Está en la página 1de 40

ANALISIS DE LA VARIANZA

COMPARACION DE DOS VARINZAS POBLACIONALES


Se basa en el supuesto de varianzas poblacionales iguales. Una forma de porbar este supuesto e

Distribucion F
Sirve como la distribucion del estadistico de prueba en varias situaciones, con ella se pone a prueba si dos muest
provienen de poblaciones que tienen varianzas iguales, y tambien se aplica cuando se desea comparar varias
medias poblacionales en forma simultanea (ANOVA)

Caracteristicas de la distribucion F

1. Existe una familia de distribuciones F


Cada miembro se determina mediante dos parametros: Los grados de libertad del numerador y los grados de libe

2. La distibucion F es continua
Esto significa que supone un numero infinito de valores entre cero y el infinito positivo

3. La distribucion F no puede ser negativa


El menor valor posible de F es 0

4. Tiene sesgo positivo


La cola larga de la distribucion es hacia el lado derecho. Cuando el numero de grados de libertad aumenta, tanto
denominador , la distribucion se aproxima a ser normal.

5. Es asintótica
Cuando los valores de X aumentan, La curva F se aproxima al eje X pero nunca lo toca.

Utilizamos la distribucion F cuando se pone a prueba la hipotesis de que la varianza de una poblacion normal es igual a la varia

La distribucion F tambien sirve para probar suposiciones de algunas pruebas estadisticas. Esta dsitribucion proporciona un me
las varianzas de dos poblaciones normales.
Sin importar si se desea determinar si una poblacion varia mas que otra, o validar una suposicion de una prueba estadistica, pr
𝜎_1^2
La cual es que la varianza de una poblacion normal, , es igual a la varianza de otra poblacion normal, . La hipotesis a
varianzas difieren.
𝐻_0;𝜎_1^2=𝜎_2^2

𝐻_1;𝜎_1^2≠𝜎_2^2

Entonces para realizar la prueba , se selecciona una muestra aleatoria de 𝑛_1


observaciones de una poblacion y una muestra a
ESTADSTICA DE PRUEBA PARA COMPARAR DOS VARIANZAS 𝐹=(𝑠_1^2)/(𝑠_2^2 )

Los terminos𝑠_1^2𝑠_2^2
y son las varianzaas muestrales respectivas.
Si la Ho es verdadera, el estadistico de prueba sigue la distribucion F con 𝑛_1−1y 𝑛_2−1 grados de libertad.
Para reducir el tamaño de la tabla de valores criticos, la varianza mas grande la muestra se coloca en el numerador, de aquí, la
asi, el valor critico de la cola de la derecha es el unico que se requiere.
El valor critico de F de una prueba de dos colas se dtermina dividiendo el nivel de significancia entre dos ( ) y despues se

EJERCICIO

CARRETERA 25 AUTOPISTA I-75


52 59
67 60
56 61
45 51
70 56
54 63
64 57
65

Obtenemos la media de cada muestra


𝑥 ̅_1 58.29

𝜒 ̅_2 59

analizamos las dos desviaciones estandar


𝑠_1= 8.995
𝑠=√((∑128▒(𝑥−𝑥 ̅ )^2 )/(𝑛−1))

𝑠_2= 4.375

se decide realizar una prueba estadistica para determinar si en realidad existe una diferencia entre las variacione

1. Establecimiento de la Ho y la H1
𝐻_0;𝜎_1^2=𝜎_2^2

𝐻_1;𝜎_1^2≠𝜎_2^2

2. Nivel de signifcancia: 0,10

3. Estadistico de prueb: F

4. Obtener el valor critico

nivel de signif…... 0,10, 0,10/2….. = 0,05

grados de libertad…. muestra 1….. n - 1 ….... 7 - 1 = 6

muestra 2…. N - 1 …..... 8 - 1 = 7

valor critico…. 3,866

regla de decision…...
que si el valor de prueba F es mayor que el valor critico, 3,86, se rechaza Ho.

𝐹=(𝑠_1^2)/(𝑠_2^2 ) 〗 _1^2)/( 〖 (4,375) 80.910025


𝐹=( 〖 (8,995) 〗 _2^2 )
= 4.23
19.140625

Conclusion:
Rechazamos la Ho porque el valor F (4,23) es mayor que el punto critico (3,86)

Concluimos que hay diferencia entre las variaciones de los tiempos en las dos rutas.
na forma de porbar este supuesto estadisticamente es la distribucion F

n ella se pone a prueba si dos muestras


uando se desea comparar varias

d del numerador y los grados de libertad del denominador

e grados de libertad aumenta, tanto en el numerador como en el

poblacion normal es igual a la varianza de otra poblacion normal

sta dsitribucion proporciona un medio para realizar una prueba considerando

osicion de una prueba estadistica, primero se formula la Hipotesis nula;


𝜎_2^2
lacion normal, . La hipotesis alternativa podria ser que las

𝑛_2 obervaciones de una segunda poblacion.


s de una poblacion y una muestra aleatoria de
^2)/(𝑠_2^2 )

grados de libertad.
coloca en el numerador, de aquí, la razon F que se indica en la tabla siempre es mayor que 1,00;

ncia entre dos ( 𝛼∕2 ) y despues se consultan los grados de libertad apropiados en la tabla correspondiente.
Según estos resultados hay mas variacion en la carretera 25

e una diferencia entre las variaciones de ambas vias.

F
ANOVA: análisis de la varianza
ANOVA ( analysis of variance )

La distribucion F se utiliza para realizar una amplia variedad de pruebas de hipotesis.


El estadistico F se emplea como prueba.

Suposiciones en el analisis de la varianza ANOVA

1. Las poblaciones siguen la distribucion normal


2. Laas poblaciones tienen desviaciones estandar iguales
3. Las poblaciones son independientes

El ANOVA permite comparar las medias poblacionales de forma simultanea con el nivel de significancia determin

Se estima la varianza de la poblacion de dos formas para despues determinar la razon de dichas estimaciones. Si
y se concluye que las medias poblacionales no lo son. La distribucion F sirve como un arbitro para indicar en que
ocurrido por casualidad.

VARIACION TOTAL
Suma de las diferencias entre cada observacion y la media global elevadas al cuadrado

VARIACION DE TRATAMIENTO
Suma de las diferencias entre la media de cada tratamiento y la media total o global elevadas al cua

VARIACION ALEATORIA
Suma de las diferencias entre cada observacion y su media de tratamiento elevadas al cuadrado

El estadistico de prueba, que es la razon de las dos estimaciones de la variacion poblacional, se determina a parti

Estimacion de la varianza poblacional basada en


las diferencias entre las medias muestrales
F =
Estimacion de la varianza poblacional basada en
la variacion dentro de la muestra
nivel de significancia determinado, ademas, evita la acumulacion del error tipo I asociado con probar muchas hipotesis

azon de dichas estimaciones. Si esta razon es aproximadamente 1 entonces, por logica las dos estimaciones son iguales,
un arbitro para indicar en que instancia la razon de las varianzas muestrales es mucho mayor que 1 para haber

vadas al cuadrado

ia total o global elevadas al cuadrado

miento elevadas al cuadrado

oblacional, se determina a partir de la siguiente ecuacion:


on probar muchas hipotesis

s estimaciones son iguales,


r que 1 para haber
EJERCICIO ANOVA

1. Establecer Hipotesis nula y Alternativa

𝐻_0;𝜇_𝑁=𝜇_𝑤=𝜇_𝑝=𝜇_𝐵

𝐻_1; No todas las calificaciones medias son iguales

La Hipotesis Alternativa tambien se considera como: "al menos dos calificaciones medias no

Si no se rechaza la hipotesis nula, se concluye que no hay una diferencia entre las calificaciones medias de las cuatro
al menos un par de calificaciones medias, pero en este punto no se sabe cual par o cuantos pares difieren.

2. Se selecciona el nivel de significancia.


en este caso 0,01

3. Se identifica el estadistico de prueba.


Distribucion F

4. Se formula la regla de decision.


Determinamos el valor critico con la tabla F

Para esto debemos conocer los grados de libertad del numerador y denominador
Los grados de libertad del numerador son iguales al numero de tratam
Los grados de libertad del denominador son el numero total de obse

gl numerador = k-1 = 4-1 = 3


gl denominador = n-k = 22 - 4 = 18

⇒ Buscamos en la tabla F con nivel de significancia 0,01 …. En la fila superior ubicamos en 3 gra
en la primera columna ubicamos en 18 grados de libertad para el den
⇒ La regla de decision es rechazar Ho si el valor calculado de F es mayor

5. Se toma una muestra, se realizan los calculos y se decide.

tabla ANOVA
Fuente de variacion Suma de cuadrados gl
Tratamientos SST k-1
Error SSE n-k
total SS total n-1

SST total = ∑128▒(𝑥−𝑥 ̅_𝐺 )^2 SST total : suma de las diferencias elevada
x es cada observacion de la muestra
𝑥 ̅_𝐺es la media global o total

SSE = ∑128▒(𝑥−𝑥 ̅_𝑐 )^2 SSE : suma de las diferencias elevadas al


𝑥 ̅_𝑐es la media muestral del tratamiento c

𝑆𝑆𝐸=∑128▒ 〖 (𝑥−𝑥 ̅_𝑁 )_+^2 𝛴(𝑥−𝑥 ̅_𝑤 )^2 〗 +∑128▒(𝑥−𝑥 ̅_𝑃 )^2 +∑128▒(𝑥

Empezamos calculando la media global o total


Calculamos SS total encontrando la desviacion de cada observacion a la media total

(𝑥−𝑥 ̅_𝐺 )= 94 - 75,64 = 18,36

elevamos al cuadrado cada diferencia y se suman

Calculamos SSE encontrando la desviacion entre cada observacion y su media de tratamiento

Media de cada tratamiento …....


(𝑥−𝑥 ̅_𝑁 )⇒𝑥 ̅_𝑁…... Es la media de Northern
( 94 - 87,25 ) = 6,75

Luego se elevan al cuadrado y se suman

Se determina SST (la suma de los cuadrados debida a los tratamientos) con la resta:

Consultamos la tabla ANOVA para determinar el valor de F

* Los grados de libertad son los mismos del paso 4


* La media cuadratica del tratamiento: SST / gl numerador = MST
* El Error cuadratico medio : SSE / gl denominador = MSE
* Para obtener F : Dividir MST / MSE

tabla ANOVA
Fuente de variacion Suma de cuadrados gl Media cuadrática
Tratamientos SST k-1 SST / (k - 1) = MST
Error SSE n-k SSE / (n - k) = MSE
total SS total n-1

* El valor de F = 8,99 es mayor que el punto critico 5,09, por lo que rechazamos Ho
6. Conclusion o interpretacion de resultados
* No todas las medias poblacionales son iguales
* las calificaciones medias de las cuatro aerolineas no son iguales

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma
Northern 4 349
WTA 5 391
Pocono 7 510
Branson 6 414

ANÁLISIS DE VARIANZA
Origen de las variaciones Suma de cuadrados Grados de libertad
Entre grupos 890.683766233766 3
Dentro de los grupos 594.407142857143 18

Total 1485.09090909091 21
es medias son iguales

os dos calificaciones medias no son iguales"

lificaciones medias de las cuatro aerolineas. Si se rechaza Ho, se concluye que hay una diferencia en
cuantos pares difieren.
ador y denominador
son iguales al numero de tratamientos…. k - 1
or son el numero total de observaciones n menos el numero de tratamientos

a fila superior ubicamos en 3 grados de libertad para el numerador, y,


8 grados de libertad para el denominador, el valor de la interseccion es 5,09.
el valor calculado de F es mayor que 5,09

A
Media cuadrática F
SST / (k - 1) = MST MST / MSE
SSE / (n - k) = MSE

suma de las diferencias elevadas al cuadrado entre cada observacion y la media global
observacion de la muestra
edia global o total

ma de las diferencias elevadas al cuadrado entre cada observacion y su respectiva media de tratamiento.
media muestral del tratamiento c

+∑128▒(𝑥−𝑥 ̅_𝑃 )^2 +∑128▒(𝑥−𝑥 ̅_𝐵 )^2

Northern WTA Pocono Branson total


94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65

total de la columna 349 391 510 414 1664


n 4 5 7 6 22
media 87.25 78.20 72.86 69.00 75.64

rvacion a la media total

4 = 18,36 Northern WTA Pocono Branson


18.36 -0.64 -5.64 -7.64
14.36 -7.64 -2.64 -5.64
9.36 1.36 0.36 -3.64
4.36 7.36 2.36 -10.64
12.36 4.36 -1.64
-7.64 -10.64
-10.64

a y se suman Northern WTA Pocono Branson


337.22 0.40 31.77 58.31
206.31 58.31 6.95 31.77
87.68 1.86 0.13 13.22
19.04 54.22 5.59 113.13
152.86 19.04 2.68
58.31 113.13
113.13
total 650.26 267.66 234.93 332.25 1485.09

vacion y su media de tratamiento

Northern WTA Pocono Branson


94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65

cada tratamiento ….... 87.25 78.20 72.86 69.00


Northern WTA Pocono Branson
6.75 -3.20 -2.86 -1.00
2.75 -10.20 0.14 1.00
-2.25 -1.20 3.14 3.00
-7.25 4.80 5.14 -4.00
9.80 7.14 5.00
-4.86 -4.00
-7.86

Northern WTA Pocono Branson


45.56 10.24 8.16 1.00
7.56 104.04 0.02 1.00
5.06 1.44 9.88 9.00
52.56 23.04 26.45 16.00
96.04 51.02 25.00
23.59 16.00
61.73

total 110.75 234.80 180.86 68.00 594.41

amientos) con la resta:

SST = SS total - SSE

SST = 1485,09 - 594,41 = 890.68 ⇒

os del paso 4
o: SST / gl numerador = MST
l denominador = MSE

Fuente de Suma de gl Media


F Variacion Cuadrados Cuadratica
MST / MSE ⇒ Tratamientos 890.68 3 296.89
Error 594.41 18 33.02
total 1485.09 21

r lo que rechazamos Ho
Promedio Varianza
87.25 36.91666667
78.2 58.7
72.8571428571429 30.14285714
69 13.6

Promedio de los cuadrados F Probabilidad Valor crítico para F


296.894588744589 8.990643302 0.0007427689 5.091889520414
33.022619047619
⇒ 1664 / 22 ⇒ 𝒙 ̅_𝑮

⇒ SS total
⇒ SSE

SST

8.99 Estadistico de prueba


a) 𝐻_0;𝜇_𝐴=𝑢_𝐵=𝑢_𝐶

H1 ; Al menos una media de tratamiento es diferente

b) nivel signif…. 0,05


tratamientos k -1 = 3 - 1 = 2 gl numerador
obervaciones n - k = 12 - 3 = 9 gl denominador valor critico 4,26

Se rechaza ho si F > 4,26 rechazo Ho si el estadistico de prueba F es mayor que el valor critico
c)
A B C SS total
cerca del cerca de la cerca de otros cerca del cerca de la cerca de otros
pan cerveza limpiadores pan cerveza limpiadores
18 12 26 4 64 36
14 18 28 36 4 64
19 10 30 1 100 100
17 16 32 9 16 144

68 56 116 240 50 184 344


4 4 4 12
17 14 29 20
𝑥 ̅_𝐺

tabla ANOVA tabla


Fuente de Suma de gl Media F Fuente de
Variacion Cuadrados Cuadratica Variacion
Tratamiento SST k-1 SST / (k - 1) = MST MST / MSE Tratamiento
Error SSE n-k SSE / (n - k) = MSE Error
total SS total n-1 total

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
pan 4 68 17 4.66666667
cerveza 4 56 14 13.3333333
limpiadores 4 116 29 6.66666667

ANÁLISIS DE VARIANZA
Origen de las variaciones
Suma de cuadrados Grados de libertad
Promedio de los cuadradosF Probabilidad
Entre grupos 504 2 252 30.6486486 9.61319E-05
Dentro de los 74 9 8.22222222

Total 578 11

Conclusion
Se rechaza la Ho, porque el estadistico de prueba F (30,65) es mayor que el valor critico 4,26

Si hay diferencia entre los valores medios de botellas vendidas de acuerdo a su ubicacion
cerca del
pan

alor critico 4,26

e el valor critico

SSE
erca de otros cerca del cerca de la cerca de otros
pan cerveza limpiadores SST
1 4 9
9 16 1 SS total - SSE
4 16 1
0 4 9 578 - 74 =

578 14 40 20 74 504
SS total SSE SST

tabla ANOVA
Suma de gl Media F
Cuadrados Cuadratica
504 2 252 30.65
74 9 8.22
578 11

Valor crítico para F


4.25649473

También podría gustarte