Está en la página 1de 44

ANLISIS DE VARIANZA

La distribucin F (Fisher)
Se emplea para probar si dos muestras
provienen de poblaciones que poseen
varianzas iguales, y tambin se aplica cuando
se trata de comparar simultneamente varias
medias poblacionales.
ANLISIS DE VARIANZA
La distribucin F (Fisher)
La comparacin simultnea de varias medias
poblacionales se conoce como anlisis de
varianza (ANOVA).
ANLISIS DE VARIANZA
Caractersticas de la distribucin de F
1. Existe una familia de distribuciones F. Un
miembro especfico de la familia se determina
por dos parmetros: los grados de libertad en
el numerador y en el denominador.
ANLISIS DE VARIANZA
ANLISIS DE VARIANZA
Caractersticas de la distribucin de F
2. La distribucin F es una distribucin
continua.
3. F no puede ser negativa.
4. La distribucin F tiene sesgo positivo.
ANLISIS DE VARIANZA
Comparacin de dos varianzas poblacionales
La distribucin F en este caso, se utiliza para
probar la hiptesis de que la varianza de una
poblacin normal es igual a la varianza de otra
poblacin normal.
ANLISIS DE VARIANZA
Por ejemplo:
Se calibran dos mquinas cortadoras que
producen tablas de madera de la misma longitud.
Por lo tanto, las tablas deben tener la misma
longitud media y una variacin similar.
ANLISIS DE VARIANZA
Por ejemplo:
En este caso, la hiptesis nula es que la varianza
de una poblacin normal S
1
2
, es igual a la
varianza de otra poblacin normal S
2
2
. La
hiptesis alternativa es que las varianzas sean
distintas.
ANLISIS DE VARIANZA
Por ejemplo:
Esta prueba de hiptesis se escribe:
Ho: S
1
2
= S
2
2
H1: S
1
2
S
2
2
Para realizar la prueba se selecciona una
muestra aleatoria de cada poblacin: n
1
y n
2
.
ANLISIS DE VARIANZA
Por ejemplo:
El estadstico de prueba es S
1
2
/ S
2
2
, donde S
1
2
y
S
2
2
son las respectivas varianzas mustrales, con
n
1
1 y n
2
1 grados de libertad.
A fin de reducir el tamao de la tabla de valores crticos,
la mayor varianza muestral se coloca en el numerador;
por lo tanto, el valor F de la tabla siempre es mayor a
1.00
ANLISIS DE VARIANZA
Ejemplo 2:
Maderables Transportistas S.A ofrece servicio
desde la Pennsula de Osa, hasta el Aeropuero
Juan Santamara. Para efectuar sus servicios
puede escoger entre dos rutas alternativas.
ANLISIS DE VARIANZA
Ejemplo 2:

Ruta Tiempo (min) Desv Sta Tamao muestra
A 56 12 7
B 58 5 8
ANLISIS DE VARIANZA
Solucin:
La empresa observ que los tiempos medios son
similares, pero hay mayor variacin en la ruta A
en comparacin con la ruta B. Lo anterior puede
deberse a que en la ruta A hay ms semforos;
sin embargo, la ruta B es ms larga.
ANLISIS DE VARIANZA
Solucin:
Es importante que el servicio que se ofrece sea
oportuno y consistente, por lo que decide realizar
una prueba estadstica para determinar si existe
una diferencia real en la variacin en ambas
rutas.
ANLISIS DE VARIANZA
Solucin (paso 1):
Se comienza estableciendo la hiptesis nula y
alternativa. La prueba tiene dos colas, porque se
busca la diferencia de variacin entre ambas
rutas.
Ho: S
1
2
= S
2
2
H1: S
1
2
S
2
2
ANLISIS DE VARIANZA
Solucin (paso 2):
Se selecciona el nivel de significancia de 5%
Paso 3:
El estadstico de prueba apropiado es S
1
2
/ S
2
2
que sigue al distribucin F.
ANLISIS DE VARIANZA
Solucin (paso 4):
La F tabular o valor crtico se obtiene con base
en la tabla de distribucin F***
ANLISIS DE VARIANZA
Solucin (paso 4):
Existen:
n
1
1= 7 1 = 6 gL en el numerador
n
2
1= 8 1= 7 gL en el denominador
ANLISIS DE VARIANZA
Solucin (paso 4):
El valor crtico es 3,87. Por lo tanto, la regla de
decisin es: si la relacin de las varianzas de la
muestra S
1
2
/ S
2
2
es diferente a 3,87 la hiptesis
nula se rechaza.
ANLISIS DE VARIANZA
Solucin (paso 5):
Determine el valor estadstico de prueba
tomando la relacin de las dos varianzas
muestrales, como se observa a continuacin:
F= S
1
2
/ S
2
2
ANLISIS DE VARIANZA
Solucin (paso 5):
F= S
1
2
/ S
2
2

F= (12)
2
/ (5)
2

F= 5,76
Se rechaza la hiptesis nula y se acepta la alternativa. Se
concluye que existe una diferencia en las variaciones en el tiempo
de recorrido en ambas rutas.

SUPOSICIONES DE LA ANOVA
Otro uso de la distribucin F es la tcnica del
anlisis de varianza (ANOVA), en la que se
comparan tres o ms medias muestrales para
determinar si provienen de poblaciones iguales.
SUPOSICIONES DE LA ANOVA
Para utilizar esta tcnica, se supone lo siguiente:
1. Las poblaciones tienen una distribucin normal.
2. Las poblaciones tienen desviaciones estndar
iguales.
3. Las muestras se seleccionan de manera indepen-
diente.
SUPOSICIONES DE LA ANOVA
ANOVA tuvo sus inicios en la agricultura, y
muchos de los trminos que se relacionan con
ese contexto permanecen vigentes. En
particular, se emplea el trmino tratamiento para
identificar las diferentes poblaciones que se
examinan.
SUPOSICIONES DE LA ANOVA
Ejemplo:
Jos Prez, propietario de una empresa agrcola
productora de maz, desea utilizar la marca de
fertilizante que produzca el mximo rendimiento
de maz por unidad de superficie.
SUPOSICIONES DE LA ANOVA
Ejemplo:
Prez puede elegir entre tres marcas comerciales
diferentes: Wolfe, White y Korosa. Para
empezar, Prez divide su campo en 12 parcelas
de igual tamao.
SUPOSICIONES DE LA ANOVA
Ejemplo:
Luego planta el maz al mismo tiempo y del
mismo modo. La nica diferencia en las parcelas
es que Prez asigna al azar la marca Wolfe a
cuatro de ellas, White a otras cuatro y Korosa a
las ltimas cuatro.
SUPOSICIONES DE LA ANOVA
Ejemplo:
Al final de la temporada Prez registra la cantidad de
mazorcas de maz que se produjo en cada parcela:
Wolfe White Korosa
55 66 47
54 76 51
59 67 46
56 71 48
SUPOSICIONES DE LA ANOVA
Ejemplo:
Existe una diferencia en el nmero de mazorcas
de maz que se produjeron?
SUPOSICIONES DE LA ANOVA
Ejemplo:
Ahora suponga que las poblaciones son iguales;
o sea, que no hay diferencia en las medias de
fertilizacin (tratamiento). Esto indicara que las
medias poblacionales son las mismas.
SUPOSICIONES DE LA ANOVA
Por qu es importante la prueba ANOVA?
Porque a travs de otros mtodos como la t de
Student, sera necesario hacer comparaciones de
medias poblacionales de par en par y con la
ANOVA se pueden comparar varias medias al
mismo tiempo.
LA PRUEBA ANOVA
Haciendo referencia al ejemplo de la empresa de
Jos Prez, ste desea determinar si existe una
diferencia en los rendimientos medios de maz
para diversos fertilizantes.
LA PRUEBA ANOVA
Para comenzar, se debe encontrar el rendimiento
medio promedio de maz para TODAS las
parcelas de tierra.
O sea: (55 + 54 + + 48) / 12 = 58
LA PRUEBA ANOVA
A continuacin, para cada una de las doce
parcelas, encontrar la distancia entre el
desarrollo de esa parcela en particular y la media
general. Cada una de las diferencias se eleva al
cuadrado y se suman dichos cuadrados. Este
trmino se conoce como variacin total.
VARIACIN TOTAL
Es la suma del cuadrado de las diferencias entre
cada observacin y la media global.
En el ejemplo, la variacin total es:
(55 - 58)
2
+ (54 - 58)
2
+ + (48 - 58)
2
= 1082
VARIACIN TOTAL
A continuacin, se debe separar la variacin total
en sus dos componentes: el que se debe a los
tratamientos y el aleatorio.
VARIACIN DE LOS TRATAMIENTOS
La suma del cuadrado de las diferencias entre la
media de cada tratamiento y la media global.
Para calcularlo primero es preciso encontrar el
rendimiento medio de cada uno de los tres
tratamientos.
VARIACIN DE LOS TRATAMIENTOS
El rendimiento medio para Wolfe es:
(55 + 54 + 59 +56) / 4 = 56
Las otras medias son: 70 para White y 48 para
Korosa.
VARIACIN DE LOS TRATAMIENTOS
La suma de los cuadrados debidos a los
tratamientos es:
4 (56 - 58)
2
+ 4 (70 - 58)
2
+ 4 (48 - 58)
2
= 992
Nmero de parcelas por
tratamiento. En el ejemplo
son 4 para Wolfe, 4 para
White y 4 para Korosa
Rendimiento
medio de cada
tratamiento
internamente
Rendimiento promedio de
las 12 parcelas en total
VARIACIN DE LOS TRATAMIENTOS
La otra fuente de variacin a que se hace
referencia es el componente aleatorio, o
componente de error.
VARIACIN ALEATORIA
En el ejemplo del fertilizante, este trmino es la
suma del cuadrado de las diferencias entre el
rendimiento promedio de maz de cada parcela y
la media del rendimiento para el tratamiento
especfico:
(55 - 56)
2
+ (54 - 56)
2
+ + (48 - 48)
2
= 90
LA PRUEBA ANOVA
Se determina el estadstico F, que es la relacin
de los dos estimadores de la varianza de la
poblacin, con base en la ecuacin siguiente:
Estimado de la varianza de la poblacin con base en
la diferencias entre las medias de muestra
Estimado de la varianza de la poblacin con base en
la variacin dentro de la muestra
F = =
992 / 2
Variacin de tratamiento / n - 1
90 / (12 - 3)
Variacin aleatoria / nmero de observaciones nmero de tratamientos
LA PRUEBA ANOVA
Fc =
992 / 2
90 / (12 - 3)
= 49.6
Para el F tabular los grados de libertad en el numerador equivalen
al nmero de tratamientos, designados como K, menos 1. Los
grados de libertad en el denominador son el nmero total de
observaciones, n, menos el nmero de tratamientos.
Grados de libertad en el numerador: k - 1
Grados de libertad en el denominador: n - k
PRCTICA
La informacin siguiente pertenece a una muestra.
Pruebe la hiptesis de que las medias de tratamientos
son iguales. Utilice el nivel de significancia de 0.05
Tratamiento 1 Tratamiento 2 Tratamiento 3
8 3 3
6 2 4
10 4 5
9 3 4

A) Establezca la hiptesis nula y alternativa.
B) Cul es la regla de la decisin?
C) Cul es el resultado final?

También podría gustarte