Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VARIANZA
LOGRO ESPERADO
Resuelve problemas utilizando la técnica del análisis de varianza de acuerdo al
procedimiento dado en problemas de contexto profesional/científico.
INDICADORES DE LOGRO
Si las medias de las poblaciones (𝜇𝑗 ) son iguales, se espera que las medias muestrales (𝑥𝑗 )
sean similares; es decir, si la variabilidad entre las medias muestrales es pequeña, es posible
que la hipótesis nula (H0) sea verdadera. Por el contrario, si la variabilidad entre las medias
muestrales es grande, es posible que la hipótesis nula (H0) no sea verdadera.
El análisis de varianza es una técnica estadística que se aplica para determinar si las diferencias
observadas entre las medias muestrales 𝑥𝑗 ; 𝑗 = 1, 2, … , 𝑘 son lo suficientemente grandes para
rechazar la hipótesis nula (𝐻𝑜 ∶ 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 ); esto implica que por lo menos 2 de las
medias poblacionales (𝜇𝑗 ) son diferentes. Para determinar si las medias poblacionales (𝜇𝑗 ) son
iguales, la técnica se basa en comparar la estimación de la varianza en base a la variabilidad
entre las medias muestrales y la estimación de la varianza en base a la variabilidad entre los
datos de cada muestra.
Otra forma de estimar la varianza es a partir de la estimación de la varianza de cada población; es decir, 𝜎 2 se estima
con el promedio de las varianzas de las k poblaciones, siempre que los tamaños de muestra en cada población sean
iguales. Como la estimación de las varianzas de las k poblaciones solo se basa en la variación dentro de cada
muestra, la estimación 𝜎 2 no es afectada por el hecho que las medias poblacionales sean iguales o no. A esta
estimación de la varianza poblacional se le conoce como estimación de la varianza 𝜎 2 dentro de las poblaciones o
tratamientos.
Población o tratamiento
observación 1 2 … k Total
1 𝑥11 𝑥12 … 𝑥1𝑗
2 𝑥21 𝑥22 … 𝑥2𝑗
… … … … …
i 𝑥𝑖1 𝑥𝑖2 … 𝑥𝑖𝑗
𝑛𝑗 𝑛1 𝑛2 … 𝑛𝑘 𝑛 𝑛 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘
𝑇𝑗 𝑇1 𝑇2 𝑇𝑘 𝑇 𝑇 = 𝑇1 + 𝑇2 + ⋯ + 𝑇𝑘
donde:
𝑥𝑖𝑗 : Valor de la observación i en la población o tratamiento j
k : Número de poblaciones o tratamientos
𝑛𝑗 : Tamaño de la muestra en la población o tratamiento j
n : Tamaño de la muestra
𝑇𝑗 : Suma de las observaciones en la población o tratamiento j
𝑇 : Suma de todas las observaciones
NOTACIONES
Considerando que de cada una de las k poblaciones o tratamientos se toma una muestra aleatoria de
tamaño 𝑛𝑗 , se tiene:
𝑛𝑗 𝑛𝑗
𝑥
𝑖=1 𝑖𝑗
(𝑥
𝑖=1 𝑖𝑗
− 𝑥𝑗 )2
𝑥𝑗 = 𝑠𝑗2 =
𝑛𝑗 𝑛𝑗 − 1
Donde el numerador viene a ser la suma de cuadrados entre poblaciones o tratamientos (SCTR). En la práctica SCTR se estimará
2
𝑘 𝑇𝑗 𝑇2
de la siguiente manera: 𝑗=1 𝑛 −
𝑗 𝑛
𝑘
𝑗=1 𝑛𝑗 − 1 𝑠𝑗2 𝑆𝐶𝐸
CME (Cuadrado medio debido al error) 𝐶𝑀𝐸 = =
Es la estimación de la varianza poblacional (σ2) dentro de las poblaciones 𝑛−𝑘 𝑛−𝑘
o tratamientos
Donde el numerador viene a ser la suma de cuadrados debido al error (SCE). En la práctica SCE se estimará de la siguiente
manera: SCE = SCT − SCTR
Donde:
SCTR : Suma de cuadrados entre poblaciones o tratamientos
SCE : Suma de cuadrados debido al error
SCT : Suma de cuadrados total
CMTR : Cuadrado medio debido a la población o tratamiento
CME : Cuadrado medio debido al error
F : Estadístico de prueba
PASOS PARA REALIZAR LA PRUEBA DE ANÁLISIS DE
VARIANZA
Paso 1: Plantear las hipótesis
𝐻𝑜 ∶ 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (Todas las medias poblacionales son iguales)
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑗 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒; 𝑗 = 1,2, … , 𝑘 (No todas las medias poblacionales son iguales)
Paso 2: Establecer el nivel de significancia
Paso 3: Calcular el estadístico de prueba
Fuente de Grados de Cuadrados
Suma de Cuadrados (SC) F
Variación libertad (GL) Medio (CM)
𝑘
Población o 𝑇𝑗2 𝑇2 𝑆𝐶𝑇𝑅
k -1 SCTR = − 𝐶𝑀𝑇𝑅 =
Tratamiento 𝑛𝑗 𝑛 𝑘−1 𝐶𝑀𝑇𝑅
𝑗=1 𝑭𝒄𝒂𝒍 =
𝐶𝑀𝐸
𝑆𝐶𝐸
Error n-k SCE = SCT − SCTR 𝐶𝑀𝐸 =
𝑛−𝑘
𝑘 𝑛𝑗
2 𝑇2
Total n -1 SCT = 𝑥𝑖𝑗 −
𝑛
𝑗=1 𝑖=1
Paso 4: Establecer la región de rechazo
Con un nivel de significancia del 5%, ¿existe evidencia estadística para pensar que hay
diferencias significativas entre los tiempos de vida de los focos ahorradores de las 3
marcas?
(Asuma que se cumplen los supuestos de normalidad y homogeneidad de varianzas)
SOLUCIÓN
Sean las variables:
X1= Tiempo de vida de los focos ahorradores de la marca Sam
X2= Tiempo de vida de los focos ahorradores de la marca Phi
X3= Tiempo de vida de los focos ahorradores de la marca Gam
Paso 4:
F(0.05,2,12)=3.89
Paso 5:
Como Fcal=38.862>F(0.05,2,12)=3.89, se encuentra en la región de rechazo, se rechaza H0. Con un n.s. del 5%, e.e.e. para pensar
que los tiempo de vida promedio de los focos ahorradores de las 3 marcas no son iguales.
COMPARACIONES MÚLTIPLES
Si al realizar la prueba de hipótesis para comparar las medias de 3 o más
poblaciones se rechaza la hipótesis nula, es necesario conocer que
poblaciones o tratamientos producen diferentes resultados.
MÉTODO DE TUKEY
El método de Tukey genera intervalos de confianza para todas las diferencias por pares
entre las medias de los niveles de los factores mientras controla la tasa de error
individual en un nivel especificado. Es importante considerar la tasa de error individual
cuando se hacen comparaciones múltiples, porque la probabilidad de cometer un error
de tipo I para una serie de comparaciones es mayor que la tasa de error para cualquier
comparación individual. Para contrarrestar esta tasa de error más elevada, el método de
Tukey ajusta el nivel de confianza de cada intervalo individual para que el nivel de
confianza simultáneo resultante sea igual al valor especificado.
Con una confianza del 95%, se puede pensar que el tiempo promedio de vida de los focos ahorradores de
la marca Sam es mayor.
MÉTODO MCB de Hsu
• El método MCB de Hsu es un método de comparaciones múltiples que ha sido
diseñado para identificar que nivel de factor es mejor, los que son
estadísticamente diferentes y equivalentes al mejor. Se puede entender como
mejor, al nivel de factor con el mayor o menor promedio.
• El método MCB de Hsu crea un intervalo de confianza para la diferencia entre las
medias de cada nivel y la mejor de las medias.
OBSERVACIONES
• El método de Tukey genera intervalos de confianza más anchos y pruebas de
hipótesis menos potentes para una tasa de error especificado. Esta prueba es
más recomendable cuando se desea todas las comparaciones por pares.
H1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝜇𝑗 es diferente
Estadístico de Prueba
CMTra
Fcal = ~ 𝐹𝛼; 𝑘−1; 𝑛−𝑘;
CME
Cuadro ANOVA
PARA REFORZAR LO APRENDIDO