Está en la página 1de 10

DIFERENCIA DE MEDIAS DE 3 O MAS GRUPOS: PRUEBA F O

ANÁLISIS DE VARIANZA (ANOVA)

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K


poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una
de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es
fundamental en el análisis de resultados experimentales, en los que interesa comparar
los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de
interés.

El Anova requiere el cumplimiento los siguientes supuestos:

 Las K muestras sobre las que se aplican los tratamientos son independientes.
 Las poblaciones (distribuciones de probabilidad de la variable dependiente
correspondiente a cada factor) son normales.
 Las poblaciones tienen todas igual varianza (homoscedasticidad).

Proceso estadístico ANOVA (paramétrica)

1. Formulación de la Hipótesis

Ho : μ=μ 1=μ2 …=μi


H1: Algun μ i es diferente

2. Nivel de significación: α = 5% = 0.05 (si es que no nos refieren en los datos)

3. Cumplimiento de los supuestos.

a) Independencia. Se comprueba mediante la inspección del diseño experimental.


Si las unidades experimentales han sido seleccionadas al azar o su distribución
de datos se realiza en grupo definidos, entonces se asume independencia entre
ellos.
b) Normalidad de los datos en cada una de los grupos, se verifica mediante un
contraste de bondad de ajuste a una variable normal.

Hipotesis de normalidad:
Ho: Los datos provienen de una distribución normal
H1: Los datos no provienen de una distribución normal

Decisión al 95% de confiabilidad


Si p < 0.05, Rechazar Ho
Si p ≥ 0.05, Aceptar Ho

c) Igualdad de varianzas (Homocedasticidad). Debemos analizar si las varianzas


son homogéneas (parecidas) y esto lo hacemos a partir de un contraste de
homogeneidad de varianzas.

Hipotesis de homocedasticidad:
Ho: σ 21=σ 22 =σ 23=…=σ 2i
H1: Al menos una varianza difiere

Decisión al 95% de confiabilidad


Si p < 0.05, Rechazar Ho
Si p ≥ 0.05, Aceptar Ho

Una vez cumplidos todos los supuestos, recién se puede realizar la contrastación de
hipotesis de las medias (ANOVA).

4. Decisión (ANOVA)

Decisión al 95% de confiabilidad


Si sig < 0.05, Rechazar Ho
Si sig ≥ 0.05, Aceptar Ho

5. Conclusión. De acuerdo a la toma de decisión

Ejemplo de aplicación
Un ingeniero químico desea comparar la dureza de cuatro mezclas de pintura. Se
aplicaron seis muestras de cada mezcla de pintura a una pieza de metal. El ingeniero
químico desea conocer cual de las mezclas de pintura presenta menor dureza siempre y
cuando no exista igualdad promedio de dureza de las pinturas.

Abra los datos de muestra, DurezaPintura.MPJ.

1. Formulación de la Hipotesis

Ho : μ1=μ 2=μ3=μ 4
H1: Algun μ i es diferente

2. Nivel de significación: α = 0.05  95% de confiabilidad

3. Cumplimiento de los supuestos.


a) Independencia. Si hay independencia en los datos ya que cada mezcla tiene
independientemente 6 muestras.

Primer supuesto cumplido

Correlaciones
mezcla1 mezcla2 mezcla3 mezcla4
mezcla1 Correlación de Pearson 1 ,274 -,747 -,752
Sig. (bilateral) ,599 ,088 ,085
N 6 6 6 6
mezcla2 Correlación de Pearson ,274 1 ,092 -,670
Sig. (bilateral) ,599 ,863 ,145
N 6 6 6 6
mezcla3 Correlación de Pearson -,747 ,092 1 ,151
Sig. (bilateral) ,088 ,863 ,775
N 6 6 6 6
mezcla4 Correlación de Pearson -,752 -,670 ,151 1
Sig. (bilateral) ,085 ,145 ,775
N 6 6 6 6

b) Normalidad
Hipotesis de normalidad:
Ho: Los datos provienen de una distribución normal
H1: Los datos no provienen de una distribución normal

En minitab seguir la ruta: Estadisticas/ Estadisticas básicas/ Resumen grafico

cuantitativa

cualitativa
Hipotesis de normalidad:
Ho: Los datos provienen de una distribución normal
H1: Los datos no provienen de una distribución normal

Informe de resumen de Dureza


Pintura = Mezcla 1
Prueba de normalidad de Anderson-Darling
A-cuadrado 0,17
Valor p 0,884
Media 14,733
Desv.Est. 3,363
Varianza 11,307
Asimetría -0,00336
Curtosis -1,30808
N 6
Mínimo 10,400
1er cuartil 11,375
Mediana 15,000
3er cuartil 17,575
Máximo 19,300
Intervalo de confianza de 95% para la media
0 5 10 15 20 25 11,205 18,262
Decisión al 95% de confiabilidad Intervalo de confianza de 95% para la mediana

Si p < 0.05, Rechazar Ho 10,864 18,479


Intervalo de confianza de 95% para la desviación estándar

Si p ≥ 0.05, Aceptar Ho 2,099 8,247

Intervalos de confianza de 95%


Mezcla 1:
Media
p = 0.884 > 0.05, los datos provienen de una distribución normal
Mezcla 2: p = 0.526 > 0.05, los datos provienen de una distribución normal
Mediana

Mezcla 3: 10
p = 0.345
12 14
> 0.05, los datos provienen de una distribución normal
16 18

Mezcla 4: p = 0.175 > 0.05, los datos provienen de una distribución normal

Segundo supuesto cumplido, los datos presentan normalidad

c) Igualdad de varianzas (Homocedasticidad). Debemos analizar si las varianzas


son homogéneas (parecidas) y esto lo hacemos a partir de un contraste de
homogeneidad de varianzas.

Hipotesis de homocedasticidad:
2 2 2 2
Ho: σ 1=σ 2 =σ 3=σ 4
H1: Al menos una varianza difiere

En minitab seguir la ruta: Estadísticas: Estadísticas / Anova / Prueba de igualdad


de varianzas
cuantitativa

cualitativa

Pruebas
Estadística
Método de prueba Valor p
Bartlett 2.69 0.441
Decisión al 95% de confiabilidad
Si p < 0.05, Rechazar Ho
Si p ≥ 0.05, Aceptar Ho

P= 0.441 > 0.05, aceptar Ho

Por lo tanto se cumple el tercer supuesto de homogeneidad de las varianzas

Una vez cumplidos todos los supuestos, recién se puede realizar la contrastación de
hipotesis de las medias aritmética.

Estadísticas / Anova / un solo factor

Cuantitiva

Cualitativa
DUREZAPINTURA.MTW

ANOVA de un solo factor: Dureza vs. Pintura


Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05

Se presupuso igualdad de varianzas para el análisis.

1. Formulación de la Hipotesis

Ho : μ1=μ 2=μ3=μ 4
H1: Algun μ i es diferente

Información del factor


Factor Niveles Valores
Pintura 4 Mezcla 1; Mezcla 2; Mezcla 3; Mezcla 4
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Pintura 3 281.7 93.90 6.02 0.004
Error 20 312.1 15.60    
Total 23 593.8      

Decisión al 95% de confiabilidad


Si p < 0.05, Rechazar Ho
Si p ≥ 0.05, Aceptar Ho

Rechazar Ho, por lo tanto no todas las medias son iguales,


Como p = 0.004 < 0.05 ,
algún media es diferente.

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
3.95012 47.44% 39.56% 24.32%
Medias
Pintura N Media Desv.Est. IC de 95%
Mezcla 1 6 14.73 3.36 (11.37; 18.10)
Mezcla 2 6 8.57 5.50 (5.20; 11.93)
Mezcla 3 6 12.98 3.73 (9.62; 16.35)
Mezcla 4 6 18.07 2.64 (14.70; 21.43)

Desv.Est. agrupada = 3.95012


Como existen diferencias en la dureza de las pinturas con 4 mezclas diferentes, entonces
ahora se analizará en donde existe diferencias de la dureza en estas mezclas de pintura.

Se hará uso de la prueba Post Hoc de Tukey, para evaluar las diferencias.

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza de 95%
Pintura N Media Agrupación
Mezcla 4 6 18.07 A  
Mezcla 1 6 14.73 A B
Mezcla 3 6 12.98 A B
Mezcla 2 6 8.57   B

Las medias que no comparten una letra son significativamente diferentes.


2. Conclusión

De acuerdo al análisis ANOVA donde p = 0.004 < 0.05 , Rechazar Ho, por lo tanto
no todas las medias son iguales, encontrando que según la prueba Tukey existen
diferencias significativas con la mezcla 2 y la mezcla 4, donde la mezcla 2 de
pintura tienen menor dureza.

También podría gustarte