Está en la página 1de 17

Conceptos de ANOVA

Al análisis de varianza se le conoce como


ANOVA por sus siglas en inglés y es una
técnica para detectar diferencias
significativas entre los promedios de 3 o más
grupos. Su nombre responde a que lo que
realmente hace el estudio es comparar
varianzas, las que definimos como:
• Varianza entre los grupos (explicable)
• Varianza dentro de los grupos (no explicable)
Como hemos visto, para comparar varianzas
el estadístico adecuado es el de la prueba F,
aunque las conclusiones, basadas en el valor
P se orientan a los promedios, así que
planteamos dos posibilidades:
H0: no hay diferencias entre los
promedios
H1: hay al menos un promedio diferente
a los demás

y un análisis posterior nos aclarará en cuáles


grupos son diferentes estos promedios.
ANOVA de un factor y estadístico F
Bajo las siguientes condiciones:
• Nuestros datos son de variable numérica
• Clasificamos nuestros datos dentro de “k”
grupos diferentes
• Los datos de un mismo grupo no tienen una
distinción especial entre sí
• Nos interesa comparar los niveles promedio
de todos los grupos
Lo indicado es un ANOVA de un factor.
Ejercicio 1: En el Archivo Jabones se
muestran los desgastes en gramos que
sufrieron varios jabones de 3 marcas
diferentes después de sumergirlos en agua
bajo condiciones similares. Para determinar
si los jabones se desgastan igual o si hay
alguno que dure más, utilizaremos el análisis
mencionado con
Estadísticas > ANOVA > Un solo factor
(Desapilado)
Como Respuestas ingresamos cada marca
en una columna diferente. En la opción
Comparaciones señalamos De Tukey.
La primera tabla nos resume el valor P
(0.000) que señala diferencias muy
significativas en los promedios. Más abajo,
los intervalos para los promedios de cada
marca nos dan una idea del orden que
siguen y qué tanta diferencia hay entre ellos.

Los intervalos de confianza simultáneos de


Tukey hacen comparaciones por pares entre
los grupos, lo que es equivalente a las
pruebas de hipótesis que realizamos en el
módulo anterior.
Los intervalos de confianza para las
diferencias siguen la misma interpretación
que mencionamos antes: si los límites inferior
y superior son del mismo signo, la diferencia
entre los grupos es significativa, lo cual se
puede apreciar para todas las
comparaciones.

Lo anterior nos hace concluir que el desgaste


promedio de la marca 2 es más alto, pero
pudo haber algún problema en el
procedimiento para medir el desgaste en la
marca 1.
Ejercicios adicionales

Ejercicio 2: En el archivo Ladrillos se


muestran los resultados de un experimento
para determinar si cuatro temperaturas de
cocción específicas afectan la densidad de
cierto tipo de ladrillo. Cada grupo es una de
las temperaturas a prueba y la respuesta
mide la densidad. Si es necesario realiza
comparaciones múltiples para determinar la
mejor temperatura.
Ejercicio adicional
Ejercicio 3: En el archivo Baterías1 tenemos
los resultados de tiempo de vida, en minutos,
costo unitario y vida por dólar de 4 tipos de
baterías AA. Nos gustaría determinar si las
baterías tienen promedios diferentes de vida
por costo, y si es así, decidirnos por la mejor
o si todas tienen el mismo rendimiento.
En particular, el arreglo de los datos es
diferente, esta vez necesitamos aplicar
Estadísticas > ANOVA > Un solo factor…
ANOVA de dos factores

En el tema anterior suponemos que los datos


de un mismo grupo no tienen una distinción
particular entre sí, pero si además de
dividirlos en grupos agregamos un segundo
efecto que divida en subgrupos, nos
interesará saber si entre los grupos formados
por este segundo efecto también hay
diferencias significativas. El análisis de
varianza puede revisar estos efectos al
mismo tiempo.
Ejercicio 4: Regresemos a la comparación
entre baterías AA pero ahora en el archivo
Baterías2 aparecen clasificadas por dos tipos
codificados como 1 = alcalina, 2 = de uso
industrial y en dos marcas codificadas como
1 = marca publicitada, 2 = marca genérica.
En esta ocasión aplicamos
Estadísticas > ANOVA > Dos factores
Respuestas es nuestra medición, factor de la
fila y de la columna es indiferente, pero sí
pediremos Mostrar medias y, por esta
ocasión, Ajustar al modelo aditivo
Los resultados nos indican que sí hay
diferencias significativas entre los tipos y
entre las marcas, además de concluir que
rinden más las baterías alcalinas,
independientemente de la marca y que
también rinden más las baterías de la marca
genérica, independientemente del tipo.
Ejercicio adicional

Ejercicio 5: Los resultados en Barnices


muestran los tiempos en minutos que tardan
en removerse las manchas dejadas por 3
tipos diferentes de barnices con la ayuda de
dos marcas diferentes de solventes. ¿Qué
resultados nos puede dar este experimento?
Supuestos y análisis de residuales

Una dificultad que surge en este análisis es


que su validez está condicionada a que se
cumplan algunos supuestos con los
resultados que llamamos residuales:
• Que sigan distribución normal
• Que sean independientes de los demás
datos
• Que se conserve la misma variabilidad en
todos los grupos
o como se abrevia usualmente en
estadística, los supuestos de:
• Normalidad
• Independencia
• Homocedasticidad
Lo cual se puede apreciar en las gráficas de
residuales disponibles en Minitab.
Ejercicio 7: Para los datos del archivo
Baterías1, regresemos al ANOVA pero esta
vez en la opción de Gráficas, indicamos que
nos presente gráficas de residuos de Cuatro
en uno.
La gráfica de probabilidad y el histograma
nos ayudan a visualizar si cumplen el
supuesto de normalidad (aparentemente sí).
Si la gráfica superior derecha aparece con
dispersión similar en todos los niveles, hay
homocedasticidad y en caso de que los datos
aparezcan en orden temporal, una gráfica sin
tendencias nos indica independencia.
Ejercicios adicionales
Ejercicio 8: Revisa si los resultados de los
experimentos en Jabones, Ladrillos y
Barnices cumplen los supuestos del ANOVA.

Ejercicio 9: En el archivo South River


aparecen los niveles de mercurio medidos en
un río de Virginia en fechas diferentes del
año y en diferentes estaciones a lo largo del
río. ¿Hay evidencia para pensar que los
niveles promedio de mercurio son iguales en
todas las estaciones del río?

También podría gustarte