ANOVA por sus siglas en inglés y es una técnica para detectar diferencias significativas entre los promedios de 3 o más grupos. Su nombre responde a que lo que realmente hace el estudio es comparar varianzas, las que definimos como: • Varianza entre los grupos (explicable) • Varianza dentro de los grupos (no explicable) Como hemos visto, para comparar varianzas el estadístico adecuado es el de la prueba F, aunque las conclusiones, basadas en el valor P se orientan a los promedios, así que planteamos dos posibilidades: H0: no hay diferencias entre los promedios H1: hay al menos un promedio diferente a los demás
y un análisis posterior nos aclarará en cuáles
grupos son diferentes estos promedios. ANOVA de un factor y estadístico F Bajo las siguientes condiciones: • Nuestros datos son de variable numérica • Clasificamos nuestros datos dentro de “k” grupos diferentes • Los datos de un mismo grupo no tienen una distinción especial entre sí • Nos interesa comparar los niveles promedio de todos los grupos Lo indicado es un ANOVA de un factor. Ejercicio 1: En el Archivo Jabones se muestran los desgastes en gramos que sufrieron varios jabones de 3 marcas diferentes después de sumergirlos en agua bajo condiciones similares. Para determinar si los jabones se desgastan igual o si hay alguno que dure más, utilizaremos el análisis mencionado con Estadísticas > ANOVA > Un solo factor (Desapilado) Como Respuestas ingresamos cada marca en una columna diferente. En la opción Comparaciones señalamos De Tukey. La primera tabla nos resume el valor P (0.000) que señala diferencias muy significativas en los promedios. Más abajo, los intervalos para los promedios de cada marca nos dan una idea del orden que siguen y qué tanta diferencia hay entre ellos.
Los intervalos de confianza simultáneos de
Tukey hacen comparaciones por pares entre los grupos, lo que es equivalente a las pruebas de hipótesis que realizamos en el módulo anterior. Los intervalos de confianza para las diferencias siguen la misma interpretación que mencionamos antes: si los límites inferior y superior son del mismo signo, la diferencia entre los grupos es significativa, lo cual se puede apreciar para todas las comparaciones.
Lo anterior nos hace concluir que el desgaste
promedio de la marca 2 es más alto, pero pudo haber algún problema en el procedimiento para medir el desgaste en la marca 1. Ejercicios adicionales
Ejercicio 2: En el archivo Ladrillos se
muestran los resultados de un experimento para determinar si cuatro temperaturas de cocción específicas afectan la densidad de cierto tipo de ladrillo. Cada grupo es una de las temperaturas a prueba y la respuesta mide la densidad. Si es necesario realiza comparaciones múltiples para determinar la mejor temperatura. Ejercicio adicional Ejercicio 3: En el archivo Baterías1 tenemos los resultados de tiempo de vida, en minutos, costo unitario y vida por dólar de 4 tipos de baterías AA. Nos gustaría determinar si las baterías tienen promedios diferentes de vida por costo, y si es así, decidirnos por la mejor o si todas tienen el mismo rendimiento. En particular, el arreglo de los datos es diferente, esta vez necesitamos aplicar Estadísticas > ANOVA > Un solo factor… ANOVA de dos factores
En el tema anterior suponemos que los datos
de un mismo grupo no tienen una distinción particular entre sí, pero si además de dividirlos en grupos agregamos un segundo efecto que divida en subgrupos, nos interesará saber si entre los grupos formados por este segundo efecto también hay diferencias significativas. El análisis de varianza puede revisar estos efectos al mismo tiempo. Ejercicio 4: Regresemos a la comparación entre baterías AA pero ahora en el archivo Baterías2 aparecen clasificadas por dos tipos codificados como 1 = alcalina, 2 = de uso industrial y en dos marcas codificadas como 1 = marca publicitada, 2 = marca genérica. En esta ocasión aplicamos Estadísticas > ANOVA > Dos factores Respuestas es nuestra medición, factor de la fila y de la columna es indiferente, pero sí pediremos Mostrar medias y, por esta ocasión, Ajustar al modelo aditivo Los resultados nos indican que sí hay diferencias significativas entre los tipos y entre las marcas, además de concluir que rinden más las baterías alcalinas, independientemente de la marca y que también rinden más las baterías de la marca genérica, independientemente del tipo. Ejercicio adicional
Ejercicio 5: Los resultados en Barnices
muestran los tiempos en minutos que tardan en removerse las manchas dejadas por 3 tipos diferentes de barnices con la ayuda de dos marcas diferentes de solventes. ¿Qué resultados nos puede dar este experimento? Supuestos y análisis de residuales
Una dificultad que surge en este análisis es
que su validez está condicionada a que se cumplan algunos supuestos con los resultados que llamamos residuales: • Que sigan distribución normal • Que sean independientes de los demás datos • Que se conserve la misma variabilidad en todos los grupos o como se abrevia usualmente en estadística, los supuestos de: • Normalidad • Independencia • Homocedasticidad Lo cual se puede apreciar en las gráficas de residuales disponibles en Minitab. Ejercicio 7: Para los datos del archivo Baterías1, regresemos al ANOVA pero esta vez en la opción de Gráficas, indicamos que nos presente gráficas de residuos de Cuatro en uno. La gráfica de probabilidad y el histograma nos ayudan a visualizar si cumplen el supuesto de normalidad (aparentemente sí). Si la gráfica superior derecha aparece con dispersión similar en todos los niveles, hay homocedasticidad y en caso de que los datos aparezcan en orden temporal, una gráfica sin tendencias nos indica independencia. Ejercicios adicionales Ejercicio 8: Revisa si los resultados de los experimentos en Jabones, Ladrillos y Barnices cumplen los supuestos del ANOVA.
Ejercicio 9: En el archivo South River
aparecen los niveles de mercurio medidos en un río de Virginia en fechas diferentes del año y en diferentes estaciones a lo largo del río. ¿Hay evidencia para pensar que los niveles promedio de mercurio son iguales en todas las estaciones del río?
Resumen de Diseño Estadístico Para Investigadores en Ciencias Sociales y del Comportamiento. Capítulo 2: Variables Estadísticas: RESÚMENES UNIVERSITARIOS