0 calificaciones0% encontró este documento útil (0 votos)
18 vistas16 páginas
Este documento presenta información sobre un análisis de varianza de un factor (ANOVA). Explica los objetivos del ANOVA, que son comparar más de dos poblaciones o tratamientos evaluando si sus medias son iguales o diferentes. Proporciona notación, pasos y ejemplos para realizar un ANOVA, incluyendo calcular el estadístico F, establecer hipótesis nulas y alternativas, y tomar una decisión basada en el valor p.
Este documento presenta información sobre un análisis de varianza de un factor (ANOVA). Explica los objetivos del ANOVA, que son comparar más de dos poblaciones o tratamientos evaluando si sus medias son iguales o diferentes. Proporciona notación, pasos y ejemplos para realizar un ANOVA, incluyendo calcular el estadístico F, establecer hipótesis nulas y alternativas, y tomar una decisión basada en el valor p.
Este documento presenta información sobre un análisis de varianza de un factor (ANOVA). Explica los objetivos del ANOVA, que son comparar más de dos poblaciones o tratamientos evaluando si sus medias son iguales o diferentes. Proporciona notación, pasos y ejemplos para realizar un ANOVA, incluyendo calcular el estadístico F, establecer hipótesis nulas y alternativas, y tomar una decisión basada en el valor p.
de varianza para comparar más de dos poblaciones o tratamientos. Ejemplo 1: ¿Hay riesgo en el futbol? Se llevó a cabo una investigación para estudiar las posibles consecuencias de la alta incidencia de lesiones en la cabeza entre los jugadores de fútbol. Tres grupos de estudiantes universitarios (deportistas de fútbol, atletas que no son de fútbol y un grupo de control formado por estudiantes que no participaron en deportes interuniversitarios) fueron considerados en el estudio, y se obtuvo la siguiente información sobre las puntuaciones de la prueba de aprendizaje verbal de Hopkins:
Sean 𝜇1 , 𝜇2 y 𝜇3 las medias poblacionales de los resultados de la prueba de Hopkins
para atletas de futbol, atletas no futbolistas, y estudiantes que no participan en deportes, respectivamente. ¿Los datos apoyan la afirmación de que 𝜇1 = 𝜇2 = 𝜇3 , o parece que al menos dos de los 𝜇’s son diferentes uno del otro? Notación 𝑘: Número de poblaciones o tratamientos a ser comparados Población o tratamiento 1 2 ⋯ 𝒌 Media poblacional o de tratamiento 𝜇1 𝜇2 ⋯ 𝜇𝑘 Varianza poblacional o de tratamiento 𝜎12 𝜎22 ⋯ 𝜎𝑘2 Tamaño muestral 𝑛1 𝑛2 ⋯ 𝑛𝑘 Media muestral 𝑥ҧ1 𝑥ҧ2 ⋯ 𝑥ҧ 𝑘 Varianza muestral 𝑠12 𝑠22 ⋯ 𝑠𝑘2
𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 : Número total de observaciones en el conjunto de datos.
𝑇 = 𝑛1 𝑥ҧ1 + 𝑛2 𝑥ҧ2 + ⋯ + 𝑛𝑘 𝑥ҧ𝑘 : Gran total = suma de las 𝑁 observaciones. 𝑇 𝑥Ӗ = 𝐺𝑟𝑎𝑛 𝑚𝑒𝑑𝑖𝑎 = 𝑁 ANOVA de un factor Cuando dos o más poblaciones o tratamientos están siendo comparados, la característica que distingue las poblaciones o tratamientos una de otra es llamada el factor de investigación. Por ejemplo, un experimento puede ser realizado para comparar tres diferentes métodos de enseñar a leer, en ese caso, el factor de interés sería el método de enseñanza. Si el crecimiento de peces en aguas teniendo diferentes niveles de salinidad – 0%, 10%, 20%, y 30% - es de interés, el factor nivel de salinidad es cuantitativo. Un problema de análisis de varianza de un solo factor (ANOVA) implica la comparación de 𝑘 medias poblacionales o de tratamientos. El objetivo es probar: 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 𝐻𝑎 : Al menos dos de los 𝜇’s son diferentes. Gráficas de puntos comparativas Ejemplo 2: Un indicador de riesgo a sufrir ataque al corazón El artículo “Could Mean Platelet Volume Be a Predictive Marker for Acute Myocardial Infarction?” (Medical Science Monitor [2005]: 387-392) describió un experimento en que se compararon cuatro grupos de pacientes que buscaban tratamiento para el dolor torácico con respecto al volumen plaquetario medio (MPV, medido en fL). La siguiente tabla presenta un resumen de la data publicada en el artículo: Diagramas de caja comparativas Prueba F para el análisis de varianza de un factor
1. Describir las medias poblacionales o de tratamiento: 𝜇1 , 𝜇2 , … , 𝜇𝑘
2. Establecer la hipótesis nula: 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 3. Establecer la hipótesis alternativa: 𝐻𝑎 : Al menos dos de los 𝜇’s son diferentes 4. Seleccionar el nivel de significancia: 𝛼 = 0.05 5. El estadístico de prueba: 𝑀𝑆𝑇𝑟 𝐹= 𝑀𝑆𝐸 el cual tiene una distribución 𝐹 con 𝑑𝑓1 = 𝑘 − 1 y 𝑑𝑓2 = 𝑁 − 𝑘 grados de libertad. Suma de cuadrados de tratamiento 𝑆𝑆𝑇𝑟 = 𝑛1 𝑥ҧ1 − 𝑥Ӗ 2 + 𝑛2 𝑥ҧ2 − 𝑥Ӗ 2 + ⋯ + 𝑛𝑘 𝑥ҧ𝑘 − 𝑥Ӗ 2 Suma de cuadrados del error 𝑆𝑆𝐸 = 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22 + ⋯ + 𝑛𝑘 − 1 𝑠𝑘2 Cuadrados medios de tratamiento 𝑆𝑆𝑇𝑟 𝑀𝑆𝑇𝑟 = 𝑘−1 Cuadrados medios del error 𝑆𝑆𝐸 𝑀𝑆𝐸 = 𝑁−𝑘 6. Verificar los supuestos: • Cada una de las 𝑘 poblaciones tiene distribución normal. (Normalidad) • Las distribuciones tienen la misma desviación estándar 𝜎1 = 𝜎2 = ⋯ = 𝜎𝑘 . (Homoscedasticidad) • Las observaciones en una muestra de cualquiera de las 𝑘 poblaciones o tratamientos son independientes una de otra. • Cuando comparamos poblaciones, las 𝑘 muestras son seleccionadas independientemente una de otra. Cuando comparamos medias de tratamiento, los tratamientos son asignados aleatoriamente a sujetos o objetos. (Independencia) 7. Calcule el valor del estadístico de prueba. 8. Determine el 𝑃-valor. • Área a la derecha del valor 𝐹 calculado y bajo la curva F con 𝑑𝑓1 = 𝑘 − 1 y 𝑑𝑓2 = 𝑁 − 𝑘. 9. Tomar la decisión. Tabla de ANOVA de un factor Fuente de Grados de Suma de Cuadrados F variación libertad cuadrados medios Tratamientos 𝑘−1 𝑆𝑆𝑇𝑟 𝑆𝑆𝑇𝑟 𝑀𝑆𝑇𝑟 𝑀𝑆𝑇𝑟 = 𝐹= 𝑘−1 𝑀𝑆𝐸 Error 𝑁−𝑘 𝑆𝑆𝐸 𝑆𝑆𝐸 𝑀𝑆𝐸 = 𝑁−𝑘 Total 𝑁−1 𝑆𝑆𝑇𝑜
Suma de cuadrados del total:
𝑆𝑆𝑇𝑜 = 𝑥𝑖 − 𝑥Ӗ 2
Identidad fundamental de ANOVA de un solo factor:
𝑆𝑆𝑇𝑜 = 𝑆𝑆𝑇𝑟 + 𝑆𝑆𝐸 La distribución F de Fischer Retomando el ejemplo 2: Ataques al corazón
Prueba de ANOVA para comparar poblaciones:
Ejemplo 3: Sistema de detección de plagio El artículo “Plagiarism and Technology: A Tool for Coping with Plagiarism” (Journal of Education for Business [2005]: 149–152) describe un estudio en el que artículos de investigación presentados por estudiantes durante cinco semestres fueron analizados por plagio. Para cada artículo, el porcentaje de palabras plagiadas en el trabajo fue determinado por un análisis en línea. En cada uno de los cinco semestres, a los estudiantes se les dijo durante las dos primeras clases que tendrían que presentar una versión electrónica de sus trabajos de investigación y que los documentos serían revisados por plagio. Suponga que el número de trabajos muestreados en cada uno de los cinco semestres y las medias y desviaciones estándar para el porcentaje de palabras plagiadas son las que se dan en la tabla adjunta. Para propósitos de este ejercicio, suponga que las condiciones necesarios para la prueba ANOVA F son razonables. ¿Estos datos proporcionan evidencia para respaldar la afirmación de que porcentaje medio de palabras plagiadas no es el mismo para los cinco semestres? Pruebe las hipótesis apropiadas usando un 𝛼 = 0.05.