Está en la página 1de 16

ESTADISTICA II

Unidad II
ANÁLISIS DE VARIANZA

Tema: Análisis de varianza de un factor

Semana 05
Objetivo de aprendizaje

• Aplicar la prueba F en el análisis


de varianza para comparar más
de dos poblaciones o
tratamientos.
Ejemplo 1: ¿Hay riesgo en el futbol?
Se llevó a cabo una investigación para estudiar las posibles consecuencias de la alta
incidencia de lesiones en la cabeza entre los jugadores de fútbol. Tres grupos de
estudiantes universitarios (deportistas de fútbol, atletas que no son de fútbol y un
grupo de control formado por estudiantes que no participaron en deportes
interuniversitarios) fueron considerados en el estudio, y se obtuvo la siguiente
información sobre las puntuaciones de la prueba de aprendizaje verbal de Hopkins:

Sean 𝜇1 , 𝜇2 y 𝜇3 las medias poblacionales de los resultados de la prueba de Hopkins


para atletas de futbol, atletas no futbolistas, y estudiantes que no participan en
deportes, respectivamente. ¿Los datos apoyan la afirmación de que 𝜇1 = 𝜇2 = 𝜇3 , o
parece que al menos dos de los 𝜇’s son diferentes uno del otro?
Notación
𝑘: Número de poblaciones o tratamientos a ser comparados
Población o tratamiento 1 2 ⋯ 𝒌
Media poblacional o de tratamiento 𝜇1 𝜇2 ⋯ 𝜇𝑘
Varianza poblacional o de tratamiento 𝜎12 𝜎22 ⋯ 𝜎𝑘2
Tamaño muestral 𝑛1 𝑛2 ⋯ 𝑛𝑘
Media muestral 𝑥ҧ1 𝑥ҧ2 ⋯ 𝑥ҧ 𝑘
Varianza muestral 𝑠12 𝑠22 ⋯ 𝑠𝑘2

𝑁 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 : Número total de observaciones en el conjunto de datos.


𝑇 = 𝑛1 𝑥ҧ1 + 𝑛2 𝑥ҧ2 + ⋯ + 𝑛𝑘 𝑥ҧ𝑘 : Gran total = suma de las 𝑁 observaciones.
𝑇
𝑥Ӗ = 𝐺𝑟𝑎𝑛 𝑚𝑒𝑑𝑖𝑎 = 𝑁
ANOVA de un factor
Cuando dos o más poblaciones o tratamientos están siendo comparados, la
característica que distingue las poblaciones o tratamientos una de otra es llamada el
factor de investigación.
Por ejemplo, un experimento puede ser realizado para comparar tres diferentes
métodos de enseñar a leer, en ese caso, el factor de interés sería el método de
enseñanza. Si el crecimiento de peces en aguas teniendo diferentes niveles de
salinidad – 0%, 10%, 20%, y 30% - es de interés, el factor nivel de salinidad es
cuantitativo.
Un problema de análisis de varianza de un solo factor (ANOVA) implica la
comparación de 𝑘 medias poblacionales o de tratamientos. El objetivo es probar:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻𝑎 : Al menos dos de los 𝜇’s son diferentes.
Gráficas de puntos comparativas
Ejemplo 2: Un indicador de riesgo a
sufrir ataque al corazón
El artículo “Could Mean Platelet Volume Be a Predictive Marker for Acute Myocardial
Infarction?” (Medical Science Monitor [2005]: 387-392) describió un experimento en
que se compararon cuatro grupos de pacientes que buscaban tratamiento para el
dolor torácico con respecto al volumen plaquetario medio (MPV, medido en fL). La
siguiente tabla presenta un resumen de la data publicada en el artículo:
Diagramas de caja comparativas
Prueba F para el análisis de varianza
de un factor

1. Describir las medias poblacionales o de tratamiento: 𝜇1 , 𝜇2 , … , 𝜇𝑘


2. Establecer la hipótesis nula:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
3. Establecer la hipótesis alternativa:
𝐻𝑎 : Al menos dos de los 𝜇’s son diferentes
4. Seleccionar el nivel de significancia: 𝛼 = 0.05
5. El estadístico de prueba:
𝑀𝑆𝑇𝑟
𝐹=
𝑀𝑆𝐸
el cual tiene una distribución 𝐹 con 𝑑𝑓1 = 𝑘 − 1 y 𝑑𝑓2 = 𝑁 − 𝑘 grados de libertad.
Suma de cuadrados de tratamiento
𝑆𝑆𝑇𝑟 = 𝑛1 𝑥ҧ1 − 𝑥Ӗ 2 + 𝑛2 𝑥ҧ2 − 𝑥Ӗ 2 + ⋯ + 𝑛𝑘 𝑥ҧ𝑘 − 𝑥Ӗ 2
Suma de cuadrados del error
𝑆𝑆𝐸 = 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22 + ⋯ + 𝑛𝑘 − 1 𝑠𝑘2
Cuadrados medios de tratamiento
𝑆𝑆𝑇𝑟
𝑀𝑆𝑇𝑟 =
𝑘−1
Cuadrados medios del error
𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑁−𝑘
6. Verificar los supuestos:
• Cada una de las 𝑘 poblaciones tiene distribución normal. (Normalidad)
• Las distribuciones tienen la misma desviación estándar 𝜎1 = 𝜎2 = ⋯ = 𝜎𝑘 .
(Homoscedasticidad)
• Las observaciones en una muestra de cualquiera de las 𝑘 poblaciones o
tratamientos son independientes una de otra.
• Cuando comparamos poblaciones, las 𝑘 muestras son seleccionadas
independientemente una de otra. Cuando comparamos medias de tratamiento,
los tratamientos son asignados aleatoriamente a sujetos o objetos.
(Independencia)
7. Calcule el valor del estadístico de prueba.
8. Determine el 𝑃-valor.
• Área a la derecha del valor 𝐹 calculado y bajo la curva F con 𝑑𝑓1 = 𝑘 − 1 y
𝑑𝑓2 = 𝑁 − 𝑘.
9. Tomar la decisión.
Tabla de ANOVA de un factor
Fuente de Grados de Suma de Cuadrados F
variación libertad cuadrados medios
Tratamientos 𝑘−1 𝑆𝑆𝑇𝑟 𝑆𝑆𝑇𝑟 𝑀𝑆𝑇𝑟
𝑀𝑆𝑇𝑟 = 𝐹=
𝑘−1 𝑀𝑆𝐸
Error 𝑁−𝑘 𝑆𝑆𝐸 𝑆𝑆𝐸
𝑀𝑆𝐸 =
𝑁−𝑘
Total 𝑁−1 𝑆𝑆𝑇𝑜

Suma de cuadrados del total:


𝑆𝑆𝑇𝑜 = ෍ 𝑥𝑖 − 𝑥Ӗ 2

Identidad fundamental de ANOVA de un solo factor:


𝑆𝑆𝑇𝑜 = 𝑆𝑆𝑇𝑟 + 𝑆𝑆𝐸
La distribución F de Fischer
Retomando el ejemplo 2: Ataques al corazón

Prueba de ANOVA para comparar poblaciones:


Ejemplo 3: Sistema de detección de plagio
El artículo “Plagiarism and Technology: A Tool for Coping with Plagiarism” (Journal
of Education for Business [2005]: 149–152) describe un estudio en el que artículos
de investigación presentados por estudiantes durante cinco semestres fueron
analizados por plagio. Para cada artículo, el porcentaje de palabras plagiadas en el
trabajo fue determinado por un análisis en línea. En cada uno de los cinco
semestres, a los estudiantes se les dijo durante las dos primeras clases que tendrían
que presentar una versión electrónica de sus trabajos de investigación y que los
documentos serían revisados ​por plagio. Suponga que el número de trabajos
muestreados en cada uno de los cinco semestres y las medias y desviaciones
estándar para el porcentaje de palabras plagiadas son las que se dan en la tabla
adjunta. Para propósitos de este ejercicio, suponga que las condiciones necesarios
para la prueba ANOVA F son razonables. ¿Estos datos proporcionan evidencia para
respaldar la afirmación de que porcentaje medio de palabras plagiadas no es el
mismo para los cinco semestres? Pruebe las hipótesis apropiadas usando un 𝛼 =
0.05.

También podría gustarte