0% encontró este documento útil (0 votos)
330 vistas36 páginas

ANOVA de Dos Factores: Análisis y Procedimientos

Este documento presenta información sobre el análisis de varianza de dos factores. Explica conceptos clave, requisitos, el procedimiento para realizar el análisis de varianza de dos factores y cómo interpretar los resultados incluyendo tablas y ejemplos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
330 vistas36 páginas

ANOVA de Dos Factores: Análisis y Procedimientos

Este documento presenta información sobre el análisis de varianza de dos factores. Explica conceptos clave, requisitos, el procedimiento para realizar el análisis de varianza de dos factores y cómo interpretar los resultados incluyendo tablas y ejemplos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadística II

Ingeniería Industrial
Mg. Eliana Roque Roji
eroquer@[Link]

Departamento de Matemáticas y Estadística


ESTADISTICA II
Unidad III
ANÁLISIS DE VARIANZA

Tema: Análisis de varianza de dos


factores

Departamento de Matemáticas y Estadística


Objetivos de aprendizaje
✓ Analizar datos muestrales provenientes de poblaciones separadas
en categorías, utilizando dos características (o factores).
✓ Aplicar el método de análisis de varianza de dos factores a:
(1) pruebas para una interacción entre dos factores
(2) pruebas para un efecto del factor de fila, y
(3) pruebas para un efecto del factor de columna.

Departamento de Matemáticas y Estadística


Conceptos Clave

Departamento de Matemáticas y Estadística


Requisitos para un Análisis de varianza de dos factores

Departamento de Matemáticas y Estadística


Procedimiento para ANOVA de dos factores

𝑀𝑆(𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛)
𝐹=
𝑀𝑆(𝑒𝑟𝑟𝑜𝑟)

Departamento de Matemáticas y Estadística


Procedimiento para ANOVA de dos factores

Departamento de Matemáticas y Estadística


Departamento de Matemáticas y Estadística
Medias de tratamiento
Factor Columna

1 2 ⋯ 𝑐 Media de
fila
1 𝒙𝟏𝟏 𝒙𝟏𝟐 ⋯ 𝒙𝟏𝒄 ഥ𝟏.
𝒙
2 𝒙𝟐𝟏 𝒙𝟐𝟐 ⋯ 𝒙𝟐𝒄 ഥ𝟐.
𝒙
Factor Fila

3 𝒙𝟑𝟏 𝒙𝟑𝟐 ⋯ 𝒙𝟑𝒄 ഥ𝟑.


𝒙
⋮ ⋮ ⋮ ⋱ ⋮ ⋮

r 𝒙𝐫𝟏 𝒙𝐫𝟐 ⋯ 𝒙𝐫𝒄 ഥ𝒓.


𝒙
Media de ഥ.𝟏
𝒙 ഥ.𝟐
𝒙 ⋯ ഥ.𝒄
𝒙 ന
𝒙
columna

Departamento de Matemáticas y Estadística


Análisis de la varianza
Variación total: Variación de la interacción:
2
𝑆𝑆𝑇 = ෍ 𝑋𝑖𝑗𝑘 − 𝑋ത… 𝑆𝑆𝐼 = 𝑘 ෍ 𝑋ത𝑖𝑗. − 𝑋ത𝑖.. − 𝑋ത.𝑗. + 𝑋ത…
2

Variación del factor fila: Variación aleatoria:


𝑆𝑆𝐹𝐹 = 𝑐𝑘 ෍ 𝑋ത𝑖.. − 𝑋ത… 2
𝑆𝑆𝐸 = ෍ 𝑋𝑖𝑗𝑘 − 𝑋ത𝑖𝑗.
2

Variación del factor columna:


2
𝑆𝑆𝐹𝐶 = 𝑟𝑘 ෍ 𝑋ത.𝑗. − 𝑋ത… 𝑺𝑺𝑻 = 𝑺𝑺𝑭𝑭 + 𝑺𝑺𝑭𝑪 + 𝑺𝑺𝑰 + 𝑺𝑺𝑬

Departamento de Matemáticas y Estadística


Tabla de ANOVA
Fuente de Grados de Suma de Cuadrados medios Razón F P-valor
variación libertad cuadrados
Factor fila 𝑟−1 𝑆𝑆𝐹𝐹 𝑆𝑆𝐹𝐹 𝑀𝑆𝐹𝐹 𝑃(𝐹 > 𝐹𝐹 )
𝑀𝑆𝐹𝐹 = 𝐹𝐹 =
𝑟−1 𝑀𝑆𝐸
Factor columna 𝑐−1 𝑆𝑆𝐹𝐶 𝑆𝑆𝐹𝐶 𝑀𝑆𝐹𝐶 𝑃(𝐹 > 𝐹𝐶 )
𝑀𝑆𝐹𝐶 = 𝐹𝐶 =
𝑐−1 𝑀𝑆𝐸
Interacciones (𝑟 − 1)(𝑐 − 1) 𝑆𝑆𝐼 𝑆𝑆𝐼 𝑀𝑆𝐼 𝑃(𝐹 > 𝐹𝐼 )
𝑀SI = 𝐹𝐼 =
(𝑟 − 1)(𝑐 − 1) 𝑀S𝐸
Error 𝑟𝑐(𝑘 − 1) 𝑆𝑆𝐸 𝑆S𝐸
𝑀S𝐸 =
𝑟𝑐(𝑘 − 1)
Total 𝑟𝑐𝑘 − 1 𝑆𝑆𝑇

Departamento de Matemáticas y Estadística


Mujer Hombre
18-29 104 82 80 78 80 84 82 66 70 78 72 64 72 64 64 70 72 64 54 52
30-49 66 74 96 86 98 88 82 72 80 80 80 90 58 74 96 72 58 66 80 92
50-80 94 72 82 86 72 90 64 72 72 100 54 102 52 52 62 82 82 60 52 74

Departamento de Matemáticas y Estadística


Df Sum Sq Mean Sq F value Pr(>F)
Fila 2 527 263.5 1.816 0.172531
Columna 1 1972 1972 13.591 0.000528 ***
Interacción 2 273 136.5 0.940 0.397290
Residuals 54 7836 145.1
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Departamento de Matemáticas y Estadística


Paso 1: Efecto de interacción:

El P-valor correspondiente, se muestra en la salida de Rstudio como 0.397290, por lo que no se puede
rechazar la hipótesis nula. No parece que las frecuencias del pulso se vean afectadas por una
interacción entre el grupo de edad (18-29, 30-49, 50-80) y el género. No parece haber un efecto de
interacción.
Paso 2: Efecto del factor fila:

El p-valor correspondiente se muestra en la salida de Rstudio como 0.172531. Debido a que ese p-valor
es mayor que el nivel de significancia de 0.05, no podemos rechazar la hipótesis nula. Es decir, las
frecuencias del pulso no parecen verse afectadas por el rango de edad.
Departamento de Matemáticas y Estadística
Paso 3: Efecto del factor columna:

El p-valor correspondiente se muestra en la salida de Rstudio como 0.000528. Debido a que


ese [Link] es menor que el nivel de significancia de 0.05, rechazamos la hipótesis nula. Las
tasas de pulso parecen estar afectadas por el género.

Departamento de Matemáticas y Estadística


Departamento de Matemáticas y Estadística
Shapiro-Wilk normality test

data: modelo_anova$residuals
W = 0.96829, p-value = 0.1203

El p-valor correspondiente se muestra en la salida de Rstudio como 0.1203. Debido a que


ese valor P es mayor que el nivel de significancia de 0.05, no rechazamos la hipótesis
nula. Las muestras provienen de poblaciones con distribuciones aproximadamente
normal. Es decir, se cumple el supuesto de normalidad.

Departamento de Matemáticas y Estadística


Departamento de Matemáticas y Estadística
Bartlett test of homogeneity of variances

data: residuos and datos$Edad


Bartlett's K-squared = 4.8515, df = 2, p-value = 0.08841

El p-valor correspondiente se muestra en la salida de Rstudio como 0.08841. Debido a


que ese p-valor es mayor que el nivel de significancia de 0.05, no rechazamos la
hipótesis nula. Las muestras provienen de poblaciones con varianzas homogéneas. Es
decir, se cumple el supuesto de homocedasticidad.

Departamento de Matemáticas y Estadística


Departamento de Matemáticas y Estadística
Durbin-Watson test
data: modelo_anova
DW = 1.988, p-value = 0.2389
alternative hypothesis: true autocorrelation is greater than 0

El p-valor correspondiente se muestra en la salida de Rstudio como 0.23889. Debido a que


ese p-valor es mayor que el nivel de significancia de 0.05, no rechazamos la hipótesis nula.
Se puede concluir que no hay evidencia de autocorrelación en los residuos, lo que sugiere
que la independencia entre las observaciones se cumple.

Departamento de Matemáticas y Estadística


Suero 0% Suero 10% Suero 20% Suero 30%
Sin suplemento 4.4 4.5 4.3 4.6 4.5 4.8 4.5 4.8 4.8 4.6 4.7 5.1
Suplemento 3.3 3.2 3.1 3.8 3.7 3.6 5 5.3 4.8 5.4 5.6 5.3

Departamento de Matemáticas y Estadística


Df Sum Sq Mean Sq F value Pr(>F)
datos$Fila 1 0.510 0.5104 17.01 0.000794 ***
datos$Columna 3 6.691 2.2304 74.35 1.30e-09 ***
datos$Fila:datos$Columna 3 3.725 1.2415 41.38 9.13e-08 ***
Residuals 16 0.480 0.0300
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Paso 1: Efecto de interacción:

El p-valor es 9.13e-08, por lo que se puede rechazar la hipótesis nula. Si parece haber un
efecto de interacción.

Departamento de Matemáticas y Estadística


La interpretación de la interacción es crucial para comprender cómo los factores se
relacionan entre sí y cómo afectan conjuntamente a la variable de interés. Si se encuentra
una interacción significativa, como es en nuestro caso, implica que el efecto de al menos uno
de los factores depende del nivel del otro factor, lo que sugiere una relación más compleja
entre las variables que simplemente los efectos principales de los factores.

Departamento de Matemáticas y Estadística


Cuando se encuentra evidencia de interacción significativa entre los
factores en un ANOVA de dos factores, es importante realizar un
análisis adicional para comprender mejor la naturaleza de la
interacción y cómo afecta a las variables de interés. Aquí hay algunos
procedimientos que se sugieren realizar:

Departamento de Matemáticas y Estadística


Descomposición de la interacción: Una vez que se ha identificado la
interacción significativa, es útil descomponerla para comprender
mejor la naturaleza de la relación entre los factores. Esto puede
implicar examinar las diferencias entre los grupos formados por las
combinaciones de niveles de los factores. Por ejemplo, puedes
realizar análisis de comparaciones múltiples (por ejemplo, pruebas
de comparaciones de medias como la prueba de Tukey) para
identificar específicamente qué combinaciones de niveles de los
factores son diferentes entre sí.

Departamento de Matemáticas y Estadística


Gráficos de interacción: Visualizar la interacción mediante gráficos
puede ayudar a comprender mejor la naturaleza de la relación entre
los factores. Puedes crear gráficos de líneas o gráficos de barras para
representar cómo varía la variable de interés en diferentes niveles de
un factor, teniendo en cuenta los diferentes niveles del otro factor.
Esto te permitirá observar cómo se cruzan las líneas o barras en
función de los niveles de los factores y determinar si hay algún
patrón significativo de interacción.

Departamento de Matemáticas y Estadística


Análisis post-hoc específico: Si encuentras diferencias significativas
en la interacción, es posible que desees realizar análisis post-hoc
específicos para explorar estas diferencias con más detalle. Por
ejemplo, puedes realizar análisis de subgrupos para examinar cómo
la interacción afecta a diferentes subgrupos de la muestra.

Departamento de Matemáticas y Estadística


Consideración de implicaciones teóricas: Es importante considerar las
implicaciones teóricas de la interacción encontrada. ¿Se alinea con lo
que se esperaba teóricamente? ¿Cómo afecta la interpretación de los
resultados? Estas consideraciones te ayudarán a contextualizar los
hallazgos y a desarrollar una narrativa coherente sobre los efectos de
los factores en la variable de interés.

Departamento de Matemáticas y Estadística


Ejercicio propuesto
Una tienda de maquinaria utiliza tres máquinas para pulir con precisión rodillos de levas. Se emplearon tres
operarios para pulir los rodillos en las máquinas. En un experimento para determinar si hay diferencias en el
producto entre las máquinas o entre los operarios, cada uno de éstos trabajó en cada máquina durante cuatro
días diferentes. El resultado medido fue la producción diaria de partes que satisfacían las especificaciones. Con el
operario como el factor fila y la máquina como el factor columna, se observaron las siguientes sumas de los
cuadrados: SSFF=3147.0, SSFC=136.5, SSI=411.7, SSE=1522.0.
a) Construya una tabla de ANOVA de dos factores, inclusive obtenga los P-valores.
b) ¿El modelo aditivo es creíble? Haga la prueba paso a paso.
c) ¿Es posible interpretar los efectos principales individualmente? Si es así, interprételos. Si no, explique.
a) Completemos la tabla con la data:
𝑟 = 3, 𝑐 = 3, 𝑘 = 4 SSFF=3147.0, SSFC=136.5, SSI=411.7, SSE=1522.0.

Fuente de Grados de Suma de Cuadrados medios Razón F P-valor


variación libertad cuadrados
Factor fila
(operario)
Factor columna
(máquina)
Interacciones

Error

Total
b) Hagamos la prueba para verificar si el modelo aditivo es creíble.
c) ¿Se puede interpretar los efectos principales individualmente? Explique.
Departamento de Matemáticas y Estadística
BAJA MEDIA ALTA
130 34 20
74 40 70
MATERIAL1
155 80 82
180 75 58
150 136 25
188 122 70
MATERIAL2
159 106 58
126 115 45
138 174 96
168 150 104
MATERIAL3
110 120 82
160 139 60
Departamento de Matemáticas y Estadística
BIBLIOGRAFÍA

También podría gustarte