Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 3. Anova Con Un Factor
Unidad 3. Anova Con Un Factor
Civil
Industrial
Estadística para
Ingeniería
ingeniería
civil
industrial
ingeniería
3 civil
industrial
Arica, 02 de mayo de 2019
Temas.
i. análisis de varianza (ANOVA)
ii. diagrama
iii. pruebas de rango múltiples
iv. determinación del tamaño muestral
3
ingeniería
3 civil
industrial
i. análisis de varianza
2019
4
ANOVA permite comparar varios
tratamientos a la vez.
Hipótesis:
H0: 𝜇1 = 𝜇2 = … = 𝜇𝑘 = 𝜇
H1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
o
H0: 𝜏1 = 𝜏2 = … = 𝜏𝑘 = 0
H1: 𝜏𝑖 ≠ 0 para algún 𝑖
¿Por qué no es conveniente usar todas de
combinaciones posibles de comparaciones de medias?
5
ANOVA considera dos fuentes de
variabilidad: tratamiento y error
aleatorio.
La tabla representa un diseño al azar:
Donde:
𝑌𝑖𝑗 : observación j-ésima del tratamiento i,
6
Ejemplo.
7
El tratamiento 𝜏𝑖 esta dado por la
diferencia entre la media global 𝜇 y la
media de un tratamiento particular 𝜇𝑖 .
Gráficamente se tendría lo siguiente:
8
La tabla ANOVA utiliza la notación de
puntos y permite calcular 𝐹0
9
ingeniería
3 civil
industrial
ii. diagrama
2019
10
el diagrama de caja no es concluyente
pero dan una intuición visual.
Utiliza percentiles (mín, P25, P50, P75 y máx) y
cuando las cajas no se traslapan es posible que los
tratamientos sean diferentes entre sí, y si traslapan
puede que no haya diferencias significativas entre ellas.
11
el diagrama de LSD es más asertivo al
hacer contraste estadístico (means plot)
Utiliza los promedios de los tratamientos y sus
intervalos de confianza. Si no se traslapan, son diferentes.
12
Ejercicio 1
13
Ejercicio 2
14
ingeniería
3 civil
industrial
2019
15
cuando se rechaza Ho de ANOVA, hay
que investigar cuales tratamientos son
diferentes.
Estrategias para averiguar cuales tratamientos
son diferentes:
• comparación de parejas de medias.
• comparación con un control.
• comparación por contrastes.
16
cuando se rechaza Ho de ANOVA, hay
que investigar cuales tratamientos son
diferentes.
Estrategias para averiguar cuales tratamientos
son diferentes:
• comparación de parejas de medias.
• comparación con un control.
• comparación por contrastes.
17
una prueba es potente, si es capaz
de detectar diferencias pequeñas.
◦ comparación de parejas de medias:
Método LSD (least significant difference)
Dos medias son significativamente diferentes si sus
diferencias muestrales exceden:
1 1
𝐿𝑆𝐷 = 𝑡 𝛼 𝐶𝑀𝑒 +
2;𝑁−𝑎 𝑛𝑖 𝑛𝑗
23
cuando se rechaza Ho de ANOVA, hay
que investigar cuales tratamientos son
diferentes.
Estrategias para averiguar cuales tratamientos
son diferentes:
• comparación de parejas de medias.
• comparación con un control.
• comparación por contrastes.
24
si un tratamientos específico (𝜇𝑘 ) es
el control (o sin tratamiento), todas
las medias se comparan con éste.
◦ comparación con un control:
Método Dunnett
En algunos casos uno de los tratamientos es un control,
donde los restantes (𝑎 − 1) tratamientos se comparan con él.
Dunnett, señala que la hay diferencia significativa entre
un tratamiento y el control (sea este 𝑦𝑎. ) si:
1 1
𝑦𝑖. − 𝑦𝑎. > 𝑑𝛼 𝑎 − 1, 𝑛 − 𝑎 𝐶𝑀𝑒 +
𝑛𝑖 𝑛𝑎
26
cuando se rechaza Ho de ANOVA, hay
que investigar cuales tratamientos son
diferentes.
Estrategias para averiguar cuales tratamientos
son diferentes:
• comparación de parejas de medias.
• comparación con un control.
• comparación por contrastes.
27
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Se define contraste:
𝑎
Γ= 𝑐𝑖 𝜇𝑖
𝑖=1
𝑐𝑖 = 0
𝑖=1
28
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
De este modo se definen las siguientes hipótesis:
𝑎
𝐻0: 𝑐𝑖 𝜇𝑖 = 0
𝑖=1
𝑎
𝐻1: 𝑐𝑖 𝜇𝑖 ≠ 0
𝑖=1
𝐶= 𝑐𝑖 𝑦𝑖. = 𝑐𝑖 𝑦𝑖.
𝑖=1 𝑖=1
29
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Método de Prueba 𝑡
𝑎
𝑖=1 𝑐𝑖 𝑦𝑖.
Estadístico: 𝑡0 =
𝑛𝐶𝑀𝑒 𝑎 2
𝑖=1 𝑐𝑖
30
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Método de Prueba 𝐹
𝑎 2
𝑐 𝑦
Estadístico: 𝐹0 = 𝑡02 = 𝑖=1 𝑖 𝑖.
𝑛𝐶𝑀𝑒 𝑎𝑖=1 𝑐𝑖
2
31
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Método de Prueba 𝐹
Para tamaños de muestras desiguales se tiene:
𝑎 2
𝑐 𝑦
𝑖=1 𝑖 𝑖.
𝑆𝑆𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 = 𝑎 𝑛 𝑐2
𝑖=1 𝑖 𝑖
32
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Intervalo de Confianza de un Contraste:
𝑎 𝑎 𝑎 𝑎 𝑎
𝐶𝑀𝑒 𝐶𝑀𝑒
𝑐𝑖 𝑦𝑖. − 𝑡 𝛼 𝑐𝑖2 ≤ 𝑐𝑖 𝜇𝑖 ≤ 𝑐𝑖 𝑦𝑖. + 𝑡 𝛼 𝑐𝑖2
2;𝑁−𝑎 𝑛 2;𝑁−𝑎 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
33
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Contrastes ortogonales
Es un caso especial de contraste, si se tienes dos
contrastes con coeficientes {𝑐𝑖} y {𝑑𝑖}, son ortogonales si:
𝑎
𝑐𝑖 𝑑𝑖 = 0
𝑖=1
𝑛𝑖 𝑐𝑖 𝑑𝑖 = 0
𝑖=1
34
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
Si se tiene 𝑎 tratamientos, se puede obtener (𝑎 − 1)
contrastes ortogonales.
De este modo, la 𝑆𝑆𝑇𝑟𝑎𝑡 de la ANOVA se divide en
(𝑎 – 1) contrastes con 𝑔. 𝑙. = 1, teniendo cada uno de los
contrastes su propio estadístico de prueba 𝐹0.
Los contrastes ortogonales deben comenzar por las
comparaciones de interés para el experimentador, antes de
llevar a cabo el experimento y de tener los resultados.
Si se hace un sondeo de datos previo a seleccionar los
contrastes, llevaría a inflar el Error Tipo I (𝛼), ya que el
experimentador estará sesgado de construir los contrastes
con las diferencias más grandes de medias observadas.
35
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
Ejemplo
36
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
Ejemplo
37
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
Ejemplo
38
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
Ejemplo
39
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Método Scheffé
Este método surge cuando hay interés de realizar más
de (𝑎 − 1) comparaciones y los datos ya se obtuvieron. Este
método permite comparar todos los contrastes posibles entre
las medias de los tratamientos, donde el error 𝑇𝑖𝑝𝑜 𝐼 es a lo
sumo 𝛼, para cualquiera de las comparaciones posibles.
Suponga un conjunto de “𝑚” contrastes, con medias:
Γ𝑢 = 𝑐1𝑢 𝜇1 + 𝑐2𝑢 𝜇2 + ⋯ + 𝑐𝑎𝑢 𝜇𝑎 𝐷𝑜𝑛𝑑𝑒 𝑢 = 1,2, … , 𝑚
40
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Método Scheffé
El contraste con los promedio, queda de este modo:
𝐶𝑢 = 𝑐1𝑢 𝑦1. + 𝑐2𝑢 𝑦2. + ⋯ + 𝑐𝑎𝑢 𝑦𝑎. 𝐷𝑜𝑛𝑑𝑒 𝑢 = 1,2, … , 𝑚
41
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Método Scheffé
Siendo el valor crítico de comparación del contraste:
𝑆𝛼,𝑢 = 𝑆𝐶 𝑢 𝑎 − 1 𝐹 𝛼;𝑎−1;𝑁−𝑎
42
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
Ejemplo
2019
45
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
46
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
47
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con
el tamaño muestral
• curvas de operación característica.
Grafica la probabilidad 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼, de una prueba
estadística para un tamaño de muestra particular contra un
parámetro que refleje la medida en que la 𝐻0 es falsa.
𝛽 = 𝑃 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑓𝑎𝑙𝑠𝑎
En ocasiones se utiliza la 𝑝𝑜𝑡𝑒𝑛𝑐𝑖𝑎.
𝛽 = 1 − 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑓𝑎𝑙𝑠𝑎
De este modo, estas curvas grafican 𝛽 contra un
parámetro Φ2 para un 𝛼 = 0,05 y 𝛼 = 0,01, con grados de
libertad de 𝜐1 para el numerador y 𝜐2 para el denominador.
48
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con
el tamaño muestral
49
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con
el tamaño muestral
• curvas de operación característica.
Donde:
𝑎 2
𝑛 𝜏
𝑖=1 𝑖
Φ2 =
𝑎𝜎 2
Se tiene que 𝜏𝑖 = 𝜇𝑖 − 𝜇, donde 𝜇 es el promedio de
todas las medias de los tratamientos, pero como son
parámetros poblacionales, no se conocen, lo mismo que 𝜎.
Pero supongamos que sí se conocieran los parámetros
𝜏𝑖 y 𝜎 2 , quedaría la expresión Φ2 en función de 𝑛. Con una
𝑝𝑜𝑡𝑒𝑛𝑐𝑖𝑎 (1 − 𝛽) específica deseada, con un nivel de
significancia, con los grados de libertad y probando con varios
𝑛, se lograría la potencia deseada y se llegaría al 𝑛 necesario.
50
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con el
tamaño muestral.
Ejemplo
51
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con
el tamaño muestral
52
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con
el tamaño muestral
• curvas de operación característica.
Un enfoque alternativo sería seleccionar un tamaño
de la muestra tal, que si la diferencia (𝐷) entre la medias de
dos tratamientos cualquiera excede el valor específico, la 𝐻0
deberá rechazarse.
𝑛𝐷 2
Φ2 =
2𝑎𝜎 2
Para ello se debe proponer valores para 𝐷 y para 𝜎.
𝐷 es la diferencia entre dos medias de tratamientos
cualquiera lo suficientemente grande que permita rechazar
𝐻0 con una potencia deseada. 𝜎 desviación estándar grande
de las respuestas, para que las otras no será mayor que éste.
53
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
54
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
55
Este método considera un límite 𝜎
de una observación que cuando es
mayor a eso se rechaza 𝐻0
• especificación de un incremento de 𝝈.
Se tiene la siguiente expresión:
𝑎 𝜏𝑖
𝑖=1 𝑎
Φ= 𝜎 = 1+𝑃 2 −1 𝑛
𝑛
Donde 𝑃: Porcentaje (0 a 1) del incremento de la 𝜎 de
una observación que al ser mayor que ésta la 𝐻0 se rechaza.
Al darle un valor a 𝑃, Φ queda en función de 𝑛. Se usa
las curvas de operación característica, se da un 𝑛, una
significancia 𝛼 y una potencia (1 − 𝛽) e ir probando hasta
lograr la potencia deseada.
56
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
57
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
58
El experimentador proponer un
ancho específico del intervalo de
confianza (error estándar).
• método de intervalo de confianza.
La precisión del intervalo de confianza está dado por:
2𝐶𝑀𝑒
±𝑡 𝛼
2,𝑁−𝑎 𝑛
59
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
60
Modelo de Efecto 𝐹𝑖𝑗𝑜 versus
Modelo de Efecto 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒.
Cuando se habla de un modelo de efecto fijo,
significa que el modelo presentado para los efectos de
los tratamientos o niveles de un factor mediante pruebas
de hipótesis, sólo será aplicable a los niveles de efectos
considerados en el análisis y las conclusiones no pueden
extenderse a otros tratamientos que no fueron
considerados explícitamente.
Por otro lado, si los “𝑎” tratamientos fueran una
muestra aleatoria de una población de tratamientos, en
ese caso sería deseable usar un modelo de efecto
variable, donde las conclusiones pueden extenderse a la
totalidad de los tratamientos de la población.
61