Unidad 3. Anova Con Un Factor

Ingeniería
Civil
Industrial
Estadística para
Ingeniería
Arica, 02 de mayo de 2019

U3
nidad
ingeniería
civil
industrial
ingeniería
3 civil
industrial
Arica, 02 de mayo de 2019
Temas.
i. análisis de varianza (ANOVA)
ii. diagrama
iii. pruebas de rango múltiples
iv. determinación del tamaño muestral
3
ingeniería
3 civil
industrial
i. análisis de varianza
2019
4
ANOVA permite comparar varios
tratamientos a la vez.
Hipótesis:
H0: 𝜇1 = 𝜇2 = … = 𝜇𝑘 = 𝜇
H1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗
o
H0: 𝜏1 = 𝜏2 = … = 𝜏𝑘 = 0
H1: 𝜏𝑖 ≠ 0 para algún 𝑖
¿Por qué no es conveniente usar todas de
combinaciones posibles de comparaciones de medias?
5
ANOVA considera dos fuentes de
variabilidad: tratamiento y error
aleatorio.
La tabla representa un diseño al azar:
Donde:
𝑌𝑖𝑗 : observación j-ésima del tratamiento i,
6
Ejemplo.
7
El tratamiento 𝜏𝑖 esta dado por la
diferencia entre la media global 𝜇 y la
media de un tratamiento particular 𝜇𝑖 .
Gráficamente se tendría lo siguiente:
8
La tabla ANOVA utiliza la notación de
puntos y permite calcular 𝐹0
9
ingeniería
3 civil
industrial
ii. diagrama
2019
10
el diagrama de caja no es concluyente
pero dan una intuición visual.
Utiliza percentiles (mín, P25, P50, P75 y máx) y
cuando las cajas no se traslapan es posible que los
tratamientos sean diferentes entre sí, y si traslapan
puede que no haya diferencias significativas entre ellas.
11
el diagrama de LSD es más asertivo al
hacer contraste estadístico (means plot)
Utiliza los promedios de los tratamientos y sus
intervalos de confianza. Si no se traslapan, son diferentes.
12
Ejercicio 1
13
Ejercicio 2
14
ingeniería
3 civil
industrial
iii. pruebas de rango

múltiples
2019
15
cuando se rechaza Ho de ANOVA, hay
que investigar cuales tratamientos son
diferentes.
Estrategias para averiguar cuales tratamientos
son diferentes:
• comparación de parejas de medias.
• comparación con un control.
• comparación por contrastes.
16
diferentes.
son diferentes:
17
una prueba es potente, si es capaz
de detectar diferencias pequeñas.
◦ comparación de parejas de medias:
Método LSD (least significant difference)
Dos medias son significativamente diferentes si sus
diferencias muestrales exceden:
1 1
𝐿𝑆𝐷 = 𝑡 𝛼 𝐶𝑀𝑒 +
2;𝑁−𝑎 𝑛𝑖 𝑛𝑗
El intervalo de confianza para la diferencia, se tiene:

𝑦𝑖. − 𝑦𝑗. − 𝐿𝑆𝐷 ≤ 𝜇𝑖 − 𝜇𝑗 ≤ 𝑦𝑖. − 𝑦𝑗. + 𝐿𝑆𝐷
𝐶𝑀𝑒
En means plot, se emplea: 𝑦𝑖. ± 𝑡 𝛼 2,𝑁−𝑎
𝑛𝑖
18
una prueba conservadora, al comparar
de forma robusta, si hay rechazo de Ho
la diferencia es evidente
Método Tukey
Dos medias son significativamente diferentes si el
valor absoluto de sus diferencias muestrales exceden:
𝑞𝛼 𝑎,𝑁−𝑎 1 1
𝑇𝛼 = 𝐶𝑀𝑒 +
2 𝑛𝑖 𝑛𝑗
Donde 𝑞𝛼 es el estadístico del rango estudentizado.

Para el intervalo de confianza de la diferencia se tiene:
𝑦𝑖. − 𝑦𝑗. − 𝑇𝛼 ≤ 𝜇𝑖 − 𝜇𝑗 ≤ 𝑦𝑖. − 𝑦𝑗. + 𝑇𝛼
19
prueba que ordena ascendentemente
las medias para compararlas con un
rango significativo mínimo.
Método Duncan
Se ordenan los “a” promedio de los tratamientos de
menor a mayor y se calcula el Error Estándar de cada
promedio:
𝐶𝑀𝑒
𝑆𝑦𝑖. =
𝑛
Si el diseño está desbalanceado, se reemplaza “n”

por la media armónica “nh”:
𝑎
𝑛ℎ = 𝑎
1
𝑖=1 𝑛𝑖
20
Método Duncan
En la tabla de rangos significativos de Duncan se
buscan los valores:
𝑟𝛼 𝑝, 𝑁 − 𝑎 Donde 𝑝 = 2,3, … , 𝑎
En seguida se calculan (𝑎 − 1) rangos mínimos de
significativos (𝑅𝑝 )
𝑅𝑝 = 𝑟𝛼 𝑝, 𝑁 − 𝑎 𝑆𝑦𝑖. Donde 𝑝 = 2,3, … , 𝑎
Si una diferencia de pares de medias es mayor que su

𝑅𝑝 correspondiente, entonces son diferentes a un nivel 𝛼.
21
Método Duncan
𝑅𝑎 se compara con la diferencia mayor (promedio
máximo con el promedio mínimo), 𝑅𝑎−1 se compara con la
diferencia que le sigue en tamaño (promedio máximo con el
promedio que le sigue al mínimo) y así sucesivamente hasta
llegar a 𝑅2 .
Terminada la diferencia mayor usando el promedio
máximo como pivote, se vuelve hacer la diferencia de pares
de promedios usando el que le sigue al máximo y se compara
con 𝑅𝑎−1 y así hasta llegar a 𝑅2 . Esto continua hasta hacer las
𝑎(𝑎 − 1) 2 pares de medias posibles
22
diferentes.
son diferentes:
23
diferentes.
son diferentes:
24
si un tratamientos específico (𝜇𝑘 ) es
el control (o sin tratamiento), todas
las medias se comparan con éste.
◦ comparación con un control:
Método Dunnett
En algunos casos uno de los tratamientos es un control,
donde los restantes (𝑎 − 1) tratamientos se comparan con él.
Dunnett, señala que la hay diferencia significativa entre
un tratamiento y el control (sea este 𝑦𝑎. ) si:
1 1
𝑦𝑖. − 𝑦𝑎. > 𝑑𝛼 𝑎 − 1, 𝑛 − 𝑎 𝐶𝑀𝑒 +
𝑛𝑖 𝑛𝑎
Donde 𝑑𝛼 𝑎 − 1, 𝑛 − 𝑎 está tabulada, para una y dos

colas. El tamaño muestral del control debería ser mayor que el
resto de los tratamientos, para ello se sugiere que 𝑛𝑎 𝑛𝑖 = 𝑎
25
diferentes.
son diferentes:
26
diferentes.
son diferentes:
27
a veces el objetivo es contrastar
hipótesis que involucra a más de dos
medias.
◦ comparación por contraste:
Se define contraste:
𝑎
Γ= 𝑐𝑖 𝜇𝑖
𝑖=1
Donde se debe dar la siguiente condición:

𝑎
𝑐𝑖 = 0
𝑖=1
28
medias.
De este modo se definen las siguientes hipótesis:
𝑎
𝐻0: 𝑐𝑖 𝜇𝑖 = 0
𝑖=1
𝑎
𝐻1: 𝑐𝑖 𝜇𝑖 ≠ 0
𝑖=1
Para una muestra se tiene que un contraste es:

𝑎 𝑎
𝐶= 𝑐𝑖 𝑦𝑖. = 𝑐𝑖 𝑦𝑖.
𝑖=1 𝑖=1
29
medias.
Método de Prueba 𝑡
𝑎
𝑖=1 𝑐𝑖 𝑦𝑖.
Estadístico: 𝑡0 =
𝑛𝐶𝑀𝑒 𝑎 2
𝑖=1 𝑐𝑖
Para tamaños de muestras desiguales se tiene:

𝑎
𝑖=1 𝑐𝑖 𝑦𝑖.
𝑡0 =
𝐶𝑀𝑒 𝑎 2
𝑖=1 𝑛𝑖 𝑐𝑖
Criterio de rechazo: 𝑡0 > 𝑡 𝛼 2;𝑁−𝑎
30
medias.
Método de Prueba 𝐹
𝑎 2
𝑐 𝑦
Estadístico: 𝐹0 = 𝑡02 = 𝑖=1 𝑖 𝑖.
𝑛𝐶𝑀𝑒 𝑎𝑖=1 𝑐𝑖
2
Es una ANOVA con g.l. =1 en el numerador:

𝑆𝑆𝐶𝑜𝑛𝑠𝑡𝑟𝑎𝑠𝑡𝑒
1
𝐹0 =
𝐶𝑀𝑒
𝑎 2
𝑐 𝑦
𝑖=1 𝑖 𝑖.
Donde: 𝑆𝑆𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 =
𝑛 𝑎 2
𝑖=1 𝑐𝑖
31
medias.
Método de Prueba 𝐹
Para tamaños de muestras desiguales se tiene:
𝑎 2
𝑐 𝑦
𝑖=1 𝑖 𝑖.
𝑆𝑆𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 = 𝑎 𝑛 𝑐2
𝑖=1 𝑖 𝑖
Criterio de rechazo: 𝐹0 > 𝐹 𝛼;1;𝑁−𝑎
32
medias.
Intervalo de Confianza de un Contraste:
𝑎 𝑎 𝑎 𝑎 𝑎
𝐶𝑀𝑒 𝐶𝑀𝑒
𝑐𝑖 𝑦𝑖. − 𝑡 𝛼 𝑐𝑖2 ≤ 𝑐𝑖 𝜇𝑖 ≤ 𝑐𝑖 𝑦𝑖. + 𝑡 𝛼 𝑐𝑖2
2;𝑁−𝑎 𝑛 2;𝑁−𝑎 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
33
medias.
Contrastes ortogonales
Es un caso especial de contraste, si se tienes dos
contrastes con coeficientes {𝑐𝑖} y {𝑑𝑖}, son ortogonales si:
𝑎
𝑐𝑖 𝑑𝑖 = 0
𝑖=1
Para un diseño desbalanceado, se tiene:

𝑎
𝑛𝑖 𝑐𝑖 𝑑𝑖 = 0
𝑖=1
34
medias.
Si se tiene 𝑎 tratamientos, se puede obtener (𝑎 − 1)
contrastes ortogonales.
De este modo, la 𝑆𝑆𝑇𝑟𝑎𝑡 de la ANOVA se divide en
(𝑎 – 1) contrastes con 𝑔. 𝑙. = 1, teniendo cada uno de los
contrastes su propio estadístico de prueba 𝐹0.
Los contrastes ortogonales deben comenzar por las
comparaciones de interés para el experimentador, antes de
llevar a cabo el experimento y de tener los resultados.
Si se hace un sondeo de datos previo a seleccionar los
contrastes, llevaría a inflar el Error Tipo I (𝛼), ya que el
experimentador estará sesgado de construir los contrastes
con las diferencias más grandes de medias observadas.
35
medias.
Ejemplo
36
medias.
Ejemplo
Antes de correr el experimento, se tiene presentada las siguientes

comparaciones entre las medias de los tratamientos:
𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒
𝐻0 : 𝜇4 = 𝜇5 𝐶1 = −𝑦4. +𝑦5.
𝐻0 : 𝜇1 + 𝜇3 = 𝜇4 + 𝜇5 𝐶2 = +𝑦1. +𝑦3. −𝑦4. −𝑦5.
𝐻0 : 𝜇1 = 𝜇3 𝐶3 = +𝑦1. −𝑦3.
𝐻0 : 4𝜇2 = 𝜇1 + 𝜇3 + 𝜇4 + 𝜇5 𝐶4 = −𝑦1. 4𝑦2. −𝑦3. −𝑦4. −𝑦5.
Se puede apreciar que cada contraste cumple su condición básica,

además de ser ortogonales entre ellos.
37
medias.
Ejemplo
Se tiene la siguiente Anova.
Desarrollando cada contraste con su SS y sus F, se tiene:
38
medias.
Ejemplo
¿Qué hubiese pasado

si posterior al haber
hecho el experimento
propone hacer las
comparaciones de
medias de los
tratamientos?
¿Hubiese optados por
las mismas o las
habría cambiado?
39
medias.
Método Scheffé
Este método surge cuando hay interés de realizar más
de (𝑎 − 1) comparaciones y los datos ya se obtuvieron. Este
método permite comparar todos los contrastes posibles entre
las medias de los tratamientos, donde el error 𝑇𝑖𝑝𝑜 𝐼 es a lo
sumo 𝛼, para cualquiera de las comparaciones posibles.
Suponga un conjunto de “𝑚” contrastes, con medias:
Γ𝑢 = 𝑐1𝑢 𝜇1 + 𝑐2𝑢 𝜇2 + ⋯ + 𝑐𝑎𝑢 𝜇𝑎 𝐷𝑜𝑛𝑑𝑒 𝑢 = 1,2, … , 𝑚
40
medias.
Método Scheffé
El contraste con los promedio, queda de este modo:
𝐶𝑢 = 𝑐1𝑢 𝑦1. + 𝑐2𝑢 𝑦2. + ⋯ + 𝑐𝑎𝑢 𝑦𝑎. 𝐷𝑜𝑛𝑑𝑒 𝑢 = 1,2, … , 𝑚
Se denomina Error Estándar del Contraste a:

𝑎 2
𝑐𝑖𝑢
𝑆𝐶𝑢 = 𝐶𝑀𝑒
𝑛𝑖
𝑖=1
41
medias.
Método Scheffé
Siendo el valor crítico de comparación del contraste:
𝑆𝛼,𝑢 = 𝑆𝐶 𝑢 𝑎 − 1 𝐹 𝛼;𝑎−1;𝑁−𝑎
Si 𝐶𝑢 > 𝑆𝛼,𝑢 , se rechaza 𝐻0 : Γ𝑢 = 0
El intervalo de confianza se puede expresar:

𝐶𝑢 − 𝑆𝛼,𝑢 ≤ Γ𝑢 ≤ 𝐶𝑢 + 𝑆𝛼,𝑢
42
medias.
Ejemplo
Para el ejemplo anterior, suponga que los contrastes de interés

son:
Γ1 = 𝜇1 + 𝜇3 − 𝜇4 − 𝜇5
Γ2 = 𝜇1 − 𝜇4
Los valores numéricos de estos contrastes son los siguientes:

𝐶1 = 𝑦1. +𝑦3. −𝑦4. −𝑦5.
𝐶1 = 9,8 + 17,6 − 20,6 − 10,8
𝐶1 = 5,0
𝐶2 = 𝑦1. −𝑦4.
𝐶1 = 9,8 − 20,6
𝐶1 = −11,8
43
medias.
Ejemplo
Calculando los Errores Estándar de los Contrastes, se tiene:

𝑆𝐶1 = 2,54
𝑆𝐶2 = 1,80
Calculando los Valores Críticos al 1%, se tiene

𝑆1%;1 = 10,69
𝑆1%;2 = 7,58
Para el contraste C1, no se rechaza H0, por lo tanto, no se tiene
evidencia que las medias de los tratamientos 1 y 3 como grupo
difieren de las medias de los tratamientos 4 y 5 como grupo a un
nivel de significancia del 1%. Por otro lado, que para el contraste
C2, se rechaza H0, por lo tanto, las medias de los tratamientos 1 y 4
difieren a un nivel de significancia del 1%.
44
ingeniería
3 civil
industrial
iv. determinación del tamaño

muestral
2019
45
Para un diseño experimental es
fundamental determinar la cantidad
de réplicas se deben hacerse.
Para esto se puede emplear dos métodos:
• curvas de operación característica.
• especificación de un incremento de 𝜎.
• método de intervalo de confianza.
46
47
Este método utiliza gráficas que
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con
el tamaño muestral
Grafica la probabilidad 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼, de una prueba
estadística para un tamaño de muestra particular contra un
parámetro que refleje la medida en que la 𝐻0 es falsa.
𝛽 = 𝑃 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑓𝑎𝑙𝑠𝑎
En ocasiones se utiliza la 𝑝𝑜𝑡𝑒𝑛𝑐𝑖𝑎.
𝛽 = 1 − 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑓𝑎𝑙𝑠𝑎
De este modo, estas curvas grafican 𝛽 contra un
parámetro Φ2 para un 𝛼 = 0,05 y 𝛼 = 0,01, con grados de
libertad de 𝜐1 para el numerador y 𝜐2 para el denominador.
48
el tamaño muestral
49
el tamaño muestral
Donde:
𝑎 2
𝑛 𝜏
𝑖=1 𝑖
Φ2 =
𝑎𝜎 2
Se tiene que 𝜏𝑖 = 𝜇𝑖 − 𝜇, donde 𝜇 es el promedio de
todas las medias de los tratamientos, pero como son
parámetros poblacionales, no se conocen, lo mismo que 𝜎.
Pero supongamos que sí se conocieran los parámetros
𝜏𝑖 y 𝜎 2 , quedaría la expresión Φ2 en función de 𝑛. Con una
𝑝𝑜𝑡𝑒𝑛𝑐𝑖𝑎 (1 − 𝛽) específica deseada, con un nivel de
significancia, con los grados de libertad y probando con varios
𝑛, se lograría la potencia deseada y se llegaría al 𝑛 necesario.
50
relaciona el 𝐸𝑟𝑟𝑜𝑟 𝑇𝑖𝑝𝑜 𝐼𝐼 (𝛽) con el
tamaño muestral.
Ejemplo
51
el tamaño muestral
52
el tamaño muestral
Un enfoque alternativo sería seleccionar un tamaño
de la muestra tal, que si la diferencia (𝐷) entre la medias de
dos tratamientos cualquiera excede el valor específico, la 𝐻0
deberá rechazarse.
𝑛𝐷 2
Φ2 =
2𝑎𝜎 2
Para ello se debe proponer valores para 𝐷 y para 𝜎.
𝐷 es la diferencia entre dos medias de tratamientos
cualquiera lo suficientemente grande que permita rechazar
𝐻0 con una potencia deseada. 𝜎 desviación estándar grande
de las respuestas, para que las otras no será mayor que éste.
53
54
55
Este método considera un límite 𝜎
de una observación que cuando es
mayor a eso se rechaza 𝐻0
• especificación de un incremento de 𝝈.
Se tiene la siguiente expresión:
𝑎 𝜏𝑖
𝑖=1 𝑎
Φ= 𝜎 = 1+𝑃 2 −1 𝑛
𝑛
Donde 𝑃: Porcentaje (0 a 1) del incremento de la 𝜎 de
una observación que al ser mayor que ésta la 𝐻0 se rechaza.
Al darle un valor a 𝑃, Φ queda en función de 𝑛. Se usa
las curvas de operación característica, se da un 𝑛, una
significancia 𝛼 y una potencia (1 − 𝛽) e ir probando hasta
lograr la potencia deseada.
56
57
58
El experimentador proponer un
ancho específico del intervalo de
confianza (error estándar).
La precisión del intervalo de confianza está dado por:
2𝐶𝑀𝑒
±𝑡 𝛼
2,𝑁−𝑎 𝑛
El experimentador propone una precisión de forma

especifica y un valor para 𝜎. De este modo se va probando los
𝑛 hasta que el obtenga la precisión deseada.
59
60
Modelo de Efecto 𝐹𝑖𝑗𝑜 versus
Modelo de Efecto 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒.
Cuando se habla de un modelo de efecto fijo,
significa que el modelo presentado para los efectos de
los tratamientos o niveles de un factor mediante pruebas
de hipótesis, sólo será aplicable a los niveles de efectos
considerados en el análisis y las conclusiones no pueden
extenderse a otros tratamientos que no fueron
considerados explícitamente.
Por otro lado, si los “𝑎” tratamientos fueran una
muestra aleatoria de una población de tratamientos, en
ese caso sería deseable usar un modelo de efecto
variable, donde las conclusiones pueden extenderse a la
totalidad de los tratamientos de la población.
61

Unidad 3. Anova Con Un Factor

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 3. Anova Con Un Factor

Cargado por

Copyright:

Formatos disponibles

Ingeniería

Arica, 02 de mayo de 2019

iii. pruebas de rango

El intervalo de confianza para la diferencia, se tiene:

Donde 𝑞𝛼 es el estadístico del rango estudentizado.

Si el diseño está desbalanceado, se reemplaza “n”

Si una diferencia de pares de medias es mayor que su

Donde 𝑑𝛼 𝑎 − 1, 𝑛 − 𝑎 está tabulada, para una y dos

Donde se debe dar la siguiente condición:

Para una muestra se tiene que un contraste es:

Para tamaños de muestras desiguales se tiene:

Criterio de rechazo: 𝑡0 > 𝑡 𝛼 2;𝑁−𝑎

Es una ANOVA con g.l. =1 en el numerador:

Criterio de rechazo: 𝐹0 > 𝐹 𝛼;1;𝑁−𝑎

Para un diseño desbalanceado, se tiene:

Antes de correr el experimento, se tiene presentada las siguientes

Se puede apreciar que cada contraste cumple su condición básica,

Se tiene la siguiente Anova.

Desarrollando cada contraste con su SS y sus F, se tiene:

¿Qué hubiese pasado

Se denomina Error Estándar del Contraste a:

Si 𝐶𝑢 > 𝑆𝛼,𝑢 , se rechaza 𝐻0 : Γ𝑢 = 0

El intervalo de confianza se puede expresar:

Para el ejemplo anterior, suponga que los contrastes de interés

Los valores numéricos de estos contrastes son los siguientes:

Calculando los Errores Estándar de los Contrastes, se tiene:

Calculando los Valores Críticos al 1%, se tiene

iv. determinación del tamaño

El experimentador propone una precisión de forma

También podría gustarte