INDUSTRIAL
SESION 04
ANOVA de un factor
3
1
4
SUPOSICIONES EN EL ANÁLISIS DE LA
VARIANZA (ANOVA) LV
6
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
Walter
• Las poblaciones en la gráfica de la izquierda siguen la
Kike
distribución normal y la variación en cada población es la
Willy
misma. Sin embargo, las medias no son iguales.
Servicio al cliente
Walter
Suponer que las poblaciones son iguales es
decir que no hay diferencia en las medias Kike
9
Ing. William león Velásquez
La prueba ANOVA LV
11
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
X G 58
12
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
SS= (55-58)2+(54-58)2+(59-58)2+(56-58)2+
(66-58)2+(76-58)2+(67-58)2+(71-58)2+
(47-58)2+(51-58)2+(46-58)2+(48-58)2=
SS= 1082.
13
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
14
Ing. William león Velásquez
La prueba ANOVA LV
15
Ing. William león Velásquez
La prueba ANOVA LV
En el ejemplo:
• La variación debida a los tratamientos es la suma de las diferencias al
cuadrado entre la media de cada empleado y la media global.
• Para calcularlo, primero se encuentra la media de cada uno de los
tres tratamientos.
18
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
Walter es 56
Willy es 70
Kike es 48
En el ejemplo:
• Este término es la suma de las diferencias al cuadrado entre cada valor y la media
para ese empleado en particular.
SSE=(55 – 56)2 +(54 – 56)2 + ……… + (46 – 48)2+ (48 – 48)2 = 90
• La variación de error es de 90.
SSE = 90
19
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
En resumen:
La suma de la diferencia entre el valor particular y la media global
elevado al cuadrado es la variación total, y es igual 1082.
La suma de los cuadrados debida a los tratamientos es 992
La variación de error es de 90.
Por lo tanto:
SS = SST + SSE
1082 = 992 + 90
+
=
20
Ing. William león Velásquez
La prueba ANOVA LV
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟
21
Ing. William león Velásquez
La prueba ANOVA LV
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟
𝐹= 𝑚 − 1 m-1
𝑆𝐶𝐸 Diferencias dentro de
𝑛−𝑚 cada grupos
n -m
22
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
23
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
Por tanto
𝑆𝐶𝑇
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹= 𝑚 − 1 Entre grupos
𝐹= 𝑆𝐶𝐸
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟 Dentro de cada
𝑛−𝑚 grupos
25
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV
26
Ing. William león Velásquez
Comparación de varias medias LV
Análisis de Varianza (ANOVA)
27
Ing. William león Velásquez
LV
El problema
• Se tiene varias medias muestrales y se desea saber si
realmente son evidencia de una diferencia entre los
diferentes grupos.
• Existe una variable cuanlitativa X que podría explicar
los cambios en una variable cuantitativa Y
28
Ing. William león Velásquez
LV
Esquema ANOVA
Variable Variable dependiente
Independiente o
Explicativa o Respuesta
CUALITATIVA CUANTITATIVA
X Y
30
Ing. William león Velásquez
LV
Ilustración mediante un ejemplo
32
Ing. William león Velásquez
LV
Modelo de ANOVA de un factor
Media general
Error aleatorio
33
Ing. William león Velásquez
En el ejemplo LV
El efecto sobre la cantidad producida de cada tratamiento
(línea de producción) en la muestra no tiene que ser el
mismo.
X: Es el factor analizado
Variable cualitativa
Línea 1 Línea 2 `Línea 3
Variable Y: Producción
cuantitativa promedio 11.1 15.9 22.7
36
Ing. William león Velásquez
Ejemplo 1 LV
• Una gran ciudad está dividida en cuatro distritos. El jefe de policía quiere
determinar si hay alguna diferencia en el número promedio de infracciones
cometidos en cada distrito.
• Se registró el número de infracciones reportados en cada distrito en una
muestra de seis días.
• Al nivel de significancia 0,05; puede el funcionario concluir que hay diferencia en
el número promedio de infracciones?
Distrito 1 Distrito 2 Distrito 3 Distrito 4
13 21 12 16
15 13 14 17
14 18 15 18
15 19 13 15
14 18 12 20
37
Ing. William león Velásquez 15 19 15 18
LV
Ejemplo 1
a) Formulación de las hipótesis
Ho: μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en unos de los distritos la cantidad promedio
de infracciones cometidos es diferente
σσ𝑋 2 σ 𝑋𝑖 2 σσ𝑋 2
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋2 - 𝑆𝐶𝑇 = σ - σ𝑛
σ𝑛 𝑛𝑖
d) Criterio de decisión
Se rechaza la Ho debido a que el valor del Fcalculado es 9.118 y es mayor al valor
del Fcrítico de 3.10.
e) Conclusión:
Se puede afirmar con un nivel de significancia del 5%
Que al menos en unos de los distritos la cantidad promedio de infracciones
cometidos es diferente
Por lo tanto existe diferencia en el número promedio de infracciones cometidos 41
Ing. William león Velásquez
en cada distrito
Ejemplo 2 LV
• Una egresada de ingeniería industrial tiene ofertas de trabajo de cuatro
empresas. Para examinar un poco más las propuestas, solicitó a un grupo de
personas recién ingresadas a dichas empresas, que le indiquen cuántos meses
trabajaron cada una para su compañía, antes de recibir un aumento de sueldo.
• La información muestral fueron lo siguiente:
44
Ing. William león Velásquez
Ejemplo 2 LV
2 σσ𝑋 2
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋 - σ𝑛
σ 𝑋𝑖 2 σσ𝑋 2
𝑆𝐶𝑇 = σ - σ𝑛
𝑛𝑖
45
Ing. William león Velásquez
Ejemplo 2 LV
ANOVA
Factor de SC GL CM F
Variación
Tratamiento 32.33 3 10.777 2.360
Error 45.67 10 4.567
Total 78.00 13
Conclusión
• Como el valor Fcalculado (2.360) es menor al valor Fcrítico (3.71) no se rechaza la Ho,
• No se puede afirmar con un nivel de significancia del 5%, que al menos en una de las
empresas el promedio de meses antes de recibir un aumento de sueldo es diferente
• Es decir no existe diferencia entre las cuatro empresas, en el promedio de meses
antes de recibir un aumento de sueldo
• Por lo tanto debe elegir otro criterio para seleccionar a una de las empresas
46
Ing. William león Velásquez
Ejemplo 3 LV
47
Ing. William león Velásquez
Ejemplo 3 LV
15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos
producen resultados equivalentes? O por el contrario ¿Hay algún método superior
a los demás?
48
Ing. William león Velásquez
Ejemplo 3 LV
50
Ing. William león Velásquez
Ejemplo 3 LV
σ 𝑋𝑖 2
σ σ 𝑋 2 =2984 = 2940
𝑛𝑖
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
σ 𝑋𝑖 2 σσ𝑋 2
σσ𝑋 2 𝑆𝐶𝑇 = σ -
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋2 - 𝑛𝑖 σ𝑛
σ𝑛
SC(entre) = 2966,8 – 2940 = 26,8
SC(total) = 2984 - 2940 = 44
SS = SST + SSE
SST = SS - SSE
SC(intra) = 2984 – 2966,8 = 17,2 51
Ing. William león Velásquez
Ejemplo 3 LV
d.- Conclusión:
• Como el Fcalculado (9.37) es mayor que es valor de la Fteórica (3,89)
se rechaza la Ho.
• Se puede afirmar con un nivel de significancia del 5% que al menos
uno de los tres métodos producen en el test de rendimientos resultados
diferentes
• Se concluye que los tres métodos de entrenamiento producen
diferencias significativas.
53
Ing. William león Velásquez
Ejemplo 4 LV
Un estudio muestra en la pantalla de cuatro
computadores una lista de palabras sin sentido con
procedimientos diferentes, asignados aleatoriamente a
un grupo de personas. Luego se les realiza una prueba
de memoria de dichas palabras, obteniéndose los
siguientes resultados:
c) Encontrar el Fcalculado
Calcular los totales y los cuadrados de los totales divididos por el número
de observaciones:
56
Ing. William león Velásquez
Ejemplo 4 LV
57
Ing. William león Velásquez
Ejemplo 4 LV
2 σ𝑋 2
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋 - SC(total) = 988 – 820 = 168
𝑛
d.- Conclusión
Como el Fcalculado (7.0) es mayor que el Fcritico (3.05) se rechaza la hipótesis
nula
Se puede afirmar con un nivel de significancia del 5%
Que al menos en una de las cuatros formas de presentar las palabras se
obtiene resultados diferentes
Y se concluye que los cuatro procedimientos de presentación producen
diferencias significativas.
59
Ing. William león Velásquez
2
60
LV
ANOVA de dos factores
62
Ing. William león Velásquez
LV
ANOVA – Dos factores o direcciones
63
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV
Ho: µ1=µ2=µ3=………….µi
Ha: Al menos unas de las µs es diferente
No todas las medias de tratamientos son iguales
𝐹𝑐𝑟𝑖𝑡 𝑇1 =Alfa, GL , GL
T1 E
𝐹𝑐𝑟𝑖𝑡 𝑇2 =Alfa, GL , GL
T2 E
65
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋 2 - FC
σ 𝑋𝑖 2 σ 𝑋𝑖 2
𝑆𝐶𝑇1 = σ - FC 𝑆𝐶𝑇2 = σ - FC
𝑛𝑖 𝑛𝑖
66
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV
Paso 3 Calculo del estadístico Tabla ANOVA
Variación total
SCT n-1 Varianza Tot
Regla: No rechazar si la F de la muestra es menor que la F de tabla para una cierta alfa
67
Ing. William león Velásquez
LV
ANOVA de 2 factores –Pasos
Paso 4 Conclusión y decisión
Distribución F
Ftabla
Alfa
Zona de no
rechazo
O
Si el valor de p correspondiente a Fc (Tr1 o Tr2) es menor
de Alfa se rechaza Ho
69
Ing. William león Velásquez
Ejemplo 5 LV
72
Ing. William león Velásquez
Ejemplo 5 LV
2.- Establecer el Criterio de Contraste
gl T1 a-1 2 Gl T2 =4
gl T2 b-1 4 Gl SCE= 8
F= 3.838
T1 T2
gl Tot n-1 14
gl
SCE glTot-gl T1 -gl T2 8
I II III ∑X ∑X2 n
A 18 21 20 59 1165 3
B 24 26 27 77 1981 3
C 30 29 34 93 2897 3
D 22 25 24 71 1685 3
E 20 23 24 67 1505 3
∑X 114 124 129 367 ∑∑X
∑X2 2684 3112 3437 9,233 ∑∑X2
n 5 5 5 15 ∑∑n
74
Ing. William león Velásquez
Ejemplo 5 LV
Factor de corrección
σσ𝑋 2
(367)2
𝐹𝐶 = FC = ----------- = 8979.267
σ𝑛 15
3.3- Cálculo de la Suma cuadrado de totales
SCTotales X FC 2
Suma total de
cuadrados
( X ) 2
SCTi FC
n
FUENTE SS GL SM F
T1 23.33333 2 11.66667 7
T2 217.0667 4 54.26667 32.56
ERROR 13.33333 8 1.666667
TOTAL 253.7333 14
4. Conclusión
78
Ing. William León Velasquez
Jun.-20
Urbano Rural
82
Ing. William león Velásquez
Ejemplo 6 LV
Pasos
1.- Establecer Hipótesis
Se tiene que establecer hipótesis para cada uno de
los tratamientos y para la interacción de ambos:
a) Primer tratamiento:
Ho: “Con respecto al sexo no existe diferencia en
las calificaciones obtenidas, que mide la
afinidad hacia la mecánica”
Ha: “Con respecto al sexo existe diferencia en las
calificaciones obtenidas, que mide la afinidad
hacia la mecánica”
83
Ing. William león Velásquez
Ejemplo 6 LV
1.- Establecer Hipótesis
b) Respecto al segundo tratamiento:
Ho: “Con respecto al lugar donde viven no existe diferencia en las
calificaciones obtenidas, que mide la afinidad hacia la mecánica”
Ha: “Con respecto al lugar donde viven existe diferencia en las
calificaciones obtenidas, que mide la afinidad hacia la mecánica”
c) Respecto a la interacción de los dos tratamientos
Ho: ”La combinación de las circunstancias sexo y lugar de residencia
no afecta de manera significativa el tener más afinidad hacia la
mecánica”
Ha: ”La combinación de las circunstancias sexo y lugar de residencia
afecta de manera significativa el tener más afinidad hacia la
mecánica” 84
Ing. William león Velásquez
Ejemplo 6 LV
2.- Establecer el Criterio de Contraste
nivel de significancia
a=2 b=2 n=16 de .05
Gl T1 =1
Gl SCE= 12
gl T1 a-1 1 F= 4 .75
gl T2 b-1 1
gl Iter (a-1)(b-1) 1
gl Tot n-1 15 Gl T2 =1
gl SCE glTot-gl T1 -gl T2 - gl Iter 12 Gl SCE= 12
F= 4 .75
Gl Iter =1
Gl SCE= 12
F= 4 .75
85
Ing. William león Velásquez
Ejemplo 6 LV
3.- Calcular el Estadístico de Prueba
Sumatoria de los totales
Urbano Rural
Hombre x2 Mujer x2 Hombre x2 Mujer x2
4 16 1 1 3 9 4 16
9 81 4 16 7 49 4 16
9 81 5 25 7 49 4 16
10 100 6 36 7 49 8 64 ΣΣ
ΣX = 32 16 24 20 92
ΣX² = 278 78 156 112 624
n 4 4 4 4 16
86
Ing. William león Velásquez
Ejemplo 6 LV
•Cálculo del Factor de corrección:
( X ) 2
FC
n
FC
92
2
529
Ing. William león Velásquez
16 87
Ejemplo 6 LV
SCTotal = X 2 - FC
= ( 278 + 78 + 156 + 112) - 529 = 95
= 624 - 529 = 95
88
Ing. William león Velásquez
Ejemplo 6 LV
( Ti ) 2
SCT1 FC
n
89
Ing. William león Velásquez
Ejemplo 6 LV
( Bli ) 2
SCT2 FC
n
Hombre Mujer
( X ) 2
SCG FC
n
92
Ing. William león Velásquez
Ejemplo 6 LV
FUENTE SC GL MC F
TRATAMIENTO 1 1.0 1 1 0.2
TRATAMIENTO 2 25.0 1 25 5
POR GRUPOS 35
INTERACCION 9.0 1 9 1.8
ERROR 60 12 5
TOTAL 95 15
93
Ing. William león Velásquez
Ejemplo 6 LV
4.- Tomar Decisión y Conclusión
Decisión FDATOS Conclusión
FCRITICO
0.2 No se rechaza la Ho
FT1= 4 .75
5 Se rechaza la Ho
FT2= 4 .75
FCrítico
1.8 No se rechaza la Ho
FINT= 4 .75
Como los Estadísticos de Prueba, en los casos de las variables de localidad (F*1 = 0.2) y la
combinación de sexo y localidad (F*i =1.8) son mas pequeños que sus respectivos criterios de
contraste (F = 4.75), en estos casos no se rechaza la hipótesis nula,
Mientras que en el caso del sexo el Estadístico de Prueba (F*2 = 5.0) es mas grande que el Criterio de
Contraste (F = 4.75), entonces por lógica inferimos que F* queda dentro de la zona crítica y por lo
tanto se rechaza la hipótesis nula por lo tanto aceptamos la hipótesis alterna
Ing. William león Velásquez 94
Ejemplo 6 LV
y la conclusión :
95
Ing. William león Velásquez
Ejemplo 7 LV
96
Ing. William león Velásquez
Ejemplo 7 LV
• Los resultados, en miligramos de ácido ascórbico por litro, son los siguientes:
TIEMPO ( DÍAS )
MARCA 0 3 7
RICA 52.6 54.2 49.4 49.2 42.7 48.8
49.8 46.5 42.8 53.2 40.4 47.6
BUENA 56.0 48.0 48.8 44.0 49.2 44.0
49.6 48.4 44.0 42.4 42.0 43.2
BARATA 52.5 52.0 48.0 47.0 48.5 43.3
51.8 53.6 48.2 49.6 45.2 47.6
• Utilice un nivel de significancia de .05 para probar la hipótesis que:
• Los contenidos de ácido ascórbico por marca de jugo son diferentes
• Los contenidos de ácido ascórbico por tiempo de congelamiento son diferentes
• Los contenidos de ácido ascórbico son diferentes debido a la interacción de las dos
variables. 97
Ing. William león Velásquez
Ejemplo 7 LV
98
Ing. William león Velásquez
Ejemplo 7 LV
3.35
gl T1 a-1 2
gl T2 b-1 2 Gl T2 =2
Gl SCE= 27
gl Iter (a-1)(b-1) 4 F= 3.35
gl Tot n-1 35
gl glTot-gl T1 -gl T2 - gl 3.35
SCE Iter 27
Gl Iter =4
Gl SCE= 27
F=2.73
99
Ing. William león Velásquez
2.73
Ejemplo 7 LV
• Elaborar la tabla ANOVA
n
0 3 7
1724.1
X 2
(1724.1) 2 2972520.81
( X ) 2 2,972,520.81
FC
n FC = ----------------
36
= 82,570.0225
SCTotales X FC 2
SCT1
2
X
FC
n
ΣX²/ n0 ΣX²/ n3 ΣX²/ n7
2 2 2
615 566.6 542.5
SCT1 FC
12 12 12
TIEMPO SCT1 = 31518.75 + 26752.96 + 24525.52 - 82570.02
SCT2
3- Cálculos de los tratamientos X 2
FC
n
X
X
n=4
2
SGG FC RICA
0
203.1
3
194.6
7
179.5
n BUENA 202 179.2 178.4
BARATA 209.9 192.8 184.6
X 2
203 .12
41249.61
10312.4
n 4 4
106
Ing. William león Velásquez
Ejemplo 7 LV
107
Ing. William león Velásquez
Ejemplo 7 LV
108
Ing. William león Velásquez
Ejemplo 7 LV
•Conclusión
FDATOS Conclusión
FCRITICO
12.0429 Se rechaza la Ho
FT1= 3.35
1.7359 No se rechaza la Ho
FT2= 3.35
109
Ing. William león Velásquez
FIN
¿Alguna pregunta?
Me puedes encontrar en
@wjleonv & wjleonv@yahoo.com 110