Está en la página 1de 110

ESTADISTICA

INDUSTRIAL
SESION 04

WILLIAM JAIME LEON VELASQUEZ


ANALISIS DE
LAS
VARIANZAS
CONTENIDO

ANOVA de un factor

ANOVA de dos factores

3
1
4
SUPOSICIONES EN EL ANÁLISIS DE LA
VARIANZA (ANOVA) LV

Para emplear ANOVA se supone lo


siguiente:
Las poblaciones siguen la distribución
normal.
Las poblaciones tienen desviaciones
estándar iguales (σ).
Las poblaciones son independientes.
5
Ing. William león Velásquez
ANÁLISIS DE LA VARIANZA LV
(ANOVA)

• ANOVA permite comparar las medias de


tratamientos de forma simultánea y evitar la
acumulación del error tipo I.

• ANOVA se desarrolló para aplicaciones en


agricultura, y aún se emplean muchos de los
términos relacionados con ese contexto.

• El término tratamiento se identifican las


poblaciones diferentes que se examinan.

6
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

El gerente de una empresa financiera, desea comparar la


productividad, medida por el número de clientes atendidos en tres de
sus empleados.
Selecciona cuatro días en forma aleatoria y se registra el número de
clientes atendidos por cada empleado.
Los resultados son:
Walter Willy Kike
55 66 47
54 76 51
59 67 46
56 71 48

¿Habrá alguna diferencia en el número de clientes atendidos?


7
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

En las siguiente gráficas se ilustra cómo pueden aparecer las poblaciones si


hubiera una diferencia en las medias del tratamiento.

Walter
• Las poblaciones en la gráfica de la izquierda siguen la
Kike
distribución normal y la variación en cada población es la
Willy
misma. Sin embargo, las medias no son iguales.
Servicio al cliente
Walter
Suponer que las poblaciones son iguales es
decir que no hay diferencia en las medias Kike

(tratamiento). Esto se muestra en la gráfica de la


Willy
derecha. Las poblaciones siguen la distribución
normal y la variación en cada población es la
misma.
Ing. William león Velásquez Servicio al cliente
8
La prueba ANOVA LV

• Si se desea determinar si varias medias muestrales


provienen de una sola población o de poblaciones con
medias diferentes, lo que se hace en realidad, es que estas
medias muestrales se comparan mediante sus varianzas.

• Una de las suposiciones para aplicar la prueba ANOVA es


que la desviación estándar de las diversas poblaciones
normales tienen que ser las mismas. Se aprovecha este
requisito en la prueba ANOVA.

9
Ing. William león Velásquez
La prueba ANOVA LV

• La estrategia es estimar la varianza de la población de dos formas y


después determinar la razón de dichos estimados.
• Si esta razón es aproximadamente 1, entonces por lógica los dos
estimados son iguales, y se concluye que las medias poblaciones son
iguales.

• La distribución F sirve como un árbitro al


indicar en que instancia la razón de las
varianzas muestrales es mucho mayor
que 1 para haber ocurrido por
casualidad.
10
Ing. William león Velásquez
La prueba ANOVA LV

• Se definirá algunos conceptos que nos ayudaran a entender mejor en


problemas posteriores, a través del ejemplo planteado.

VARIACIÓN TOTAL (SS) Suma de las diferencias


elevadas al cuadrado entre cada observación y la
media global

11
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

La variación total del ejemplo:

• Se calcula la media global de las 12 observaciones:


𝑋ത𝐺 =(55+54+59+56+66+76+67+71+47+51+46+48)/12 = 58

X G  58
12
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

• Después, para cada una de las 12 observaciones se encuentra


la diferencia entre el valor particular y la media global. Cada una
de estas diferencias se eleva al cuadrado y estos cuadrados se
suman, este resultado es la variación total,

SS= (55-58)2+(54-58)2+(59-58)2+(56-58)2+
(66-58)2+(76-58)2+(67-58)2+(71-58)2+
(47-58)2+(51-58)2+(46-58)2+(48-58)2=

SS= 1082.
13
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

Luego se divide esta variación total en dos componentes:


• la que se debe a los tratamientos y
• la que es aleatoria.

SS: Suma de cuadrados


SS = SST + SSE SST: Suma de cuadrados de los tratamientos
SSE: Suma de cuadrados del error

 Para encontrar estas dos componentes, se determina la media de


cada tratamiento.
 La primera fuente de variación se debe a los tratamientos.

14
Ing. William león Velásquez
La prueba ANOVA LV

• La primera fuente de variación:

VARIACIÓN DEL TRATAMIENTO (SST) Suma de las


diferencias elevadas al cuadrado entre la media de cada
tratamiento y la media global

15
Ing. William león Velásquez
La prueba ANOVA LV

En el ejemplo:
• La variación debida a los tratamientos es la suma de las diferencias al
cuadrado entre la media de cada empleado y la media global.
• Para calcularlo, primero se encuentra la media de cada uno de los
tres tratamientos.

La media de Walter es 56, determinada por: (55 + 54 + 59 + 56)/4.


La media de Willy es son 70 determinada por:(66 + 76 + 67 + 71)/4.
La media de Kike es 48 determinada por: (47 + 51 + 46 + 48)/4.
EJEMPLO DIDACTICO
Ing. William león Velásquez 16
EJEMPLO DIDACTICO
LV

La suma de los cuadrados debida a los tratamientos es:

SST=(56 – 58)2 +(56 – 58)2 + … ..+ (48 – 58)2 + (48 – 58)2 =


=4(56 – 58)2 + 4(70 – 58)2 + 4(48 – 58)2 = 992
SST = 992

 Si existe una variación considerable entre las medias de los


tratamientos, es lógico que este término sea grande.
 El valor más bajo posible es cero. Esto ocurrirá cuando todas las
medias de los tratamientos sean iguales. 17
Ing. William león Velásquez
La prueba ANOVA LV

• La otra fuente de variación se le conoce como componente


aleatorio o componente de error.

VARIACIÓN ALEATORIA (SSE) Suma de las diferencias


elevadas al cuadrado entre cada observación y su media
de tratamiento.

18
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

Las medias de cada empleado:

Walter es 56
Willy es 70
Kike es 48
En el ejemplo:
• Este término es la suma de las diferencias al cuadrado entre cada valor y la media
para ese empleado en particular.
SSE=(55 – 56)2 +(54 – 56)2 + ……… + (46 – 48)2+ (48 – 48)2 = 90
• La variación de error es de 90.

SSE = 90

19
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

En resumen:
 La suma de la diferencia entre el valor particular y la media global
elevado al cuadrado es la variación total, y es igual 1082.
 La suma de los cuadrados debida a los tratamientos es 992
 La variación de error es de 90.
Por lo tanto:
SS = SST + SSE
1082 = 992 + 90

+
=
20
Ing. William león Velásquez
La prueba ANOVA LV

El estadístico de prueba, es la razón de los dos estimados de la varianza


poblacional, se determina a partir de la siguiente ecuación:

Estimado de la varianza poblacional basado en


F = las diferencias entre las medias muestrales
Estimado de la varianza poblacional basado en
la variación dentro de la muestra

𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟
21
Ing. William león Velásquez
La prueba ANOVA LV

𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟

𝑆𝐶𝑇 Diferencia entre grupos

𝐹= 𝑚 − 1 m-1
𝑆𝐶𝐸 Diferencias dentro de
𝑛−𝑚 cada grupos
n -m
22
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

El primer estimado de la varianza poblacional entre los


tratamientos, es decir, de la diferencia entre las medias.
Éste es 992/2.
¿Por qué se divide entre 2?
Recuerde que para encontrar una varianza muestral , se
divide entre el número de observaciones menos uno (n-1).
En este caso hay 3 tratamientos por lo que se divide entre 2.
El primer estimado poblacional es 992/2.
Entre grupos

23
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

El estimado de la varianza dentro de los


tratamientos es la variación aleatoria
dividida entre el número total de
observaciones menos el número de
tratamientos.
Es decir 90 / (12-3).
De aquí, el segundo estimado de la
varianza poblacional es 90/9.
Dentro de cada
grupos
24
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

Por tanto
𝑆𝐶𝑇
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹= 𝑚 − 1 Entre grupos
𝐹= 𝑆𝐶𝐸
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟 Dentro de cada
𝑛−𝑚 grupos

25
Ing. William león Velásquez
EJEMPLO DIDACTICO
LV

Como esta razón es muy distinta a 1, se concluye que las medias de


los tratamientos no son iguales.

Por lo tanto hay una diferencia en el número medio de clientes


atendidos por los tres empleados.

Al igual que en la prueba de hipótesis de dos muestras y una


muestra se sigue la regla de los cinco pasos.

26
Ing. William león Velásquez
Comparación de varias medias LV
Análisis de Varianza (ANOVA)

Es la relación entre una variable


cualitativa (con más de 2 categorías) y
una variable cuantitativa

27
Ing. William león Velásquez
LV
El problema
• Se tiene varias medias muestrales y se desea saber si
realmente son evidencia de una diferencia entre los
diferentes grupos.
• Existe una variable cuanlitativa X que podría explicar
los cambios en una variable cuantitativa Y

28
Ing. William león Velásquez
LV
Esquema ANOVA
Variable Variable dependiente
Independiente o
Explicativa o Respuesta
CUALITATIVA CUANTITATIVA

X  Y

FACTOR que incluye Medición que puede


varios posibles RESPONDER a los
tratamientos que varios posibles
pueden influir en la tratamientos del
respuesta factor estudiado 29
Ing. William león Velásquez
LV
La Hipótesis
Ho: μ1 = μ2 = μ3
Ho: Las medias de Y en los diferentes grupos
son iguales
Ho: No hay relación entre X e Y

Ha: No todas las medias poblacionales son


iguales
Ha: Por lo menos una media de Y es diferente
en los grupos definidos por la variable X
Ha: Si hay relación entre X e Y

30
Ing. William león Velásquez
LV
Ilustración mediante un ejemplo

Se ha calculado la producción promedio de tres líneas de producción


de una empresa de productos electrónicos
Línea 1 Línea 2 Línea 3
Producción 11.1 15.9 22.7
promedio
(unidades)
Desviación 5.6 6.2 5.9
estándar
(unidades)
Base n 244 206 139
La muestra seleccionada permite ver que hay diferencias,
pero esta diferencia representa sólo en la muestra 31
Ing. William león Velásquez
Si se asume que Ho es cierta LV
(No hay relación)

Línea 1 Línea 2 Línea 3 Media


general
Producción 15.5 15.5 15.5 15.5
promedio

Base (n) 244 206 139 589

En la población las medias deberían ser iguales (Este es


el supuesto de Ho)

32
Ing. William león Velásquez
LV
Modelo de ANOVA de un factor

Media general

Y= Efecto del tratamiento en el


factor analizado

Error aleatorio

33
Ing. William león Velásquez
En el ejemplo LV
 El efecto sobre la cantidad producida de cada tratamiento
(línea de producción) en la muestra no tiene que ser el
mismo.
X: Es el factor analizado
Variable cualitativa
Línea 1 Línea 2 `Línea 3
Variable Y: Producción
cuantitativa promedio 11.1 15.9 22.7

 La hipótesis nula dice que no hay diferencia en la


producción en los tratamientos.
 La hipótesis alternativa dice que por lo menos uno de
los tratamientos (línea de producción) tiene efecto
sobre la cantidad comprada
34
Ing. William león Velásquez
LV
Resultados de ANOVA
Efecto del factor Línea de Producción

Efecto del Error aleatorio


Como el valor de p es casi 0 se rechaza la Ho
Con lo cual se rechaza la hipótesis de igualdad de medias
Por lo tanto al menos una línea tiene una producción diferente
En otras palabras hay una relación en el factor línea y la producción. 35
Ing. William león Velásquez
LV
SUPUESTOS DE ANOVA
• La dispersión debe ser la misma en cada grupo o categoría
(igualdad de varianza)
• La distribución de las observaciones en cada grupo debe
ser normal

ANOVA es más sensible al primer supuesto que la segundo

En casos extremos hay que considerar alternativas no


paramétricas

36
Ing. William león Velásquez
Ejemplo 1 LV
• Una gran ciudad está dividida en cuatro distritos. El jefe de policía quiere
determinar si hay alguna diferencia en el número promedio de infracciones
cometidos en cada distrito.
• Se registró el número de infracciones reportados en cada distrito en una
muestra de seis días.
• Al nivel de significancia 0,05; puede el funcionario concluir que hay diferencia en
el número promedio de infracciones?
Distrito 1 Distrito 2 Distrito 3 Distrito 4
13 21 12 16
15 13 14 17
14 18 15 18
15 19 13 15
14 18 12 20
37
Ing. William león Velásquez 15 19 15 18
LV
Ejemplo 1
a) Formulación de las hipótesis
Ho: μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en unos de los distritos la cantidad promedio
de infracciones cometidos es diferente

b) Obtención del valor crítico:


Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 24-4 =20
Fcrítico= 3.098
Regla de decisión:
Se rechazará la Ho si F> 3.10
38
Ing. William león Velásquez
Ejemplo 1 LV
c) Cálculo del valor del estadístico de la prueba:

Distrito Distrito Distrito Distrito


01
x2
02
x2
03
x2
04
x2 total
13 169 21 441 12 144 16 256
15 225 13 169 14 196 17 289
14 196 18 324 15 225 18 324
15 225 19 361 13 169 15 225
14 196 18 324 12 144 20 400
15 225 19 361 15 225 18 324 ∑∑x

∑x (T) 86 108 81 104 379


n 6 6 6 6 ∑∑x2
∑ x2 1236 1980 1103 1818 6137
39
Ing. William león Velásquez
Ejemplo 1 LV

σσ𝑋 2 σ 𝑋𝑖 2 σσ𝑋 2
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋2 - 𝑆𝐶𝑇 = σ - σ𝑛
σ𝑛 𝑛𝑖

2 (86)2 (108)2 (81)2 (104)2 (379)2


𝟑𝟕𝟗
𝑆𝐶𝑇𝑜𝑡 = 6137 - = 151.958 SCT=------ + ------ + ------ + -------- - --------
24 6 6 6 6 24

SCT= 1232.67 + 1944.00 + 1093.50 + 1802.67 - 5985.04 = 87.79

SCTotal= SST+ SSE

SSE=SCTotal – SST SSE=151.958 – 87.79 =64.188 40


Ing. William león Velásquez
Ejemplo 1 LV
Suma de Media
F. Variación G.L. F
Cuadrados Cuadrado
Tratamientos 87.770 3 29.256 9.118
Error 64.188 20 3.2094
Total 151.958 23

d) Criterio de decisión
Se rechaza la Ho debido a que el valor del Fcalculado es 9.118 y es mayor al valor
del Fcrítico de 3.10.
e) Conclusión:
Se puede afirmar con un nivel de significancia del 5%
Que al menos en unos de los distritos la cantidad promedio de infracciones
cometidos es diferente
Por lo tanto existe diferencia en el número promedio de infracciones cometidos 41
Ing. William león Velásquez
en cada distrito
Ejemplo 2 LV
• Una egresada de ingeniería industrial tiene ofertas de trabajo de cuatro
empresas. Para examinar un poco más las propuestas, solicitó a un grupo de
personas recién ingresadas a dichas empresas, que le indiquen cuántos meses
trabajaron cada una para su compañía, antes de recibir un aumento de sueldo.
• La información muestral fueron lo siguiente:

Empresa1 Empresa2 Empresa3 Empresa4


12 14 18 12
10 12 12 14
14 10 16 16
12 10
• Al nivel de significancia de 0,05; existe alguna diferencia entre las cuatro empresas,
en el promedio de meses antes de recibir un aumento de sueldo? 42
Ing. William león Velásquez
Ejemplo 2 LV

a) Formulación de las hipótesis


Ho:μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en una de las empresas el promedio de meses
antes de recibir un aumento de sueldo es diferente
b) Obtención del valor crítico:
Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 14-4 =10
Fcritico= 3.708
Regla de decisión:
43
Se
Ing. William leónrechazará
Velásquez la Ho si F> 3.71
Ejemplo 2 LV

C) Obtención del F de los datos de la muestra

Empresa 01 X2 Empresa 02 X2 Empresa 03 X2 Empresa 04 X2 Total

44
Ing. William león Velásquez
Ejemplo 2 LV

2 σσ𝑋 2
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋 - σ𝑛

σ 𝑋𝑖 2 σσ𝑋 2
𝑆𝐶𝑇 = σ - σ𝑛
𝑛𝑖

45
Ing. William león Velásquez
Ejemplo 2 LV
ANOVA
Factor de SC GL CM F
Variación
Tratamiento 32.33 3 10.777 2.360
Error 45.67 10 4.567
Total 78.00 13
Conclusión
• Como el valor Fcalculado (2.360) es menor al valor Fcrítico (3.71) no se rechaza la Ho,
• No se puede afirmar con un nivel de significancia del 5%, que al menos en una de las
empresas el promedio de meses antes de recibir un aumento de sueldo es diferente
• Es decir no existe diferencia entre las cuatro empresas, en el promedio de meses
antes de recibir un aumento de sueldo
• Por lo tanto debe elegir otro criterio para seleccionar a una de las empresas
46
Ing. William león Velásquez
Ejemplo 3 LV

 Los miembros de un equipo ciclista se dividen al azar


en tres grupos que entrenan con métodos diferentes.

 El primer grupo realiza largos recorridos a ritmo


pausado, el segundo grupo realiza series cortas de alta
intensidad y el tercero trabaja en el gimnasio con
pesas y se ejercita en el pedaleo de alta frecuencia.

 Después de un mes de entrenamiento se realiza un test


de rendimiento consistente en un recorrido
cronometrado de 9 Km.

47
Ing. William león Velásquez
Ejemplo 3 LV

Los tiempos empleados fueron los siguientes

Método I Método II Método III

15 14 13
16 13 12
14 15 11
15 16 14
17 14 11

A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos
producen resultados equivalentes? O por el contrario ¿Hay algún método superior
a los demás?
48
Ing. William león Velásquez
Ejemplo 3 LV

a) Formulación de las hipótesis


Ho:μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos uno de los tres métodos producen en el test de
rendimientos resultados diferentes
b) Obtención del valor crítico:
Nivel de significancia=0.05
GL numerador: k-1 = 3-1=2
GL del denominador: n-k = 15-3 =12
Fcritico= 3.89
Regla de decisión:
Se rechazará la Ho si F> 3.89

Ing. William león Velásquez 49


Ejemplo 3 LV

c.- Se encuentra el Fcalculado


Primero se calcula los totales y los cuadrados de los totales divididos
por el numero de observaciones

50
Ing. William león Velásquez
Ejemplo 3 LV

σ 𝑋𝑖 2
σ σ 𝑋 2 =2984 ෍ = 2940
𝑛𝑖
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:

σ 𝑋𝑖 2 σσ𝑋 2
σσ𝑋 2 𝑆𝐶𝑇 = σ -
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋2 - 𝑛𝑖 σ𝑛
σ𝑛
SC(entre) = 2966,8 – 2940 = 26,8
SC(total) = 2984 - 2940 = 44
SS = SST + SSE
SST = SS - SSE
SC(intra) = 2984 – 2966,8 = 17,2 51
Ing. William león Velásquez
Ejemplo 3 LV

Las varianzas serán:


𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑇
𝐹= VT= Varianza(entre) = 26,8/2 = 13,4
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝐸𝑟𝑟𝑜𝑟 Verror= Varianza(intra) = 17,2/12 = 1,43

Por consiguiente el estadístico de contraste es:


𝑆𝐶𝑇
𝐹= 𝑚 − 1
F = 13,4/ 1,43 = 9,37
𝑆𝐶𝐸
𝑛−𝑚
Ing. William león Velásquez
52
Ejemplo 3 LV

d.- Conclusión:
• Como el Fcalculado (9.37) es mayor que es valor de la Fteórica (3,89)
se rechaza la Ho.
• Se puede afirmar con un nivel de significancia del 5% que al menos
uno de los tres métodos producen en el test de rendimientos resultados
diferentes
• Se concluye que los tres métodos de entrenamiento producen
diferencias significativas.

53
Ing. William león Velásquez
Ejemplo 4 LV
Un estudio muestra en la pantalla de cuatro
computadores una lista de palabras sin sentido con
procedimientos diferentes, asignados aleatoriamente a
un grupo de personas. Luego se les realiza una prueba
de memoria de dichas palabras, obteniéndose los
siguientes resultados:

COMP 1 COMP 2 COMP 3 COMP 4


¿Qué conclusiones pueden obtenerse acerca de las
5 9 8 1
cuatro formas de presentación de las palabras, con un
7 11 6 3
nivel de significación del 5%?
6 8 9 4
3 7 5 5
9 7 7 1
7 4 4
4 4
54
Ing. William león Velásquez 2
Ejemplo 4 LV
a) Formulación de las hipótesis
Ho:μ1 = μ2 = μ3 = μ4
H1: Al menos una de las μi es diferente
Al menos en una de las cuatros formas de presentar las
palabras se obtiene resultados diferentes
b) Obtención del valor crítico:
Nivel de significancia=0.05
GL numerador: k-1 = 4-1=3
GL del denominador: n-k = 26-4 =22
Fcritico= 3.05
Regla de decisión:
Se rechazará la Ho si F> 3.05
Ing. William león Velásquez 55
Ejemplo 4 LV

c) Encontrar el Fcalculado
Calcular los totales y los cuadrados de los totales divididos por el número
de observaciones:

56
Ing. William león Velásquez
Ejemplo 4 LV

Luego calcular los cuadrados de las observaciones y su total

57
Ing. William león Velásquez
Ejemplo 4 LV

A partir de estas cantidades básicas calcular las Sumas


de Cuadrados:

2 σ𝑋 2
𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋 - SC(total) = 988 – 820 = 168
𝑛

σ 𝑋𝑖 2 σ𝑋 2 SC(entre) = 902 – 820 = 82


𝑆𝐶𝑇 = σ -
𝑛𝑖 𝑛

Las varianzas serán: SC(intra) = 168 – 82 = 86

Varianza(entre) = 82/3 = 27,3


Varianza(intra) = 86/22 = 3,9 58
Ing. William león Velásquez
Ejemplo 4 LV

Por lo tanto el estadístico de prueba será:


27.3
𝐹= =7.0
3.9

d.- Conclusión
Como el Fcalculado (7.0) es mayor que el Fcritico (3.05) se rechaza la hipótesis
nula
Se puede afirmar con un nivel de significancia del 5%
Que al menos en una de las cuatros formas de presentar las palabras se
obtiene resultados diferentes
Y se concluye que los cuatro procedimientos de presentación producen
diferencias significativas.

59
Ing. William león Velásquez
2
60
LV
ANOVA de dos factores

◦ Se consideran los efectos de dos factores


simultáneamente

• Diseño de bloques aleatorios


◦ Cuando una característica puede afectar la
medición de la variable dependiente, se trata de
controlar o bloquear esta variable, de tal manera
que se pueda comparar mejor la influencia de un
determinado tratamiento
61
Ing. William león Velásquez
ANOVA – P.H. para probar la igualdad de LV
medias de varias poblaciones con dos
factores

Se trata de probar si el efecto de un factor o Tratamiento


en la respuesta de un proceso o sistema es significativo,
al realizar experimentos variando los niveles de ese
factor (Temp.1, Temp.2, etc.) por FILAS
Y Considerando los niveles de otro factor que se piensa
que tiene influencia en la prueba – FACTOR DE
BLOQUEO por COLUMNA

62
Ing. William león Velásquez
LV
ANOVA – Dos factores o direcciones

• La SCTot y SCTr (filas) se determina de la


misma forma que para la ANOVA de una
dirección o factor
• En forma adicional se determina la suma
de cuadrados del factor de bloqueo
(columnas) de forma similar a la de las filas
• La SCE = SCT – SCTr - SCBl

63
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV

Formulación de las Hipótesis

Para el tratamiento 1– en filas

Ho: µ1=µ2=µ3=………….µi
Ha: Al menos unas de las µs es diferente
No todas las medias de tratamientos son iguales

Para el tratamiento 2 – en columnas


Ho: µ’1=µ’2=µ’3=………….µ’i
Ha: Al menos unas de las µs es diferente
64
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV

Paso2: Valor critico


Gl T 1= a-1
Gl T2 = b-1
GL Tot = n-1
GLE = GLTot –GL T1-GLT2

𝐹𝑐𝑟𝑖𝑡 𝑇1 =Alfa, GL , GL
T1 E

𝐹𝑐𝑟𝑖𝑡 𝑇2 =Alfa, GL , GL
T2 E
65
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV

Paso 3 Calculo del estadístico


σσ𝑋 2
𝐹𝐶 =
σ𝑛

𝑆𝐶𝑇𝑜𝑡 = σ σ 𝑋 2 - FC
σ 𝑋𝑖 2 σ 𝑋𝑖 2
𝑆𝐶𝑇1 = σ - FC 𝑆𝐶𝑇2 = σ - FC
𝑛𝑖 𝑛𝑖

𝑆𝐶𝐸 = 𝑆𝐶𝑇𝑜𝑡 − 𝑆𝐶𝑇1 − 𝑆𝐶𝑇2

66
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV
Paso 3 Calculo del estadístico Tabla ANOVA

FUENTE DE VARIACIÓN SUMA DE GRADOS DE


CUADRADOS LIBERTAD VARIANZA VALOR F

Entre muestras (tratamiento)


SCTR1 a-1 Varianza T1 Vt1/VEr

Entre Bloques (Factor Bloque)


SCTR2 b-1 Varianza T2 Vt2L/VEr

Dentro de muestras (error)


SCE (a-1)(b-1) Varianza Err

Variación total
SCT n-1 Varianza Tot

Regla: No rechazar si la F de la muestra es menor que la F de tabla para una cierta alfa
67
Ing. William león Velásquez
LV
ANOVA de 2 factores –Pasos
Paso 4 Conclusión y decisión
Distribución F

Ftabla

Alfa
Zona de no
rechazo

Zona de no rechazo de Ho Zona de rechazo de Ho


O de no aceptar Ha o aceptar Ha
Fc: Tr o Bl 68
Ing. William león Velásquez
ANOVA de 2 factores –Pasos LV

Paso 4 Conclusión y decisión

Si Fc (Tr1 o Tr2) es mayor que Ftabla se rechaza Ho.


Aceptando Ha donde las medias son diferentes

O
Si el valor de p correspondiente a Fc (Tr1 o Tr2) es menor
de Alfa se rechaza Ho

69
Ing. William león Velásquez
Ejemplo 5 LV

• Una empresa realiza una investigación para determinar


el rendimiento en km por galón, característico de tres
marcas de gasolina: Como cada gasolina da
rendimientos distintos en automóviles de marcas
diferentes,

• Se eligen cinco marcas de automóviles que


se tratan como bloques en el experimento,
es decir el automóviles de cada marca se
prueba con los tres tipos de gasolina.
70
Ing. William león Velásquez
Ejemplo 5 LV

• Los resultados del experimento (en Km. por galón) se presenta


a continuación:
MARCA DE GASOLINA
I II III
A 18 21 20
AUTOMOVILES B 24 26 27
C 30 29 34
D 22 25 24
E 20 23 24
Con un α= 0.05 ¿Existirá alguna diferencia entre los rendimientos medios en
miles por galón de los tres tipos de gasolina?
71
Ing. William león Velásquez
Ejemplo 5 LV

1.- Establecer las hipótesis

• Ho: Los consumos de gasolina según la marca de gasolina no son diferentes


• Ha: Los consumos de gasolina según la marca de gasolina son diferentes

• Ho: Los consumos de gasolina según la marca de automóvil no son diferentes


• Ha: Los consumos de gasolina según la marca de automóvil son diferentes

• Como la relación entre la marca de gasolina y la marca de automóvil es de uno a


uno no existirá prueba de interacción entre las dos variables.

72
Ing. William león Velásquez
Ejemplo 5 LV
2.- Establecer el Criterio de Contraste

nivel de significancia de .05


a b n
Gl T1 =2
3 5 15 Gl SCE= 8
F=4.459

gl T1 a-1 2 Gl T2 =4
gl T2 b-1 4 Gl SCE= 8
F= 3.838
T1 T2
gl Tot n-1 14
gl
SCE glTot-gl T1 -gl T2 8

Ing. William león Velásquez 73


4.459
3.838
Ejemplo 5 LV
3. Elaborar la tabla ANOVA
3.1- Cálculo de la Suma de cuadrados

I II III ∑X ∑X2 n
A 18 21 20 59 1165 3
B 24 26 27 77 1981 3
C 30 29 34 93 2897 3
D 22 25 24 71 1685 3
E 20 23 24 67 1505 3
∑X 114 124 129 367 ∑∑X
∑X2 2684 3112 3437 9,233 ∑∑X2
n 5 5 5 15 ∑∑n
74
Ing. William león Velásquez
Ejemplo 5 LV

3.2- Cálculo del Factor de corrección

Factor de corrección
σσ𝑋 2
(367)2
𝐹𝐶 = FC = ----------- = 8979.267
σ𝑛 15
3.3- Cálculo de la Suma cuadrado de totales

SCTotales   X  FC 2

Suma total de
cuadrados

SSTot = 9,233 - 8,979.267= 253.733


75
Ing. William león Velásquez
Ejemplo 5 LV
3.4- Cálculos de los tratamientos

( X ) 2
SCTi    FC
n

Suma de cuadrados del


tratamiento 1
SST1 = (114)2 (124)2 (129)2
-------- + --------- + --------- - 8979.2667 = 23.3333
5 5 5

Suma de cuadrados del


tratamiento 2
SST2 = (59)2 (77)2 (93)2 (71)2 (67)2
-------- + ------- + --------- + --------- + --------- - 8979.2667
-
= 217.067
3 3 3 3 3
Suma de cuadrados del error
SSE =
Ing. William león Velásquez
253.7333 - 23.3333 - 217.067 = 13.3333333
Ejemplo 5 LV
3. Construir la Tabla ANOVA

FUENTE SS GL SM F
T1 23.33333 2 11.66667 7
T2 217.0667 4 54.26667 32.56
ERROR 13.33333 8 1.666667
TOTAL 253.7333 14
4. Conclusión

FCRITICO FDATOS Conclusión


FT1= 4.459 7 Se rechaza la Ho

FT2= 3.838 32.56 Se rechaza la Ho


FCrítico
77
Ing. William león Velásquez
ANOVA de dos factores con LV
interacción

• Cuando se emplea ANOVA de dos vías para


estudiar la interacción, en lugar de emplear los
términos tratamientos y bloques, ahora a las dos
variables se les denominan factores.
• La interacción tiene lugar si la combinación de dos
factores ejerce algún efecto sobre la variable en
estudio, además de hacerlo en cada factor por sí
mismo.
• A la variable en estudio se le llama variable de
respuesta.

78
Ing. William León Velasquez
Jun.-20

ANOVA de dos factores con interacción LV

Un ejemplo cotidiano de interacción:


• Es el efecto de dieta y ejercicio sobre el peso. En general, se
acepta que el peso de una persona (la variable de respuesta)
se controla con dos factores, dieta y ejercicio.

• Las investigaciones demuestran que sólo una dieta afecta al peso


de una persona, y también que el solo ejercicio tiene un efecto
sobre el peso.
• Sin embargo, el método recomendado para controlar el peso se
fundamenta en el efecto combinado o en la interacción entre
dieta y ejercicio. 79
Ing. William León Velasquez
Ejemplo 6 LV

• Se ha diseñado una prueba de vocabulario para detectar la


afinidad hacia la mecánica.
• La prueba consiste en un cierto número de palabras
tomadas de una lista de términos alusivos a la mecánica y
a la maquinaria; y que la calificación que una persona
puede obtener en esa prueba es, simplemente, el número
de palabras que puede definir correctamente.

• Suponer que se quiere probar si hay


diferencias relativas a dos características: sexo
y lugar donde viven, y también si se presentan
diferencias atribuibles a la combinación de
Ing.ambas.
80
William león Velásquez
Ejemplo 6 LV

• Las calificaciones (cantidad de palabras bien definidas) de las personas


clasificadas de acuerdo a las dos variables fueron las siguientes:

Urbano Rural

Hombre Mujer Hombre Mujer


C
a
p
a
4 1 3 4
n
t d a
l
9 4 7 4
d
i e b
r
9 5 7 4
a
d
a
s
10 6 7 8 81
Ing. William león Velásquez
Ejemplo 6 LV

• Es posible, llevar a efecto un análisis de varianza de una sola


clasificación con estos cuatro grupos de sujetos, sin embargo, si se
encuentra una diferencia significativa entre estos cuatro grupos.
• ¿Como saber si esas diferencias deben atribuirse al sexo o al
lugar donde viven o a una combinación de ambos?
• Es por ello que en estos casos se utiliza el método de análisis de
varianza de doble clasificación.

82
Ing. William león Velásquez
Ejemplo 6 LV
Pasos
1.- Establecer Hipótesis
Se tiene que establecer hipótesis para cada uno de
los tratamientos y para la interacción de ambos:
a) Primer tratamiento:
Ho: “Con respecto al sexo no existe diferencia en
las calificaciones obtenidas, que mide la
afinidad hacia la mecánica”
Ha: “Con respecto al sexo existe diferencia en las
calificaciones obtenidas, que mide la afinidad
hacia la mecánica”

83
Ing. William león Velásquez
Ejemplo 6 LV
1.- Establecer Hipótesis
b) Respecto al segundo tratamiento:
Ho: “Con respecto al lugar donde viven no existe diferencia en las
calificaciones obtenidas, que mide la afinidad hacia la mecánica”
Ha: “Con respecto al lugar donde viven existe diferencia en las
calificaciones obtenidas, que mide la afinidad hacia la mecánica”
c) Respecto a la interacción de los dos tratamientos
Ho: ”La combinación de las circunstancias sexo y lugar de residencia
no afecta de manera significativa el tener más afinidad hacia la
mecánica”
Ha: ”La combinación de las circunstancias sexo y lugar de residencia
afecta de manera significativa el tener más afinidad hacia la
mecánica” 84
Ing. William león Velásquez
Ejemplo 6 LV
2.- Establecer el Criterio de Contraste
nivel de significancia
a=2 b=2 n=16 de .05
Gl T1 =1
Gl SCE= 12
gl T1 a-1 1 F= 4 .75
gl T2 b-1 1
gl Iter (a-1)(b-1) 1
gl Tot n-1 15 Gl T2 =1
gl SCE glTot-gl T1 -gl T2 - gl Iter 12 Gl SCE= 12
F= 4 .75

Gl Iter =1
Gl SCE= 12
F= 4 .75

85
Ing. William león Velásquez
Ejemplo 6 LV
3.- Calcular el Estadístico de Prueba
Sumatoria de los totales
Urbano Rural
Hombre x2 Mujer x2 Hombre x2 Mujer x2
4 16 1 1 3 9 4 16
9 81 4 16 7 49 4 16
9 81 5 25 7 49 4 16
10 100 6 36 7 49 8 64 ΣΣ
ΣX = 32 16 24 20 92
ΣX² = 278 78 156 112 624
n 4 4 4 4 16
86
Ing. William león Velásquez
Ejemplo 6 LV
•Cálculo del Factor de corrección:

( X ) 2
FC 
 n

FC 
92
2
 529
Ing. William león Velásquez
16 87
Ejemplo 6 LV

•Cálculo de la Suma Total de Cuadrados

SCTotal = X 2 - FC
= ( 278 + 78 + 156 + 112) - 529 = 95
= 624 - 529 = 95

88
Ing. William león Velásquez
Ejemplo 6 LV

• Calcular la suma de cuadrados por cada tipo de


tratamiento
• SCT1 (por el lugar donde viven)

(  Ti ) 2
SCT1    FC
n

89
Ing. William león Velásquez
Ejemplo 6 LV

• Calcular la suma de cuadrados por cada tipo de


tratamiento
• SCT2 (por sexo)

( Bli ) 2
SCT2    FC
n
Hombre Mujer

Ing. William león Velásquez


90
Ejemplo 6 LV
•Calcular la suma de cuadrados por grupos

( X ) 2
SCG    FC
n

*Este valor nos servirá para calcular el SCI y SCE


91
Ing. William león Velásquez
Ejemplo 6 LV

• Calcular la suma de cuadrados de la interacción de los


dos tratamientos
SCI = SCG – SCT1 – SCT2 =
= 35 – 1 – 25 = 9

• Calcular la suma de cuadrados del error


SCE = SCTOT – SCG =
= 95 – 35 = 60

92
Ing. William león Velásquez
Ejemplo 6 LV

• Construir la Tabla ANOVA

FUENTE SC GL MC F
TRATAMIENTO 1 1.0 1 1 0.2
TRATAMIENTO 2 25.0 1 25 5
POR GRUPOS 35
INTERACCION 9.0 1 9 1.8
ERROR 60 12 5
TOTAL 95 15

93
Ing. William león Velásquez
Ejemplo 6 LV
4.- Tomar Decisión y Conclusión
Decisión FDATOS Conclusión
FCRITICO
0.2 No se rechaza la Ho
FT1= 4 .75
5 Se rechaza la Ho
FT2= 4 .75
FCrítico
1.8 No se rechaza la Ho
FINT= 4 .75
Como los Estadísticos de Prueba, en los casos de las variables de localidad (F*1 = 0.2) y la
combinación de sexo y localidad (F*i =1.8) son mas pequeños que sus respectivos criterios de
contraste (F = 4.75), en estos casos no se rechaza la hipótesis nula,
Mientras que en el caso del sexo el Estadístico de Prueba (F*2 = 5.0) es mas grande que el Criterio de
Contraste (F = 4.75), entonces por lógica inferimos que F* queda dentro de la zona crítica y por lo
tanto se rechaza la hipótesis nula por lo tanto aceptamos la hipótesis alterna
Ing. William león Velásquez 94
Ejemplo 6 LV

y la conclusión :

 “Hay evidencia suficiente, con un nivel de significancia de .05, para


afirmar que con respecto al sexo existe diferencia en las calificaciones
obtenidas que mide la afinidad hacia la mecánica”
 “Hay evidencia suficiente, con un nivel de significancia de .05, para
afirmar que con respecto al lugar de procedencia no existe diferencia en
las calificaciones que mide la afinidad hacia la mecánica”

 ni tampoco podemos afirmar que la combinación de ambas circunstancias


influya en la afinidad hacia la mecánica de las personas”.

95
Ing. William león Velásquez
Ejemplo 7 LV

• El departamento de nutrición de cierta


universidad lleva a cabo un estudio para
determinar si hay diferencia o no en el contenido
de ácido ascórbico entre tres diferentes marcas
de concentrado de jugo de naranja.

• Se hacen cuatro pruebas de los tres tipos de


concentrado de jugo de naranja que fue
congelado durante tres periodos de tiempo
diferentes (en días)

96
Ing. William león Velásquez
Ejemplo 7 LV

• Los resultados, en miligramos de ácido ascórbico por litro, son los siguientes:
TIEMPO ( DÍAS )
MARCA 0 3 7
RICA 52.6 54.2 49.4 49.2 42.7 48.8
49.8 46.5 42.8 53.2 40.4 47.6
BUENA 56.0 48.0 48.8 44.0 49.2 44.0
49.6 48.4 44.0 42.4 42.0 43.2
BARATA 52.5 52.0 48.0 47.0 48.5 43.3
51.8 53.6 48.2 49.6 45.2 47.6
• Utilice un nivel de significancia de .05 para probar la hipótesis que:
• Los contenidos de ácido ascórbico por marca de jugo son diferentes
• Los contenidos de ácido ascórbico por tiempo de congelamiento son diferentes
• Los contenidos de ácido ascórbico son diferentes debido a la interacción de las dos
variables. 97
Ing. William león Velásquez
Ejemplo 7 LV

a) Planteamiento de las hipótesis:


Ho: Los contenidos de ácido ascórbico por marca de jugo son iguales
Ha: Los contenidos de ácido ascórbico por marca de jugo son
diferentes
Ho: Los contenidos de ácido ascórbico por tiempo de congelamiento son iguales
Ha: Los contenidos de ácido ascórbico por tiempo de congelamiento son
diferentes
Ho: Los contenidos de ácido ascórbico son iguales debido a la interacción de las
dos variables.
Ha: Los contenidos de ácido ascórbico son diferentes debido a la interacción de
las dos variables.

98
Ing. William león Velásquez
Ejemplo 7 LV

2.- Establecer el Criterio de Contraste


a b n Gl T1 =2
nivel de
significancia
3 3 36 Gl SCE= 27 de .05
F=3.35

3.35
gl T1 a-1 2
gl T2 b-1 2 Gl T2 =2
Gl SCE= 27
gl Iter (a-1)(b-1) 4 F= 3.35
gl Tot n-1 35
gl glTot-gl T1 -gl T2 - gl 3.35
SCE Iter 27
Gl Iter =4
Gl SCE= 27
F=2.73

99
Ing. William león Velásquez
2.73
Ejemplo 7 LV
• Elaborar la tabla ANOVA

n
0 3 7

52.6 54.2 49.4 49.2 42.7 48.8 ෍12


𝑥 577.2
RICA
49.8 46.5 42.8 53.2 40.4 47.6
56 48 48.8 44 49.2 44 12 559.6
BUENA
49.6 48.4 44 42.4 42 43.2
52.5 52 48 47 48.5 43.3 12 587.3
BARATA
51.8 53.6 48.2 49.6 45.2 47.6

1724.1

Tratamientos 615 566.6 542.5 ෍ ෍𝑥


1724.1
෍𝑥
Ing. William león Velásquez
n 12 12 12 36 100
Ejemplo 7 LV
• 1- Cálculo del Factor de corrección

 X  2
 (1724.1) 2  2972520.81

( X ) 2 2,972,520.81
FC 
 n FC = ----------------
36
= 82,570.0225

Ing. William león Velásquez FC = 82570 101


Ejemplo 7 LV
2- Cálculo de la Suma cuadrado de totales

SCTotales   X  FC 2

SCTotales= 83,102.01 - 82,570 = 531.9875


102
Ing. William león Velásquez
Ejemplo 7 LV
3- Cálculos de los tratamientos

SCT1   
2
X
 FC
n
ΣX²/ n0 ΣX²/ n3 ΣX²/ n7

2 2 2
615 566.6 542.5
SCT1     FC
12 12 12
TIEMPO SCT1 = 31518.75 + 26752.96 + 24525.52 - 82570.02

SCT1 = 82,797.23 - 82,570.02 = 227.212 103


Ejemplo 7 LV

SCT2   
3- Cálculos de los tratamientos X 2

 FC
n

ΣX²/ nRICA ΣX²/ nBUENA ΣX²/ nBARATA - FC


2 2 2
577.2 559.66 587.3
SCT2     FC
12 12 12
MARCA SCT2 = 27763.32 + 26096.01 + 28743.44 - 82570.02

SCT2= 82602.77 - 82570.02 = 32.752


Ing. William león Velásquez
Ejemplo 7 LV
4- Calcular la suma de cuadrados por bloques

X
 X
n=4


2

SGG    FC RICA
0
203.1
3
194.6
7
179.5
n BUENA 202 179.2 178.4
BARATA 209.9 192.8 184.6

  X 2
203 .12
41249.61
   10312.4
n 4 4

SCG = 10312.40 + 9467.29 + 8055.06 +


+ 10201 + 8028.16 + 7956.64 +
+ 11014.50 + 9292.96 + 8519.29 - 82570.02 = 277.29
105
Ing. William león Velásquez
Ejemplo 7 LV

5- Calcular la suma de cuadrados de la interacción de


los dos tratamientos

SCI = SCG – SCT1 – SCT2 =

SCI = 277.29 - 227.212 - 32.752 17.322


=

106
Ing. William león Velásquez
Ejemplo 7 LV

6- Calcular la suma de cuadrados del error

SCE = SCTOT – SCG

SCE = 531.9875 - 277.29 = 254.703

107
Ing. William león Velásquez
Ejemplo 7 LV

•Construir la Tabla ANOVA


FUENTE SC GL MC F
TRATAMIENTO 1 227.21 2 113.606 12.0429

TRATAMIENTO 2 32.75 2 16.376 1.7359


POR GRUPOS 277.29
INTERACCION 17.32 4 4.330 0.4591
ERROR 254.70 27 9.433
TOTAL 531.99 35

108
Ing. William león Velásquez
Ejemplo 7 LV

•Conclusión
FDATOS Conclusión
FCRITICO
12.0429 Se rechaza la Ho
FT1= 3.35
1.7359 No se rechaza la Ho
FT2= 3.35

FCrítico 0.4591 No se rechaza la Ho


FINT= 2.73

109
Ing. William león Velásquez
FIN
¿Alguna pregunta?
Me puedes encontrar en
@wjleonv & wjleonv@yahoo.com 110

También podría gustarte