Está en la página 1de 39

ANÁLISIS DE

VARIANZA
Excel
Ing. Alberto Zúñiga R.
Utilice el ANOVA de un solo factor cuando tenga un factor categórico y una
respuesta continua y desee determinar si las medias de las poblaciones de
dos o más grupos son diferentes.

Por ejemplo, un fabricante de alfombras desea determinar si hay


diferencias en la durabilidad de varios tipos de alfombras.

ANOVA DE 1
FACTOR
1. Los datos deben incluir solo una variable categórica que sea un factor
fijo
2. La variable de respuesta debe ser continua
3. Los datos de la muestra deben proceder de una población normal o
cada muestra debe ser > 15 o 20
Si el tamaño de la muestra es mayor que 15 o 20, la prueba funciona muy
bien con distribuciones asimétricas y no normales. Si el tamaño de la
ANOVA DE 1 muestrea es menor que 15 o 20, los resultados podrían ser engañosos con
distribuciones no normales.
FACTOR El tamaño de la muestra real que usted necesita depende del número de
Consideraciones grupos en los datos, de la siguiente manera:
- Si tiene de 2 a 9 grupos, el tamaño de la muestra para cada grupo debe
ser por lo menos 15.
- Si tiene de 10 a 12 grupos, el tamaño de la muestra para cada grupo
debe ser por lo menos 20.
.
4. Cada observación debe ser independiente de todas las demás observaciones
Si las observaciones son dependientes, los resultados podrían no ser válidos.
Considere los siguientes puntos para determinar si las observaciones son
independientes: Si una observación no proporciona información sobre el valor de
otra observación, las observaciones son independientes.
Si una observación proporciona información sobre el valor de otra observación, las
observaciones son dependientes.
5. Recolecte los datos utilizando las mejores prácticas
ANOVA DE 1 Para asegurar que los resultados sean válidos, considere las siguientes pautas:
FACTOR - Asegúrese de que los datos representen a la población de interés.

Consideraciones - Recolecte suficiente datos para proporcionar la precisión necesaria.


- Mida las variables con tanta exactitud y precisión como sea posible.
- Registre los datos en el orden de recolección
6. El modelo debe proveer un ajuste adecuado a los datos
.
Un ingeniero industrial desea comparar la dureza de cuatro
mezclas de pintura. Se aplicaron seis muestras de cada mezcla de
pintura a una pieza de metal. Se curaron las piezas de metal. A
continuación, se midió la dureza de cada muestra. Para probar la
igualdad de medias y para evaluar las diferencias entre pares de
medias, el analista usa el ANOVA de un solo factor con múltiples
comparaciones..

ANOVA DE 1
FACTOR
Ejemplo 1
ANOVA DE 1
FACTOR
Ejemplo 1
Resultados
ANOVA DE 1
FACTOR
Ejemplo 1
Resultados
ANOVA DE 1
FACTOR
Ejemplo 1
Resultados
Usted es el dueño de soda Tapia y ofrece una salsa picante que
acompaña el gallo pinto. Usted cuenta con clientes regulares que
asisten todos los días. La mayoría de sus clientes son estudiantes,
operadores y empleados de oficina. Algunos de ellos casi siempre
piden la salsa picante, pero usted tiene la impresión de que a los
estudiantes y a los operadores les gusta más esta salsa que a los
empleados. Basándose en 10 días representativos para cada
grupo, indique si existe diferencias entre los grupos. Sustente
ANOVA DE 1 estadísticamente su respuesta e incluya las respectivas hipótesis.
FACTOR Número de veces que los clientes piden la salsa especial
Día
1
Estudiantes Empleados Operadores
25 15 25
Ejemplo 2 2
3
10
14
18
13
29
28
4 14 15 27
5 20 14 25
6 27 9 28
7 19 9 29
8 22 10 27
9 19 11 26
10 14 13 28
RESULTADOS-excel

HIPÓTESIS NULA: Todas las medias son iguales


HIPÓTESIS ALTERNA: No todas las medias son iguales
Nivel significancia: α = 0,05

• Su lugar de vacaciones favorito es ___.


• Si (escriba el nombre de alumno) pudiera viajar a cualquier lugar del
mundo, viajaría a ___ porque ___.
RESULTADOS-excel

Para saber si los resultados son significativos (si la probabilidad "P" es menor a 0.05), el
valor de la "F" necesita ser al menos 3.354 (el valor crítico para F). Entonces, como el
valor de nuestra "F" es de 40.01 (mayor que el valor crítico para F (3.354)), estamos
seguros que los resultados son significativos. Por tanto, sí existe una relación significativa
entre cuanto que cada grupo pide la salsa especial. La probabilidad demuestra a qué
nivel los resultados son estadísticamente significativos.
• Su lugar de vacaciones favorito es ___.
• Si (escriba el nombre de alumno) pudiera viajar a cualquier lugar del
mundo, viajaría a ___ porque ___.
RESULTADOS-Minitab

Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales

Nivel de significancia α = 0,05


Se presupuso igualdad de varianzas para el análisis.

Información del factor


Factor Niveles Valores
Factor 3 Estudiantes; Empleados; Operadores
RESULTADOS-Minitab

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Factor 2 1067,3 533,63 40,01 0,000


Error 27 360,1 13,34
Total 29 1427,4

Resumen del modelo


S R-cuad. R-cuad. (ajustado) R-cuad. (pred)
3,65199 74,77% 72,90% 68,85%
RESULTADOS-Minitab

Medias
Factor N Media Desv.Est. IC de 95%
Estudiantes 10 18,40 5,40 (16,03; 20,77)
Empleados 10 12,700 2,946 (10,330; 15,070)
Operadores 10 27,200 1,476 (24,830; 29,570)
Desv.Est. agrupada = 3,65199

Agrupar información utilizando el método de Tukey y


una confianza de 95%
Factor N Media Agrupación
Operadores 10 27,200 A
Estudiantes 10 18,40 B
Empleados 10 12,700 C
Las medias que no comparten una letra son significativamente diferentes.
RESULTADOS-Minitab

Pruebas simultáneas de Tukey para diferencias de las


medias
Diferencia de niveles Diferencia de las medias EE de diferencia IC de 95% Valor T Valor p ajustado
Empleados - Estudiantes -5,70 1,63 (-9,75; -1,65) -3,49 0,005
Operadores - Estudiantes 8,80 1,63 (4,75; 12,85) 5,39 0,000
Operadores - Empleados 14,50 1,63 (10,45; 18,55) 8,88 0,000
Nivel de confianza individual = 98,04%
RESULTADOS-Minitab
RESULTADOS-Minitab
RESULTADOS-Minitab
La empresa Tosty lanzó una nueva marca de tostadas con nuevo
sabor. Basándose de una encuesta que la compañía condujo
enfocándose en el sabor del producto, han tenido algunas
discusiones que indican que las opiniones del sabor de las tostadas
dependen de las diferentes edades de los clientes. Los resultados
de las encuestas se dividieron entre diferentes rangos de edades.
Los resultados están tabulados a una escala de 100 puntos (el punto
más alto, significa que le gustan más las tostadas). Basándose en
estos resultados, ¿existe alguna diferencia estadística entre las
opiniones de las tostadas y la edad de los clientes?
ANOVA DE 1 Tostadas nuevo sabor
Encuestado <20 21-40 >40
FACTOR 1
2
89
95
85
67
64
66
Ejemplo 3 3
4
94
81
90
73
68
63
5 82 83 59
6 86 73 75
7 87 86 80
8 92 61 60
9 90 89 59
10 93 75 73
RESULTADOS-excel

HIPÓTESIS NULA: Todas las medias son iguales


HIPÓTESIS ALTERNA: No todas las medias son iguales
Nivel significancia: α = 0,05
RESULTADOS-excel

Para ser significativo, el valor de F tiene que ser mayor de 3.35 y el valor
de F observado en este caso llega a ser 21.38. Como resultado, el
ANOVA indica que sí existe una diferencia significativa entre los tres
grupos en cuanto a su opinión sobre las tostadas de nuevo sabor
RESULTADOS-Minitab

Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales

Nivel de significancia α = 0,05


Se presupuso igualdad de varianzas para el análisis.
RESULTADOS-Minitab
RESULTADOS-Minitab
RESULTADOS-Minitab
RESUMEN
RESUMEN
Usted está experimentando con levadura para una receta de panes
dulces. Parece ser que la cantidad de azúcar y la temperatura del agua
afectan el tamaño de los panes. Basándose en los siguientes datos,
usted realiza un análisis de varianza para averiguar lo que es significativo
de estas receta

Levadura: Tamaño de los panes dulces


ANOVA DE 2 Agua fría Agua Tibia Agua Caliente
FACTOR Poco azúcar 75 87 60
Azúcar nornal 74 82 55
Ejemplo 4 Mucho azúcar 70 79 53
RESULTADOS-excel
RESULTADOS-excel

En este caso el valor de la "F" por las filas (cantidad de azúcar) es 23.15, y es
mucho mayor que el valor crítico de la F (6.94), por lo que estamos seguros que los
resultados de nuestras pruebas son significativas. El valor de la "F" para las
columnas (temperatura del agua) es igual a 378.53. Esto es también significativo,
porque el valor de "F" crítico es solamente 6.94. Por tanto, existe una relación
significativa en la cantidad de azúcar, la temperatura del agua y el tamaño de los
panes dulces. La probabilidad muestra a qué nivel los resultados son
estadísticamente significativos
La compañía SIMAN ha analizado el número de clientes que entra a
la tienda principal. Cada hora, ellos han contado el número
promedio de clientes que entra a la tienda. Estos números están
resumidos por hora y por trimestre. ¿Existe alguna relación
significativa en el número de clientes que entra a la tienda por medio
de las variables que son la hora y el trimestre del año?
Promedio de clientes en la tienda

Hora Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


8:00 a. m. 7 4 5 9

ANOVA DE 2 9:00 a. m.
10:00 a. m.
10
25 15
7
17
8 20
35
11:00 a. m. 50 20 25 67
FACTOR 12:00 p. m.
1:00 p. m.
75
79
35
40
40
46
85
103
Ejemplo 5 2:00 p. m.
3:00 p. m.
74
68
43
38
49
38
96
85
4:00 p. m. 52 34 38 80
5:00 p. m. 54 30 35 86
6:00 p. m. 45 25 30 85
7:00 p. m. 69 27 35 75
8:00 p. m. 50 20 33 70
9:00 p. m. 40 17 29 62
RESULTADOS-excel
RESULTADOS-excel

El valor de F significativo para las filas (la hora del día) nos indica que de acuerdo
con la hora del día, hay una diferencia significativa en el número de clientes que
pasa por la tienda. El valor significativo para las columnas (trimestre) nos indica
que de acuerdo con el trimestre del año, hay una diferencia significativa en el
número de clientes que pasa por la tienda.
Usted tiene un restaurante y ha Encuesta: Resultado sobre sabor nueva salsa
Hombres Mujeres
creado una nueva receta de salsa
85 69
para los tacos. Por alguna razón 74 65
parece ser que a sus clientes 96 63
hombres les gusta más la salsa 62 70
anterior que la nueva. Pero también 80 72
Opinión salsa anterior
parece ser que a sus clientes mujeres 78 59
prefieren la nueva salsa que la 90 64
anterior. Usted decide realizar una 79 70
prueba con un grupo de 10 mujeres y 85 68
ANOVA DE 2 10 hombres dándole a probar las dos 80
68
73
85
salsas, basándose en una escala de
FACTOR 100 puntos para el sabor de las dos 64
62
75
97
Ejemplo 6 salsas. ¿Existe alguna relación
significativa desde el punto de vista
69
73
80
88
de los clientes hombres y clientes Opinión Salsa nueva
61 81
mujeres y cómo ven la nueva y la 64 91
anterior salsa para los tacos? 72 83
70 84
21 82
RESULTADOS-excel
RESULTADOS-excel

En este caso el valor de la "F" de la muestra (receta anterior y receta nueva) es


0.896. El valor de la "F" necesita ser al menos 4.11 (el valor crítico de la F). El valor
de "F" es de 0.896 y no es mayor que el valor crítico de la F, no podemos decir que
existe alguna diferencia significativa. Ahora, siempre un efecto de interacción
sobrepasa el efecto principal. En este caso se tiene un gran efecto de interacción
(el valor de la "F"=58.89). En otras palabras, sí existe una diferencia significativa
entre la opinión de los hombres y de las mujeres relacionada a la receta anterior y
la nueva.
La empresa Demasa requiere Número paquetes sobrantes de tortillas
distribuir tortillas recién hechas Pavas Santa Ana Escazú Hatillo
diariamente y que sea importante 20 15 25 26
36 20 37 36
reportar el número mínimo de
45 40 44 45
paquetes sobrantes diariamente. 27 35 25 21
Demasa ha revisado el número de antes
45 30 46 48
paquetes sobrantes en las tiendas 33 21 34 32
21 20 25 24
en cuatro diferentes localidades 22 30 25 26
(Pavas, Santa Ana, Escazú y 15 12 17 18
Hatillo). Basándose en estos 34 10 33 32
ANOVA DE 2 números, Demasa cambió algunos 15
20
14
21
14
21
25
33
de sus procedimientos de
FACTOR distribución. Después se revisaron
20
21
39
30
22
20
44
20

Ejemplo 7 otra vez para ver si hubo menos


paquetes sobrantes. ¿Existe alguna
después
33
20
31
20
34
21
47
34
15 19 14 20
diferencia significativa en el número 14 32 13 24
de paquetes sobrantes en relación 10 15 9 15
con los cambios de distribución? 25 9 26 29
¿Estos cambios se aplican para
todas las localidades??
RESULTADOS-excel
RESULTADOS-excel

El valor de F significativo para las muestras (antes y después) indica que hay una
diferencia significativa en el cambio en el número de paquetes sobrantes. El valor
de F no significativo para las columnas (las cuatro ciudades) indica que los cambios
tienen el mismo efecto en todas las ciudades, por lo que no hay diferencia entre las
ciudades. El valor de F no significativo para la interacción nos indica que no hay un
efecto de interacción entre las variables (eso es bueno, pues una interacción
muchas veces niega la validez de los otros valores de F.)

También podría gustarte