Está en la página 1de 15

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA

EXPERIMENTOS GENERALES DE UN SOLO FACTOR


ANOVA (Análisis de Varianza)
ANOVA está diseñada específicamente para probar si dos o más poblaciones tienen la misma
media esto por medio de un examen de varianzas muestrales; de allí el término análisis de
varianza.

El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar la


variación entre muestras y la variación al interior de estas mediante la determinación de
varianzas.

• Unidades experimentales: son los objetos que reciben el tratamiento.


• Factor: es la variable cuyo impacto en tales unidades experimentales se desea medir.
• Tratamiento: es una combinación específica de niveles de factor.

Ejemplo:

Se esta interesado en medir los efectos relativos en la producción de los empleados de tres
programas de capacitación. Estos tres tipos de formación adicional pueden ser: a)
autodidactas, b) impartido por computador, o c) enseñado por un supervisor. En un estudio
ANOVA, las unidades experimentales son los objetos que reciben el tratamiento. En este
ejemplo sobre capacitación, los empleados constituyen las unidades experimentales. El
Factor es la fuerza o variable cuyo impacto en tales unidades experimentales se desea medir.
En este caso “capacitación” es el factor de interés. Finalmente, los tres tipos de capacitación
constituyen los tratamientos o niveles del factor, del factor “capacitación”.

La forma de seleccionar los tratamientos es a través de un modelo de efectos fijos o uno de


modelo de efectos aleatorios.

Modelo de efectos fijos: en el cual se seleccionan tratamientos específicos o se fijan antes


del estudio.
Modelo de efectos aleatorios: en el cual los niveles (tratamientos) utilizados en el estudio
se seleccionan aleatoriamente de una población de niveles posibles.

Para la aplicación de ANOVA son esenciales tres suposiciones:

1. Todas las poblaciones involucradas son normales.


2. Todas las poblaciones tienen la misma varianza.
3. Las muestras se seleccionan independientemente.
𝐻𝑜: 𝜇1 = 𝜇2 = 𝜇3 … = 𝜇𝑘
𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠.

Análisis de Varianza a una vía: Diseño completamente aleatorizado

El término proviene del hecho que varios sujetos o unidades experimentales se asignan
aleatoriamente a diferentes niveles de un solo factor.
El análisis de varianza se basa en una comparación de la cantidad de variación en cada uno
de los tratamientos. Si de un tratamiento al otro la variación es significativamente alta, puede
concluirse que los tratamientos tienen efectos diferentes en las poblaciones.
Método de suma de cuadrados
Tres tipos o fuentes de variación:
1. Variación total (SST): existe variación entre el número total de las observaciones.

2. Variación entre muestras (SSA): existe variación entre los diferentes tratamientos
(muestras).

3. Variación dentro de la muestra (SSE): existe variación dentro de un tratamiento


dado (muestra).

Efecto del tratamiento: como las muestras diferentes tienen tratamientos distintos, la
variación entre las muestras puede ser producida por los efectos de tratamientos diferentes.
Es decir, un efecto de tratamiento puede detectarse comparando la variación entre las
muestras y la variación dentro de las muestras. Si la variación entre las muestras es
significativamente mayor que la variación dentro de las muestras, un fuerte efecto de
tratamiento está presente. Esta diferencia entre la variación entre muestras y la variación
dentro de las muestras es precisamente lo que mide el análisis de varianza.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA

Ejemplo 1:
El director administrativo de una gran empresa industrial desea determinar si los tres
programas de capacitación distintos tienen efectos diferentes en los niveles de productividad
de los empleados. Estos programas son los tratamientos que puede evaluar el análisis de
varianza. Se seleccionan 15 empleados y se asignan a uno de los tres programas. Al terminar
la capacitación, cada empleado responde un examen para determinar su competencia. Se
colocan 5 en cada uno de los programas.
Tratamientos
Programa 1 Programa 2 Programa 3
85 80 82
72 84 80
83 81 85
80 78 90
78 82 88
Suma 398 405 425
Promedio 79.6 81 85
Variación total (SST): no todos los 15 empleados tuvieron el mismo puntaje en la prueba.
Variación entre muestras (SSA): los empleados del programa 1 no tuvieron el mismo
puntaje que los del programa 2 y 3.
Variación dentro de la muestra (SSE): no todos los empleados de la primera muestra
tuvieron el mismo puntaje. Factores: la habilidad innata de los empleados en dicha muestra,
la motivación personal, los esfuerzos individuales, factor suerte, entre otros.
Tratamientos k = 3
Muestra n = 5
12282
𝑆𝑆𝑇 = 852 + 722 + 832 + ⋯ 882 − = 267.73
5(3)
3982 + 4052 + 4252 12282
𝑆𝑆𝐴 = − = 78.53
5 5(3)
𝑆𝑆𝐸 = 267.73 − 78.53 = 189.2

Fuente de Suma de Grados de Cuadrados medios Calculada


variación cuadrados libertad
Tratamientos 78.53 3-1 = 2 78.53 39.27
𝑆1 = = 39.27 𝐹= = 2.49
2 15.77

Error 189.2 3(5-1) = 12 189.2


𝑆1 = = 15.77
12
Total 267.73 3(5)-1 = 14

1. Análisis de Varianza (una vía)

2. 𝐻𝑜: 𝜇1 = 𝜇2 = 𝜇3 𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠.

3. Nivel de significancia: α = 0.05

4. Valor de prueba:

39.27
𝐹= = 2.49
15.77
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA

5. Valor critico:
𝑣1 = 2
𝑣2 = 12

𝐹(0.05, 2,12) = 3.89

6. Gráfica

Vp = 2.49

7. Conclusión: se acepta Ho. con un nivel de confianza del 95%, se concluye que los
programas de capacitación no muestran diferencias significativas en los niveles de
productividad de los colaboradores. El valor P es de 0.1245 que es mayor que 0.05.
Tabla de resumen en Excel:

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
Programa 1 5 398 79.6 25.3
Programa 2 5 405 81 5
Programa 3 5 425 85 17

ANÁLISIS DE VARIANZA
Valor
Origen de las Suma de Grados de Promedio de los crítico para
variaciones cuadrados libertad cuadrados F Probabilidad F
Entre grupos 78.5333333 2 39.2666667 2.49048626 0.12454094 3.88529383
Dentro de los
grupos 189.2 12 15.7666667

Total 267.733333 14
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA

Ejemplo 2:

Roberto Marroquín es vicepresidente de mercadeo en Banco G&T. Los recientes esfuerzos


promocionales para atraer nuevos depositantes incluyen algunos juegos y premios en cuatro
sucursales del banco. Roberto está convencido de que diferentes tipos de premios atraerían a
diferentes grupos de ingreso. Las personas de un nivel de ingreso prefieren los regalos,
mientras que los de otro grupo de ingreso pueden sentirse más atraídos por viajes gratuitos a
sitios favoritos para pasar vacaciones. El desea determinar si existe una diferencia en el nivel
promedio de depósitos entre las cuatro sucursales. Si halla alguna diferencia, ofrecerá una
diversidad de premios promocionales.
A continuación, aparecen siete depósitos seleccionados aleatoriamente de cada sucursal,
aproximado al $100 más cercano. ¿A qué conclusión llega?

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4

1 5.1 1.9 3.6 1.3


2 4.9 1.9 4.2 1.5
3 5.6 2.1 4.5 0.9
4 4.8 2.4 4.8 1.0
5 3.8 2.1 3.9 1.9
6 5.1 3.1 4.1 1.5
7 4.8 2.5 5.1 2.1

RESUMEN

Grupos Cuenta Suma Promedio Varianza


Sucursal 1 7 34.1 4.87142857 0.29904762
Sucursal 2 7 16 2.28571429 0.18142857
Sucursal 3 7 30.2 4.31428571 0.27142857
Sucursal 4 7 10.2 1.45714286 0.19285714
3.23214286
ANÁLISIS DE VARIANZA
Valor
Origen de las Suma de Grados de Promedio de los crítico para
variaciones cuadrados libertad cuadrados F Probabilidad F
Entre grupos 55.3325 3 18.4441667 78.0902218 1.5974E-12 3.00878657
Dentro de los
grupos 5.66857143 24 0.23619048

Total 61.0010714 27

1. Factor
Promedio de depósitos ($)

2. Tratamiento
Sucursales

3. Número de tratamientos o Niveles de Factor


k=4

4. Variable dependiente
Depósitos realizados en cada sucursal
5. Variable independiente
Sucursales

6. Variabilidad entre las sucursales


𝑆1 2 = 18.44

7. Error estándar dentro de las sucursales (Desviación estándar o desviación típica)


𝑆2 = 0.4860

8. Error de estimación de la sucursal 2.


0.1814
𝜎𝑥 = √ = 0.1610
7

9. Media global
𝑥̿ = $ 3.23

10. Sucursal que parece tener un mejor promedio en depósitos.


Sucursal 1

11. Agencia con mayor estabilidad en el número promedio de depósitos.


Sucursal 2 (Menor variabilidad)
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA
12. El 95% de los clientes de la sucursal 1, ¿Cuál es la cantidad mínima y máxima de
sus depósitos?
0.2990
4.87 ± 2.4469√ = 4.3649 ≤ 𝜇 ≤ 5.3757
7

13. Hipótesis nula


𝐻𝑜: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4

14. Hipótesis alternativa


𝐻1: 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

15. Valor de prueba


𝑉𝑝 = 78.09

16. Tipo de prueba


Análisis de varianza, Fisher
17. Valor critico
𝑉𝑐 = 3.01

18. Error tipo I


𝛼 = 0.05

19. Nivel de confianza


𝑁𝐶 = 95%

20. Tamaño de la muestra


𝑛=7

21. Conclusión
Se rechaza Ho. con un NC 95%. Se concluye que si existe una diferencia en el nivel
promedio de depósitos entre las cuatro sucursales. Debe ofrecer una diversidad de
premios promocionales. Valor p ≤ 0.05
COMPARACIONES PAREADAS

Si rechaza la hipótesis nula y se acepta la alternativa planteada lo que significa que no


todas las medias son iguales entonces se procede a realizar comparaciones entre
conjuntos de niveles o tratamientos de factor para determinar que media (s) difieren
significativamente del resto.

Prueba de Tukey

1. Sirve para probar todas las diferencias entre medias de tratamientos de un


experimento, por medio de intervalos de confianza para todas las diferencias en
parejas.
2. El procedimiento de Tukey implica encontrar una diferencia significativa entre las
medias y verificar si excede el valor del error.
3. La única exigencia es que el número de observaciones sea constante en todos los
tratamientos.

𝑆2
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝑞(𝛼, 𝑘, 𝑣)√
𝑛

Pasos:
1. Ordenar las medias muestrales en forma ascendente.
2. De la tabla de análisis de varianza se toma el cuadrado medio del error y los grados
de libertad.
3. Determinar el error utilizando las tablas de Tukey con un nivel de significancia de
0.05.
4. Comparar todas las diferencias absolutas con el error y si excede eso indica que hay
una diferencia significativa.

1. Medias muestrales de las 4 sucursales


Sucursal 4 Sucursal 2 Sucursal 3 Sucursal 1
1.4571 2.2857 4.3143 4.8714
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA
2. Valor del error
Grados de libertad Varianza
Dentro de los grupos 5.66857143 24 0.23619048

𝑆2
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝑞(𝛼, 𝑘, 𝑣)√
𝑛
Tabla

3. Valor del error

0.2362
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 = 𝑞(0.05,4,24)√
7

0.2362
𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 = 3.90√
7

𝑉𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 = 0.7164


4. Combinaciones 4C2=6
Comparaciones Diferencia Comparación
pareadas
𝜇1 − 𝜇3 0.55714286 ≤ 0.7164 NO hay diferencia significativa
𝜇1 − 𝜇2 2.58571429 > 0.7164
𝜇1 − 𝜇4 3.41428571 > 0.7164
𝜇3 − 𝜇2 2.02857143 > 0.7164
𝜇3 − 𝜇4 2.85714286 > 0.7164
𝜇2 − 𝜇4 0.82857143 > 0.7164

5. Conclusión

Sucursal 4 Sucursal 2 Sucursal 3 Sucursal 1


1.4571 2.2857 4.3143 4.8714

Tratamiento n Media Agrupación


Sucursal 1 7 4.8714 A
Sucursal 3 7 4.3143 A
Sucursal 2 7 2.2857 B
Sucursal 4 7 1.4571 C
Las medias que no comparte una letra son significativamente diferentes.

Utilizando la prueba de Tukey se concluye con un NC 95% que no existe diferencia


significativa entre la sucursal 1 y sucursal 3.
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA

Prueba de Duncan

También conocida como la Prueba del Rango múltiple Duncan, determina la diferencia entre
pares de medias después que se ha rechazado la hipótesis nula en el análisis de varianza.

A diferencia con la prueba Tukey es que la prueba de Duncan ajusta la diferencia crítica
considerando si los dos promedios son adyacentes o si por el contrario existe uno o más
medias entre las medias que se están comparando.

𝑟𝑝 = 𝑟𝑎𝑛𝑔𝑜 𝑒𝑠𝑡𝑢𝑑𝑒𝑛𝑡𝑖𝑧𝑎𝑑𝑜

𝑅𝑝 = 𝑅𝑎𝑛𝑔𝑜

𝑆2
𝑅𝑝 = 𝑟𝑝 √
𝑛
Ejemplo

1. Medias muestrales de las 4 sucursales


Sucursal 4 Sucursal 2 Sucursal 3 Sucursal 1
1.4571 2.2857 4.3143 4.8714

Grados de libertad Varianza


Dentro de los grupos 5.66857143 24 0.23619048

p 2 3 4
rp 2.919 3.066 3.160
Rp 0.5362 0.5632 0.5805
UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
FACULTAD DE INGENIERÍA
ESTADÍSTICA 2
INGA. LADY MARIEBELIA ELÍAS ESTRADA

Comparaciones pareadas Diferencia Comparación


𝜇1 − 𝜇3 0.55714286 > 0.5362
𝜇1 − 𝜇2 2.58571429 > 0.5632
𝜇1 − 𝜇4 3.41428571 > 0.5805
𝜇3 − 𝜇 2 2.02857143 > 0.5362
𝜇3 − 𝜇 4 2.85714286 > 0.5632
𝜇2 − 𝜇 4 0.82857143 > 0.5362

Conclusión: utilizando la prueba de Duncan con un NC 95% se puede concluir que


existe diferencia entre todas las sucursales.

También podría gustarte