Está en la página 1de 11

Unidad 3 / Escenario 6

Lectura Fundamental

ANOVA

Contenido

1 ANOVA

Referencias

Palabras Claves: muestra, población, hipótesis, significancia.


1. ANOVA

1.1. Introducción

El análisis de varianza ANOVA, por sus siglas en inglés, se puede ver como una generalización de las pruebas de
hipótesis para la media cuando se tienen más de dos tratamientos (uno por cada muestra), para determinar si
existen diferencias siginificativas entre las poblaciones. Por lo tanto, a través de esta herramienta estadı́stica se
determina si las poblaciones tenı́an el mismo valor para la media; por ejemplo cuando se quiere observar si existen
diferencias en los tiempos de mantenimiento en vı́as principales o secundarias a través de muestras que se toman
en puntos crı́ticos de las ciudades donde se construyó con materiales de diferente tipo. A continuacnón se muestran
otras situaciones se aplica el análisis de varianza.

• En la universidad U se quiere medir si existen diferencias entre los diferentes modelos pedagógicos que se
están implementando actualmente en las tres modalidades que tiene la institución.

• Presencial.
• Semipresencial.
• A distancia.

• En una empresa que provee material de construcción para grandes superficies de mercado, existe la necesidad
de cuantificar si hay diferencias entre los tipos de bloques.

• Sencillo.
• Con acabados.
• Supér resistente.

• Una ensambladora de vehiculos quiere determinar si el rendimiento por galón presenta un mejor desempeño
con las nuevas propuestas de motores que se diseñaron.

• 1.000 cc.
• 1.050 cc.
• 1.200 cc.

Cuantificar si los niveles de material particulado en el centro de la ciudad son diferentes de acuerdo a la zona
donde se mide.

• Zona sur.
• Zona norte.
• Zona oriente.
• Zona occidente.

El análisis de varianza nos permite determinar cuál de los factores es la fuente de la variabilidad en un
conjunto de datos, cuando se tiene un esquema como el siguiente.

POLITÉCNICO GRANCOLOMBIANO 1
Tabla 1: Esquema de datos y tratamientos.
Datos del Tratamiento
Tratamiento 1 2 ... k
1 x11 x12 ... x1k
2 x21 x22 ... x2k
3 x31 x32 ... x3k
... ... ... ... ...
... ... ... ... ...
I xi1 xi2 ... xik

Fuente elaboración propia

Dentro de este esquema cabe aclarar que cada uno de los tratamientos es una población y que tenemos los siguientes
supuestos sobre esas poblaciones.

• Los tratamientos provienen de una distribución normal.

• Tienen varianza igual, es decir, para cada uno la varianza es σ 2 .

• A las muestras que se les aplicó un tratamiento fueron seleccionadas independientemente.

En sintesis el análisis de varianza toma la decisión frente a la siguiente hipótesis.

H0 : µ1 = µ2 = µ3 = µ4 = ... = µI
vs
H0 : µ1 6= µ2 6= µ3 6= µ4 6= ... 6= µI

Lo cual implica que el ANOVA determinará si las medias de todas poblaciones son iguales o presentan diferencias
significativas, gráficamente se ve ası́:

Figura 1: Distribución de x̄ bajo H0


Fuente: Elaboración propia

POLITÉCNICO GRANCOLOMBIANO 2
Figura 2: Distribución de x̄ bajo H1
Fuente: Elaboración propia

En la siguiente tabla se muestra un ejemplo donde no existe diferencias ni entre los tratamientos, ni dentro de
cada una de las muestras.

Tabla 2: Autonomia en kilometros por carga.


Tratamiento Motor 1 Motor 2 Motor 3 Motor 4 Media
Motor eléctrico universal 50 50 50 50 50
Motor de corriente continua 50 50 50 50 50
Motor de corriente alterna 50 50 50 50 50
Media de las medias= 50
Fuente elaboración propia

La tabla 3 presenta un ejemplo donde existen diferencias entre los tratamientos, pero no dentro de cada una de
las muestras.

Tabla 3: Autonomia en kilometros por carga.


Tratamiento Motor 1 Motor 2 Motor 3 Motor 4 Media
Motor eléctrico universal 95 95 95 95 95
Motor de corriente continua 60 60 60 60 60
Motor de corriente alterna 70 70 70 70 70
Media de las medias = 75
Fuente elaboración propia

La tabla 4 trae un ejemplo donde no existen diferencias entre los tratamientos, sino dentro de cada una de las
muestras.

Tabla 4: Autonomia en kilometros por carga.


Tratamiento Motor 1 Motor 2 Motor 3 Motor 4 Media
Motor eléctrico universal 95 100 95 120 102,5
Motor de corriente continua 80 80 125 125 102,5
Motor de corriente alterna 120 95 100 95 102,5
Media de las medias= 102,5
Fuente elaboración propia

POLITÉCNICO GRANCOLOMBIANO 3
Por último, se presenta una tabla donde existen diferencias tanto en los tratamientos como en las muestras.

Tabla 5: Autonomia en kilometros por carga.


Tratamiento Motor 1 Motor 2 Motor 3 Motor 4 Media
Motor eléctrico universal 95 85 195 55 107,5
Motor de corriente continua 60 66 160 56 87,8
Motor de corriente alterna 70 77 170 57 93,5
Media de las medias= 96,3
Fuente elaboración propia

1.2. Análisis de varianza

En sı́ntesis, el análisis de varianza se centra en la comparación de dos estimaciones de la variabilidad común σ 2 de


una población.

• La estimación de la variabilidad entre las medias muestrales.


• La estimación de la varibilidad con los datos de cada una de las muestras

Si el resultado obtenido al comparar dichas estimaciones es casi igual, entonces no se tiene evidencia estadı́stica
suficiente para rechazar H0 , sino que las diferencias que existen entre los tratamientos son significativas. A conti-
nuación se presenta una serie de ejemplos para mostrar cómo se calcula la variabilidad y cómo se toma la decisión
de rechazar o no H0 .

1.3. Ejemplos

1.3.1. Planta de concreto

El gerente de una planta de concreto desea comparar la productividad que se presenta en tres regiones con base
en la cantidad de pedidos por región, para ello selecciona aleatoriamente cuatro meses del año obteniendo los
siguientes resultados.

Tabla 6: Pedidos por región.


Costa Centro Oriente
54 86 45
70 65 69
70 67 53
56 76 40
Fuente elaboración propia

Solución
La pregunta a la que se dará respuesta es: ¿Existen diferencias entre el número promedio de pedidos en las tres
regiones?

POLITÉCNICO GRANCOLOMBIANO 4
Se comienza entonces por calcular la varianza entre las medias muestrales ası́:

1. Cabe recordar que la varianza en una muestra se calcula de la siguiente manera:


Pn
(xi − x̄)2
S 2 = i=1
n−1

2. Como se calculará la varianza entre las medias muestrales, se debe reemplazar cada xi por la media co-
¯;
rrespondiente a la ı́-esima muestra x̄i , y la media muestral X̄ por el promedio global de todos los datos X̄
además, n ahora es k que es el número de muestras, por lo tanto, se obtiene:
Pk ¯ )2
(X̄i − X̄
2
Sx̄ = i=1
k−1

σ2
3. Partiendo de la base de que σx̄2 = n , despejando σ 2 se obtiene σ 2 = nσx̄2 , entonces finalmente se tiene que:
Pk ¯ )2
− X̄
2 i=1 (X̄i
σEM M =n
k−1
Pk ¯ )2
n (X̄ − X̄
2 i=1 i i
σEM M =
k−1
Donde:

• ni corresponde al tamaño de la muestra i.


• k es el número de muestras.
¯ es el promedio de todos los datos.
• X̄
• X̄i es la media de la muestra i.
2
• σEM M es la varianza entre las medias muestrales (EMM).

En particular, para el ejemplo de los pedidos por región se tiene:

Tabla 7: Varianza entre las muestras.


Región ni X̄i ¯
X̄ ¯ (X̄ − X̄
X̄i − X̄ ¯ )2 n (X̄ − X̄
¯ )2 P3 n (X̄ − X̄
¯ )2 2
σEM
i i i i=1 i i M
Costa 4 62,5 62,6 -0,1 0,01 0,03 946,17 473,08
Centro 4 73,5 73,5 10,9 119,17 476,69
Oriente 4 51,75 51,8 -10,8 117,36 469,44
Fuente elaboración propia

Se continúa con el cálculo la varianza dentro de las muestras (DM) ası́:

Pk
2 i=1 ni Si2
σDM = P k
i=1 ni

POLITÉCNICO GRANCOLOMBIANO 5
Donde:

• ni es el tamaño de la muestra i.

• k es la cantidad de muestras.
2
• σDM es la estimación de la varianza con base en la varianza dentro de las muestras.

• Si2 es la varianza de la muestra i.

Continuando con el ejemplo se tiene:

Tabla 8: Varianza dentro de las muestras.


Región Si2 ni
Costa 75,7 4
Centro 92,3 4
Oriente 160,9 4

Fuente elaboración propia

2
Por lo tanto, el cálculo de la σDM es el siguiente:

2 4(75, 7) + 4(92, 3) + 4(120, 7)


σDM =
4+4+4

2 1315, 7
σDM = = 109, 64
12

Finalmente, se realiza la prueba de hipótesis ası́:

A través del estadı́stico de prueba F se compara la varianza entre las muestras con la varianza dentro de las
muestras.

473, 08
Fc = = 4, 3149
109, 64

Para determinar si se rechaza o no la hipótesis nula ese valor se compara con el valor de Fα .

Donde:

• Fα tiene k − 1 gn:=grados de libertad en el númerador

• Fα tiene n − k gd:=grados de libertad en el denominador

POLITÉCNICO GRANCOLOMBIANO 6
En este caso a un nivel de significancia del 5 % se tiene un valor crı́tico Fα , gn = 3 − 1 = 2 y gd = 12 − 3 = 9, por
lo tanto, Fα = 4, 2565.

Al comparar Fc con Fα se puede observar que Fc > Fα y por lo tanto se rechaza la hipotésis nula H0 . De don-
de se puede concuir que sı́ existen diferencias significativas entre el número promedio de pedidos en las tres regiones.

1.3.2. Solución del ejemplo de la planta de concreto en Excel

La ruta para hacer el ejercicio en Excel es la siguiente.

• Instalar el complemento de Excel análisis de datos

Figura 3: Pantallazo en excel.


Fuente: Elaboración propia

• En datos, ir a análisis de datos.

Figura 4: Pantallazo en excel.


Fuente: Elaboración propia

• En análisis de datos seleccionar ANOVA de un factor

Figura 5: Pantallazo en excel.


Fuente: Elaboración propia

• Seleccionar los datos.

POLITÉCNICO GRANCOLOMBIANO 7
Figura 6: Ruta en excel. Fuente: Elaboración propia

Se obtienen las siguientes salidas:

Figura 7: Ruta en excel.


Fuente: Elaboración propia

Figura 8: Ruta en excel.


Fuente: Elaboración propia

POLITÉCNICO GRANCOLOMBIANO 8
Referencias

[1] Montgomery, Douglas C and Runger Probabilidad y estadı́stica aplicadas a la ingenierı́a 1996.

[2] Walpole, Ronald E and Myers, Raymond H and Myers, Sharon L Probabilidad y estadı́stica para ingenieros
1999.

[3] Anderson, D.R. and Sweeney, D.J. Estadı́stica Para Administración y Economı́a 2008.

POLITÉCNICO GRANCOLOMBIANO 9
INFORMACIÓN TÉCNICA

Módulo: Estadı́stica II
Unidad 3: Pruebas de hipótesis con dos o más poblaciones
Escenario 6: ANOVA

Autor: Daniel Ernesto Santiago Garnica

Asesor Pedagógico: Diana Marcela Salcedo Dı́az


Diseñador Gráfico: Jully Amanda Guzman
Corrector de estilo: Felipe Garán
Asistente: Ginna Paola Quiroga

Este material pertenece al Politécnico Grancolombiano.


Por ende, es de uso exclusivo de las Instituciones
adscritas a la Red Ilumno. Prohibida su reproducción
total o parcial.

POLITÉCNICO GRANCOLOMBIANO 10