Está en la página 1de 5

Anlisis de varianza

Antes, en este captulo, utilizamos la prueba ji-cuadrada para examinar las diferencias entre
ms de dos proporciones muestrales y para hacer inferencias acerca de si las muestras se
tomaron de poblaciones que contenan la misma proporcin. En esta seccin, aprenderemos
una tcnica conocida como anlisis de varianza (a menudo abreviada ANOVA: analysis
of variance), que permite probar la significancia de las diferencias entre ms de dos
medias muestrales. Usando el anlisis de varianza, podremos hacer inferencias acerca de
si nuestras muestras se tomaron de poblaciones que tienen la misma media.
El anlisis de varianza ser til en situaciones tales como la comparacin del kilometraje
logrado por cinco clases diferentes de gasolina; la prueba de cul de cuatro mtodos de
capacitacin produce el aprendizaje ms rpido; o en la comparacin de los ingresos del
primer ao de los graduados de una media docena de escuelas de administracin. En cada
caso, se pueden comparar las medias de ms de dos muestras.
Planteamiento del problema
En el problema del director de capacitacin con que iniciamos el captulo, se queran
evaluar tres mtodos de capacitacin para determinar si haba alguna diferencia en su
efectividad.
Despus de terminar el periodo de capacitacin, los especialistas en estadstica de la
compaa tomaron 16 nuevos empleados asignados aleatoriamente a los tres mtodos de
capacitacin.* Contando los resultados de la produccin de estos 16 empleados, el personal
de estadstica resumi los datos y calcul su produccin media. Ahora bien, si deseamos
determinar la gran media o (la media del grupo completo de 16 empleados nuevos),
podemos utilizar uno de dos mtodos:

Anlisis de Varianza a una va: Diseo completamente aleatorizado


Hay varias formas en las cuales puede disearse un experimento ANOVA. Quizs el ms
comn es el diseo completamente aleatorizado a una va. El trmino proviene del hecho
que varios sujetos o unidades experimentales se asignan aleatoriamente a diferentes niveles
de un solo factor. Por ejemplo: varios empleados (unidades experimentales) pueden
seleccionarse aleatoriamente para participar en diversos tipos (niveles diferentes) de
un programa de capacitacin (el factor).
El anlisis de varianza se basa en una comparacin de la cantidad de variacin en cada uno
de los tratamientos. Si de un tratamiento al otro la variacin es significativamente alta,
puede concluirse que los tratamientos tienen efectos diferentes en las poblaciones.

a.

Esta variacin entre el nmero total de las 14 observaciones. Esto se


llama variacin total.
b.
Existe variacin entre los diferentes tratamientos (muestras). Esto se
llama variacin entre muestras.
c.
Existe variacin dentro de un tratamiento dado (muestra). Esto se
denomina variacin dentro de la muestra.
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o
ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es
incorrecto utilizar repetidamente el contraste basado en la t de Student. Por dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente varios contrastes
de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada
contraste se rechaza la H0 si la t supera el nivel crtico, para lo que, en la hiptesis nula, hay
una probabilidad. Si se realizan m contrastes independientes, la probabilidad de que, en laa
hiptesis nula, ningn estadstico supere el valor) a crtico es (1 - m, por lo tanto, la
probabilidad de que alguno lo )a supere es 1 - (1 - m, que para valores m. Una primera
solucin, a prximos a 0 es aproximadamente igual a a de denominada mtodo de
Bonferroni, consiste en bajar el valor /m, aunque resulta un mtodo muy conservador.a ,
usando en su lugar a de
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de
la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la
hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin embargo,
para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta,
pues se ha hecho en base a muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que esto: es un
mtodo que permite comparar varias medias en diversas situaciones; muy ligado, por tanto,
al diseo de experimentos y, de alguna manera, es la base del anlisis multivariante.
ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES
En este caso las frmulas son parecidas a la del ANOVA de una va pero ahora agregando el
clculo por renglones adicional al de columnas donde se incluye la variable de bloqueo.
Se trata de bloquear un factor externo que probablemente tenga efecto en la respuesta pero
que no hay inters en probar su influencia, slo se bloquea para mininizar la variabilidad de
este factor externo, evitando que contamine la prueba de igualdad entre los tratamientos.
Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque indica
condiciones similares de los sujetos al experimentar con diferentes tratamientos. Las
hiptesis son:
Ho: No hay diferencia en las medias del factor de columna
Ha: Al menos una media del factor de columna es diferente
Ho: No hay diferencia en las medias de la variable de rengln
Ha: Al menos una media de la variable de rengln es diferente
2. Ejemplos con clculo manual
Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres diferentes mquinas es igual,
tomando en cuenta la experiencia de los operadores a un nivel de significancia del 5%.

Experiencia

Mquinas

de ops. En aos

Maq 1

Maq 2

Maq 3

Promedios

27

21

25

24.33333

31

33

35

33

42

39 39

38

41

37

38.66667

45

46

45

45.33333

36.6

36

36.2

36.26667

Promedios

40

TABLA ANOVA
SS
SCTR= 0.933333

GL
2

CM
CMTR= 0.466667

SCBL= 764.9333
SCE = 41.06667
SCT = 806.9333

4
8
14

CMBL= 191.2333
CME= 5.133333
CMT= 57.6381

Fc
Ftr = 0.09
Fbl =
37.25

Falfa
4.46
3.84

Conclusin: No hay diferencia entre mquinas a pesar de la diferencia en experiencia de los


operadores.
Ejemplo 2
Una empresa de taxis intenta crear un sistema de rutas que minimice el tiempo que se pasa
manejando a ciertas localidades. El tiempo que toma viajar en cada ruta por los taxis se
muestra a continuacin:
Var.
Bloqueo
Taxista
1
2
3
4
5

1
12
18
10
13
18

Factor - Ruta
2
3
15
17
18
18
11
15
12
12
14
12

y si afecta el taxista.
Var.

Factor - Ruta

4
13
17
9
15
15

Bloqueo
Taxista
1
2
3
4
5

1
12
18
10
13
18

2
15
18
11
12
14

3
17
18
15
12
12

14.2

4
13
17
9
15
15

14

14.8

13.8

14.2

4.84

0.64

7.84

1.44

14.44

14.44

14.44

7.84

17.64

10.24

0.64

27.04

1.44

4.84

4.84

0.64

14.44

0.04

4.84

0.64

SCT
r
SCTR
c

153.2
5
0
2.8
4
c*(XiX)^2
0.01

0.2

50.41
34.81
5.76
1.21
SCE = SCT - SCTR - SCBL
SCE
58.2
TABLA ANOVA

rj*(Xj X)^2
1.8

0.8

SCBL

92.2

Fuente de
SC
Variacin

g.l.

CM

Columnas 2.8
Renglones 92.2
Error
58.2

3
4
12

0.9333333 0.1924399
23.05
4.7525773
4.85

Total

FC

153.2

Conclusin: No hay diferencia en la tiempo por las rutas a pesar de diferencias en taxistas
DMS Prueba de TUKEY
Renglones
Columnas
(n) datos
n-c
CME

5 Alfa 0.05%
4
CME
T q ,c ,n c
20
r
16
4.85

Obteniendo q de tablas = 4.05

x1-x2
x1-x3
x1-x4
x1-x5
x2-x3
x2-x4
x2-x5
x3-x4
x3-x5
x4-x5

Diferencias
3.5
3
1.25
0.5
6.5
4.75
3
1.75
3.5
1.75

Significativas
No
No
No
No
Significativas
Significativas
No
No
No
No

F = DISTR.F.INV(alfa, gl. =1, gl. CME =12)


F=
4.7472
DMS =

2.1459

Conclusin: Medias Poblacionales de taxistas diferentes