Está en la página 1de 12

ANALISIS DE VARIANZA

EI modelo para un analisis de la varianza de un factor Supongamos que tenemos


muestras aleatorias independientes de n1, n2 , ... , nK observaciones de K
poblaciones. Si las medias poblacionales son /11' /12' ... , /1K' el amilisis de la
varianza de un factor pretende contrastar la hip6tesis nula
Ho : fll = fl2 = ... = flK
HI : fli #- Pj Para al menos un par Pi' J.lj
En este apartado presentamos un contraste de la hip6tesis nula de que las medias
de K poblaciones son iguales, dadas muestras aleatorias independientes de esas
poblaciones. El primer paso obvio es calcular las medias muestrales de los K grupos
de observaciones. Estas medias muestrales se representan por medio de Xl' X2, ...
, xK • En terminos formales,

donde ni representa el número de observaciones muestrales del grupo i


Ahora bien, la hipotesis nul a de interes especifica que las K poblaciones tienen una
media común.
Esta es simplemente la suma de todos los valores muestrales dividida por su
número total. Si n representa eI número total de observaciones muestrales,

entonces
El primero es la variabilidad en torno a las medias muestrales individuales dentro de
los K grupos de observaciones. Es c6modo llamada variabilidad del1tro de los
grupos. En segundo lugar, nos interesa la variabilidad entre las medias de los K
grupos. Esta se llama variabilidad entre los grupos. A continuaci6n, buscamos
medidas, basadas en los datos muestrales, de estos dos tipos de variabilidad.
Consideremos, en primer lugar, la variabilidad dentro de los grupos. Para medir la
variabilidad en el primer grupo, calculamos la suma de los cuadrados de las
desviaciones de las observaciones en torno a su media muestral XI' es decir,
Asimismo, en el caso del segundo grupo, cuya media muestral es X2' calculamos

y as! sucesivamente. As! pues, la variabilidad total que existe dentro de los grupos,
denominada SCD, es la suma de las sumas de los cuadrados de los K grupos; es

decir,
o sea

A continuaci6n, necesitamos una medida de la variabilidad que existe entre los


grupos. Una medida 16gica se basa en las diferencias entre las medias individuales
de los grupos y la media global. En realidad, al igual que antes, estas diferencias se

elevan al cuadrado, por 10 que


Para calcular la suma total de los cuadrados entre los grupos, SCG, ponderamos
cada diferencia al cuadrado par el número de observaciones muestrales del grupo
correspondiente (de manera que damos mas peso a las diferencias
correspondientes a los grupos en los que hay más observaciones), por 10 que
A menudo se calcula otra suma de los cuadrados. Es la suma de los cuadrados de

las diferencias de todas las observaciones muestrales en torno a su media global.


Esta se denomina suma total de los cuadrados y se expresa de la forma siguiente:
De hecho, en el apéndice de este capítulo mostramos que la suma total de los
cuadrados es la suma de los cuadrados dentro de los grupos y la suma de los

cuadrados entre los grupos; es decir,

Descomposición de la suma de los cuadrados en el análisis de la varianza de un


factor
La descomposición de la suma total de 'los cuadrados en la suma de dos
componentes -las sumas de los cuadrados dentro de los grupos y entre los grupos-
constituye la base del contraste de la igualdad de las medias poblacionales de los
grupos basado en el análisis de la varianza. Podemos considerar que esta
descomposición expresa la variabilidad total de todas las observaciones muestrales
en torno a su media global como la suma de la variabilidad dentro de los grupos y
la variabilidad entre los grupos
Nuestro contraste de la igualdad de las medias poblacionales se basa en el
supuesto de que las K poblaciones tienen una varianza común. Si la hipótesis nula
de que las medias poblacionales son iguales es verdadera, cada una de las sumas
de los cuadrados, SCD y SCG, puede utilizarse como base para estimar la varianza
poblacional común. Para obtener estas estimaciones, deben dividirse las sumas de
los cuadrados par el número correspondiente de grados de libertad. En primer lugar,
en el apéndice del capítulo mostramos que se obtiene un estimado de la varianza
poblacional si se divide SCD por (n - K). La estimación resultante se denomina

media de los cuadrados dentro de los grupos y se representa par medio de MCD,
de manera que
Si las medias poblacionales son iguales, se obtiene otro estimador de la varianza
poblacional dividiendo SCG por (K - 1), que también se muestra en el apéndice del
capítulo. La cantidad resultante se llama media de los cuadrados entre los grupos y
se representa por medio de MCG; por 10 tanto,
Cuando las medias poblacionales no son iguales, la media de los cuadrados entre
los grupos no constituye una estimación de la varianza poblacional común. EI valor

esperado de la variable aleatoria correspondiente es mayor que la varianza


poblacional común, ya que también contiene información sobre los cuadrados de
las diferencias de las verdaderas medias poblacionales. Si la hipótesis nula fuera
verdadera, ahora tendríamos dos estimaciones investigadas de la misma cantidad,
la varianza poblacional común. Sería razonable esperar que estas estimaciones
fueran muy parecidas. Cuanto mayor es la diferencia entre estas dos estimaciones,
manteniéndose todo 10 de mas constante, mayor es nuestra sospecha de que la
hipótesis nula no es verdadera.
Si este cociente es cercano a 1, hay pocas razones para dudar de la hipótesis nula
de la igualdad de las medias poblacionales. Sin embargo, como ya hemos señalado,
si la variabilidad entre los grupos es grande en comparación con la variabilidad
dentro de los grupos, sospechamos que la hipótesis nula es falsa. Lo es cuando el
cociente F tiene un valor muy superior a 1. En ese caso, se rechaza la hipótesis
nula. Cabe deducir un contraste formal del hecho de que si la hipótesis nula de la
igualdad de las medias poblacionales es verdadera, la variable aleatoria sigue una
distribución F

Caso práctico 1
En una escuela de idiomas se requiere comprobar la eficacia de cuatro métodos
diferentes de enseñanza del inglés (Alternando la participación de medios
audiovisuales) que llamaremos A, B, C, y D. Para ello se va a someter a los
alumnos de nivel 0 (principiante), durante seis meses, a razón de 10 horas
semanales, al aprendizaje del inglés. Se piensa que la edad de los alunmos pueda
influir en el resultado, por lo que se dese determinar al nivel de significación del
1%. Al finalizar el curso se les somete a todos al mismo examen oral y escrito,
puntuado en 100 puntos. La siguiente tabla muestra los resultados obtenidos:

A B C D
74 75 72 78
75 74 75 77
77 78 76 80
81 79 78 83

Comprobar si los métodos son similares o existe alguno significativamente


diferente.
Paso 1:
ŷ: 76.75 76.5 75.25 79.5

Sustituyendo en la formula ŷ=∑yi/k


ŷ =308/4=77
Sustituyendo en la formula SSA=nz(yi- ŷ)²

A B C D
9 4 25 1 ∑=124
4 9 4 0 ∑4=496
0 1 1 9
16 4 1 36
SSA=496

Sustituyendo en la formula SSE=∑∑(yij- ŷ)²

A B C D
7.5625 2.25 10.5625 2.25 ∑=85.5
3.0625 6.25 0.0625 6.25
0.0625 2.25 0.5625 0.25

18.0625 6.25 7.5625 12.25 SST=SSA+SSE por lo tanto:


SST=496+85.5=581.5

Sustituyendo en la formula S1²=SSA/K-1

S1²=165.3

Sustituyendo en la formula S²=SSE/k(n-1)

S²=28.5

Resolviendo f=S1²/S2²
f= 5.8

Caso práctico 2
Se dispone de tres máquinas, la A, B Y C, que fabrican el mismo producto y se
pretende comprobar si su rendimiento, medido en numero de piezas producidas
por hora, es sikilar. Se sopecha que hay otros factores que también podrían influir,
como el operario que las maneja, y el turno de trabajo (mañana, tarde o noche). La
siguiente tabla muestra los resultados obtenidos de las mediciones. Se desea
determinar al nivel de significancia del 1%.

A B C D E
92 98 90 100 99
98 91 91 98 87
93 87 98 93 95
88 84 89 94 92
94 91 85 97 86
96 89 92 88 102

ŷ: 93.5 90 90.8 95 93.5

Sustituyendo en la formula ŷ=∑yi/k


ŷ =463/6=77.14
Sustituyendo en la formula SSA=nz(yi- ŷ)²

A B C D
220.85 435.19 165.41 522.63
435.19 192.13 192.13 435.19
∑=5992.24
251.57 97.24 435.19 251.57
117.96 47.07 140.69 284.30 ∑6=35953.44
284.30 192.13 61.80 394.46
355.74 140.69 220.85 117.96

SSA=359553.44

Sustituyendo en la formula SSE=∑∑(yij- ŷ)²

∑=354.33
A B C D
2.25 64 0.69 25
20.25 1 0.03 9
0.25 9 51.36 4
30.25 36 3.36 1
0.25 1 34.03 4
6.25 1 1.36 49
SSE=354.33

SST=SSA+SSE por lo tanto: SST=359553.44+354.33=36307.77

Sustituyendo en la formula S1²=SSA/K-1

S1²=11984.5

Sustituyendo en la formula S²=SSE/k(n-1)

S²=118.11

Resolviendo f=S1²/S2²
f= 101.5

Caso practico 3
Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan
con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado,
el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un
mes de entrenamiento se realiza un test de rendimiento consistente en un
recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:

Método 1 Método 2 Método 3


15 14 13
16 13 12
14 15 11
15 16 14
17 14 11
Desarrollando:

ŷ: 15.40 14.40 12.20


Sustituyendo en la formula ŷ=∑yi/k
ŷ =42/3=14
Sustituyendo en la formula SSA=nz(yi- ŷ)²

Método 1 Método 2 Método 3


1.00 0.00 1.00 ∑=44
4.00 1.00 4.00
0.00 1.00 9.00 ∑5=220
1.00 4.00 0.00
9.00 0.00 9.00

SSA=220
Sustituyendo en la formula SSE=∑∑(yij- ŷ)²

Método 1 Método 2 Método 3


0.16 0.16 0.64
0.36 1.96 0.04 ∑=17.20
1.96 0.36 1.44
0.16 2.56 3.24
2.56 0.16 1.44

SSE=17.20

SST=SSA+SSE por lo tanto: SST=220+17.20=237.20

Sustituyendo en la formula S1²=SSA/K-1

S1²=73.3

Sustituyendo en la formula S²=SSE/k(n-1)

S²=5.73

Resolviendo f=S1²/S2²
f= 12.8
Caso práctico 4
Una lista de palabras sin sentido se presenta en la pantalla del ordenador con
cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos.
Posteriormente se les realiza una prueba de recuerdo de dichas palabras,
obteniéndose los siguientes resultados:

Procdmt.I Procdmt.II Procdmt.III Procdmt.IV Procdmt.V


5 9 8 1 10
7 11 6 3 3
6 8 9 4 5
3 7 5 5 7
9 7 7 1 2
7 10 4 4 8
4 6 4 6 3
2 3 9 9 2
Se desea determinar al nivel de significancia del 5%.

ŷ: 5.375 7.625 6.5 4.125 5

Sustituyendo en la formula ŷ=∑yi/k


ŷ =29/5=5.73
Sustituyendo en la formula SSA=nz(yi- ŷ)²

Procdmt.I Procdmt.II Procdmt.III Procdmt.IV Procdmt.V


0.53 10.73 5.18 22.33 18.28 ∑=283.98
1.63 27.83 0.08 7.43 7.43
0.08 5.18 10.73 2.98 0.53 ∑8=2271.8
7.43 1.63 0.53 0.53 1.63
10.73 1.63 1.63 22.33 13.88
1.63 18.28 2.98 2.98 5.18
2.98 0.08 2.98 0.08 7.43
13.88 7.43 10.73 10.73 13.88

SSA=2271.8
Sustituyendo en la formula SSE=∑∑(yij- ŷ)²
Procdmt.I Procdmt.II Procdmt.III Procdmt.IV Procdmt.V
0.140625 1.890625 2.25 9.765625 25
2.640625 11.390625 0.25 1.265625 4
0.390625 0.140625 6.25 0.015625 0 ∑=224.62
5.640625 0.390625 2.25 0.765625 4
13.140625 0.390625 0.25 9.765625 9
2.640625 5.640625 6.25 0.015625 9
1.890625 2.640625 6.25 3.515625 4
11.390625 21.390625 6.25 23.765625 9

SSE=224.62

SST=SSA+SSE por lo tanto: SST=2271.8+224.62=2496.42

Sustituyendo en la formula S1²=SSA/K-1

S1²=757.3

Sustituyendo en la formula S²=SSE/k(n-1)

S²=74.87

Resolviendo f=S1²/S2²
f= 10.1
Caso práctico 5
Se toman 20 conductores y asignar aleatoriamente 10 a los automoviles A y 10 a
los automoviles B y 10 automoviles C (aunque, en realidad, no es necesario hacer
el mismo numero de pruebas con cada tipo de automovil). Las 20 cifras de
consumo de combustible resultantes constituirfan un par de muestras aleatorias
independientes de 10 observaciones cada una sobre los automoviles A, B Y C.

Autos A Autos B Autos C


22.2 24.6 22.7
19.9 23.1 21.9
20.3 22 23.2
21.4 23.5 24.1
21.2 23.6 22.1
21 22.1 23.4
20.3 23.5

ŷ: 24.38 27.07 22.9

Sustituyendo en la formula ŷ=∑yi/k


ŷ =74/3=24.78
Sustituyendo en la formula SSA=nz(yi- ŷ)²
Autos A Autos B Autos C
6.67 0.03 4.34
23.85 2.83 8.31
20.10 7.75 2.51 ∑=156.57
11.45 1.65 0.47
12.84 1.40 7.20 ∑7=1096
14.31 7.20 1.91
20.10 1.65

SSA=1096

Sustituyendo en la formula SSE=∑∑(yij- ŷ)²

Autos A Autos B Autos C


4.77 6.08 0.04 ∑=201.77
20.10 15.73 1.00
16.67 25.67 0.09
8.90 12.72 1.44
10.13 12.02 0.64
11.45 24.67 0.25
16.67 12.72

SSE=201.77
SST=SSA+SSE por lo tanto: SST=1096+201.77=1297.77

Sustituyendo en la formula S1²=SSA/K-1

S1²=365.3

Sustituyendo en la formula S²=SSE/k(n-1)

S²=67.25

Resolviendo f=S1²/S2²
f= 5.4

También podría gustarte