Está en la página 1de 24

ANLISIS DE VARIANZA

Dra. Nidelvia del Jess Bolvar Fernndez

EJEMPLOS Y EJERCICIOS
Ejemplo 1

Se han aplicado cuatro mtodos distintos para el


aprendizaje del concepto de nmero primo a cuatro grupos
de alumnos y alumnas elegidos aleatoriamente.
Posteriormente se les ha pasado la misma prueba para
valorar la adquisicin del concepto, con los siguientes
resultados:
Mtodo A Mtodo B Mtodo C Mtodo D
8
12
11
15
7
9
10
11
17
12

16
12
13
15
19
16
13
10
6
11

16
15
13
17
13
9
19
16
14
13

11
9
8
8
9
12
10
9
5
10

Se supone poblacin normal y que las muestras son


independientes entre s. Hay alguna evidencia, al 95% de
Nivel de Confianza, de que exista un efecto en la aplicacin
de los distintos mtodos?

Aunque se haya expresado con otras palabras, lo que


interesa en esta situacin es averiguar si las medias
de las cuatro poblaciones representadas por la
aplicacin de los mtodos se pueden considerar
iguales o no, es decir:
La hiptesis nula es
H0: m1 = m2 = m3 = m4
Para averiguar esto se acude a analizar la varianza.
La razn es que
si las medias son iguales, la varianza total disminuye,
pero
si las medias son muy diferentes, aumenta.
Es una idea intuitiva que podemos expresar con
estas imgenes:

En esta situacin, los cuatro


grupos estn muy cercanos.
Su varianza total no ser
grande. Cada grupo tiene su
propia varianza interna.

En esta otra, al separarse los


grupos, la varianza total
aumentar, porque hay ms
dispersin, pero la varianza
interna de cada grupo es la
misma. Lo que ha aumentado
es la variabilidad
Intergrupos.

Observando las imgenes se puede entender que si la


varianza total aumenta, esto puede deberse a dos causas, o a
que haya aumentado la varianza interna de cada grupo, o, lo
que es ms probable, que se hayan separado las medias y
eso ha aumentado la varianza total.
El Anlisis de la varianza (ANOVA) nos permite aceptar o
rechazar la hiptesis nula
H0: 1 = 2 = 3 = 4
descomponiendo la varianza total en dos sumandos:
Intragrupos e Intergrupos. Segn sean estas cantidades se
tomar una decisin u otra.
Cuando las medias de varios grupos
relacionados se separan entre s, aumenta la
varianza total.

En la prctica se forman tres sumas de cuadrados


distintas y despus se restan adecuadamente.
S1: Consiste en sumar todos los cuadrados de los
datos. Su valor es, en este ejemplo 6207.
S2: Se suman los cuadrados de las sumas de los
distintos niveles dividido cada uno entre el nmero
de datos. En el ejemplo su valor es de 5901.1
S3: Se obtiene dividiendo el cuadrado de la suma
total de todos los niveles dividido entre el nmero
total de datos. En este caso vale 5736.03
Una vez obtenidas estas sumas, se van
restando y resultarn las sumas de cuadrados
Intergrupos, Intragrupos y Total:

S1: Consiste en sumar todos los cuadrados de los


datos
Sumatoria
s

Mtodo A Mtodo B Mtodo C Mtodo D


64

256

256

121

697

144

144

225

81

594

121

169

169

64

523

225

225

289

64

803

49

361

169

81

660

81

256

81

144

562

100

169

361

100

730

121

100

256

81

558

289

36

196

25

546

144

121

169

100

534

1338

1837

2171

861

6207

6207

S2: Se suman los cuadrados de las sumas de los distintos


niveles dividido cada uno entre el nmero de datos.
Mtodo A Mtodo B

Mtodo C

Mtodo D

16

16

11

12

12

15

11

13

13

15

15

17

19

13

16

12

10

13

19

10

11

10

16

17

14

12

11

13

10

112

131

145

91

12544

17161

21025

8281

1254.4

1716.1

2102.5

828.1

479
59011
5901.1

Sumatorias
Cuadrado de
Sumatorias
Cuadrado de
Sumatorias entre
10

S3: Se obtiene dividiendo el cuadrado de la suma total de


todos los niveles dividido entre el nmero total de datos. En
este caso vale 5736.03
Mtodo A

Mtodo B

Mtodo C

Mtodo D

16

16

11

12

12

15

11

13

13

15

15

17

19

13

16

12

10

13

19

10

11

10

16

17

14

12

11

13

10

112

131

145

91

479

Cuadrado de la sumatoria

229441

Cuadrado de la sumatoria entre el nmero total de datos (N)

5736.025

Suma de cuadrados INTRA: S1-S2 = 6207 - 5901,1 =


305,9
Es la suma de cuadrados que corresponde al interior de los
niveles, sin tener en cuenta su diferencia de medias.
Sus grados de libertad se obtienen restando el nmero
total (40) menos el nmero de niveles (4), es decir, 36.
Su cociente es el mejor estimador de la varianza de la
poblacin, en este caso 8,5
Suma de cuadrados TOTAL: S1-S3 = 6207 5736.03
= 470.98
Es la suma total de cuadrados. Sus grados de libertad
son N-1, que en este caso son 39, con lo que la varianza
total ser 470.98/39 = 12.08
Suma de cuadrados INTER: S2-S3 = 5901.1
5736.03 = 165.08
Esta suma refleja los desniveles en las medias. Si es alta,
puede indicar que las diferencias entre medias son
significativas.
Sus grados de libertad equivalen al nmero de

ANOVA
Fuente de
variacin

Suma de
cuadrados

Grados
de
libertad

Cuadrado
Medio

F (Fisher)
Calculada

Suma de
cuadrado
s Inter

S2-S3 =
5901.1
5736.03 =
165.08

4 -1 = 3

165.08 3
= 55.03

55.03 8.5
= 6.48

Suma de
cuadrado
s INTRA:

S1-S2 = 6207
- 5901,1 =
305.9

40-4 =36

305.9 36
= 8.5

Suma de
cuadrado
s TOTAL

S1-S3 = 6207
5736.03 =
470.98

40 -1 =
39

470.98
39 = 12.08

F tablas 4. 313

Contraste
El punto importante del ANOVA es el contraste entre
unas varianzas y otras, que se realiza mediante la
prueba F.
Al dividir nos resulta un valor de F=6.48, muy
grande, con un p-valor de 0,001 en tablas, que la
convierte en significativa, luego las medias de los
distintos niveles no se pueden considerar
iguales.
Como resultado del ANOVA podremos afirmar
que en nuestro ejemplo el mtodo de
enseanza ha influido en los resultados.

Ejemplo

Se ha recogido la valoracin de un lder poltico en dos


ciudades distintas A y B, dividida cada una en tres barrios
segn su nivel adquisitivo (Alto, Medio y Bajo), obtenindose
los siguientes resultados:

Nivel alto
Nivel medio Nivel bajo
6, 5, 6, 7, 4, 8,
6, 7, 8, 5, 4, 3, 2, 3, 3, 4,
9
Ciudad A
5, 10, 6, 7,7, 5, 4, 1, 0, 4,
4, 4, 6, 8 8,8,3,
4, 7, 6, 8
6, 2, 5, 4, 4
10
6, 6, 5, 6, 4, 5, 4, 4, 5, 1, 4, 5 4, 6, 3, 2,
Ciudad B 2, 4, 2, 8, 6, 5, 3, 3, 3, 6, 4, 3, 2, 3, 1, 6
4, 4, 3
2, 2, 6, 3, 1 4, 2, 2, 3, 1
Suponiendo que se cumplen los supuestos del
ANOVA para dos factores, podemos afirmar
si la poblacin presenta diferencias
significativas en la apreciacin del poltico
segn la ciudad o segn su nivel adquisitivo?

S2: Se suman los cuadrados de las sumas de los


distintos niveles dividido cada uno entre el
nmero de datos.
Nivel alto

Nivel medio Nivel bajo

6, 5, 6, 7, 4, 6, 7, 8, 5, 4,
3,
8, 9
5, 10, 6,
Ciudad A
5,
4, 4, 6, 8
7,7, 4, 7, 6,
6,
8,8,3, 10
8
6, 6, 5, 6, 4, 4, 4, 5, 1, 4, 5
Ciudad B 5, 2, 4, 2, 8, 3, 3, 3, 6, 4, 3,
6, 5, 4, 4, 3 2, 2, 6, 3, 1 4,

2, 3, 3, 4,
4, 1, 0, 4,
2, 5, 4, 4
4, 6, 3, 2,
2, 3, 1, 6
2, 2, 3, 1

Este sera un ejemplo de Anlisis de Varianza con dos factores (ciudad


y nivel).
Toda la teora y consideraciones hechas para el caso de un factor
siguen sirviendo en ste, pero con ms sumas de cuadrados y ms
contrastes F.
Fuente variacin

SC

G.L.

CM

Factor A

83.83

41.92

14.55

Factor B

59.13

59.13

20.53

Interaccin AB

30.12

15.06

5.23

Error

239.03

83

2.88

TOTAL

412.11

88

P-valor de FA

0,182

P-valor de FB

0,045 Significativa al 5%

P-valor de
FAB

0,007 Significativa al 5%

Observa que ahora se pueden considerar cinco sumas de cuadrados:


Factor A: SCA=83.83. Representa la variabilidad propia del factor
Nivel adquisitivo. Sus grados de libertad son 2, que equivalen al
nmero de niveles menos 1, y su cuadrado medio 41.92
Factor B:SCB=59.13. Es la suma correspondiente al factor Ciudad.
Como slo hay dos ciudades, sus grados de libertad equivalen a 1, y
su cuadrado medio 59.13, muy alto respecto al estimador 2.88.
Interaccin: SCAB=30.12 Este factor no se considera si existen
motivos para creer que no existe influencia mutua entre el factor
Ciudad y el factor Nivel adquisitivo. Aqu lo consideraremos porque
no tenemos suficiente informacin. Sus grados de libertad son 2,
producto de los G.L. anteriores.
Error:SCE=239.03. Es la variabilidad de la encuesta si se prescinde
de la influencia de los factores. Su cuadrado medio es el mejor
estimador de la varianza de la poblacin: 2.88.
Total: SCT=412.11. Nos sirve para ver si cuadran bien todos los
clculos de sumas de cuadrados y grados de libertad, o para calcular
SCE mediante la operacin de restar.

Si dividimos cada cuadrado medio


entre 2,88 obtenemos la F de cada
factor,
Y, aplicando el contraste correspondiente
obtenemos
que son significativas al 5% tanto la
influencia de la Ciudad como de la
Interaccin,
no siendo significativa la influencia del Nivel
adquisitivo.

Ejercicio 1
Se est estudiando el tiempo de
coccin de un alimento antes de
lanzarlo al mercado.
Se han formado cuatro grupos y se les
ha pedido que midan el tiempo
transcurrido hasta que, segn su
juicio, el alimento quede a punto.
Como esta sensacin es subjetiva, se
usa un ANOVA para estimar la
varianza que presenta el experimento.
Todos los grupos usan fuentes de calor
y utensilios similares. Si la tabla
siguiente recoge los resultados
redondeados en minutos,
a) qu estimacin podramos hacer
de la varianza de la poblacin de
estos alimentos?
b) Se observan diferencias entre los
grupos?

Grupo Grupo Grupo Grupo


A
B
C
D
7
11
11
9
7
11
11
9
8
13
11
10
7
7
12
9
9
9
11
10
8
9
12
8
11
9
10
10
12
10
10
10
9
10
11
12
10
9
11
9
10
9
9
9

Resultados probables:
Obtendrs que las medias de los grupos son 8.91
9.73 10.82 y 9.55, algo dispersas, y como la F
tiene un p-valor de 0.016, se puede catalogar de
significativa su diferencia al 5%,
luego podemos afirmar que existen diferencias
entre los grupos.
Quizs haya influido algn otro factor, como la
presin atmosfrica o los gustos personales.
La estimacin de la varianza de la poblacin es de
1.79, y su desviacin tpica de 1.34, algo alta para
un experimento que poda haber sido ms preciso.

Ejercicio 2
Se puede afirmar que la siguiente tabla de doble entrada
contiene una interaccin significativa entre sus dos factores?

Nivel 1

Nivel 2

Nivel A

1 2 1 2 3 4 3 4 2 4 3 4 5 4 3 2
5
31

Nivel B

35654534 476787665
6
4

Nivel C

46578968 689987678
6
9

Vaca estos datos en el modelo de ANOVA para dos factores y


obtendrs estos resultados:
La interaccin presenta una F cuyo p-valor es 0.398, claramente no
significativo.

Fuente variacin

SC

G.L.

CM

Factor A

13.38

13.38

7.84

Factor B

169.3

84.65

49.62

Interaccin AB

3.2

1.6

0.94

Error

87

51

1.71

TOTAL

272.88

56

Ejercicio 3
Para estudiar el efecto del cansancio en una tarea rutinaria, se han
contado el nmero de realizaciones de varios operarios a lo largo del
da, con estos resultados:
Se puede afirmar que el tiempo de trabajo transcurrido influye en el
rendimiento?
Usa el modelo de un factor. Analiza los resultados:
La F=19.67 es claramente significativa. S existe una
influencia del cansancio.
En el inicio del trabajo
A las cuatro horas
A las siete horas

12 12 13 14 11 15 9 9 8 10 11 11 10 9
8 10 10
9 9 9 10 9 7 6 6 9 12 11 10 8 6 9 6 7
9676677887996566798

Fuente variacin

SC

G.L.

CM

INTER

115

57.5

19.67

INTRA

146.17

50

2.92

TOTAL

261.17

52

5.02

También podría gustarte