Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseo de experimentos
con varios factores de influencia
Planteamiento del modelo con dos factores sin interaccin.
Metodologa de trabajo. Estimacin de los parmetros. Tabla ANOVA.
Comparacin de medias. Comparaciones mltiples: correccin por
Bonferroni. Diagnosis de las hiptesis del modelo a travs de los
residuos.
Extensin a ms factores.
Utilizacin del SPSS.
1
Supondremos que Uij sigue una distribucin N(0,) lo que implica que Yij
sigue una distribucin N(ij ,) y que no hay interaccin entre los factores.
Factor 1 ()
Factor 2 ()
Niveles
...
...
Medias
por filas
Y11
Y12
...
...
Y1J
Y1.
Y21
Y22
...
...
Y2J
Y2.
...
...
...
...
...
...
...
YI1
YI2
...
...
YIJ
YI.
Medias por
columnas
Y.1
Y.2
...
...
Y.J
Y..
Datos (Ejemplo 1)
Se desea estudiar la eficiencia (en cuanto a menor emisin de
CO2) de 5 mquinas desaladoras. Se piensa que la cantidad de
sal en el agua puede influir en dicha eficiencia.
Factor 1: distintas mquinas (I=5)
Factor 2: nivel de sal (J=3)
Anlisis estadstico:
Estimacin de los parmetros desconocidos
Parmetros desconocidos del modelo (I + J) :
, 1 , ... , I , 1 ,..., J ,
Estimaciones de los parmetros:
Residuos
En el modelo:
Uij = Yij - - i - j
Requisitos previos
Se supone que Uij sigue una distribucin N(0,)
para todos los valores de i, j.
Y que no hay interaccin entre los factores.
Se cumple que:
SCE() + SCE() + SCR
= SCT
Estadstico de contraste
El factor 2
no influye
Estadstico de contraste
En cuanto a las emisiones de CO2 las 5 mquinas no son iguales (p-valor 0.0026)
y tambin influye la cantidad de sal (p-valor 0.0001).
Y si no hubiramos tenido en cuenta el factor cantidad de sal ?
Interaccin?
Normalidad?
Error
tpico
Comparaciones mltiples:
Pruebas Post hoc: Test de Bonferroni
Al igual que en el anlisis de la varianza con un factor podemos hacer
pruebas simultneas entre todas las posibles parejas de niveles en
cada factor. Por ejemplo utilizando el Test de Bonferroni.
En el ejemplo 1:
Factor 1 ()
Factor 2 ()
Niveles
Y111
....
Y11n11
Y121
....
Y12n12
...
...
...
Medias
por filas
...
Y1J1
....
Y1Jn1J
Y1..
...
...
...
YI..
Y...
Yijk
...
...
...
...
YI11
....
YI1nI1
YI21
....
YI2nI2
...
...
YIJ1
....
YIJnIJ
Medias por
columnas
Y.1.
Y.2.
...
...
Y.J.
Ejemplo 2
Eysenck (1974)
Datos
Mayores
Factor 1
Edad
Jvenes
Factor 2 Mtodo
Rimar Adjetivar Imaginar Recordar
11
12
10
13
11
19
16
14
11
10
14
10
11
11
23
11
13
12
14
13
10
15
10
19
11
11
11
11
10
14
20
21
11
16
19
18
16
17
10
14
15
15
13
18
22
22
16
16
10
17
20
22
16
22
22
12
14
18
11
19
21
Anlisis estadstico:
Estimacin de los parmetros desconocidos
Parmetros desconocidos del modelo (IJ + 1) :
, 1 , ... , I , 1 ,..., J , ()11 ,..., ()IJ ,
Estimaciones de los parmetros:
El factor 2
no influye
No hay interacciones
Estadsticos de contraste
Ejemplos
con Excel y SPSS
jvenes
Total
mtodo
contar
rimar
adjetivar
imaginar
recordar
Total
contar
rimar
adjetivar
imaginar
recordar
Total
contar
rimar
adjetivar
imaginar
recordar
Total
Media
7,00
6,90
11,00
13,40
12,00
10,06
6,50
7,60
14,80
17,60
19,30
13,16
6,75
7,25
12,90
15,50
15,65
11,61
Desv. tp.
1,826
2,132
2,494
4,502
3,742
4,007
1,434
1,955
3,490
2,591
2,669
5,787
1,618
2,023
3,538
4,174
4,902
5,191
N
10
10
10
10
10
50
10
10
10
10
10
50
20
20
20
20
20
100
Excel
ANLISIS DE VARIANZA
Origen de
Suma de
las
variaciones cuadrados
Edad
240,25
Mtodo
1514,94
Interaccin
190,3
Error
722,3
g.l.
1
4
4
90
Total
99
2667,79
Promedio de
los
cuadrados
240,25
378,74
47,58
8,03
p-valor
29,94 3,9814E-07
47,19 2,5301E-21
5,93 0,00027927
SPSS
Fuente
Modelo corregido
Interseccin
edad
mtodo
edad * mtodo
Error
Total
Total corregida
Suma de
cuadrados
tipo III
1945,490 a
13479,210
240,250
1514,940
190,300
722,300
16147,000
2667,790
gl
9
1
1
4
4
90
100
99
Media
cuadrtica
216,166
13479,210
240,250
378,735
47,575
8,026
F
26,935
1679,536
29,936
47,191
5,928
Significacin
,000
,000
,000
,000
,000
Comparaciones mltiples
Variable dependiente: palabras recordadas
Bonferroni
(I) mtodo
contar
rimar
adjetivar
imaginar
recordar
(J) mtodo
rimar
adjetivar
imaginar
recordar
contar
adjetivar
imaginar
recordar
contar
rimar
imaginar
recordar
contar
rimar
adjetivar
recordar
contar
rimar
adjetivar
imaginar
Diferencia
entre
medias (I-J)
-,50
-6,15*
-8,75*
-8,90*
,50
-5,65*
-8,25*
-8,40*
6,15*
5,65*
-2,60*
-2,75*
8,75*
8,25*
2,60*
-,15
8,90*
8,40*
2,75*
,15
Error tp.
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
,896
Significacin
1,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,047
,028
,000
,000
,047
1,000
,000
,000
,028
1,000
Intervalo de confianza al
95%.
Lmite
Lmite inferior
superior
-3,08
2,08
-8,73
-3,57
-11,33
-6,17
-11,48
-6,32
-2,08
3,08
-8,23
-3,07
-10,83
-5,67
-10,98
-5,82
3,57
8,73
8,23
3,07
-5,18
-,02
-5,33
-,17
6,17
11,33
5,67
10,83
,02
5,18
-2,73
2,43
6,32
11,48
5,82
10,98
,17
5,33
-2,43
2,73
N
contar
rimar
adjetivar
imaginar
recordar
Total
10
10
10
10
10
50
Media
6,50
7,60
14,80
17,60
19,30
13,16
Desviacin
tpica
1,434
1,955
3,490
2,591
2,669
5,787
Error tpico
,453
,618
1,104
,819
,844
,818
Mnimo
4
4
11
14
15
4
Mximo
9
10
22
22
22
22
ANOVA
palabras recordadas
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
1353,720
287,000
1640,720
gl
4
45
49
Media
cuadrtica
338,430
6,378
F
53,064
gl1
gl2
4
45
Sig.
,046
Sig.
,000
Comparaciones mltiples
Variable dependiente: palabras recordadas
Bonferroni
(I) metjov
contar
rimar
adjetivar
imaginar
recordar
(J) metjov
rimar
adjetivar
imaginar
recordar
contar
adjetivar
imaginar
recordar
contar
rimar
imaginar
recordar
contar
rimar
adjetivar
recordar
contar
rimar
adjetivar
imaginar
Diferencia de
medias (I-J)
Error tpico
-1,100
1,129
-8,300*
1,129
-11,100*
1,129
-12,800*
1,129
1,100
1,129
1,129
-7,200*
1,129
-10,000*
1,129
-11,700*
1,129
8,300*
1,129
7,200*
1,129
-2,800
1,129
-4,500*
11,100*
1,129
10,000*
1,129
2,800
1,129
-1,700
1,129
12,800*
1,129
11,700*
1,129
4,500*
1,129
1,700
1,129
Sig.
1,000
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,170
,002
,000
,000
,170
1,000
,000
,000
,002
1,000
Intervalo de confianza al
95%
Lmite
Lmite inferior
superior
-4,43
2,23
-11,63
-4,97
-14,43
-7,77
-16,13
-9,47
-2,23
4,43
-10,53
-3,87
-6,67
-13,33
-8,37
-15,03
11,63
4,97
10,53
3,87
,53
-6,13
-1,17
-7,83
14,43
7,77
6,67
13,33
-,53
6,13
-5,03
1,63
9,47
16,13
8,37
15,03
1,17
7,83
-1,63
5,03
N
contar
rimar
adjetivar
imaginar
recordar
Total
10
10
10
10
10
50
Media
7,00
6,90
11,00
13,40
12,00
10,06
Desviacin
tpica
1,826
2,132
2,494
4,502
3,742
4,007
Error tpico
,577
,674
,789
1,424
1,183
,567
Mnimo
4
3
6
9
5
3
ANOVA
palabras recordadas
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
351,520
435,300
786,820
Media
cuadrtica
87,880
9,673
gl
4
45
49
F
9,085
gl2
gl1
4
45
Sig.
,054
Sig.
,000
Mximo
10
11
14
23
19
23
Comparaciones mltiples
Variable dependiente: palabras recordadas
Bonferroni
(I) metmay
contar
rimar
adjetivar
imaginar
recordar
(J) metmay
rimar
adjetivar
imaginar
recordar
contar
adjetivar
imaginar
recordar
contar
rimar
imaginar
recordar
contar
rimar
adjetivar
recordar
contar
rimar
adjetivar
imaginar
Diferencia de
medias (I-J)
Error tpico
,100
1,391
1,391
-4,000
1,391
-6,400*
-5,000*
1,391
1,391
-,100
-4,100
1,391
-6,500*
1,391
-5,100*
1,391
4,000
1,391
1,391
4,100
-2,400
1,391
1,391
-1,000
6,400*
1,391
1,391
6,500*
1,391
2,400
1,400
1,391
1,391
5,000*
5,100*
1,391
1,000
1,391
-1,400
1,391
Sig.
1,000
,061
,000
,008
1,000
,051
,000
,006
,061
,051
,913
1,000
,000
,000
,913
1,000
,008
,006
1,000
1,000
Intervalo de confianza al
95%
Lmite
Lmite inferior
superior
-4,01
4,21
-8,11
,11
-2,29
-10,51
-9,11
-,89
4,01
-4,21
-8,21
,01
-10,61
-2,39
-9,21
-,99
-,11
8,11
8,21
-,01
-6,51
1,71
3,11
-5,11
2,29
10,51
2,39
10,61
6,51
-1,71
-2,71
5,51
,89
9,11
,99
9,21
-3,11
5,11
2,71
-5,51
Ejemplo 3
www.zoology.ubc.ca/.../ANOVA/ANOVA.html
La mariposa tropical Heliconius erato tiene un sabor desagradable
que le proporciona una cierta proteccin de los pjaros. stos
aprenden a reconocerlas para evitarlas. A su vez, para protegerse, el
resto de las mariposas de una zona particular evolucionan para
parecerse a las de mal sabor.
En Amrica del sur existen diferentes formas de Heliconius erato.
Localmente casi el 100% son de la misma forma.
En un estudio se tomaron mariposas de la forma rayada (ms
comn al norte) y de la forma cartero (ms comn al sur) y se
intercambiaron de zona midiendo posteriormente su supervivencia.
Tabla ANOVA
Source of Variation
SS
df
MS
Zone
9.05
9.05
0.965
0.327
Morph
34.553
34.55
3.685
0.056
Zone*morph
80.548
80.55
8.590
0.004
Error
1837.947
196
9.38
I=J=K
A
C
B
C
B
A
Datos
B
A
C
Dato y75(3)
Estos SUDOKU rellenos corresponden a dos diseos de cuadrado latino con I = 9
Existen ms de 1021 soluciones diferentes para un SUDOKU 9x9.
Ejemplo con I = 5
Supongamos que deseamos contrastar la eficacia de 5 fertilizantes
diferentes sobre un cultivo de avena. Queremos aplicar los 5
fertilizantes, esperar a que la avena madure, recolectar y medir el
resultado de la cosecha por unidad de superficie con cada fertilizante.
Pero no podemos hacer los 5 experimentos en la misma tierra.
Incluso terrenos contiguos pueden variar en fertilidad debido a
mltiples causas (diferencias de humedad, uso previo del terreno, etc.)
Dividimos el terreno experimental en una retcula de 5 x 5 rectngulos
y en cada uno administramos un fertilizante (etiquetados al azar A, B,
C, D, E )segn el siguiente diseo de cuadrado latino:
AB C D E
BDAEC
CE DBA
DC EAB
EAB C D
www.math.sunysb.edu/.../latinI2.html
Factor letra:
Color = fertilizante
Un experimento real
A 5 x 5 Latin square laid
out at Bettgelert Forest in
1929 to study the effect of
exposure on Sitka spruce,
Norway spruce (Abetos),
Japaneses larch (Alerce),
Pinus contorta and Beech
(Haya). Photograph taken
about 1945
Plate 6 from J F Box, R.A.
Fisher: The Life of a
Scientist, New York: Wiley
1978.
Ejemplo 4
Anova
Variable dependiente: emisiones
Fuente
vehculo
conductor
combustible
Error
Total
Suma de
cuadrados
tipo III
128,667
14,000
8,667
20,667
172,000
gl
2
2
2
2
8
Media
cuadrtica
64,333
7,000
4,333
10,333
F
6,226
,677
,419
Significacin
,138
,596
,705
Ejemplo 5
En un estudio sobre percepcin espacial con tres mtodos diferentes de
visin, se seleccionaron tres habitaciones, en cada habitacin se pidi a 6
personas con las mismas caractersticas (edad, formacin, sexo, etc.) que
estimasen la medida de una de las tres dimensiones (longitud, anchura,
altura) de la habitacin utilizando uno de los tres mtodos siguientes:
Visin real
las personas, sin nada, se pueden mover por la habitacin
Visin con monitor de televisin
las personas ven a travs de un monitor de televisin, situado
fuera, que les permite ver la habitacin desde distintos ngulos
Visin virtual
a las personas se les coloca un dispositivo de visin virtual con el
que pueden moverse por la habitacin
Las 48 personas se asignaron al azar a la habitacin, a la dimensin y al
mtodo. La variable respuesta es el cociente entre las medidas reales y las
estimadas por cada grupo de seis personas.
23
18
14
II
48
19
14
III
47
28
20
II
III
Habitacin \ Dimensin
Diseo
Habitacin \ Dimensin
Datos
Media fila
1.03 a
0.97 b
0.83 c
0.943
II
0.91 b
0.78 c
1.08 a
0.923
III
0.80 c
1.00 a
1.02 b
0.940
0.977
Media
total
0.936
Media columna
0.913
0.917
Mtodo
real
monitor virtual
Media
1.037 0.967
0.803
Tabla ANOVA
Variable dependiente: estimacin relativa
Fuente
Suma de
cuadrados
tipo III
habitacin
gl
Media
cuadrtica
Significacin
,001
,000
,301
,769
dimensin
,008
,004
3,330
,231
mtodo
,086
,043
37,583
,026
Error
,002
,001
,097
Total
Conclusiones?