Está en la página 1de 111

Diseo de experimentos p.

1/111
Diseo completamente al azar
Diseo de experimentos p. 2/111
Ejemplo
Suponga que tenemos 4 dietas diferentes que queremos
comparar. Las dietas estn etiquetadas A,B,C y D.
Estamos interesados en estudiar si las dietas afectan la tasa
de coagulacin en conejos. La tasa de coagulacin es el
tiempo en segundos que tarda una cortada en dejar de
sangrar.
Tenemos 16 conejos para el experimento, por lo que usaremos
4 en cada dieta.
Los conejos estn en una jaula grande hasta que se inicie el
experimento, momento en que se transferirn a otras jaulas.
Cmo asignamos los conejos a los cuatro grupos
tratamiento?
Diseo de experimentos p. 3/111
Mtodo 1
Supongamos que los conejos se atrapan "al azar". Atrapamos
cuatro conejos y los asignamos a la dieta A. Atrapamos otros
cuatro y los asignamos a la dieta B y as sucesivamente.
Dado que los conejos fueron "atrapados al azar", esto
producir un diseo completamente al azar.
Diseo de experimentos p. 4/111
Mtodo 1
No es necesariamente cierto.
Los primeros cuatro conejos atrapados pueden ser los ms
lentos y dbiles, aquellos menos capaces de escapar. Esto
puede sesgar los resultados.
Si los resultados del experimento dan desventaja a la dieta A,
no habr forma de determinar si los resultados son a
consecuencia de la dieta A o del hecho de haber asignado los
conejos ms dbiles a esa dieta por nuestro "proceso de
aleatorizacin".
Diseo de experimentos p. 5/111
Mtodo 2
Atrape a todos los conejos y etiqutelos del 1 al 16.
Seleccione cuatro nmeros aleatorios (sin reemplazo) del 1 al
16 y ponga los conejos con esa etiqueta en una jaula que
recibir la dieta A.
Entonces, seleccione otros cuatro nmeros aleatorios y ponga
los conejos correspondientes en otra jaula que recibir la dieta
B.
As sucesivamente hasta tener cuatro jaulas con cuatro
conejos en cada una.
Diseo de experimentos p. 6/111
Mtodo 2
No hay repeticiones.
El diseo es un diseo completamente al azar pero no tiene
repeticiones.
Hay 16 conejos, pero los conejos en cada jaula no son
independientes. Si un conejo come mucho, los otros en la
jaula tienen menos para comer.
La unidad experimental es la menor unidad de material
experimental a la cual se le aplica un tratamiento en forma
independiente. En este caso, las jaulas son las unidades
experimentales. Para un diseo completamente al azar con
repeticiones, cada conejo debe estar en su propia jaula.
Diseo de experimentos p. 7/111
Mtodo 3
En una urna ponga las letras A,B,C y D en pedazos de papel
separados.
Atrape un conejo, saque un pedazo de papel al azar de la urna
y asigne el conejo a la dieta que indique el papel. No
reemplace el papel. Atrape el segundo conejo y seleccione al
azar otro pedazo de papel de la urna de los tres que quedan.
Asigne el conejo a la dieta correspondiente.
Continue hasta que los primeros cuatro conejos sean
asignados a una de las cuatro dietas. De esta manera, todos
los conejos lentos tienen diferentes dietas.
Coloque otra vez los cuatro pedazos de papel en la urna y
repita el procedimiento hasta que los 16 conejos estn
asignados a una dieta.
Diseo de experimentos p. 8/111
Mtodo 3
Este no es un diseo completamente al azar.
Ya que se seleccionaron los conejos en bloques de 4, y cada
uno asignado a una de las dietas, el diseo es el bloques al
azar.
El tratamiento es Dieta pero se ha bloqueado a travs del
grado de "atrapabilidad".
Diseo de experimentos p. 9/111
Mtodo 4
Atrape a todos los conejos y mrquelos del 1 al 16. Ponga 16
piezas de papel en una urna, con las letras A, B, C y D
repetidas cuatro veces cada una.
Ponga otros 16 pedazos de papel numerados del 1 al 16 en
otra urna. Tome un pedazo de papel de cada urna. El conejo
con el nmero seleccionado es asignado a la dieta
seleccionada.
Para hacer ms fcil de recordar cul conejo tiene cul dieta,
las jaulas se acomodan como se muestra abajo:
A A A A
B B B B
C C C C
D D D D
Diseo de experimentos p. 10/111
Mtodo 4
El mtodo 4 tiene algunas deciencias. La asignacin de los
conejos a los tratamientos es un diseo completamente al
azar. Sin embargo, el arreglo de las jaulas crea un sesgo en
los resultados.
Puede haber cambios climticos y de luz que afecten de forma
diferencial a los tratamientos, de tal manera que, cualquier
diferencia observada no puede ser atribuida a la dieta, sino
que podra ser resultado de la posicin de la jaula.
La posicin de la jaula no es parte del tratamiento, pero debe
ser considerada. En un diseo completamente al azar, todos
los conejos tienen la misma probabilidad de recibir cualquier
dieta y en cualquier posicin de la jaula.
Diseo de experimentos p. 11/111
Mtodo 5
Marque las jaulas del 1 al 16.
1 5 9 13
2 6 10 14
3 7 11 15
4 8 12 16
Ponga 16 pedazos de papel en una urna, numerados del 1 al
16. En otra urna ponga 16 pedazos de papel, marcados con
las letras A, B C y D.
Atrape un conejo. Seleccione un nmero y una letra de cada
urna. Ponga el conejo en la jaula indicada por el nmero
escogido y asgnelo a la dieta indicada por la letra.
Repita sin reemplazo hasta que todos los conejos hayan sido
asignados a una dieta y una jaula.
Diseo de experimentos p. 12/111
Mtodo 5
Si, por ejemplo, el primer nmero seleccionado fu 7 y la
primera letra B, entonces el primer conejo se pone en la jaula
7 y se alimenta con la dieta B.
1 5 9 13
2 6 10 14
3 7 B 11 15
4 8 12 16
Diseo de experimentos p. 13/111
Mtodo 5
Un ejemplo de asignacin completa es el siguiente:
1 C 5 A 9 B 13 D
2 D 6 B 10 D 14 C
3 C 7 B 11 A 15 D
4 A 8 A 12 C 16 B
Note que el diseo completamente al azar no toma en cuenta
las diferencias en la altura de las jaulas. Es solamente una
asignacin completamente al azar.
En este ejemplo vemos que la mayora de los conejos con la
dieta A estn en jaulas de la parte de abajo y los de la dieta D
estn en la parte superior. Un diseo completamente al azar
supone que estas posiciones no producen una diferencia
sistemtica en la respuesta (tiempo de coagulacin).
Si creemos que la posicin afecta la respuesta, deberamos
usar un diseo de bloques al azar.
Diseo de experimentos p. 14/111
Diseo completamente al azar, un factor
Ejemplo: Disminucin del crecimiento de bacterias en carne
almacenada.
La vida en estante de carne almacenada es el tiempo en que
el corte empacado se mantiene bien, nutritivo y vendible.
El empaque estndar con aire del medio ambiente tiene una
vida de 48 horas. Despus se deteriora por contaminacin
bacterial, degradacin del color y encogimiento.
El empaque al vaco detiene el crecimiento bacterial, sin
embargo, se pierde calidad.
Estudios recientes sugieren que al controlar ciertos gases de
la atmsfera se alarga la vida en estante.
Diseo de experimentos p. 15/111
Diseo completamente al azar, un factor
Hiptesis de investigacin: Algunas formas de gases
controlados pueden mejorar la efectividad del
empacamiento para carne.
Diseo de tratamientos: Un factor con 4 niveles:
1. Aire ambiental con envoltura plstica
2. Empacado al vaco
3. Mezcla de gases:
I
1% CO (monxido de carbono)
I
40% O
2
(oxgeno)
I
59% N (nitrgeno)
4. 100% CO
2
(bixido de carbono)
Diseo experimental: Completamente al azar.
Diseo de experimentos p. 16/111
Diseo completamente al azar, un factor
Tres bisteces de res, aproximadamente del mismo tamao (75
grs.) se asignaron aleatoriamente a cada tratamiento. Cada
bistec se empaca separadamente con su condicin asignada.
Variable de respuesta: Se mide el nmero de
bacterias psichnotropicas en la carne despus de 9
das de almacenamiento a 4

C.
Estas bacterias se encuentran en la supercie de la
carne y aparecen cuando la carne se ech a perder.
La medicin fu el logaritmo del nmero de
bacterias por cm
2
.
Diseo de experimentos p. 17/111
Diseo completamente al azar, un factor
Cmo aleatorizar?
Se obtiene una permutacin aleatoria de los nmeros 1 a 12. Para esto se
toma una secuencia de nmeros de 2 dgitos de una tabla de nmeros
aleatorios y se les asigna el rango que les corresponda.
Por ejemplo:
# aleatorio 52 56 20 99 44 34 62 60 31 57 40 78
rango 6 7 1 12 5 3 10 9 2 8 4 11
trat 1 1 1 2 2 2 3 3 3 4 4 4
u.e. 1 2 3 4 5 6 7 8 9 10 11 12
trat 1 3 2 4 2 1 1 4 3 3 4 2
Diseo de experimentos p. 18/111
Diseo completamente al azar, un factor
Modelo estadstico para el experimento
El modelo estadstico para estudios comparativos supone que
hay una poblacin de referencia de u.e. En muchos casos la
poblacin es conceptual. En el ejemplo, es posible imaginar
una poblacin de carne empacada.
Cada unidad de la poblacin tiene un valor de la variable de
respuesta, y, la cual tiene media y varianza
2
.
Se supone una poblacin de referencia para cada tratamiento
considerado en el estudio, y las variables en el experimento se
suponen seleccionadas aleatoriamente de dicha poblacin de
referencia, como resultado de la aleatorizacin.
Nota. Para estudios observacionales, suponemos que las
unidades observadas se seleccionaron aleatoriamente de
cada una de las poblaciones.
Diseo de experimentos p. 19/111
Diseo completamente al azar, un factor
Diseo de experimentos p. 20/111
Diseo completamente al azar, un factor
Modelo estadstico lineal para un diseo completamente al
azar.
Modelo de medias:
y
ij
=
i
+
ij
i = 1, 2, . . . , t j = 1, 2, . . . , r
donde
y
ij
es la observacin de la j-sima u.e. del i-simo tratamiento,

i
es la media del i-simo tratamiento,

ij
es el error experimental de la unidad ij.
Suponemos que hay t tratamientos y r repeticiones en cada
uno.
En el ejemplo de la carne empacada, tenemos:
Diseo de experimentos p. 21/111
Diseo completamente al azar, un factor
bistec trata obser log y
ij
Modelo
miento vacin (conteo/cm
2
)
6 1 1 7.66 y
11

1
+
11
7 1 2 6.98 y
12

1
+
12
1 1 3 7.80 y
13

1
+
13
12 2 1 5.26 y
21

2
+
21
5 2 2 5.44 y
22

2
+
22
3 2 3 5.80 y
23

2
+
23
10 3 1 7.41 y
31

3
+
31
9 3 2 7.33 y
32

3
+
32
2 3 3 7.04 y
33

3
+
33
8 4 1 3.51 y
41

4
+
41
4 4 2 2.91 y
42

4
+
42
11 4 3 3.66 y
43

4
+
43
Diseo de experimentos p. 22/111
Diseo completamente al azar, un factor
El modelo:
y
ij
=
i
+
ij
lo llamaremos modelo completo ya que incluye una media
separada para cada una de las poblaciones denidas por los
tratamientos.
Si no hay diferencia entre las medias de las poblaciones, es
decir,

1
=
2
=
3
=
4
=
se genera el modelo reducido
y
ij
= +
ij
que establece que las observaciones provienen de la misma
poblacin con media .
Diseo de experimentos p. 23/111
Diseo completamente al azar, un factor
El modelo reducido representa la hiptesis de no diferencia
entre las medias
H
0
:
1
=
2
=
3
=
4
=
El modelo completo representa la hiptesis alternativa:
H
a
:
i
=
k
i = k
El investigador debe determinar cul de los dos modelos
describe mejor a los datos en el experimento.
Diseo de experimentos p. 24/111
Diseo completamente al azar, un factor
y
ij
= +
ij
y
ij
=
i
+
ij
Diseo de experimentos p. 25/111
Diseo completamente al azar, un factor
Pregunta de investigacin: Hay ms crecimiento bacterial
con algunos mtodos de empacado que con otros?
Pregunta estadstica: Cul modelo describe mejor los
resultados del experimento?
Se requiere un mtodo para estimar los parmetros de los dos
modelos y con base en algun criterio objetivo determinar cul
modelo o hiptesis estadstica se ajusta mejor a los datos del
experimento.
Diseo de experimentos p. 26/111
Diseo completamente el azar, un factor
Los estimadores de mnimos cuadrados son aquellos que
resultan de minimizar la suma de cuadrados de los errores
experimentales.
Si los errores experimentales son independientes con media
cero y varianzas homogneas, los estimadores de mnimos
cuadrados son insesgados y tienen varianza mnima.
Nota. El muestreo aleatorio en los estudios observacionales y
la aleatorizacin en los experimentales aseguran la suposicin
de independencia.
Diseo de experimentos p. 27/111
Estimadores para el modelo completo
y
ij
=
i
+
ij
i = 1, . . . , t j = 1, . . . , r

ij
= y
ij

i
SSE
c
=
t

i=1
r

j=1

2
ij
=
t

i=1
r

j=1
(y
ij

i
)
2
La SSE
c
es una medida de qu tan bien se ajusta el modelo a
los datos.
Queremos determinar los estimadores
i
tales que se
minimice esta SSE
c
.
Vamos a tener t ecuaciones normales, una para cada
tratamiento, encontradas a partir de derivar la SSE
c
con
respecto a cada
i
e igualarlas a cero.
Diseo de experimentos p. 28/111
Estimadores para el modelo completo
Para una i:

i
r

j=1
(y
ij

i
)
2
= 2
r

j=1
(y
ij

i
)
igualando a cero
2
r

j=1
(y
ij

i
) = 0
r

j=1
y
ij
r
i
= 0

i
=

r
j=1
y
ij
r
= y
i.
Diseo de experimentos p. 29/111
Estimadores para el modelo completo
Por lo tanto,

i
= y
i
i = 1, . . . , t
Entonces,
SSE
c
=
t

i=1
r

j=1
(y
ij

i
)
2
=
t

i=1
r

j=1
(y
ij
y
i.
)
2
=
t

i=1
_
_
r

j=1
(y
ij
y
i.
)
2
_
_
Diseo de experimentos p. 30/111
Estimadores para el modelo completo
La varianza muestral del i-simo tratamiento es:
S
2
i
=

r
j=1
(y
ij
y
i.
)
2
r 1
es una estimador de
2
de los datos del i-simo grupo.
S
2
=

t
i=1
_

r
j=1
(y
ij
y
i.
)
2
_
t(r 1)
=
SSE
c
t(r 1)
es un estimador combinado (pooled) de
2
de todos los
datos del experimento.
Es un buen estimador si podemos hacer la suposicin de que

2
es homognea en todos los grupos.
Diseo de experimentos p. 31/111
Estimadores para el modelo completo
Para los datos del ejemplo:
tratamiento comercial vaco mezcla CO2
7.66 5.26 7.41 3.51
6.98 5.44 7.33 2.91
7.80 5.80 7.04 3.66

i
= y
i.
7.48 5.50 7.26 3.36

r
j=1
(y
ij
y
i.
)
2
0.3848 0.1512 0.0758 0.3150
SSE
c
= 0.3848 + 0.1512 + 0.0758 + 0.3150 = 0.9268
S
2
=
SSE
c
t(r 1)
=
0.9268
4(2)
= 0.11585
Diseo de experimentos p. 32/111
Estimadores para el modelo reducido
y
ij
= +
ij

ij
= y
ij

SSE
r
=
t

i=1
r

j=1

2
ij
=
t

i=1
r

j=1
(y
ij
)
2

i=1
r

j=1
(y
ij
)
2
= 2
t

i=1
r

j=1
(y
ij
)
igualando a cero
t

i=1
r

j=1
=
t

i=1
r

j=1
y
ij
rt = y
..
=
y
..
rt
= y
..
Diseo de experimentos p. 33/111
Estimadores para el modelo reducido
Entonces,
SSE
r
=
t

i=1
r

j=1
(y
ij
)
2
=
t

i=1
r

j=1
(y
ij
y
..
)
2
Para el ejemplo,
= y
..
=
70.80
12
= 5.90
Diseo de experimentos p. 34/111
Modelo reducido Modelo completo
y
ij
= +
ij
y
ij
=
i
+
ij
Observado Estimado Diferencia Estimado Diferencia
Tratamiento y (y
ij
)
i
(y
ij

i
)
Comercial 7.66 5.90 1.76 7.48 0.18
6.98 5.90 1.08 7.48 -0.50
7.80 5.90 1.90 7.48 0.32
Vaco 5.26 5.90 -0.64 5.50 -0.24
5.44 5.90 -0.46 5.50 -0.06
5.80 5.90 -0.10 5.50 0.30
Mezcla 7.41 5.90 1.51 7.26 0.15
7.33 5.90 1.43 7.26 0.07
7.04 5.90 1.14 7.26 -0.22
CO2 3.51 5.90 -2.39 3.36 0.15
2.91 5.90 -2.99 3.36 -0.45
3.66 5.90 -2.24 3.36 0.30
SSE
r
= 33.7996 SSE
c
= 0.9268
Diseo de experimentos p. 35/111
Diseo completamente al azar, un factor
Siguiendo con el ejemplo:
Modelo completo y
ij
=
i
+
ij
SSE
c
=

j
(y
ij
y
i.
)
2
= 0.9268
Modelo reducido y
ij
= +
ij
SSE
r
=

j
(y
ij
y
..
)
2
= 33.7996
Diferencia:
SSE
r
SSE
c
=

j
(y
ij
y
..
)
2

j
(y
ij
y
i.
)
2
haciendo lgebra
=

j
( y
i.
y
..
)
2
= r

i
( y
i.
y
..
)
2
En el ejemplo: SSE
r
SSE
c
= 32.8728
Diseo de experimentos p. 36/111
Diseo completamente al azar, un factor
SSE
r
SSE
c
= SS
t
suma de cuadrados de tratamientos.
Representa la reduccin en SSE al haber incluido
tratamientos en el modelo, tambin se le conoce como
reduccin en suma de cuadrados debida a tratamientos.
Llamaremos SS
total
= SSE
r
ya que es la suma de cuadrados
de las diferencias de cada observacin y la media general y
..
Entonces, tenemos la particin:
SS
total
= SS
t
+SSE
c

j
(y
ij
y
..
)
2
=

j
( y
i.
y
..
)
2
+

j
(y
ij
y
i.
)
2
desviacin de la desviacin de la desviacin de la
observacin ij media del grupo observacin ij
con respecto a con respecto a con respecto a
la media general la media general la media de su grupo
Diseo de experimentos p. 37/111
Diseo completamente al azar, un factor

j
(y
ij
y
..
)
2
=

j
[(y
ij
y
i.
) + ( y
i.
y
..
)]
2
=

j
(y
ij
y
i.
)
2
+

j
( y
i.
y
..
)
2
+2

j
(y
ij
y
i.
)( y
i.
y
..
)

j
(y
ij
y
i.
)( y
i.
y
..
) =

i
( y
i.
y
..
)

j
(y
ij
y
i.
)
=

i
( y
i.
y
..
)(y
i.
r y
i.
) = 0
Diseo de experimentos p. 38/111
Diseo completamente al azar, un factor
Grados de libertad. Representan el nmero de piezas de
informacin independientes en las sumas de cuadrados.
En general, es el nmero de observaciones menos el nmero
de parmetros estimados de los datos.
Sea n = rt, el tamao de muestra total.
As, SS
total
=

t
i

r
j
(y
ij
y
..
)
2
donde y
..
es el estimador de
, tiene n 1 g.l.
SSE =

t
i

r
j
(y
ij
y
i.
)
2
se estimaron t parmetros
(
1
,
2
, . . . ,
t
) por lo tanto tiene n t g.l.
SS
t
= SS
total
SSE = (n 1) (n t) = t 1 g.l.
Diseo de experimentos p. 39/111
Tabla de Anlisis de Varianza
ANOVA
F.V. g.l. SS CM
Tratamientos t 1 SS
t
CM
t
= SS
t
/t 1
Error n t SSE CME = SSE/n t =
2
Total n 1 SS
total
Se puede demostrar que:
E (CME) =
2
E (CM
t
) =
2
+
1
t 1
t

i=1
r(
i
)
2
; =

i
/t
Diseo de experimentos p. 40/111
Tabla de Anlisis de Varianza
Si suponemos
ij
NID(0,
2
) i = 1, . . . , t j = 1, . . . , r
en el modelo completo y
ij
=
i
+
ij
Entonces, y
ij
NID(
i
,
2
).
Se puede demostrar que:
SS
total

2
=

j
(y
ij
y
..
)
2

2

2
n1
SSE

2
=

j
(y
ij
y
i.
)
2

2

2
nt
Cuando H
0
:
1
=
2
= . . . =
t
es cierta
SS
t

2
=

i
r( y
i.
y
..
)
2

2

2
t1
Diseo de experimentos p. 41/111
Tabla de Anlisis de Varianza
Por el Teorema de Cochran (Montgomery, 2001, pg. 69), SS
t
y SSE son independientes, por lo tanto cuando H
0
es cierta,
F
0
=
SS
t
/
2
(t 1)
SSE/
2
(n t)
=
CM
t
CME
F
t1,nt
Adems, E (CM
t
) =
2
+
2
t
=
2
cuando
2
t
= 0 que es
cuando H
0
es cierta. Es decir,
E (CM
t
) = E (CME) cuando H
0
es cierta
E (CM
t
) > E (CME) cuando H
0
no es cierta
Entonces, si CM
t
> CME, o sea, valores grandes de F
0
llevan a rechazar la hiptesis nula H
0
:
1
=
2
= . . . =
t
.
Por lo tanto, la regin de rechazo es:
F
0
> F

t1,nt
Diseo de experimentos p. 42/111
Tabla de Anlisis de Varianza
ANOVA
F.V. g.l. SS CM F E(CM)
Tratamientos t 1 SS
t
CM
t
=
SS
t
t1
CM
t
CME

2
+
2
t
Error n t SSE CME =
SSE
nt

2
Total n 1 SS
total
SS
t
=
t

i=1
r ( y
i.
y
..
)
2
SSE =
t

i=1
r

j=1
(y
ij
y
i.
)
2
SS
total
=
t

i=1
r

j=1
(y
ij
y
..
)
2
Diseo de experimentos p. 43/111
Tabla de Anlisis de Varianza
En el ejemplo de empacado de carne:
F.V. g.l. SS CM F Pr > F
trat 3 32.8728 10.958 94.55 0.000
error 8 0.9268 0.1159
total 11 33.7996
Por lo tanto, se rechaza la hiptesis H
0
:
1
=
2
= . . . =
4
,
es decir, hay algn mtodo de empaque que tiene diferente
comportamiento en promedio.
Diseo de experimentos p. 44/111
Diseo completamente al azar, un factor
Se quieren comparar t niveles de un factor, lo que implica t
tratamientos y se dispone de n
i
u.e. para el tratamiento i,
i = 1, . . . , t. Hay dos situaciones:
1. Los t tratamientos son escogidos especcamente por el
investigador. En esta situacin deseamos probar hiptesis
acerca de las medias de los tratamientos y nuestras
conclusiones se aplicarn solamente a los niveles del
factor considerados en el anlisis. Las conclusiones no se
pueden extender a tratamientos similares que no fueron
explcitamente considerados. Este es el modelo de
efectos jos.
2. Los t tratamientos son una muestra aleatoria de una
poblacin de tratamientos. En esta situacin nos gustara
poder extender las conclusiones (las cuales estn basadas
en la muestra de tratamientos considerada) a todos los
tratamientos de la poblacin. Este es el modelo de
efectos aleatorios.
Diseo de experimentos p. 45/111
Diseo completamente al azar, un factor
A las cantidades n
1
, n
2
, . . . , n
t
se les llama repeticiones de
cada tratamiento.
Si n
i
= r i se dice que el diseo es balanceado.
y
ij
es la respuesta de la u.e. j del tratamiento i,
i = 1, . . . , t j = 1, . . . , n
i
.
Diseo de experimentos p. 46/111
Diseo completamente al azar
Estructura de los datos.
tratamientos
1 2 3 ... t
y
11
y
21
y
31
... y
t1
y
12
y
22
y
32
... y
t2
y
13
y
23
y
33
... y
t3
. . . ... .
. . . ... .
. . . ... .
y
1n
1
y
2n
2
y
3n
3
... y
tn
t
y
1.
y
2.
y
3.
... y
t.
totales
y
1.
y
2.
y
3.
... y
t.
medias
Diseo de experimentos p. 47/111
Diseo completamente al azar
n =
t

i=1
n
i
y
i.
=
n
i

j=1
y
ij
i = 1, . . . , t total tratamiento i
y
i.
=

n
i
j=1
y
ij
n
i
i = 1, . . . , t media tratamiento i
y
..
=
t

i=1
n
i

j=1
y
ij
=
t

i=1
y
i.
total de las observaciones
y
..
=
y
..
n
media general
Diseo de experimentos p. 48/111
Diseo completamente al azar
Se tienen t muestras aleatorias independientes de tamaos
n
1
, n
2
, . . . , n
t
respectivamente.
y
11
, y
12
, . . . , y
1n
1
es una muestra aleatoria de N(
1
,
2
)
y
21
, y
22
, . . . , y
2n
2
es una muestra aleatoria de N(
2
,
2
)
y
t1
, y
t2
, . . . , y
tn
t
es una muestra aleatoria de N(
t
,
2
)
Diseo de experimentos p. 49/111
Diseo completamente al azar
Las observaciones en cada una de estas muestras se pueden
representar por el modelo lineal simple
y
ij
=
i
+
ij
i = 1, . . . , t j = 1, . . . , n
i
con
ij
error experimental en la observacin j-sima del
tratamiento i-simo.
Estamos suponiendo independencia entre y dentro de las
muestras, es decir,
ij
son independientes y
ij
N(0,
2
).
Diseo de experimentos p. 50/111
Diseo completamente al azar
Otra forma de verlo
Como suponemos que las u.e. son homogneas, es decir, el
promedio de respuesta de todas las u.e. es el mismo () antes
de aplicar los tratamientos, y si se observan en condiciones
similares, las respuestas las podemos modelar como
y
ij
= +
ij
Diseo de experimentos p. 51/111
Modelo de efectos
Entonces al aplicar el tratamiento i-simo a un grupo (de
tamao n
i
) de u.e. se introduce un efecto (
i
) de ese
tratamiento en las variables por observar.
El modelo se puede escribir como:
Modelo de efectos
y
ij
= +
i
+
ij
i = 1, . . . , t j = 1, . . . , n
i
donde
es la media general, comn a todas las u.e.

i
es el efecto del tratamiento i-simo
Diseo de experimentos p. 52/111
Modelo de efectos
Diseo de experimentos p. 53/111
Modelo de efectos
El modelo de efectos implica que se empieza el experimento
con u.e. con la misma capacidad de respuesta () y con la
misma varianza (
2
).
La aplicacin de los tratamientos tiene el efecto de alterar las
medias, que ahora son
i
= +
i
, pero supone que no se
modican las varianzas.
En este caso, la hiptesis a probar es:
H
0
:
1
=
2
= . . . =
t
= 0
H
a
:
i
= 0 para al menos una i
Diseo de experimentos p. 54/111
Modelo de efectos
Estimadores de mnimos cuadrados:
y
ij
= +
i
+
ij
i = 1, . . . , t j = 1, . . . , n
i
SSE =
t

i=1
n
i

j=1

2
ij
=
t

i=1
n
i

j=1
(y
ij

i
)
2

i=1
n
i

j=1
(y
ij

i
)
2
= 2
t

i=1
n
i

j=1
(y
ij

i
)

i
t

i=1
n
i

j=1
(y
ij

i
)
2
= 2
n
i

j=1
(y
ij

i
) i = 1, . . . , t
Diseo de experimentos p. 55/111
Modelo de efectos
Igualando a cero:
t

i=1
n
i

j=1
y
ij
= n +
t

i=1
n
i

i
n
1

j=1
y
1j
= n
1
+n
1

1
n
2

j=1
y
2j
= n
2
+n
2

2
. . . . . .
n
t

j=1
y
tj
= n
t
+n
t

t
Las ecuaciones normales no son linealmente independientes,
por lo tanto no hay una solucin nica. Esto ocurre porque el
modelo de efectos est sobreparametrizado.
Diseo de experimentos p. 56/111
Modelo de efectos
Se aade una ecuacin linealmente independiente:
a)

t
i=1

i
= 0
= y
..

i
= y
i.
y
..
i = 1, . . . , t
b) = 0
= 0

i
= y
i.
i = 1, . . . , t
c)
1
= 0
= y
1.

i
= y
i.
y
1.
i = 2, . . . , t
Diseo de experimentos p. 57/111
Modelo de efectos
Hay un nmero innito de posibles restricciones que se
pueden usar para resolver las ecuaciones normales. Entonces
Cul usar?
No importa ya que en cualquier caso

+
i
= y
i.
Aunque no podemos obtener estimadores nicos de los
parmetros del modelo de efectos, podemos obtener
estimadores nicos de funciones de estos parmetros.
A estas funciones se les llama funciones lineales
linealmente estimables.
Diseo de experimentos p. 58/111
Diseo completamente al azar, Tabla de ANOVA
F.V. g.l. SS CM F E(CM)
Tratamientos t 1 SS
t
CM
t
=
SS
t
t1
CM
t
CME

2
+

i
n
i
(
i
)
2
t1
Error n t SSE CME =
SSE
nt

2
Total n 1 SS
total
SS
t
=
t

i=1
n
i
( y
i.
y
..
)
2
=
t

i=1
y
2
i.
n
i

y
2
..
n
SSE =
t

i=1
n
i

j=1
(y
ij
y
i.
)
2
=
t

i=1
n
i

j=1
y
2
ij

t

i=1
y
2
i.
n
i
SS
total
=
t

i=1
n
i

j=1
(y
ij
y
..
)
2
=
t

i=1
n
i

j=1
y
2
ij

y
2
..
n
n =
t

i=1
n
i
Diseo de experimentos p. 59/111
Intervalos de conanza

i
= y
i.
S
2
y
i.
=
S
2
n
i
con S
2
= CME =
2
S
y
i.
=
_
CME
n
i
Como suponemos que
y
ij
N
_

i
,
2
_
entonces
y
i.
N
_

i
,
2
/n
i
_
como estimamos la varianza:
y
i.

i
S
y
i.
t
nt
Por lo tanto, un intervalo del (1 )100% de conanza para
i
es
y
i.
t
1/2
nt
(S
y
i.
)
Diseo de experimentos p. 60/111
Contrastes
En el ejemplo del empacado de carne tenamos:
Comercial Al vaco CO,O2,N CO2

i
= y
i.
7.48 5.50 7.26 3.36
S
2
= CME = 0.116 con 8 g.l.
Una vez que rechazamos la hiptesis H
0
:
1
=
2
=
3
=
4
Qu sigue?
Diseo de experimentos p. 61/111
Contrastes
Se podran contestar preguntas como:
I
Es ms efectiva la creacin de una atmsfera articial que el
aire ambiente con plstico para reducir el crecimiento de
bacterias?
I
Son ms efectivos los gases que el vaco?
I
Es ms efectivo el tratamiento de CO2 puro que la mezcla
CO,O2 y N?
Un contraste es una funcin lineal de los parmetros
i
denido como
C =
t

i=1
k
i

i
= k
1

1
+k
2

2
+. . . +k
t

t
donde

t
i=1
k
i
= 0.
Diseo de experimentos p. 62/111
Contrastes
Los contrastes para las preguntas anteriores son:
I
comercial vs. atmsfera articial
C
1
=
1

1
3
(
2
+
3
+
4
)
I
vaco vs. gases
C
2
=
2

1
2
(
3
+
4
)
I
mezcla de gases vs. CO2 puro
C
3
=
3

4
Diseo de experimentos p. 63/111
Contrastes
El estimador del contraste
C =
t

i=1
k
i

i
es

C =
t

i=1
k
i

i
=
t

i=1
k
i
y
i.
Si suponemos que
y
ij
N
_

i
,
2
_
entonces
y
i.
N
_

i
,
2
/n
i
_
Por lo tanto,

C =
t

i=1
k
i
y
i.
N
_
t

i=1
k
i

i
,
2
t

i=1
k
2
i
n
i
_
Diseo de experimentos p. 64/111
Contrastes
Ya que:
E
_
t

i=1
k
i
y
i.
_
=
t

i=1
k
i
E ( y
i.
) =
t

i=1
k
i

i
V
_
t

i=1
k
i
y
i.
_
=
..
m.indep
t

i=1
k
2
i
V ( y
i.
) =
t

i=1
k
2
i

2
n
i
=
2
t

i=1
k
2
i
n
i

V
_

C
_
=
2
t

i=1
k
2
i
n
i
= CME
t

i=1
k
2
i
n
i
Diseo de experimentos p. 65/111
Contrastes
Entonces,

t
i=1
k
i
y
i.

t
i=1
k
i

i
_
CME

t
i=1
k
2
i
/n
i
t
g.l.error
De aqu un intervalo del 100(1 )% de conanza para el
contraste C es:

C t
1/2
g.l.error

_
CME
t

i=1
k
2
i
/n
i
Diseo de experimentos p. 66/111
Contrastes
Adems,

C C
_

t
i=1
k
2
i
/n
i
N (0, 1)
Si H
0
:

t
i=1
k
i

i
= 0, es decir, H
0
: C = 0 es cierta, entonces,

C
2

t
i=1
k
2
i
/n
i

2
1
Sea
SS
c
=

C
2

t
i=1
k
2
i
/n
i
entonces
SS
c
/
2
SSE/
2
(n t)
=

C
2
/

t
i=1
k
2
i
/n
i
CME
F
1,nt
Por lo tanto, para probar H
0
: C = 0 se rechaza si F
c
> F

1,nt
Diseo de experimentos p. 67/111
Contrastes
El nmero de contrastes que se pueden hacer es muy grande,
sin embargo, esta tcnica tiene su mayor utilidad cuando se
aplica a comparaciones planeadas antes de realizar el
experimento.
Una clase de contrastes, conocida como Contrastes
ortogonales (como son los del ejemplo anterior) tienen
propiedades especiales con respecto a la particin de sumas
de cuadrados y grados de libertad y con respecto a su relacin
entre ellos. La ortogonalidad implica que un contraste no
aporta informacin acerca de otro.
Dos contrastes, con coecientes {k
i
}, {l
i
} son ortogonales si
t

i=1
k
i
l
i
n
i
= 0
Diseo de experimentos p. 68/111
Contrastes
Para t tratamientos existe un conjunto de t 1 contrastes
ortogonales, los cuales hacen una particin de la suma de
cuadrados de tratamientos en t 1 componentes
independientes, cada uno con 1 g.l. Por lo tanto las pruebas
realizadas con contrastes ortogonales son independientes.
En el ejemplo anterior, los contrastes son ortogonales.
k
1
k
2
k
3
k
4
C
1
1 -1/3 -1/3 -1/3
C
2
0 1 -1/2 -1/2
C
3
0 0 1 -1
Diseo de experimentos p. 69/111
ANOVA
La tabla de ANOVA incorporando las pruebas de hiptesis de
los 3 contrastes es:
F.V. g.l. SS CM F Pr > F
trat 3 32.8728 10.958 94.55 0.000
C
1
1 10.01 10.01 86.29 0.000
C
2
1 0.07 0.07 0.62 0.453
C
3
1 22.82 22.82 196.94 0.000
error 8 0.9268 0.1159
total 11 33.7996
Se rechaza H
0
:
1
=
2
=
3
=
4
Se rechaza H
01
:
1
=
1
3
(
2
+
3
+
4
)
No se rechaza H
02
:
2
=
1
2
(
3
+
4
)
Se rechaza H
03
:
3
=
4
SS
C1
=

C
1
2
1
r

4
i=1
k
2
i
=
(2.11)
2
1
2
+3(1/3)
2
3
=
4.4521
0.4444
= 10.01
Diseo de experimentos p. 70/111
Otro ejemplo
Los siguientes datos son los tiempos de coagulacin de
sangre para 24 animales que fueron aleatoriamente asignados
a una de cuatro dietas (A,B,C,D)
Dieta A Dieta B Dieta C Dieta D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
66 68 64
63
59
Diseo de experimentos p. 71/111
Otro ejemplo
I
Pruebe la hiptesis de igualdad de medias
H
0
:
1
=
2
=
3
=
4
.
I
Pruebe el siguiente contraste: (pendiente)
El promedio de la dieta A y B es igual al promedio de la C y
D
El anlisis en R:
I
Los datos estn en el archivo coag.txt
I
El programa est en anova_coag.txt
Diseo de experimentos p. 72/111
Comparaciones mltiples
En muchas situaciones prcticas, se desea comparar pares de
medias. Podemos determinar cules medias dieren probando
las diferencias entre todos los pares de medias de
tratamientos.
Es decir, estamos interesados en contrastes de la forma
=
i

j
i = j
Lo primero que se nos viene a la mente es hacer una prueba t
para cada par de medias, es decir, probar
H
0
:
i
=
j
H
a
:
i
=
j
i = j
Diseo de experimentos p. 73/111
Comparaciones mltiples
Si suponemos varianzas iguales, se tiene la estadstica de
prueba
t
c
=
y
i.
y
j.
s
p
_
1
n
i
+
1
n
j
y se rechaza H
0
al nivel de signicancia si
t
c
t
/2
n
i
+n
j
2
t
c
t
1/2
n
i
+n
j
2
Esto es equivalente a decir que se rechaza H
0
si
|t
c
| =
| y
i.
y
j.
|
s
p
_
1
n
i
+
1
n
j
> t
1/2
n
i
+n
j
2
o equivalente a
| y
i.
y
j.
| > t
1/2
n
i
+n
j
2
s
p

1
n
i
+
1
n
j
Diseo de experimentos p. 74/111
Comparaciones mltiples
Esta prueba conocida como Diferencia Mnima Signicativa
(DMS LSD) en el contexto de ANOVA, lo que hace es
comparar el valor absoluto de la diferencia de cada par de
medias con DMS:
Si
| y
i.
y
j.
| > DMS = t
1/2
glerror

CME
_
1
n
i
+
1
n
j
_
se rechaza H
0
:
i
=
j
.
CME es el cuadrado medio del error que es una estimacin
ponderada de la varianza basada en t estimaciones de la
varianza.
El utilizar este procedimiento no es conveniente por que el
nivel de signicancia global, es decir, para el conjunto de todas
las pruebas, resulta muy superior al nivel de signicancia ()
planeado.
Diseo de experimentos p. 75/111
Comparaciones mltiples
Por ejemplo, si se tienen 4 medias de tratamientos, entonces
se tienen
_
4
2
_
=
4!
2!2!
= 6
pares a comparar, es decir, 6 pruebas de hiptesis a realizar,
con lo que se pueden cometer 0, 1, 2, 3, 4, 5, 6 errores Tipo I,
si todas las medias son iguales.
Se dene otra forma de error tipo I basado en los riesgos
acumulados asociados a la familia de pruebas bajo
consideracin.
Este es el error tipo I del experimento
E
que es el riesgo de
cometer el error tipo I al menos una vez.
La probabilidad de error tipo I del experimento puede
evaluarse para una familia de pruebas independientes.
Diseo de experimentos p. 76/111
Comparaciones mltiples
Sin embargo, todas las pruebas a pares usando la DMS no
son independientes, puesto que el CME es el mismo en cada
una de las estadsticas de prueba y el numerador contiene las
mismas medias en varias de las estadsticas de prueba.
An as, se puede evaluar el lmite superior de la probabilidad
de error tipo I del experimento, suponiendo n pruebas
independientes.
Suponga que la H
0
es cierta para cada una de las n =
_
t
2
_
pruebas y que son independientes.
Sea
c
= P(error tipo I) en una sola prueba (comparacin)
con (1
c
) = P(decisin correcta).
Diseo de experimentos p. 77/111
Comparaciones mltiples
La probabilidad de cometer x errores tipo I est dada por la
distribucin binomial como:
P(X = x) =
_
n
x
_

x
c
(1
c
)
nx
P(X = x) =
n!
(n x)!x!

x
c
(1
c
)
nx
x = 0, 1, 2, . . . , n
La probabilidad de no cometer ningn error tipo I es
P(X = 0) = (1
c
)
n
Diseo de experimentos p. 78/111
Comparaciones mltiples
La probabilidad de cometer al menos 1 error tipo I es
P(X 1) = 1 P(X = 0) = 1 (1
c
)
n
es decir, la mxima probabilidad de cometer al menos un error
tipo I entre las n comparaciones es:

E
= 1 (1
c
)
n
de aqu

c
= 1 (1
E
)
1/n
Diseo de experimentos p. 79/111
Comparaciones mltiples
# de pruebas
E
cuando
c
cuando
indep. n
c
= 0.05
E
= 0.05
1 0.05 0.05
2 0.098 0.025
3 0.143 0.017
4 0.185 0.013
5 0.226 0.010
10 0.401 0.005
Por el razonamiento anterior es que han surgido una serie de
pruebas de diferentes autores para hacer comparaciones
mltiples tratando de mantener la
P(error tipo I del experimento) =
Diseo de experimentos p. 80/111
Bonferroni

E
n
c
n comparaciones, la igualdad se d cuando las pruebas son
independientes.
Entonces,

c
=
E
/n
Si queremos
E
= 0.05 entonces,
c
= 0.05/n y se hacen las
pruebas t para los pares de medias con un nivel de
signicancia
c
en cada una de ellas.
Diseo de experimentos p. 81/111
Tukey
Conocida como la prueba de la Diferencia Mnima Signicativa
Honesta (DMSH)
DMSH = q

t,glerror
_
CME
r
si n
i
= r i
DMSH = q

t,glerror

CME
2
_
1
n
i
+
1
n
j
_
Si | y
i.
y
j.
| > DMSH se rechaza H
0
:
i
=
j
.
q

1
,
2
se obtiene de las "tablas de rangos estudentizados".
Diseo de experimentos p. 82/111
Tukey
Para el ejemplo del empaque de carne:
Comercial Al vaco CO,O2,N CO2
y
i.
7.48 5.50 7.26 3.36
S
2
= CME = 0.116 con 8g.l. t = 4, r = 3
DMSH = q
0.05
4,8
_
0.116
3
= (4.53)(0.197) = 0.891
| y
1.
y
2.
| = 1.98

| y
1.
y
3.
| = 0.22
| y
1.
y
4.
| = 4.12

| y
2.
y
3.
| = 1.76

| y
2.
y
4.
| = 2.14

| y
3.
y
4.
| = 3.90

Diseo de experimentos p. 83/111


Student-Newman-Keuls (SNK)
Se calcula un conjunto de valores crticos
k
p
= q

p,f
S
y
i.
p = 2, 3, . . . , t
donde q

p,f
es el percentil 1 de la distribucin del rango
estudentizado para el nmero p de medias involucradas en la
comparacin y f g.l. del error, y S
y
i.
=
_
CME
r
Para el ejemplo de la carne empacada:
p 2 3 4
q
.05
p,8
3.26 4.04 4.53
k
p
0.642 0.796 0.892
Diseo de experimentos p. 84/111
Student-Newman-Keuls (SNK)
Comercial Al vaco CO,O2,N CO2
y
i.
7.48 5.50 7.26 3.36
Medias ordenadas:
y
4.
= 3.36 y
2.
= 5.50 y
3.
= 7.26 y
1.
= 7.48
| y
4.
y
1.
| = 4.12 > k

4
| y
4.
y
3.
| = 3.90 > k

3
| y
4.
y
2.
| = 2.14 > k

2
| y
2.
y
1.
| = 1.98 > k

3
| y
2.
y
3.
| = 1.76 > k

2
| y
3.
y
1.
| = 0.22 < k
2
(N.S.)
Diseo de experimentos p. 85/111
Duncan
Es similar a la de SNK. Los promedios de los t tratamientos se
ordenan en forma ascendente y el error estndar de cada
promedio se determina con
S
y
i.
=
_
CME
r
si n
i
= r i
Para muestras de diferente tamao, se reemplaza la r por la
media armnica (n
h
) de los {n
i
}
n
h
=
t

t
i=1
_
1
n
i
_
Diseo de experimentos p. 86/111
Duncan
De las tablas de Duncan de rangos signicativos se obtienen
los valores de r

p,f
para p = 2, 3, . . . , t.
p es el nmero de medias involucradas en la comparacin,
es el nivel de signicancia y f los grados de libertad del error.
Se calculan
R
p
= r

p,f
S
y
i.
p = 2, 3, . . . , t
Para el ejemplo de la carne empacada:
p 2 3 4
r
.05
p,8
3.26 3.39 3.47
R
p
0.642 0.668 0.684
Diseo de experimentos p. 87/111
Duncan
Comercial Al vaco CO,O2,N CO2
y
i.
7.48 5.50 7.26 3.36
Medias ordenadas:
y
4.
= 3.36 y
2.
= 5.50 y
3.
= 7.26 y
1.
= 7.48
| y
4.
y
1.
| = 4.12 > R

4
| y
4.
y
3.
| = 3.90 > R

3
| y
4.
y
2.
| = 2.14 > R

2
| y
2.
y
1.
| = 1.98 > R

3
| y
2.
y
3.
| = 1.76 > R

2
| y
3.
y
1.
| = 0.22 < R
2
(N.S.)
Diseo de experimentos p. 88/111
Dunnett
Para comparar las medias de los tratamientos con la media del
tratamiento control.
Suponga que el tratamiento t es el control, queremos probar
las hiptesis
H
0
:
i
=
t
H
a
:
i
=
t
i = 1, 2, . . . , t 1
H
0
:
i
=
t
se rechaza si
| y
i.
y
t.
| > D = d

(t 1, glerror)
_
CME
r
con d

(k, ) es el percentil 1 de las tablas de Dunnett.


Para el ejemplo de la carne empacada, el tratamiento 1 es el
control.
Comercial Al vaco CO,O2,N CO2
y
i.
7.48 5.50 7.26 3.36
Diseo de experimentos p. 89/111
Dunnett
d
0.05,3,8
= 2.42
D = 2.42
_
_
CME
r
_
= 0.477
| y
2.
y
1.
| = 1.98 > D

| y
3.
y
1.
| = 0.22 < D(N.S.)
| y
4.
y
1.
| = 4.12 > D

Diseo de experimentos p. 90/111


Scheff
Scheff (1953) propuso un mtodo para probar todos los
posibles contrastes.
Considere cualquier contraste
C =
t

i=1
k
i

i
estimado con

C =
t

i=1
k
i
y
i.
con error estndar
S
C
=

_
CME
_
t

i=1
k
2
i
n
i
_
La hiptesis nula pra el contraste H
0
: C = 0 se rechaza si
|C| > S(
E
)
donde
S(
E
) = S
C
_
(t 1)F

E
t1,g.l.error
Diseo de experimentos p. 91/111
Anlisis de residuales
Tenemos el modelo
y
ij
=
i
+
ij
y
ij
= +
i
+
ij

ij
NID
_
0,
2
_
Suposiciones:
I
errores normales
I
independientes
I
varianza constante
La prueba F del anlisis de varianza es robusta a falta de
normalidad.
Diseo de experimentos p. 92/111
Anlisis de residuales
Si los errores experimentales estn correlacionados, el error
estndar estar mal estimado. La independencia se justica
aleatorizando las u.e. a los tratamientos en experimentos y
seleccionando muestras aleatorias en estudios
observacionales.
Si no hay homogeneidad de varianzas el estimador de
2
es
malo, aunque se ha visto en estudios que si el diseo es
balanceado no efecta mucho. Tambin si los tamaos de
muestra mayores corresponden a las poblaciones con mayor
varianza.
Diseo de experimentos p. 93/111
Anlisis de residuales, Normalidad
Residuales
e
ij
= y
ij
y
ij
y
ij
=

+
i
=
i
= y
i.
e
ij
= y
ij
y
i.
I
Prueba no parmetrica ( Kolmogorov-Smirnov )
I
Histograma (muestras grandes)
I
grca en papel normal
I
anlisis de residuales estandarizados para detectar outliers.
Si
ij
N(0,
2
) entonces

ij
0

N(0, 1). Sean


d
ij
=
e
ij

CME
, esperamos que:
68% de los residuales estandarizados estn entre -1 y 1
95 % estn entre -2 y 2
Virtualmente todos estn entre -3 y 3.
Diseo de experimentos p. 94/111
Anlisis de residuales, Homogeneidad de varianzas
Prueba de Bartlett
H
0
:
2
1
=
2
2
= . . . =
2
t
H
a
: no H
0
Estadstica de Prueba:
U =
1
C
_
(n t)ln(
2
)

i
(n
i
1)ln(
2
i
)
_
donde
2
=

i
(n
i
1)
2
i
n t

2
i
=

j
(y
ij
y
i.
)
2
n
i
1
C = 1 +
1
3(t 1)
_

i
1
n
i
1

1
n t
_
H
0
se rechaza si U >
2
,t1
(prueba sensible a falta de
normalidad)
Diseo de experimentos p. 95/111
Anlisis de residuales, Homogeneidad de varianzas
Prueba de Levene
Se calcula
d
ij
= |y
ij
y
i.
| i = 1, . . . , t j = 1, . . . , n
i
donde y
i.
es la mediana de las observaciones en el
tratamiento i.
Se evala si el promedio de estas observaciones d
ij
es igual
para todos los tratamientos, es decir, se hace un ANOVA para
probar igualdad de medias de d
ij
.
Diseo de experimentos p. 96/111
Prueba de Welch
La prueba F usual es robusta ante heteroscedasticidad
(varianzas diferentes) si los tamaos de muestra son muy
parecidos o, si los tamaos de muestra ms grandes
corresponden a las poblaciones con varianzas ms grandes.
Sin embargo, se han construdo algunas procedimientos de
prueba de igualdad de medias (H
0
:
1
=
2
= . . . =
t
) como
por ejemplo el desarrollado por Welch, conocido como la
prueba de Welch, utilizada cuando no hay homoscedasticidad.
Sean W
i
= n
i
/
2
i
y

i
W
i
y
i.
/

i
W
i
y
=

i
(1 W
i
/W
.
)
2
n
i
1
donde W
.
=

i
W
i
.
Diseo de experimentos p. 97/111
Prueba de Welch
Entonces
F
c
=

i
W
i
( y
i.
y

)
2
t1
1 + 2(t 2)/(t
2
1)
tiene aproximadamente una distribucin F con

1
= t 1 y
2
= (t
2
1)/3 grados de libertad.
H
0
:
1
=
2
= . . . =
t
se rechaza al nivel de signicancia si
F
c
> F

1
,
2
.
Diseo de experimentos p. 98/111
Transformaciones
Se utilizan las transformaciones para cambiar la escala de las
observaciones para que se cumplan las suposiciones del
modelo lineal y dar inferencias vlidas del anlisis de varianza.
Cuando las transformaciones son necesarias, se hace el
anlisis y se hacen las inferencias en la escala transformada
pero se presentan tablas de medias en la escala de medicin
original.
1. Distribucin Poisson. Mediciones que son conteos
(nmero de plantas en cierta rea, insectos en plantas,
accidentes por unidad de tiempo) tienen distribucin Poisson.
La transformacin x =

y +a, a es la adecuada.
Diseo de experimentos p. 99/111
Transformaciones
2. Distribucin binomial. Observaciones del nmero de
xitos en n ensayos independientes tiene distribucin binomial
(proporcin de semillas germinadas, proporcin de plantas
con ores en un transecto). = y/n
La transformacin x = sin
1

es la adecuada.
Las transformaciones del tipo potencia alteran la simetra o
asimetra de las distribuciones de las observaciones.
Si suponemos que la desviacin estndar de y es proporcional
a alguna potencia de la media, es decir,

Una transformacin de las observaciones, del estilo:


x = y
p
Diseo de experimentos p. 100/111
Transformaciones
Da una relacin

x

p+1
Si p = 1 entonces la desviacin estndar de la variable
transformada x ser constante, ya que p + 1 = 0 y
x

0
.
La transformacin de Box-Cox
x = (y
p
1)/p p = 1
x = log
e
y p = 1
El estimador de p se encuentra maximizando
L(p) =
1
2
log
e
[CME(p)]
donde CME(p) es el cuadrado medio del error del anlisis de
varianza usando la transformacin x = (y
p
1)/p para el valor
dado p.
Diseo de experimentos p. 101/111
Transformaciones
Se determina CME(p) para un conjunto de valores de p, se
graca CME(p) vs. p y se toma el valor de p que corresponde
al valor mnimo de CME(p).
JMP calcula la transformacin de Box-Cox, da una grca de p
vs. CME y da la opcin de guardar los datos transformados
en el archivo.
La dicultad de utilizar esta transformacin es la interpretacin.
Diseo de experimentos p. 102/111
Ejemplo
Los siguientes datos son el nmero de errores en un examen
de sujetos bajo la inuencia de dos drogas. El grupo 1 es un
grupo control (sin droga), a los sujetos del grupo 2 se les di la
droga 1, a los del grupo 3 la droga 2 y a los del grupo 4 las dos
drogas.
Grupo 1 Grupo 2 Grupo 3 Grupo 4
(sin droga) (droga 1) (droga 2) (dos drogas)
1 12 12 13
8 10 4 14
9 13 11 14
9 13 7 17
4 12 8 11
1 10 10 14
1 12 13
5 14
Diseo de experimentos p. 103/111
Ejemplo
Correr el ejemplo con SPSS y JMP.
1. Probar homogeneidad de varianzas. (Bartlett y Levene)
2. Hacer prueba de Welch
3. Probar con algunas transformaciones, checando
normalidad y homogeneidad de varianzas
ej2_1_messy.sav
ej2_1_messy.jmp
ej2_1_messy.txt
Diseo de experimentos p. 104/111
Relacin entre Regresin y ANOVA
Cualquier modelo de ANOVA se puede escribir como un
modelo de regresin lineal.
Suponga el ejemplo de la carne empacada
tratamiento comercial vaco mezcla CO2
7.66 5.26 7.41 3.51
6.98 5.44 7.33 2.91
7.80 5.80 7.04 3.66
Un diseo completamente al azar con un solo factor (mtodo
de empacado) con 4 niveles (4 tratamientos) y 3 repeticiones
en cada tratamiento (diseo balanceado).
Diseo de experimentos p. 105/111
Relacin entre Regresin y ANOVA
Modelo ANOVA completamente al azar un solo factor
balanceado:
y
ij
=
i
+
ij
= +
i
+
ij
_
i = 1, 2, 3, 4
j = 1, 2, 3
El modelo de regresin equivalente es:
y
ij
=
0
+
1
x
1j
+
2
x
2j
+
3
x
3j
+
ij
_
i = 1, 2, 3, 4
j = 1, 2, 3
Diseo de experimentos p. 106/111
Relacin entre Regresin y ANOVA
Donde las variables x
1j
, x
2j
, x
3j
estn denidas como:
x
1j
=
_
1 si la observacin j es del tratamiento 1
0 en otro caso
x
2j
=
_
1 si la observacin j es del tratamiento 2
0 en otro caso
x
3j
=
_
1 si la observacin j es del tratamiento 3
0 en otro caso
Diseo de experimentos p. 107/111
Relacin entre Regresin y ANOVA
La relacin entre los parmetros del modelo ANOVA y el
modelo de regresin es:
Si la observacin viene del tratamiento 1, entonces
x
1j
= 1, x
2j
= 0, x
3j
= 0 y el modelo de regresin es
y
1j
=
0
+
1
(1) +
2
(0) +
3
(0) +
1j
=
0
+
1
+
1j
y el modelo ANOVA es:
y
1j
=
1
+
1j
= +
1
+
1j
Por lo tanto:

0
+
1
=
1
= +
1
Diseo de experimentos p. 108/111
Relacin entre Regresin y ANOVA
Similarmente, para las observaciones del tratamiento 2
y
2j
=
0
+
1
(0) +
2
(1) +
3
(0) +
2j
=
0
+
2
+
2j
y la relacin entre los parmetros es:

o
+
2
=
2
= +
2
Lo mismo para las observaciones del tratamiento 3
y
3j
=
0
+
1
(0) +
2
(0) +
3
(1) +
3j
=
0
+
3
+
3j
y la relacin entre los parmetros es:

o
+
3
=
3
= +
3
Diseo de experimentos p. 109/111
Relacin entre Regresin y ANOVA
Finalmente, considere las observaciones del tratamiento 4,
para las cuales el modelo de regresin es:
y
4j
=
0
+
1
(0) +
2
(0) +
3
(0) +
4j
=
0
+
4j
entonces
0
=
4
= +
4
Por lo tanto,

0
=
4

1
=
1

2
=
2

3
=
3

4
Diseo de experimentos p. 110/111
Relacin entre Regresin y ANOVA
Entonces, para probar la hiptesis H
0
:
1
=
2
=
3
=
4
tendramos que probar H
0
:
1
=
2
=
3
= 0, lo cual se puede
hacer con cualquier paquete de cmputo estadstico.
Para el ejemplo de la carne empacada:
tratamiento y x
1
x
2
x
3
1 7.66 1 0 0
1 6.98 1 0 0
1 7.80 1 0 0
2 5.26 0 1 0
2 5.44 0 1 0
2 5.80 0 1 0
3 7.41 0 0 1
3 7.33 0 0 1
3 7.04 0 0 1
4 3.51 0 0 0
4 2.91 0 0 0
4 3.66 0 0 0
Diseo de experimentos p. 111/111
Relacin entre Regresin y ANOVA
Si pedimos una regresin y =
0
+
1
x
1
+
2
x
2
+
3
x
3
+ y
pedimos una tabla de anlisis de varianza del modelo
y
ij
= +
i
+
ij
las dos tablas ANOVA son idnticas.

También podría gustarte