Está en la página 1de 112

Diseo completamente al azar

Diseo de experimentos p. 1/112


Ejemplo

Suponga que tenemos 4 dietas diferentes que queremos


comparar. Las dietas estn etiquetadas A,B,C y D.
Estamos interesados en estudiar si las dietas afectan la tasa
de coagulacin en conejos. La tasa de coagulacin es el
tiempo en segundos que tarda una cortada en dejar de
sangrar.
Tenemos 16 conejos para el experimento, por lo que usaremos
4 en cada dieta.
Los conejos estn en una jaula grande hasta que se inicie el
experimento, momento en que se transferirn a otras jaulas.

Cmo asignamos los conejos a los cuatro grupos


tratamiento?

Diseo de experimentos p. 2/112


Mtodo 1

Supongamos que los conejos se atrapan "al azar". Atrapamos


cuatro conejos y los asignamos a la dieta A. Atrapamos otros
cuatro y los asignamos a la dieta B y as sucesivamente.

Dado que los conejos fueron "atrapados al azar", esto


producir un diseo completamente al azar.

Diseo de experimentos p. 3/112


Mtodo 1

No es necesariamente cierto.

Los primeros cuatro conejos atrapados pueden ser los ms


lentos y dbiles, aquellos menos capaces de escapar. Esto
puede sesgar los resultados.

Si los resultados del experimento dan desventaja a la dieta A,


no habr forma de determinar si los resultados son a
consecuencia de la dieta A o del hecho de haber asignado los
conejos ms dbiles a esa dieta por nuestro "proceso de
aleatorizacin".

Diseo de experimentos p. 4/112


Mtodo 2

Atrape a todos los conejos y etiqutelos del 1 al 16.

Seleccione cuatro nmeros aleatorios (sin reemplazo) del 1 al


16 y ponga los conejos con esa etiqueta en una jaula que
recibir la dieta A.

Entonces, seleccione otros cuatro nmeros aleatorios y ponga


los conejos correspondientes en otra jaula que recibir la dieta
B.

As sucesivamente hasta tener cuatro jaulas con cuatro


conejos en cada una.

Diseo de experimentos p. 5/112


Mtodo 2

No hay repeticiones.

El diseo es un diseo completamente al azar pero no tiene


repeticiones.

Hay 16 conejos, pero los conejos en cada jaula no son


independientes. Si un conejo come mucho, los otros en la
jaula tienen menos para comer.

La unidad experimental es la menor unidad de material


experimental a la cual se le aplica un tratamiento en forma
independiente. En este caso, las jaulas son las unidades
experimentales. Para un diseo completamente al azar con
repeticiones, cada conejo debe estar en su propia jaula.

Diseo de experimentos p. 6/112


Mtodo 3

En una urna ponga las letras A,B,C y D en pedazos de papel


separados.

Atrape un conejo, saque un pedazo de papel al azar de la urna


y asigne el conejo a la dieta que indique el papel. No
reemplace el papel. Atrape el segundo conejo y seleccione al
azar otro pedazo de papel de la urna de los tres que quedan.
Asigne el conejo a la dieta correspondiente.
Continue hasta que los primeros cuatro conejos sean
asignados a una de las cuatro dietas. De esta manera, todos
los conejos lentos tienen diferentes dietas.

Coloque otra vez los cuatro pedazos de papel en la urna y


repita el procedimiento hasta que los 16 conejos estn
asignados a una dieta.

Diseo de experimentos p. 7/112


Mtodo 3

Este no es un diseo completamente al azar.

Ya que se seleccionaron los conejos en bloques de 4, y cada


uno asignado a una de las dietas, el diseo es el bloques al
azar.

El tratamiento es Dieta pero se ha bloqueado a travs del


grado de "atrapabilidad".

Diseo de experimentos p. 8/112


Mtodo 4

Atrape a todos los conejos y mrquelos del 1 al 16. Ponga 16


piezas de papel en una urna, con las letras A, B, C y D
repetidas cuatro veces cada una.

Ponga otros 16 pedazos de papel numerados del 1 al 16 en


otra urna. Tome un pedazo de papel de cada urna. El conejo
con el nmero seleccionado es asignado a la dieta
seleccionada.

Para hacer ms fcil de recordar cul conejo tiene cul dieta,


las jaulas se acomodan como se muestra abajo:

A A A A
B B B B
C C C C
D D D D

Diseo de experimentos p. 9/112


Mtodo 4

El mtodo 4 tiene algunas deficiencias. La asignacin de los


conejos a los tratamientos es un diseo completamente al
azar. Sin embargo, el arreglo de las jaulas crea un sesgo en
los resultados.

Puede haber cambios climticos y de luz que afecten de forma


diferencial a los tratamientos, de tal manera que, cualquier
diferencia observada no puede ser atribuida a la dieta, sino
que podra ser resultado de la posicin de la jaula.

La posicin de la jaula no es parte del tratamiento, pero debe


ser considerada. En un diseo completamente al azar, todos
los conejos tienen la misma probabilidad de recibir cualquier
dieta y en cualquier posicin de la jaula.

Diseo de experimentos p. 10/112


Mtodo 5

Marque las jaulas del 1 al 16.

1 5 9 13
2 6 10 14
3 7 11 15
4 8 12 16

Ponga 16 pedazos de papel en una urna, numerados del 1 al


16. En otra urna ponga 16 pedazos de papel, marcados con
las letras A, B C y D.
Atrape un conejo. Seleccione un nmero y una letra de cada
urna. Ponga el conejo en la jaula indicada por el nmero
escogido y asgnelo a la dieta indicada por la letra.
Repita sin reemplazo hasta que todos los conejos hayan sido
asignados a una dieta y una jaula.

Diseo de experimentos p. 11/112


Mtodo 5

Si, por ejemplo, el primer nmero seleccionado fu 7 y la


primera letra B, entonces el primer conejo se pone en la jaula
7 y se alimenta con la dieta B.

1 5 9 13
2 6 10 14
3 7B 11 15
4 8 12 16

Diseo de experimentos p. 12/112


Mtodo 5

Un ejemplo de asignacin completa es el siguiente:

1C 5A 9B 13 D
2D 6B 10 D 14 C
3C 7B 11 A 15 D
4A 8A 12 C 16 B

Note que el diseo completamente al azar no toma en cuenta


las diferencias en la altura de las jaulas. Es solamente una
asignacin completamente al azar.

En este ejemplo vemos que la mayora de los conejos con la


dieta A estn en jaulas de la parte de abajo y los de la dieta D
estn en la parte superior. Un diseo completamente al azar
supone que estas posiciones no producen una diferencia
sistemtica en la respuesta (tiempo de coagulacin).

Si creemos que la posicin afecta la respuesta, deberamos


usar un diseo de bloques al azar.
Diseo de experimentos p. 13/112
Diseo completamente al azar, un factor

Ejemplo: Disminucin del crecimiento de bacterias en carne


almacenada.

La vida en estante de carne almacenada es el tiempo en que


el corte empacado se mantiene bien, nutritivo y vendible.

El empaque estndar con aire del medio ambiente tiene una


vida de 48 horas. Despus se deteriora por contaminacin
bacterial, degradacin del color y encogimiento.

El empaque al vaco detiene el crecimiento bacterial, sin


embargo, se pierde calidad.

Estudios recientes sugieren que al controlar ciertos gases de


la atmsfera se alarga la vida en estante.

Diseo de experimentos p. 14/112


Diseo completamente al azar, un factor

Hiptesis de investigacin: Algunas formas de gases


controlados pueden mejorar la efectividad del
empacamiento para carne.

Diseo de tratamientos: Un factor con 4 niveles:


1. Aire ambiental con envoltura plstica
2. Empacado al vaco
3. Mezcla de gases:
1% CO (monxido de carbono)

40% O2 (oxgeno)

59% N (nitrgeno)
4. 100% CO2 (bixido de carbono)

Diseo experimental: Completamente al azar.

Diseo de experimentos p. 15/112


Diseo completamente al azar, un factor

Tres bisteces de res, aproximadamente del mismo tamao (75


grs.) se asignaron aleatoriamente a cada tratamiento. Cada
bistec se empaca separadamente con su condicin asignada.

Variable de respuesta: Se mide el nmero de


bacterias psichnotropicas en la carne despus de 9
das de almacenamiento a 4 C.

Estas bacterias se encuentran en la superficie de la


carne y aparecen cuando la carne se ech a perder.
La medicin fu el logaritmo del nmero de
bacterias por cm2 .

Diseo de experimentos p. 16/112


Diseo completamente al azar, un factor

Cmo aleatorizar?

Se obtiene una permutacin aleatoria de los nmeros 1 a 12. Para esto se


toma una secuencia de nmeros de 2 dgitos de una tabla de nmeros
aleatorios y se les asigna el rango que les corresponda.
Por ejemplo:

# aleatorio 52 56 20 99 44 34 62 60 31 57 40 78
rango 6 7 1 12 5 3 10 9 2 8 4 11
trat 1 1 1 2 2 2 3 3 3 4 4 4
u.e. 1 2 3 4 5 6 7 8 9 10 11 12
trat 1 3 2 4 2 1 1 4 3 3 4 2

Diseo de experimentos p. 17/112


Diseo completamente al azar, un factor

Modelo estadstico para el experimento

El modelo estadstico para estudios comparativos supone que


hay una poblacin de referencia de u.e. En muchos casos la
poblacin es conceptual. En el ejemplo, es posible imaginar
una poblacin de carne empacada.

Cada unidad de la poblacin tiene un valor de la variable de


respuesta, y, la cual tiene media y varianza 2 .

Se supone una poblacin de referencia para cada tratamiento


considerado en el estudio, y las variables en el experimento se
suponen seleccionadas aleatoriamente de dicha poblacin de
referencia, como resultado de la aleatorizacin.

Nota. Para estudios observacionales, suponemos que las


unidades observadas se seleccionaron aleatoriamente de
cada una de las poblaciones.

Diseo de experimentos p. 18/112


Diseo completamente al azar, un factor

Diseo de experimentos p. 19/112


Diseo completamente al azar, un factor

Modelo estadstico lineal para un diseo completamente al


azar.

Modelo de medias:

yij = i + ij i = 1, 2, . . . , t j = 1, 2, . . . , r
donde
yij es la observacin de la j-sima u.e. del i-simo tratamiento,
i es la media del i-simo tratamiento,
ij es el error experimental de la unidad ij.
Suponemos que hay t tratamientos y r repeticiones en cada
uno.

En el ejemplo de la carne empacada, tenemos:

Diseo de experimentos p. 20/112


Diseo completamente al azar, un factor

bistec trata obser log yij Modelo


miento vacin (conteo/cm2 )
6 1 1 7.66 y11 1 + 11
7 1 2 6.98 y12 1 + 12
1 1 3 7.80 y13 1 + 13
12 2 1 5.26 y21 2 + 21
5 2 2 5.44 y22 2 + 22
3 2 3 5.80 y23 2 + 23
10 3 1 7.41 y31 3 + 31
9 3 2 7.33 y32 3 + 32
2 3 3 7.04 y33 3 + 33
8 4 1 3.51 y41 4 + 41
4 4 2 2.91 y42 4 + 42
11 4 3 3.66 y43 4 + 43

Diseo de experimentos p. 21/112


Diseo completamente al azar, un factor

El modelo:
yij = i + ij
lo llamaremos modelo completo ya que incluye una media
separada para cada una de las poblaciones definidas por los
tratamientos.

Si no hay diferencia entre las medias de las poblaciones, es


decir,
1 = 2 = 3 = 4 =
se genera el modelo reducido
yij = + ij
que establece que las observaciones provienen de la misma
poblacin con media .

Diseo de experimentos p. 22/112


Diseo completamente al azar, un factor

El modelo reducido representa la hiptesis de no diferencia


entre las medias
H0 : 1 = 2 = 3 = 4 =
El modelo completo representa la hiptesis alternativa:
Ha : i 6= k i 6= k
El investigador debe determinar cul de los dos modelos
describe mejor a los datos en el experimento.

Diseo de experimentos p. 23/112


Diseo completamente al azar, un factor

yij = + ij yij = i + ij

Diseo de experimentos p. 24/112


Diseo completamente al azar, un factor

Pregunta de investigacin: Hay ms crecimiento bacterial


con algunos mtodos de empacado que con otros?

Pregunta estadstica: Cul modelo describe mejor los


resultados del experimento?

Se requiere un mtodo para estimar los parmetros de los dos


modelos y con base en algun criterio objetivo determinar cul
modelo o hiptesis estadstica se ajusta mejor a los datos del
experimento.

Diseo de experimentos p. 25/112


Diseo completamente el azar, un factor

Los estimadores de mnimos cuadrados son aquellos que


resultan de minimizar la suma de cuadrados de los errores
experimentales.

Si los errores experimentales son independientes con media


cero y varianzas homogneas, los estimadores de mnimos
cuadrados son insesgados y tienen varianza mnima.

Nota. El muestreo aleatorio en los estudios observacionales y


la aleatorizacin en los experimentales aseguran la suposicin
de independencia.

Diseo de experimentos p. 26/112


Estimadores para el modelo completo

yij = i + ij i = 1, . . . , t j = 1, . . . , r
ij = yij i
X r
t X t X
X r
2
SSEc = 2ij = (yij i )
i=1 j=1 i=1 j=1

La SSEc es una medida de qu tan bien se ajusta el modelo a


los datos.

Queremos determinar los estimadores i tales que se


minimice esta SSEc .

Vamos a tener t ecuaciones normales, una para cada


tratamiento, encontradas a partir de derivar la SSEc con
respecto a cada i e igualarlas a cero.

Diseo de experimentos p. 27/112


Estimadores para el modelo completo

Para una i:
r r
X 2
X
(yij i ) = 2 (yij i )
i j=1 j=1

igualando a cero
Xr
2 (yij i ) = 0
j=1
r
X
yij ri = 0
j=1
Pr
j=1 yij
i = = yi.
r

Diseo de experimentos p. 28/112


Estimadores para el modelo completo

Por lo tanto,
i = yi i = 1, . . . , t
Entonces,
t X
X r
2
SSEc = (yij i )
i=1 j=1
t X
X r
2
= (yij yi. )
i=1 j=1

t
X Xr
2
= (yij yi. )
i=1 j=1

Diseo de experimentos p. 29/112


Estimadores para el modelo completo

La varianza muestral del i-simo tratamiento es:


Pr 2
j=1 (y ij y i. )
Si2 =
r1
es una estimador de 2 de los datos del i-simo grupo.
Pt hPr 2
i
2 i=1 j=1 (yij yi. ) SSEc
S = =
t(r 1) t(r 1)
es un estimador combinado (pooled) de 2 de todos los
datos del experimento.

Es un buen estimador si podemos hacer la suposicin de que


2 es homognea en todos los grupos.

Diseo de experimentos p. 30/112


Estimadores para el modelo completo

Para los datos del ejemplo:

tratamiento comercial vaco mezcla CO2


7.66 5.26 7.41 3.51
6.98 5.44 7.33 2.91
7.80 5.80 7.04 3.66
i = yi. 7.48 5.50 7.26 3.36
Pr 2
j=1 (y ij y i. ) 0.3848 0.1512 0.0758 0.3150

SSEc = 0.3848 + 0.1512 + 0.0758 + 0.3150 = 0.9268

SSEc 0.9268
S2 = = = 0.11585
t(r 1) 4(2)

Diseo de experimentos p. 31/112


Estimadores para el modelo reducido

yij = + ij
ij = yij
t X
X r t X
X r
2
SSEr = 2ij = (yij )
i=1 j=1 i=1 j=1

t r t X
r
XX 2
X
(yij ) = 2 (yij )
i=1 j=1 i=1 j=1

igualando a cero
t X
X r t X
X r
= yij
i=1 j=1 i=1 j=1
rt = y..
y..
= = y..
rt

Diseo de experimentos p. 32/112


Estimadores para el modelo reducido

Entonces,
t X
X r t X
X r
2 2
SSEr = (yij ) = (yij y.. )
i=1 j=1 i=1 j=1

Para el ejemplo,
70.80
= y.. = = 5.90
12

Diseo de experimentos p. 33/112


Modelo reducido Modelo completo
yij = + ij yij = i + ij
Observado Estimado Diferencia Estimado Diferencia
Tratamiento y (yij ) i (yij i )
Comercial 7.66 5.90 1.76 7.48 0.18
6.98 5.90 1.08 7.48 -0.50
7.80 5.90 1.90 7.48 0.32
Vaco 5.26 5.90 -0.64 5.50 -0.24
5.44 5.90 -0.46 5.50 -0.06
5.80 5.90 -0.10 5.50 0.30
Mezcla 7.41 5.90 1.51 7.26 0.15
7.33 5.90 1.43 7.26 0.07
7.04 5.90 1.14 7.26 -0.22
CO2 3.51 5.90 -2.39 3.36 0.15
2.91 5.90 -2.99 3.36 -0.45
3.66 5.90 -2.24 3.36 0.30
SSEr = 33.7996 SSEc = 0.9268
Diseo de experimentos p. 34/112
Diseo completamente al azar, un factor

Siguiendo con el ejemplo:


P P
Modelo completo yij = i + ij SSEc = i j (yij yi. )2 = 0.9268
P P
Modelo reducido yij = + ij SSEr = i j (yij y.. )2 = 33.7996

Diferencia:
XX XX
2
SSEr SSEc = (yij y.. ) (yij yi. )2
i j i j

haciendo lgebra
XX X
2
= (yi. y.. ) = r (yi. y.. )2
i j i

En el ejemplo: SSEr SSEc = 32.8728

Diseo de experimentos p. 35/112


Diseo completamente al azar, un factor

SSEr SSEc = SSt suma de cuadrados de tratamientos.

Representa la reduccin en SSE al haber incluido


tratamientos en el modelo, tambin se le conoce como
reduccin en suma de cuadrados debida a tratamientos.

Llamaremos SStotal = SSEr ya que es la suma de cuadrados


de las diferencias de cada observacin y la media general y..

Entonces, tenemos la particin:


SStotal = SSt + SSEc
XX XX XX
(yij y.. )2 = 2
(yi. y.. ) + (yij yi. )2
i j i j i j

desviacin de la desviacin de la desviacin de la


observacin ij media del grupo observacin ij
con respecto a con respecto a con respecto a
la media general la media general la media de su grupo
Diseo de experimentos p. 36/112
Diseo completamente al azar, un factor

XX XX 2
2
(yij y.. ) = [(yij yi. ) + (yi. y.. )]
i j i j
XX XX
2
= (yij yi. ) + (yi. y.. )2
i j i j
XX
2 (yij yi. )(yi. y.. )
i j

XX X X
(yij yi. )(yi. y.. ) = (yi. y.. ) (yij yi. )
i j i j
X
= (yi. y.. )(yi. ryi. ) = 0
i

Diseo de experimentos p. 37/112


Diseo completamente al azar, un factor

Grados de libertad. Representan el nmero de piezas de


informacin independientes en las sumas de cuadrados.

En general, es el nmero de observaciones menos el nmero


de parmetros estimados de los datos.

Sea n = rt, el tamao de muestra total.


Pt Pr
As, SStotal = i j (yij y.. )2 donde y.. es el estimador de
, tiene n 1 g.l.
Pt Pr
SSE = i j (yij yi. )2 se estimaron t parmetros
(1 , 2 , . . . , t ) por lo tanto tiene n t g.l.

SSt = SStotal SSE = (n 1) (n t) = t 1 g.l.

Diseo de experimentos p. 38/112


Tabla de Anlisis de Varianza

ANOVA

F.V. g.l. SS CM
Tratamientos t1 SSt CMt = SSt /t 1
Error nt SSE CM E = SSE/n t = 2
Total n1 SStotal

Se puede demostrar que:


E (CM E) = 2
t
2 1 X X
E (CMt ) = + r(i )2 ; = i /t
t 1 i=1 i

Diseo de experimentos p. 39/112


Tabla de Anlisis de Varianza

Si suponemos ij N ID(0, 2 ) i = 1, . . . , t j = 1, . . . , r
en el modelo completo yij = i + ij

Entonces, yij N ID(i , 2 ).

Se puede demostrar que:


P P 2
SStotal i j (yij y.. ) 2
= n1
2 2
P P 2
SSE i j (y ij y i. ) 2
= nt
2 2

Cuando H0 : 1 = 2 = . . . = t es cierta
P 2
SSt i r(y i. y .. ) 2
= t1
2 2

Diseo de experimentos p. 40/112


Tabla de Anlisis de Varianza

Por el Teorema de Cochran (Montgomery, 2001, pg. 69), SSt


y SSE son independientes, por lo tanto cuando H0 es cierta,
SSt / 2 (t 1) CMt
F0 = 2
= Ft1,nt
SSE/ (n t) CM E
Adems, E (CMt ) = 2 + t2 = 2 cuando t2 = 0 que es
cuando H0 es cierta. Es decir,

E (CMt ) = E (CM E) cuando H0 es cierta


E (CMt ) > E (CM E) cuando H0 no es cierta

Entonces, si CMt > CM E, o sea, valores grandes de F0


llevan a rechazar la hiptesis nula H0 : 1 = 2 = . . . = t .
Por lo tanto, la regin de rechazo es:

F0 > Ft1,nt

Diseo de experimentos p. 41/112


Tabla de Anlisis de Varianza

ANOVA

F.V. g.l. SS CM F E(CM )


SSt CMt
Tratamientos t1 SSt CMt = t1 CM E 2 + t2

SSE
Error nt SSE CM E = nt 2

Total n1 SStotal

t
X 2
SSt = r (yi. y.. )
i=1
t X
X r
2
SSE = (yij yi. )
i=1 j=1
t X
X r
2
SStotal = (yij y.. )
i=1 j=1
Diseo de experimentos p. 42/112
Tabla de Anlisis de Varianza

En el ejemplo de empacado de carne:

F.V. g.l. SS CM F Pr > F


trat 3 32.8728 10.958 94.55 0.000
error 8 0.9268 0.1159
total 11 33.7996

Por lo tanto, se rechaza la hiptesis H0 : 1 = 2 = . . . = 4 ,


es decir, hay algn mtodo de empaque que tiene diferente
comportamiento en promedio.

Diseo de experimentos p. 43/112


Diseo completamente al azar, un factor

Se quieren comparar t niveles de un factor, lo que implica t


tratamientos y se dispone de ni u.e. para el tratamiento i,
i = 1, . . . , t. Hay dos situaciones:

1. Los t tratamientos son escogidos especficamente por el


investigador. En esta situacin deseamos probar hiptesis
acerca de las medias de los tratamientos y nuestras
conclusiones se aplicarn solamente a los niveles del
factor considerados en el anlisis. Las conclusiones no se
pueden extender a tratamientos similares que no fueron
explcitamente considerados. Este es el modelo de
efectos fijos.
2. Los t tratamientos son una muestra aleatoria de una
poblacin de tratamientos. En esta situacin nos gustara
poder extender las conclusiones (las cuales estn basadas
en la muestra de tratamientos considerada) a todos los
tratamientos de la poblacin. Este es el modelo de
efectos aleatorios.
Diseo de experimentos p. 44/112
Diseo completamente al azar, un factor

A las cantidades n1 , n2 , . . . , nt se les llama repeticiones de


cada tratamiento.

Si ni = r i se dice que el diseo es balanceado.

yij es la respuesta de la u.e. j del tratamiento i,


i = 1, . . . , t j = 1, . . . , ni .

Diseo de experimentos p. 45/112


Diseo completamente al azar

Estructura de los datos.

tratamientos
1 2 3 ... t
y11 y21 y31 ... yt1
y12 y22 y32 ... yt2
y13 y23 y33 ... yt3
. . . ... .
. . . ... .
. . . ... .
y1n1 y2n2 y3n3 ... ytnt
y1. y2. y3. ... yt. totales
y1. y2. y3. ... yt. medias

Diseo de experimentos p. 46/112


Diseo completamente al azar

t
X
n = ni
i=1
Xni
yi. = yij i = 1, . . . , t total tratamiento i
j=1
Pni
j=1 yij
yi. = i = 1, . . . , t media tratamiento i
ni
t X
X ni t
X
y.. = yij = yi. total de las observaciones
i=1 j=1 i=1
y..
y.. = media general
n

Diseo de experimentos p. 47/112


Diseo completamente al azar

Se tienen t muestras aleatorias independientes de tamaos


n1 , n2 , . . . , nt respectivamente.

y11 , y12 , . . . , y1n1 es una muestra aleatoria de N (1 , 2 )

y21 , y22 , . . . , y2n2 es una muestra aleatoria de N (2 , 2 )

yt1 , yt2 , . . . , ytnt es una muestra aleatoria de N (t , 2 )

Diseo de experimentos p. 48/112


Diseo completamente al azar

Las observaciones en cada una de estas muestras se pueden


representar por el modelo lineal simple
yij = i + ij i = 1, . . . , t j = 1, . . . , ni
con ij error experimental en la observacin j-sima del
tratamiento i-simo.

Estamos suponiendo independencia entre y dentro de las


muestras, es decir, ij son independientes y ij N (0, 2 ).

Diseo de experimentos p. 49/112


Diseo completamente al azar

Otra forma de verlo

Como suponemos que las u.e. son homogneas, es decir, el


promedio de respuesta de todas las u.e. es el mismo () antes
de aplicar los tratamientos, y si se observan en condiciones
similares, las respuestas las podemos modelar como
yij = + ij

Diseo de experimentos p. 50/112


Modelo de efectos

Entonces al aplicar el tratamiento i-simo a un grupo (de


tamao ni ) de u.e. se introduce un efecto (i ) de ese
tratamiento en las variables por observar.

El modelo se puede escribir como:

Modelo de efectos

yij = + i + ij i = 1, . . . , t j = 1, . . . , ni
donde

es la media general, comn a todas las u.e.


i es el efecto del tratamiento i-simo

Diseo de experimentos p. 51/112


Modelo de efectos

Diseo de experimentos p. 52/112


Modelo de efectos

El modelo de efectos implica que se empieza el experimento


con u.e. con la misma capacidad de respuesta () y con la
misma varianza ( 2 ).

La aplicacin de los tratamientos tiene el efecto de alterar las


medias, que ahora son i = + i , pero supone que no se
modifican las varianzas.

En este caso, la hiptesis a probar es:


H0 : 1 = 2 = . . . = t = 0

Ha : i 6= 0 para al menos una i

Diseo de experimentos p. 53/112


Modelo de efectos

Estimadores de mnimos cuadrados:

yij = + i + ij i = 1, . . . , t j = 1, . . . , ni

X ni
t X ni
t X
X
SSE = 2ij = (yij i )2
i=1 j=1 i=1 j=1
t n
i ni
t X
XX X
(yij i )2 = 2 (yij i )
i=1 j=1 i=1 j=1
t ni ni
XX X
(yij i )2 = 2 (yij i ) i = 1, . . . , t
i i=1 j=1 j=1

Diseo de experimentos p. 54/112


Modelo de efectos

Igualando a cero:
X ni
t X t
X
yij = n + ni i
i=1 j=1 i=1
n1
X
y1j = n1 + n1 1
j=1
n2
X
y2j = n2 + n2 2
j=1
... ...
nt
X
ytj = nt + nt t
j=1

Las ecuaciones normales no son linealmente independientes,


por lo tanto no hay una solucin nica. Esto ocurre porque el
modelo de efectos est sobreparametrizado.

Diseo de experimentos p. 55/112


Modelo de efectos

Se aade una ecuacin linealmente independiente:


Pt
a) i=1 i = 0

= y..
i = yi. y.. i = 1, . . . , t

b) = 0
= 0
i = yi. i = 1, . . . , t

c) 1 = 0
= y1.
i = yi. y1. i = 2, . . . , t

Diseo de experimentos p. 56/112


Modelo de efectos

Hay un nmero infinito de posibles restricciones que se


pueden usar para resolver las ecuaciones normales. Entonces

Cul usar?

No importa ya que en cualquier caso

\
+ i = yi.
Aunque no podemos obtener estimadores nicos de los
parmetros del modelo de efectos, podemos obtener
estimadores nicos de funciones de estos parmetros.

A estas funciones se les llama funciones lineales


linealmente estimables.

Diseo de experimentos p. 57/112


Diseo completamente al azar, Tabla de ANOVA

F.V. g.l. SS CM F E(CM )


P
SSt CMt 2 ni (i )2
Tratamientos t1 SSt CMt = t1 CM E + i
t1

SSE
Error nt SSE CM E = nt 2

Total n1 SStotal
t t
X 2
X y2 i. y..2
SSt = ni (yi. y.. ) =
i=1 i=1
ni n
ni
t X ni
t X t
X 2
X
2
X y2 i.
SSE = (yij yi. ) = yij
i=1 j=1 i=1 j=1 i=1
ni
ni
t X ni
t X
X 2
X
2 y..2
SStotal = (yij y.. ) = yij
i=1 j=1 i=1 j=1
n
t
X
n = ni
i=1 Diseo de experimentos p. 58/112
Intervalos de confianza

2
r
S CM E
i = yi. Sy2i. = 2
con S = CM E = 2
Syi. =
ni ni
Como suponemos que
2

yij N i ,
entonces
2
yi. N i , /ni
como estimamos la varianza:
yi. i
tnt
Syi.
Por lo tanto, un intervalo del (1 )100% de confianza para i
es
1/2
yi. tnt (Syi. )

Diseo de experimentos p. 59/112


Contrastes

En el ejemplo del empacado de carne tenamos:

Comercial Al vaco CO,O2,N CO2


i = yi. 7.48 5.50 7.26 3.36

S 2 = CM E = 0.116 con 8 g.l.

Una vez que rechazamos la hiptesis H0 : 1 = 2 = 3 = 4

Qu sigue?

Diseo de experimentos p. 60/112


Contrastes

Se podran contestar preguntas como:


Es ms efectiva la creacin de una atmsfera artificial que el
aire ambiente con plstico para reducir el crecimiento de
bacterias?
Son ms efectivos los gases que el vaco?
Es ms efectivo el tratamiento de CO2 puro que la mezcla
CO,O2 y N?

Un contraste es una funcin lineal de los parmetros i


definido como
t
X
C= ki i = k1 1 + k2 2 + . . . + kt t
i=1
Pt
donde i=1 ki = 0.

Diseo de experimentos p. 61/112


Contrastes

Los contrastes para las preguntas anteriores son:


comercial vs. atmsfera artificial
1
C1 = 1 (2 + 3 + 4 )
3
vaco vs. gases
1
C2 = 2 (3 + 4 )
2
mezcla de gases vs. CO2 puro
C3 = 3 4

Diseo de experimentos p. 62/112


Contrastes

El estimador del contraste


t
X t
X t
X
C= ki i es C = ki i = ki yi.
i=1 i=1 i=1

Si suponemos que
2

yij N i ,
entonces
2
yi. N i , /ni
Por lo tanto,
t
t t
!
X X
2
X ki
C = ki yi. N ki i ,
i=1 i=1 i=1
ni

Diseo de experimentos p. 63/112


Contrastes

Ya que:
t ! t t
X X X
E ki yi. = ki E (yi. ) = ki i
i=1 i=1 i=1

t ! t t t
2 2
X X
2 2
X
2
X ki
V ki yi. = ki V (y i. ) = ki =
i=1
|{z}
i=1 i=1
ni n
i=1 i
m.indep

t 2 t

2
X ki
X ki2
V C = = CM E
n
i=1 i
n
i=1 i

Diseo de experimentos p. 64/112


Contrastes

Entonces,
Pt Pt
i=1 ki yi. i=1 ki i
q Pt tg.l.error
CM E i=1 ki2 /ni

De aqu un intervalo del 100(1 )% de confianza para el


contraste C es:
v
u t
1/2
u X
C tg.l.error tCM E ki2 /ni
i=1

Diseo de experimentos p. 65/112


Contrastes

Adems,
C C
q P N (0, 1)
t
2 i=1 ki2 /ni
Pt
Si H0 : i=1 ki i = 0, es decir, H0 : C = 0 es cierta, entonces,

C 2
Pt 2 /n
21
2 k
i=1 i i

Sea
C 2
SSc = Pt 2 /n
k
i=1 i i

entonces
Pt
SSc / 2 2
C / i=1 ki2 /ni
2
= F1,nt
SSE/ (n t) CM E

Por lo tanto, para probar H0 : C = 0 se rechaza si Fc > F1,nt

Diseo de experimentos p. 66/112


Contrastes

El nmero de contrastes que se pueden hacer es muy grande,


sin embargo, esta tcnica tiene su mayor utilidad cuando se
aplica a comparaciones planeadas antes de realizar el
experimento.

Una clase de contrastes, conocida como Contrastes


ortogonales (como son los del ejemplo anterior) tienen
propiedades especiales con respecto a la particin de sumas
de cuadrados y grados de libertad y con respecto a su relacin
entre ellos. La ortogonalidad implica que un contraste no
aporta informacin acerca de otro.

Dos contrastes, con coeficientes {ki }, {li } son ortogonales si


t
X ki li
=0
i=1
ni

Diseo de experimentos p. 67/112


Contrastes

Para t tratamientos existe un conjunto de t 1 contrastes


ortogonales, los cuales hacen una particin de la suma de
cuadrados de tratamientos en t 1 componentes
independientes, cada uno con 1 g.l. Por lo tanto las pruebas
realizadas con contrastes ortogonales son independientes.

En el ejemplo anterior, los contrastes son ortogonales.

k1 k2 k3 k4
C1 1 -1/3 -1/3 -1/3
C2 0 1 -1/2 -1/2
C3 0 0 1 -1

Diseo de experimentos p. 68/112


ANOVA

La tabla de ANOVA incorporando las pruebas de hiptesis de


los 3 contrastes es:

F.V. g.l. SS CM F Pr > F


trat 3 32.8728 10.958 94.55 0.000
C1 1 10.01 10.01 86.29 0.000
C2 1 0.07 0.07 0.62 0.453
C3 1 22.82 22.82 196.94 0.000
error 8 0.9268 0.1159
total 11 33.7996

Se rechaza H0 : 1 = 2 = 3 = 4
Se rechaza H01 : 1 = 31 (2 + 3 + 4 )
No se rechaza H02 : 2 = 21 (3 + 4 )
Se rechaza H03 : 3 = 4
2
C1 (2.11)2 4.4521
SSC1 = P4 = = = 10.01
1
ki2 12 +3(1/3)2 0.4444
r i=1 3

Diseo de experimentos p. 69/112


Otro ejemplo

En un experimento se van a comparar los % de carbohidratos


en cuatro marcas de pan, para lo cual se van a hacer 18
determinaciones: 5 en la marca A, 3 en la B, 4 en la C y 6 en
la D.

En este caso, cada marca de pan es un tratamiento (t = 4) y


se tienen n1 = 5, n2 = 3, n3 = 4, n4 = 6. Para obtener las
respuestas se tomarn muestras aleatorias de los tamaos ni
especificados de cada marca y se harn determinaciones de
los porcentajes mediante un procedimiento (hasta donde sea
posible) idntico en las 18 u.e.

Note que en este ejemplo no estamos en libertad de asignar


las u.e. a los tratamientos, ya que las poblaciones (las 4
marcas) existen independientemente de la accin del
experimentador. No obstante lo anterior, basta que las
muestras aleatorias de las 4 poblaciones sean independientes
para que el anlisis bajo el modelo que se propone sea vlido.

Este es un estudio observacional, no experimental.


Diseo de experimentos p. 70/112
Otro ejemplo

Tratamiento (marca)
A B C D
63 60 59 70
68 65 66 69
71 61 58 62
70 59 71
69 70
66
ni 5 3 4 6
yi. 341 186 242 408
yi. 68.2 62.0 60.5 68.0

Diseo de experimentos p. 71/112


Otro ejemplo

Pruebe la hiptesis de igualdad de medias


H0 : 1 = 2 = 3 = 4 .

Conteste las siguientes preguntas:


Son diferentes en promedio los porcentajes de
carbohidratos en las marcas B y C?
Es diferente el porcentaje de carbohidratos de la marca A al
promedio de las marcas C y D?
Suponga que las marcas A y B estn hechas con harina
integral y las marcas C y D con harina blanca. El promedio
del porcentaje de carbohidratos de las marcas A y B es igual
al promedio de C y D?

Hacerlo con SPSS, JMP, STATA

Diseo de experimentos p. 72/112


Comparaciones mltiples

En muchas situaciones prcticas, se desea comparar pares de


medias. Podemos determinar cules medias difieren probando
las diferencias entre todos los pares de medias de
tratamientos.

Es decir, estamos interesados en contrastes de la forma


= i j i 6= j
Lo primero que se nos viene a la mente es hacer una prueba t
para cada par de medias, es decir, probar
H0 : i = j
Ha : i 6= j i 6= j

Diseo de experimentos p. 73/112


Comparaciones mltiples

Si suponemos varianzas iguales, se tiene la estadstica de


prueba
yi. yj.
tc = q
sp n1i + n1j

y se rechaza H0 al nivel de significancia si


/2 1/2
tc tni +nj 2 tc tni +nj 2

Esto es equivalente a decir que se rechaza H0 si


|yi. yj. | 1/2
|tc | = q > tni +nj 2
sp n1i + n1j

o equivalente a
s
1/2 1 1
|yi. yj. | > tni +nj 2 sp +
ni nj

Diseo de experimentos p. 74/112


Comparaciones mltiples

Esta prueba conocida como Diferencia Mnima Significativa


(DMS LSD) en el contexto de ANOVA, lo que hace es
comparar el valor absoluto de la diferencia de cada par de
medias con DMS:
Si s
1/2 1 1
|yi. yj. | > DM S = tglerror CM E +
ni nj
se rechaza H0 : i = j .

CM E es el cuadrado medio del error que es una estimacin


ponderada de la varianza basada en t estimaciones de la
varianza.

El utilizar este procedimiento no es conveniente por que el


nivel de significancia global, es decir, para el conjunto de todas
las pruebas, resulta muy superior al nivel de significancia ()
planeado.

Diseo de experimentos p. 75/112


Comparaciones mltiples

Por ejemplo, si se tienen 4 medias de tratamientos, entonces


se tienen
4 4!
= =6
2 2!2!
pares a comparar, es decir, 6 pruebas de hiptesis a realizar,
con lo que se pueden cometer 0, 1, 2, 3, 4, 5, 6 errores Tipo I,
si todas las medias son iguales.

Se define otra forma de error tipo I basado en los riesgos


acumulados asociados a la familia de pruebas bajo
consideracin.

Este es el error tipo I del experimento E que es el riesgo de


cometer el error tipo I al menos una vez.

La probabilidad de error tipo I del experimento puede


evaluarse para una familia de pruebas independientes.

Diseo de experimentos p. 76/112


Comparaciones mltiples

Sin embargo, todas las pruebas a pares usando la DM S no


son independientes, puesto que el CM E es el mismo en cada
una de las estadsticas de prueba y el numerador contiene las
mismas medias en varias de las estadsticas de prueba.

An as, se puede evaluar el lmite superior de la probabilidad


de error tipo I del experimento, suponiendo n pruebas
independientes.
t
Suponga que la H0 es cierta para cada una de las n = 2
pruebas y que son independientes.

Sea c = P (error tipo I) en una sola prueba (comparacin)


con (1 c ) = P (decisin correcta).

Diseo de experimentos p. 77/112


Comparaciones mltiples

La probabilidad de cometer x errores tipo I est dada por la


distribucin binomial como:

n x
P (X = x) = c (1 c )nx
x
n!
P (X = x) = cx (1 c )nx x = 0, 1, 2, . . . , n
(n x)!x!

La probabilidad de no cometer ningn error tipo I es


P (X = 0) = (1 c )n

Diseo de experimentos p. 78/112


Comparaciones mltiples

La probabilidad de cometer al menos 1 error tipo I es


P (X 1) = 1 P (X = 0) = 1 (1 c )n
es decir, la mxima probabilidad de cometer al menos un error
tipo I entre las n comparaciones es:
E = 1 (1 c )n de aqu
c = 1 (1 E )1/n

Diseo de experimentos p. 79/112


Comparaciones mltiples

# de pruebas E cuando c cuando


indep. n c = 0.05 E = 0.05
1 0.05 0.05
2 0.098 0.025
3 0.143 0.017
4 0.185 0.013
5 0.226 0.010
10 0.401 0.005

Por el razonamiento anterior es que han surgido una serie de


pruebas de diferentes autores para hacer comparaciones
mltiples tratando de mantener la
P (error tipo I del experimento) =

Diseo de experimentos p. 80/112


Bonferroni

E nc
n comparaciones, la igualdad se d cuando las pruebas son
independientes.

Entonces,
c = E /n
Si queremos E = 0.05 entonces, c = 0.05/n y se hacen las
pruebas t para los pares de medias con un nivel de
significancia c en cada una de ellas.

Diseo de experimentos p. 81/112


Tukey

Conocida como la prueba de la Diferencia Mnima Significativa


Honesta (DMSH)
r
CM E
DM SH = qt,glerror si ni = r i
r
s
CM E 1 1
DM SH = qt,glerror +
2 ni nj

Si |yi. yj. | > DM SH se rechaza H0 : i = j .

q1 ,2 se obtiene de las "tablas de rangos estudentizados".

Diseo de experimentos p. 82/112


Tukey

Para el ejemplo del empaque de carne:


Comercial Al vaco CO,O2,N CO2
yi. 7.48 5.50 7.26 3.36
S 2 = CM E = 0.116 con 8g.l. t = 4, r = 3
r
0.05 0.116
DM SH = q4,8 = (4.53)(0.197) = 0.891
3

|y1. y2. | = 1.98


|y1. y3. | = 0.22
|y1. y4. | = 4.12
|y2. y3. | = 1.76
|y2. y4. | = 2.14
|y3. y4. | = 3.90

Diseo de experimentos p. 83/112


Student-Newman-Keuls (SNK)

Se calcula un conjunto de valores crticos



kp = qp,f Syi. p = 2, 3, . . . , t

donde qp,f es el percentil 1 de la distribucin del rango
estudentizado para el nmero p de medias q involucradas en la
CM E
comparacin y f g.l. del error, y Syi. = r

Para el ejemplo de la carne empacada:


p 2 3 4
.05
qp,8 3.26 4.04 4.53
kp 0.642 0.796 0.892

Diseo de experimentos p. 84/112


Student-Newman-Keuls (SNK)

Comercial Al vaco CO,O2,N CO2


yi. 7.48 5.50 7.26 3.36

Medias ordenadas:
y4. = 3.36 y2. = 5.50 y3. = 7.26 y1. = 7.48

|y4. y1. | = 4.12 > k4


|y4. y3. | = 3.90 > k3
|y4. y2. | = 2.14 > k2
|y2. y1. | = 1.98 > k3
|y2. y3. | = 1.76 > k2
|y3. y1. | = 0.22 < K2 (N.S.)

Diseo de experimentos p. 85/112


Duncan

Es similar a la de SNK. Los promedios de los t tratamientos se


ordenan en forma ascendente y el error estndar de cada
promedio se determina con
r
CM E
Syi. = si ni = r i
r
Para muestras de diferente tamao, se reemplaza la r por la
media armnica (nh ) de los {ni }
t
nh = P
t 1
i=1 ni

Diseo de experimentos p. 86/112


Duncan

De las tablas de Duncan de rangos significativos se obtienen



los valores de rp,f para p = 2, 3, . . . , t.
p es el nmero de medias involucradas en la comparacin,
es el nivel de significancia y f los grados de libertad del error.

Se calculan

Rp = rp,f Syi. p = 2, 3, . . . , t

Para el ejemplo de la carne empacada:


p 2 3 4
.05
rp,8 3.26 3.39 3.47
Rp 0.642 0.668 0.684

Diseo de experimentos p. 87/112


Duncan

Comercial Al vaco CO,O2,N CO2


yi. 7.48 5.50 7.26 3.36

Medias ordenadas:
y4. = 3.36 y2. = 5.50 y3. = 7.26 y1. = 7.48

|y4. y1. | = 4.12 > R4


|y4. y3. | = 3.90 > R3
|y4. y2. | = 2.14 > R2
|y2. y1. | = 1.98 > R3
|y2. y3. | = 1.76 > R2
|y3. y1. | = 0.22 < R2 (N.S.)

Diseo de experimentos p. 88/112


Dunnett

Para comparar las medias de los tratamientos con la media del


tratamiento control.
Suponga que el tratamiento t es el control, queremos probar
las hiptesis
H0 : i = t
Ha : i 6 = t i = 1, 2, . . . , t 1

H0 : i = t se rechaza si r
CM E
|yi. yt. | > D = d (t 1, glerror)
r
con d (k, ) es el percentil 1 de las tablas de Dunnett.
Para el ejemplo de la carne empacada, el tratamiento 1 es el
control.
Comercial Al vaco CO,O2,N CO2
yi. 7.48 5.50 7.26 3.36

Diseo de experimentos p. 89/112


Dunnett

d0.05,3,8 = 2.42
r !
CM E
D = 2.42 = 0.477
r

|y2. y1. | = 1.98 > D


|y3. y1. | = 0.22 < D(N.S.)
|y4. y1. | = 4.12 > D

Diseo de experimentos p. 90/112


Scheff

Scheff (1953) propuso un mtodo para probar todos los


posibles contrastes.

Considere cualquier contraste


t
X t
X
C= ki i estimado con C = ki yi.
i=1 i=1

con error estndar


v " t #
u
u X k2
i
SC = CM E
t
n
i=1 i

La hiptesis nula pra el contraste H0 : C = 0 se rechaza si


|C| > S(E )
donde q
E
S(E ) = SC (t 1)Ft1,g.l.error
Diseo de experimentos p. 91/112
Anlisis de residuales

Tenemos el modelo
yij = i + ij yij = + i + ij
2

ij N ID 0,
Suposiciones:
errores normales
independientes
varianza constante

La prueba F del anlisis de varianza es robusta a falta de


normalidad.

Diseo de experimentos p. 92/112


Anlisis de residuales

Si los errores experimentales estn correlacionados, el error


estndar estar mal estimado. La independencia se justifica
aleatorizando las u.e. a los tratamientos en experimentos y
seleccionando muestras aleatorias en estudios
observacionales.

Si no hay homogeneidad de varianzas el estimador de 2 es


malo, aunque se ha visto en estudios que si el diseo es
balanceado no efecta mucho. Tambin si los tamaos de
muestra mayores corresponden a las poblaciones con mayor
varianza.

Diseo de experimentos p. 93/112


Anlisis de residuales, Normalidad

Residuales
eij = yij yij
yij = \+ i = i = yi.
eij = yij yi.

Prueba no parmetrica ( Kolmogorov-Smirnov )


Histograma (muestras grandes)
grfica en papel normal
anlisis de residuales estandarizados para detectar outliers.
0
Si ij N (0, 2 ) entonces ij N (0, 1). Sean
eij
dij = CM E
, esperamos que:
68% de los residuales estandarizados estn entre -1 y 1
95 % estn entre -2 y 2
Virtualmente todos estn entre -3 y 3.

Diseo de experimentos p. 94/112


Anlisis de residuales, Homogeneidad de varianzas

Prueba de Bartlett
H0 : 12 = 22 = . . . = t2
Ha : no H0

Estadstica de Prueba:
" #
1 2
X
U= (n t)ln( ) (ni 1)ln(i2 )
C i
X (ni 1) 2 X (yij yi. )2
2 i
donde = = i2
i
n t j
ni 1
!
1 X 1 1
C =1+
3(t 1) i
ni 1 n t
H0 se rechaza si U > 2,t1 (prueba sensible a falta de
normalidad)

Diseo de experimentos p. 95/112


Anlisis de residuales, Homogeneidad de varianzas

Prueba de Levene

Se calcula
dij = |yij yi. | i = 1, . . . , t j = 1, . . . , ni
donde yi. es la mediana de las observaciones en el
tratamiento i.

Se evala si el promedio de estas observaciones dij es igual


para todos los tratamientos, es decir, se hace un ANOVA para
probar igualdad de medias de dij .

Diseo de experimentos p. 96/112


Prueba de Welch

La prueba F usual es robusta ante heteroscedasticidad


(varianzas diferentes) si los tamaos de muestra son muy
parecidos o, si los tamaos de muestra ms grandes
corresponden a las poblaciones con varianzas ms grandes.

Sin embargo, se han construdo algunas procedimientos de


prueba de igualdad de medias (H0 : 1 = 2 = . . . = t ) como
por ejemplo el desarrollado por Welch, conocido como la
prueba de Welch.
2
P P
Sean Wi = ni /i y = i Wi yi. / i Wi y

X (1 Wi /W. )2
=
i
ni 1
P
donde W. = i Wi .

Diseo de experimentos p. 97/112


Prueba de Welch

Entonces
P (yi. y )2
i Wi t1
Fc =
1+ 2(t 2)/(t2 1)

tiene aproximadamente una distribucin F con


1 = t 1 y 2 = (t2 1)/3 grados de libertad.

H0 : 1 = 2 = . . . = t se rechaza al nivel de significancia si


Fc > F1 ,2 .

Diseo de experimentos p. 98/112


Transformaciones

Se utilizan las transformaciones para cambiar la escala de las


observaciones para que se cumplan las suposiciones del
modelo lineal y dar inferencias vlidas del anlisis de varianza.

Cuando las transformaciones son necesarias, se hace el


anlisis y se hacen las inferencias en la escala transformada
pero se presentan tablas de medias en la escala de medicin
original.

1. Distribucin Poisson. Mediciones que son conteos


(nmero de plantas en cierta rea, insectos en plantas,
accidentes por unidad de tiempo) tienen distribucin Poisson.

La transformacin x = y + a, a es la adecuada.

Diseo de experimentos p. 99/112


Transformaciones

2. Distribucin binomial. Observaciones del nmero de


xitos en n ensayos independientes tiene distribucin binomial
(proporcin de semillas germinadas, proporcin de plantas
con flores en un transecto). = y/n

La transformacin x = sin 1
es la adecuada.

Las transformaciones del tipo potencia alteran la simetra o


asimetra de las distribuciones de las observaciones.

Si suponemos que la desviacin estndar de y es proporcional


a alguna potencia de la media, es decir,

y
Una transformacin de las observaciones, del estilo:
x = yp

Diseo de experimentos p. 100/112


Transformaciones

Da una relacin
x p+1
Si p = 1 entonces la desviacin estndar de la variable
transformada x ser constante, ya que p + 1 = 0 y x 0 .

La transformacin de Box-Cox
x = (y p 1)/p p 6= 1

x = loge y p = 1
El estimador de p se encuentra maximizando
1
L(p) = loge [CM E(p)]
2
donde CM E(p) es el cuadrado medio del error del anlisis de
varianza usando la transformacin x = (y p 1)/p para el valor
dado p.

Diseo de experimentos p. 101/112


Transformaciones

Se determina CM E(p) para un conjunto de valores de p, se


grafica CM E(p) vs. p y se toma el valor de p que corresponde
al valor mnimo de CM E(p).

JMP calcula la transformacin de Box-Cox, da una grfica de p


vs. CM E y da la opcin de guardar los datos transformados
en el archivo.

La dificultad de utilizar esta transformacin es la interpretacin.

Diseo de experimentos p. 102/112


Ejemplo

Los siguientes datos son el nmero de errores en un examen


de sujetos bajo la influencia de dos drogas. El grupo 1 es un
grupo control (sin droga), a los sujetos del grupo 2 se les di la
droga 1, a los del grupo 3 la droga 2 y a los del grupo 4 las dos
drogas.
Grupo 1 Grupo 2 Grupo 3 Grupo 4
(sin droga) (droga 1) (droga 2) (dos drogas)
1 12 12 13
8 10 4 14
9 13 11 14
9 13 7 17
4 12 8 11
1 10 10 14
1 12 13
5 14

Diseo de experimentos p. 103/112


Ejemplo

Correr el ejemplo con SPSS y JMP.

1. Probar homogeneidad de varianzas. (Bartlett y Levene)


2. Hacer prueba de Welch
3. Probar con algunas transformaciones, checando
normalidad y homogeneidad de varianzas

ej2_1_messy.sav
ej2_1_messy.jmp
ej2_1_messy.txt

Diseo de experimentos p. 104/112


Relacin entre Regresin y ANOVA

Cualquier modelo de ANOVA se puede escribir como un


modelo de regresin lineal.

Suponga el ejemplo de la carne empacada

tratamiento comercial vaco mezcla CO2


7.66 5.26 7.41 3.51
6.98 5.44 7.33 2.91
7.80 5.80 7.04 3.66

Un diseo completamente al azar con un solo factor (mtodo


de empacado) con 4 niveles (4 tratamientos) y 3 repeticiones
en cada tratamiento (diseo balanceado).

Diseo de experimentos p. 105/112


Relacin entre Regresin y ANOVA

Modelo ANOVA completamente al azar un solo factor


balanceado:
(
i = 1, 2, 3, 4
yij = i + ij = + i + ij
j = 1, 2, 3

El modelo de regresin equivalente es:

(
i = 1, 2, 3, 4
yij = 0 + 1 x1j + 2 x2j + 3 x3j + ij
j = 1, 2, 3

Diseo de experimentos p. 106/112


Relacin entre Regresin y ANOVA

Donde las variables x1j , x2j , x3j estn definidas como:

(
1 si la observacin j es del tratamiento 1
x1j =
0 en otro caso
(
1 si la observacin j es del tratamiento 2
x2j =
0 en otro caso
(
1 si la observacin j es del tratamiento 3
x3j =
0 en otro caso

Diseo de experimentos p. 107/112


Relacin entre Regresin y ANOVA

La relacin entre los parmetros del modelo ANOVA y el


modelo de regresin es:

Si la observacin viene del tratamiento 1, entonces


x1j = 1, x2j = 0, x3j = 0 y el modelo de regresin es
y1j = 0 + 1 (1) + 2 (0) + 3 (0) + 1j
= 0 + 1 + 1j

y el modelo ANOVA es:


y1j = 1 + 1j = + 1 + 1j
Por lo tanto:
0 + 1 = 1 = + 1

Diseo de experimentos p. 108/112


Relacin entre Regresin y ANOVA

Similarmente, para las observaciones del tratamiento 2


y2j = 0 + 1 (0) + 2 (1) + 3 (0) + 2j
= 0 + 2 + 2j

y la relacin entre los parmetros es:


o + 2 = 2 = + 2
Lo mismo para las observaciones del tratamiento 3
y3j = 0 + 1 (0) + 2 (0) + 3 (1) + 3j
= 0 + 3 + 3j

y la relacin entre los parmetros es:


o + 3 = 3 = + 3

Diseo de experimentos p. 109/112


Relacin entre Regresin y ANOVA

Finalmente, considere las observaciones del tratamiento 4,


para las cuales el modelo de regresin es:
y4j = 0 + 1 (0) + 2 (0) + 3 (0) + 4j
= 0 + 4j
entonces 0 = 4 = + 4

Por lo tanto,
0 = 4
1 = 1 4
2 = 2 4
3 = 3 4

Diseo de experimentos p. 110/112


Relacin entre Regresin y ANOVA

Entonces, para probar la hiptesis H0 : 1 = 2 = 3 = 4


tendramos que probar H0 : 1 = 2 = 3 = 0, lo cual se puede
hacer con cualquier paquete de cmputo estadstico.
Para el ejemplo de la carne empacada:
tratamiento y x1 x2 x3
1 7.66 1 0 0
1 6.98 1 0 0
1 7.80 1 0 0
2 5.26 0 1 0
2 5.44 0 1 0
2 5.80 0 1 0
3 7.41 0 0 1
3 7.33 0 0 1
3 7.04 0 0 1
4 3.51 0 0 0
4 2.91 0 0 0
4 3.66 0 0 0
Diseo de experimentos p. 111/112
Relacin entre Regresin y ANOVA

Si pedimos una regresin y = 0 + 1 x1 + 2 x2 + 3 x3 + y


pedimos una tabla de anlisis de varianza del modelo
yij = + i + ij las dos tablas ANOVA son idnticas.

Diseo de experimentos p. 112/112

También podría gustarte