Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diseño de Experimentos
Luis Nava
CAPÍTULO TRES
3.1. INTRODUCCIÓN
Ahora bien, para obtener una medida del error es necesario usar en la investigación más de
una máquina de cada marca, por ejemplo, un conjunto de cuatro máquinas de cada marca.
Supongamos además que el experimento involucra cuatro operadores. Un diseño que
requiera que cada máquina sea operada una vez por cada operador, permitirá evaluar
independientemente la variación debida a operadores y por ende removerla del término del
error. A este diseño, se le denomina diseño de bloques completamente aleatorizado. Los
datos a ser analizados pueden ser arreglados en una tabla de doble clasificación, donde las
filas representan digamos, bloques y las columnas tratamientos (o viceversa).
Dependiendo del tamaño del bloque usado, existen dos tipos básicos de diseños de bloques
aleatorizados:
a. Diseño de bloque completo: Cada bloque contiene todos los tratamientos. Esto es,
el material experimental es dividido en b bloques de k unidades experimentales cada
uno, donde k representa el número de tratamientos (Tabla 1)
44
Notas de Clases
Diseño de Experimentos
Luis Nava
b.1. Balanceado: Todos los bloques tienen el mismo tamaño y el número de
bloques en el que cualquier par de tratamientos aparece juntos, es constante. Si
además, el número de tratamientos es igual al número de bloques, decimos que el
diseño es simétrico. (Tabla 2)
TABLA 1
TRATAMIENTOS
A B C D
BLOQUES B A C D
D C B A
TABLA 2 TABLA 3
TRATAMIENTOS TRATAMIENTOS
A B C D B A E D
A B C E A B C D
A B D E B A C D
BLOQUES A C D E BLOQUES E D C A
B C D E D C A B
Cada uno de estos casos debe ser analizado a través de una técnica en particular. Esto es,
TECNICA
Completo Andeva de dos vías
DISEÑO DE
BLOQUES Balanceado - Andeva ajustado
Incompleto
No -Método de Mínimos Cuadrados
Balanceado General
45
Notas de Clases
Diseño de Experimentos
Luis Nava
Consideremos el diseño de efectos fijos discutido en el capítulo anterior con una restricción
adicional, el material experimental es agrupado en bloques homogéneos. Si i representa el
efecto debido al i-ésimo bloque, el correspondiente modelo puede ser formulado como:
b k
i 1
i
j 1
j 0 (3)
Ahora bien, los datos observados de un diseño en el cual los tratamientos son arreglados en
b bloques completos pueden presentase como en la Tabla 4.
46
Notas de Clases
Diseño de Experimentos
Luis Nava
En el desarrollo analítico del ANDEVA se necesita calcular:
b k b k
a.- El gran total Y.. Yi. Y. j Yij
i 1 j 1 i 1 j 1
k
b.- Y. j Yij = Total por tratamientos.
j 1
b
c.- Yi. Yij = Total por bloques (5)
i 1
Los promedios:
Y. j Yi. Y ..
Y. j ; Yi. ; Y.. (6)
b k kb
Si elevamos al cuadrado esta expresión y sumamos para todas las observaciones, se tiene
que:
b k b k
(Y 2
2
i 1 j 1 i 1 j 1
b k __ __ b k __ __ b k __ __ __ b k __ __ __ __ __
(Y i. Y.. ) 2 (Y . j Y.. ) 2 (Yij Y i. Y . j Y.. ) 2 2 (Y . j. Y.. )(Yij Y i. Y . j Y.. )
i 1 j 1 i 1 j 1 i 1 j 1 i 1 j 1
b k
2 (Y i. Y.. ) (Y . j Y.. ) (Yij Y i. Y . j Y.. )
__ __ __ __ __ __ __
i 1 j 1
k k __ __ k k __ k k __ __ __
(Y i. Y.. ) 2 (Y. j Y.. ) 2 (Yij Y i. Y . j Y.. ) 2
i 1 j 1 i 1 j 1 i 1 j 1
(8)
47
Notas de Clases
Diseño de Experimentos
Luis Nava
Cada una de estas sumas de cuadrado tiene asociado sus correspondientes grados de
libertad:
Para efecto de cálculos, las formulas dadas en (8) usualmente se desarrollan y rescriben de
la forma siguiente:
b
Y2
k k Y. 2j Y..2
SCTot Y .. 2
ij SCTr
i 1 j 1 bk j 1 b bk
(11)
2
b
Yi.2 Y..2 b k b
Yi.2 k Y. j Y..2
SCBl SCE Yij2 SCTo SCBl SCTr
i 1 k bk i 1 j 1 i 1 k j 1 b bk
Ahora bien, si el bloqueo es usado para reducir el error experimental, comparando los
modelos para los diseños completamente aleatorizados y de bloques completamente
aleatorizados para la i-ésima observación bajo el j-ésimo tratamiento se tiene que:
*ij ij i
(12)
donde ij* es el error aleatorio del diseño completamente aleatorizado, ij el error para el
diseño de bloques completamente aleatorizado y i el efecto de bloque.
Esta igualdad implica que la suma de cuadrados del Error en el Diseño Completamente
Aleatorizado es igual a la Suma de Cuadrados de Bloques más la Suma de Cuadrados del
Error en le Diseño de Bloques, es decir :
Las sumas de cuadrados dadas en (11), divididas por sus grados de libertad proveen otros
estadísticos, llamados cuadrados medios.
48
Notas de Clases
Diseño de Experimentos
Luis Nava
b
k i2
1 b
E CMBl k i2 (b 1) 2 2 i 1 (15)
(b 1) i 1 (b 1)
k
b 2j
E CMTr
1
(k 1) 2 b 2j 2 j 1
(16)
(k 1) j 1 (k 1)
Existen dos posibles hipótesis a probar aquí, una sobre el efecto de los bloques y otra sobre
el efecto de los tratamientos.
Si H 01 es verdadera, el valor esperado del cuadrado medio de los bloques está dado por:
E CMBl 2 (17)
CMBl
Fc1 F(b-1),(b-1)(k-1) (18)
CME
De aquí podemos indicar que cuando la hipótesis nula H 01 no es verdadera, se espera que
ocurra un valor grande para Fc1 , es decir, H 01 debe ser rechazada. Fc1 es chequeado contra
el valor crítico F(b-1),(b-1)(k-1); , si Fc1 es mayor que este valor crítico, rechazamos H 01 .
Por razones similares, si H 02 es verdadera, el valor esperado del cuadrado medio de los
tratamientos está dado por:
E CMTr 2 (19)
CMTr
Fc2 F(k-1),(b-1)(k-1) (20)
CME
49
Notas de Clases
Diseño de Experimentos
Luis Nava
2 2
y H se rechaza si F es mayor que el valor crítico.
0 c
Todo este desarrollo lo podemos resumir como se muestra en la Tabla 5. Esta tabla recibe
el nombre de Tabla de Análisis de Varianza par el Diseño de Bloques Completamente
Aleatorizado.
EJEMPLO 1
Se realiza un experimento para determinar el efecto que tiene el grado de trabajo (vueltas
por pulgada) en la resistencia del algodón. Se decide utilizar cinco niveles para el grado de
trabajo; 150, 163, 169, 178 y 10 vueltas por pulgadas. Se sabe que además de este factor,
existen otras posibles fuentes de variación, como las máquinas, operadores, material
experimental, entre otros. Después de una discusión se decide ignorar el efecto de estos
factores, excepto el factor máquinas, el cual será controlado. La variable respuesta medida
es el número de roturas por cada cien libras de material. La tabla 3-1 muestra los resultados
obtenidos:
Tabla 3-1
Número de Rupturas por cada cien libras
Grados de Trabajo
10 163 169 178 190
1 9 24 42 29 68
2 12 27 23 49 34
Máquinas 3 12 22 22 17 60
4 31 16 47 45 50
5 22 25 17 39 57
6 10 24 23 44 37
Solución:
50
Notas de Clases
Diseño de Experimentos
Luis Nava
- Tratamientos: Grados de Trabajo
- Bloques: Máquinas
- Variable Respuesta: Número de roturas por cada cien libras de material
Ho:1=2=3=4=5=0
Y
j 1 i 1
2
ij 36 .475
Y6. = 138
937 2 937 2
SCTo = 36.475 - = 7.209,367 SCTr = 33.650,167 - = 4.384,533
30 30
937 2
SCBl = 29.732,600 - = 466,967
30
Si se usa un nivel de significación del 5%, el valor crítico es F4,20,0.05 = 2,87 y dado que
9,298 es mayor que 2,87, entonces se rechaza la hipótesis, es decir, se concluye que existe
efectos del grado de trabajo sobre el número de roturas.
51
Notas de Clases
Diseño de Experimentos
Luis Nava
Al observar el valor de la Fc asociada con los bloques, 0.792, podemos concluir que no
existen diferencias significativas entre las máquinas, lo que implica que el diseño de
bloques no se justifica.
El modelo es:
Yij i j ij
i=1,...,b
j=1,...,k
Regla 1: Hay una ecuación normal para cada parámetro a ser estimado.
Regla 2: El lado derecho de cualquier ecuación normal es la suma de todas las
observaciones que contienen el parámetro asociado con esa ecuación normal particular.
Regla 3: El lado izquierdo de cualquier ecuación normal es la suma de todos los
parámetros, donde cada parámetro es multiplicado por el número de veces que aparece
en el total derecho.
2 : b ̂ + b ˆ2 + ̂ 1 + ̂ 2 +… + ̂ b = Y.2
k : b ̂ + b ˆk + ̂ 1 + ̂ 2 +… + ̂ b = Y.k
1 : k ̂ + ˆ1 + ˆk + k ̂ 1 = Y1.
2 : k ̂ + ˆ1 + ˆk +k ̂ 2 = Y2.
b : k ̂ + ˆ1 + ˆk … + k ̂
b
= Yb.
Obsérvese que al sumar las ecuaciones asociadas con los j , reproducen la ecuación
asociada con . Situación similar ocurre con las ecuaciones asociadas con los i . Hay por
52
Notas de Clases
Diseño de Experimentos
Luis Nava
lo tanto, dos dependencias lineales en este sistema de ecuaciones normales. Surge la
necesidad de usar los contrastes usados en la ecuación (3). De aquí se tiene que:
kb ̂ = Y..
b ̂ + b ˆ j = Y.j (21)
k ̂ +k ̂ i = Yi.
̂ = Y../kb = ..Y
ˆ j = (Y.j-b ..Y )/b = Y. j Y.. (22)
̂ i = (Yi.-k ..Y )k = Yi. Y..
En muchas situaciones prácticas es bastante obvio que existe una diferencia sustancial
entre los efectos de bloque, es decir, entre los i . En tales casos, no hay duda que los
bloques serán utilizados con el propósito de reducir el error experimental. Existen casos en
los que esta diferencia no es tan clara o, no se tiene información precisa sobre los bloques
al comienzo del experimento.
De esta forma, podemos estar corriendo un modelo ineficiente, lo que se traduce en una
pérdida de grados de libertad para la SCE , para el mismo número de observaciones, con
respecto a un diseño completamente aleatorizado. Esto entonces, puede resultar en una
pérdida de potencia o sensibilidad con respecto a la comparación de tratamientos.
53
Notas de Clases
Diseño de Experimentos
Luis Nava
¿Cuánto hemos ganado usando Diseño de Bloques Completamente Aleatorizado en lugar
de un Diseño Completamente Aleatorizado con el mismo número de unidades
experimentales?
Para estudiar este problema, se propone estimar la eficiencia relativa del Diseño de Bloques
Completamente Aleatorizado comparado con el Diseño Completamente Aleatorizado.
(Yates 1935)
donde CME(1) y CME(2) son los cuadrados medios del error de los diseños 1 y 2
respectivamente, y 1 y 2 sus grados de libertad.
Se dice que el primer diseño es mas preciso que el segundo sólo sí E.R. > 1.
E.R.
(k 1)(b 1) 1(kb k ) 3 CME( D.C.A.) (24)
(k 1)(b 1) 3(kb k ) 1 CME( D.B.C.A.)
Donde CME(D.C.A) y CME(D.B.C.A) son el cuadrado medio del error de los diseños
completamente aleatorizados y de bloques completamente aleatorizados respectivamente.
Este estadístico puede ser visto como e incremento en replicaciones que se requieren para
que un diseño completamente aleatorizado sea tan efectivo como el diseño de bloques
completamente aleatorizado.
Ahora bien, debemos definir los cuadrados medios antes mencionados, para poder calcular
la eficiencia relativa.
54
Notas de Clases
Diseño de Experimentos
Luis Nava
EJEMPLO 2
Para los datos del ejemplo 1 de esta sección, calcular e interpretar la eficiencia relativa del
diseño de bloques respecto del diseño completamente aleatorizado.
E.R.
(k 1)(b 1) 1(kb k ) 3 CME( D.C.A.)
(k 1)(b 1) 3(kb k ) 1 CME( D.B.C.A.)
donde:
(b 1)CMBl b(k 1)CME( D.B.C. A)
CME( D.C. A)
kb 1
21 * 28 113,669
E.R. * 0,948
23 * 26 117 ,893
Lo que indica que no existe ninguna ganancia en cuanto a la precisión al usar de bloques.
En ocasiones puede ocurrir que por razones que no pueden atribuirse al efecto de los
tratamientos, una o varias observaciones pueden no estar disponibles. Esto introduce un
nuevo problema dentro del análisis, puesto que los tratamientos ya no son ortogonales a
bloques, esto es, todos los tratamientos no ocurren en todos los bloques.
SCE = SCTo-SCBl-SCTr
2
b k
Yi.2 k Y. j Y..2
b
SCE Y 2
ij
i 1 j 1 i 1 k j 1 b bk
55
Notas de Clases
Diseño de Experimentos
Luis Nava
( Yi.2 (Yi * . Yi * j * ) 2 ) ( Y (Y. j * Yi * j * ) ) ( Yij Yi * j * )
2 2 2
.j
SCE ( Yij2 Yi *2 j * ) i i
j j* i i* j j*
*
k b kb (25)
i i* j j*
Una buena estimación de Yi* j * puede considerarse aquella que minimice la suma de
cuadrados del error. Luego, derivando SCE con respecto a Yi* j * e igualando a cero, lo cual
es una condición necesaria para minimizar SCE, obtenemos:
donde :
Podemos entonces, sustituir Yi* j * para la observación faltante y efectuar ahora, el análisis de
varianza usual.
Aunque el valor estimado hace que la suma de cuadrados del error sea mínima, la suma de
cuadrados de tratamiento es producida con sesgo hacia arriba. Este sesgo es una cantidad
dada por:
(Yi * . (k 1)Yi * j * ) 2
Sesgo 1
k (k 1)
Los grados de libertad del error se ven reducidos por cada observación faltante.
Otra forma de enfrentar el problema, es haciendo uso del análisis de covarianza. Para el
caso de una observación faltante el modelo a considerar estaría dado por:
Yij i j X jl ij (27)
donde:
1
Steel y Torrie, Bioestadística Principios y Procedimientos, Segunda Edición, 1988, Pág. 202
56
Notas de Clases
Diseño de Experimentos
Luis Nava
0 si ii ;j j
* *
Yij =
Yij en otro caso
-1 si i i* ; j j *
Xij =
0 en otro caso
Este modelo puede extenderse en el caso de que haya dos o mas observaciones faltantes,
incluyendo una covariable por cada observación faltante.
EJEMPLO 3
Solución:
Luego:
6 * 122 5 * 151 91
Y23 21,15
20
57
Notas de Clases
Diseño de Experimentos
Luis Nava
b.- La siguiente tabla muestra los resultados del análisis de varianza donde Y23 ha sido
estimado por el valor 21,15
EJEMPLO 4
Bloques
1 2 3 4
1 12 18 9
Tratamientos 2 17 21 15 11
3 14 19 17 8
4 16 22 14 13
Luego, este valor se incorpora a los datos sustituyendo a la observación faltante y la tabla
de análisis de varianza en este caso es:
58
Notas de Clases
Diseño de Experimentos
Luis Nava
El sesgo viene dado por:
(Yi * . (k 1)Yi * j * ) 2
Sesgo 0,59256
k (k 1)
Por lo tanto,
Usando el paquete estadístico SAS, la observación faltante es reemplazada por un punto (.).
El análisis de varianza resultante se muestra en la siguiente tabla:
Number of observations 16
NOTE: Due to missing values, only 15 observations can be used in this analysis.
Dependent Variable: Y
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 6 199.7111111 33.2851852 7.56 0.0059
Error 8 35.2222222 4.4027778
Corrected Total 14 234.9333333
Este procedimiento resulta, por lo tanto, mas eficiente que el tradicional, principalmente
cuando hay mas de una observación faltante.
59
Notas de Clases
Diseño de Experimentos
Luis Nava
input;
end;
cards;
12 . 18 9
17 21 15 11
14 19 17 8
16 22 14 13
;
proc glm;
class trat blq;
model Y=trat blq;
run;
EJEMPLO 5
Para los datos del ejemplo 1, determina mediante el método de Scheffé, que pares de
medias difieren.
Solución:
Se tiene para este ejemplo que las medias para cada uno de los cinco tratamientos son:
La siguiente tabla muestra las diferencias entre todos los posibles pares de medias:
Y.3 -- -- 6 13
Y.2 -- -- -- 7
60
Notas de Clases
Diseño de Experimentos
Luis Nava
2
r (k 1) Fk 1;( k 1)(b 1); CME
b
2 117 ,893
r 4 2,87 21,09
6
Luego, la media del tratamiento 5 difiere en forma significativa de las medias de los
tratamientos 1,2 y 3. De la misma forma, la media del tratamiento 4 difiere de la del
tratamiento 1, a un nivel de significación del 5%.
Vamos a ilustrar aquí, como es aplicada la metodología de regresión general a los diseños
de bloques, considerando los siguientes modelos:
3.4.1. Modelo Aditivo: Este modelo supone que no existe interacción entre bloques y
tratamientos. El modelo de análisis de análisis de varianza puede ser escrito en
este caso, como:
Yij i j ij
Yˆij ˆ ˆ i ˆ j (28)
Yi. Y. j Y..
Ahora bien, la reducción en la suma de cuadrados por ajuste del modelo completo es:
61
Notas de Clases
Diseño de Experimentos
Luis Nava
Si deseamos probar la hipótesis que todos los tratamientos no son significativos, esto es,
H o : j 0 para todo j, el modelo reducido puede ser escrito como:
Yij i ij
Y 2
i.
SC Re g ( , ) ˆY.. ˆ i Yi. i 1
(31)
i k
k Y. j Y..2
(32)
j 1 b kb
Esta ecuación es la que hemos denominado suma de cuadrados de tratamientos y tiene (k-1)
grados de libertad. Ahora bien, si se desea probar si el efecto de bloques es o no
significativo, el modelo reducido puede ser escrito como:
Yij j ij (33)
K Y. 2j
SC Re g ,
j 1 b
SC Re g ( / , ) SC Re g ( , , ) SC Re g (, )
62
Notas de Clases
Diseño de Experimentos
Luis Nava
b 2
Yi. Y
..
(34)
i 1 k kb
Esta ecuación representa la suma de cuadrados de bloques y tiene (b-1) grados de libertad.
Estos resultados se resumen en la tabla 9.
b k
Y...2
Total (N-1) SCTo Y 2
ijl
i 1 j 1 l N
De aquí que:
63
Notas de Clases
Diseño de Experimentos
Luis Nava
e
i j l
2
ijl SCE (Yijl ˆ ˆi ˆ j ˆij )2
i j l
(36)
Obtenemos ahora las derivadas parciales de (55) con respecto a ˆ , ˆ i ,ˆ j , y, ̂ij e igualando
a cero se obtiene el siguiente conjunto de ecuaciones normales:
Podemos verificar fácilmente que estas ecuaciones son linealmente dependientes. Una
Yij.
solución a estas ecuaciones es ˆ 0 , ˆ i 0 para todo i, ˆ j 0 para todo j y ˆ ij .
r
Por lo tanto,
Yij2.
SC Re g ( , , , ) (38)
i j r
Yij2.
SCE Yijl2
i j l i j r
Yijl i j i jl
Considerando que ̂
i
i 0 y ˆ
j
j 0 , podemos llegar a la siguiente solución:
ˆ Y...
ˆ i Yi.. Y...
ˆ j Y. j. Y...
Yi..2 Y. 2j . Y...2
SC Re g ( , i , j ) (39)
i kr j br N
64
Notas de Clases
Diseño de Experimentos
Luis Nava
y
Y...2 Yi..2 Yij2. Y. 2j .
SC Re g (ij / , i , j ) (40)
N i kr i j r j br
Yi..2
SC Re g ( , i ) (41)
i kr
y
SC Re g ( j / , i ) SC Re g ( , i , j ) SC Re g ( , i )
Y. 2j .
Y...2
SC Re g ( j / , i ) (42)
j br N
Yijl j i jl
Y. 2j .
SC Re g ( , j ) (43)
i br
y
SC Re g ( i / , j ) SC Re g ( , i , j ) SC Re g ( , j )
Yi..2 Y...2
SC Re g ( i / , j ) (44)
j kr N
65
Notas de Clases
Diseño de Experimentos
Luis Nava
b k
Y...2
Total (N-1) SCTo Y 2
ijl
i 1 j 1 l N
66