y de parcelas
subdivididas
En este captulo se introducen dos importantes tipos de diseos experimentales: el diseo anidado y el diseo de parcelas subdivididas. Estos dos diseos encuentran una aplicacin razonablemente generalizada en el uso industrial de los experimentos diseados. Con frecuencia incluyen tambin uno o ms
factores aleatorios, por lo que algunos de los conceptos introducidos en el captulo 12 tendrn cabida
aqu.
13..1
En algunos experimentos con factores mltiples, los niveles de uno de los factores (por ejemplo el factor
B) son similares pero no idnticos a los diferentes niveles de otro factor (por ejemplo A). A un arreglo
como ste se le llama diseo anidado o jerrquico, con los niveles del factor B anidados bajo los niveles
del factorA. Por ejemplo, considere una compaa que compra su materia prima a tres proveedores diferentes. La compaa quiere determinar si la pureza de la materia prima de cada proveedor es la misma.
Hay cuatro lotes de materia prima disponibles de cada proveedor, y se harn tres determinaciones de la
pureza en cada lote. La situacin se describe en la figura 13-1.
Se trata de un diseo anidado de dos etapas, con los lotes anidados bajo los proveedores. A primera
vista se podra preguntar por qu no es un experimento factorial. Si fuera un experimento factorial, entonces el lote 1 se referira siempre al mismo lote, el lote 2 se referira siempre al mismo lote, etctera.
Evidentemente, no es ste el caso, ya que los lotes de cada proveedor son nicos para ese proveedor
particular. Es decir, el lote 1 del proveedor 1 no tiene relacin con el lote 1 de cualquier otro proveedor,
el lote 2 del proveedor 1 no tiene relacin con el lote 2 de cualquier otro proveedor, etctera. Para subrayar el hecho de que los lotes de cada proveedor son diferentes, se pueden numerar como 1, 2, 3 y 4
para el proveedor 1; 5, 6, 7 Y8 para el proveedor 2; y 9,10,11 Y12 para el proveedor 3, como se muestra en
la figura 13-2.
En ocasiones quiz no se sepa si un factor est cruzado en un arreglo factorial o anidado. Si los niveles
del factor pueden numerarse arbitrariamente como en la figura 13-2, entonces el factor est anidado.
557
558
CAPTULO 13
~ ~
Proveedores
Lotes
Observaciones
{Y'"
Y121
Yl3l
Y141
Y 211
Y221
Y231
Y241
Y311
Y321
Y331
Y341
y 112
Y122
Y132
Y142
Y 212
Y222
Y232
Y242
Y312
Y322
Y332
Y342
Y 113
Y123
Y133
Y143
Y 213
Y223
Y 233
Y243
Y313
Y323
Y333
Y343
13~ 1.1
Anlisis estadstico
(13-1)
Es decir, haya niveles del factor A, b niveles del factor B anidados bajo cada nivel deA, y n rplicas. El
subndicej(i) indica que el nivelj-simo del factor B est anidado bajo el nivel i-simo del factorA. Resulta conveniente considerar que las rplicas estn anidadas dentro de la combinacin de los nivelesdeA y
B; por lo tanto, se usa el subndice (ij)k para el trmino del error. Se trata de un diseo anidado balanceado, ya que hay el mismo nmero de niveles de B con cada nivel deA y el mismo nmero de rplicas. Puesto
que no todos los niveles del factor B aparecen dentro de todos los niveles del factor A, no puede haber interaccin entre A y B.
La suma de cuadrados total corregida puede escribirse como
a
2:2:2:
(Yijk - y... )2 = 2:2:2: [(Yi.. - Y... )+(Yij, - y;.. )+(Yijk - Yij, )]2
j=1 k=1
j=1 k=1
i=1
(13-2)
;=1
ah
abn
2:2:2:
(Yijk - y'.. )2 = bn 2: (Yi.. - Y... )2 + n 2:2: (Yij, - Yi.. )2 + 2:2:2: (Yijk - Yij,)2
j=1 k=1
j=1
j=1 k=1
i=1
;=1
i=1
(13-3)
i=1
ya que los tres trminos con productos cruzados son cero. La ecuacin 13-3 indica que puede hacerse la
particin de la suma de cuadrados total en una suma de cuadrados debida al factor A, una suma de cuadrados debida al factor B bajo los niveles deA, y una suma de cuadrados debida al error. Simblicamente,
la ecuacin 13-3 puede escribirse como
SST
= SS A + SSB(A) + SSE
(13-4)
Hay abn -1 grados de libertad para SSr. a -1 grados de libertad para SSA' a(b -1) grados de libertad para
SSB(A) y aben -1) grados de libertad para el error. Observe que abn -1 = (a -1) + a(b -1) + aben -1). Si
los errores son NID(O, ci), cada una de las sumas de cuadrados del miembro derecho de la ecuacin 13-4
Proveedores
Lotes
559
Tabla 13-1
E(MS)
A fijo
B fijo
A fijo
B aleatorio
A aleatorio
B aleatorio
puede dividirse por sus grados de libertad para obtener cuadrados medios con una distribucin independiente tales que el cociente de dos cuadrados medios cualesquiera se distribuye como F.
Los estadsticos apropiados para probar los efectos de los factores A y B dependen de siA y B son fijos
o aleatorios. Si los factoresAy B son fijos, se supone que ~;=1 Ti = Oy ~~=1 f3j(1) = O(i = 1,2, ..., a). Es decir,
la suma de los efectos del tratamiento A es cero, y la suma de los efectos del tratamiento B es cero dentro
de cada nivel deA. De manera alternativa, siA y B son aleatorios, se supone que T es NID(O, a;) y que f3j(i)
es NID(O, a~). Tambin es frecuente encontrar modelos mixtos conA fijo y B aleatorio. Los cuadrados
medios esperados pueden determinarse aplicando directamente las reglas del captulo 12. Para el modelo
mixto, estos cuadrados medios esperados suponen la forma restringida del modelo del captulo 12. En la
tabla 13-1 se muestran los cuadrados medios esperados para estas situaciones.
La tabla 13-1 indica que si los niveles deAy B son fijos, Ho:T; = Ose prueba con MSA/MS E y H o:f3j(;) = O
se prueba con MSB(A/MSE Si A es un factor fijo y B es aleatorio, entonces Ho:T = O se prueba con
MSA/MSB(A) y Ho:a~ = Ose prueba con MSB(A/MSE Por ltimo, si tantoA comoB son factores aleatorios,
Ho:a; = Ose prueba con MSA/MSB(A) y Ho:a~ = Ocon MSB(A/MSE El procedimiento de prueba se resume
en la tabla del anlisis de varianza, como se muestra en la tabla 13-2. Las frmulas para calcular las sumas
de cuadrados se obtienen desarrollando las cantidades de la ecuacin 13-3 y simplificando. stas son
1
=_"
2_~
~ Yi..
a
SS
abn
1 a
l a b
2
'SS B(A) = _
_ "
n"
LJ "
~ yij. _bn
LJ y..2
A
bn
1=1 J=l
SSE
/l
(13-7)
;=1 j=l
(13-6)
1=1
SST
(13-5)
1=1
11
Y...
2:2:2: Yijk - abn
2
(13-8)
Tabla 13-2 Tabla del anlisis de varianza para el diseo anidado de dos etapas
Fuente de
variacin
Suma de
cuadrados
eY;" --Y... f
Grados de
libertad
bn
B dentro deA
a(b -1)
Error
ab(n-l)
Total
abn-l
a-l
Cuadrado
medio
,i
560
CAPTULO 13
SSB(A)
SSB(A)
2: [1-;; 2: Y~. a
1=1
J=l
l];~
Esto expresa la idea de que SSB(A) es la suma de cuadrados entre los niveles de B para cada nivel deA, sumados en todos los niveles de A.
EJEMPLO
13~1
Considere una compaa que compra materia prima en lotes de tres proveedores diferentes. La pureza de
esta materia prima vara considerablemente, lo cual ocasiona problemas en la manufactura del producto
terminado. Quiere determinarse si la variabilidad de la pureza es atribuible a las diferencias entre los proveedores. Se seleccionan al azar cuatro lotes de materia prima de cada proveedor, y se hacen tres determinaciones de la pureza en cada lote. Se trata, desde luego, de un diseo anidado de dos etapas. Los datos,
despus de codificarlos restando 93, se muestran en la tabla 13-3. Las sumas de cuadrados se calculan de
la siguiente manera:
a
SST
= 2:2:2:
Y..
abn
Yijk -
SS
B(A)
1 a
~
bn LJ
= _1 ~ ~
n LJ LJ
2 __
Yij.
1=1 J=l
2
Yi..
1=1
3
= 89.67-19.75= 69.92
y
abn?
SSE
= 2:2:2:
1ab
Yijk - -
Tabla 13-3
2:2: Y~.
n i=l j=l
= 153.00- 89.67 = 63.33
i=l j=l k=l
Lotes
Yij.
1
-1
O
O
Yi..
3
-2
O
1
-1
2
-2
-3
--4
-9
-5
pureza - 93)
Proveedor 3
Proveedor 2
4
1
4
O
5
1
1
-2
-3
2
O
4
2
3
-1
O
-2
O
3
2
2
4
O
2
-2
O
2
--4
-3
3
1
-1
2
2
14
3
2
1
6
Tabla 13-4
561
Fuente de
variacin
Suma de
cuadrados
Proveedores
Lotes (dentro de los proveedores)
Error
Total
15.06
69.92
63.33
148.31
Grados de
libertad
Cuadrado
medio
7.53
7.77
2.64
9
24
35
Cuadrado medio
esperado
a + 3a~ +
a 2, + 3a~
a2
6 .-
Fo
Valor P
0.97
2.94
0.42
0.02
En la tabla 13-4 se resume el anlisis de varianza. Los proveedores son fijos y los lotes aleatorios, por lo
que los cuadrados medios esperados se obtienen de la columna de en medio de la tabla 13-1 y se repiten
por conveniencia en la tabla 13-4. Por el examen de los valores P, se concluira que no hay ningn efecto
significativo sobre la pureza debido a los proveedores, pero la pureza de los lotes de materia prima del
mismo proveedor difieren significativamente.
Las implicaciones prcticas de este experimento y del anlisis son muy importantes. El objetivo del
experimentador es encontrar la fuente de la variabilidad en la pureza de la materia prima. Si sta es resultado de las diferencias entre los proveedores, el problema puede resolverse seleccionando al "mejor"
proveedor. Sin embargo, esa solucin no es aplicable aqu porque la principal fuente de variabilidad es la
variacin de la pureza de un lote a otro dentro de los proveedores. Por lo tanto, el problema debe atacarse
trabajando con los proveedores para reducir su variabilidad de un lote a otro. Esto puede implicar modificaciones en los procesos de produccin de los proveedores o en su sistema interno de control de calidad.
Observe lo que habra pasado si se hubiera hecho un anlisis incorrecto de este diseo como un experimento factorial de dos factores. Si se considera que los lotes estn cruzados con los proveedores, se obtienen los totales de los lotes de 2, -3, -2 y 16, donde cada celda lote x proveedores contiene tres rplicas.
Por lo tanto, puede calcularse una suma de cuadrados debida a los lotes y una suma de cuadrados de interaccin. El anlisis de varianza factorial completo se muestra en la tabla 13-5, suponiendo un modelo mixto.
Este anlisis indica que los lotes difieren significativamente y que hay una interaccin significativa
entre los lotes y los proveedores. Sin embargo, es difcil ofrecer una interpretacin prctica de la interaccin lotes x proveedores. Por ejemplo, esta interaccin significativa quiere decir que el efecto del proveedor no es constante de un lote a otro? Adems, la interaccin significativa aunada al efecto no
significativo del proveedor podra llevar al analista a concluir que los proveedores en realidad difieren,
pero su efecto est enmascarado por la interaccin significativa.
Tabla 13-5
Anlisis de varianza incorrecto del diseo anidado de dos etapas del ejemplo 13-1 como un diseo factorial
(proveedores fijos, lotes aleatorios)
Fuente de
variacin
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
Proveedores (S)
Lotes (B)
Interaccin S x B
Error
Total
15.06
25.64
44.28
63.33
148.31
2
3
6
24
35
7.53
8.55
7.38
2.64
Valor P
1.02
3.24
2.80
0.42
0.04
0.03
562
CAPTULO 13
Clculos
Algunos paquetes de software de estadstica realizarn el anlisis de un diseo anidado. En la tabla 13-6
se presenta la salida del procedimiento Balanced ANOVA (anlisis de varianza balanceado) de Minitab
(utilizando el modelo restringido). Los resultados numricos concuerdan con los clculos manuales reportados en la tabla 13-4. Minitab tambin reporta los cuadrados medios esperados en la parte inferior de
la tabla 13-6. Recuerde que el smbolo Q[1] es un trmino cuadrtico que representa el efecto fijo de los
proveedores, por lo que en la notacin que se usa aqu,
~;
Q[1]=~
a-1
Por lo tanto, el trmino del efecto fijo en el cuadrado medio esperado de Minitab para los proveedores
12Q[1] = 12L;=l
(3-1) = 6L;=1
resultado que concuerda con el que se presenta en el algoritmo tabular de la tabla 13-4.
En ocasiones no se cuenta con un programa de computadora especializado para analizar diseos anidados. Sin embargo, observe, al comparar las tablas 13-4 y 13-5, que
T; /
T;,
Es decir, la suma de cuadrados de los lotes dentro de los proveedores se compone de la suma de cuadrados de los lotes ms la suma de cuadrados de la interaccin lofes x proveedores. Los grados de libertad
poseen una propiedad similar; es decir,
Lotes
Lotes x Proveedores
--+--------
Por lo tanto, un programa de computadora para analizar diseos factoriales podra usarse tambin para
analizar diseos anidados agrupando el "efecto principal" del factor anidado y las interacciones de ese
factor con el factor bajo el que est anidado.
Tabla 13-6
Salida de Minitab (Balanced ANOVA) [anlisis de varianza balanceado] para el ejemplo 13-1
Factor
Type Levels Values
Supplier
fixed
3
1
Batch(Supplier) random
4
1
2
2
3
3
DF
2
9
24
35
SS
15.056
69.917
63.333
148.306
MS
7.528
7.769
2.639
0.97
2.94
0.416
0.017
13~1.2
563
La herramienta principal para verificar el diagnstico es el anlisis residual. Para el diseo anidado de
dos etapas, los residuales son
El valor ajustado es
Yijk
y si se establecen las restricciones usuales sobre los parmetros del modelo (2: i f i
2, oo., a), entonces jl = Y... , f i
= Yi.. A
__
Yijk - Y..
= Yij. -
+(_
= Oy 2: j 13 j(i) = O, i = 1,
_ )+(_
Yi.. - Y..
_)
Yij. - Yi..
= Yij.
Por lo tanto, los residuales del diseo anidado de dos etapas son
(13-9)
donde Yij. son los promedios de los lotes individuales.
Las observaciones, los valores ajustados y los residuales para los datos de la pureza del ejemplo
13-1 son:
-1
O
-2
-3
-4
-2
O
1
1
4
O
1
-2
-3
O
4
2
-1
O
-2
O
3
2
2
1.00
-1.00
0.00
1.00
0.00
-1.00
-1.67
0.33
1.33
-0.67
2.33
-1.67
2.33
-0.67
-1.67
-2.00
2.00
0.00
0.00
1.00
-1.00
-1.67
1.33
0.33
0.00
564
CAPTULO 13
4
O
-2
O
2
1
-1
2
3
2
1
Yij.
2.00
-2.00
-2.00
0.00
2.00
0.33
-1.67
1.33
1.00
0.00
-1.00
Pueden realizarse ahora las verificaciones de diagnstico usuales; incluyendo las grficas de probabilidad
normal, la verificacin de puntos atpicos y la graficacin de los residuales contra los valores ajustados.
Como una ilustracin, en la figura 13-3 se grafican los residuales contra los valores ajustados y contra los
niveles del factor proveedor.
3
o
o
o
2
o
'"
..!!! 1
ro
:::l
"O
.;
o
o
-1
-2
-2
-3
-1
Valores predichos
al
3-
2-
j1-
"O
ro:::l
.~
c::
o
o
O
o
-11-
-21-
I
1
Proveedor
bl Grfica de los residuales contra el proveedor
Figura 13-3
i]
565
En la situacin de un problema como el que se describe en el ejemplo 13-1, las grficas de los residuales son particularmente tiles debido a la informacin de diagnstico adicional que contienen. Por ejemplo, el anlisis de varianza ha indicado que la pureza media de los tres proveedores no difiere pero que
hay una variabilidad estadsticamente significativa de un lote a otro (es decir, a~ > O). Pero, lla variabilidad dentro de los lotes es la misma para todos los proveedores? Se ha supuesto de hecho que ste es el
caso, y si no es cierto desde luego que nos gustara saberlo, ya que tiene un impacto prctico considerable
sobre la interpretacin de los resultados del experimento. La grfica de los residuales contra los proveedores de la figura 13-3b es una manera simple pero eficaz de verificar este supuesto. Puesto que la dispersin de los residuales es aproximadamente la misma para los tres proveedores, se concluira que la
variabilidad en la pureza de un lote a otro es aproximadamente la misma para los tres proveedores.
13~ 1.3
Componentes de la varianza
Para el caso de efectos aleatorios, el mtodo del anlisis de varianza puede usarse para estimar los componentes de la varianza
a~ ya;. Por los cuadrados medios esperados de la ltima columna de la tabla
13-1, se obtiene
cr,
(13-10)
~2
MSB(A) -MS E
(13-11)
=--'---'----
f3
11
y
~?
MS A -MSB(A)
a-=----------'------'
"
(13-12)
bl1
En muchas aplicaciones de diseos anidados interviene un modelo mixto, con el efecto principal (A)
fijo y el factor anidado (B) aleatorio. ste es el caso para el problema descrito en el ejemplo 13-1; los proveedores (factorA) son fijos, y los lotes de materia prima (factor B) son aleatorios. Los efectos de los proveedores pueden estimarse con
-5 13 -28
i 1 = Yi. - Y... = 12 - 36 = 36
~
2
= h. -
Y...
= 12 -
13
36
= 36
14
13
36
= 36
= h. - Y.. = 12 -
-1
29
cr
Para estimar los componentes de la varianza y a~, se elimina la lnea de la tabla del anlisis de varianza
relativo a los proveedores y se aplica el mtodo de estimacin del anlisis de varianza a las dos lneas siguientes. Se obtiene as
y
f2
f3
= MSB(A)
- MS E
11
566
Etapa 1
CAPTULO 13
Etapa 2
Etapa 3
Estos resultados se muestran tambin en la parte inferior de la salida de Minitab de la tabla 13-6. Por el
anlisis del ejemplo 13-1, se sabe que T: no difiere significativamente de cero, mientras que el componl(nte
de la varianza a~ es mayor que cero.
13~1.4
Un problema potencial en la aplicacin de los diseos anidados es que en ocasiones para obtener un nmero razonable de grados de libertad en el nivel ms alto, puede terminarse con muchos grados de libertad (quiz demasiados) en las etapas inferiores. Para ilustrar, suponga que se estn investigando las
diferencias potenciales en el anlisis qumico entre diferentes lotes de material. Se planea tomar cinco
muestras por lote, y cada muestra se medir dos veces. Si quiere estimarse un componente de la varianza
para los lotes, entonces 10 lotes no sera una eleccin irrazonable. Esto resulta en 9 grados de libertad
para los lotes, 40 grados de libertad para las muestras y 50 grados de libertad para las mediciones.
Una manera de evitar esta situacin es usar un tipo particular de diseo anidado no balanceado llamado diseo anidado por etapas. En la figura 13-4 se muestra un ejemplo de un diseo anidado escalonado. Observe que slo se toman dos muestras de cada lote; una de ellas se mide dos veces, mientras que la
otra una sola vez. Si haya lotes, entonces habr a -1 grados de libertad para los lotes (o, en general, la etapa superior), y todas las etapas inferiores tendrn exactamente a grados de libertad. Para ms informacin sobre el uso y el anlisis de estos diseos, ver Bainbridge [5], Smith y Beverly [104] y Nelson [88a, b,
c], as como el material suplementario del texto de este captulo.
13~2
ETAPAS
Los resultados de la seccin 13-1 pueden extenderse fcilmente al caso de m factores completamente anidados. A este diseo se le llamara diseo anidado de m etapas. Como un ejemplo, suponga que una fundicin quiere investigar la dureza de dos formulaciones diferentes de una aleacin de metal. Se preparan
tres hornadas de cada formulacin de la aleacin, se seleccionan dos lingotes al azar de cada hornada
para probarlos, y se hacen dos mediciones de la dureza en cada lingote. La situacin se ilustra en la figura
13-5.
En este experimento, las hornadas estn anidadas bajo los niveles del factor formulacin de la aleacin, y los lingotes estn anidados bajo los niveles del factor hornada. Por lo tanto, se trata de un diseo
anidado de tres etapas con dos rplicas.