13-6 PROBLEMAS
Mquina 1
Estacin
Ajuste de la potencia 1
Ajuste de la potencia 2
1
34.1
30.3
31.6
24.3
26.3
27.1
1
31.1
33.5
34.0
24.1
25.0
26.3
3
36.2
36.8
37.1
25.7
26.1
24.9
33.7
34.9
35.0
28.1
29.3
28.6
Mquina 2
2
33.1
34.7
33.9
24.1
25.1
27.9
3
32.8
35.1
34.3
26.0
27.1
23.9
1
32.9
33.0
33.1
24.2
26.1
25.3
587
Mquina 3
2
33.8
33.4
32.8
23.2
27.4
28.0
3
33.6
32.8
31.7
24.7
22.0
24.8
13-14. Suponga que en el problema 13-13 podran emplearse un gran nmero de ajustes de la potencia y que los dos
que se seleccionaron para el experimento se escogieron al azar. Obtener los cuadrados medios esperados para
esta situacin suponiendo la forma restringida del modelo mixto y hacer las modificaciones apropiadas al
anlisis anterior.
13-15. Analizar nuevamente el experimento del problema 13-14 suponiendo la forma no restringida del modelo
mixto. Puede usarse un paquete de software de computadora para hacerlo. Comentar las diferencias entre el
anlisis y las conclusiones del modelo restringido y el no restringido.
13-16. Un ingeniero de estructuras est estudiando la resistencia de una aleacin de aluminio adquirida de tres fabricantes. Cada fabricante entrega la aleacin en barras de tamao estndar de 1.0, 1.5 o 2.0 pulgadas. El
procesamiento de los diferentes tamaos de las barras a partir de un lingote comn implica tcnicas diferentes de forjado, por lo que este factor puede ser importante. Adems, las barras se forjan de lingotes fabricados en hornadas diferentes. Cada fabricante entrega dos ejemplares de prueba de cada tamao de las barras
de tres hornadas. Los datos de la resistencia resultantes se presentan a continuacin. Analizar los datos, suponiendo que los fabricantes y el tamao de las barras son fijos y las hornadas son aleatorias. Usar la forma
restringida del modelo mixto.
Fabricante 1
Hornada
Tamao de la barra: 1 pulgada
1tpulgadas
2 pulgadas
1
1.230
1.259
1.316
1.300
1.287
1.292
2
1.346
1.400
1.329
1.362
1.346
1.382
3
1.235
1.206
1.250
1.239
1.273
1.215
Fabricante 2
2
1
3
1.301 1.346 1.315
1.263 1.392 1.320
1.274 1.384 1.346
1.268 1.375 1.357
1.247 1.362 1.336
1.215 1.328 1.342
Fabricante 3
1
1.247
1.296
1.273
1.264
1.301
1.262
2
1.275
1.268
1.260
1.265
1.280
1.271
3
1.324
1.315
1.392
1.364
1.319
1.323
13-17. Resolver de nuevo el problema 13-16 utilizando la forma no restringida del modelo mixto. Puede usarse un
paquete de software de computadora para hacerlo. Comentar cualquier diferencia entre el anlisis y las conclusiones del modelo restringido y el no restringido.
13-18. Suponga que en el problema 13-16 las barras pueden adquirirse en muchos tamaos y que los tres tamaos
que realmente se utilizaron en el experimento fueron seleccionados al azar. Obtener los cuadrados medios
esperados para esta situacin y hacer las modificaciones apropiadas al anlisis anterior. Usar la forma restringida del modelo mixto.
13-19. La normalizacin del acero se hace calentndolo arriba de la temperatura crtica, recalentndolo y despus
enfrindolo con aire. Este proceso incrementa la resistencia del acero, refina el grano y homogeneiza la estructura. Se lleva a cabo un experimento para determinar el efecto de la temperatura y de la duracin del
tratamiento trmico sobre la resistencia del acero normalizado. Se seleccionan dos temperaturas y tres dura-
588
CAPTULO 13
ciones. El experimento se realiza calentando el horno a una temperatura seleccionada aleatoriamente e insertando tres ejemplares de prueba. Despus de 10 minutos se retira uno de ellos, despus de 20 minutos se
retira un segundo ejemplar y despus de 30 minutos se retira el ltimo. Entonces se corre la temperatura al
otro nivel y se repite el proceso. Se requieren cuatro corrimientos para recabar los datos, los cuales se muestran abajo. Analizar los datos y sacar conclusiones, suponiendo que ambos factores son fijos.
Temperatura, F
Corrimiento
1
Tiempo, minutos
10
20
30
10
20
30
10
20
30
10
20
30
1500
63
54
61
50
52
59
48
74
71
54
48
59
1600
89
91
62
80
72
69
73
81
69
88
92
64
13-20. Se disea un experimento para estudiar la dispersin de los pigmentos de una pintura. Se estudian cuatro
mezclas diferentes de un pigmento particular. El procedimiento consiste en preparar una mezcla particular y
en aplicarla despus a un panel utilizando tres mtodos (con brocha, por roco y con rodillo). La respuesta
medida es el porcentaje de reflectancia (coeficiente de reflexin) del pigmento. Se necesitan tres das para
correr el experimento, y los datos obtenidos se presentan a continuacin. Analizar los datos y sacar conclusiones, suponiendo que las mezclas y los mtodos de aplicacin son fijos.
Da
1
Mtodo de
aplicacin
1
2
3
1
2
3
1
2
3
1
64.5
68.3
70.3
65.2
69.2
71.2
66.2
69.0
70.8
Mezcla
2
3
66.3
74.1
69.5
73.8
73.1
78.0
65.0
73.8
70.3
74.5
72.8
79.1
66.5
72.3
69.0
75.4
74.2
80.1
4
66.5
70.0
72.3
64.8
68.3
71.5
67.7
68.6
72.4
13-21. Repetir el problema 13-20, suponiendo que las mezclas son aleatorias y que los mtodos de aplicacin son fijos.
13-22. Considere el diseo de parcelas con doble subdivisin del ejemplo 13-3. Suponga que este experimento se
conduce como se describe y que se obtienen los datos que se muestran en la siguiente tabla. Analizar los datos y sacar conclusiones.
13-6 PROBLEMAS
Rplicas
(o bloques)
Concentracin
de las dosis
Espesor de la pared
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
1
95
104
101
108
95
106
103
109
96
105
106
113
90
100
102
114
71
82
85
85
108
115
117
116
110
109
116
110
107
106
112
117
109
112
115
118
96
99
95
97
100
101
99
112
78
84
86
84
70
81
88
90
68
84
85
88
94
100
104
121
98
102
100
118
Tcnico
2
2
3
70
84
83
85
72
79
80
86
66
84
87
90
68
81
85
85
108
100
105
109
104
102
108
109
100
101
109
117
106
103
110
116
589
3
2
95
102
105
107
92
100
101
108
90
97
100
110
98
102
105
110
70
81
84
87
69
76
80
86
73
75
82
91
72
78
80
95
100
106
113
115
101
104
109
113
98
100
104
112
101
105
110
120
13-23. Resolver nuevamente el problema 13-22, suponiendo que los tcnicos se eligen al azar. Usar la forma restringida del modelo mixto.
13-24. Suponga que en el problema 13-22 se usaron cuatro tcnicos. Suponiendo que todos los factores son fijos,
cuntos bloques debern correrse para obtener un nmero adecuado de grados de libertad para probar las
diferencias entre los tcnicos?
13-25. Considere el experimento que se describe en el ejemplo 13-3. Demostrar cmo se determinara el orden en
que se corren la combinaciones de tratamientos si este experimento se realizara como a) una parcela con doble subdivisin, b) una parcela subdividida, c) un diseo factorial en un bloque aleatorizado y d) un diseo
factorial completamente aleatorizado.
Otros tpicos
de diseo y
anlisis
El tema de los experimentos diseados estadsticamente es muy amplio. En los captulos previos se ha
ofrecido una presentacin introductoria de muchos de los conceptos y mtodos bsicos, aunque en algunos casos slo se ha podido presentar un panorama general. Por ejemplo, hay exposiciones que ocupan un
libro sobre tpicos, como la metodologa de superficies de respuesta, los experimentos con mezclas, la estimacin de los componentes de la varianza y los diseos ptimos. En este captulo se presenta un panorama general de varios tpicos ms que el experimentador puede encontrar potencialmente tiles.
14,1
14,1.1
590
591
plo, eliminando trminos de interaccin. En ocasiones, una transformacin ser razonablemente eficaz
para conseguir de manera simultnea ms de uno de estos objetivos.
Se ha sealado ya que la familia de potencias de las transformacionesy* = es muy til, donde Aes el
parmetro de la transformacin que habr de determinarse (por ejemplo A = t significa usar la raz cuadrada de la respuesta original). Box y Cox [15] han indicado cmo puede estimarse el parmetro de la
transformacin Aal mismo tiempo que los dems parmetros del modelo (la media global y los efectos de
los tratamientos). La teora fundamental en su procedimiento utiliza el mtodo de mxima verosimilitud.
El procedimiento de clculo real consiste en efectuar, para varios valores de A, el anlisis de varianza estndar de
y(A)
l-1
ji In y
A=O
= A)/-1
O
:t:.
(14-1)
donde y = ln-1[(1/n) L lny] es la media geomtrica de las observaciones. La estimacin de mxima verosimilitud dd es el valor para el que la suma de cuadrados del error, por ejemplo SSE(A), es un mnimo. Este
valor de Ase encuentra generalmente construyendo una grfica de SSE(A) contra Ay leyendo despus en la
grfica el valor de Aque minimiza SSE(A). En general, son suficientes entre 10 y 20 valores de Apara estimar el valor ptimo. Si se necesita una estimacin ms precisa de A, podra realizarse una segunda iteracin utilizando un nmero mayor de valores.
Observe que no es posible seleccionar el valor de Acomparando directamente las sumas de cuadrados
del error obtenidas en los anlisis de varianza de yA, ya que para cada valor de Ala suma de cuadrados del
error se mide en una escala diferente. Adems, surge un problema con y cuando A = O; a saber, cuando A
tiende a cero, tiende a la unidad. Es decir, cuando A = O, todos los valores de la respuesta son una constante. El componente (i -1 )/A de la ecuacin 14-1 alivia este problema porque cuando Atiende a cero, (y"
- 1 )/A tiende a un lmite de In y. El componente del divisor )/ - 1 de la ecuacin 14-1 reescala las respuestas para que las sumas de cuadrados del error sean comparables directamente.
Al utilizar el mtodo de Box-Cox, se recomienda que el experimentador use elecciones simples de A,
ya que es probable que la diferencia prctica entre A = 0.5 y A = 0.58 sea pequea, pero la transformacin
de la raz cuadrada (A = 0.5) es mucho ms fcil de interpretar. Obviamente, los valores de Aprximos a la
unidad sugeriran que no es necesaria ninguna transformacin.
Una vez que se ha seleccionado un valor de Apor el mtodo de Box-Cox, el experimentador puede
analizar los datos utilizando como la respuesta, a menos desde luego que A = O, en cuyo caso se usa In y.
Es perfectamente aceptable utilizar y(A) como la respuesta real, aun cuando las estimaciones de los parmetros del modelo tendrn una diferencia de escala y un corrimiento del origen en comparacin con los
resultados obtenidos cuando se usa (o In y).
Es posible encontrar un intervalo de confianza aproximado de 100(1 - a) por ciento para Acalculando
(14-2)
donde 11 es el nmero de grados de libertad, y graficando una recta paralela al ejeA a la altura SS* sobre la
grfica de SSE(A) contraA. Entonces, allocalizarlos puntos sobre el ejeA donde SS* corta la curva SSE(A),
pueden leerse directamente en la grfica los lmites de confianza paraA. Si este intervalo de confianza incluye el valor A = 1, esto implica (como se seal antes) que los datos no soportan la necesidad de una
transformacin.
in
,1,
592
CAPTULO 14
EJEMPLO
14~
El procedimiento de Box-Cox se ilustrar utilizando los datos de la descarga pico presentados originalmente en el ejemplo 3-5. Recuerde que se trata de un experimento con un solo factor (ver la tabla 3-7
para los datos originales). Utilizando la ecuacin 14-1 se calcularon los valores de SSE(A) para varios valores de A:
A
-1.00
-0.50
-0.25
0.00
0.25
0.50
0.75
1.00
1.25
1.50
SSE(A)
7922.11
687.10
232.52
91.96
46.99
35.42
40.61
62.08
109.82
208.12
En la figura 14-1 se muestra una gr~fica de los valores prximos al mnimo, en la que se observa que
A =0.52 produce un valor mnimo de aproximadamente SSE(A) = 35.00. Un intervalo de confianza aproximado de 95% paraA se encuentra calculando la cantidad SS* de la ecuacin 14-2 de la siguiente manera:
SS
= SSE(A)
(1+ t~.;~20 )
= 35.00 [1 + (2.~~6)2 ]
= 42.61
Al representar SS* en la grfica de la figura 14-1 y al leer los puntos de la escala A donde esta recta interseca la curva, se obtienen los lmites de confianza inferior y superior deA deA- = 0.27y A+ = 0.77. Puesto que
estos lmites de confianza no incluyen el valor 1, es correcto el uso de una transformacin, y la transformacin de la raz cuadrada (A = 0.50) que se us en realidad se justifica con facilidad.
110
100
90
80
70
60
50
40
30
20
10
O
0.00
Figura 14-1
14-1.
0.25
/.,-; 0.27
0.50
0.75
1.00
1.25 /.,
/.,+; 0.77
20.32
16.14
ro
::J
'O
'iij
11.95
~
c:
--'
7.76
3.58
-3
-2
-1
o
Lambda
Figura 142
593
594
14.1.2
CAPTULO 14
Con frecuencia las transformaciones de datos son una forma muy eficaz de abordar el problema de las
respuestas no normales y de la desigualdad asociada de la varianza. Como se ha visto en la seccin anterior, el mtodo de Box-Cox es una forma sencilla y eficaz de seleccionar la forma de la transformacin.
Sin embargo, puede haber problemas asociados con el uso de una transformacin de datos.
Un problema es que el experimentador puede sentirse incmodo al trabajar con la respuesta en la escala transformada. Es decir, el experimentador se interesa en el nmero de defectos, no en la raz cuadrada del nmero de defectos, o en la resistividad en lugar del logaritmo de la resistividad. Por otra parte, si
una transformacin en realidad tiene xito y mejora el anlisis y el modelo asociado de la respuesta, los
experimentadores adoptarn por lo general con rapidez la nueva mtrica.
Un problema ms serio es que una transformacin puede resultar en un valor sin sentido para la variable de respuesta en alguna porcin del espacio de los factores del diseo que es de inters para el experimentador. Por ejemplo, suponga que se ha usado la transformacin de la raz cuadrada en un
experimento que incluye el nmero de defectos observados en obleas de semiconductores, y para alguna
porcin de la regin de inters la raz cuadrada predicha del conteo de defectos es negativa. Es probable
que esto suceda en situaciones en las que el nmero real de defectos observados es pequeo. Por consiguiente, el modelo del experimento ha producido una prediccin evidentemente no confiable justo en la
regin donde sera deseable que este modelo tuviera un buen desempeo predictivo.
Por ltimo, como se seal en la seccin 14-1.1, es frecuente el uso de transformaciones a fin de estabilizar la varianza, inducir la normalidad y simplificar el modelo. No existe la seguridad de que una transformacin conseguir eficazmente todos estos objetivos al mismo tiempo.
Una alternativa del enfoque tpico de la transformacin de datos seguida del anlisis estndar de mnimos cuadrados de la respuesta transformada es usar el modelo lineal generalizado. Se trata de un enfoque desarrollado por Nelder y Wedderburn [87] que en esencia unifica modelos lineales y no lineales con
respuestas normales y no normales. McCullagh y Nelder [76] ofrecen un completo estudio de los modelos
lineales generalizados y Myers y Montgomery [85b] proporcionan un tutorial. Tambin se presentan detalles adicionales en el material suplementario del texto de este captulo. Se ofrecer un panorama general
de los conceptos y se ilustrarn con dos ejemplos breves.
Un modelo lineal generalizado es bsicamente un modelo de regresin (el modelo de un diseo experimental tambin es un modelo de regresin). Como todos los modelos de regresin, est constituido por
un componente aleatorio (lo que se ha llamado generalmente el trmino del error) y una funcin de los
factores del diseo (las x) y algunos parmetros desconocidos (las f3). En un modelo de regresin lineal de
la teora normal estndar se escribe
(14-3)
donde se supone que el trmino del error e tiene una distribucin normal con media cero y varianza constante, y la media de la variable de respuesta y es
(14-4)
A la parte x'p de la ecuacin 14-4 se le llama predictor lineal. El modelo lineal generalizado contiene la
ecuacin 14-3 como un caso especial.
En un modelo lineal generalizado, la variable de respuesta puede tener cualquier distribucin que
sea un miembro de la familia exponencial. Esta familia incluye las distribuciones normal, de Poisson, bi
595
nomial, exponencial y gamma, por lo que la familia exponencial es una coleccin rica y flexible de distribuciones aplicables en muchas situaciones experimentales. Adems, la relacin entre la media de la
respuesta f-l y el predictor lineal x'P se determina por una funcin de enlace.
g(f-l) = x 'fJ
(14-5)
El modelo de regresin que representa la respuesta media est dado entonces por
(14-6)
Por ejemplo, a la funcin de enlace que lleva al modelo de regresin lineal ordinario en la ecuacin 14-3
se le llama enlace identidad, ya quel = g-\x'P) = x'p. Como otro ejemplo, el enlace log (logartmico)
1o(f-l) = x'fJ
(14-7)
produce el modelo
f-l
= ex'P
(14-8)
El enlace logartmico se usa con frecuencia con datos de conteos (respuesta de Poisson) y con respuestas
continuas que presentan una distribucin que tiene una cola larga a la derecha (la distribucin exponencial o gamma). Otra funcin de enlace importante que se usa con datos binomiales es el enlace logit
lo (1 f-l) = x'fJ
Esta eleccin de la funcin de enlace lleva al modelo
1
f-l = 1 +ex'P
(14-9)
(14-10)
Hay muchas elecciones posibles de la funcin de enlace, pero debe ser siempre montona y diferenciable.
Observe asimismo que en un modelo lineal generalizado, la varianza de la variable de respuesta no tiene
que ser una constante; puede ser una funcin de la media (y de las variables predictoras a travs de la funcin de enlace). Por ejemplo, si la respuesta es de Poisson, la varianza de la respuesta es exactamente
igual a la media.
Para usar un modelo lineal generalizado en la prctica, el experimentador debe especificar una distribucin de la respuesta y una funcin de enlace. Despus se hace el ajuste del modelo o la estimacin de
los parmetros por el mtodo de mxima verosimilitud, el cual para la familia exponencial resulta ser una
versin iterativa de los mnimos cuadrados ponderados. Para los modelos de regresin lineal o de diseos
experimentales ordinarios con una varia1?le de respuesta normal, esto se reduce a los mnimos cuadrados
estndares. Utilizando un enfoque que es anlogo al anlisis de varianza de datos de la teora normal,
pueden hacerse inferencias y la verificacin de diagnsticos para un modelo lineal generalizado. Referirse a Myers y Montgomery [85b] para los detalles y ejemplos. Dos paquetes de software que soportan el
modelo lineal generalizado son SAS (PROC GENMOD) Y S-PLUS.
EJEMPLO
14~
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
\JI
\O
01
Tabla 14-1
Anlisis de mnimos cuadrados y del modelo lineal generalizado para el experimento rejilla de recuadros abiertos
Utilizando mtodos de mnimos cuadrados con la
transformacin
de los datos de la raz cuadrada modificada de Freeman y Tukey
Transformados
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
No transformados
Longitud del
intervalo de confianza
del 95%
Valor
predicho
Intervalo de
confianza de
95%
Valor
predicho
Intervalo de
confianza de
95%
Valor
predicho
Intervalo de
confianza
de 95%
Mnimos
cuadrados
GLM (modelo
lineal generalizado)
5.50
3.95
1.52
3.07
1.52
3.07
5.50
3.95
1.08
-0.47
1.96
3.50
1.96
3.50
1.08
-0.47
(4.14,6.85)
(2.60,5.31)
(0.17,2.88)
(1.71,4.42)
(0.17, 2.88)
(1.71,4.42)
(4.14,6.85)
(2.60,5.31)
(-0.28,2.43)
(-1.82, 0.89)
(0.61,3.31)
(2.15, 4.86)
(0.61,3.31)
(2.15, 4.86)
(-0.28,2.43)
(-1.82,0.89)
29.70
15.12
1.84
8.91
1.84
8.91
29.70
15.12
0.71
*
3.36
11.78
3.36
11.78
0.71
*
(16.65,46.41)
(6.25, 27.65)
(1.69,7.78)
(2.45, 19.04)
(1.69, 7.78)
(2.45, 19.04)
(16.65,46.41)
(6.25, 27.65)
(*,5.41)
(*,0.36)
(0.04, 10.49)
(4.13,23.10)
(0.04, 10.49)
(4.13,23.10)
(*,5.41)
(*,0.36)
51.26
11.74
1.12
4.88
1.12
4.88
51.26
11.74
0.81
0.19
1.96
8.54
1.96
8.54
0.81
0.19
(42.45,61.90)
(8.14, 16.94)
(0.60, 2.08)
(2.87, 8.32)
(0.60, 2.08)
(2.87, 8.32)
(42.45, 61.90)
(8.14, 16.94)
(0.42, 1.56)
(0.09, 0.38)
(1.16, 3.30)
(5.62, 12.98)
(1.16, 3.30)
(5.62, 12.98)
(0.42, 1.56)
(0.09, 0.38)
29.76
21.39
6.09
16.59
6.09
16.59
29.76
21.39
*
*
10.45
18.96
10.45
18.97
*
*
19.45
8.80
1.47
5.45
1.47
5.45
19.45
8.80
1.13
0.29
2.14
7.35
2.14
7.35
1.13
0.29
"i~
. .,J