Está en la página 1de 10

14-1 RESPUESTAS Y TRANSFORMACIONES NO NORMALES

597

diseado. Como se seal en el inciso f del problema 8-29, los autores utilizaron una modificacin de la
transformacin de la raz cuadrada que llev al modelo

(.JY +.Jy+ 1) /2= 2.513- O.996x

-1.21x 6

O. 772x 2 x 7

donde, como de costumbre, las x representan los factores del diseo codificados. Esta transformacin
hace un excelente trabajo para estabilizar la varianza del nmero de defectos. En las dos primeras secciones de la tabla 14-1 se presenta parte de la informacin acerca de este modelo. Bajo el encabezado
"Transformados", la primera columna contiene la respuesta predicha. Observe que hay dos valores predichos negativos. El encabezado "No transformados" presenta los valores predichos no transformados, junto con los intervalos de confianza de 95% para la respuesta media en cada uno de los 16 puntos del diseo.
Puesto que hubo algunos valores predichos negativos, as como lmites de confianza inferiores negativos,
no fue posible calcular los valores de todas las entradas de esta seccin de la tabla.
La respuesta es en esencia una raz cuadrada del conteo de los defectos. Un valor predicho negativo
es claramente ilgico. Observe que esto ocurre donde los conteos observados fueron pequeos. Si es importante usar el modelo para predecir el desempeo en esta regin, el modelo puede ser no confiable.
Esto no deber tomarse como una crtica del experimento original ni del anlisis de Bisgaard y Fuller. Fue
un experimento de exploracin en extremo exitoso que defini con toda claridad las variables importantes del proceso. La prediccin no fue una de las metas originales, y tampoco fue el objetivo del anlisis
realizado por Bisgaard y Fuller.
Sin embargo, si hubiera sido importante obtener un modelo de prediccin, probablemente un modelo
lineal generalizado habra sido una buena alternativa para el enfoque de la transformacin. Myers y
Montgomery usan un enlace lag (logartmico) (ecuacin 14-7) y una respuesta de Poisson para ajustar
exactamente el mismo predictor lineal dado por Bisgaard y Fuller. Esto produce el modelo
y = e (L128-0.896x, - L176x 6 -o. 737 x,x,)
La tercera seccin de la tabla 14-1 contiene los valores predichos de este modelo y los intervalos de
confianza de 95% para la respuesta media en cada punto del diseo (obtenida con el procedimiento
PROC GENMOD de SAS). No hay valores predichos negativos (lo cual se asegura con la eleccin de la
funcin de enlace) ni lmites de confianza inferiores negativos. En la ltima seccin de la tabla se comparan las longitudes de los intervalos de confianza de 95% para la respuesta no transformada y el modelo lineal generalizado (GLM). Observe que los intervalos de confianza del modelo lineal generalizado son
uniformemente ms C01toS que sus contrapartes de mnimos cuadrados. Esto es un slido indicio de que
el enfoque del modelo lineal generalizado ha explicado la variabilidad y ha producido un modelo superior
en comparacin con el enfoque de la transformacin.

EJEMPLO

11

14~3

El experimento del hilado de estambre


En la tabla 14-2 se presenta un diseo factorial 33 que se realiz para investigar el desempeo de un hilado
de estambre bajo ciclos de carga repetida. El experimento se describe completo en Box y Draper [16b]. La
respuesta es el nmero de ciclos hasta una falla. De manera tpica, los datos de confiabilidad como stos
son no negativos y continuos, y con frecuencia tienen una distribucin con una cola derecha alargada.
Los datos se analizaron inicialmente utilizando el enfoque estndar (mnimos cuadrados), y la transformacin de datos fue necesaria para estabilizar la varianza. Se encuentra que el logaritmo de los datos

598

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

Tabla 14-2 El experimento del hilado de estambre

Corrida
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

Xl

X2

X3

-1
-1
-1
-1
-1
-1
-1
-1
-1
O
O
O
O
O
O
O
O
O
1
1
1
1
1
1
1
1
1

-1
-1
-1
O
O
O
1
1
1
-1
-1
-1
O
O
O
1
1
1
-1
-1
-1
O
O
O
1
1
1

-1
O
1
-1
O
1
-1
O
1
-1
O
1
-1
O
1
-1
O
1
-1
O
1
-1
O
1
-1
O
1

Ciclos hasta
una falla
674
370
292
338
266
210
170
118
90
1414
1198
634
1022
620
438
442
332
220
3636
3184
2000
1568
1070
566
1140
884
360

Logaritmo
de los ciclos
hasta una falla
2.83
2.57
2.47
253
2.42
2.32
2.23
2.07
1.95
3.15
3.08
2.8
3.01
2.79
2.64
2.65
2.52
2.34
3.56
3.5
3.3
3.19
3.03
2.75
3.06
2.95
2.56

de los ciclos hasta una falla produce un modelo adecuado en trminos del ajuste global del modelo, as
como grficas satisfactorias de los residuales. El modelo es

logy= 2 751+0.3617x1 - O.2739xz - O.1711x 3


o en trminos de la respuesta original, ciclos hasta una falla,

y= 10Z' 751+0.3617.<, -0.Z739x2 -0.1711x3


Este experimento se analiz tambin utilizando el modelo lineal generalizado, seleccionando la distribucin gamma para la respuesta y el enlace lag (logartmico). Se us exactamente la misma forma del
modelo encontrada por el anlisis de mnimos cuadrados de la respuesta con la transformacin logartmica. El modelo que result es

y = e6.3489+0.8425x -O. 6313x2 -0.3851x3


En la tabla 14-3 se presentan los valores predichos del modelo de mnimos cuadrados y del modelo lineal
generalizado, junto con los intervalos de confianza de 9i% para la respuesta media de cada uno de los 27

!;FSHi=Et7F.... ~M

... "r~~

- ,. """'"1 .

'-j

Tabla 14-3

Anlisis del modelo de mnimos cuadrados y del modelo lineal generalizado para el experimento del hilado de estambre
Mtodos de mnimos cuadrados con la transformacin
logartmica de los datos
Transformados

\.1l

\O
\O

'",4

~'-.....

Observacin

Valor
predicho

Intervalo de
confianza
de
95%

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

2.83
2.66
2.49
2.56
2.39
2.22
2.29
2.12
1.94
3.20
3.02
2.85
2.92
2.75
2.58
2.65
2.48
2.31
3.56
3.39
3.22
3.28
3.11
2.94
3.01
2.84
2.67

(2.76,2.91)
(2.60,2.73)
(2.42, 2.57)
(2.50, 2.62)
(2.34,2.44)
(2.15,2.28)
(2.21, 2.36)
(2.05, 2.18)
(1.87, 2.02)
(3.13, 3.26)
(2.97, 3.08)
(2.79,2.92)
(2.87,2.97)
(2.72, 2.78)
(2.53, 2.63)
(2.58,2.71)
(2.43, 2.53)
(2.24, 2.37)
(3.48, 3.63)
(3.32, 3.45)
(3.14,3.29)
(3.22, 3.35)
(3.06, 3.16)
(2.88,3.01)
(2.93, 3.08)
(2.77,2.90)
(2.59,2.74)

No transformados

Modelo lineal generalizado

Valor
predicho

Intervalo de
confianza
de
95%

Valor
predicho

Intervalo de
confianza
de
95%

682.50
460.26
310.38
363.25
244.96
165.20
193.33
130.38
87.92
1569.28
1058.28
713.67
835.41
563.25
379.84
444.63
299.85
202.16
3609.11
2433.88
1641.35
1920.88
1295.39
873.57
1022.35
689.45
464.94

(573.80,811.52)
(397.01, 533.46)
(260.98, 369.06)
(313.33,421.11)
(217.92, 275.30)
(142.50, 191.47)
(162.55,229.93)
(112.46, 151.15)
(73.93,104.54)
(1353.94, 1819.28)
(941.67,1189.60)
(615.60,827.37)
(743.19, 938.86)
(523.24, 606.46)
(337.99,426.97)
(383.53,515.35)
(266.75,336.98)
(174.42,234.37)
(3034.59, 4292.40)
(2099.42, 2821.63)
(1380.07, 1951.64)
(1656.91, 2226.90)
(1152.66, 1455.79)
(753.53, 1012.74)
(859.81,1215.91)
(594.70,799.28)
(390.93, 552.97)

680.52
463.00
315.01
361.96
246.26
167.55
192.52
130.98
89.12
1580.00
1075.00
731.50
840.54
571.87
389.08
447.07
304.17
206.95
3670.00
2497.00
1699.00
1952.00
1328.00
903.51
1038.00
706.34
480.57

(583.83, 793.22)
(407.05,526.64)
(271.49, 365.49)
(317.75,412.33)
(222.55, 272.51)
(147.67,190.10)
(165.69,223.70)
(115.43, 148.64)
(76.87, 103.32)
(1390.00, 1797.00)
(972.52, 1189.00)
(644.35,830.44)
(759.65, 930.04)
(536.67, 609.38)
(351.64,430.51)
(393.81,507.54)
(275.13, 336.28)
(182.03,235.27)
(3165.00, 4254.00)
(2200.00, 2833.00)
(1462.00, 1974.00)
(1720.00, 2215.00)
(1200.00, 1470.00)
(793.15, 1029.00)
(894.79, 1205.00)
(620.99, 803.43)
(412.29,560.15)

Longitud del
intervalo de confianza
del 95%
GLM
(modelo
Mnimos
lineal
cuadrados generalizado)
237.67
136.45
108.09
107.79
57.37
48.97
67.38
38.69
30.62
465.34
247.92
211.77
195.67
83.22
88.99
131.82
70.23
59.95
1257.81
722.21
571.57
569.98
303.14
259.22
356.10
204.58
162.04

209.39
119.59
94.00
94.58
49.96
42.42
58.01
33.22
26.45
407.00
216.48
186.09
170.39
72.70
78.87
113.74
61.15
53.23
1089.00
633.00
512.00
495.00
270.00
235.85
310.21
182.44
147.86

0;;:;"

600

CAPTULO 14

OTROS TPICOS DE DISEO Y ANLISIS

puntos del diseo. La comparacin de las longitudes de los intervalos de confianza revela que es posible
que el modeo lineal generalizado sea un mejor predictor que el modelo de mnimos cuadrados.
o

Los modelos lineales generalizados han encontrado amplia aplicacin en la investigacin y el desarrollo biomdico y farmacutico. Conforme ms paquetes de software incluyan esta capacidad, encontrar una aplicacin ms amplia en el mbito de la investigacin y el desarrollo industrial general.

14~2

DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

El centro de atencin principal de este libro ha sido el anlisis de diseos factoriales balanceados, es decir, los casos en que en cada celda hay el mismo nmero II de observaciones. Sin embargo, es comn encomrar situaciones en las que el nmero de observaciones en las celdas son desiguales. Estos diseos
factoriales no balanceados ocurren por varias razones. Por ejemplo, el experimentador puede haber diseado inicialmente un experimento balanceado, pero debido a problemas imprevistos cuando se corre el
experimento, los cuales resultan en la prdida de algunas observaciones, termina trabajando con datos no
balanceados. Por otra parte, algunos experimentos no balanceados se disean expresamente de este
modo. Por ejemplo, ciertas combinaciones de tratamientos pueden ser ms costosas o ms difciles de correr que otras, por lo que pueden hacerse menos observaciones en esas celdas. De manera alternativa, algunas combinaciones de tratamientos pueden ser de mayor inters para el experimentador debido a que
representan condiciones nuevas o no exploradas, por lo que puede optar por obtener rplicas adicionales
de dichas celdas.
La propiedad de ortogonalidad de los efectos principales y las interacciones, presente en los datos balanceados, no es vlida en el caso no balanceado. Esto significa que las tcnicas del anlisis de varianza
usual no son aplicables. Por consiguiente, el anlisis de factoriales no balanceados es mucho ms difcil
que el de los diseos balanceados.
En esta seccin se ofrece un breve panorama general de los mtodos para abordar los factoriales no
balanceados, centrando la atencin en el caso del modelo de efectos fijos con dos factores. Suponga que
el nmero de observaciones en la celda ij-sima es nij' Adems, sea lli. = L~=l llij el nmero de observaciones en el rengln i-simo (el nivel i-simo del factor A), sea II J = L ~=1 llij el nmero de observaciones de la
columnaj-sima (el nivelj-simo del factor B) y seall.. = L~=l L~=l nij el nmero total de observaciones.

14~2.1

. Datos proporcionales: un caso sencillo

Una de las situaciones que incluye datos no balanceados presenta escasa dificultad para el anlisis; se trata del caso de los datos proporcionales. Es decir, el nmero de observaciones en la celda ij-sima es
ll ..
IJ

ll.l. II .).

=-II

(14-11)

Esta condicin implica que el nmero de observaciones en dos renglones o columnas cualesquiera es proporcional. Cuando ocurren datos proporcionales, puede emplearse el anlisis de varianza estndar. Slo

14-2 DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

601

es necesario hacer modificaciones menores en las frmulas del clculo manual de las sumas de cuadrados,
las cuales quedan como
b

SST

nij

= 2:2:2:
i=1 j=1 k=1

SS A

~
= L.J

ll i .

i=l

SSB

= 2:

nj

= L.JL.J
~~
i=1 j=1

SSE

11

Y.~. - Y.~
-

j=1

SS

Yi.. Y...
---

= SST -

11

Y~. - Y.~ -SS A -SSB


llij

11..

SS A

= ~~
i=1 j=1 k=1

SSB

SS ~

Y~k- ~ ~~.
i=1 j=1

ij

Como un ejemplo de datos proporcionales, considere el experimento del diseo de la batera del
ejemplo 5-1. En la tabla 14-4 se muestra una versin modificada de los datos originales. Desde luego, los
datos son proporcionales; por ejemplo, en la celda 1,1 se tienen
_ 111 n 1 _ 10(8) _ 4
1111 11
20 observaciones. Los resultados que se obtienen al aplicar el anlisis de varianza usual a estos datos se presentan en la tabla 14-5. Tanto el tipo de material como la temperatura son significativos, lo cual concuerda
con el anlisis del conjunto completo de datos del ejemplo 5-1. Sin embargo, la interaccinque se observ
en el ejemplo 5-1 no est presente.
14~2.2

Mtodos aproximados

Cuando los datos no balanceados no se apartan demasiado del caso balanceado, en ocasiones es posible
usar procedimientos aproximados que convierten el problema no balanceado en uno balanceado. Esto

Tabla 14-4

Experimento del diseo de la batera con datos proporcionales


Temperatura, F

Tipo de
material

15
=4
130
74

155
180

= 2
159

126

= 2
138

160

/1 11

/1. 1

Y.1. = 1122

40
75

= 2
136

115

/1 13

/1 22

/1 31

= 4
34
80

/1 12

/1 21

125

70

/132

/1.2 = 8
Y.2. = 769

70

58

= 10

= 896
/1 2. = 5

Y1..

Y2.. = 581

= 1
96

/1 3. = 5
Y3.. = 683

/1 33

139

/11.

= 1
45

/1']3

= 2

150

= 2

n3 = 4
Y.3. = 269

/1

= 20

Y.::

= 2160

,1

:,[

'I

ji

602

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

11

11

Tabla 14-5

)1

:11
1'1
'[

Anlisis de varianza de los datos del diseo de la batera


de la tabla 14-4

Fuente de
variacin

Suma de
cuadrados

Grados de
libertad

Cuadrado
medio

Tipos de material
Temperatura
Interaccin
Error
Total

8,170.400
16,090.875
5,907.725
8,981.000
39,150.000

2
2
4
11
19

4,085.20
8,045.44
1,476.93
816.45

Fo
5.00
9.85
1.18

hace, desde luego, que el anlisis sea tan slo aproximado, pero el anlisis de datos balanceados es tan
sencillo que con frecuencia el experimentador se ve tentado a usarlo. En la prctica, es necesario decidir
cundo los datos no son lo suficientemente diferentes del caso balanceado para hacer que el grado de
aproximacin introducido sea relativamente de escasa importancia. A continuacin se describen brevemente algunos de estos mtodos aproximados. Se supone que todas las celdas contienen al menos una observacin (es decir, 11ij 2': 1).
Estimacin de observaciones faltantes

Si slo unas cuantas 11ij son diferentes, un procedimiento razonable es estimar los valores faltantes. Por
ejemplo, considere el diseo no balanceado de la tabla 14-6. Evidentemente, estimar el nico valor faltante de la celda 2,2 es un enfoque razonable. Para un modelo con interaccin, la estimacin del valor faltante en la celda ij-sima que minimiza la suma de cuadrados del error es Yij' Es decir, el valor faltante se
estima tomando el promedio de las observaciones que estn disponibles en esa celda.
El valor estimado se trata como un dato real. La nica modificacin del anlisis de varianza es reducir
los grados de libertad del error en el nmero de observaciones faltantes que se han estimado. Por ejemplo,
si se estima el valor faltante en la celda 2,2 de la tabla 14-6, se usaran 26 grados de libertad en lugar de 27.
Apartado de datos

Considere los datos de la tabla 14-7. Observe que la celda 2,2 slo tiene una observacin ms que las otras.
Estimar los valores faltantes de las ocho celdas restantes quiz no sea una buena idea en este caso, ya que
esto resultara en estimaciones equivalentes a cerca de 18% de los datos finales. Una alternativa es apartar una de las observaciones de la celda 2,2, para obtener as un diseo balanceado con 11 = 4 rplicas.
La observacin que se aparte deber elegirse al azar. Adems, en lugar de descartar completamente
la observacin, podra reintegrarse al diseo, despus elegir al azar otra observacin para apartarla y re-

Tabla 14-6

Los valores nij para un


diseo no balanceado
Columnas

Renglones

1
2
3

4
4
4

4
3
4

4
4
4

14-2 DATOS NO BALANCEADOS EN UN DISEO FACTORIAL

Tabla 14-7

603

Los valores n,j para un


diseo no balanceado

Columnas
Renglones
1
2
3

4
4
4

4
5
4

4
4
4

petir el anlisis. Y, se esperara, estos dos anlisis no llevarn a interpretaciones antagnicas de los datos.
Si lo hacen, se sospecha que la observacin que se apart es un valor atpico o disparatado y deber manejarse en consecuencia. En la prctica es improbable que ocurra esta confusin cuando slo se aparta un
nmero reducido de observaciones y la variabilidad dentro de las celdas es pequea.
Mtodo de las medias no ponderadas

En este enfoque, introducido por Yates [IBa], los promedios de las celdas se tratan como si fueran datos
y son objeto de un anlisis de datos balanceados estndar para obtener las sumas de cuadrados de los renglones, las columnas y la interaccin. El cuadrado medio del error se encuentra como
b

nij

LLL(Yijk - Yij.)2

= _i=_l....:j_=l_k_=_l

MS

(14-12)

-ah

11

Entonces, MS E estima er, la varianza de Yijk, una observacin individual. Sin embargo, se ha realizado un
anlisis de varianza de los promedios de las celdas, y como la varianza del promedio de la celda ij-sima es
er/11ij' el cuadrado medio del error que se usa en realidad en el anlisis de varianza deber ser una estimacin de la varianza promedio de las Yij, por ejemplo
a

"
" a
LJLJ

V(Yij,)=

i=l j=l

ah

/11 IJ..

= ~ LL
ah

i=l j=l

11ij

(14-13)

Utilizando MSE de la ecuacin 14-12 para estimar er en la ecuacin 14-13, se obtiene

MS~=MSE! ~
ah

i=l j=l

11ij

(14-14)

como el cuadrado medio del error (con 11.. -ah grados de libertad) que se usar en el anlisis de varianza.
El mtodo de las medias no ponderadas es un procedimiento aproximado porque las sumas de cuadrados de los renglones, las columnas y la interaccin no se distribuyen como una variable aleatoria
ji-cuadrada. La ventaja principal del mtodo parece ser la simplicidad de los clculos. Cuando las 11ij no difieren de manera radical, el mtodo de las medias no ponderadas funciona con frecuencia razonablemente bien.
Una tcnica relacionada es el mtodo de los cuadrados ponderados de las medias, propuesto tambin por Yates [113a]. Esta tcnica se basa tambin en las sumas de cuadrados de las medias de las celdas,
pero los trminos de las sumas de cuadrados se ponderan en proporcin inversa a sus varianzas. Para mayores detalles de este procedimiento, ver Searle [99a] y Speed, as como Hocking y Hackney [106].

604
14~2.3

CAPTULO 14

OTROS TPICOS DE DISEO Y ANLISIS

Mtodo exacto

En situaciones en que los mtodos aproximados no son apropiados, como cuando ocurren celdas vacas
(algunas ll ij = O) o cuando las llij presentan diferencias radicales, el experimentador debe usar un anlisis
exacto. El enfoque utilizado para desarrollar las sumas de cuadrados para probar los efectos principales y
las interacciones consiste en representar el modelo del anlisis de varianza como un modelo de regresin,
ajustar ese modelo a los datos y usar el enfoque de la prueba general de significacin de la regresin. Sin
embargo, existen varias formas en que puede hacerse esto, y estos mtodos pueden producir valores diferentes para las sumas de cuadrados. Adems, las hiptesis que se estn probando no siempre son anlogos directos de las del caso balanceado, y su interpretacin tampoco es siempre sencilla. Para mayor
informacin al respecto, ver el material suplementario del texto de este captulo. Otras buenas referencias son Searle [99a]; Speed y Hocking [105]; Hocking y Speed [58]; Hocking, Hackney y Speed [57];
Speed, Hocking y Hackney [106]; Searle, Speed y Henderson [102]; Searle [99c]; y Milliken y Johnson
[79]. El software de estadstica SAS proporciona un excelente enfoque del anlisis de datos no balanceados a travs del procedimiento PROC GLM.

. 14~3

ANLISIS DE COYARIANZA

En los captulos 2 y 4 se introdujo el uso del principio de la formacin de bloques para mejorar la precisin con la que se hacen comparaciones entre tratamientos. La prueba t pareada fue el procedimiento
ilustrado en el captulo 2, mientras que en el captulo 4 se present el diseo de bloques aleatorizados. En
general, el principio de la formacin de bloques puede usarse para eliminar el efecto de los factores perturbadores controlables. El anlisis de covarianza es otra tcnica que en ocasiones es til para mejorar la
precisin de un experimento. Suponga que en un experimento con una variable de respuesta y existe otra
variable, por ejemplo x, y que y se relaCiona linealmente conx. Adems, suponga quex no puede ser controlada por el experimentador, pero puede observarse junto con y. A la variable x se le llama variable con
comitante o covariable. El anlisis de covarianza implica ajustar la variable de respuesta observada para
el efecto de la variable concomitante. Si no se hace este ajuste, la variable concomitante podra inflar el
cuadrado medio del error y hacer que sean ms difciles de detectar las verdaderas diferencias en la respuesta debidas a los tratamientos. Por lo tanto, el anlisis de covarianza es un mtodo de ajuste para los
efectos de una variable perturbadora no controlable. Como se ver, el procedimiento es una combinacin
del anlisis de varianza y del anlisis de regresin.
Como un ejemplo de un experimento en ef que puede emplearse el anlisis de covarianza, considere
el estudio realizado para determinar si existe una diferencia en la resistencia de una fibra de monofilaTabla 14-8

Datos de la resistencia a la ruptura (y


= dimetro en 10-3 pulgadas)

= resistencia en libras

yx

Mquina 1

Mquina 3

Mquina 2

36
41
39
42
49
207

20
25
24
25
32
126

40
48
39
45
44
216

22
28

35
37
42
34
32
180

21
23
26
21
15
106

22

30
28
130

~
r

14-3 ANLISIS DE COVARIANZA

605

50

45

'"~
::l

15. 40
2

.!!l
ro
ro
c:

'"

35

ID

';
ID

c:

30

10

30

20

40

Dimetro, x

Figura 14-3 Resistencia a la ruptura (y) contra el dimetro


de la fibra ~"l:),

mento producida por tres mquinas diferentes. Los datos de este experimento se muestran en la tabla
14-8. En la figura 14-3 se presenta un diagrama de dispersin de la resistencia (y) contra el dimetro (o
grosor) de la muestra. Evidentemente, la resistencia de la fibra tambin se afecta por su grosor; por consiguiente, una fibra ms gruesa ser por lo general ms resistente que una delgada. El anlisis de covarianza
podra usarse para eliminar el efecto del grosor (x) sobre la resistencia (y) cuando se prueban las diferencias en la resistencia entre las mquinas.
14~3.1

Descripcin del procedimiento

A continuacin se describe el procedimiento bsico para el anlisis de covarianza, ilustrndolo para un


experimento de un solo factor con una covariable. Suponiendo que existe una relacin lineal entre la respuesta y la covariable, un modelo estadstico apropiado es
i = 1, 2, ,a
(14-15)
y.. = fl+'tt +[3(x i.. j-x
)+s 1)..
{ j= 1, 2, ,n
..
EJ

donde Yij es la observacinj-sima de la variable de respuesta tomada bajo el tratamiento o nivel i-simo del nico factor,x es la medicin hecha de la covariable o variable concomitante correspondiente aY
(es decir, la corrida ij-sima), es la media de los valoresx, fl es la media global, 'ti es el efecto del tratamiento i-simo, [3 es el coeficiente de regresin lineal que indica la dependencia de Y dexij y Sij es un componente del error aleatorio. Se supone que los errores Sij son NID(O, if), que la pendiente [3 :; OYque la
verdadera relacin entre Yij y xii es lineal, que los coeficientes de regresin de cada tratamiento son idnticos, que la suma de los efectos de los tratamientos es cero (L~=l 'ti = O) Yque la variable concomitantex
no se afecta por los tratamientos.
Observe, por la ecuacin 14-15, que el modelo del anlisis de covarianza es una combinacin de los
modelos lineales empleados en el anlisis de varianza y regresin. Es decir, se tienen efectos de los tratamientos {'tJ, como en un anlisis de varianza de un solo factor, y un coeficiente de regresin [3, como
en una ecuacin de regresin. La variable concomitante de la ecuacin 14-15 se expresa como (xij -x.,)

x..

:!

606

CAPTULO 14 OTROS TPICOS DE DISEO Y ANLISIS

en lugar dexij, para que el parmetro f-i se preserve como la media global. El modelo pudo haberse escrito como
1,2, , a
(14-16)
] - 1,2, , n

{i.:

donde f-i es una constante diferente de la media global, que para este modelo es f-i + (Ji.,. Es ms comn
encontrar la ecuacin 14-15 en la literatura sobre el tema.
Para describir el anlisis, se introduce la siguiente notacin:
I

Sy

y2

LL
(yij - y.. )2 = LL Y~ i=l j=l
j=l

a;z

(14-17)

i=l

S,u:

= LJLJ
""'"'"
i=l j=l
a

(x"IJ - X.. )2

x2

1=1

J=l

= ~LJ
""'"'" X~ - -an"
a

LL
(Xij -x.. )(Yij - Y.. )= LL XijYij j=l
i=l j=l
1
Ty = n"'"
LJ (y - Y )2 = -"'"
n LJ y L
an

S~y =

11

(14-18)

lj

11

(X,)(y..)
an

(14-19)

i=l

i,

i.

..

1=1

= n"'"
LJ

(14-20)

1=1

Trx;

(X i, -x.. )2

i=1

=-n LJ
"'"
1=1

X2

Xi.2 __
an
'o

(14-21)

= n~ (Xi. -X.. )(Yi. - Y.. )= 1:. ~ (Xi. )(Yi.)- (X,~~.. )

(14-22)

Ey

= ~!

(Yij - Yi.)2

= Sy -Ty

(14-23)

Eu:

= ~!

(Xij -xif

= S,,-'I: -Trx;

(14-24)

= ~!

(Xij -Xi. )(Yij - Yi,)=

T.TJ'

i=l

i=l j=l

i=l

E.t),

i=l

j=l
j=l

i";l

S~y -T.TJ'

(14-25)

Observe que, en general, S = T + E, donde los smbolos S, Ty E se usan para denotar las sumas de cuadrados y los productos cruzados del total, los tratamientos y el error, respectivamente. Las sumas de cuadrados
dexyy deben ser no negativas; sin embargo, las sumas de los productos cruzados (xy) pueden ser negativas.
A continuacin se indica la forma en que el anlisis de covarianza ajusta la variable de respuesta para
el efecto de la covariable. Considere el modelo completo (ecuacin 14-15). Los estimadores de mnimos
cuadrados de f-i, "i Yf3 son l = Ji.., ri = Yi. - Y.. - ~(Xi. - x.. ), y
~

Exy

f3 = -

E,,-'I:

(14-26)

La suma de cuadrados del error en este modelo es

SSE

= Ey _(ETJ')2 / Erx;

con a(n - 1) - 1 grados de libertad. La varianza del error experimental se estima con

MS _
E -

SSE
a(n-1)-1

(14-27)

También podría gustarte