Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
La presencia de datos faltantes en un experimento hace que se pierda
la estructura original y en consecuencia la ortogonalidad del diseño origi-
nal planteado. En este trabajo, se estiman los datos faltantes en un diseño
de bloques incompletos balanceados tipo I conectados (BIBC), aplicando el
método de covarianza de Bartlett; se hace la corrección del análisis de va-
rianza y finalmente se aplican los resultados obtenidos para los datos de un
experimento realizado bajo un diseño de bloques incompletos en repeticio-
nes. Los resultados obtenidos, muestran que el análisis de varianza corregido
depende de los datos observados y de la estimación de los datos faltantes.
* Esta publicación hace parte de la producción academica del grupo “Estadı́stica Aplicada a
hmendoza@matematicas.unal.edu.co
*** Profesor Asociado, Departamento de Estadı́stica, Universidad Nacional de Colombia; email:
alopez@matematicas.unal.edu.co
73
74 Mendoza H., López L.
Abstract
Missing data in experiments cause loss in the original structure and
therefore in the orthogonality of the experimental design . This paper esti-
mates missing data in an incomplete connected balanced block design type
I (ICBB), applying the Bartlett’s covariance method; a correction of the
analysis of variance is done, and finally the results are applied in experimen-
tal data realized in incomplete blocks design with repetitions. The obtained
results show that the corrected analysis of variance depends on the observed
data and estimation of the missing data.
Key Words: Covariance Analysis, Incomplete Blocks, Missing Data, Within
block Analysis, Connected Designs.
1. Introducción
En la investigación experimental, algunas veces no se pueden obtener todos los
datos planeados a observar debido a motivos inherentes al diseño o a que en la
construcción del mismo hay pérdida de unidades experimentales, lo que conlleva a
tener un diseño no ortogonal. Este hecho no tiene consecuencias cuando el diseño
experimental es un completamente al azar, pero en el caso de los diseños de bloques
y especı́ficamente en el diseño de bloques incompletos al azar no se cumplen algunas
propiedades importantes como el balanceamiento y esto conlleva a que cambia la
estructura de bloques incompletos.
De la definición se sigue que un BIB tiene como parámetros (t, b, k, r, λ), los
cuales no son independientes y además cumplen con las siguientes relaciones:
1. tr = bk
2. λ (t − 1) = r (k − 1)
Como λ debe ser entero, es claro que un BIB, no existe para todos los valores
de t, k y r; aunque para valores de t, k y r se produzca un λ entero, puede no
existir el diseño. En efecto, existe un número limitado de BIB. Raghavarao (1971),
presenta una lista completa de parámetros de diseños existentes y sus métodos de
construcción.
Según Cochran y Cox (1980), existen varios tipos de BIB : Tipo I, Tipo II,
Tipo III, y Tipo IV. En este trabajo se utilizó el tipo I, el cual se tiene cuando los
bloques pueden ser agrupados en repeticiones en repeticiones como se muestra en
el siguiente arreglo:
Repeticiones
1 2 3 4 5
(1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
(3, 4) (2, 5) (2, 6) (2, 4) (2, 3)
(5, 6) (4, 6) (3, 5) (3, 6) (4, 5)
En Raghavarao (1971), John (1980), Dud y Giri (1986) y Dodge (1985) entre
otros, se presentan los métodos de construcción de los diseños de bloques incom-
pletos. Clásicamente tales diseños son construidos usando la teorı́a de cuadrados
latinos, geometrı́a finita y la teorı́a de campos de Galois. Entre los métodos se
tienen: Series ortogonales 1 y 2 de Yates (SO1 y SO2), diseños irreducibles, con-
juntos diferencias para hallar diseños de bloques incompletos simétricos, diseño
complemento D, diseño residual, y el diseño derivado. El método más sencillo de
construir es el diseño irreducible, el cuál consiste en formar todos los conjuntos de
k−uplas de los t tratamientos.
76 Mendoza H., López L.
3. Análisis intrabloque
En este trabajo se aplicó el análisis intrabloque, en el cual se hacen compara-
ciones entre las unidades experimentales del mismo bloque, estos son usados para
comparar los efectos de tratamientos y se recomienda en cualquier experimento
con arreglo de BI, ya que los bloques sean fijos o aleatorios; pero, según Kirk (1968)
es más eficiente cuando se utiliza con bloques de efectos fijos, ya que los estimados
de los efectos de bloques son óptimos. Este análisis permite además eliminar las
diferencias entre los bloques. El análisis intrabloque es aplicado bajo el modelo
yij = nij (µ + τi + βj + εij ) i = 1, 2, . . . , t j = 1, 2, . . . k (1)
donde, nij hace referencia al número de veces que el i-ésimo tratamiento apare-
ce en el j-ésimo bloque, solo toma los valores 1 o 0, cuando nij = 0 significa que no
hay dato registrado en el experimento; µ es laP media global de los tratamientos; τi
es el efecto del i-ésimo tratamiento
P y además i τi = 0; βj es el efecto del j-ésimo
bloque, con la restricción j βj = 0; εij son las variables aleatorias para el error,
igualmente distribuidas, normales, independientes con media 0 y varianza σε2 .
Para la estimación de parámetros se aplicó el método de mı́nimos cuadrados,
a partir del cuál se obtuvieron las siguientes ecuaciones normales:
t
X b
X
y.. = nb
µ+r τbi + k βbj (2)
i=1 j=1
b
X
yi. = rb
µ + rb
τi + nij βbj , i = 1, 2, ..., t (3)
j=1
t
X
y.j = kb
µ+ nij τbi + k βbj , j = 1, 2, ..., b (4)
i=1
haciendo
b
X
Qi = yi. − nij y .j
j=1
y = Xθ + Zγ + ε (10)
X0 Xθb + X0 Zb
γ = X0 y (12)
Z0 Xθb + Z0 Zb
γ = Z0 y (13)
Reemplazando (i), (ii) y (iii) en (12) y (13) se obtienen las ecuaciones normales
80 Mendoza H., López L.
simplificadas
y
h i
−1 −1
−X2 (X0 X) X02 + Im γb = X2 (X0 X) X01 y1
haciendo
−1
W = Im − X2 (X0 X) X02 (17)
0 0 −1
V = X2 (X X) X01 (18)
b = −W−1 V0 y1
γ (19)
b0 = −W−1 V0 y1
y
de este resultado se observa que la estimación de los datos faltantes sólo depende
del vector de valores observados y1 y la matriz diseño X.
Lema 4.1 W y V0 definidas en (17) y (18) respectivamente satisfacen
V0 V + W2 = W (20)
Z0 RX Zb
γ = Z0 RX y
Estimación de Datos Faltantes en Bloques Incompletos 81
donde SCerror modelo 1 es la suma de cuadrados del error para el modelo sin datos
faltantes. La expresión (25) muestra que la suma de cuadrados del error para el
modelo (10) cuando se corrigen los datos imputados es más pequeña que la suma
b0 Z0 RX y; y el
de cuadrados del error del modelo (9) esta reducción es dada por γ
estimador de la varianza del error experimental es dado por
SCerror
bε2 =
σ
(bt − dx − dz )
5. Ejemplo
Los dos tratamientos en cada bloque se aplicaron sobre las piezas del lado izquier-
do y derecho como un par para cada músculo (repetición). Al agrupar los bloques
en repeticiones, lo más natural fue poner piezas del mismo músculo en la misma
repetición. La evaluación fue hecha por cuatro jueces y cada uno de ellos mar-
caba sobre una escala de 0 a 10. Las evaluaciones mostradas son sus totales (de
un máximo de 40), donde una alta puntuación indica una pieza de carne muy suave.
Rep. IV Rep. V
Bloque (músculo 4) (músculo 5)
(10) 25[1] 40[5] (13) 11[1] 27[6]
(11) 25[2] 34[4] (14) 24[2] 21[3]
(12) 34[3] 32[6] (15) 26[4] 32[5]
ND = No se puede determinar
6. Conclusiones
Los resultados de este trabajo muestran que el método de análisis de covarianza
de Bartlett es una metodologı́a adecuada para la estimación de datos faltantes
en Bloques Incompletos Balanceados; la estimación de estos depende de los datos
observados. Estas estimaciones son equivalentes a las obtenidas por el método de
Cornish.
El método de Bartlett tiene la ventaja sobre el de Cornish de permitir obtener
la correción del análisis de varianza.
Una desventaja de la metodologı́a de Bartlett consiste en que a medida que se
aumenta el número de datos faltantes, no es posible calcular el cuadrado medio
del error.
Se recomienda realizar un análisis comparativo del método de Bartlett con
otros métodos utilizados en la estimación de datos incompletos como por ejemplo
el propuesto por Onukogu, o con métodos basados en los estimadores EM.
Referencias
[1] COCHRAN, W. G. and COX, G. M. (1980). Experimental Designs. John
Wiley & Sons.
[2] DAS, M. N., and GIRI N. C. (1986). Design and Analysis of Experiments.
John whiley & Sons.
[3] DODGE, Y. (1985). Analysis of Experiments with Missing Data. John Wiley
& Sons.
Estimación de Datos Faltantes en Bloques Incompletos 89
[15] SEARLE,S. R. (1987). Linear Model for Unbalanced Data. John Wiley &
Sons.
[16] SAS Institute Inc., SAS/STAT User´s Guide (1990). Version 6, Fourth Edi-
tion, Vol. 1, Cary, NC: SAS Institute Inc.