Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Preliminares Diseño de Experimentos PDF
Conceptos Preliminares Diseño de Experimentos PDF
Tipos de estudios
Existen dos tipos de estudios que generan datos, los estudios observacionales y los estudios
experimentales.
Llamamos estudio observacional cuando sobre un proceso existente se observan (registra
informacin) una o ms variables aleatorias. La finalidad de estos estudios es explorar,
describir y confirmar hiptesis.
Qu es un experimento?
Prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de
entrada de un proceso o sistema de manera que sea posible observar e identificar las causas
de los cambios en la respuesta de salida (Montgomery 1991).
Es una reproduccin restringida de la realidad con el fin de observar los efectos de su
manipulacin planificada (Casanoves y Di Rienzo, 1999).
La finalidad de estudios basados en experimentos es contrastar hiptesis, modelar y
predecir.
La diferencia principal entre estos dos tipos de estudio es que en los observacionales existe
una realidad que se observa y en los experimentales se manipula la realidad para observar
su respuesta. En la practica en muchas ocasiones se obtienen datos provenientes de
combinaciones de ambos tipos de estudios. En estos casos el desafo es modelar
correctamente los datos obtenidos.
Unidad experimental
Es la mnima porcin del material experimental sobre el cual un tratamiento puede ser
realizado. La unidad experimental (UE) puede ser una parcela de terreno, una maceta, un
animal, el conjunto de alumnos de un curso, etc. Pueden ser unidades naturales como en el
caso de una persona, un automvil, una planta o unidades artificialmente delimitadas como
en el caso de una parcela de terreno, una cantidad de agua, etc.
Unidad Observacional
Es la porcin de la unidad experimental que se mide u observa. En muchos estudios, la
unidad experimental coincide con la unidad observacional, pero en otros, una unidad
experimental puede representar un conjunto de unidades observacionales. Cuando en un
estudio se registran dos o mas variables, la unidad observacional puede ser distinta para
cada una de ellas. Por ejemplo, si la unidad experimental es una parcela con plantas de
trigo, se puede registrar la variable rendimiento sobre toda la parcela y la variable nmero
de espigas por planta sobre algunas plantas de la parcela. As, las unidades de observacin
son distintas para estas variables.
Factores
Son todas las fuentes de variacin reconocidas a priori por el investigador (no incluye el
error experimental). Cada uno de los valores que asume un factor se denomina nivel. Por
ejemplo, la temperatura de coccin del pan es un factor y las diferentes temperaturas
evaluadas son los niveles. Los factores pueden ser de inters del investigador (cuando se
desea hacer inferencia sobre ellos) o simplemente pueden ser reconocidos como una fuente
1
de variacin que de no contemplarse disminuyen la precisin de las comparaciones de
inters (factores de bloqueo).
En cualquiera de estos casos, los efectos de los factores pueden ser de naturaleza fija o
aleatoria. Por ejemplo, las temperaturas de coccin del pan se pueden fijar en 100, 110 y
120 grados o elegirse al azar temperaturas entre 100 y 120 grados. Los factores de efectos
fijos se utilizan cuando todos los niveles del factor que son de inters se incluyen en el
estudio. La extrapolacin de las conclusiones estadsticas mas all de los niveles
especificados hacia otros niveles no tiene sustento estadstico. Los modelos lineales
basados en variables predictoras categricas fijas (factores fijos) se denominan modelos de
efectos fijos. Cuando en el modelo se incluyen efectos aleatorios, es decir, se incluye en el
experimento una muestra aleatoria de posibles niveles del factor, se denomina modelo de
efectos aleatorios. Las inferencias generalmente se orientan hacia todos los posibles grupos
o niveles del o los factores de efectos aleatorios. A pesar que la distincin entre factores de
efectos fijos o aleatorios no afecta el procedimiento de ajuste del modelo de ANAVA ni el
contraste de hiptesis, en el modelo a una va de clasificacin, las hiptesis que se
contrastan son fundamentalmente diferentes. En el caso de efectos fijos se contrastan
hiptesis sobre igualdad de medias de tratamiento. En el caso de efectos aleatorios, se
contrastan hiptesis sobre la varianza de los niveles del factor. Cuando se combinan efectos
fijos y aleatorios se esta en presencia de un modelo mixto. Un a introduccin a los modelos
aleatorios y mixtos se vera mas adelante. Por ahora solo se har referencia a los modelos de
efectos fijos.
Cuando se estudia un solo factor se dice que el experimento es unifactorial ya que los
tratamientos consisten en aplicar distintos niveles de un mismo factor. Si en cambio un
tratamiento consiste en la combinacin de niveles de 2 o ms factores, entonces se dice que
el experimento es un experimento con estructura factorial de tratamientos.
Tipo de Factores
Los factores estudiados pueden ser de naturaleza cuantitativa o cualitativa. Un ejemplo del
primer caso es cundo se estudian dosis de fertilizantes en un cultivo. Un ejemplo de factor
cualitativo es el cultivar o variedad agrcola donde sus niveles son los distintos cultivares
evaluados.
Tratamientos
Se denomina tratamientos al conjunto de poblaciones estudiadas y/o acciones realizadas
sobre las unidades experimentales. Si el experimento es unifactorial, los tratamientos son
los distintos niveles del factor. Si el experimento es multifactorial (ms de un factor) los
tratamientos surgen de la combinacin de los niveles de los factores intervinientes. Por
ejemplo, si se prueba el factor temperaturas con tres niveles, 100, 110 y 120 C, los
tratamientos son las tres temperaturas. Si en esta experiencia adems se evala el factor tipo
de horno con tres niveles, elctrico (E), a gas (G) y a lea (L), se tendr un total de 9
tratamientos que surgen de la combinacin de los niveles de los dos factores, temperatura y
tipo de horno. Los tratamientos entonces sern: E-100, E-110, E-120, G-100, G-110, G-
120, L-100, L-110 y L-120.
Repeticin
Se denomina repeticin a cada una de las realizaciones independientes de un tratamiento.
2
Se denomina corrida a la realizacin de una repeticin de todos los tratamientos. Otras
veces se usa el termino replica para referirse a una repeticin de todo el experimento.
Pseudo-repeticin
Se denomina Pseudo-repeticin a cada una de las realizaciones no independientes de un
tratamiento. En algunas reas se denominan submuestras.
Confundimiento
Se dice que hay confundimiento cuando la comparacin entre los niveles de un factor puede
representar tambin la comparacin entre los niveles de otro factor. As ser imposible
conocer cul es el factor que podra estar causando las diferencias observadas. Por ejemplo,
si se desea probar el efecto de dos dietas A y B y se asigna la dieta A a un conjunto de
varones tomados al azar y la dieta B a un conjunto de mujeres tomadas al azar. Si al cabo
de un tiempo se observa la diferencia de peso respecto al peso inicial, no se podr
determinar si las diferencias se deben al efecto del factor dieta o al efecto del factor sexo.
En tal caso se dice que los efectos de dieta y sexo estn confundidos. El confundimiento se
podra evitar con la simple aleatorizacin de las dietas en las unidades experimentales
(individuos sin distincin de sexos) o la aleatorizacin de las dietas dentro de cada uno de
los sexos (recomendable si se espera que el sexo tenga efecto sobre la diferencia de peso).
Cuando se realiza un ANAVA (o test T) con pseudo-repeticiones nicamente, los efectos
de los tratamientos pueden estar confundidos con variaciones en las unidades
experimentales que, al no estar repetidas, no pueden distinguirse. Por ejemplo, si se estudia
la cantidad de especies vegetales de dos reas contiguas, una que fue hace aos arrasada por
el fuego y otra que no, se pueden obtener pseudo-repeticiones de los tratamientos (fuego y
no fuego). Si se hace una prueba con estos datos no se podr saber si las diferencias se
deben al efecto del fuego o a que las reas contiguas tenan diferencias entre si mas all del
fuego.
Control y testigo
Usualmente se denomina control al nivel del factor tratamiento que representa ausencia de
tratamiento. Es comn ver en experimentos UE a las que no se le aplican los tratamientos
de inters. El objetivo es comparar los efectos de tratamientos descontando variaciones
debidas a la manipulacin experimental. Por ejemplo, en un estudio involucrando varias
dosis de fertilizantes el rendimiento observado bajo los distintos tratamientos podra
deberse a la dosis de fertilizante pero tambin a las condiciones experimentales que no son
en las que habitualmente se observa el rendimiento (siembra a mano, riego con regadera,
etc.). Luego si no se incorpora un control (sin fertilizar) ser difcil discernir cunto de lo
observado se debe a la fertilizacin.
Se denomina testigo al tratamiento tradicional que se desea comparar con nuevos
tratamientos. Por ejemplo, para evaluar tres nuevas variedades de trigo en cuanto a su
rendimiento, se podra incluir la variedad tradicional como testigo, de manera de poder
comparar los rendimientos de las nuevas versus el testigo bajo las mismas condiciones
experimentales.
3
Aleatorizacin
En diseo y anlisis de experimentos hay dos etapas importantes de aleatorizacin. La
primera se relaciona con la necesidad de contar con unidades experimentales que
representen una muestra aleatoria de la poblacin de UE. La segunda aleatorizacin es la
que se realiza para asignar los distintos tratamientos en las UE o viceversa. Esta es una
condicin necesaria para que la estimacin de los parmetros de inters sea insesgada.
Error experimental
Este error est compuesto por los errores de tratamiento, de muestreo y de medicin y
aunque en la prctica generalmente son indistinguibles, es importante reconocerlos para
tratar de minimizarlos. En el ANAVA, el error experimental es un estimador de 2 y por lo
tanto mantener en niveles bajo los errores que lo componen harn ms eficientes las
comparaciones de inters.
Error de Tratamiento: Es el error que se podra cometer al no poder aplicar el mismo
tratamiento de manera exactamente igual en las unidades experimentales (UE) que le
fueron asignadas.
Error de Medicin: Error relacionado a la obtencin del dato. Podra ser introducido por
parte del operario que obtiene el dato o por el instrumento de medicin.
Error de Muestreo: Est relacionado con la variacin de las UE que es de esperar exista
an cuando toda otra fuente de variacin se encuentre controlada. Su magnitud depende de
la heterogeneidad de las UE.
El error de tratamiento se controla con un buen protocolo de aplicacin de los tratamientos,
el error de medicin, con la capacitacin del personal y la eleccin de buenos aparatos de
medida. El error de muestreo, se controla mediante un proceso de aleatorizacin que
contemple la estructura de las unidades experimentales, es decir asegurarse que todos los
tratamientos estn representados en todos los grupos o bloques de unidades experimentales.
Diseo de experimentos
El diseo de experimentos consiste en un conjunto de tcnicas que tienen, entre otras, la
finalidad de controlar las fuentes de variacin no deseadas y disminuir el trmino de error
experimental.
Uno de los principales objetivos en la planificacin de una experiencia, siguiendo un diseo
experimental, es la reduccin del error experimental, con el propsito de incrementar la
eficiencia de la inferencia relacionada a la comparacin de tratamientos.
El diseo experimental puede entenderse como una estrategia de combinacin de la
estructura de tratamientos (factor/es de inters) con la estructura de unidades
experimentales, de manera tal que la variabilidad de la variable respuesta, al menos en
algn subgrupo de unidades experimentales, pueda ser atribuidas solamente a la accin de
los tratamientos, excepto por errores aleatorios. As, es posible contrastar (comparar)
medias de tratamientos o combinaciones lineales de medias de tratamientos con el menor
ruido posible.
La estructura de tratamientos esta relacionada al nmero de factores involucrados en el
experimento, sus niveles y la combinacin de los mismos. La estructura de unidades
experimentales surge del agrupamiento de las mismas en grupos o bloques que puedan
considerarse formados por UE homogneas. Es importante en toda situacin donde se
4
disea una experiencia distinguir entre la estructura de parcelas o estructura de las UE por
un lado, y la estructura de tratamientos, por el otro.
La estructura de parcelas es generalmente determinada a priori de la aplicacin de los
tratamientos a las UE, tratando que sta contemple todos los factores que producen
variacin en la respuesta entre las distintas unidades experimentales. En la mayora de las
experiencias, es posible identificar patrones en las UE, los que se asocian a factores, que si
bien no corresponden a los tratamientos de inters, podran diferenciar las respuestas
provenientes de las distintas UE. Una estrategia para controlar el efecto de dichos factores
es la estratificacin o bloqueo.
La estructura de tratamientos esta asociada a las cuestiones sobre las que interesa inferir. La
aleatorizacin es el proceso que permite combinar ambas estructuras. La estructura de
tratamientos es aleatorizada en las unidades experimentales.
As, un diseo experimental involucra:
a) la eleccin de la estructura de tratamientos.
b) la deteccin de la estructura de parcelas (independientemente de la estructura de
tratamientos).
c) la eleccin del mtodo de aleatorizacin acorde para la combinacin de ambas
estructuras.
El diseo experimental determina el modelo a utilizar para un correcto anlisis de la
variabilidad en la respuesta.
Algunas estructuras de parcelas clsicas son aquellas que caracterizan los diseos: 1)
completamente aleatorizados (DCA), donde las UE no tienen estructura; 2) en bloques
completos aleatorizados (DBCA), donde las UE homogneas se agrupan en un mismo
bloque y los bloques son heterogneos en relacin a un factor de clasificacin (o
combinacin de factores de clasificacin); 3) cuadrado latino (DCL), donde las UE se
agrupan en bloques heterogneos en relacin a dos factores de clasificacin independientes
(estructura de UE a dos va de clasificacin).
No debe existir interaccin entre los componentes de la estructura de parcelas y los
componentes de la estructura de tratamientos, es decir, se asume que la relacin existente
entre tratamientos es consistente de bloque a bloque (excepto por la variacin aleatoria).
comparativo
Cuntos tratamientos se desean comparar?
Cuntas repeticiones por tratamiento son suficientes para comparar con la precisin
deseada?
Es necesario observar la evolucin de la respuesta en el tiempo?
Cules son las unidades experimentales?
Cules son las unidades de observacin?
Son las unidades experimentales homogneas?
Son las unidades experimentales homogneas suficientes para realizar todos los
tratamientos?
5
Cmo se asignan los tratamientos a las unidades experimentales?
Los tratamientos tienen alguna estructura?
Puede el diseo resultante ser analizado estadsticamente y las comparaciones
Introduccin
En experimentos con fines comparativos, usualmente se realiza la aplicacin de varios
tratamientos a un conjunto de unidades experimentales para valorar y comparar las
respuestas obtenidas bajo cada tratamiento. La tcnica del Anlisis de Varianza (ANAVA)
permite realizar las estimaciones de las respuestas promedio de tratamientos y las
comparaciones entre ellas. El ANAVA es un procedimiento que descompone la
variabilidad total en la muestra (suma de cuadrados total de las observaciones) en
componentes (sumas de cuadrados) asociados cada uno a una fuente de variacin
reconocidas.
El ANAVA es una tcnica general en la que participa y se analiza la variacin en una
variable respuesta continua. La variacin es particionada en variacin explicada y no
explicada por uno o ms predictores llamados factores. Las categoras de cada factor
(niveles) generalmente conforman grupos o condiciones experimentales (tratamientos). El
objetivo es la comparacin de las medias de la variable respuesta en esos grupos. El
ANAVA examina la contribucin relativa de diferentes fuentes de variacin respecto a la
variacin total en la variable respuesta y permite contrastar la H0 sobre igualdad de medias
entre los grupos versus la H1 que establece que al menos 1 es diferente.
La variables involucradas en el ANAVA son la variable dependiente o respuesta, las
variables de clasificacin (predictoras asociadas a factores cualitativos o cuantitativos con
un numero discreto de niveles) y las covariables (predictoras asociadas a fuentes de
variacin continuas entre UE) en caso de que existan.
La variable dependiente es la variable sobre la cual se desea hacer comparaciones entre los
tratamientos. Las variables de clasificacin son las que representan factores o fuentes de
variacin que permiten separar o clasificar las observaciones en grupos. Normalmente
existen factores que tienen que ver con la estructura de tratamientos del experimento y
factores relacionados a la estructura de las unidades experimentales.
Las covariables (o variables concomitantes) representan variables aleatorias continuas cuyo
valor vara con cada unidad experimental y que posiblemente estn relacionadas
linealmente con la variable respuesta. Las covariables no deben interactuar con los factores
que se evalan en el experimento. En situaciones donde se registr una variable
concomitante, se puede realizar el anlisis de covarianza. En este anlisis antes de estudiar
las diferencias entre tratamientos, se ajusta o remueve en la variable dependiente la
variabilidad debida a la covariable. Ms adelante se desarrollar el tema anlisis de
covarianza.
6
Modelo de ANAVA de efectos fijos a un criterio de clasificacin
La tcnica de anlisis de la varianza presupone un modelo lineal para explicar la variacin
en la variable respuesta . Cuando se estudia un solo factor con a niveles (o a tratamientos)
se dice que el anlisis de varianza es a un criterio de clasificacin y el modelo (modelo de
efectos) queda definido de la siguiente forma:
Yij = + i + ij , con i=1,...,a y j=1,..,ni
donde:
Yij es la j-sima respuesta en el i-simo tratamiento
es la media poblacional de la variable respuesta
i es el efecto del i-simo tratamiento
ij es un termino de error aleatorio. Bajo los supuestos del modelos de muestreo ideal, los
trminos de error asociados a cada una de las observaciones se suponen
independientemente distribuidos, normales, con esperanza 0 y varianza 2 i,j (Varianza
constante).
La media general () pueda ser entendida como la media de todas las medias poblacionales
asociadas a cada uno de los grupos en estudio. Se considera un parmetro fijo y su valor es
constante a travs de todas las observaciones, por lo que suele denominarse simplemente
constante. Los efectos de tratamientos (i) representan la diferencia o corrimiento entre la
media poblacional del grupo considerado y la media general. En el modelo de ANAVA de
efectos fijos los (i) se consideran constantes (valores fijos) desconocidas. El efecto del
tratamiento 1 (1) es la diferencia que hay entre la media del tratamiento 1 y la media
general. La hiptesis nula del ANAVA postula la igualdad de medias de todos los
tratamientos comparados. Si la hiptesis nula del ANAVA fuera verdadera las a
poblaciones estaran centradas sobre la misma esperanza, es decir, en . El trmino de error
asociado a la observacin ij, representa la diferencia entre dicha observacin y la media
poblacional del grupo o tratamiento correspondiente.
El modelo de ANAVA tambin puede plantearse en trminos de la media de celda o media
de grupo (modelo de celdas o modelo de medias) en lugar de hacerlo sobre la base de
efectos de grupos. Es decir,
Yij =i + ij , con i=1,...,a y j=1,..,ni
El nmero de parmetros de posicin en esta parametrizacin es igual al nmero de medias
de grupo. Para el caso de estudios involucrando un solo factor con igual tamao de muestra
para cada nivel no existen diferencias entre este modelo y el de efectos a la hora del
contraste de hiptesis. El modelo de celdas puede ser ventajoso en algunas situaciones con
diseos complejos o multifactoriales donde se ha perdido una celda.
Si bien los i del modelo de efectos no son estimables, los i = + i si se pueden estimar
para cada grupo. Debido a la equivalencia entre el modelo de celdas y el modelo de efectos,
resulta indistinto plantear la hiptesis nula del ANAVA en trminos de media de celda o
efectos de tratamiento.
Las hiptesis que se contrastan en el ANAVA de efectos fijos pueden expresarse como:
H0: 1 = 2 = ...= a versus
H1: Al menos un par de medias difiere
o alternativamente como:
7
H0: 1 = 2 = ...= a=0 versus
H1: Al menos un i 0
Estimacin
En el marco del modelo de efectos, los parmetros a estimar sern, la media general, los
efectos de tratamientos y la varianza de los trminos de error, la cual se asumi constante a
travs de los niveles de los factores. La estimacin de estos parmetros usualmente se
realiza mediante los procedimientos de estimacin de mnimos cuadrados (MC) o mxima
verosimilitud (MV). El modelo de muestreo ideal (MMI) es aquel modelo que cumple con
los supuestos de independencia, homocedasticidad y distribucin normal para los trminos
de error. Bajo los supuestos del MMI las estimaciones de los parmetros de posicin
obtenidas por uno u otro procedimiento son las mismas, mientras que la estimacin de la
componente de varianza residual difiere. El estimador MV de 2 es sesgado mientras que el
estimador por MC es insesgado, pero la eficiencia del estimador MV puede ser mayor sobre
todo si el tamao de muestra es grande.
En experimentos con pocas repeticiones por tratamiento y bajo el MMI, usualmente se
utiliza el procedimiento de mnimos cuadrados ordinarios, el que provee de los siguientes
estimadores para los parmetros del modelo de efectos:
Y
Y Y (Yi Y ) Yi
El error estndar para una media de tratamientos, que permite construir intervalos de
confianza para las medias poblacionales bajo cada tratamiento y/o comparar medias de
tratamiento es:
CMR
Y2
i
ni
donde CMR es el cuadrado medio residual del ANAVA tambin conocido como cuadrado
medio dentro (CMD), ya que es un estimador de la variabilidad entre las UE tratadas de la
misma forma, es decir, dentro de un mismo tratamiento.
Los trminos de error son estimados por los residuos eij como la diferencia entre el valor
observado y el valor predicho por el modelo ( Yij Yi ):
ij eij Yij Yi
8
Tabla de anlisis de varianza para un modelo a una va de clasificacin
Fuente de Suma de Cuadrados Grados Cuadrado F
Variacin de Medio
Libertad
Entre a
1 n i
1 a n
2
gle= a -
i
SCE CME
Tratamientos SCE n
( Yij ) 2
N
ij Y 1 CME CMD
i 1 i j 1
i 1 j 1 gle
Una forma de calcular el cuadrado medio dentro es a partir de las varianzas muestrales
obtenidas para cada tratamiento:
(n1 -1)12 ... (na -1) a2
CMD
(n1 -1) ... (na -1)
El Cuadrado Medio Dentro es un estimador insesgado de 2, es decir E(CMD) = 2.
El cuadrado medio entre (CME) se asocia a la variabilidad entre las medias de tratamientos.
En el caso de tamaos muestrales iguales para cada tratamiento se puede obtener de la
siguiente forma:
CME Y2 n .
A diferencia del CMD que es un estimador incondicional de 2, el CME estima a 2 slo si
las esperanzas de los tratamientos que se comparan son iguales (H0 verdadera) de lo
a
contrario estima a 2 + c 2i , con c una constante mayor que 0. Luego, CME es un
i 1
estimador insesgado de slo si H0 es verdadera, de lo contrario estima a 2 ms una
2
9
igualdad de las esperanzas. Por lo tanto otra forma de plantear la hiptesis en ANAVA es la
siguiente:
H0 : E2 = D2 vs. H1 : E2 > D2
El contraste de hiptesis consiste en calcular el estadstico F utilizando los estimadores de
E2 y D2 , de la siguiente forma:
CME
F
CMD
a
Este estadstico tiene, bajo H0, una distribucin F(a-1),(N-a)) con N = ni . Luego, para un
i 1
nivel de significacin , si el valor observado de F es mayor que el cuantil (1-) de la
distribucin F(a-1),(N-a) se rechaza H0, implicando que H1 es verdadera. El rechazo de H0
a
implica que i2 es distinto de 0 y por lo tanto, que algn i 0; luego se concluye que no
i 1
todas las medias de tratamiento son iguales o que al menos un tratamiento tiene efecto
distinto de 0.
En este diseo se supone que las unidades experimentales son homogneas, es decir no se
identifica estructura alguna. Los tratamientos (que pueden o no tener estructura) se asignan
completamente al azar a las unidades experimentales. El nmero de repeticiones puede
variar de un tratamiento a otro. Aquellos con igual nmero de repeticiones se denominan
balanceados; para algunas tcnicas de estimacin asociadas, el balance es una caracterstica
deseada.
10
El valor p=0.0119 para el efecto de tratamientos (temperaturas) sugiere el rechazo de la
hiptesis nula de igualdad de medias de tratamientos.
Para el anlisis de los supuestos del modelo de muestreo ideal, se utilizan las mismas
tcnicas grficas y de pruebas de hiptesis que se desarrollaron en regresin lineal.
A continuacin se muestra el diagrama de dispersin de residuos versus predichos, el
grfico qq-plot para de residuos, la prueba de homogeneidad de varianzas de Levene y la
prueba de Shapiro-Wilks para el supuesto distribucional para los datos del archivo pan.idb.
Cuantiles observados(RDUO_vol)
26.02 22.28
RDUO_vol
6.50 2.57
-13.02 -17.15
-32.55 -36.87
887.11 902.99 918.88 934.76 950.64 -36.87 -17.15 2.57 22.28 42.00
PRED_vol Cuantiles de una Normal(0,434.37)
Variable N R RAj CV
RABS_vol 16 0.05 0.00 72.28
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
RDUO_vol 16 0.00 20.84 0.91 0.2452
11
No hay evidencias para rechazar el supuesto de homogeneidad de varianzas (Prueba de
Levene, p=0.8745) ni el de distribucin normal de los errores (Prueba de Shapiro-Wilks,
p=0.2425).
Como los supuestos del MMI pueden ser sostenidos, y se rechaz la hiptesis nula de
igualdad de medias de tratamientos, por lo que se concluye que al menos una temperatura
de horneado produce un volumen promedio diferente. Para identificar cul o cuales
tratamientos se asocian a valores medios diferentes se puede recurrir a tcnicas de
comparaciones mltiples (donde se contrastan todos los pares de medias) o a la estimacin
de contrastes entre medias especficamente determinados por el usuario en funcin del
conocimiento del problema y el objetivo de la investigacin.
Comparaciones mltiples
Usualmente, cuando la hiptesis nula del ANAVA es rechazada se implementa una prueba
para comparar las medias.
Para analizar las diferencias de a pares, entre las medias de las distribuciones que se
comparan, existe una gran variedad de pruebas a posteriori o comparaciones mltiples
entre las que se pueden mencionar procedimientos tradicionales y procedimientos
jerrquicos (basados en algoritmos de agrupamiento jerrquico). Con un nmero alto de
medias de tratamiento, los procedimientos tradicionales pueden producir resultados de
difcil interpretacin ya que una misma media puede pertenecer a ms de uno de los grupo
de medias que resultan en la comparacin (falta de transitividad). Por el contrario, los
mtodos jerrquicos producen agrupamientos mutuamente excluyentes (particin del
conjunto de medias de tratamientos).
Entre los procedimientos tradicionales se encuentran, entre otras, las siguientes pruebas:
LSD de Fisher, Bonferroni, Tukey, Duncan y Student-Newman-Keuls (S.N.K).
Entre los procedimientos jerrquicos se pueden mencionar: Di Rienzo, Guzmn y
Casanoves (D.G.C.), (Di Rienzo, et al., 2002); Jollife (Jollife, 1975), Scott y Knott (Scott y
Knott (1974)) y la prueba BSS (Bautista et al. (1997)), entre otras.
La eleccin del mtodo de comparaciones mltiples depende del objetivo de la
investigacin y de que tasa de error (Tipo I o Tipo II) se desee controlar. Las pruebas de
hiptesis tienen riesgos asociados al rechazo y al no rechazo de la hiptesis (contraste) de
inters. El error tipo I considera el riesgo de rechazar una hiptesis nula verdadera y su
probabilidad esta determinada por el investigador. El error tipo II es el riesgo de no
rechazar una hiptesis falsa, es decir, en el contexto de las comparaciones mltiples de a
pares, declarar iguales dos medias que en realidad no lo son. La tasa de error tipo II, para
un nivel de significacin dado, esta determinada por el tamao muestral, la varianza y la
magnitud de las diferencias entre las medias poblacionales involucradas. Los riesgos de
cometer error de tipo I y de tipo II tienen una relacin inversa; manteniendo constante las
caractersticas mencionadas arriba en relacin al error de tipo II, si disminuye , aumenta
el error de tipo II.
La importancia relativa de uno u otro error depende del contexto en el cual se realiza el
contraste de hiptesis. Por ejemplo, si un laboratorio esta en las primeras etapas de
investigacin de diversas drogas para el control de una enfermedad, el riesgo mayor podra
12
ser descartar una droga que en realidad produce el efecto deseado. En cambio, si se esta por
recomendar una droga para un paciente, el riesgo mayor es recomendar una que no sea
efectiva. En el primer caso se debe elegir una prueba que controle el error de tipo I mientras
que para el segundo una que controle el error tipo II.
Para los datos del ejemplo de la panadera, se realiz la prueba de Tukey para comparar las
medias de las temperaturas estudiadas obtenindose los siguientes resultados:
Test : Tukey Alfa: 0.05 DMS: 48.92143
Error: 542.9583 gl: 12
Temperatura Medias n
100 890.00 4 A
190 910.25 4 A B
160 944.00 4 B
130 947.75 4 B
Letras distintas indican diferencias significativas(p<=0.05)
Los mayores volmenes de pan se obtienen con las temperaturas de 190, 160 y 130 C.
Estas temperaturas no difirieren entre si, por lo que se recomienda la temperatura de 130 C
ya que es la ms econmica de lograr. Se puede ver claramente la falta de transitividad del
mtodo de Tukey, ya que la temperatura 100 no difiere de 190, la temperatura 190 no
difiere de 160, pero la temperatura 100 difiere de 160. Usando un mtodo LSD se obtienen
los siguientes resultados:
Esta prueba indica que el mayor volumen de pan se logra con las temperaturas 160 o 130.
No obstante se sigue recomendando la temperatura 130 por cuestiones econmicas. Se
puede observar que la prueba LSD encuentra ms diferencias que la prueba de Tukey.
Adems de la clasificacin por su carcter transitivo o no, los mtodos de comparaciones
mltiples pueden clasificarse por su objetivo, por el tipo de tasa de error que contro lan, y
por si la mnima diferencia significativa que se obtiene con ellos es constante o variable
entre otros criterios.
Respecto a la clasificacin por el objetivo de la comparacin pueden separarse en: 1) todas
las comparaciones posibles de a pares (Ej.: Tukey, Duncan, LSD, DGC, Jollife), 2) todas
las comparaciones contra un testigo (Ej.: Dunnett), 3) todas contra la media mayor o todas
contra la media menor (Ej.: HSU).
Respecto al tipo de tasa de error que controlan sta puede ser por experimento o por
comparacin. La tasa de error por experimento se calcula como el nmero de experimentos
en que se comete un error sobre el nmero total de experimentos (se suponen repeticiones
independientes del mismo experimento). La tasa de error por comparacin se calcula como
el nmero de comparaciones donde se comete un error sobre el nmero total de
13
comparaciones de un experimento. En general las tasas de error por experimento son
mayores que las tasas de error por comparacin.
Algunos procedimientos de comparaciones mltiples como son Bonferroni y Scheff,
permiten realizar contrastes generales e intervalos de confianza simultneos. Esta
generalidad trae como consecuencia una prdida de potencia.
La prueba de Tukey requiere medias no correlacionadas y si bien fue pensada para igual
nmero de repeticiones por tratamiento puede usarse una correccin en caso de desbalance
(Tukey-Kramer). Controla el error tipo I por experimentacin, razn por la cual es una
prueba conservadora (poco potente).
La prueba de rango mltiple de Duncan y la de SNK tambin requieren de medias no
correlacionadas e igual nmero de repeticiones por tratamiento. Son ms potentes que
Tukey pero menos que LSD.
La prueba LSD no requiere igual nmero de repeticiones, est entre las ms potentes y
controla la tasa de error tipo I por comparacin.
Dentro de los procedimientos que tienen diferencia mnima significativa constante se
encuentran el mtodo de Tukey, el LSD, el DGC y dentro de los que poseen diferencia
mnima significativa variable estn el SNK, Duncan y el REGW, entre otros.
Contrastes
Si bien el uso de las comparaciones mltiples realizadas en el ejemplo del volumen de pan
es apropiado, numerosos autores recomiendan en caso como este, donde se cuenta con
niveles equidistantes de un factor cuantitativo, realizar contrastes polinmicos ortogonales
para identificar si existe alguna tendencia particular en las medias de la variable respuesta
respecto a los niveles del factor. Con a niveles del factor tratamiento a analizar, es posible
postular a-1 polinomios ortogonales de orden 1,...,a-1. Coeficientes para polinomios
ortogonales para varios nmeros de tratamientos pueden ser encontrados en cualquier texto
de diseo de experimentos. Un contraste es definido como una combinacin lineal de los
parmetros del modelo. En el anlisis de varianza los contrastes generalmente toman la
forma c1M1+ c2M2+...+ caMa (donde Mi es la i-sima media poblacional y los coeficientes
ci son constantes conocidas, al menos dos distintos de cero, y su suma es cero).
Si se desea plantear ms de un contraste, para que las comparaciones sean independientes
unas de otras, los contrastes debern ser ortogonales. Dos contrastes son ortogonales si la
suma de los productos de los coeficientes de ambos contrastes es cero. O sea, para C1 =
c1M1 + c2M2+...+ caMa y C2 = b1M1 + b2M2+...+ baMa, C1 y C2 son ortogonales si c1b1+
c2b2+...+ caba = 0. Tres o ms contrastes son ortogonales si todos los pares de contrastes
definidos entre ellos son ortogonales.
El nmero mximo de contrastes ortogonales a realizar es igual al nmero de tratamientos
menos 1 (a-1).
La sumas de cuadrados asociadas a un conjunto de contrastes ortogonales representan una
particin de la suma de cuadrados de tratamientos. Si se realizan a-1 contrastes ortogonales
y se cuenta con igual nmero de repeticiones por tratamiento, la suma de cuadrados de cada
uno de los contrastes suma la suma de cuadrados de tratamientos.
14
En el ejemplo de la panadera, al tener 4 temperaturas, se pueden realizar 3 contrastes
polinmicos ortogonales cuyos coeficientes podran ser:
Tendencia lineal: -3 1 1 3
Tendencia cuadrtica: 1 1 1 1
Tendencia cbica: -1 3 3 1
960
vol_suavizada
929
897
865
96 120 145 170 195
Temperatura
15
denominan contrastes a priori. Por ejemplo, si de tres tratamientos que se estn ensayando
el tratamiento 1 corresponde a un testigo y los y los otros dos tratamientos representan 2
nuevas acciones que se estn experimentando, podra ser de inters postular a priori el
siguiente par de contrastes sobre las tres medias M1, M2 y M3: el contraste
0 1 1 comparar la M2 con la M3 (las dos acciones experimentales entre si) y el contraste 2
-1 -1 es equivalente a comparar M1 con la media de M2 y M3 (el promedio de las acciones
experimentales versus el testigo).
Por ltimo, si bien los contraste ortogonales proveen informacin independiente, en
algunos casos resultan de inters contrastes o comparaciones que no son ortogonales. Este
el caso, por ejemplo, cuando se tiene un tratamiento testigo que se desea comparar con el
resto de los tratamientos experimentales. Si se tiene un testigo (T) y dos tratamientos
nuevos (N1 y N2) y se desea comparar cada uno de los nuevos tratamientos versus el
testigo, los contrastes serian: 1 1 0 (para comparar T versus N1) y 1 0 1 (para comparar T
versus N2). Estos contrastes no son ortogonales ya que su producto interno es distinto de
cero (1 en este caso).
En sntesis el tipo de contraste a realizar depender de la hiptesis de investigacin y de la
estructura de los tratamientos.
16
unidades experimentales de los dos experimentos originales, se podra hacer una repeticin
completa de todo el experimento factorial y se tendra el doble de unidades experimentales
para cada nivel de cada uno de los factores. En este sentido, los experimentos factoriales
son ms eficientes para evaluar los efectos de los factores individuales. Adems los
experimentos factoriales, cuando estn repetidos, permiten evaluar si las variaciones en la
respuesta debidas a los efectos de un factor son independientes de los niveles del otro
factor, fenmeno que se conoce como interaccin. Dado que la interaccin es comn en los
sistemas involucrando varios factores, los experimentos que son capaces de detectarla son
siempre preferibles.
Modelos aditivos
Los modelos factoriales aditivos son aquellos en los que los trminos que modelan la
interaccin estn ausentes. Para ejemplificar este caso se presenta un experimento factorial
en el que es de inters estudiar los factores riego con tres niveles (100, 150 y 200mm.) y el
factor insecticida con dos niveles (con y sin insecticida) en la produccin de tomate. Los
3x2=6 tratamientos resultantes se asignan a las UE (parcelas) segn un diseo
completamente aleatorizado. Se conoce por experiencias previas (o se supone) que no hay
interaccin entre los efectos de riego e insecticida. Los factores se han designado como R
(riego) e I (insecticida) y sus niveles como R1,R2,R3 e I1,I2. Los 6 tratamientos de inters
surgen del cruzamiento de ambos factores, es decir cada nivel de un factor se asocia con
cada uno de los niveles del otro factor para definir un tratamiento. As el arreglo factorial se
representa como R1I1, R2 I1, R3I1, R1I2, R2 I2, R3I2. Cada uno de los tratamientos se evalu
una sola vez, es decir los tratamientos no estn repetidos. No obstante esto, si existen
repeticiones para cada nivel de un factor dentro de cada uno de los niveles del otro factor.
La variable observada es el rendimiento. Los datos estn en el archivo Tomate.idb. Se
presenta a continuacin los resultados obtenidos mediante el ANAVA.
Anlisis de la varianza
Variable N R RAj CV
Rendimiento 6 0.98 0.96 3.53
Se concluye que hay efecto de riego (p=0.0229) y que hay efecto de insecticida (p=0.0275).
En el caso del factor insecticida, al tener 2 niveles no hace falta ms informacin que las
medias para concluir sobre la conveniencia del uso o no de insecticida.. Para el factor riego,
por tener tres niveles se necesita indagar ms sobre la comparacin de medias. Por ser un
factor cuantitativo de niveles equidistantes, se realizaron contrastes polinmicos
ortogonales para evaluar si existan tendencias lineales y/o cuadrticas de los rendimientos
promedio en relacin a los niveles de riego. Tambin se podran haber realizado
comparaciones mltiples, en tal caso hubiera habido tres contrastes involucrados (R1vs R2,
R1vsR3 y R2vsR3). Con la estrategia seleccionada (contrastes polinmicos) las mismas
17
comparaciones se realizan a travs de dos contrastes; un menor nmero de contrastes para
obtener las mismas conclusiones siempre es preferible debido a las consecuencias de la
inferencia simultanea sobre las tasas de error.
Los pruebas de hiptesis asociadas a los contrastes polinmicos planteados para el factor
riego se presentan a continuacin:
Contrastes
Riego SC gl CM F Valor p
Contraste1 102.26 1 102.26 85.43 0.0115
Contraste2 0.04 1 0.04 0.03 0.8716
Total 102.30 2 51.15 42.73 0.0229
Se concluye que existe una tendencia lineal para el factor riego (p=0.0115) y que la
tendencia cuadrtica no es significativa (p=0.8716). Dado que el rendimiento promedio
para el tercer nivel del factor fue mayor que para el primero, se concluye que existe una
relacin lineal positiva y por tanto dentro de los niveles ensayados (intervalo 100,200), a
mayor cantidad de riego se espera mayor rendimiento. En el siguiente grfico se visualiza
esta tendencia, como as tambin la ausencia de interaccin entre los efectos de riego y
insecticida.
32
30
Rendimiento
28
26
24
100 125 150 175 200
Riego
Modelo
El modelo para un experimento con estructura factorial de tratamientos (dos factores o
bifactorial), sin estructura de parcelas, diseo completamente aleatorizado y suponiendo
falta de interaccin (modelo aditivo) es el siguiente:
18
Donde Yij representa la respuesta al i-simo nivel del factor A y j-simo nivel de factor B,
representa una media general, i el efecto que produce el i-simo nivel del factor A (con
a niveles), j corresponde al efecto del j-simo nivel del factor B (con b niveles) y ij es el
trmino de error aleatorio asociado a la observacin ij-sima que como siempre se supone
es una variable aleatoria normal, con esperanza cero y varianza 2.
Si el supuesto de aditividad (no interaccin) no se cumple entonces el experimento est
deficientemente diseado ya que haran falta repeticiones de los tratamientos (combinacin
de los niveles de ambos factores) para inferir sobre efectos principales e interacciones.
Existen algunas pruebas estadsticas para verificar este supuesto como la prueba de
aditividad de Tukey (1949), Mandel (1967) y pruebas grficas.
En este modelo Yijk representa la respuesta en la k-sima repeticin del i-simo nivel del
factor A y j-simo nivel de factor B, representa la media general, i el efecto que produce
el i-simo nivel del factor A, j corresponde al efecto del j-simo nivel del factor B
19
y los trminos ij representan los efectos adicionales (interacciones) de las combinaciones
de los niveles de los factores. Los trminos de error ijk asociados a cada observacin se
suponen (usualmente) normal e independientemente distribuidos con esperanza cero y
varianza comn 2. Debe notarse que el subndice k se mueve entre 1 y nij, que representa
el nmero de repeticiones para el tratamiento ij. Los nmeros de repeticiones dentro de
cada tratamiento pueden ser distintos.
Ejemplo
En las grandes ciudades, los lodos que surgen del tratado de los efluentes son generalmente
vertido en suelos de regiones perifricas a la ciudades. En un estudio medioambiental sobre
contaminacin con zinc (Zn) debida a esta prctica, se realiz un ensayo para comparar los
efectos de efluentes procedentes de tres ciudades sobre los niveles de Zn en hortalizas
producidas en regiones perifricas. Se tomaron 36 macetones con plantas de tomate y en un
diseo completamente aleatorizado se asignaron los tratamientos que surgieron de un
arreglo factorial del factor cualitativo procedencia del lodo adicio nado a la maceta, al que
denominaremos ciudad con tres niveles (A, B y C) y el factor cuantitativo cantidad de
lodo adicionado, denominado lodo, con tres niveles (0.5, 1 y 1.5 Kg por unidad). Luego
se cosecharon los tomates producidos y se les midi el contenido en partes por milln
(ppm) de Zn, obteniendo los promedios por maceta como variable respuesta. Los datos se
encuentran en el archivo Ciudad.idb. El ANAVA arroj los siguientes resultados.
20
Anlisis de la varianza
Variable N R RAj CV
Zn 36 0.95 0.93 12.96
Cuadro de Anlisis de la Varianza (SC Tipo III)
F.V. SC gl CM F Valor p
Modelo 9475.52 8 1184.44 61.75 <0.0001
lodo 1945.45 2 972.72 50.71 <0.0001
ciudad 5720.67 2 2860.34 149.13 <0.0001
lodo*ciudad 1809.40 4 452.35 23.58 <0.0001
Error 517.86 27 19.18
Total 9993.38 35
La interaccin entre lodo y ciudad result significativa (p<0.0001) razn por la cual no
tiene sentido estudiar a los efectos principales de los factores a travs de las medias de
todos los datos. Es necesario estudiar o abrir la interaccin, esto es estudiar los efectos de
un factor dentro de cada uno de los niveles del otro. En este ejemplo hay dos factores de
distinta naturaleza, uno cuantitativo y el otro cualitativo. Dado que uno de los intereses de
la investigacin es determinar si la cantidad de lodo agregado se relaciona con la cantidad
de Zn encontrado en las plantas, se decide hacer contrastes para verificar tendencias lineal y
cuadrtica para contenido de Zn dentro de cada uno de los niveles del factor ciudad.
3) Plantear un conjunto de contrastes ortogonales para comparar medias de los niveles del
factor cualitativo (ciudad). Como el factor ciudades tiene tres niveles habr 2 grados de
libertad para ser particionados en contrastes ortogonales. Un conjunto de contrastes que
responde a estos requerimiento podra ser el siguiente:
-2 1 1 -2 1 1 -2 1 1 (A vs.(B+C)/2)
0 -1 1 0 -1 1 0 -1 1 (B vs.C)
4) Obtener los contrastes de inters (interaccin) multiplicando los contrastes definidos en
el paso 2 por aquellos definidos en el paso 3:
2 -1 -1 0 0 0 -2 1 1 lineal (A vs.(B+C)/2)
0 1 -1 0 0 0 0 -1 1 lineal (B vs.C)
21
2 -1 -1 -4 2 2 2 -1 -1 cuadr. (A vs.(B+C)/2)
0 1 -1 0 -2 2 0 1 -1 cuadr. (B vs.C)
Calculando las sumas de cuadrados asociadas a los dos primeros contraste se obtienen los
siguientes resultados:
Contrastes
lodo*ciudad SC gl CM F Valor p
Contraste1 121.92 1 121.92 6.36 0.0179
Contraste2 1638.23 1 1638.23 85.41 <0.0001
Total 1760.15 2 880.07 45.88 <0.0001
Se concluye que hay variabilidad entre ciudades para los coeficientes de regresin lineal de
la respuesta en funcin de los niveles de lodo (p<0.0001).
Calculando las sumas de cuadrados asociadas a los dos ltimos contraste se obtienen los
siguientes resultados:
Contrastes
lodo*ciudad SC gl CM F Valor p
Contraste1 1.05 1 1.05 0.05 0.8167
Contraste2 48.20 1 48.20 2.51 0.1246
Total 49.25 2 24.63 1.28 0.2933
33.00
Aqu se concluye que no hay diferencias en las tendencias
cuadrticas de las respuestas promedio en funcin de los
niveles de lodo para las distintas ciudades (p=0.2933). 18.00
En el grfico que se presenta a la derecha se pueden 0.50 1.00 1.50
visualizar estos hallazgos: lodo
22
Aunque en los ejemplos anteriores se han presentado experimentos con estructura factorial
de tratamientos, slo en diseos completos al azar, la combinacin de estructuras factoriales
y estructuras de parcela da lugar a una amplia variedad de arreglos experimentales. Por
diversas razones, quizs no puedan asegurarse las mismas condiciones experimentales de
repeticin a repeticin y por lo tanto se tiene una fuente potencial de variacin sistemtica
reconocida a priori sobre las UE que si bien no es de inters por si misma debe
incorporarse al modelo de anlisis para disminuir el error experimental. De este modo, cada
repeticin podra considerarse un bloque y el experimento completo sera un experimento
con estructura bifactorial de tratamiento y estructura de parcelas en bloques completos al
azar. Existen numerosas combinaciones de estructuras de parcela y estructuras de
tratamiento, dependiendo de la jerarqua en la estructura de parcelas y las restricciones a la
aleatorizacin. Los diseos emergentes se conocen como multifactoriales con restricciones
a la aleatorizacin.
i 1
i 0
b
j 1
j 0
a
( )
i 1
ij 0 j 1,..., b
b
( )
j 1
ij 0 i 1,..., a
23
podemos usar estas estimaciones de los parmetros, para estimar el valor esperado de
cualquier observacin y obtener as el valor ajustado de yijk.
Luego,
yijk j ( )i j
yijk y... ( yi.. y... )+(y. j . y... )+(yij . yi.. y. j . y... )
yijk yij .
El disponer de los valores ajustados permite calcular los residuos para el modelo. Estos
residuos se usarn para evaluar el cumplimiento de los supuestos que sustentan el anlisis
de la varianza clsico (MMI).
Verificacin de supuestos
Los supuestos del anlisis de la varianza se refieren a las propiedades estadsticas de los
errores que se suponen normales con esperanza cero, varianza comn e independientes.
Existen distintas tcnicas de validacin de supuestos, pero las mas usuales se basan en los
predictores de los errores, es decir los residuos.
Una vez calculados los residuos se puede verificar el cumplimiento de los supuestos de
normalidad, independencia y homogeneidad de varianzas de los ijk, mediante pruebas de
hiptesis e interpretaciones grficas como se ha explicado anteriormente. Estas pruebas
usualmente se construyen reparametrizando el modelo factorial como un modelo de celdas,
donde cada celta corresponde a un tratamiento que surge de la combinacin de los niveles
de los factores.
Diseos en bloques
Introduccin
Cuando la UE que se disponen para realizar un experimento no son homogneas, se debe
reconocer el o los factores que pueden afectar a la respuesta de las distintas UE ms all de
los tratamientos. Estas fuentes de variacin deben ser contempladas en el diseo para
disminuir el error experimental. Esto implica reconocer la estructura que tienen las UE.
Esta estructura puede deberse a una variacin local, espacial o temporal del material
experimental. Cuando las UE no son homogneas, pueden no reaccionar o responder a los
tratamientos de la misma manera o con la misma capacidad debido a sus diferencias
intrnsecas, hecho que puede ocurrir an cuando las UE tengan el mismo aspecto.
La forma tradicional de controlar la variacin del material experimental en experiencias
planificadas es formando grupos de UE homogneas. Estos grupos o estratos, comnmente
llamados bloques, son de una naturaleza tal que las unidades experimentales dentro de un
bloque, varan menos entre s que entre los bloques. Reconocidos los grupos de UE
homogneas, los tratamientos, de ser posible, debieran compararse dentro de cada grupo.
As se elimina del error experimental la variabilidad debida a los bloques, aumentando en
consecuencia la precisin de las comparaciones de las medias de tratamientos.
24
Los criterios de bloqueo pueden deberse no slo a las caractersticas relacionadas con las
unidades experimentales sino tambin, en algunas circunstancias, a aquellas ligadas con la
toma de informacin o la realizacin de los tratamientos. A las caractersticas relacionadas
con las UE se las denomina naturales mientras que al resto se las llama inducidas. Por
ejemplo, si tenemos un conjunto de UE homogneas pero algunos subgrupos de este
conjunto son manejados por distintos operarios, estos pueden introducir una fuente de
variacin en la respuesta (inducida). En este caso sera apropiado que cada operario trabaje
con todos los tratamientos a comparar.
Los bloques, a su vez, pueden ser fijos o aleatorios. En los dos casos, las hiptesis acerca de
los tratamientos son las mismas, pero el espacio de inferencia es distinto.
Distingamos la situacin en que hay uno o ms factores que particionan el conjunto de las
unidades experimentales en subconjuntos, tal que la unidades experimentales de un mismo
subconjunto o bloque sean homogneas (ms all de los tratamientos) en relacin a la
respuesta observada.
Ejemplos
En esta figura se observa que hay un efecto 'sombra' sobre el terreno, que determina que los
bloques queden as delimitados.
Bloque 1
25
Las unidades experimentales que conforman un bloque no necesariamente deben ser
adyacentes, como se muestra a continuacin:
B1
B2
20
B3
B1
23 21 20
Bloque 1 B A D C
Bloque 2 C D A B
Bloque 3 C A D B
Modelo
El modelo para analizar un diseo en bloques completamente aleatorizados (DBCA) sin
estructura factorial de tratamientos es:
yij = + i + j + ij
26
donde: yij es la respuesta del i-simo tratamiento en el j-simo bloque
es la media general
i es el efecto del i-simo tratamiento i = 1, ...,a
j es el efecto del j-simo bloque j = 1, ...,b
ij es el trmino de error aleatorio.
Si se puede suponer que existe aditividad bloque-tratamiento y que los ij son
independientes e idnticamente distribuidos N (0, 2) puede obtenerse una prueba exacta
para la hiptesis de igualdad de medias de tratamientos.
Las hiptesis que se somete a prueba en este tipo de diseos es, como en el diseo
completamente aleatorizado a una va de clasificacin, establecida sobre la medias de las
poblaciones relacionadas a cada tratamiento (i = + i con i = 1, ... ,a):
H0 : 1= 2= , ... , =a
H1 : Al menos un par de medias difiere
27
Cuadro de Anlisis de Varianza para el modelo correspondiente a un DBCA con un
factor tratamiento
Fuente de Suma de Cuadrados Grados de Cuadrado F
Variacin Libertad Medio
Tratamiento a
Y Y
2 2
gltr=a-1 SCTrat CMTrat
SCTrat i. .. CMTrat
gltr CMD
i 1 b ab
Bloque Y Y glbl=b-1
2 2
b SCBloq CMBloq
SCBloque CMBloq
.j ..
a ab glbl CMD
j 1
Error CMD
SCD
SCD=SCT-SCTrat-SCBloque gld=(a-1)(b-1)
gld
Total a b
Y
2
glt=a.b-1
SCT Y 2
ij ..
i 1 j 1 ab
i 1
i 0
b
j 1
j 0
28
y..
yi. y.. i 1,..., a
j y. j y.. j 1,..., b
podemos usar estas estimaciones de los parmetros, para estimar el valor esperado de
cualquier observacin y obtener as el valor ajustado de yij.
Luego,
yij j
yij y.. ( yi. y.. )+(y. j y.. )
yij yi. y. j y..
El disponer de los valores ajustados (predichos) permite calcular los residuos para el
modelo. Estos residuos se usarn para evaluar el cumplimiento de los supuestos que
sustentan el anlisis de la varianza clsico (MMI).
Verificacin de supuestos
El anlisis de los supuestos del MMI se realiza utilizando las tcnicas descriptas
anteriormente. En el caso del DBCA se agrega el supuesto de aditividad bloque-
tratamiento.
Aditividad bloque-tratamiento:
Como ya se mencion con anterioridad la estructura de parcelas no debe interactuar con la
estructura de tratamientos, es decir el efecto en este caso de los bloques debe ser aditivo. De
no ser as, seria imposible hacer recomendaciones acerca de los tratamientos en forma
independiente a los bloques. Existen pruebas formales para determinar la presencia de
interaccin bloque-tratamiento, entre ellas las propuestas por Mandel y por Tukey. Estas
pruebas no siempre estn disponibles en los Software Estadsticos, por lo que se puede
recurrir a mtodos grficos de deteccin como se ve a continuacin:
25.50 35.50
21.50 29.00
respuesta
respuesta
17.50 22.50
13.50 16.00
9.50 9.50
1 2 3 1 2 3
tratamiento tratamiento
29
Existe un diseo en bloques llamado DBCA generalizado en el cual los tratamientos se
encuentran repetidos dentro de cada bloque. La existencia de repeticiones permite el
agregado del trmino de interaccin bloque-tratamiento en el modelo de manera tal de
poder realizar la prueba de hiptesis de no interaccin en forma directa.
Yijk=+Materiali+Velocidad+Material*Velocidadij+Turnok+ijk
Variable N R RAj CV
Resistencia 21 0.82 0.70 21.42
30
F.V. SC gl CM F Valor p
Modelo 650.91 8 81.36 6.70 0.0019
Turno 127.32 2 63.66 5.25 0.0231
velocidad 89.20 3 29.73 2.45 0.1138
Material 206.89 1 206.89 17.05 0.0014
Velocidad*Material 227.49 2 113.75 9.37 0.0035
Error 145.63 12 12.14
Total 796.53 20
Anlisis de la varianza
Variable N R RAj CV
resistencia1 21 0.82 0.70 21.42
Se concluye que hay efecto de tratamientos (p=0.0020). Si bien la hiptesis sobre efecto
turno no es de inters y por las restricciones a la aleatorizacin que implica el hecho de que
los tratamientos se asignaron al azar dentro de cada turno la prueba F para turno no es
valida, no obstante, a partir del valor p=0.0231 se puede inferir que la inclusin de este
factor de bloqueo fue pertinente.
31
A continuacin se presentan los contraste ortogonales de inters. El primero contrasta el
testigo versus el promedio del resto de los tratamientos, y como no result significativo
(p=0.2886) no hay evidencias para rechazar esta hiptesis.
El segundo contraste compara el promedio del material N1 con el promedio del material N2
y resulto significativo (p=0.0014).
Los contrastes 3 y 4 prueban la hiptesis sobre tendencia lineal y cuadrtica de resistencia
en funcin de velocidad del aire respectivamente. Existe tendencia lineal (p=0.0357) pero
no cuadrtica (p=0.4834).
Contrastes
tratamiento SC gl CM F Valor p
Contraste1 14.96 1 14.96 1.23 0.2886
Contraste2 206.89 1 206.89 17.05 0.0014
Contraste3 67.89 1 67.89 5.59 0.0357
Contraste4 6.35 1 6.35 0.52 0.4834
Contraste5 89.83 1 89.83 7.40 0.0186
Contraste6 137.66 1 137.66 11.34 0.0056
Total 523.58 6 87.26 7.19 0.0020
25
20
Resistencia
15
10
5
0 1000 2000 3000
Velocidad
E N1 N2 32
Se recomienda el uso del material N1 con la velocidad 2000.
Ms all de los resultados y conclusiones para este ejemplo, es importante visualizar que a
partir de la particin en contrastes ortogonales realizada en el ltimo anlisis, se puede
reconstruir la tabla de anlisis de varianza presentada en primer trmino (modelo de efectos
e interacciones) como se muestra a continuacin:
Al tener los tratamientos una estructura factorial, para el anlisis de los supuestos es
conveniente obtener los residuos y predichos desde el modelo reparametrizado con efectos
de tratamiento y bloque:
Yij=+Tratamientoi+Turnoj+ij
Con los residuos y predichos de este modelo se obtuvieron los siguientes resultados:
Cuantiles observados(RDUO_resistencia)
2.57 2.25
RDUO_resistencia
-0.93 -0.93
-4.43 -4.11
-7.93 -7.29
5.18 10.90 16.62 22.34 28.07 -7.29 -4.11 -0.93 2.25 5.43
33
PRED_resistencia Cuantiles de una Normal(1.6521E-17,7.2813)
Shapiro-Wilks (modificado)
Variable N R RAj CV
RABS_resistencia 21 0.77 0.62 63.88
31.76
25.19
resistencia
18.62
12.04
5.47
testigo V1N1 V2N1 V3N1 V1N2 V2N2 V3N2
tratamiento
34
Experimentos Multifactoriales con restricciones a la aleatorizacin
Cuando se tiene una estructura factorial de tratamientos y los tratamientos que la
conforman no pueden ser asignados al azar en las UE, surgen los experimentos con
restricciones a la aleatorizacin. Estas restricciones deben imponerse ya sea por cuestiones
operativas o por la naturaleza de los factores. En funcin del momento y la forma de
imponer las restricciones a la aleatorizacin, y de la forma en que se relacionan los factores
en estudio, surgen los diseos conocidos como en parcelas Divididas, donde los factores
estn totalmente cruzados, y los diseos Encajados (tambin conocidos como jerrquicos o
anidados) donde los niveles de un factor estn dentro de los niveles del otro factor.
Ejemplo
Se desea evaluar el efecto que tiene la fecha de siembra en distintas variedades de Soja
sobre el rendimiento del cultivo. El factor fecha de siembra tiene 3 niveles (F1, F2 y F3)
mientras que el efecto variedad tiene 5 niveles (V1, , V5).
Supongamos que el terreno disponible para el ensayo es totalmente homogneo en cuanto a
aquellos factores que afectan al rendimiento. En este caso, se podra hacer un diseo
completamente aleatorizado con estructura factorial de tratamientos y si se realizan tres
repeticiones por tratamiento, un arreglo posible sera el siguiente:
35
F2V1 F3V1 F2V4 F3V5 F1V4
F1V3 F2V2 F1V5 F1V2 F3V3 Bloque 1
F1V1 F2V5 F3V2 F2V3 F3V4
F2V5 F1V1 F1V3 F3V1 F2V2
F1V4 F2V1 F3V2 F3V5 F1V5 Bloque 2
F2V3 F3V4 F1V2 F3V3 F2V4
F1V2 F3V2 F3V4 F2V4 F3V5
F3V3 F2V3 F2V5 F1V3 F2V2 Bloque 3
F2V1 F1V5 F3V1 F1V1 F1V4
En cualquiera de estos diseos, el DCA y el DBCA, se tiene el problema de que dentro de
una determinada fecha de siembra, las UE a sembrar que estn desordenadas en el
espacio.
Una solucin para este problema es imponer restricciones a la aleatorizacin de manera tal
que todas las UE de una misma fecha de siembra queden agrupadas. Este tipo de
restricciones a la aleatorizacin conduce a los diseos en parcelas divididas o a los diseos
anidados dependiendo de cmo se realiza la restriccin.
Cada PP tiene tantas UE de menor tamaos como niveles tiene el segundo factor, en este
caso la variedad, con 5 niveles. Estas UE son comnmente denominadas subparcela (SP).
Por ltimo, dentro de cada PP se aleatorizan las variedades en las SP, es decir no hay
restricciones a este nivel.
Para el ejemplo, un esquema experimental posible sera:
36
F2V1 F2V4 F2V5 F2V3 F2V2 PP1
F1V3 F1V2 F1V5 F1V1 F1V4 PP2 Bloque 1
F3V1 F3V5 F3V2 F3V3 F3V4 PP3
F1V5 F1V1 F1V3 F1V2 F1V4 PP1
F3V4 F3V1 F3V2 F3V5 F3V3 PP2 Bloque 2
F2V3 F2V4 F2V2 F2V5 F2V1 PP3
F1V2 F1V3 F1V4 F1V1 F1V5 PP1
F3V3 F3V1 F3V5 F3V4 F3V2 PP2 Bloque 3
F2V1 F2V5 F2V3 F2V2 F2V4 PP3
Se puede observar que cada uno de los bloques contiene las tres fechas de siembra en las
PP y en cada PP estn aleatorizadas las variedades. Las PP tienen un tamao mayor que las
subparcelas, motivo por el cual a estos tipos de diseo se los conoce tambin como diseos
con UE de distintos tamaos.
Al imponer restricciones a la aleatorizacin, el modelo de anlisis cambia y debido a que
las esperanzas de los cuadrados medios se ven afectadas por esta restriccin, para cada
factor en el modelo se debe construir la prueba F con el trmino de error adecuado.
El modelo para un diseo en parcelas divididas en bloque completos aleatorizados con
estructura bifactorial de tratamientos es, para el ejemplo, el siguiente:
Yijk=+Fechai+Bloquek+ Fechai*Bloquek + Variedadj + Variedadj*Bloquek +
Fechai*Variedadj + ijk
Para evaluar el efecto Fecha se usa como trmino de error la interaccin Fecha*Bloque que
es conocida como error A.
Para evaluar los efectos Variedad, Variedad*Bloque y Fecha*Variedad, se usa el trmino
de error corriente (error experimental), en este contexto llamado error B.
El efecto de la interaccin Variedad*Bloque debe ser nulo, ya que la estructura de parcelas
no debe interactuar con la de tratamientos (supuesto de aditividad). Este trmino puede
entonces colocarse para contrastar esta hiptesis. Algunos autores sugieren que luego de
verificar el supuesto de aditividad, este trmino puede eliminarse del modelo, aumentando
de esa forma los grados de libertad para el contraste de las hiptesis sobre Variedades y
Variedad*Fecha.
En los diseos en Parcelas Divididas, el factor que se asigna en las PP, en este caso Fecha,
se contrasta con menor precisin que el asignado a las SP, en este caso variedad.
Este tipo de diseo se puede generalizar a ms de dos factores, agregando las restricciones
correspondientes. Si se utilizan 2 restricciones a la aleatorizacion, adems de la
correspondiente a Bloque si lo hubiere, se dice que el diseo es en parcelas subdivididas.
37
En este caso, aparece un nuevo trmino de error, por lo cual los trminos de error son tres.
Comnmente se los denomina A, B y C, siendo este ltimo el error experimental.
Los datos para el ensayo de fechas y variedades en un diseo en parcelas divididas en
bloques completos aleatorizados estn en el archivo variedadesPDB.idb.
Los resultados del anlisis de varianza se presentan a continuacin:
Anlisis de la varianza
Variable N R R Aj CV
Rendimiento 45 0.97 0.92 6.27
Test:Duncan Alfa:=0.05
Error: 3.6290 gl: 4
Fecha Medias n
1.00 27.12 15 A
3.00 29.54 15 B
2.00 33.99 15 C
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 3.5844 gl: 16
Variedad Medias n
1.00 28.05 9 A
2.00 28.06 9 A
4.00 31.60 9 B
5.00 31.66 9 B
3.00 31.71 9 B
Letras distintas indican diferencias significativas(p<= 0.05)
38
sobre ellas se aleatorizan las fechas. Posteriormente se aleatorizan las variedades en las SP
dentro de cada PP. Un esquema posible para el ejemplo con este tipo de experimento es:
Variable N R R Aj CV
Rendimiento 45 0.82 0.66 8.33
39
Test:Duncan Alfa:=0.05
Error: 5.6757 gl: 6
Fecha Medias n
1 26.63 15 A
3 28.46 15 A
2 33.21 15 B
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 6.0070 gl: 24
Variedad Medias n
1 27.03 9 A
2 27.68 9 A B
4 29.63 9 B C
3 30.67 9 C D
5 32.17 9 D
Letras distintas indican diferencias significativas(p<= 0.05)
Considerando la fecha y las variedades como fijas, los efectos de Fecha y Variedad(fecha)
se contrastan usando el cuadrado medio del error experimental.
Haciendo el anlisis de varianza para los datos del archivo se obtienen los siguientes
resultados:
Anlisis de la varianza
Variable N R R Aj CV
Rendimiento 45 0.77 0.67 8.28
40
Cuadro de Anlisis de la Varianza (SC tipo III)
F.V. SC gl CM F valor p
Modelo 602.61 14 43.04 7.25 <0.0001
Fecha 346.24 2 173.12 29.14 <0.0001
Fecha>Variedad 256.36 12 21.36 3.60 0.0022
Error 178.22 30 5.94
Total 780.83 44
Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Medias n
1 26.63 15 A
3 28.46 15 B
2 33.21 15 C
Letras distintas indican diferencias significativas(p<= 0.05)
Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Variedad Medias n
1 2 23.56 3 A
3 1 25.53 3 A B
1 4 26.57 3 A B
1 1 26.90 3 A B
1 3 27.23 3 A B
3 4 28.58 3 B
2 1 28.66 3 B
3 3 28.87 3 B
1 5 28.89 3 B
3 2 29.44 3 B C
3 5 29.88 3 B C
2 2 30.03 3 B C
2 4 33.74 3 C D
2 3 35.90 3 D
2 5 37.73 3 D
Letras distintas indican diferencias significativas(p<= 0.05)
Se observa que hay efecto de fecha (p<0.0001) y efecto de variedad dentro de fecha
(p=0.0022). Se recomienda a partir de la prueba de Duncan, la fecha 2, y dentro de esta, las
variedades 3, 4, o 5.
41
Anlisis de la varianza
Variable N R R Aj CV
Rendimiento 45 0.77 0.67 8.28
Cuadro de Anlisis de la Varianza (SC tipo III)
F.V. SC gl CM F valor p (Error)
Modelo 602.61 14 43.04 7.25 <0.0001
Fecha 346.24 2 173.12 8.10 0.0059 (Fecha>Variedad)
Fecha>Variedad 256.36 12 21.36 3.60 0.0022
Error 178.22 30 5.94
Total 780.83 44
Test:Duncan Alfa:=0.05
Error: 5.9408 gl: 30
Fecha Variedad Medias n
1 2 23.56 3 A
3 1 25.53 3 A B
1 4 26.57 3 A B
1 1 26.90 3 A B
1 3 27.23 3 A B
3 4 28.58 3 B
2 1 28.66 3 B
3 3 28.87 3 B
1 5 28.89 3 B
3 2 29.44 3 B C
3 5 29.88 3 B C
2 2 30.03 3 B C
2 4 33.74 3 C D
2 3 35.90 3 D
2 5 37.73 3 D
Letras distintas indican diferencias significativas(p<= 0.05)
Como la fecha se consider aleatoria, las hiptesis que se prueban sobre ella son:
42
Introduccin al anlisis de la covarianza
El anlisis de la covarianza combina las tcnicas del ANAVA con regresin y se usa como
una practica de control local para reducir el error experimental y aumentar la precisin de la
estimacin de las medias de tratamiento y las pruebas de hiptesis.
La tcnica del anlisis de covarianza (ANCOVA) consiste en realizar un anlisis de
varianza con la inclusin de una o mas variables regresoras.
Las variables regresoras son conocidas en este contexto como variables concomitantes o
covariables. Las covariables son variables medidas sobre cada una de las unidades
experimentales.
Si bien la medida mas generalizada para el control local o control de la variabilidad de las
UE es el uso de bloques, salvo raras excepciones estos deben definirse antes de comenzar el
ensayo, en cambio las covariables pueden medirse en cualquier momento durante el
experimento. Por otra parte puede ocurrir a veces que el nmero de UE disponibles para
cada nivel del factor de bloqueo sea insuficiente para realizar todos los tratamientos. En
estos casos, se puede recurrir a bloques incompletos o al control del factor de bloqueo por
una covariable.
Otro caso donde las covariables toman relevancia es cuando hay varios factores de bloqueo
y la estructura de las UE es compleja, determinando un modelo de anlisis con muchas
restricciones que se puede tornar ineficiente. La inclusin de una covariable para controlar
un factor solo lleva 1 grado de libertad por factor. En cambio, los factores de bloqueo
requieren de b-1 grados de libertad cada uno, con b igual al nmero de bloques.
Modelo
El modelo para una anlisis de covarianza con una covariable en un DCA tiene la siguiente
expresin:
Yij = + i + (Xij- X ) + ij , con i=1,...,a y j=1,..,ni
donde:
Yij es la j-sima respuesta observada en el i-simo tratamiento
es la media poblacional de la variable respuesta
i es el efecto del i-simo tratamiento
es el coeficiente de regresin promedio de las regresiones de Y sobre X en cada uno de
los a tratamientos
Xij es el valor de la covariable en el i-simo tratamiento y la j-sima repeticin
X es el valor promedio de la covariable en todo el ensayo.
ij es un termino de error aleatorio. Bajo los supuestos del modelos de muestreo ideal, los
trminos de error asociados a cada una de las observaciones se suponen
independientemente distribuidos, normales, con esperanza 0 y varianza 2 i,j (Varianza
constante).
Las estimaciones de son correctas bajo la suposicin de que las pendientes de las
regresiones para cada tratamiento son iguales. Otra suposicin importante en anlisis de
43
covarianza es que la/s covariable/s no interactuen con los tratamientos y que exista una
relacin lineal entre la respuesta y la covariable.
Al ser la covariable independiente de los tratamientos, para obtener soluciones solo es
necesario imponer la restriccin usual:
i 0
Para realizar comparaciones de medias de tratamiento estas deben ser previamente
ajustadas por la covariable:
Yi ( ajustada ) Yi X i X
a n
X ij X i Yij Yi
donde i 1 j 1
a n
X Xi
2
ij
i 1 j 1
1 Xi X
2
Y ( ajustado ) CMR
i
ni SCresidual ( X )
Luego, las hiptesis que se contrastan en el ANCOVA de efectos fijos se realizan sobre las
medias ajustadas y pueden expresarse como:
H0: 1(aj) = 2(aj) = ...= a(aj) versus
H1: Al menos un par de medias ajustadas difiere
O alternativamente como:
H0: 1(aj) = 2(aj) = ...= a(aj)=0 versus
H1: Al menos un i(aj) 0
Ejemplo
Recordando el ejemplo de una panadera que desea probar 4 temperaturas de horneado de pan
(100, 130, 160 y 190 C) con el fin de verificar si existen diferencias en el volumen del pan
obtenido. Para hacer la prueba se amas el pan y se formaron 16 bollos. Cada uno de los
bollos fue asignado al azar a una de las temperaturas. Luego se aleatoriz el orden de las
temperaturas del horno y despus del horneado se midi el volumen del pan obtenido (cm3).
Los datos estn en el archivo pan.idb. En este ejemplo, la unidad experimental es el bollo de
pan. Estos se realizan a mano y en forma artesanal, razn por la cual es de pensar que no todos
los bollos tengan el mismo pero al entrar al horno. Si las UE son variables y no se tiene en
cuenta esta variacin, esto se traduce en un aumento de los residuos.
Se realiz un ANAVA a una va de clasificacin (DCA) usando el peso del bollo como
covariable y se obtuvo la siguiente tabla:
Anlisis de la varianza
Variable N R RAj CV
vol 16 0.97 0.96 0.70
44
Cuadro de Anlisis de la Varianza (SC Tipo III)
F.V. SC gl CM F Valor p Coef
Modelo 15283.06 4 3820.76 92.79 <0.0001
Temperatura 7110.00 3 2370.00 57.56 <0.0001
peso 6062.56 1 6062.56 147.23 <0.0001 2.07
Error 452.94 11 41.18
Total 15736.00 15
Por un lado, la DMS paso de 48.9 a 15.2, y por el otro, las medias de tratamiento han
cambiado, debido a que en el segundo anlisis son medias de tratamiento ajustadas por la
covariable.
45
ves de medir el peso del bollo se hubiera medido el peso del pan obtenido luego del
horneado, es posible que esta covariable haya sido afectada por los tratamientos, ya que es
de suponer que a mayor temperatura mayor deshidratacin y por consecuencia menor peso
del pan. En este caso, el tratamiento afect a la covariable y esta no debe ser usada como
tal.
1) Existe una relacin lineal entre la variable respuesta y la covariable.
Para verificar este supuesto se puede hacer un grfico o un anlisis de regresin. Con los
datos del ejemplo de la panadera se obtienen los siguiente resultados:
992
960
PRED_vol
929
897
865
185.50 193.75 202.00 210.25 218.50
peso
Se puede observar que hay una regresin lineal significativa (p=0.0016) entre volumen del
pan y peso del bollo.
Es importante notar que en el anlisis anterior no se removi el efecto de los tratamientos,
que como ya se vio en el primer anlisis es significativo. La no remocin de este efecto
puede llevar a no rechazar la hiptesis de coeficiente de regresin igual a cero cuando esta
es falsa. Si se tiene alguna duda al respecto, se puede realizar un ANAVA con efectos de
46
tratamiento nicamente y sobre los residuos de ese modelo (que ya tienen removido el
efecto de tratamiento) realizar la prueba del supuesto de linealidad. A continuacin se
muestra este anlisis para los datos de la panadera.
45.55
26.02
PRED_RDUO_vol1
6.50
-13.02
-32.55
185.50 193.75 202.00 210.25 218.50
peso
47
Yi ( ajustada ) Yi i X ij X i
n
X ij X i Yij Yi
donde i j 1
n
X Xi
2
ij
j 1
1 Xi X
2
Y ( ajustado ) CMR
i
ni SCresidual ( X )
Este supuesto se puede verificar en forma grfica o mediante pruebas formales.
Para los datos del archivo pan.idb se obtiene el siguiente grfico:
990
959
Vol
929
899
869
186 194 202 210 219
peso
vol-100 vol-130
vol-160 vol-190
En el grfico se puede ver que no hay una falta de paralelismo muy marcada, por lo tanto se
puede pensar en una nica pendiente de regresin para ajustar las medias de los
tratamientos.
Los supuestos del MMI se prueban sobre los residuos, que en el caso del anlisis de
covarianza para un DCA tienen la siguiente forma:
eij Yij Yi X ij X i
En general, los supuestos del MMI en ANCOVA son evaluados con las mismas tcnicas
grficas y/o probabilsticas usadas en ANAVA.
Por ultimo, la tcnica de anlisis de covarianza puede extenderse a todos los diseos y
arreglos factoriales mas comunes sin mayores complicaciones. Por ejemplo, en el caso de
un diseo en BCA con una covariable, el modelo resultante es:
Yij = + i + j + (Xij- X ) + ij , con i=1,...,a y j=1,..,b
48