Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Comenzaremos con el caso de comparar un producto con un control. Revisando los principios
básicos del diseño de experimentos para este ensayo luego se extenderá la propuesta a situaciones
con mayor número de tratamientos.
Los métodos de análisis estadísticos permiten inferencias estadísticas válidas para ir más allá de la
muestra o ensayo realizado, siempre que la forma en que se diseñe el estudio cumpla con algunos
requisitos estadísticos básicos.
Es claro que no podemos responder a esta pregunta analizando TODOS los cultivos de trigo de la
población de cultivos fertilizados en ese ambiente y compararlos con TODOS los cultivos de trigo sin
fertilizar. Entonces, haremos un ensayo donde sembraremos varias parcelas con trigo, a unas las
fertilizaremos y a otras no para observar los resultados a través del registro de valores para una
variable respuesta.
1
¡Veamos un ENSAYO!
En la imagen de este link se observa un ensayo realizado con un total de 12 parcelas o Unidades
Experimentales (UE), para evaluar 2 tratamientos (TRAT) (con y sin fertilización nitrogenada a la
siembra) aplicados a las UE. En este ensayo se usan 6 repeticiones por tratamiento, es decir 6
parcelas recibirán un mismo tratamiento y las otras 6 el otro tratamiento (el tratamiento asignados a
cada parcela se representa con un color).
El diseño experimental usado se llama Diseño Completamente al Azar (DCA). ¿Qué significa? Que
los tratamientos se asignaron totalmente al azar sobre cada UE, es decir fue usando el azar (por
ejemplo, mediante un sorteo) que se decidió cuál de los tratamientos se aplicaría a cada UE.
¿Cuándo se usa un DCA? Cuando las UE son relativamente homogéneas. En este ejemplo se supone
que el lote sobre el que se delinean las parcelas es homogéneo para características de suelo y otras
variables que podría diferencias a las parcelas antes de la siembra.
¿Por qué se aleatoriza? Porque aun cuando las parcelas parezcan similares siempre existen
diferencias entre ellas y no queremos que esas diferencias puedan favorecer los resultados
obtenidos bajo un tratamiento particular. No queremos que un tratamiento se aplique siempre
sobre las mejores parcelas y entonces dejamos que el azar decida cuál de los tratamientos irá sobre
cada parcela, es decir cuales se fertilizarán y cuales no en nuestro ejemplo.
Las 12 UE quedan clasificadas por el tratamiento que reciben, por eso decimos que el factor
tratamiento es un criterio de clasificación. Luego del crecimiento y desarrollo del cultivo, se
cosechará el trigo y se tendrán los datos de rendimiento por parcela que se muestran en el siguiente
link. Con fines didácticos, se han representado dos situaciones. Una suponiendo que no hay efecto
de tratamiento y otra donde sí hay efecto de tratamiento. Notar que existe variabilidad de los
rendimientos, de parecela a parcela, en ambas situaciones ya que el rendimiento es una variable
aleatoria que varía entre las unidades de análisis (las parcelas). Sin embargo, la variabilidad de los
rendimientos entre parcelas tiene características diferentes entre ambas situaciones.
2
Medidas resumen Situacion SIN EFECTO DE TRAT
Es decir, la desviación típica de los rendimientos de las parcelas que recibieron T1 es 958.19 Kg/ha y
su promedio 3798.90. Estos valores son muy similares a los observados en las parcelas que
recibieron el T2 y por eso estamos sospechando que no hay efecto de tratamientos.
La diferencia entre estas dos medias de rendimiento asume un valor posible de observar si se toman
al azar dos datos de la distribucion del conjunto de rendimientos. Por el contrario, en la imagen de
la derecha se representa una situación donde sospecharemos que hay efecto de tratamiento
porque la variabilidad entre parcelas de un mismo tratamiento (variabilidad dentro del tratamiento)
es menor a la variabilidad de los rendimientos entre parcelas de distintos tratmientos (variabilidad
entre tratamientos).
La media de las parcelas con T1 es 3619.08 kg/ha mientras que la media de las parcelas con T2 es
4619,22. La diferencia entre estas dos medias es apriximadamente 1000 kg/ha. La diferencia entre
las medias de los tratamientos es mayor a la variabilidad de los rendimientos observada entre las
parcelas de un mismo tratamiento, que aquí en promedio es cercana a 400 kg/ha.
3
Principios Básicos del Diseño de Experimentos
Los principios del diseño de experimentos que aseguran pruebas estadísticas válidas evitan fuentes
de sesgo potencial y controlan factores que introducen variaciones no deseadas que pueden
confundirse con los efectos del tratamiento (Fisher, 1937) son:
I. Aleatorización
II. Replicación
Por supuesto, deben ser contemplados para conformar el protocolo de ensayos sin desatender las
características propias de los sistemas de producción y los requerimientos para el buen
funcionamiento de la maquinaria y de los sensores utilizados ya sea para aplicar tratamientos como
para recuperar información sobre las unidades de análisis.
Aleatorización
La aleatorización brinda protección contra diferentes formas de tendencias y variaciones presente
en el material experimental. La aleatorización de los tratamientos a las unidades experimentales
evita la aparición de errores sistemáticos. Los diseños sistemáticos que no tienen en cuenta los
efectos de tendencia espacial podrían dar lugar a estimaciones sesgadas.
Replicación
La precisión de las estimaciones del efecto del tratamiento aumenta con el número de repeticiones
o veces que se repita cada tratamiento sobre una unidad de análisis y la homogeneidad de las (UE).
El impacto de la variabilidad aleatoria se controla con el tamaño y el número de UE involucradas en
el ensayo.
Respecto al tamaño se ha observado que los diseños con pequeñas unidades experimentales y más
repeticiones en general son más robustos a las variaciones entre UE. Por ejemplo, cuando se
experimenta con cultivos, los diseños en los que cada tratamiento se asigna a una región continua
grande podrían ser menos precisos, y los efectos del tratamiento podrían confundirse con la
variación subyacente del rendimiento.
Respecto al número de UE, diremos que la eficiencia del ensayo aumenta con el incremento en el n-
umero de repeticiones y que existen expresiones estadísticas para calcular el tamaño de muestra
necesario para conducir un experimento con la precisión deseada para la evaluación del efecto de
tratamiento.
4
Control Local
La precisión de los ensayos puede variar debido a la variabilidad introducida a las UE por otros
factores distintos al factor tratamiento. Esta variabilidad puede ser controlada con la estratificación
de las UE en grupos o “bloques” de UE relativamente homogéneas. Más adelante, se introducirá el
Diseño en Bloques Completos al Azar como un mecanismo de control local.
Definiciones importantes
Unidad experimental (UE): mínima porción del material experimental sobre el cual un tratamiento
puede ser realizado o aplicado. Cuando se diseñan ensayos comparativos es conveniente
tener repeticiones de UE, es decir un número mayor que uno de UE que reciben un mismo
tratamiento.
Tratamiento: se refiere a la acción o acciones que se aplican a las unidades experimentales con la
finalidad de observar cómo responden y así “simular experimentalmente bajo condiciones
controladas” las poblaciones que interesan comparar.
Diseño experimental: estrategia usada para asociar los TRAT a las UE. Se debe pensar en las UE
antes de realizar el experimento, es decir durante la etapa de diseño, y reconocer cualquier
estructura (no aleatoria) presente entre las UE.
Diseño completamente aleatorizado (DCA): diseño experimental usado cuando las UE son similares
entre sí (homogeneidad de UE). Como no hay estructura de las UE, los tratamientos serán aplicados
a las UE de forma completamente aleatoria, es decir cualquier UE puede recibir cualquier
tratamiento.
Modelo lineal: simplificación de la realidad usada para explicar la variabilidad de una variable
respuesta o dependiente como función de una suma de efectos de variables que se reconocen a
priori impactan la respuesta. El modelo usualmente incluye la media general o valor esperado de la
respuesta y al menos un término aleatorio que refleja la incertidumbre o porción de la variabilidad
en la respuesta no explicada por las fuentes de variación especificadas en el modelo.
5
ANAVA: método estadístico cuya finalidad es contrastar hipótesis referidas a las medias de dos o
más poblaciones, generalmente definidas por la asignación de dos o más tratamientos a un conjunto
de unidades experimentales.
Residuo eij: diferencia ente la observación j-ésima del tratamiento i-ésimo y el valor predicho por el
modelo para la UEij.
Predicho: valor que el modelo estimado predice debiera haberse observado en una UE.
Q-Q plot: gráfico de dispersión que permite comparar los cuantiles (en inglés, Quantil) de la
distribón de una variable con los cuantiles (Quantil) esperados bajo una distribución de
probabilidades teórica. Por ejemplo, el Q-Q plot normal asplicado a los residuos de un modelo de
ANAVA permite evaluar si cumple el supuesto de distribución normal de los errores del modelo.
Coeficiente de determinación, R2: correlación entre la variabilidad explicada por los términos no
aleatorios del modelo y la variabilidad total de la variable respuesta. Su valor esta entre cero y uno,
aunque suelo multiplcarse por 100 y reportarse como porcentaje.
Diferencia Mínima Significativa, DMS: (conocida por las siglas LSD del inglés “least significance
difference”, es la diferencia que tiene que existir, como mínimo, entre dos medias de tratamiento en
el ensayo para inferir que existen diferencias estadísticamente significativas entre los tratamientos,
es decir entra las medias poblacionales que se comparan. Se calcula la DMS para decidir qué
tratamiento es mejor cuando hay más de dos tratamientos en evaluación
H 0=μ 1 , μ2 ,… , μa
Donde a representa la cantidad de poblaciones a comparar a través de sus medias (en el ejemplo
anterior a=2).
6
Si se encuentran diferencias estadísticamente significativas entre los valores esperados de todas o
de al menos un par de poblaciones, se podrá inferir sobre la existencia de efectos de TRAT, ya que si
los efectos de TRAT son nulos entonces las medias poblacionales serán iguales porque se supone
que ningún otro factor está afectando la respuesta y que las posibles diferencias entre parcelas se
han “licuado” por el proceso de aleatorización.
donde:
μes la media general τ i es el efecto de la i−ésimo tratamiento (algunos tratamientos tendrán
efectos positivos, es decir sumarán al valor esperado de la variable y otros tendrán efectos negativos
o restarán al valor esperado)
ε ij es una componente aleatoria que representa el error experimental asociado a la observación ij .
Usualmente se supone que los términos de error asociados a observaciones de distintas unidades
experimentales son independientes, y que se distribuyen siguiendo una distribución normal con
media 0 y varianza σ 2 constante u “homogénea”.
Es a esta variabilidad entre repeticiones de un mismo tratamiento que se la conoce como “Error
Experimental” o variabilidad “No Explicada” por el modelo, o “variabilidad residual” y que en la
formulación del modelo lineal se denota como σ 2 .
7
La técnica aritmética del ANAVA para este modelo, estima las medias de los tratamientos y la
varianza residual o varianza de la componente aleatoria como medida de la incerteza (variabilidad
entre UE para las cuales sería esperable observar el mismo rendimiento). El erro estándar que
acompañará cada media de tratamiento estimada será la raíz cuadrad del cociente entre esta
varianza residual y el tamaño muestral desde el cual se obtuvo cada media muestral de tratamiento
(cantidad de repeticiones o n ).
La comparación de las varianzas entre y dentro de tratamientos se realiza por medio de una prueba
F basada en el cociente entre ellas. Si F es cercano a 1, debe entenderse que la variabilidad entre
medias de tratamiento es similar a la variabilidad entre repeticiones de un tratamiento y por tanto
sospecharemos que no hay efectos de tratamientos.
La otra varianza que forma parte del estadístico F, surge de la idea de plantear otro estimador para
σ2 construido a partir de las medias de los tratamientos, ya que cuando las poblaciones que se
comparan son iguales, las medias de los datos recolectados bajo cada tratamiento debieran variar
como varia cualquier otro par de datos. Luego, las a medias muestrales calculadas con
n repeticiones por tratamiento, tendría varianza igual a:
2 σ2
σ =
Ý
n
σ 2=n × S2 X́
8
Bajo la hipótesis nula, es decir cuando no hay diferencias significativas entre las medias de los
tratamientos, la varianza entre las medias de tratamiento tenderá a ser baja. En el caso que la
hipótesis nula de igualdad de medias poblacionales no fuera verdadera, la varianza de las medias de
tratamiento tenderá a crecer.
2 2
Si denotamos como σ E y σ D a las varianzas estimadas respectivamente por el CME y el CMD, se
2 2
debe observar que, bajo la hipótesis nula de igualdad de medias poblacionales, ocurrirá que σ E ¿ σ D
2 2
, en caso contrario (hipótesis nula falsa) ocurrirá que σ E ¿ σ D.
Por esta relación esperada entre las varianzas, podemos reescribir las hipótesis del ANAVA también
como una hipótesis sobre varianzas poblacionales:
H 0 :σ 2E ¿ σ 2D vs. H 1 : σ 2E ¿ σ 2D
2 2
La prueba del ANAVA consiste en calcular el estadístico F utilizando los estimadores de σ E y σ D (es
decir los cuadrados medios) de la siguiente forma:
CME
F=
CMD
Este estadístico tiene, bajo H 0, una distribución F(a−1),(N −a) con N igual al número total de unidades
distribución F(a−1),(N −a)se rechaza H 0, implicando que H1 es verdadera o, dicho de otra manera,
Como en otras pruebas estadísticas, el valor-p de la prueba se compara con el nivel de significación
fijado (α ) y si el valor p es menor que α , se rechaza la hipótesis nula.
9
Estos supuestos plantean exigencias acerca de los términos de error aleatorios y se pueden
establecer como: (a) independencia entre términos de error aleatorio, (b) distribución normal de los
términos de error aleatorio y (c) homogeneidad de varianzas o igualdad de varianza de los términos
de error entre observaciones. Este último sugiere que la variabilidad de las observaciones bajo los
distintos tratamientos es la misma o no difiere significativamente, i.e. las varianzas dentro de TRAT
son iguales.
Existen distintas técnicas de validación de supuestos. Las que se presentan aquí se basan en los
residuos. Para un DCA con un factor tratamiento como el expuesto en esta sección, el valor predicho
para la una UE es la media del tratamiento que fue asignado a esa UE, razón por la cual el residuo
(diferencia entre el valor observado y el predicho por el modelo) para la UE ijse calcula como:
Construir un Q-Q plot con los residuos. Mediante esta técnica se obtiene un diagrama de dispersión
en el que, si los errores son normales y no hay otros defectos del modelo, los residuos se alinean
sobre una recta a 45°, es decir los residuos calculados para cada UE en el experimento correlacionan
bien con los residuos que se esperarían si la distribución de los errores fuese la distribución normal
téorica.
10
El siguiente gráfico de residuos vs. predichos sugiere que no se cumple el supuesto de
homogeneidad en las varianzas. La heterogeneidad de varianzas se pone de manifiesto ya que a
medida que crecen los valores predichos por el modelo, aumentan las dispersiones de los residuos;
así los tratamientos con mayores valores predichos tienen más variabilidad entre sus repeticiones
que los tratamientos con menor valor predicho.
En casos de heterogeniedad de varianzas, los valores-p con los que se concluye sobre la hipótesis de
interés no serán correcto y por tanto también se compromete la validez de las conclusiones. En caso
de heterogeneidad de varianzas se recurre otro tipo de ANAVA donde no es necesario suponer
varianzas homogéneas como es el ANAVA bajo un modelo lineal mixto.
La falta de independencia etambién puede poner en riesgo las conclusiones del ANAVA y en
situaciones de marcada dependendencia o correlacion en los datos se ajusta el modelo de ANAVA
bajo el marco teórico de los Modelos Lineales Mixtos. La aleatorización en la asignación de los
tratamientos a las unidades experimentales, en la secuencia de medición de los resultados del
ensayo, o en cualquier otra etapa experimental que pueda introducir una fuente sistemática de
error, es un método eficaz para evitar la falta de cumplimiento del supuesto de independencia.
Si los supuestos se han logrado verificar, es decir se cumplen para los datos que hemos analizado,
entonces concluiremos rechazando o no la hipótesis de nulidad de efectos de tratamiento en
función del valor-p reportado. Si valor-p fuese 0,01 es decir menor a 0,05 (nivel de significación
11
generalmente usado en la investigación científica) rechazaremos la hipótesis nula del ANAVA porque
solo en 1 de cada 100 ensayos, como el realizado, podría observarse una diferencia de medias
muestrales como la observada sólo por azar. Como la probabilidad de diferencias azarosas es bajo,
tenemos evidencia para inferir sobre la existencia de diferencias entre las medias de cultivos
fertilizados respecto a los no fertilizados.
12
Diseño en Bloques Completos al Azar
Uno de los principios básicos del diseño de experimentos (Fisher 1939) es el control local. El principio
proviene de la necesidad comparar los tratamientos de interés bajo condiciones homogéneas.
Luego, si existe variabilidad entre las unidades experimentales (UE), armaremos un bloque de UE
homogéneas donde pueda aplicarse una vez cada tratamiento, posteriormente se armará otro
bloque de UE o repetición de la comparación de los tratamientos. La cantidad de bloques será el
número de repeticiones del ensayo.
Este arreglo experimental de las UE y el tratamiento se llama Diseño en Bloques Completos al Azar
(DBCA), porque se han armado bloques de UE homogéneas con tantas UE como tratamiento para
que todos los tratamientos se comparen en el mismo bloque (completo quiere decir con todos los
tratamientos se encuentran dentro de cada bloque). además, los tratamientos son asignados al azar
sobre las UE de cada bloque.
Por razones de practicidad, no podemos responder a esta pregunta analizando TODOS los cultivos de
trigo de la población de cultivos fertilizados y compararlos con TODOS los cultivos sin fertilizar.
Entonces, diseñamos un ensayo donde sembraremos varias parcelas con trigo, a unas las
fertilizaremos y a otras no las fertilizaremos. Supongamos que decidimos que el ensayo tendrá 6
repeticiones, es decir habrá 6 parcelas fertilizadas y 6 sin fertilizar.
¡Cuando vamos al terreno a delimitar las parcelas experimentales notamos que hay una pendiente y
que las parcelas que se ubiquen en la parte más alta del lote podrían rendir menos que las que están
en el bajo ya que en esta zona se acumula más agua, es decir Las UE no son homogéneas!
Dependiendo de su posición en el gradiente de la pendiente algunas pueden ser mejor UE que otras.
Si aleatorizamos los tratamientos completamente (es decir implementamos un DCA) podría ser que
un tratamiento se asignara más veces a las parcelas del bajo. El efecto sobre la variable dependiente
(rendimiento) de la posición en el terreno o pendiente podría confundir efectos de TRATAMIENTO.
Realizaremos un DBCA como estrategia de Control Local de la variabilidad entre las UE para evitar
que dicha variabilidad confunda nuestras conclusiones sobre los tratamientos.
13
Diremos que, si no es posible disponer de UE homogéneas, pero existe algún criterio de clasificación
de la UE que permita agruparlas de forma tal que cada grupo de UE sea internamente homogéneo se
podrá realizar un DBCA.
Cada tratamiento será evaluado en todas las posiciones o niveles de pendiente. La comparación de
los tratamientos dentro de cada bloque no se ve afectada por el factor pendiente ya que las parcelas
de un mismo bloque están a la misma elevación.
¿Cuándo se usa un DBCA? Cuando las UE NO son homogéneas y se requiere armar bloques de UE
homogéneas. Las 12 UE quedan clasificadas por el tratamiento que reciben, por eso decimos que el
factor tratamiento es un criterio de clasificación.
Luego del crecimiento y desarrollo del cultivo, se cosecha y se tienen los datos de rendimiento por
parcela que se muestran en el siguiente link. Hemos representado dos situaciones: 1) suponiendo
que no hubo efecto de tratamiento pero sí hay efecto de bloque y 2) suponiendo que si hubo efecto
de tratamiento y hay efecto de bloque. Como puede observarse a partir de los valores de
rendimiento, existe variabilidad de los rendimientos de parcela a parcela en ambas situacione. En la
situacion sin efecto de tratamiento se observa variabilidad de bloque a bloque, es decir hay bloques
que rinden mas que otros independientemente de los tratamientos. En este ejemplo, a la
variabilidad entre bloques la atribuiremos a efectos de la pendiente ya que dijimos que los bloques
habian sido dispuestos ortogonal o perpendiculares al sentido de variación del factor pendiente que
pretendemos controlar con el diseño. Sin embargo, les importante remarcar que la fuente de
14
variación de interés no es la atribuida por la pendiente sino la debida a la fertilización es decir la
producida por los tratamiento.
En la situacion que hemos usado para representar que no hay efecto de tratamiento la variabilidad
de los rendimientos entre parcelas de un mismo bloque es similar. La diferencia entre dos medias de
rendimiento de un mismo bloque asume un valor posible de observar si se toman al azar dos datos
de la distribucion de rendimientos de trigo tratados de la misma forma, es decir sin efectos de
tratamiento.
En la situación que hemos usado para representar que SI hay efecto de tratamiento la variabilidad
entre parcelas es alta y se debe a ambas fuentes de variación, el efecto del bloque que existía
independientemente del tratamiento mas el efecto del tratamiento (las fertilizadas producen mas
rendimiento que las no fertilizada independientemente del bloque en el que comparemos estos
rendimientos).
Independientemente del diseño, la diferencia entre las dos muestras de la respuesta del cultivo
obtenidas con y sin fertilización a la siembra en el ensayo, será usada para inferir si el valor esperado
del rendimiento debe ser el mismo (o no) en situaciones con y sin fertilizante.
H 0=μ 1 , μ2 ,… , μa
donde a representa la cantidad de poblaciones a comparar a través de sus medias (en el ejemplo,
a=2).
Y ij =μ+ τ i+ β j+ e ij
donde:
15
Y ij es la j−ésima observación de la variable respuesta realizada bajo el i−ésimo tratamiento en el
bloque j .
e ij es una componente aleatoria que representa el error experimental asociado a la observación ij .
Usualmente se supone que los términos de error asociados a observaciones de distintas UE son
independientes, y que se distribuyen siguiendo una distribución normal con media 0 y varianza σ 2
constante u “homogénea”.
Si las diferencias entre unidades experimentales debidas al factor de bloqueo no son consideradas,
es decir si omitimos el efecto bloque en el modelo, los efectos de bloques se adicionan al término de
error del modelo. Así, la varianza del error aumenta y como consecuencia se pierde eficiencia en la
prueba de la hipótesis referida a las medias de tratamiento, que es la hipótesis de interés. Los
resultados del ANAVA de un DBCA también se presentan en una tabla de ANAVA como el DCA, pero
en este caso habrá una fila extra asociada a la variabilidad de la respuesta entre bloques. La
comparación entre las medias de bloques, en general, no es de interés:
2- porque no se asocian con los tratamientos, sino que responden a un factor de control
3- porque la aleatorización fue realizada solo dentro de los bloques. Tal restricción de aleatorización
hace que el estadístico construido y por ello el cociente de medidas de variabilidad entre bloques y
la varianza residual no siga una distribución F . Además, no interesa inferir sobre una población de
bloques. No obstante, este cociente suele ser usado para realizar sugerencias sobre la conveniencia
o no de haber bloqueado. Un valor de F grande, es tomado como un indicador de que el DBCA fue
una buena elección como diseño experimental ya que se observaron diferencias entre las medias de
los bloques (hubo heterogeneidad entre bloques).
A través del ANAVA se obtendrá el estadístico F asociado a la variabilidad entre tratamientos el cual
permitirá concluir sobre la hipótesis nula de interés (hipótesis sobre igualdad de medias de
tratamientos). Este estadístico F resulta del cociente entre una medida de la variabilidad entre
16
tratamientos y una medida de la variabilidad dentro de tratamientos, luego de descontar
variabilidades que podrían deberse al efecto de Bloque y que se observan como diferencias entre las
medias de los bloques. El DBCA, permite que la variabilidad residual o no explicada del ANAVA no
sea sobreestimada a consecuencia del efecto que otro factor que no es el factor tratamiento (como
la pendiente, en nuestro ejemplo) podría tener sobre las UE.
Luego, para un nivel de significación α, si el valor-p asociado al efecto de TRAT es menor a α , se
rechaza H 0, implicando que H 1 es verdadera o, dicho de otra manera, existen diferencias
La técnica del ANAVA para el modelo del DBCA, estima las medias de los tratamientos y la varianza
residual, o varianza no explicada luego de descontar efectos de tratamientos y efectos de bloques,
como medida de la incerteza. El error estándar que acompañará cada media de tratamiento
estimada será la raíz cuadrada del cociente entre esta varianza residual y el tamaño muestral desde
el cual se obtuvo cada media muestral de tratamiento (cantidad de repeticiones o bloques).
En caso de que alguno de estos supuestos no se cumpla, impactarán sobre el valor-p usado para
concluir sobre la hipótesis de interés, afectando así la calidad de las conclusiones. Por ello, resulta
importante verificar que los supuestos del análisis se cumplen antes de elaborar conclusiones.
17
Diseño Factorial
Hemos desarrollado modelos estadísticos de clasificación para un DCA y para un DBCA se han
diferenciado por la presencia (o no) de estructura en las UE. Seguidamente veremos un diseño que
se usa cuando existe estructura en los tratamientos. En todo experimento deben reconocerse dos
estructuras: 1) la estructura de las unidades experimentales (UE) y 2) la estructura de los
tratamientos. Mediante el diseño del experimento se vinculan estas dos estructuras.
Si las UE son homogéneas, es decir, no existe estructura en las UE, usaremos un DCA (ya que si todas
las UE son iguales cualquiera podría recibir un tratamiento particular). Por el contrario, si las UE no
son homogéneas, existe la posibilidad de confundir efectos de tratamientos con diferencias entre las
UE que existen más allá del tratamiento que se les aplique. Una forma de controlar variabilidad
entre las UE es a través del “bloqueo" o estratificación de UE y para tal fin se usa, por ejemplo, el
diseño conocido como DBCA.
En los diseños factoriales se habla de factores cruzados cuando cada nivel de un factor se combina
con cada uno de los niveles del otro factor para formar un tratamiento y son especialmente útiles
para analizar el fenómeno denominado interacción. Se dice que hay interacción entre los factores
tratamientos cuando el efecto de un factor depende del nivel del otro factor tratamiento en el que
se lo observa.
Supongamos que interesa responder las preguntas sobre la existencia (o no) de diferencias de
rendimiento entre cultivos de trigo fertilizados con nitrógeno a la siembra respecto a cultivos de
trigo sin fertilizar y además entre cultivos de trigo a los que se le ha aplicado un estimulante o
promotor de crecimiento al macollaje respecto a cultivos de trigo que no incluyen este promotor. Es
18
decir, existen dos factores tratamiento de los cuales nos interesa evaluar su efecto sobre el
rendimiento de trigo: el factor fertilización nitrogenada (Factor A) y el factor promotor o estimulante
del macollaje (Factor B).
Podríamos diseñar un ensayo para evaluar la fertilización y otro ensayo para evaluar el promotor
pero en ese caso no podríamos evaluar cuál es el impacto de aplicar ambos inputs sobre la misma
UE, es decir qué rendimiento se espera cuando fertilizamos a la siembra y, además, aplicamos
durante el macollaje el promotor del crecimiento. Cuando existen dos (o más) factores y se pueden
cruzar sus niveles (i.e. definir a los tratamientos en función de la combinación de los niveles de
ambos factores, de manera tal que todos los niveles de un factor se pueden ensayar con todos los
niveles del otro factor) se obtiene este diseño más eficiente e informativo que se llama Diseño
Factorial.
Para este ejemplo, haremos un ensayo donde sembraremos varias parcelas con trigo, a unas solo las
fertilizaremos durante la siembra, en otras solo aplicaremos el promotor en el macollaje, en otras
fertilizaremos a la siembra y, además, aplicaremos el promotor en el macollaje y finalmente
incluiremos parcelas control, es decir parcelas donde no se usa ninguno de los dos inputs o factores
tratamiento que queremos evaluar. En este diseño factorial se evaluarán 4 (cuatro) tratamientos
que provienen de la combinación de dos factores con dos niveles cada uno (2x2). Si antes de aplicar
los tratamientos hemos visto que el sitio de ensayo es uniforme y no identificamos estructura alguna
en la UE, usaremos un DCA para asignar los tratamientos a las UE.
Los tratamientos surgen de combinar dos factores de interés (Factor A y Factor B) donde cada uno
de estos factores tiene dos niveles. Llamaremos T1 a la situación control, es decir donde no se usa
ningún input; T2 al tratamiento que surge cuando aplicamos fertilizante pero no el promotor, T3; al
tratamiento que implica solo uso del promotor y T4 al tratamiento donde se aplican ambos inputs.
En este ensayo se usan 3 repeticiones por TRAT, es decir 3 parcelas recibirán un mismo tratamiento
(el tratamiento asignados a cada parcela se representa con un color, por ello hay 4 colores).
Este diseño factorial sería mejor denominado como Diseño Completamente al Azar con Estructura
Factorial de Tratamientos.
¿Qué significa? Que los tratamientos representan combinación de los niveles de los factores
tratamiento y que se asignaron totalmente al azar sobre cada UE, es decir fue usando el azar (por
19
ejemplo, mediante un sorteo) que se decidió si se fertilizaba o no y si se aplicaba el promotor o no a
cada UE, hasta lograr las 3 repeticiones de cada tratamiento.
Las 12 UE quedan clasificadas según el nivel del Factor A y según el nivel del Factor B que reciben,
por eso decimos que ambos, el Factor A y el Factor B, son criterios de clasificación, pero también
quedan clasificadas por la combinación de ambos que define a T1, T2, T3 y T4.
Luego del crecimiento y desarrollo del cultivo, se cosechará el trigo y se tendrán los datos de
rendimiento por parcela que se muestran en el siguiente link. Con fines didácticos, se han
representado dos situaciones. Una suponiendo que no hay efecto de tratamiento y otra donde sí hay
efecto de tratamiento.
Notar que existe variabilidad de los rendimientos, de parcela a parcela, en ambas situaciones ya que
el rendimiento es una variable aleatoria que varía entre las unidades de análisis (las parcelas). Sin
embargo, la variabilidad de los rendimientos entre parcelas tiene características diferentes entre
ambas situaciones.
Por el contrario, en la imagen de la derecha se representa una situación donde sí hay efecto de
tratamiento. Se observa que hay variabilidad entre los tratamientos. Por ejemplo, las parcelas que
llevan T4 (es decir las que recibieron ambos inputs) muestran rendimientos mayores a 4000 kg/ha,
mientras que otras parcelas el rendimiento es siempre menor.
Como tenemos un diseño factorial la variabilidad de los rendimientos podrá descomponerse en tres
componentes: el efecto principal del Factor A, el efecto principal del Factor B y la interacción entre
Factor A y Factor B. Aquí, en este ejemplo encontraremos que hay interacción entre los factores.
¿Por qué? porque la diferencia entre parcelas con el promotor de crecimiento respecto a aquellas
donde no se usó este producto pareciera ser diferente en las parcelas fertilizadas que en las no
fertilizadas.
La interacción entre factores puede ser evaluada sólo en experimentos con diseño factorial que
tengan repeticiones de cada tratamiento.
20
¿Cómo analizaremos estadísticamente el ensayo para concluir en términos poblacionales
sobre los efectos principales del Factor A, los efectos del principales Factor B o los efectos de
interacción entre factores?
Usaremos la técnica de ANAVA (Análisis de Varianza) para inferir a partir de este ensayo (el cual se
entiende como una muestra del rendimiento que se podría cosechar bajo estos tratamientos) si se
puede esperar un aumento de rendimientos al fertilizar el trigo a la siembra, al usar el promotor que
se aplica en el macollaje y además podremos saber si el efecto de un factor de interés depende del
nivel del otro factor, es decir si existe interacción entre los efectos del fertilizante y del promotor de
crecimiento. Usualmente cuando hay interacción se comparan todas las medias de tratamiento y si
no hay interacción entonces podemos hablar de los efectos principales de cada factor tratamiento.
con i=1 , ..., a ; j=1 ,... , b ; k =1, .. , nij , donde Y ijk representa la respuesta en la k −ésima
repetición del i−ésimo nivel del factor A y j−ésimo nivel de factor B, μ representa la media
general, α i el efecto que produce el i-ésimo nivel del factor A, δ j corresponde al efecto del j-ésimo
nivel del factor B y el término α δ ij representa los efectos adicionales (interacciones) de las
combinaciones de los niveles de los factores (A*B). Los términos de error e ijk asociados a cada
observación se suponen normal e independientemente distribuidos con media cero y varianza
común o varianza homogénea.
La tabla de ANAVA tendrá una fila para evaluar la significancia estadística del efecto principal del
Factor A, otra para evaluar el efecto principal del Factor B y una extra para evaluar la significancia de
la interacción entre Factores. El efecto principal del Factor A se evalúa a través de la comparación de
medias de los distintos niveles del Factor A. El efecto principal del Factor B se evalúa a través de la
comparación de medias de los distintos niveles del Factor B. Esto siempre y cuando no haya
interacción estadísticamente significativa, i.e. el valor p de interacción es menor al nivel de
21
significación. Cuando la interacción resulta significativa se estudia la interacción comparando las
medias de todos los TRAT conformados por combinación de factores y no se estudian los efectos
principales de los factores ya que las diferencias de medias de los niveles de un factor podrían estar
mal estimada por efecto de la interacción. Los supuestos del modelo lineal son los que hemos visto
para un DCA (i.e. Normalidad, Independencia y Homogeneidad de Varianzas), y para cada caso
particular se evalúan usando las herramientas ya presentadas como es el análisis de los residuos. Si
hay efectos significativos de tratamiento se comparan las medias mediante pruebas de
comparaciones múltiples como LSD o DGC.
A continuación, se muestra el ANAVA de un Diseño factorial para el ensayo de trigo usado para
presentar el diseño factorial, un ensayo cuyo objetivo es evaluar el efecto de la fertilización a la
siembra en trigo, con o sin el aplicado de un promotor de crecimiento en macollaje.
Análisis de la varianza
Variable N R² R² Aj CV
F.V. SC gl CM F p-valor
Total 4204321.28 11
22
Fertilizado Con 4495 3 119.94 C
Medias con una letra común no son significativamente diferentes (p > 0.05)
23
por ha). Las parcelas eran uniformes y toda otra fuente de variación, distinta a los dos factores
tratamientos, fue mantenida constante. En cada parcela se aleatorizó la asignación de los TRAT.
Los resultados a obtener al hacer el análisis se presentan a continuación junto a un gráfico de medias
de tratamiento.
Análisis de la varianza
Variable N R² R² Aj CV
F.V. SC gl CM F p-valor
Total 4204321.28 11
Medias con una letra común no son significativamente diferentes (p > 0.05)
24
4700
4300
Rendimiento (kg/ha)
3900
3500
3100
2700
Sin fertilizar Fertilizado
Fertilización
Ejercicios
Aplicación del ANAVA bajo un diseño completamente aleatorizado.
Para comparar el efecto de la fertilización en trigo se realiza un ensayo bajo un diseño en
Bloques Completos al Azar (DBCA) con dos tratamientos, un tratamiento es fertilizar a la
siembra y el otro es sembrar sin fertilizar. Al final del ensayo se registra el rendimiento en
cada parcela. Las parcelas diferían respecto a su posición en el terreno por efecto de una
pronunciada pendiente. Por ello se armaron bloques de dos parcelas con igual posición en
el gradiente de pendiente y en cada bloque se aleatorizó la asignación de los Tratamientos.
El objetivo es analizar posibles diferencias entre los rendimientos promedio de ambos
tratamientos. Los datos se encuentran en el archivo EnsayoDBCA.IDB2.
Actividad
25
Trabajando con un nivel de significación igual a 0.05, ¿se rechaza la
hipótesis nula del efecto Tratamientos?
26
Evaluación de genotipos de papa y tratamientos para el control de nemátodos
El interés de este ensayo es estudiar el efecto de un producto natural para disminuir la carga de
nemátodos en suelo sobre distintos cultivares de papa. Se realizó un ensayo en invernadero donde
se evaluaron 3 cultivares de papas en macetas (una planta por maceta) que contenían suelos
provenientes de áreas con distinta carga de nemátodos (Alta, Media y Baja). Se asignaron los
tratamientos a las macetas mediante sorteo. Al cabo de un tiempo se evaluaron varias
características de las plantas que se usaron para crear un índice de severidad de enfermedad (ISE) en
cada unidad experimental. Los datos se muestran en la siguiente tabla. Ingresarlos a InfoStat y
realizar el ANAVA para el modelo lineal para responder a las preguntas.
Actividad
1. Especifique las unidades experimentales
2. Especifique los tratamientos
27
3. ¿Cuántos niveles tiene cada uno de los factores?
4. ¿Cuántas repeticiones de cada tratamiento hay?
5. Identifique la estructura de parcelas
6. Escriba el modelo correspondiente a un ANAVA para un DCA con arreglo factorial de
tratamientos
7. Establezca las hipótesis que se contrastan mediante el ANAVA
8. Realice un ANAVA
9. Haga una representación gráfica
10. Interprete el ANAVA y las comparaciones de medias provistas. ¿El efecto principal de cada
uno de los factores es estadísticamente significativo?
11. Dado el resultado de la interacción, ¿conviene evaluar la hipótesis de efectos principales
nulos para cada factor independientemente?
12. Concluya acerca de los resultados obtenidos
Referencias
Balzarini M.G., Gonzalez L., Tablada M., Casanoves F., Di Rienzo J.A., Robledo C.W. (2008). InfoStat-
Manual del Usuario, Editorial Brujas, Córdoba, Argentina.
Di Rienzo, J.A., Macchiavelli R, Casanoves F. (2009) Modelos Mixtos en InfoStat. Edición electrónica.
Disponible con la distribución del software estadístico InfoStat (www.infostat.com.ar).
Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versión
2010. Grupo InfoStat, FCA, Universidad Nacional de Córdoba, Argentina.
Draper N.R, Smith H. (1998). Applied Regression Analysis (Third Edition). John Wiley & Sons, New
York 706.
Hacking. (1991). La domesticación del azar: La erosión del determinismo y el nacimiento de las
ciencias del caos. Barcelona: Editorial Gedisa.
28