Está en la página 1de 28

Introducción

En la investigación agropecuaria es frecuente conducir ensayos, a campo o en laboratorio, para


concluir sobre la existencia (o no) de diferencias estadísticas entre dos o más poblaciones de datos
de una variable respuesta. El protocolo de experimentación o diseño del ensayo depende de sus
objetivos, en este material supondremos que se tiene por objetivo la estimación de efectos globales
de tratamientos.

Comenzaremos con el caso de comparar un producto con un control. Revisando los principios
básicos del diseño de experimentos para este ensayo luego se extenderá la propuesta a situaciones
con mayor número de tratamientos.

El propósito de un ensayo agronómico como el que vamos a implementar es habilitar la


generalización de los resultados del ensayo a situaciones similares en el futuro. Los resultados
numéricos sobre rasgos medibles en el ensayo sólo son útiles si se pueden “extrapolar” a
condiciones similares. Con este propósito en mente, un ensayo debe considerarse como una
muestra simple de una población potencialmente grande de ensayos similares que podrían haberse
realizado con el mismo producto. Diremos que existen diferencias estadísticas cuando las diferencias
observadas en el ensayo realizado tienen baja probabilidad de ser por azar.

Los métodos de análisis estadísticos permiten inferencias estadísticas válidas para ir más allá de la
muestra o ensayo realizado, siempre que la forma en que se diseñe el estudio cumpla con algunos
requisitos estadísticos básicos.

Diseño Completamente Aleatorizado


Ejemplo de un Ensayo siguiendo un DCA
Supongamos que interesa responder, para un ambiente particular, la pregunta sobre la existencia (o
no) de diferencias de rendimiento entre cultivos de trigo fertilizados con 150 kg/ha de nitrógeno a la
siembra respecto a cultivos de trigo sin fertilizar.

Es claro que no podemos responder a esta pregunta analizando TODOS los cultivos de trigo de la
población de cultivos fertilizados en ese ambiente y compararlos con TODOS los cultivos de trigo sin
fertilizar. Entonces, haremos un ensayo donde sembraremos varias parcelas con trigo, a unas las
fertilizaremos y a otras no para observar los resultados a través del registro de valores para una
variable respuesta.

1
¡Veamos un ENSAYO!
En la imagen de este link se observa un ensayo realizado con un total de 12 parcelas o Unidades
Experimentales (UE), para evaluar 2 tratamientos (TRAT) (con y sin fertilización nitrogenada a la
siembra) aplicados a las UE. En este ensayo se usan 6 repeticiones por tratamiento, es decir 6
parcelas recibirán un mismo tratamiento y las otras 6 el otro tratamiento (el tratamiento asignados a
cada parcela se representa con un color).

El diseño experimental usado se llama Diseño Completamente al Azar (DCA). ¿Qué significa? Que
los tratamientos se asignaron totalmente al azar sobre cada UE, es decir fue usando el azar (por
ejemplo, mediante un sorteo) que se decidió cuál de los tratamientos se aplicaría a cada UE.

¿Cuándo se usa un DCA? Cuando las UE son relativamente homogéneas. En este ejemplo se supone
que el lote sobre el que se delinean las parcelas es homogéneo para características de suelo y otras
variables que podría diferencias a las parcelas antes de la siembra.

¿Por qué se aleatoriza? Porque aun cuando las parcelas parezcan similares siempre existen
diferencias entre ellas y no queremos que esas diferencias puedan favorecer los resultados
obtenidos bajo un tratamiento particular. No queremos que un tratamiento se aplique siempre
sobre las mejores parcelas y entonces dejamos que el azar decida cuál de los tratamientos irá sobre
cada parcela, es decir cuales se fertilizarán y cuales no en nuestro ejemplo.

Las 12 UE quedan clasificadas por el tratamiento que reciben, por eso decimos que el factor
tratamiento es un criterio de clasificación. Luego del crecimiento y desarrollo del cultivo, se
cosechará el trigo y se tendrán los datos de rendimiento por parcela que se muestran en el siguiente
link. Con fines didácticos, se han representado dos situaciones. Una suponiendo que no hay efecto
de tratamiento y otra donde sí hay efecto de tratamiento. Notar que existe variabilidad de los
rendimientos, de parecela a parcela, en ambas situaciones ya que el rendimiento es una variable
aleatoria que varía entre las unidades de análisis (las parcelas). Sin embargo, la variabilidad de los
rendimientos entre parcelas tiene características diferentes entre ambas situaciones.

Analizemos cada situación


En la situación que hemos usado para representar que no hay efecto de tratamiento (gráfica
izquierda) la variabilidad de los rendimientos entre parcelas de un mismo color (mismo tratamiento)
es similar a la variabilidad entre parcelas de distintos tratamientos. Todos los rendimientos
observados parecieran provenir de una misma población de valores. La media y el DE del conjunto
de datos en esta situación donde los tratamientos no han surtido ninfun efecto y por tanto no se
observan diferencias entre parecelas bajo distinto tratamiento son:

2
Medidas resumen Situacion SIN EFECTO DE TRAT

Tratamientos Variable n Media D.E.


T1 Rendimiento 6 3798.90 958.19
T2 Rendimiento 6 3658.80 929.85

Es decir, la desviación típica de los rendimientos de las parcelas que recibieron T1 es 958.19 Kg/ha y
su promedio 3798.90. Estos valores son muy similares a los observados en las parcelas que
recibieron el T2 y por eso estamos sospechando que no hay efecto de tratamientos.

La diferencia entre estas dos medias de rendimiento asume un valor posible de observar si se toman
al azar dos datos de la distribucion del conjunto de rendimientos. Por el contrario, en la imagen de
la derecha se representa una situación donde sospecharemos que hay efecto de tratamiento
porque la variabilidad entre parcelas de un mismo tratamiento (variabilidad dentro del tratamiento)
es menor a la variabilidad de los rendimientos entre parcelas de distintos tratmientos (variabilidad
entre tratamientos).

Medidas resumen en la situacion CON EFECTO DE TRATAMIENTO

Tratamientos Variable n Media D.E.


T1 Rendimiento 6 3619.08 366.05
T2 Rendimiento 6 4619.22 314.73

La media de las parcelas con T1 es 3619.08 kg/ha mientras que la media de las parcelas con T2 es
4619,22. La diferencia entre estas dos medias es apriximadamente 1000 kg/ha. La diferencia entre
las medias de los tratamientos es mayor a la variabilidad de los rendimientos observada entre las
parcelas de un mismo tratamiento, que aquí en promedio es cercana a 400 kg/ha.

¿Cómo analizaremos estadísticamente el ensayo para concluir en términos


poblacionales o generales?
Usaremos la técnica de ANAVA (Análisis de Varianza) para inferir a partir de este ensayo (el cual se
entiende como una muestra del rendimiento que se podría cosechar bajo estos tratamientos) si se
puede esperar un aumento de rendimientos al fertilizar el trigo a la siembra (bajo condiciones
similares a la del ensayo).

Del ENSAYO (MUESTRA), queremos inferir sobre

EFECTOS DE TRATAMIENTO en la POBLACION

3
Principios Básicos del Diseño de Experimentos
Los principios del diseño de experimentos que aseguran pruebas estadísticas válidas evitan fuentes
de sesgo potencial y controlan factores que introducen variaciones no deseadas que pueden
confundirse con los efectos del tratamiento (Fisher, 1937) son:

I. Aleatorización

II. Replicación

III. Control local

Por supuesto, deben ser contemplados para conformar el protocolo de ensayos sin desatender las
características propias de los sistemas de producción y los requerimientos para el buen
funcionamiento de la maquinaria y de los sensores utilizados ya sea para aplicar tratamientos como
para recuperar información sobre las unidades de análisis.

Aleatorización
La aleatorización brinda protección contra diferentes formas de tendencias y variaciones presente
en el material experimental. La aleatorización de los tratamientos a las unidades experimentales
evita la aparición de errores sistemáticos. Los diseños sistemáticos que no tienen en cuenta los
efectos de tendencia espacial podrían dar lugar a estimaciones sesgadas.

Replicación
La precisión de las estimaciones del efecto del tratamiento aumenta con el número de repeticiones
o veces que se repita cada tratamiento sobre una unidad de análisis y la homogeneidad de las (UE).
El impacto de la variabilidad aleatoria se controla con el tamaño y el número de UE involucradas en
el ensayo.

Respecto al tamaño se ha observado que los diseños con pequeñas unidades experimentales y más
repeticiones en general son más robustos a las variaciones entre UE. Por ejemplo, cuando se
experimenta con cultivos, los diseños en los que cada tratamiento se asigna a una región continua
grande podrían ser menos precisos, y los efectos del tratamiento podrían confundirse con la
variación subyacente del rendimiento.

Respecto al número de UE, diremos que la eficiencia del ensayo aumenta con el incremento en el n-
umero de repeticiones y que existen expresiones estadísticas para calcular el tamaño de muestra
necesario para conducir un experimento con la precisión deseada para la evaluación del efecto de
tratamiento.

4
Control Local
La precisión de los ensayos puede variar debido a la variabilidad introducida a las UE por otros
factores distintos al factor tratamiento. Esta variabilidad puede ser controlada con la estratificación
de las UE en grupos o “bloques” de UE relativamente homogéneas. Más adelante, se introducirá el
Diseño en Bloques Completos al Azar como un mecanismo de control local.

Definiciones importantes
Unidad experimental (UE): mínima porción del material experimental sobre el cual un tratamiento
puede ser realizado o aplicado. Cuando se diseñan ensayos comparativos es conveniente
tener repeticiones de UE, es decir un número mayor que uno de UE que reciben un mismo
tratamiento.

Tratamiento: se refiere a la acción o acciones que se aplican a las unidades experimentales con la
finalidad de observar cómo responden y así “simular experimentalmente bajo condiciones
controladas” las poblaciones que interesan comparar.

Repeticiones: UE tratadas de la misma forma incluidas en el experimento para evaluar la


variabilidad de la variable respuesta dentro de cada TRAT.

Diseño experimental: estrategia usada para asociar los TRAT a las UE. Se debe pensar en las UE
antes de realizar el experimento, es decir durante la etapa de diseño, y reconocer cualquier
estructura (no aleatoria) presente entre las UE.

Diseño completamente aleatorizado (DCA): diseño experimental usado cuando las UE son similares
entre sí (homogeneidad de UE). Como no hay estructura de las UE, los tratamientos serán aplicados
a las UE de forma completamente aleatoria, es decir cualquier UE puede recibir cualquier
tratamiento.

Aleatorización: proceso aplicado en la asignación de tratamiento a UE orientado a minimizar el


efecto de errores sistemáticos. La asignación aleatoria de los tratamientos a las UE y la conducción
cuidadosa del estudio, contribuyen a que el supuesto de independencia de los términos de error del
modelo estadístico se cumpla. 

Modelo lineal: simplificación de la realidad usada para explicar la variabilidad de una variable
respuesta o dependiente como función de una suma de efectos de variables que se reconocen a
priori impactan la respuesta. El modelo usualmente incluye la media general o valor esperado de la
respuesta y al menos un término aleatorio que refleja la incertidumbre o porción de la variabilidad
en la respuesta no explicada por las fuentes de variación especificadas en el modelo.

5
ANAVA: método estadístico cuya finalidad es contrastar hipótesis referidas a las medias de dos o
más poblaciones, generalmente definidas por la asignación de dos o más tratamientos a un conjunto
de unidades experimentales.

Residuo eij: diferencia ente la observación j-ésima del tratamiento i-ésimo y el valor predicho por el
modelo para la UEij.

Predicho: valor que el modelo estimado predice debiera haberse observado en una UE.

Q-Q plot: gráfico de dispersión que permite comparar los cuantiles (en inglés, Quantil) de la
distribón de una variable con los cuantiles (Quantil) esperados bajo una distribución de
probabilidades teórica. Por ejemplo, el Q-Q plot normal asplicado a los residuos de un modelo de
ANAVA permite evaluar si cumple el supuesto de distribución normal de los errores del modelo.

Coeficiente de determinación, R2: correlación entre la variabilidad explicada por los términos no
aleatorios del modelo y la variabilidad total de la variable respuesta. Su valor esta entre cero y uno,
aunque suelo multiplcarse por 100 y reportarse como porcentaje.

Diferencia Mínima Significativa, DMS: (conocida por las siglas LSD del inglés “least significance
difference”, es la diferencia que tiene que existir, como mínimo, entre dos medias de tratamiento en
el ensayo para inferir que existen diferencias estadísticamente significativas entre los tratamientos,
es decir entra las medias poblacionales que se comparan. Se calcula la DMS para decidir qué
tratamiento es mejor cuando hay más de dos tratamientos en evaluación

Efecto de tratamiento> Diferencia entre la media poblacional de la variable bajo un tratamiento y la


media poblacional general. Si un tratamiento tiene efecto positivo, significa que bajo ese
tratamiento la media de la variable es mayor a la media general.

Técnica del ANAVA (Análisis de Varianza)


La diferencia entre las dos muestras de la respuesta del cultivo obtenidas con y sin fertilización en el
ensayo, será usada para inferir si el valor esperado del rendimiento debe ser el mismo (o no) en
situaciones con y sin fertilizante. Las hipótesis estadísticas por contrastar en un ANAVA son:

H 0=μ 1 , μ2 ,… , μa

H 0= Al menosuna de las a medias poblacionales es distinta

Donde a  representa la cantidad de poblaciones a comparar a través de sus medias (en el ejemplo
anterior a=2).

6
Si se encuentran diferencias estadísticamente significativas entre los valores esperados de todas o
de al menos un par de poblaciones, se podrá inferir sobre la existencia de efectos de TRAT, ya que si
los efectos de TRAT son nulos entonces las medias poblacionales serán iguales porque se supone
que ningún otro factor está afectando la respuesta y que las posibles diferencias entre parcelas se
han “licuado” por el proceso de aleatorización. 

Modelo Lineal de ANAVA para un DCA con un factor


El modelo lineal  usado para contrastar la hipótesis de igualdad de a medias poblacionales se puede
escribir de la siguiente forma:

Y ij =μ+ τ i+ ε ij con i=1 , .... , a y j=1 ,... , n

donde:

a  denota la cantidad de poblaciones o tratamientos en evaluación

n indica la cantidad de repeticiones por tratamiento

Y ij  es la j−ésima observación de la variable respuesta realizada bajo el i−ésimo tratamiento

μes la media general τ i  es el efecto de la i−ésimo tratamiento (algunos tratamientos tendrán
efectos positivos, es decir sumarán al valor esperado de la variable y otros tendrán efectos negativos
o restarán al valor esperado)

ε ij es una componente aleatoria que representa el error experimental asociado a la observación ij .
Usualmente se supone que los términos de error asociados a observaciones de distintas unidades
experimentales son independientes, y que se distribuyen siguiendo una distribución normal con
media 0 y varianza σ 2 constante u “homogénea”.

¿Por qué un error aleatorio desconocido en el modelo?


La componente aleatoria siempre está presente en los modelos estadísticos porque los modelos no
pueden explicar perfectamente la variabilidad de las observaciones realizadas. Por ejemplo, aún en
un mismo ambiente, con el mismo clima y suelo, cuando se cosechen parcelas que reciben el mismo
tratamiento agronómico (se siembran igual, se manejan igual y se tratan con el mismo tratamiento)
se observará, diferencias en rendimiento; estos podrán ser parecidos pero la probabilidad de que
sean iguales es cero.

Es a esta variabilidad entre repeticiones de un mismo tratamiento que se la conoce como “Error
Experimental” o variabilidad “No Explicada” por el modelo, o “variabilidad residual” y que en la
formulación del modelo lineal se denota como σ 2 .

7
La técnica aritmética del ANAVA para este modelo, estima las medias de los tratamientos y la
varianza residual o varianza de la componente aleatoria como medida de la incerteza (variabilidad
entre UE para las cuales sería esperable observar el mismo rendimiento). El erro estándar que
acompañará cada media de tratamiento estimada será la raíz cuadrad del cociente entre esta
varianza residual y el tamaño muestral desde el cual se obtuvo cada media muestral de tratamiento
(cantidad de repeticiones o n ).

Estimaciones de Varianzas en un ANAVA


El ANAVA para contrastar la hipótesis de igualdad de medias poblacionales, se basa en la
comparación de dos varianzas, por eso se denomina análisis de varianza, aunque su objetivo sea
comparar medias. Una, es la varianza dentro de tratamientos (que refleja la variabilidad de
repeticiones de un mismo tratamiento) y la otra es la varianza entre tratamientos (que refleja la
variabilidad entre las medias de los tratamientos).

La comparación de las varianzas entre y dentro de tratamientos se realiza por medio de una prueba
F basada en el cociente entre ellas. Si F es cercano a 1, debe entenderse que la variabilidad entre
medias de tratamiento es similar a la variabilidad entre repeticiones de un tratamiento y por tanto
sospecharemos que no hay efectos de tratamientos.

El cuadrado medio dentro (CMD) o cuadrado medio del error representa la variabilidad observada


en los datos que provienen de repeticiones de un mismo tratamiento y que por tanto no puede ser
asignable al tratamiento recibido. Dicha varianza residual se estima por medio de la varianza
muestral entre repeticiones, S2.  Bajo el supuesto de que las varianzas entre repeticiones son las
mismas para los distintos tratamientos, se promedian las a  varianzas muestrales para obtener una
estimación de la varianza de la variable respuesta, σ 2.

La otra varianza que forma parte del estadístico F, surge de la idea de plantear otro estimador para
σ2 construido a partir de las medias de los tratamientos, ya que cuando las poblaciones que se
comparan son iguales, las medias de los datos recolectados bajo cada tratamiento debieran variar
como varia cualquier otro par de datos. Luego, las a medias muestrales calculadas con
n  repeticiones por tratamiento, tendría varianza igual a:

2 σ2
σ =

n

y se puede obtener un segundo estimador de σ2 desde la expresión:

σ 2=n × S2 X́

El nuevo estimador es conocido como  cuadrado medio entre tratamientos (CME).

8
Bajo la hipótesis nula, es decir cuando no hay diferencias significativas entre las medias de los
tratamientos, la varianza entre las medias de tratamiento tenderá a ser baja. En el caso que la
hipótesis nula de igualdad de medias poblacionales no fuera verdadera, la varianza de las medias de
tratamiento tenderá a crecer.

2 2
Si denotamos como σ E y σ D  a las varianzas estimadas respectivamente por el CME y el CMD, se
2 2
debe observar que, bajo la hipótesis nula de igualdad de medias poblacionales, ocurrirá que  σ E ¿ σ D 
2 2
 , en caso contrario (hipótesis nula falsa) ocurrirá que σ E ¿ σ D.

Por esta relación esperada entre las varianzas, podemos reescribir las hipótesis del ANAVA también
como una hipótesis sobre varianzas poblacionales:

H 0 :σ 2E ¿ σ 2D vs. H 1 : σ 2E ¿ σ 2D
2 2
La prueba del ANAVA consiste en calcular el estadístico F utilizando los estimadores de σ E y σ D (es
decir los cuadrados medios) de la siguiente forma:

CME
F=
CMD

Este estadístico tiene, bajo H 0, una distribución F(a−1),(N −a) con N igual al número total de unidades

experimentales. Luego, para un nivel de significación α , si F es mayor que el cuantil (1−α ) de la

distribución F(a−1),(N −a)se rechaza H 0, implicando que H1 es verdadera o, dicho de otra manera,

existen diferencias estadisticamente significativas entre tratamientos. El rechazo de H 0implica que


las medias poblacionales (expresadas como a media poblacional más un efecto de tratamiento) no
son iguales, al menos un tratamiento tiene media de la variable respuesta diferente.

Como en otras pruebas estadísticas, el valor-p de la prueba se compara con el nivel de significación
fijado (α ) y si el valor p es menor que α , se rechaza la hipótesis nula.

En síntesis, en el ANAVA cuando el valor F es alto se pone en evidencia la existencia de diferencias


entre tratamientos. Diferencias que son mayores a las observadas dentro de tratamientos es decir a
aquellas que podrían darse sólo por azar o por la variabilidad natural de la respuesta.
Consecuentemente, valores altos de F se asocian con valores-p bajos y llevan al rechazo de la
hipótesis de igualdad de medias de tratamientos.

Supuestos del ANAVA


El modelo lineal del ANAVA plantea supuestos que deben cumplirse para que el estadístico
F=CME/CMD tenga la distribución F con (a−1)y a (n−1) grados de libertad y por tanto los
valores p reportados sean válidos.

9
Estos supuestos plantean exigencias acerca de los términos de error aleatorios y se pueden
establecer como: (a) independencia entre términos de error aleatorio, (b) distribución normal de los
términos de error aleatorio y (c) homogeneidad de varianzas o igualdad de varianza de los términos
de error entre observaciones. Este último sugiere que la variabilidad de las observaciones bajo los
distintos tratamientos es la misma o no difiere significativamente, i.e. las varianzas dentro de TRAT
son iguales.

En caso de que alguno de estos supuestos (independencia, normalidad, y homogeneidad de


varianzas) no se cumplan, impactarán sobre el valor-p usado para concluir sobre la hipótesis de
interés, afectando así la calidad de las conclusiones. Por ello, resulta importante verificar que los
supuestos del análisis se cumplen antes de elaborar conclusiones.

Existen distintas técnicas de validación de supuestos. Las que se presentan aquí se basan en los
residuos. Para un DCA con un factor tratamiento como el expuesto en esta sección, el valor predicho
para la una UE es la media del tratamiento que fue asignado a esa UE, razón por la cual el residuo
(diferencia entre el valor observado y el predicho por el modelo) para la UE ijse calcula como:

e ij = y ij − ý i¿Cómo verificar el supuesto de Normalidad?

Construir un Q-Q plot con los residuos. Mediante esta técnica se obtiene un diagrama de dispersión
en el que, si los errores son normales y no hay otros defectos del modelo, los residuos se alinean
sobre una recta a 45°, es decir los residuos calculados para cada UE en el experimento correlacionan
bien con los residuos que se esperarían si la distribución de los errores fuese la distribución normal
téorica.

¿Cómo verificar el supuesto de homogeneidad de varianzas?


Con un gráfico de dispersión de residuos vs. Predichos. Si se observa una nube de puntos sin patrón
alguno y con rango de variación similar para el valor predicho de cada tratamiento, se entiende que
los residuos son aleatorios y que las varianzas son homgéneas.

10
El siguiente gráfico de residuos vs. predichos sugiere que no se cumple el supuesto de
homogeneidad en las varianzas. La heterogeneidad de varianzas se pone de manifiesto ya que a
medida que crecen los valores predichos por el modelo, aumentan las dispersiones de los residuos;
así los tratamientos con mayores valores predichos tienen más variabilidad entre sus repeticiones
que los tratamientos con menor valor predicho.

En casos de heterogeniedad de varianzas, los valores-p con los que se concluye sobre la hipótesis de
interés no serán correcto y por tanto también se compromete la validez de las conclusiones. En caso
de heterogeneidad de varianzas se recurre otro tipo de ANAVA donde no es necesario suponer
varianzas homogéneas como es el ANAVA bajo un modelo lineal mixto. 

¿Cómo se evalúa el supuesto de Independencia?


Gráfico de los residuos según la secuencia en el tiempo o espacio en que han sido colectados los
datos. Si los residuos aparecen en “rachas” de varios valores positivos seguidos de varios valores
negativos puede ser un indicio claro de la falta de independencia. Siempre que se detecte cualquier
patrón distinto al aleatorio (falta de patrón), se debe sospechar del incumplimiento del supuesto de
independencia. 

La falta de independencia etambién puede poner en riesgo las conclusiones del ANAVA y en
situaciones de marcada dependendencia o correlacion en los datos se ajusta el modelo de ANAVA
bajo el marco teórico de los Modelos Lineales Mixtos. La aleatorización en la asignación de los
tratamientos a las unidades experimentales, en la secuencia de medición de los resultados del
ensayo, o en cualquier otra etapa experimental que pueda introducir una fuente sistemática de
error, es un método eficaz para evitar la falta de cumplimiento del supuesto de independencia.

Si los supuestos se han logrado verificar, es decir se cumplen para los datos que hemos analizado,
entonces concluiremos rechazando o no la hipótesis de nulidad de efectos de tratamiento en
función del valor-p reportado. Si valor-p fuese 0,01 es decir menor a 0,05 (nivel de significación

11
generalmente usado en la investigación científica) rechazaremos la hipótesis nula del ANAVA porque
solo en 1 de cada 100 ensayos, como el realizado, podría observarse una diferencia de medias
muestrales como la observada sólo por azar. Como la probabilidad de diferencias azarosas es bajo,
tenemos evidencia para inferir sobre la existencia de diferencias entre las medias de cultivos
fertilizados respecto a los no fertilizados.

12
Diseño en Bloques Completos al Azar
Uno de los principios básicos del diseño de experimentos (Fisher 1939) es el control local. El principio
proviene de la necesidad comparar los tratamientos de interés bajo condiciones homogéneas.
Luego, si existe variabilidad entre las unidades experimentales (UE), armaremos un bloque de UE
homogéneas donde pueda aplicarse una vez cada tratamiento, posteriormente se armará otro
bloque de UE o repetición de la comparación de los tratamientos. La cantidad de bloques será el
número de repeticiones del ensayo.

Este arreglo experimental de las UE y el tratamiento se llama Diseño en Bloques Completos al Azar
(DBCA), porque se han armado bloques de UE homogéneas con tantas UE como tratamiento para
que todos los tratamientos se comparen en el mismo bloque (completo quiere decir con todos los
tratamientos se encuentran dentro de cada bloque). además, los tratamientos son asignados al azar
sobre las UE de cada bloque.

¡Veamos un ensayo conducido bajo un DBCA!


Supongamos que interesa responder la pregunta sobre la existencia (o no) de diferencias de
rendimiento entre cultivos de trigo fertilizados con 150 kg/ha de nitrógeno a la siembra respecto a
cultivos de trigo sin fertilizar.

Por razones de practicidad, no podemos responder a esta pregunta analizando TODOS los cultivos de
trigo de la población de cultivos fertilizados y compararlos con TODOS los cultivos sin fertilizar.
Entonces, diseñamos un ensayo donde sembraremos varias parcelas con trigo, a unas las
fertilizaremos y a otras no las fertilizaremos. Supongamos que decidimos que el ensayo tendrá 6
repeticiones, es decir habrá 6 parcelas fertilizadas y 6 sin fertilizar.

¡Cuando vamos al terreno a delimitar las parcelas experimentales notamos que hay una pendiente y
que las parcelas que se ubiquen en la parte más alta del lote podrían rendir menos que las que están
en el bajo ya que en esta zona se acumula más agua, es decir Las UE no son homogéneas!

Dependiendo de su posición en el gradiente de la pendiente algunas pueden ser mejor UE que otras.
Si aleatorizamos los tratamientos completamente (es decir implementamos un DCA) podría ser que
un tratamiento se asignara más veces a las parcelas del bajo. El efecto sobre la variable dependiente
(rendimiento) de la posición en el terreno o pendiente podría confundir efectos de TRATAMIENTO.
Realizaremos un DBCA como estrategia de Control Local de la variabilidad entre las UE para evitar
que dicha variabilidad confunda nuestras conclusiones sobre los tratamientos.

13
Diremos que, si no es posible disponer de UE homogéneas, pero existe algún criterio de clasificación
de la UE que permita agruparlas de forma tal que cada grupo de UE sea internamente homogéneo se
podrá realizar un DBCA.

Dos principios hacen que el DBCA sea eficiente:

HOMOGENEIDAD de las UE dentro de cada Bloque

HETEROGENEIDAD entre las UE de distintos Bloques.

 el DBCA permitirá disminuir el error experimental


 el DBCA incrementará la potencia en la comparación de medias de tratamiento

En el siguiente link se observa un ensayo, realizado con un total de 12 Unidades Experimentales


(UE), para evaluar 2 tratamientos (TRAT) (con y sin fertilización) donde se usan 6 repeticiones por
tratamiento pero en lugar de aleatorizar la asignación de los tratamiento sobre las UE , primero se
han armado grupos de parcelas similares respecto a la pendiente, es decir de igual elevación y luego
se ha aleatorizado que tratamiento se asignara a cada parcela del bloque. El diseño implementado
es el que se llama DBCA. Para facilitar la identificación de los 6 bloques (cada uno de dos parcelas) se
ha rotulado cada parcela según el bloque al que pertenece. Siempre en un DBCA, los tratamientos se
aleatorizan dentro de cada bloque.

Cada tratamiento será evaluado en todas las posiciones o niveles de pendiente. La comparación de
los tratamientos dentro de cada bloque no se ve afectada por el factor pendiente ya que las parcelas
de un mismo bloque están a la misma elevación.

¿Cuándo se usa un DBCA? Cuando las UE NO son homogéneas y se requiere armar bloques de UE
homogéneas. Las 12 UE quedan clasificadas por el tratamiento que reciben, por eso decimos que el
factor tratamiento es un criterio de clasificación.

Luego del crecimiento y desarrollo del cultivo, se cosecha y se tienen los datos de rendimiento por
parcela que se muestran en el siguiente link. Hemos representado dos situaciones: 1) suponiendo
que no hubo efecto de tratamiento pero sí hay efecto de bloque y 2) suponiendo que si hubo efecto
de tratamiento y hay efecto de bloque. Como puede observarse a partir de los valores de
rendimiento, existe variabilidad de los rendimientos de parcela a parcela en ambas situacione. En la
situacion sin efecto de tratamiento se observa variabilidad de bloque a bloque, es decir hay bloques
que rinden mas que otros independientemente de los tratamientos. En este ejemplo, a la
variabilidad entre bloques la atribuiremos a efectos de la pendiente ya que dijimos que los bloques
habian sido dispuestos ortogonal o perpendiculares al sentido de variación del factor pendiente que
pretendemos controlar con el diseño. Sin embargo, les importante remarcar que la fuente de

14
variación de interés no es la atribuida por la pendiente sino la debida a la fertilización es decir la
producida por los tratamiento.

En la situacion que hemos usado para representar que no hay efecto de tratamiento la variabilidad
de los rendimientos entre parcelas de un mismo bloque es similar. La diferencia entre dos medias de
rendimiento de un mismo bloque asume un valor posible de observar si se toman al azar dos datos
de la distribucion de rendimientos de trigo tratados de la misma forma, es decir sin efectos de
tratamiento.

En la situación que hemos usado para representar que SI hay efecto de tratamiento la variabilidad
entre parcelas es alta y se debe a ambas fuentes de variación, el efecto del bloque que existía
independientemente del tratamiento mas el efecto del tratamiento (las fertilizadas producen mas
rendimiento que las no fertilizada independientemente del bloque en el que comparemos estos
rendimientos).

¿Cómo analizamos estadísticamente el ensayo?


Usaremos ANAVA (análisis de varianza), pero ahora el modelo de ANAVA incluirá además del efecto
de TRATAMIENTO, que es el efecto de interés, el efecto de BLOQUE para descontar la variabilidad
ocasionada por otro factor que reconocimos antes de realizar el ensayo que podía introducir
variabilidad en los rendimientos, pero no es de interés. Diremos que con este DBCA “controlamos”
el efecto de la pendiente sobre la variabilidad de los rendimientos.

Independientemente del diseño, la diferencia entre las dos muestras de la respuesta del cultivo
obtenidas con y sin fertilización a la siembra en el ensayo, será usada para inferir si el valor esperado
del rendimiento debe ser el mismo (o no) en situaciones con y sin fertilizante.

Recordemos que la hipótesis estadística de interés en el ANAVA de un DBCA es:

H 0=μ 1 , μ2 ,… , μa

H 0= Al menosuna de las a medias poblacionales es distinta

donde a  representa la cantidad de poblaciones a comparar a través de sus medias (en el ejemplo,
a=2).

Modelo Lineal de ANAVA para un DBCA con un Factor Tratamiento


El modelo lineal  usado para contrastar la hipótesis de igualdad de a medias poblacionales si el
diseño del experimento fue un DBCA se puede escribir de la siguiente forma:

Y ij =μ+ τ i+ β j+ e ij

donde:

15
Y ij es la j−ésima observación de la variable respuesta realizada bajo el i−ésimo tratamiento en el
bloque j .

μ   es la media general

τ i  es el efecto del i−ésimo tratamiento i=1 , ..., a

β j es el efecto del j−ésimo bloque  j=1 ,... , b

e ij es una componente aleatoria que representa el error experimental asociado a la observación ij .
Usualmente se supone que los términos de error asociados a observaciones de distintas UE son
independientes, y que se distribuyen siguiendo una distribución normal con media 0 y varianza σ 2
constante u “homogénea”.

Además, en los DBCA se supone que existe aditividad bloque-tratamiento que significa NO


interacción entre los bloques y los tratamientos o, dicho de otra manera, que la diferencia entre
tratamientos no depende del bloque en que se esté observando.

Si las diferencias entre unidades experimentales debidas al factor de bloqueo no son consideradas,
es decir si omitimos el efecto bloque en el modelo, los efectos de bloques se adicionan al término de
error del modelo. Así, la varianza del error aumenta y como consecuencia se pierde eficiencia en la
prueba de la hipótesis referida a las medias de tratamiento, que es la hipótesis de interés. Los
resultados del ANAVA de un DBCA también se presentan en una tabla de ANAVA como el DCA, pero
en este caso habrá una fila extra asociada a la variabilidad de la respuesta entre bloques. La
comparación entre las medias de bloques, en general, no es de interés:

1- porque por construcción se espera que sean diferentes

2- porque no se asocian con los tratamientos, sino que responden a un factor de control

3- porque la aleatorización fue realizada solo dentro de los bloques. Tal restricción de aleatorización
hace que el estadístico construido y por ello el cociente de medidas de variabilidad entre bloques y
la varianza residual no siga una distribución F . Además, no interesa inferir sobre una población de
bloques. No obstante, este cociente suele ser usado para realizar sugerencias sobre la conveniencia
o no de haber bloqueado. Un valor de F grande, es tomado como un indicador de que el DBCA fue
una buena elección como diseño experimental ya que se observaron diferencias entre las medias de
los bloques (hubo heterogeneidad entre bloques).

A través del ANAVA se obtendrá el estadístico F asociado a la variabilidad entre tratamientos el cual
permitirá concluir sobre la hipótesis nula de interés (hipótesis sobre igualdad de medias de
tratamientos). Este estadístico F resulta del cociente entre una medida de la variabilidad entre

16
tratamientos y una medida de la variabilidad dentro de tratamientos, luego de descontar
variabilidades que podrían deberse al efecto de Bloque y que se observan como diferencias entre las
medias de los bloques. El DBCA, permite que la variabilidad residual o no explicada del ANAVA no
sea sobreestimada a consecuencia del efecto que otro factor que no es el factor tratamiento (como
la pendiente, en nuestro ejemplo) podría tener sobre las UE.

Luego, para un nivel de significación α, si el valor-p asociado al efecto de TRAT es menor a α , se
rechaza H 0, implicando que H 1 es verdadera o, dicho de otra manera, existen diferencias

estadísticamente significativas entre tratamientos. El rechazo de H 0, implica que las medias


poblacionales no son iguales, al menos un tratamiento tiene media de la variable respuesta
diferente y si son más de dos tratamientos habrá que realizar una prueba de comparación de medias
de a pares como la prueba LSD o DMS de Fisher.

La técnica del ANAVA para el modelo del DBCA, estima las medias de los tratamientos y la varianza
residual, o varianza no explicada luego de descontar efectos de tratamientos y efectos de bloques,
como medida de la incerteza. El error estándar que acompañará cada media de tratamiento
estimada será la raíz cuadrada del cociente entre esta varianza residual y el tamaño muestral desde
el cual se obtuvo cada media muestral de tratamiento (cantidad de repeticiones o bloques).

Supuestos del ANAVA para un DBCA


Hemos aprendido trabajando con un DCA que el modelo lineal del ANAVA plantea los supuestos de
independencia, distribución normal y homogeneidad de varianza para la distribución de los términos
de error. Estos supuestos deben verificarse para que el estadístico F de interés tenga la distribución
que se supone y por tanto los valores-p reportados sean válidos. Estos supuestos siempre existen
independientemente de que el diseño sea un DCA o un DBCA y se pueden verificar mediante análisis
de los residuos del modelo como se vio al analizar un DCA. En un DBCA se agrega el supuesto de
aditividad bloque-tratmiento. Si bien existen pruebas formales para evaluar este supuesto,
usualmente la verificación de este se realiza graficando las medias de tratamiento para cada bloque
y observando que la relación entre las mismas se mantiene de bloque en bloque.

En caso de que alguno de estos supuestos no se cumpla, impactarán sobre el valor-p usado para
concluir sobre la hipótesis de interés, afectando así la calidad de las conclusiones. Por ello, resulta
importante verificar que los supuestos del análisis se cumplen antes de elaborar conclusiones.

17
Diseño Factorial
Hemos desarrollado modelos estadísticos de clasificación para un DCA y para un DBCA se han
diferenciado por la presencia (o no) de estructura en las UE. Seguidamente veremos un diseño que
se usa cuando existe estructura en los tratamientos. En todo experimento deben reconocerse dos
estructuras: 1) la estructura de las unidades experimentales (UE) y 2) la estructura de los
tratamientos. Mediante el diseño del experimento se vinculan estas dos estructuras. 

Si las UE son homogéneas, es decir, no existe estructura en las UE, usaremos un DCA (ya que si todas
las UE son iguales cualquiera podría recibir un tratamiento particular). Por el contrario, si las UE no
son homogéneas, existe la posibilidad de confundir efectos de tratamientos con diferencias entre las
UE que existen más allá del tratamiento que se les aplique. Una forma de controlar variabilidad
entre las UE es a través del “bloqueo" o estratificación de UE y para tal fin se usa, por ejemplo, el
diseño conocido como DBCA.

Independientemente de cuál fuera la condición de las UE (sin estructura o estratificadas), tendremos


que pensar también sobre la estructura de los tratamientos. La pregunta que debemos hacer será:
¿los datos se encuentran estructurados por un único factor tratamiento?, es decir ¿existe sólo una
vía o criterio de clasificación de los datos respecto al factor tratamiento? ¿O hay dos o más factores
tratamientos? Si la respuesta es que hay solo un factor tratamiento entonces diremos que no hay
estructura de tratamientos. Por el contrario, si para conformar el tratamiento de interés debemos
combinar los niveles de dos o más factores tratamiento, diremos que hay estructura de
tratamientos y diseñaremos un ensayo con estructura factorial de tratamientos (o simplemente,
diseño factorial). Esta decisión es independiente de la existencia o no de estructuras en las UE. Es
decir, la necesidad de un diseño factorial depende de cómo se definen los tratamientos y no de las
UE. Podríamos tener un diseño factorial en un DCA o en un DBCA.

En los diseños factoriales se habla de factores cruzados cuando cada nivel de un factor se combina
con cada uno de los niveles del otro factor para formar un tratamiento y son especialmente útiles
para analizar el fenómeno denominado interacción. Se dice que hay interacción entre los factores
tratamientos cuando el efecto de un factor depende del nivel del otro factor tratamiento en el que
se lo observa.

Supongamos que interesa responder las preguntas sobre la existencia (o no) de diferencias de
rendimiento entre cultivos de trigo fertilizados con nitrógeno a la siembra respecto a cultivos de
trigo sin fertilizar y además entre cultivos de trigo a los que se le ha aplicado un estimulante o
promotor de crecimiento al macollaje respecto a cultivos de trigo que no incluyen este promotor. Es

18
decir, existen dos factores tratamiento de los cuales nos interesa evaluar su efecto sobre el
rendimiento de trigo: el factor fertilización nitrogenada (Factor A) y el factor promotor o estimulante
del macollaje (Factor B).

Podríamos diseñar un ensayo para evaluar la fertilización y otro ensayo para evaluar el promotor
pero en ese caso no podríamos evaluar cuál es el impacto de aplicar ambos inputs sobre la misma
UE, es decir qué rendimiento se espera cuando fertilizamos a la siembra y, además, aplicamos
durante el macollaje el promotor del crecimiento. Cuando existen dos (o más) factores y se pueden
cruzar sus niveles (i.e. definir a los tratamientos en función de la combinación de los niveles de
ambos factores, de manera tal que todos los niveles de un factor se pueden ensayar con todos los
niveles del otro factor) se obtiene este diseño más eficiente e informativo que se llama Diseño
Factorial.

 Para este ejemplo, haremos un ensayo donde sembraremos varias parcelas con trigo, a unas solo las
fertilizaremos durante la siembra, en otras solo aplicaremos el promotor en el macollaje, en otras
fertilizaremos a la siembra y, además, aplicaremos el promotor en el macollaje y finalmente
incluiremos parcelas control, es decir parcelas donde no se usa ninguno de los dos inputs o factores
tratamiento que queremos evaluar. En este diseño factorial se evaluarán 4 (cuatro) tratamientos
que provienen de la combinación de dos factores con dos niveles cada uno (2x2). Si antes de aplicar
los tratamientos hemos visto que el sitio de ensayo es uniforme y no identificamos estructura alguna
en la UE, usaremos un DCA para asignar los tratamientos a las UE.

¡Veamos un Ensayo con un Diseño Factorial!


En la imagen de este link se observa un ensayo realizado con un total de 12 parcelas o UE, para
evaluar 4 (cuatro) tratamientos aplicados según un DCA a las UE.

Los tratamientos surgen de combinar dos factores de interés (Factor A y Factor B) donde cada uno
de estos factores tiene dos niveles. Llamaremos T1 a la situación control, es decir donde no se usa
ningún input; T2 al tratamiento que surge cuando aplicamos fertilizante pero no el promotor, T3; al
tratamiento que implica solo uso del promotor y T4 al tratamiento donde se aplican ambos inputs.
En este ensayo se usan 3 repeticiones por TRAT, es decir 3 parcelas recibirán un mismo tratamiento
(el tratamiento asignados a cada parcela se representa con un color, por ello hay 4 colores). 

Este diseño factorial sería mejor denominado como Diseño Completamente al Azar con Estructura
Factorial de Tratamientos.

¿Qué significa? Que los tratamientos representan combinación de los niveles de los factores
tratamiento y que se asignaron totalmente al azar sobre cada UE, es decir fue usando el azar (por

19
ejemplo, mediante un sorteo) que se decidió si se fertilizaba o no y si se aplicaba el promotor o no a
cada UE, hasta lograr las 3 repeticiones de cada tratamiento. 

Las 12 UE quedan clasificadas según el nivel del Factor A y según el nivel del Factor B que reciben,
por eso decimos que ambos, el Factor A y el Factor B, son criterios de clasificación, pero también
quedan clasificadas por la combinación de ambos que define a T1, T2, T3 y T4.

Luego del crecimiento y desarrollo del cultivo, se cosechará el trigo y se tendrán los datos de
rendimiento por parcela que se muestran en el siguiente link. Con fines didácticos, se han
representado dos situaciones. Una suponiendo que no hay efecto de tratamiento y otra donde sí hay
efecto de tratamiento.

Notar que existe variabilidad de los rendimientos, de parcela a parcela, en ambas situaciones ya que
el rendimiento es una variable aleatoria que varía entre las unidades de análisis (las parcelas). Sin
embargo, la variabilidad de los rendimientos entre parcelas tiene características diferentes entre
ambas situaciones.

Analizamos cada situación


En la situación que hemos usado para representar que no hay efecto de tratamiento la variabilidad
de los rendimientos entre parcelas de un mismo color (mismo tratamiento) es similar a la
variabilidad entre parcelas de distinto color, es decir, no hay un patrón asociado al color porque no
hay diferencia entre los tratamientos. Todos los rendimientos observados parecieran provenir de
una misma población de valores con rendimientos entre 2500 y 5000 kg/ha.

Por el contrario, en la imagen de la derecha se representa una situación donde sí hay efecto de
tratamiento. Se observa que hay variabilidad entre los tratamientos. Por ejemplo, las parcelas que
llevan T4 (es decir las que recibieron ambos inputs) muestran rendimientos mayores a 4000 kg/ha,
mientras que otras parcelas el rendimiento es siempre menor.

Como tenemos un diseño factorial la variabilidad de los rendimientos podrá descomponerse en tres
componentes: el efecto principal del Factor A, el efecto principal del Factor B y la interacción entre
Factor A y Factor B. Aquí, en este ejemplo encontraremos que hay interacción entre los factores.
¿Por qué? porque la diferencia entre parcelas con el promotor de crecimiento respecto a aquellas
donde no se usó este producto pareciera ser diferente en las parcelas fertilizadas que en las no
fertilizadas.

La interacción entre factores puede ser evaluada sólo en experimentos con diseño factorial que
tengan repeticiones de cada tratamiento.

20
¿Cómo analizaremos estadísticamente el ensayo para concluir en términos poblacionales
sobre los efectos principales del Factor A, los efectos del principales Factor B o los efectos de
interacción entre factores?  
Usaremos la técnica de ANAVA (Análisis de Varianza) para inferir a partir de este ensayo (el cual se
entiende como una muestra del rendimiento que se podría cosechar bajo estos tratamientos) si se
puede esperar un aumento de rendimientos al fertilizar el trigo a la siembra, al usar el promotor que
se aplica en el macollaje y además podremos saber si el efecto de un factor de interés depende del
nivel del otro factor, es decir si existe interacción entre los efectos del fertilizante y del promotor de
crecimiento. Usualmente cuando hay interacción se comparan todas las medias de tratamiento y si
no hay interacción entonces podemos hablar de los efectos principales de cada factor tratamiento.

Modelo de ANAVA para un DCA con estructura factorial de tratamiento


Si el experimentador sospecha que la respuesta a dos o más factores además de involucrar la suma
de los efectos principales (o individuales) de esos factores depende de la combinación específica de
los niveles de éstos, entonces el modelo para el diseño factorial deberá incluir un término de
interacción entre los factores.

La inclusión de términos de interacción en el modelo demanda repeticiones para cada tratamiento


para evaluar desde un ANAVA la significación estadística de la interacción. El modelo lineal para un
diseño bifactorial con interacción se expresa como:

Y ijk =μ+α i+ δ j+ α δ ij +e ijk

con i=1 , ..., a ; j=1 ,... , b ; k =1, .. , nij , donde Y ijk representa la respuesta en la k −ésima
repetición del i−ésimo nivel del factor A y j−ésimo nivel de factor B, μ representa la media
general, α i el efecto que produce el i-ésimo nivel del factor A, δ j corresponde al efecto del j-ésimo

nivel del factor B y el término α δ ij representa los efectos adicionales (interacciones) de las

combinaciones de los niveles de los factores (A*B). Los términos de error e ijk asociados a cada
observación se suponen normal e independientemente distribuidos con media cero y varianza
común o varianza homogénea.

La tabla de ANAVA tendrá una fila para evaluar la significancia estadística del efecto principal del
Factor A, otra para evaluar el efecto principal del Factor B y una extra para evaluar la significancia de
la interacción entre Factores. El efecto principal del Factor A se evalúa a través de la comparación de
medias de los distintos niveles del Factor A. El efecto principal del Factor B se evalúa a través de la
comparación de medias de los distintos niveles del Factor B. Esto siempre y cuando no haya
interacción estadísticamente significativa, i.e. el valor p de interacción es menor al nivel de

21
significación. Cuando la interacción resulta significativa se estudia la interacción comparando las
medias de todos los TRAT conformados por combinación de factores y no se estudian los efectos
principales de los factores ya que las diferencias de medias de los niveles de un factor podrían estar
mal estimada por efecto de la interacción. Los supuestos del modelo lineal son los que hemos visto
para un DCA (i.e. Normalidad, Independencia y Homogeneidad de Varianzas), y para cada caso
particular se evalúan usando las herramientas ya presentadas como es el análisis de los residuos. Si
hay efectos significativos de tratamiento se comparan las medias mediante pruebas de
comparaciones múltiples como LSD o DGC.

A continuación, se muestra el ANAVA de un Diseño factorial para el ensayo de trigo usado para
presentar el diseño factorial, un ensayo cuyo objetivo es evaluar el efecto de la fertilización a la
siembra en trigo, con o sin el aplicado de un promotor de crecimiento en macollaje.

Análisis de la varianza

Variable N R² R² Aj CV

Rendimiento 12 0.92 0.89 5.78

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor

Modelo 3859091.45 3 1286363.82 29.81 0.0001

Fertilizacion 2693021.88 1 2693021.88 62.41 <0.0001

Promotor 850294.98 1 850294.98 19.70 0.0022

Fertilizacion*Promotor 315774.59 1 315774.59 7.32 0.0269

Error 345229.83 8 43153.73

Total 4204321.28 11

Test:LSD Fisher Alfa=0.05 DMS=391.13214

Error: 43153.7283 gl: 8

Fertilizacion Promotor Medias n E.E.

Sin fertilizar Sin 3015 3 119.94 A

Sin fertilizar Con 3223 3 119.94 A

Fertilizado Sin 3638 3 119.94 B

22
Fertilizado Con 4495 3 119.94 C

Medias con una letra común no son significativamente diferentes (p > 0.05)

EL ANAVA indica que existe interacción estadísticamente significativa entre la fertilización a la


siembra y el uso del promotor al macollaje en trigo (P=0.0269). Es decir, el efecto del promotor no es
el mismo se aplique en cultivos fertilizados o no fertilizados a la siembra (El efecto de un factor
depende del otro factor). Aun cuando también se rechaza la hipótesis de efectos principales nulos
tanto para el factor Fertilización (P <0.0001) como para el factor Promotor también (P=0.0022), dado
que la interacción Fertilizacion*Promotor estadísticamente significativa, analizaremos las cuatro
medias de tratamiento y no las medias de los niveles de cada es Factor por separado. Porque hay
interacción, observaremos el efecto de usar el promotor en cada nivel del factor fertilización.
Concluimos que cuando el cultivo se realiza sin fertilizar a la siembra, la diferencia de rendimientos
entre parcelas con el promotor al macollaje vs. parcelas sin el promotor, no es estadísticamente
significativas (las medias muestrales fueron 3015 y 3223 kg/ha, ambas llevan la misma letra para
indicar que esta diferencia muestral no permite concluir que debamos esperar efecto del promotor
en cultivos sin fertilizar). Por el contrario, cuando el cultivo fue fertilizado a la siembra la media, sí se
observa una diferencia estadística entre las parcelas tratadas con el promotor, que en promedio
rindieron 4495 kg/ha y las que no lo usan para las cuales el promedio muestral en el experimento
fue 3638 kg/ha. Estas dos medias muestrales son acompañadas con distinta letra para indicar que
pueden ser tomadas como evidencia experimental para concluir o inferir (con un nivel de
significación del 5%) que el promotor tendrá un efecto sobre el rendimiento cuando se aplique en
cultivos fertilizados. También podemos inferir, a partir de este experimento, que la fertilización, ya
sea con o sin promotor de crecimiento, incrementará el valor esperado del rendimiento (notar que
las medias muestrales de parcelas sin fertilizar son menores y se acompañan con letra distinta a los
fertilizados).

Ejercicio paso a paso


Rendimiento Trigo
Abrir el archivo EnsayoFactorial.idb2 en InfoStat. Luego, de mirar el video de uso de InfoStat para
realizar un ANAVA con estructura Factorial, reproducir el ANAVA sobre los datos del ejemplo
presentado en el material de lectura (el archivo de datos se llama EnsayoFactorial.idb2).
Corresponde a un diseño factorial con cuatro tratamientos aplicados en trigo, que provienen de la
combinación del factor fertilización y del factor promotor (producto aplicado al macollaje para
favorecer esta etapa e incrementar la uniformidad del cultivo y consecuentemente el rendimiento

23
por ha). Las parcelas eran uniformes y toda otra fuente de variación, distinta a los dos factores
tratamientos, fue mantenida constante. En cada parcela se aleatorizó la asignación de los TRAT.

Los resultados a obtener al hacer el análisis se presentan a continuación junto a un gráfico de medias
de tratamiento.

Análisis de la varianza

Variable N R² R² Aj CV

Rendimiento 12 0.92 0.89 5.78

Cuadro de Análisis de la Varianza (SC tipo III)

F.V. SC gl CM F p-valor

Modelo 3859091.45 3 1286363.82 29.81 0.0001

Fertilizacion 2693021.88 1 2693021.88 62.41 <0.0001

Promotor 850294.98 1 850294.98 19.70 0.0022

Fertilizacion*Promotor 315774.59 1 315774.59 7.32 0.0269

Error 345229.83 8 43153.73

Total 4204321.28 11

Test:LSD Fisher Alfa=0.05 DMS=391.13214

Error: 43153.7283 gl: 8

Fertilizacion Promotor Medias n E.E.

Sin fertilizar Sin 3015.38 3 119.94 A

Sin fertilizar Con 3223.32 3 119.94 A

Fertilizado Sin 3638.40 3 119.94 B

Fertilizado Con 4495.22 3 119.94 C

Medias con una letra común no son significativamente diferentes (p > 0.05)

24
4700

4300

Rendimiento (kg/ha)
3900

3500

3100

2700
Sin fertilizar Fertilizado
Fertilización

Con promotor Sin promotor

Ejercicios
Aplicación del ANAVA bajo un diseño completamente aleatorizado.
Para comparar el efecto de la fertilización en trigo se realiza un ensayo bajo un diseño en
Bloques Completos al Azar (DBCA) con dos tratamientos, un tratamiento es fertilizar a la
siembra y el otro es sembrar sin fertilizar. Al final del ensayo se registra el rendimiento en
cada parcela. Las parcelas diferían respecto a su posición en el terreno por efecto de una
pronunciada pendiente. Por ello se armaron bloques de dos parcelas con igual posición en
el gradiente de pendiente y en cada bloque se aleatorizó la asignación de los Tratamientos.
El objetivo es analizar posibles diferencias entre los rendimientos promedio de ambos
tratamientos. Los datos se encuentran en el archivo EnsayoDBCA.IDB2.

Actividad

Usando el archivo EnsayoDBCA.IDB2:

1. Realice un análisis de la varianza contemplando, además del efecto de los


tratamientos, el efecto de la pendiente que podría estar causando modificaciones en
el rendimiento (bloques) y una prueba a posteriori de Fisher.

Nota: Recuerde que el valor p permite concluir sobre H 0 interpretándose de la siguiente


manera: si p es mayor que el nivel de significación fijado para la prueba () no se rechaza la
hipótesis nula; si p es menor o igual que  se rechaza la hipótesis nula.

2. En el momento de analizar los resultados del ANAVA, tenga en cuenta:

 La cantidad de tratamientos que se compararon, la variable analizada y el


número de repeticiones por tratamiento

 ¿Todos los tratamientos tienen la misma cantidad de repeticiones?

 ¿Cuál es la hipótesis nula de interés para el efecto Tratamientos?

25
 Trabajando con un nivel de significación igual a 0.05, ¿se rechaza la
hipótesis nula del efecto Tratamientos?

 ¿Hay diferencias estadísticamente significativas entre los tratamientos?

 ¿Es de interés evaluar las diferencias de media entre bloques? ¿Hay


diferencias de rendimiento entre los bloques? ¿A qué conclusiones
podríamos arribar si no incluimos el efecto de los bloques en el modelo?

26
Evaluación de genotipos de papa y tratamientos para el control de nemátodos

El interés de este ensayo es estudiar el efecto de un producto natural para disminuir la carga de
nemátodos en suelo sobre distintos cultivares de papa. Se realizó un ensayo en invernadero donde
se evaluaron 3 cultivares de papas en macetas (una planta por maceta) que contenían suelos
provenientes de áreas con distinta carga de nemátodos (Alta, Media y Baja). Se asignaron los
tratamientos a las macetas mediante sorteo. Al cabo de un tiempo se evaluaron varias
características de las plantas que se usaron para crear un índice de severidad de enfermedad (ISE) en
cada unidad experimental. Los datos se muestran en la siguiente tabla. Ingresarlos a InfoStat y
realizar el ANAVA para el modelo lineal para responder a las preguntas.

Factor A Carga Factor B Cultivar ISE


A 1 2.30
M 1 1.78
B 1 1.67
A 2 1.25
M 2 1.15
B 2 0.25
A 3 1.20
M 3 0.97
B 3 0.46
A 1 2.34
M 1 1.55
B 1 1.66
A 2 1.30
M 2 1.20
B 2 0.80
A 3 1.18
M 3 0.87
B 3 0.50

Actividad
1. Especifique las unidades experimentales
2. Especifique los tratamientos

27
3. ¿Cuántos niveles tiene cada uno de los factores?
4. ¿Cuántas repeticiones de cada tratamiento hay?
5. Identifique la estructura de parcelas
6. Escriba el modelo correspondiente a un ANAVA para un DCA con arreglo factorial de
tratamientos
7. Establezca las hipótesis que se contrastan mediante el ANAVA
8. Realice un ANAVA
9. Haga una representación gráfica
10. Interprete el ANAVA y las comparaciones de medias provistas. ¿El efecto principal de cada
uno de los factores es estadísticamente significativo?
11. Dado el resultado de la interacción, ¿conviene evaluar la hipótesis de efectos principales
nulos para cada factor independientemente?
12. Concluya acerca de los resultados obtenidos

Referencias
Balzarini M.G., Gonzalez L., Tablada M., Casanoves F., Di Rienzo J.A., Robledo C.W. (2008). InfoStat-
Manual del Usuario, Editorial Brujas, Córdoba, Argentina.

Di Rienzo, J.A., Macchiavelli R, Casanoves F. (2009) Modelos Mixtos en InfoStat. Edición electrónica.
Disponible con la distribución del software estadístico InfoStat (www.infostat.com.ar).

Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W. InfoStat versión
2010. Grupo InfoStat, FCA, Universidad Nacional de Córdoba, Argentina.

Draper N.R, Smith H. (1998). Applied Regression Analysis (Third Edition). John Wiley & Sons, New
York 706.

Hacking. (1991). La domesticación del azar: La erosión del determinismo y el nacimiento de las
ciencias del caos. Barcelona: Editorial Gedisa.

28

También podría gustarte