ASIGNATURA:
EXPERIMENTACION AGROPECUARIA Y FORESTAL
INGENIERIA AGRONÓMICA
DOCENTE: EFRAÍN JIRÓN ARAGÓN
Contenido
Introducción
Modelo aditivo lineal
Arreglo de muestras
Procedimientos para determinar las sumas de cuadrados
Prueba de hipótesis a través de F (ANDEVA)
Formulas operacionales
Supuestos del ANDEVA
Forma de presentación del análisis de varianza
Aplicación del análisis de varianza
4.1. Introducción.
Desde el punto de vista práctico, el menor número de tratamientos en el experimento más
sencillo comprende la comparación entre dos tratamientos, en este caso los criterios
utilizados se basan en las pruebas de “t” y “z”. Sin embargo, pudo haberse utilizado la
prueba de F o análisis de varianza. Este último procedimiento se emplea cuando se
comparan varias muestras (tratamientos) extraídos al azar y en forma independiente, de
poblaciones normales con varianza común.
Es comúnmente conocido que la variabilidad total de una población no es consecuencia de
un solo factor, sino el resultado de cierto número de causas independientes. El análisis de
varianza (ANDEVA) es un procedimiento aritmético que consiste en partir la variabilidad
total de un conjunto de observaciones en conocidas fuentes de variación y en causas
desconocidas de variación.
1
Significa que la variabilidad total de un población se puede descomponer en diferentes partes, lo
que corresponde a los factores conocidos (los tratamientos) y la variabilidad restante, que no es
posible medir en un experimento, que es ajena al control razonable del experimentador, constituye
el error experimental. Su valor cuantitativo proporciona un indicador sobre la mayor o menor
precisión con que se ha realizado el trabajo experimental de donde proceden las observaciones.
El análisis de varianza es el método más generalizado en la experimentación agrícola y los demás
estudios biológicos por ser más preciso, flexible y de más fácil aplicación. Por medio de la
descomposición de la variabilidad total en sus diferentes componentes, se puede determinar si
existen diferencias significativas o no, entre los tratamientos objeto de estudio.
Esta es la principal utilidad del método conocido como Análisis de Varianza ideado por Sir Ronald
Fischer, matemático estadístico inglés que contribuyó grandemente al actual desarrollo científico-
técnico debido a que el ANDEVA es una herramienta muy útil en muchas disciplinas del saber
humano y en investigaciones en que se aplican la observación y la experimentación.
Las suposiciones que se hagan de la media 𝝁 y del error 𝜺𝒊𝒋 , variarán con el problema que se tenga.
Sin embargo, debe existir una suposición mínima y ésta es, que 𝒀𝒊𝒋 debe obtenerse al azar, es decir,
los errores de muestreo 𝜺𝒊𝒋 deben ser aleatorios. Los términos de 𝜺𝒊𝒋 se supone que pertenecen a
una población de 𝜺𝒊𝒋 que tiene media cero.
Como las observaciones se obtienen al azar, este procedimiento asegura independencia de los
errores de muestreo, condición fundamental en esta teoría para hacer inferencias válidas sobre una
población. Tales supuestos acerca del Modelo Aditivo Lineal pueden resumirse de la siguiente
forma:
1. Los errores de muestreo 𝜺𝒊𝒋 , siguen la distribución normal con media cero y
varianza S2e , esto es (O, S2e), donde S2e es la varianza común dentro de los
tratamientos.
2. También se asume ∑ 𝝉𝒊 = 𝟎, de manera que 𝝉𝒊 sigue la distribución normal con
media cero y varianza S2t, esto es, (O, S2t), donde S2t es la varianza entre
tratamientos.
2
El análisis estadístico de las variables obtenidas en un experimento usualmente consiste en verificar
la 𝐻𝑜: ∑ 𝝉𝒊 = 𝟎. Si la hipótesis nula es verdadera, no existen efectos de tratamientos y cada
observación Yij está compuesta de su media poblacional y el elemento aleatorio de variación.
Se usa la prueba de "F" o análisis de varianza suponiendo que t poblaciones c/u representando un
tratamiento extraído al azar de cada población pudiendo hacer estimaciones de las medias de
tratamientos y la media general realizando nj observaciones iguales para cada tratamiento
Esquema de arreglo de las muestras aleatorias
𝑌̅𝑖 = ∑ 𝑌𝑖𝑗 /𝑛
𝑯𝒐 : 𝝉𝟏 = 𝝉𝟐 = 𝝉𝟑 = ⋯ . 𝝉𝒕 𝒐 𝒃𝒊𝒆𝒏 ∑ 𝝉𝒊 = 𝒐
3
Si la Ho es cierta, entonces 𝒀𝒊𝒋 = 𝝁 + 𝜺𝒊𝒋 , esto indicaría que los tratamientos rinden en promedio lo
mismo y que las diferencias presentes son casuales o aleatorias. Pero bien, es eso lo que
precisamente se desea verificar, mediante la prueba de F. que consiste sencillamente en una
relación de varianzas, donde:
F = s2t /s2e ; siendo conocido que una varianza es: s2 = SC/gl.
Por lo tanto, el procedimiento a desarrollar es determinar las Sumas de Cuadrados (S.C) respectivas,
para con el uso de los grados de libertad (gl) conocidos, obtener los estimadores de s2 y efectuar la
relación necesaria. A partir del esquema para el arreglo de las muestras presentadas anteriormente
se deducen algunos términos básicos muy importantes:
a) La media general (𝒀 ̅ ..) estima a 𝝁
b) La media de cada tratamiento (𝒀 ̅ 𝒊 .) estima el efecto de cada uno de los tratamientos.
c) La suma de las diferencias entre (𝒀 ̅ 𝒊 . −𝒀
̅ . . ) permite estimar la suma de cuadrados entre
tratamientos; esto es, que permite estimar la suma de cuadrados de 𝝉𝒊 .
d) La sumatoria de las diferencias entre (Yij - 𝒀 ̅ i.) permite estimar la suma de cuadrados dentro
de tratamientos, es decir, la suma de cuadrados del error experimental (𝜺𝒊𝒋 ).
El dominio de estos cuatro términos es muy importante debido a que el M.A.L. en función de
parámetros es prácticamente desconocido, solamente una estimación es la que se puede obtener a
partir de los datos experimentales. Esta estimación permitirá realizar generalizaciones correctas, si
se cumplen los supuestos del ANDEVA. Todo lo antes explicado puede plantearse en términos
matemáticos de la forma siguiente:
𝒀𝒊𝒋 = 𝝁 + 𝝉𝒊 + 𝜺𝒊𝒋 … … … … … . 𝒆𝒄. (𝟏) 𝑬𝒄𝒖𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝒑𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔.
̅ .. + (𝒀
𝒀𝒊𝒋 = 𝒀 ̅ 𝒊. − 𝒀
̅ .. ) + (𝒀
̅ 𝒊𝒋 − 𝒀
̅ 𝒊. ) … … 𝒆𝒄. (𝟐) 𝑬𝒄𝒖𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝑬𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒐𝒔.
̅ .. = (𝒀
𝒀𝒊𝒋 − 𝒀 ̅ 𝒊. − 𝒀
̅ .. ) + (𝒀
̅ 𝒊𝒋 − 𝒀
̅ 𝒊. ) … … 𝒆𝒄. (𝟑) 𝑬𝒄𝒖𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝑬𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒐𝒔.
2
∑ ∑(𝑌𝑖𝑗 − 𝑌̅.. )2 = ∑ ∑(𝑌̅𝑖. − 𝑌̅.. )2 + (𝑌𝑖𝑗 − 𝑌̅𝑖. ) +
Esta última ecuación recibe el nombre de: “Ecuación Fundamental del Análisis de Varianza” y
se interpreta como:
4
La SC Total = SC de tratamientos + SC del Error
La búsqueda de las sumas de cuadrados (S.C) son un medio y no un fin. Son necesarias las
S.C., para luego relacionarlas con sus grados de libertad (gl) respectivos y obtener los
estimadores de varianza que realmente evaluarán la variabilidad presente en los datos
experimentales. Recuérdese que una s2 = S.C./gl.; por lo tanto, si cada término de la
ecuación fundamental del ANDEVA se divide entre sus gl, se obtiene una ecuación en
función de varianzas; entonces al dividir :
SC Total/nt-1; SC Entre Tratamientos/t-1; SC Dentro de Tratamientos/t(n-1)
Se obtienen tres estimadores de varianzas, que expresan el concepto básico del ANDEVA:
S2Total = S2Entre tratamiento + S2Dentro de tratamiento
La prueba de F es una razón entre dos varianzas y se utiliza para determinar si dos estimaciones de
varianzas independientes, pueden ser admitidas como estimadores de una misma varianza. De ahí
que, una prueba de significación para las diferencias entre “t” medias muestrales (tratamientos), es
decir, probar la hipótesis nula de igualdad de tratamientos, se podría determinar mediante la razón
de los dos estimados de varianzas anteriores, esto es precisamente la prueba de F.
De esta forma, si se tienen “t” muestras extraídas al azar de poblaciones con medias desconocidas y
varianzas iguales, y se plantea la hipótesis:
𝑯𝒐 : 𝝁 𝟏 = 𝝁 𝟐 = 𝝁 𝟑 = ⋯ … … … = 𝝁 𝒕
𝑯𝒂 = 𝑵𝒐 𝒕𝒐𝒅𝒂𝒔 𝒍𝒂𝒔 𝒎𝒆𝒅𝒊𝒂𝒔 𝒔𝒐𝒏 𝒊𝒈𝒖𝒂𝒍𝒆𝒔.
Entonces el estadístico F con (t-1) y t(n-1) grados de libertad, puede usarse:
S2 a partir de medias variabilidad entre tratamientos
F = --------------------
S2 a partir de individuos variabilidad aleatoria.
5
a) El estadístico Fc es relativamente grande (mayor que 1), consecuencia de un numerador
relativamente grande, debido a que las diferencias entre las medias muestrales (medias
de tratamientos) es bien marcada. Esto conduce a interpretar que la variación entre
tratamientos es significativa, lo cual implica rechazar la hipótesis nula (Ho) y concluir
que las diferencias observadas entre las medias muestrales (tratamientos) no son
casuales sino reales.
4.5.2. Normalidad
Este supuesto significa que si se grafican todos los valores del error se obtendría una
distribución normal. La consecuencia de la no normalidad no son graves si la desviación es
moderada; sólo distribuciones muy asimétricas afectan considerablemente los efectos de
significación.
6
muestras (tratamientos) provienen de la misma población. La homogeneidad de las
varianzas es frecuente en ciertos tipos de experimentos agrícolas.
4.5.4. Aditividad
Para cada diseño experimental existe un modelo matemático denominado M.A.L., el cual
explica que los efectos principales del modelo son aditivos; es decir:
Para un D.C.A. , este modelo es: 𝒀𝒊𝒋 = 𝝁 + 𝝉𝒊 + 𝜺𝒊𝒋
Para un B.C.A. , este modelo es: 𝒀𝒊𝒋 = 𝝁 + 𝝉𝒊 + 𝜷𝒋 + 𝜺𝒊𝒋
El aspecto importante que debe notarse en estos modelos es que los términos se suman, a
medida que se adicionan otras fuentes de variación en estudio.
Mucho más que documentos.
Descubra todo lo que Scribd tiene para ofrecer, incluyendo libros y audiolibros de importantes editoriales.
Cancele en cualquier momento.