Documentos de Académico
Documentos de Profesional
Documentos de Cultura
U Vi 2015 PDF
U Vi 2015 PDF
Modelo matemático:
Supongamos que se realizó un DCA para evaluar el comportamiento de t variedades
de trigo, cada una repetida n veces. La evaluación se realizará midiendo los rendimientos de
cada variedad en cada parcela. Designaremos con yij al rendimiento de la i-ésima variedad
que fue sembrada en la j-ésima parcela (i=1, ... , t ; j=1, ... , n). Se puede pensar que las
mediciones de cada variedad (los rendimientos) son una muestra aleatoria de una distribución
normal con media µi y varianza σ e la cual debe suponerse constante para todo i. En
2
1 t
µ= ∑ µi
t i =1
τi = µi - µ
eij = y ij - µ - τ i = y ij - µ i
Para el modelo anterior se debe suponer que:
1) eij ~ NI 0 , σ e , con σ e cons tan te ∀i , donde NI indica que son independientes y con
2 2
distribución normal.
t
aleatorio. Mientras que, en la realidad, esa variabilidad se obtuvo de las diferencias entre las
medias de las muestras, que son medias de muestras de dos poblaciones distintas. Como
consecuencia de esto se puede definir el Análisis de Varianza diciendo que: "Dado un
conjunto de observaciones, obtenidas bajo la acción de varias causas asignables de variación,
o bien, bajo factores controlables, se puede particionar la variabilidad total presente en estas
observaciones en varias fuentes independientes, unas atribuibles a los factores controlables y
un remanente, atribuido única y exclusivamente al error aleatorio. El Análisis de la varianza no
sólo permite particionar las fuentes de variación sino también llegar a probar si esas
variaciones son significativas o no".
Retomemos el ejemplo en que se cuenta con los rendimientos de t variedades de trigo,
cada variedad medida n veces. Se tendrá un cuadro de la forma:
Variedad 1 i t
Mediciones
1 y11 yi1 yt1
. . . .
. . . .
. . . .
j y1j yij ytj
. . . .
. . . .
. . . .
n y1n yin ytn
TOTAL y1• yi• yt • . y••
Medias y1• yi• yt • y••
donde:
yij es el j-ésimo rendimiento de la i-ésima variedad:
n
y i• = ∑ y ij Es el rendimiento total de la i-ésima variedad.
j=1
n
y
∑y ij
Es el rendimiento promedio de la i-ésima variedad.
y i• = i• =
j=1
n n
t t n
y•• = ∑ yi• = ∑∑ yij Es el rendimiento total general.
i =1 i =1 j =1
y•• 1 t 1 t n
y•• = = ∑ yi• = ∑∑ yij Es el rendimiento promedio general
tn tn i =1 tn i =1 j =1
N = ∑ ni N = tn
i j
i j
i j i j
(1) (2)
(1) es la SCdentro de grupos = SCerror = SCE
(2) es la SCentre grupos = SCtratamientos = SCTRAT
Según las distintas variantes existentes, el análisis se realiza de la siguiente manera:
∑y i•
2
SC TRAT = i
− FC
n
SC T = ∑∑ y ij - FC
2
i j
2
y
donde: FC (factor de corrección) FC = ••
tn
SC E = SC T - SC TRAT
Cuadrados Medios: CM = SC/GL
SCTRAT
CM TRAT =
( t - 1)
CM E = SC E
( t ( n − 1) )
Fuentes de Variación: FV
Con ellas podemos construir el siguiente:
Cuadro de Análisis de Varianza
FV SC GL CM F
entre grupos SCTRAT t-1 CMTRAT CMTRAT/CME
(Tratamientos)
dentro de grupos SCE t(n - 1) CME −−−−−−−−−
(Error)
Total SCT tn - 1 −−−−−− −−−−−−−−−
CM TRAT
FTRAT = es el estadístico que nos permite probar las hipótesis. La región crítica es
CM E
RC = { FTRAT / FTRAT > F (t -1);t(n-1);1-α }
CM E
CV% = x 100
y ••
{
R.C. = FTRAT / FTRAT 〉 F ( t −1);( Σni − t ); 1−α }
Todos los análisis de varianza deben culminar con una conclusión aplicada y el cálculo
del correspondiente Coeficiente de Variación.
EJEMPLO: Diseño completamente aleatorizado. Modelo I. Datos balanceados.
Se cuenta con los datos provenientes de un DCA en el que se probaron 4 alimentos aplicados
a lotes de pollitos y se desea evaluar si estos alimentos producen diferentes aumentos de
peso (en gramos), utilizando un nivel de significación del 1%. Los datos, después de un
período de alimentación, fueron los siguientes:
Alimentos
Lotes 1 2 3 4
1 55 61 42 169
2 49 112 97 137
3 42 30 81 169
4 21 89 95 85
5 52 63 92 154
TOTALES 219 355 407 714 1695
MEDIAS 43,8 71,0 81,4 142,8 84,75
Como se desean comparar sólo esos 4 alimentos, estamos ante un modelo I.
4
yi2• ( 219 ) 2 + ... + ( 714 ) 2
SCTRAT = ∑ − FC = − 143.651, 25 = 26.234,95
i =1 n 5
Como 12,105 > 5,29 (es decir, FTRAT ∈ RC), se rechaza la hipótesis nula y se concluye que
hay diferencias en el aumento de peso promedio de los pollitos según el alimento utilizado.
CM E 722, 425
CV% = x 100 CV % = ×100 = 32%
y •• 84, 75
La variación no controlada es de un 32% con respecto a la media de aumento de peso,
es decir, la variación dentro de los lotes de pollitos y que no se debe a los alimentos
corresponde a un 32% del aumento de peso promedio.
y23
SCError y23 − y2 .
18
y2 .
16
14
12
y.. = 11,5
10
8
6
Tratamientos
Dirección de la 2 5 3 4 7 1 6 Bloque I
pendiente:
variación de
fertilidad Bloque II
Bloque III
Para poner a prueba las hipótesis con un nivel de significación α, se realizarán los
siguientes cálculos para obtener el cuadro de ANOVA:
∑ y i•
2
y••2
FC = SC TRAT = - FC
tn n
∑ y •2 j SC T = ∑∑ y ij - FC
2
SC BLOQ = - FC i j
t
SC E = SC T - SC TRAT - SC BLOQ SCTRAT tiene (t - 1) grados de libertad
RC = { F TRAT / F TRAT > F (t -1);(t -1)(n-1);1-α } . Entonces, se rechaza Ho cuando FTRAT > FTABLA.
CM E
El coeficiente de variación porcentual es CV % = × 100 , que es una medida de
y ••
la variación no controlada relativizada al valor medio de la variable respuesta, y se puede
considerar como una medida de la precisión de la experiencia.
También se puede analizar la eficiencia del bloqueo (con respecto a un DCA)
Bloques Total
Distancias e/surcos I II III IV
Baja 330 288 295 313 1226
Media 372 340 343 341 1396
Alta 359 337 373 302 1371
Total 1061 965 1011 956 3993
El modelo matemático es yij = µ + τ i + γ j + eij i = 1, 2,3 j = 1,K ,4
donde:
yij es el rendimiento observado en la parcela del j-ésimo nivel de pendiente
(bloque) que fue sembrada a la i-ésima distancia entre surcos
µ es el rendimiento promedio
τi es el efecto en el rendimiento de la i-ésima distancia entre surcos
γj es el efecto en el rendimiento del j-ésimo nivel de pendiente
eij es el error aleatorio asociado a la ij-ésima observación
Dado que esas tres distancias son las únicas de interés, las hipótesis a poner a prueba
son:
H0: τi = 0 ∀ i ( i = 1, 2, 3) No hay diferencias en el rendimiento debidas a las diferentes
distancia entre surcos.
H1: algún τi ≠ 0 Hay diferencias en el rendimiento según la distancia entre
surcos utilizada.
Para obtener el cuadro de ANOVA, realizamos los siguientes cálculos:
2
y•• 39932
FC = = = 1328670, 75
tn 3× 4
SCT = ∑ ∑y 2
ij − FC = 3302 + 2882 + K + 302 2 − FC
i j
CUADRO DE ANOVA
FV SC GL CM F
Entre distancias 4212,50 2 2106,25 5,44
Entre bloques 2330,25 3 776,75 2,01
Error 2321,50 6 386,92 -
Total 8864,25 11 - -
RC = { FTRAT / FTRAT > F2 ; 6 ; 0.95 = 5,14 }
Como 5,44 > 5,14 ( FTRAT > FTABLA), entonces se rechaza H0. Podemos concluir que el
rendimiento difiere según la distancia entre surcos utilizada.
El coeficiente de variación porcentual es CV% = 5,91%, es decir, la variación no
controlada corresponde aproximadamente a un 6% del rendimiento medio de soja.
Respecto al bloqueo, como 2,01 > 1, puede decirse que el bloqueo fue eficiente.
Bibliografía:
Steel, R. G. D. y Torrie J. H (1988) Bioestadística Principios y Procedimientos. McGraw-Hill
México. Capítulos 6, 7 y 9.
Box, G. E. P. Hunter, W. G. y Hunter, J. S. (1999) Estadística para investigadores,
Introducción al Diseño de experimentos, Análisis de datos y Construcción de modelos.
Editorial Reverté S.A. Capítulos 6 y 7.
Kuehl, R. O. (2001) Diseño de experimentos. Segunda ed. Thomson International. Capítulos 1,
2 y 8.
Montgomery, D. C. (1991) Diseño y análisis de experimentos. Grupo Editorial Iberoamérica.
Capítulos 1, 2, 3 y 5.