Está en la página 1de 4

ANAVA de un DCA

El ANAVA para contrastar la hiptesis de igualdad de medias


poblacionales entre los distintos tratamientos de un DCA, respecto a la
hiptesis de que al menos un par de tratamientos difiere
estadsticamente, se basa en la comparacin de dos varianzas
muestrales, por eso se denomina anlisis de varianza, aunque su
objetivo sea comparar medias. Una, es la varianza dentro de
tratamientos o cuadrado medio del error (CMD) y la otra es la varianza
entre tratamientos o cuadrado medio entre tratamientos (CME). Esta
comparacin de dos varianzas se realiza por medio de una prueba
F basada en el estadstico F igual al cociente de las dos varianzas.
El cuadrado
medio
dentro (CMD)
o cuadrado
medio
del
error representa la variabilidad observada de unidad a unidad que
reciben el mismo tratamiento y no es asignable a ninguna causa
particular; es tambin denominada varianza debida al error
experimental. El CMD, como toda varianza puede ser escrito tambin
como el cociente de una suma de cuadrados y sus grados de libertad,
que en un DCA con N=an unidades experimentales, son N-a. El CMD es
un estimador de la varianza residual, es decir de la variabilidad entre
observaciones que no se debe a las fuentes de variacin que se
reconocen a priori (tratamientos). En el DCA unifactorial es equivalente
a la variabilidad entre observaciones que no tiene que ver con
diferencias entre tratamientos, sino con diferencias observadas dentro
de los tratamientos.
La otra varianza muestral que forma parte del estadstico F, surge de la
idea de plantear otro estimador para 2. Bajo normalidad, si la hiptesis
nula de igualdad de medias y las suposiciones de homogeneidad de
varianzas fuesen verdaderas, las a funciones de densidad poblacional
seran iguales. Luego, las a medias muestrales que se pueden calcular
con los n datos de cada tratamiento, tienen varianza
segn lo

observado en el estudio de distribuciones en el muestreo y por tanto se


obtiene un segundo estimador de 2 desde la expresin
. El
nuevo

estimador

es conocido

como cuadrado

medio

entre

tratamientos, cuadrado medio de tratamientos o simplemente como


cuadrado medio entre (CME).
Bajo la hiptesis nula, es decir cuando no hay diferencias significativas
entre las medias de los tratamientos,
tender a ser baja, ya que
las medias muestrales de los atratamientos sern muy parecidas, al
menos no significativamente mayor que la varianza inherente de los
datos que se observa entre las repeticiones de un mismo tratamiento.
En el caso que la hiptesis nula de igualdad de medias poblacionales no
fuera verdadera, ocurrir que
tender a crecer a medida que
las a medias poblacionales sean cada vez ms distintas.
Si

denotamos

como

las

varianzas

estimadas

respectivamente por el CME y el CMD, se debe observar que, bajo la


hiptesis nula de igualdad de medias poblacionales, ocurrir
que
, en caso contrario (hiptesis nula falsa) ocurrir
que

, por lo que podemos reescribir las hiptesis clsicas del

ANAVA (referidas a medias poblacionales o esperanzas) como la siguiente


hiptesis unilateral que compara dos varianzas poblacionales:
H0 :

vs

H1 :

La prueba del ANAVA consiste en calcular el estadstico F utilizando los


estimadores de
y
(es decir los cuadrados medios) de la

siguiente forma:

Este estadstico tiene, bajo H0, una distribucin F(a-1),(N-a)) con N igual al
nmero total de unidades experimentales.
Luego, para un nivel de significacin , si F es mayor que el cuantil (1) de la distribucin F(a-1),(N-a) se rechaza H0, implicando que H1 es
verdadera. El rechazo de H0 implica que las medias poblacionales
(expresadas como a media poblacional ms un efecto de tratamiento)
no son iguales y por lo tanto, que algn t i0; as se concluye que no
todas las medias de tratamiento son iguales ya que al menos algn
tratamiento tiene efecto no nulo y por tanto para ese tratamiento, la
media ser igual a la media general ms el efecto del tratamiento.
En sntesis y para reforzar la idea principal, decimos que a pesar que la
hiptesis de inters del ANAVA se refiera a la igualdad de medias de dos
o ms distribuciones, la tcnica se basa en la comparacin de varianzas
(CME y CMD).
El anlisis de la varianza se suele resumir en una tabla conocida como
Tabla de Anlisis de la Varianza en la que se presentan los estadsticos y
clculos bsicos para obtener el CME y el CMD. En la columna titulada
"Fuentes de Variacin" se destacan tres celdas con sus correspondientes
ttulos. En ellas se indican los contenidos de las celdas dentro de la fila
respectiva. En la fila titulada "Entre Tratamientos" existen cuatro
celdas, en las que se presentan las siguientes cantidades: Suma de
Cuadrados Entre Tratamientos (SCE),Grados de Libertad de la suma de
cuadrados
entre
tratamientos
(gle), Cuadrados
Medios entre
Tratamientos (CME) y el estadstico F correspondiente al cociente del
CME/CMD. La fila titulada "Dentro (Error Experimental)" se completa
con las siguientes cantidades: Suma de Cuadrados Dentro de
Tratamientos (SCD), Grados de Libertad de la suma de cuadrados dentro
de tratamientos (gld) y Cuadrado Medio Dentro de Tratamientos(CMD).
En la titulada "Total" se completa con la Suma de Cuadrados Total (SCT)
y Grados de Libertad Total (glt).
Como en otras pruebas estadsticas, el valor p de la prueba se compara
con el nivel de significacin fijado y si el valor p es menor que , se
concluye rechazando la hiptesis nula. En una ANAVA siempre que el

valor F sea grande, se pone en evidencia que las diferencias entre


tratamientos son mayores a las diferencias observadas dentro de
tratamientos es decir a aquellas que podran darse por azar o por la
variabilidad natural de la respuesta. Consecuentemente valores altos de
F se asocian con valores p bajos y llevan al rechazo de la hiptesis de
igualdad de medias de tratamientos.
El cociente entre la Suma de Cuadrados del Modelo y la Suma de
Cuadrados Total, se denomina coeficiente de determinacin y se
denota como R2. Este coeficiente, al ser una proporcin, verifica que
0R21, suele expresarse en porcentaje y se interpreta como el
porcentaje de la variabilidad total en Y que es explicada por el modelo
propuesto. El complemento a 100% es una medida de la variabilidad no
explicada por el modelo.

También podría gustarte