Está en la página 1de 8

ANLISIS DE LA VARIANZA

En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes debidos a diferentes variables explicativas. Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher", debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis.

Introduccin
El anlisis de la varianza parte de los conceptos de regresin lineal. El primer concepto fundamental es que todo valor observado puede expresarse mediante la siguiente funcin:

Donde Y sera el valor observado (variable dependiente), y X el valor que toma la variable independiente. sera una constante que en la recta de regresin equivale a la ordenada en el origen, es otra constante que equivale a la pendiente de la recta, y es una variable aleatoria que aade a la funcin cierto error que desva la puntuacin observada de la puntuacin pronosticada. Por tanto, a la funcin de pronstico la podemos llamar "Y prima":

Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, ms el error aleatorio: (1.1) Sabiendo este concepto, podemos operar con esta ecuacin de la siguiente forma: 1) Restamos a ambos lados de la ecuacin (para mantener la igualdad) la media de la variable dependiente:

2) Substituimos el error por la ecuacin resultante de despejar la ecuacin 1.1:

Por tanto...

Y reorganizando la ecuacin:

Ahora hay que tener en cuenta que la media de las puntuaciones observadas es exactamente igual que la media de las puntuaciones pronosticadas:

Por tanto:

Podemos ver que nos han quedado 3 puntuaciones diferenciales. Ahora las elevamos al cuadrado para que posteriormente, al hacer el sumatorio, no se anulen:

Y desarrollamos el cuadrado:

Podemos ver que tenemos los numeradores de las varianzas, pero al no estar divididas por el nmero de casos (n), las llamamos Sumas de Cuadrados., excepto en el ltimo trmino, que es una Suma Cruzada de Cuadrados (el numerador de la covarianza), y la covarianza en este caso es cero (por las propiedades de la regresin lineal, la covarianza entre el error y la variable independiente es cero). Por tanto:

O lo mismo que:

de un factor, que es el caso ms sencillo, la idea bsica del anlisis de la varianza es comparar la variacin total de un conjunto de muestras y descomponerla como:

Donde: es un nmero real relacionado con la varianza, que mide la variacin debida al "factor", "tratamiento" o tipo de situacin estudiado. es un nmero real relacionado con la varianza, que mide la variacin dentro de cada "factor", "tratamiento" o tipo de situacin. En el caso de que la diferencia debida al factor o tratamiento no sean estadsticamente significativa puede probarse que las varianzas muestrales son iguales:

Donde: es el nmero de situaciones diferentes o valores del factor se estn comparando. es el nmero de mediciones en cada situacin se hacen o nmero de valores disponibles para cada valor del factor. As lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadsticamente significativo. Visin general Existen tres clases conceptuales de estos modelos: 1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. (Modelo 1) 2. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento. (Modelo 2) 3. El Modelo de efectos mixtos describen situaciones que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3)

Supuestos previos El ANOVA parte de algunos supuestos que han de cumplirse:


La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas.

La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal)

El nmero de grados de libertad (gl) puede separarse de forma similar y corresponde con la forma en que la distribucin chi-cuadrado ( o Ji-cuadrada) describe la suma de cuadrados asociada.

Tipos de modelo Modelo I: Efectos fijos El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la media, permaneciendo la "variable respuesta" con una distribucin normal. Este modelo se supone cuando el investigador se interesa nicamente por los niveles del factor presentes en el experimento, por lo que cualquier variacin observada en las puntuaciones se deber al error experimental. Modelo II: Efectos aleatorios (componentes de varianza) Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo ms simple es el de estimar la media desconocida de una poblacin compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicin.

Este modelo se supone cuando el investigador est interesado en una poblacin de niveles, tericamente infinitos, del factor de estudio, de los que nicamente una muestra al azar (t niveles) estn presentes en el experimento. Grados de libertad Los grados de libertad pueden descomponerse al igual que la suma de cuadrados. As, GLtotal = GLentre + GLdentro. Los GLentre se calculan como: a - 1, donde a es el nmero de tratamientos o niveles del factor. Los GLdentro se calculan como N - a, donde N es el nmero total de observaciones o valores de la variable medida (la variable respuesta). Pruebas de significacin El anlisis de varianza lleva a la realizacin de pruebas de significacin estadstica, usando la denominada distribucin F de Snedecor. Tablas ANOVA Una vez que se han calculado las sumas de cuadrados, las medias cuadrticas, los grados de libertad y la F, se procede a elaborar una tabla que reuna la informacin, denominada "Tabla de Anlisis de varianza o ANOVA", que adopta la siguiente forma:

Fuente de variacin Intergrupo Intragrupo o Error Total

Suma de cuadrados

Grados de libertad t-1 N-t N-1

Cuadrado medio

Tipos de factores
-Factores cualitativos especficos.
Factores susceptibles de aplicacin Factores de clasificacin -Factores cuantitativos -Factores cualitativos ordenados. -Factores cualitativos muestreados.

Efectos principales e interaccin en un experimento de dos factores.


Supongamos que tenemos un experimento de dos factores A y B con cuatro niveles cada uno, y supongamos, para simplificar que no existe variacin no controlada.

Factor B Factor A nivel 1 nivel 2 nivel 3 nivel 4 media nivel 1 9 12 10 13 11 nivel 2 11 14 12 15 13 nivel 3 14 17 15 18 16 nivel 4 15 18 16 19 17 media 12.25 15.25 13.25 16.25

Tenemos varias formas de cacterizar esta tabla: a)La diferencia entre las observaciones de dos niveles cualesquiera de A es la misma para todos los niveles de B. b)La diferencia entre las observaciones de dos niveles cualesquiera de B es la misma para todos los niveles de A. c) Los efectos de los dos factores son aditivos. d) Los residuales al restar los efectos fila y columna son cero. En este caso se dice que los factores no interactuan o que sus efectos son aditivos. Si estas condiciones no se verifican decimos que hay una interaccin entre A y B. Se dice que hay interaccin cuando las diferencias entre dos niveles cualesquiera de uno de los factores dependen de los niveles del otro factor.

Factor B Factor A nivel 1 nivel 1 9 nivel 2 12 nivel 2 11 14 nivel 3 14 17 nivel 4 15 18 media 12.25 15.25

nivel 3 nivel 4 media

11 12 11

11 16 13

14 19 16

17 18 17

13.25 16.25

Efectos principales: Efectos de cada uno de los niveles de los factores por separado (promediando sobre el otro factor). Interaccin: Efectos producidos por la aplicacin conjunta de los niveles de los dos factores. Grficos de interaccin

Efectos aditivos

Efectos no aditivos