En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn
terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes de!idos a diferentes varia!les e"plicativas# $as t%cnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista &# A# 'is(er en los a)os *+,- y *+.- y es algunas veces conocido como /Anova de 'is(er/ o /anlisis de varianza de 'is(er/, de!ido al uso de la distri!ucin ' de 'is(er como parte del contraste de (iptesis# El anlisis de la varianza parte de los conceptos de regresin lineal# El primer concepto fundamental es 0ue todo valor o!servado puede e"presarse mediante la siguiente funcin1 2onde 3 sera el valor o!servado (varia!le dependiente), y 4 el valor 0ue toma la varia!le independiente# sera una constante 0ue en la recta de regresin e0uivale a la ordenada en el origen, es otra constante 0ue e0uivale a la pendiente de la recta, y es una varia!le aleatoria 0ue a)ade a la funcin cierto error 0ue desva la puntuacin o!servada de la puntuacin pronosticada# 5or tanto, a la funcin de pronstico la podemos llamar /3 prima/1 5odemos resumir 0ue las puntuaciones o!servadas e0uivalen a las puntuaciones esperadas, ms el error aleatorio1 (*#*) 6a!iendo este concepto, podemos operar con esta ecuacin de la siguiente forma1 *) &estamos a am!os lados de la ecuacin (para mantener la igualdad) la media de la varia!le dependiente1 ,) 6u!stituimos el error por la ecuacin resultante de despe7ar la ecuacin *#*1 5or tanto### 3 reorganizando la ecuacin1 A(ora (ay 0ue tener en cuenta 0ue la media de las puntuaciones o!servadas es e"actamente igual 0ue la media de las puntuaciones pronosticadas1 5or tanto1 5odemos ver 0ue nos (an 0uedado . puntuaciones diferenciales# A(ora las elevamos al cuadrado para 0ue posteriormente, al (acer el sumatorio, no se anulen1 3 desarrollamos el cuadrado1 5odemos ver 0ue tenemos los numeradores de las varianzas, pero al no estar divididas por el nmero de casos (n), las llamamos 6umas de 8uadrados#, e"cepto en el ltimo t%rmino, 0ue es una 6uma 8ruzada de 8uadrados (el numerador de la covarianza), y la covarianza en este caso es cero (por las propiedades de la regresin lineal, la covarianza entre el error y la varia!le independiente es cero)# 5or tanto1 O lo mismo 0ue1 de un factor, 0ue es el caso ms sencillo, la idea !sica del anlisis de la varianza es comparar la variacin total de un con7unto de muestras y descomponerla como1 2onde1 es un nmero real relacionado con la varianza, que mide la variacin debida al "factor", "tratamiento" o tipo de situacin estudiado. es un nmero real relacionado con la varianza, que mide la variacin dentro de cada "factor", "tratamiento" o tipo de situacin. En el caso de 0ue la diferencia de!ida al factor o tratamiento no sean estadsticamente significativa puede pro!arse 0ue las varianzas muestrales son iguales1 2onde1 es el nmero de situaciones diferentes o valores del factor se estn comparando. es el nmero de mediciones en cada situacin se hacen o nmero de valores disponibles para cada valor del factor. As lo 0ue un simple test a partir de la ' de 6nedecor puede decidir si el factor o tratamiento es estadsticamente significativo# Visin general E"isten tres clases conceptuales de estos modelos1 1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. !Modelo 1" #. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cu$as diferencias quedan restrin%idas por la jerarqua. Ejemplo& El e'perimentador ha aprendido $ ha considerado en el e'perimento slo tres de muchos ms m(todos posibles, el m(todo de ense)anza es un factor aleatorio en el e'perimento. !Modelo #" *. El Modelo de efectos mi'tos describen situaciones que (ste puede tomar. Ejemplo& +i el m(todo de ense)anza es analizado como un factor que puede influir donde estn presentes ambos tipos de factores& fijos $ aleatorios. !Modelo *" Supuestos previos El ANOVA parte de algunos supuestos 0ue (an de cumplirse1 ,a variable dependiente debe medirse al menos a nivel de intervalo. -ndependencia de las observaciones. ,a distribucin de los residuales debe ser normal. .omocedasticidad& homo%eneidad de las varianzas. $a t%cnica fundamental consiste en la separacin de la suma de cuadrados (66, 9sum of s0uares9) en componentes relativos a los factores contemplados en el modelo# 8omo e7emplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles# (6i los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal) El nmero de grados de li!ertad (gl) puede separarse de forma similar y corresponde con la forma en 0ue la distri!ucin c(i:cuadrado (;< o =i:cuadrada) descri!e la suma de cuadrados asociada# Tipos de modelo Modelo I: Efectos fijos El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las 0ue el e"perimentador (a sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la media, permaneciendo la /varia!le respuesta/ con una distri!ucin normal# Este modelo se supone cuando el investigador se interesa nicamente por los niveles del factor presentes en el e"perimento, por lo 0ue cual0uier variacin o!servada en las puntuaciones se de!er al error e"perimental# Modelo II: Efectos aleatorios (componentes de varianza) $os modelos de efectos aleatorios se usan para descri!ir situaciones en 0ue ocurren diferencias incompara!les en el material o grupo e"perimental# El e7emplo ms simple es el de estimar la media desconocida de una po!lacin compuesta de individuos diferentes y en el 0ue esas diferencias se mezclan con los errores del instrumento de medicin# Este modelo se supone cuando el investigador est interesado en una po!lacin de niveles, tericamente infinitos, del factor de estudio, de los 0ue nicamente una muestra al azar (t niveles) estn presentes en el e"perimento# Grados de libertad Pruebas de significacin El anlisis de varianza lleva a la realizacin de prue!as de significacin estadstica, usando la denominada distri!ucin ' de 6nedecor# Tablas ANOVA >na vez 0ue se (an calculado las sumas de cuadrados, las medias cuadrticas, los grados de li!ertad y la ', se procede a ela!orar una ta!la 0ue reuna la informacin, denominada /?a!la de Anlisis de varianza o ANOVA/, 0ue adopta la siguiente forma1 Fuente de variacin Suma de cuadrados Grados de liertad !uadrado medio F -nter%rupo t / 1 -ntra%rupo o Error 0 / t 1otal 0 / 1 Concepto de modelo economtrico $a econometra, igual 0ue la economa, tiene como o!7etivo e"plicar una varia!le en funcin de otras# Esto implica 0ue el punto de partida para el anlisis econom%trico es el modelo econmico y este se transformar en modelo econom%trico cuando se (an a)adido las especificaciones necesarias para su aplicacin emprica# Es decir, cuando se (an definido las varia!les (endgenas, e"genas) 0ue e"plican y determinan el modelo, los parmetros estructurales 0ue acompa)an a las varia!les, las ecuaciones y su formulacin en forma matemtica, la pertur!acin aleatoria 0ue e"plica la parte no sistemtica del modelo, y los datos estadsticos# A partir del modelo econom%trico especificado, en una segunda etapa se procede a la estimacin, fase estadstica 0ue asigna valores num%ricos a los parmetros de las ecuaciones del modelo# 5ara ello se utilizan m%todos estadsticos como pueden ser1 @nimos cuadrados ordinarios, @"ima verosimilitud, @nimos cuadrados !ietpicos, etc# Al reci!ir los parmetros el valor num%rico definen el concepto de estructura 0ue (a de tener valor esta!le en el tiempo especificado# $a tercera etapa en la ela!oracin del modelo es la verificacin y contrastacin, donde se someten los parmetros y la varia!le aleatoria a unos contrastes estadsticos para cuantificar en t%rminos pro!a!ilsticos la validez del modelo estimado# $a cuarta etapa consiste en la aplicacin del modelo conforme al o!7etivo del mismo# En general los modelos econom%tricos son tiles para1 1. 2nlisis estructural $ entender como funciona la economa. #. 3rediccin de los valores futuros de las variables econmicas. *. +imular con fines de planificacin distintas posibilidades de las variables e'%enas. 4. +imular con fines de control valores ptimos de variables instrumentales de poltica econmica $ de empresa. El mtodo de mnimos cuadrados ordinarios (estimacin CO! ?am!i%n se conoce como teora de la regresin lineal, y estar ms desarrollado en la parte estadstica de la enciclopedia# No o!stante, a0u se dar un resumen general so!re la aplicacin del m%todo de mnimos cuadrados# 6e parte de representar las relaciones entre una varia!le econmica endgena y una o ms varia!les e"genas de forma lineal, de la siguiente manera1 /3/ es la varia!le endgena, cuyo valor es determinado por las e"genas, (asta # 8uales son las varia!les elegidas depende de la teora econmica 0ue se tenga en mente, y tam!i%n de anlisis estadsticos y econmicos previos# El o!7etivo !uscado sera o!tener los valores de los parmetros desde (asta # A menudo este modelo se suele completar a)adiendo un t%rmino ms a la suma, llamado t%rmino independiente, 0ue es un parmetro ms a !uscar# As1 # En el 0ue es una constante, 0ue tam!i%n (ay 0ue averiguar# A veces resulta til, por motivos estadsticos, suponer 0ue siempre (ay una constante en el modelo, y contrastar la (iptesis de si es distinta, o no, de cero para reescri!irlo de acuerdo con ello# Adems, se supone 0ue esta relacin no es del todo determinista, esto es, e"istir siempre un cierto grado de error aleatorio (en realidad, se entiende 0ue encu!re a todas a0uellas varia!les y factores 0ue no se (ayan podido incluir en el modelo) 0ue se suele representar a)adiendo a la suma una letra representa una varia!le aleatoria#As1 6e suele suponer 0ue es una varia!le aleatoria normal, con media cero y varianza constante en todas las muestras (aun0ue sea desconocida)# 6e toma una muestra estadstica, 0ue corresponda a o!servaciones de los valores 0ue (ayan tomado esas varia!les en distintos momentos del tiempo (o, dependiendo del tipo de modelo, los valores 0ue (ayan tomado en distintas reas o zonas o agentes econmicos a considerar)# 5or e7emplo, en un determinado modelo podemos estar interesados en averiguar como la renta (a dependido de los niveles de precios, de empleo y de tipos de inter%s a lo largo de los aos en cierto pas, mientras 0ue en otro podemos estar interesados en ver como, a lo largo de un mismo ao, (a dependido la renta de distintos pases de esas mismas varia!les# 5or lo 0ue tendramos 0ue o!servar, en el primer caso, la renta, niveles de empleo, precios y tipos de inter%s del a)o *, lo mismo, pero del a)o ,, etc%tera, para o!tener la muestra a lo largo de varios a)os, mientras 0ue en el segundo caso tendramos 0ue tener en cuenta los valores de cada uno de los pases para o!tener la muestra# 8ada una de esas o!servaciones para cada a)o, o pas, se llamara o!servacin muestral# Ntese 0ue an se podra (acer un anlisis ms am!icioso teniendo en cuenta pas y ao# >na vez tomada la muestra, se aplica un m%todo, 0ue tiene su 7ustificacin matemtica y estadstica, llamado m%todo de mnimos cuadrados# Este consiste en, !sicamente, minimizar la suma de los errores (elevados al cuadrado) 0ue se tendran, suponiendo distintos valores posi!les para los parmetros, al estimar los valores de la varia!le endgena a partir de los de las varia!les e"genas en cada una de las o!servaciones muestrales, usando el modelo propuesto, y comparar esos valores con los 0ue realmente tom la varia!le endgena# $os parmetros 0ue lograran ese mnimo, el de las suma de los errores cuadrticos, se acepta 0ue son los 0ue estamos !uscando, de acuerdo con criterios estadsticos# ?am!i%n, este m%todo nos proporcionar informacin (en forma de ciertos valores estadsticos adicionales, 0ue se o!tienen adems de los parmetros) para ver en 0u% medida los valores de los parmetros 0ue (emos o!tenido resultan fia!les, por e7emplo, para (acer contrastes de hiptesis, esto es, ver si ciertas suposiciones que se haban hecho acerca del modelo resultan, o no, ciertas# 6e puede usar tam!i%n esta informacin adicional para compro!ar si se pueden prescindir de algunas de esas varia!les, para ver si es posi!le 0ue los valores de los parmetros (ayan cam!iado con el tiempo (o si los valores de los parmetros son diferentes en una zona econmica de los de otra, por e7emplo), o para ver en 0u% grado son vlidas predicciones acerca del futuro valor de la varia!le endgena si se supone 0ue las varia!les e"genas adoptarn nuevos valores#