Está en la página 1de 6

Anlisis de la varianza

En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn


terminologa inglesa) es una coleccin de modelos estadsticos y sus
procedimientos asociados, en el cual la varianza est particionada en ciertos
componentes de!idos a diferentes varia!les e"plicativas#
$as t%cnicas iniciales del anlisis de varianza fueron desarrolladas por el
estadstico y genetista &# A# 'is(er en los a)os *+,- y *+.- y es algunas veces
conocido como /Anova de 'is(er/ o /anlisis de varianza de 'is(er/, de!ido al uso
de la distri!ucin ' de 'is(er como parte del contraste de (iptesis#
El anlisis de la varianza parte de los conceptos de regresin lineal#
El primer concepto fundamental es 0ue todo valor o!servado puede e"presarse
mediante la siguiente funcin1
2onde 3 sera el valor o!servado (varia!le dependiente), y 4 el valor 0ue toma la
varia!le independiente#
sera una constante 0ue en la recta de regresin e0uivale a la ordenada en el
origen, es otra constante 0ue e0uivale a la pendiente de la recta, y es una
varia!le aleatoria 0ue a)ade a la funcin cierto error 0ue desva la puntuacin
o!servada de la puntuacin pronosticada#
5or tanto, a la funcin de pronstico la podemos llamar /3 prima/1
5odemos resumir 0ue las puntuaciones o!servadas e0uivalen a las puntuaciones
esperadas, ms el error aleatorio1
(*#*)
6a!iendo este concepto, podemos operar con esta ecuacin de la siguiente forma1
*) &estamos a am!os lados de la ecuacin (para mantener la igualdad) la media
de la varia!le dependiente1
,) 6u!stituimos el error por la ecuacin resultante de despe7ar la ecuacin *#*1
5or tanto###
3 reorganizando la ecuacin1
A(ora (ay 0ue tener en cuenta 0ue la media de las puntuaciones o!servadas es
e"actamente igual 0ue la media de las puntuaciones pronosticadas1
5or tanto1
5odemos ver 0ue nos (an 0uedado . puntuaciones diferenciales# A(ora las
elevamos al cuadrado para 0ue posteriormente, al (acer el sumatorio, no se
anulen1
3 desarrollamos el cuadrado1
5odemos ver 0ue tenemos los numeradores de las varianzas, pero al no estar
divididas por el nmero de casos (n), las llamamos 6umas de 8uadrados#, e"cepto
en el ltimo t%rmino, 0ue es una 6uma 8ruzada de 8uadrados (el numerador de la
covarianza), y la covarianza en este caso es cero (por las propiedades de la
regresin lineal, la covarianza entre el error y la varia!le independiente es cero)#
5or tanto1
O lo mismo 0ue1
de un factor, 0ue es el caso ms sencillo, la idea !sica del anlisis de la varianza
es comparar la variacin total de un con7unto de muestras y descomponerla como1
2onde1
es un nmero real relacionado con la varianza, que mide la variacin debida
al "factor", "tratamiento" o tipo de situacin estudiado.
es un nmero real relacionado con la varianza, que mide la variacin dentro
de cada "factor", "tratamiento" o tipo de situacin.
En el caso de 0ue la diferencia de!ida al factor o tratamiento no sean
estadsticamente significativa puede pro!arse 0ue las varianzas muestrales son
iguales1
2onde1
es el nmero de situaciones diferentes o valores del factor se estn comparando.
es el nmero de mediciones en cada situacin se hacen o nmero de valores
disponibles para cada valor del factor.
As lo 0ue un simple test a partir de la ' de 6nedecor puede decidir si el factor o
tratamiento es estadsticamente significativo#
Visin general
E"isten tres clases conceptuales de estos modelos1
1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales
las cuales podran diferir nicamente en sus medias. !Modelo 1"
#. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de
diferentes poblaciones cu$as diferencias quedan restrin%idas por la jerarqua.
Ejemplo& El e'perimentador ha aprendido $ ha considerado en el e'perimento slo
tres de muchos ms m(todos posibles, el m(todo de ense)anza es un factor aleatorio
en el e'perimento. !Modelo #"
*. El Modelo de efectos mi'tos describen situaciones que (ste puede tomar. Ejemplo&
+i el m(todo de ense)anza es analizado como un factor que puede influir donde
estn presentes ambos tipos de factores& fijos $ aleatorios. !Modelo *"
Supuestos previos
El ANOVA parte de algunos supuestos 0ue (an de cumplirse1
,a variable dependiente debe medirse al menos a nivel de intervalo.
-ndependencia de las observaciones.
,a distribucin de los residuales debe ser normal.
.omocedasticidad& homo%eneidad de las varianzas.
$a t%cnica fundamental consiste en la separacin de la suma de cuadrados (66,
9sum of s0uares9) en componentes relativos a los factores contemplados en el
modelo# 8omo e7emplo, mostramos el modelo para un ANOVA simplificado con un
tipo de factores en diferentes niveles# (6i los niveles son cuantitativos y los efectos
son lineales, puede resultar apropiado un anlisis de regresin lineal)
El nmero de grados de li!ertad (gl) puede separarse de forma similar y
corresponde con la forma en 0ue la distri!ucin c(i:cuadrado (;< o =i:cuadrada)
descri!e la suma de cuadrados asociada#
Tipos de modelo
Modelo I: Efectos fijos
El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las
0ue el e"perimentador (a sometido al grupo o material analizado a varios factores,
cada uno de los cuales le afecta slo a la media, permaneciendo la /varia!le
respuesta/ con una distri!ucin normal#
Este modelo se supone cuando el investigador se interesa nicamente por los
niveles del factor presentes en el e"perimento, por lo 0ue cual0uier variacin
o!servada en las puntuaciones se de!er al error e"perimental#
Modelo II: Efectos aleatorios (componentes de varianza)
$os modelos de efectos aleatorios se usan para descri!ir situaciones en 0ue
ocurren diferencias incompara!les en el material o grupo e"perimental# El e7emplo
ms simple es el de estimar la media desconocida de una po!lacin compuesta de
individuos diferentes y en el 0ue esas diferencias se mezclan con los errores del
instrumento de medicin#
Este modelo se supone cuando el investigador est interesado en una po!lacin
de niveles, tericamente infinitos, del factor de estudio, de los 0ue nicamente una
muestra al azar (t niveles) estn presentes en el e"perimento#
Grados de libertad
Pruebas de significacin
El anlisis de varianza lleva a la realizacin de prue!as de significacin
estadstica, usando la denominada distri!ucin ' de 6nedecor#
Tablas ANOVA
>na vez 0ue se (an calculado las sumas de cuadrados, las medias cuadrticas,
los grados de li!ertad y la ', se procede a ela!orar una ta!la 0ue reuna la
informacin, denominada /?a!la de Anlisis de varianza o ANOVA/, 0ue adopta la
siguiente forma1
Fuente de
variacin
Suma de
cuadrados
Grados de
liertad
!uadrado medio F
-nter%rupo t / 1
-ntra%rupo o Error 0 / t
1otal 0 / 1
Concepto de modelo economtrico
$a econometra, igual 0ue la economa, tiene como o!7etivo e"plicar una varia!le
en funcin de otras# Esto implica 0ue el punto de partida para el anlisis
econom%trico es el modelo econmico y este se transformar en modelo
econom%trico cuando se (an a)adido las especificaciones necesarias para su
aplicacin emprica# Es decir, cuando se (an definido las varia!les (endgenas,
e"genas) 0ue e"plican y determinan el modelo, los parmetros estructurales 0ue
acompa)an a las varia!les, las ecuaciones y su formulacin en forma matemtica,
la pertur!acin aleatoria 0ue e"plica la parte no sistemtica del modelo, y los
datos estadsticos#
A partir del modelo econom%trico especificado, en una segunda etapa se procede
a la estimacin, fase estadstica 0ue asigna valores num%ricos a los parmetros
de las ecuaciones del modelo# 5ara ello se utilizan m%todos estadsticos como
pueden ser1 @nimos cuadrados ordinarios, @"ima verosimilitud, @nimos
cuadrados !ietpicos, etc# Al reci!ir los parmetros el valor num%rico definen el
concepto de estructura 0ue (a de tener valor esta!le en el tiempo especificado#
$a tercera etapa en la ela!oracin del modelo es la verificacin y contrastacin,
donde se someten los parmetros y la varia!le aleatoria a unos contrastes
estadsticos para cuantificar en t%rminos pro!a!ilsticos la validez del modelo
estimado#
$a cuarta etapa consiste en la aplicacin del modelo conforme al o!7etivo del
mismo# En general los modelos econom%tricos son tiles para1
1. 2nlisis estructural $ entender como funciona la economa.
#. 3rediccin de los valores futuros de las variables econmicas.
*. +imular con fines de planificacin distintas posibilidades de las variables e'%enas.
4. +imular con fines de control valores ptimos de variables instrumentales de poltica
econmica $ de empresa.
El mtodo de mnimos cuadrados ordinarios (estimacin CO!
?am!i%n se conoce como teora de la regresin lineal, y estar ms desarrollado
en la parte estadstica de la enciclopedia# No o!stante, a0u se dar un resumen
general so!re la aplicacin del m%todo de mnimos cuadrados#
6e parte de representar las relaciones entre una varia!le econmica endgena y
una o ms varia!les e"genas de forma lineal, de la siguiente manera1
/3/ es la varia!le endgena, cuyo valor es determinado por las e"genas,
(asta # 8uales son las varia!les elegidas depende de la teora econmica 0ue
se tenga en mente, y tam!i%n de anlisis estadsticos y econmicos previos# El
o!7etivo !uscado sera o!tener los valores de los parmetros desde (asta # A
menudo este modelo se suele completar a)adiendo un t%rmino ms a la suma,
llamado t%rmino independiente, 0ue es un parmetro ms a !uscar# As1
#
En el 0ue es una constante, 0ue tam!i%n (ay 0ue averiguar# A veces resulta til,
por motivos estadsticos, suponer 0ue siempre (ay una constante en el modelo, y
contrastar la (iptesis de si es distinta, o no, de cero para reescri!irlo de acuerdo
con ello#
Adems, se supone 0ue esta relacin no es del todo determinista, esto es, e"istir
siempre un cierto grado de error aleatorio (en realidad, se entiende 0ue encu!re a
todas a0uellas varia!les y factores 0ue no se (ayan podido incluir en el modelo)
0ue se suele representar a)adiendo a la suma una letra representa una varia!le
aleatoria#As1
6e suele suponer 0ue es una varia!le aleatoria normal, con media cero y
varianza constante en todas las muestras (aun0ue sea desconocida)#
6e toma una muestra estadstica, 0ue corresponda a o!servaciones de los valores
0ue (ayan tomado esas varia!les en distintos momentos del tiempo (o,
dependiendo del tipo de modelo, los valores 0ue (ayan tomado en distintas reas
o zonas o agentes econmicos a considerar)#
5or e7emplo, en un determinado modelo podemos estar interesados en averiguar
como la renta (a dependido de los niveles de precios, de empleo y de tipos de
inter%s a lo largo de los aos en cierto pas, mientras 0ue en otro podemos estar
interesados en ver como, a lo largo de un mismo ao, (a dependido la renta de
distintos pases de esas mismas varia!les# 5or lo 0ue tendramos 0ue o!servar, en
el primer caso, la renta, niveles de empleo, precios y tipos de inter%s del a)o *, lo
mismo, pero del a)o ,, etc%tera, para o!tener la muestra a lo largo de varios a)os,
mientras 0ue en el segundo caso tendramos 0ue tener en cuenta los valores de
cada uno de los pases para o!tener la muestra# 8ada una de esas o!servaciones
para cada a)o, o pas, se llamara o!servacin muestral# Ntese 0ue an se
podra (acer un anlisis ms am!icioso teniendo en cuenta pas y ao#
>na vez tomada la muestra, se aplica un m%todo, 0ue tiene su 7ustificacin
matemtica y estadstica, llamado m%todo de mnimos cuadrados# Este consiste
en, !sicamente, minimizar la suma de los errores (elevados al cuadrado) 0ue se
tendran, suponiendo distintos valores posi!les para los parmetros, al estimar los
valores de la varia!le endgena a partir de los de las varia!les e"genas en cada
una de las o!servaciones muestrales, usando el modelo propuesto, y comparar
esos valores con los 0ue realmente tom la varia!le endgena# $os parmetros
0ue lograran ese mnimo, el de las suma de los errores cuadrticos, se acepta 0ue
son los 0ue estamos !uscando, de acuerdo con criterios estadsticos#
?am!i%n, este m%todo nos proporcionar informacin (en forma de ciertos valores
estadsticos adicionales, 0ue se o!tienen adems de los parmetros) para ver en
0u% medida los valores de los parmetros 0ue (emos o!tenido resultan fia!les,
por e7emplo, para (acer contrastes de hiptesis, esto es, ver si ciertas
suposiciones que se haban hecho acerca del modelo resultan, o no, ciertas#
6e puede usar tam!i%n esta informacin adicional para compro!ar si se pueden
prescindir de algunas de esas varia!les, para ver si es posi!le 0ue los valores de
los parmetros (ayan cam!iado con el tiempo (o si los valores de los parmetros
son diferentes en una zona econmica de los de otra, por e7emplo), o para ver en
0u% grado son vlidas predicciones acerca del futuro valor de la varia!le endgena
si se supone 0ue las varia!les e"genas adoptarn nuevos valores#

También podría gustarte