Está en la página 1de 33

PUBLICACIONES DE 4º CURSO

Licenciatura: ECONOMICAS

Asignatura: MODELOS REGIONALES

TEMA 4:

DATOS PANEL: MODELOS ESTÁTICOS

Autores: Jesús Mur; Ana Angulo

Departamento: ANÁLISIS ECONÓMICO


Curso Académico: 2008/2009

Facultad de Ciencias Económicas y Empresariales


Universidad de Zaragoza
2

Indice

1- Introducción.
2- Fuentes de heterogeneidad en conjuntos de datos panel.
3- Estimación en modelos de datos panel estáticos.
4- Contrastes de especificación en modelos de datos panel estáticos.
5- Efectos espaciales en modelos de datos panel.
3

1. INTRODUCCIÓN

Se dice que estamos en presencia de un conjunto de datos de panel cuando se


dispone, simultáneamente, de información de corte transversal y de serie temporal. Esto es
cuando se dispone de observaciones sobre determinadas características de un conjunto de
agentes (individuos, países, empresas, etc.) a lo largo de un período continuado de tiempo.
La recogida de información se lleva a cabo, por tanto, en dos dimensiones y, de este modo,
se generan múltiples observaciones puntuales para cada unidad económica.

Generalmente, los paneles de datos se distinguen unos de otros según su


amplitud transversal y temporal. Así, los paneles con un número muy amplio de
observaciones transversales y un número de períodos reducido se denominan Paneles
Micro. En el caso contrario, número de periodos elevado e información transversal
reducida se conoce con el nombre de Paneles Macro. Por último, en el caso realmente
extraordinario de contar con un panel con amplia dimensión tanto temporal como
transversal hablaríamos de un Campo aleatorio (Random Field).

Así mismo, resulta habitual hablar de paneles de datos equilibrados o paneles


completos cuando el número de observaciones transversales es el mismo para cada
período temporal.

Comenzaremos presentando una breve descripción de las principales ventajas,


así como de las limitaciones, del uso de muestras de datos de panel en la investigación
económica en relación con las bases de datos que sólo contemplan una dimensión
temporal (series temporales) o individual (corte transversal). Para ello nos basaremos en
los trabajos de Hsiao (2000), Klevmarken (1989), Solon (1989) y Baltagi (2001). Entre
las principales ventajas hay que destacar las siguientes:

1) Los datos de panel proporcionan menos problemas de multicolinealidad


(presente en numerosas ocasiones al utilizar datos de series temporales), más grados de
4

libertad y, por tanto, mayor eficiencia. En efecto, la utilización de datos de panel, como ya
hemos comentado, permite utilizar un conjunto de datos más informativos, en el sentido de
que es capaz de recoger con mayor precisión la variabilidad en los datos, tanto la existente
entre individuos como la que existe a lo largo del tiempo.

2) Asimismo, la utilización de datos de panel permite identificar y medir algunos


efectos que no pueden considerarse al utilizar únicamente datos de corte transversal o datos
de series temporales. Ben-Porath (1973) sugiere un ejemplo. Supongamos que tenemos
datos de corte transversal correspondientes a un determinado número de mujeres en el que
una variable es la participación media anual en el mercado de trabajo. Supongamos que
una determinada mujer ha participado una media del 50%. Esta cifra ha podido ser
generada por dos situaciones diferentes. O bien ha trabajado el 50% de los años
considerados, o bien trabaja a tiempo parcial durante todos los años. Las implicaciones de
ambas situaciones son distintas y sólo la utilización de datos de panel permitiría
discriminar ambas situaciones.

3) A diferencia de los datos de corte transversal, una ventaja adicional de los datos
de panel radica en la posible modelización de efectos dinámicos. Por ejemplo, en los datos
de corte transversal podemos determinar qué porcentaje de la población consume un
determinado producto en un determinado momento. La utilización de datos de panel
permite analizar qué porcentaje de personas que consumían un producto siguen haciéndolo
y quienes han dejado de consumirlo. Un ejemplo de esto que acabamos de mencionar
referido al desempleo puede encontrarse en Ashenfelter (1978) y Ashenfelter y Solon
(1982).

4) Otra de las ventajas atribuidas a los datos de panel con respecto a los datos de
corte transversal es la gran capacidad que ofrecen al investigador de construir y
contrastar complicados modelos de comportamiento. De hecho, el análisis y la
modelización de la eficiencia técnica resulta más interesante realizarla utilizando datos
de panel (Baltagi y Griffin, 1988b; Cornwell y otros, 1990; y Kumbhakar, 1990, 1991,
1992, 1993). Además, es necesario introducir menos restricciones a la hora de estimar
modelos de retardos distribuidos usando datos de panel, en relación con los que son
necesarios cuando se utilizan datos de series temporales (Hsiao, 1986).
5

5) Por otra parte, los datos de panel permiten resolver o reducir la magnitud de
un problema econométrico muy importante que, a menudo aparece en los estudios
empíricos. Nos referimos a la presencia de variables omitidas (inobservadas u
observadas con error) que están correlacionadas con las variables explicativas del
modelo. Por ejemplo, consideremos el siguiente modelo de regresión:

yit = α + xit' β + z it' ρ + ε it i = 1,..., N ; t = 1,..., T (1)

donde dada la naturaleza de los datos, utilizaremos dos tipos de subíndices: i para los
individuos1 ( i = 1,..., N ) y t para el período temporal ( t = 1,..., T ) y donde xit y zit son

vectores de variables exógenas, donde el término de error ε it se distribuye de forma

idéntica e independiente sobre i y t con media cero y varianza σ ε2 . En estas


circunstancias, es bien conocido que la estimación MCO proporciona estimadores
consistentes de los parámetros del modelo α , β y ρ. Sin embargo, si suponemos que las

variables incluidas en zit son inobservables, y que además la covarianza entre xit y zit

no es cero, (es decir, están correlacionadas con xit ), entonces los estimadores MCO

obtenidos al hacer la regresión de y it sobre xit serán sesgados2.

En estas circunstancia, se puede comprobar como la disponibilidad de datos de


panel permite solucionar el problema. Al disponer de observaciones repetidas para un
grupo de individuos podemos eliminar el efecto de las variables incluidas en z . Si por
ejemplo, zit = zi para todo t (los valores de z permanecen constantes a lo largo del
tiempo para un individuo, pero varían entre individuos), podemos tomar las primeras
diferencias de las observaciones individuales en el tiempo y obtener:

1
Utilizaremos el término individuos para referirnos a las unidades de corte transversal. Como se ha
comentado con anterioridad, también puede tratarse de empresas, hogares, países, etc.
2
Siempre que se omiten variables relevantes se incurre en un problema de sesgadez de los parámetros
incluidos salvo que las variables incluidas y las omitidas sean ortogonales.
6

( )
yit − yi ,t −1 = xit − xi ,t −1 β + (ε it − ε i ,t −1 )
'
i = 1,..., N ; t = 1,..., T (2)

De forma análoga, si zit = z t para todo i (los valores de z permanecen constantes


entre individuos en un determinado momento del tiempo, pero presentan variación
temporal), podemos tomar desviaciones con respecto a la media entre individuos en un
periodo de tiempo y obtener:
'

⎛ −
⎞ ⎛ −

yit − yt = ⎜ xit − xt ⎟ β + ⎜ ε it − ε t ⎟ i = 1,..., N ; t = 1,..., T (3)
⎝ ⎠ ⎝ ⎠

N N N

∑ yit ∑ xit ∑ε it
donde y t = i =1
, xt = i =1
y εt = i =1
.
N N N

De esta forma, podemos obtener estimadores insesgados y consistentes para β,


en base a las regresiones (2) y (3). Sin embargo, si únicamente se hubiera dispuesto de
datos de corte transversal (T=1) para el primer caso ( zit = zi ), o datos de series

temporales (N=1) para el segundo ( zit = z t ), tales transformaciones no se podrían haber

llevado a cabo. En consecuencia, no se podrían obtener estimadores consistentes de β a


no ser que se contara con instrumentos que estuvieran correlacionados con z, pero
incorrelados con x y ε.

Existen numerosas aplicaciones que permiten ilustrar este punto. Utilicemos, por
ejemplo, el trabajo de Baltagi y Levin (1992) en el que se estima la demanda de tabaco
en Estados Unidos de 46 estados durante 25 años. Concretamente, se modeliza el
consumo como una función de la renta, los precios y el consumo retardado. Estas
variables varían entre estados y en el tiempo. Sin embargo, hay muchas otras variables
que pueden ser invariantes en el tiempo o entre estados y pueden afectar al consumo.
Ejemplos de las primeras (invariantes en el tiempo) serían la religión o la educación.
Entre las segundas podría citarse la publicidad sobre radio o televisión que,
normalmente, relaciona negativamente el consumo de tabaco con la salud. La
7

información referente a dichas variables es difícil de obtener y, en consecuencia, su


omisión conlleva problemas de sesgos en las estimaciones, a no ser que se explote la
naturaleza de los datos panel para eliminar sus efectos.

6) Finalmente, los datos de panel se recogen a nivel de micro-unidades como


individuos, empresas u hogares (familias), eliminándose los sesgos causados
principalmente por la agregación de individuos, empresas o productos (Blundell, 1988,
Klevmarken, 1989 y; Blundell y Meghir, 1990).

Entre las limitaciones de los datos de panel hay que destacar las siguientes:

i) Problemas asociados al diseño y recogida de la información. Kasprzyk y otros


(1989) ofrecen una extensa discusión sobre esta problemática. En cualquier caso, entre
estos problemas podemos citar la posible no representatividad de la muestra elegida, las
posibles no respuestas por falta de cooperación de los entrevistados, el que el
entrevistado no recuerde con exactitud su comportamiento, etc. (Bailar, 1989).

ii) Distorsiones debidas a errores de medida. Kalton y otros (1989) indican que
los errores de medida surgen a causa de respuestas falsas que, por su parte, son fruto de
respuestas ambiguas, errores de memoria, mentiras deliberadas de los encuestados
(sesgo de prestigio) o bien debidos a los sesgos que puede introducir el propio
encuestador.

iii) Una tercera limitación hace referencia a los posibles problemas de selección.
En ocasiones, es el propio investigador el que establece una especie de autoselección,
por ejemplo cuando sólo estamos interesados en aquellos que consumen por encima de
un determinado nivel, con lo que artificialmente estamos truncando la muestra con los
consiguientes problemas que eso puede traer consigo (Hausman y Wise, 1979). Otro
problema asociado con la selección hace referencia a la posible no respuesta debido a
que el encuestado rechaza participar o no está en casa, etc, aunque esto sólo ocurre en la
etapa inicial de la recogida de datos. Finalmente, destacamos el problema de lo que se
8

denomina “atrición” que, en cierto modo, también se puede catalogar como no respuesta
pero una vez que el panel está en funcionamiento. De las personas que originalmente
participan algunos pueden renunciar voluntariamente o bien se desplazan del lugar, o
bien mueren. En estas ocasiones, suelen sustituirse por personas de similares
características. Björklund (1989) y Ridder (1990, 1992) proporcionan una descripción
detallada de las consecuencias de la atrición.

iv) Finalmente, la última limitación hace referencia a que en la mayoría de los


casos la dimensión temporal del panel es generalmente reducida. Ello hace que la mayor
parte de los argumentos asintóticos utilizados en los procedimientos de estimación e
inferencia recaigan casi exclusivamente en el número de individuos encuestados. En la
mayor parte de los casos, la reducida dimensión temporal de los paneles tienen mucho
que ver con el coste de obtención de los datos. Además, incrementar la dimensión
temporal puede aumentar también los problemas de atrición que acabamos de
mencionar.

Un concepto importante en el contexto de datos de panel es lo que se denomina


heterogeneidad y, asociada a ella, sesgo de heterogeneidad. Como en todo tipo de
modelizaciones, un modelo de datos de panel pretende explicar una variable a través de
las variables más importantes, excluyendo ciertas variables cuyo impacto es menos
significativo o peculiar de ciertos individuos. En estas circunstancias, la suposición
típica de que una variable económica y es generada por una función de distribución
probabilística P(y|θ), donde θ es un vector real idéntico para todos los individuos y
períodos puede no ser realista. Es decir, el ignorar efectos específicos de individuos y
tiempo que existen entre las unidades de tiempo o del corte transversal, y que no se
capturan con las variables incluidas en el modelo, puede conducirnos a la presencia de
heterogeneidad de los parámetros del modelo especificado. Es decir, la estimación del
modelo general, sobre la base del total de las NT observaciones:

yit = α + xit' β + ε it i = 1,..., N ; t = 1,..., T (4)

puede conducir a importantes sesgos de heterogeneidad si, por el contrario, es


conveniente diferenciar los parámetros en el tiempo o entre individuos.
9

En general, se pueden distinguir las siguientes formulaciones:

1) Los coeficientes de las pendientes son constantes, pero el término


independiente varía entre individuos:
y it = α i + xit' β + ε it i = 1,..., N ; t = 1,..., T (5)

Esta formulación dará lugar a los modelos de componentes de error en una


dirección.

2) Los coeficientes de las pendientes son constantes, pero el término


independiente varía entre individuos y tiempo:
yit = α it + xit' β + ε it i = 1,..., N ; t = 1,..., T (6)

Esta formulación dará lugar a los modelos de componentes de error en dos


direcciones.

3) Todos los coeficientes varían entre individuos:


yit = α i + xit' β i + ε it i = 1,..., N ; t = 1,..., T (7)

4) Todos los coeficientes varían entre individuos y tiempo:


yit = α it + xit' β it + ε it i = 1,..., N ; t = 1,..., T (8)

En todos los casos, se asume que el término de perturbación ε it cumple las


hipótesis básicas; es decir, se supone distribuido de forma idéntica e independiente
sobre individuos y sobre el tiempo, con media 0 y varianza σ ε2 .

Ilustremos con los siguientes gráficos los posibles sesgos al estimar el modelo
(4) (con parámetros homogéneos), cuando lo correcto habría sido especificar, por
10

ejemplo, el modelo (5) (pendientes constantes y diferentes términos independientes),


suponiendo que consideramos una única variable explicativa:

y y

x x

Donde cada elipse representa la nube de puntos para un individuo en el tiempo y,


la línea recta que la atraviesa representan la regresión individual. Por otro lado, la línea
más gruesa representa la línea de regresión correspondiente al modelo (4).

Sin embargo entre los modelos 5-8, son los dos primeros los que generalmente
son utilizados en el marco de datos de panel. Es decir, lo habitual es incorporar
heterogeneidad a través del término independiente. En consecuencia, el efecto de un
cambio en las variables explicativas es el mismo para todos los individuos y períodos,
11

pero el nivel medio puede variar entre individuos (en 5) o entre individuos y tiempo (en
6).

Como ya se ha indicado, el supuesto básico de estos modelos radica en el hecho


de que el efecto de todas las variables omitidas se recoge a través de tres tipos de
variables:

1. Variables idénticas a lo largo del tiempo para cada individuo, pero que
varían entre individuos. Por ejemplo, los atributos de la dirección de una
empresa, la habilidad, el sexo así como muchas otras variables
sociodemográficas.

2. Variables idénticas para todos los individuos en un período de tiempo, pero


que varían en el tiempo. Dentro de ellas, se podrían considerar variables tales
como los precios, el tipo de interés o el ambiente de pesimismo u optimismo
de una economía en un momento del tiempo.

3. Variables que varían tanto entre individuos como en el tiempo. Algunos


ejemplos podrían ser los beneficios de una empresa, las ventas o el stock de
capital.

Las cuales se pueden ver reflejadas a través del término independiente variable
del modelo especificado.

Concluiremos esta sección mostrando la especificación propuesta por Hoch


(1962) para estimar una función de producción con datos de panel. Se parte de la típica
función de producción de tipo Cobb-Douglas: yit = μ + β1 x1it + ... + β k xkit + vit , donde y
es el logaritmo del output y x1, ...,xk son los logaritmos de los inputs. A continuación, se
trata de solventar la crítica habitual relativa al hecho de haber ignorado variables que
reflejan diferencias en las estrategias de dirección de las empresas, diferencias en
tecnología, etc., así como otro tipo de variables que afectan a la productividad de todas
12

las empresas pero que fluctúan en el tiempo. En consecuencia, se deberían introducir


dichas variables que podemos denotar, respectivamente, como Mi y Pt en el modelo (9),
obteniendo:

yit = μ + β1 x1it + ... + β k xkit + αM i + λPt + ε it (9)

Sin embargo, dado que las variables definidas como Mi y Pt son habitualmente
no observadas, su efecto se traduce en un término independiente que varía entre
empresas y/o tiempo tal y como se definió en las ecuaciones (5) y (6). De esta forma, se
demuestra en el trabajo mencionado que teniendo en cuenta la heterogeneidad entre
empresas y periodos se mejora la especificación del modelo, dado que se reduce o se
evita el sesgo por omisión de variables relevantes.

Por último, cabe mencionar que los efectos específicos de los individuos y/o del
tiempo recogidos en α i o α it en las ecuaciones (5) y (6), pueden tratarse como fijos o
como aleatorios, dando lugar a dos tipos diferentes de modelos:

• Si se les trata como parámetros desconocidos fijos, se obtiene el modelo de


efectos fijos.
• Si por el contrario, asumimos que, aunque tales términos independientes
difieren entre individuos y/o tiempo, puede considerarse que proceden de una
distribución de media μ y varianza σ α2 , se obtiene el modelo de efectos

aleatorios, donde los efectos individuales α i o α it son tratados como


aleatorios.

El enfoque de efectos fijos está condicionado a los valores de α i o α it ; es


decir, la distribución de la variable endógena se condiciona al valor de dichos
parámetros, los cuales pueden estimarse. Por el contrario, el enfoque de efectos
aleatorios no está condicionado a los valores individuales α i o α it sino que los integra.
En términos formales:
13

{ }
¾ Efectos fijos: E yit xit α i = xit' β + α i o { }
E yit xit α it = xit' β + α it (10)

{
¾ Efectos aleatorios: E yit xit = xit' β }

Por este motivo los modelos de efectos fijos se obtienen en base al enfoque
condicional del modelo, mientras que los modelos de efectos aleatorios en base al
enfoque incondicional. Además, como ya se ha mencionado para ambos modelos (de
efectos fijos y aleatorios) se habla de modelos de componentes del error en una
dirección (one-way) cuando se incorpora el término α i (ecuación 5, solo variación entre
individuos), mientras que se habla de modelos de componentes del error en dos
direcciones (two-way) cuando se incorpora el término α it (ecuación 6, variación entre
individuos y tiempo). A continuación, procederemos a su definición.

2. ENFOQUE CONDICIONAL: EL ESTIMADOR INTRAGRUPO

El modelo de efectos fijos es simplemente un modelo de regresión lineal cuyos


términos independientes varían entre individuos y/o tiempo. Consideraremos en primer
lugar, el modelo (5) que incorpora, únicamente, la variación entre individuos, y que
recibe el nombre de modelo de componente del error en una dirección, dedicando un
segundo epígrafe más breve al modelo (6) o modelo de componente del error en dos
direcciones.

2.2 MODELO DE COMPONENTE DEL ERROR EN UNA DIRECCIÓN

Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresión


lineal cuyos términos independientes varían entre individuos:

y it = α i + xit' β + ε it ε it ~ IID(0, σ ε2 ) (11)


14

donde xit es un vector de variables explicativas de dimensión K (es decir, recoge la

observación it de las K variables explicativas consideradas), que se asumen


independientes de ε it ; y donde α i recoge el efecto de aquellas variables propias del

individuo i que permanecen constantes en el tiempo y, que muy probablemente se


encuentran correlacionadas con las variables incluidas en xit .

En notación matricial:

⎡ y1 ⎤ ⎡ιT ⎤ ⎡0⎤ ⎡0⎤ ⎡ x1 ⎤ ⎡ ε1 ⎤


⎢ y2 ⎥ ⎢ 0 ⎥ ⎢ιT ⎥ ⎢0⎥ ⎢ x2 ⎥ ⎢ε 2 ⎥
⎢ ⎥ ⎢ ⎥ ⎢. ⎥ ⎢. ⎥ ⎢ ⎥ ⎢ ⎥
⎢ . ⎥ = ⎢ . ⎥ α1 + ⎢ ⎥α 2 + ... + ⎢ ⎥α N + ⎢ . ⎥ β + ⎢ . ⎥ (12)
⎢ . ⎥ ⎢.⎥ ⎢.⎥ ⎢.⎥ ⎢ . ⎥ ⎢ . ⎥
⎢y ⎥ ⎢0 ⎥ ⎢⎣ 0 ⎥⎦ ⎢⎣ιT ⎥⎦ ⎢ ⎥ ⎢ε ⎥
⎣ N⎦ ⎣ ⎦ ⎣ xN ⎦ ⎣ N⎦

siendo:

⎡ yi1 ⎤
⎢ . ⎥
⎢ ⎥
yi =⎢ . ⎥ ιT ' = (1, 1,..., 1)
⎢ . ⎥; (1xT )
⎢y ⎥
⎣ iT ⎦
(T x 1)

⎡ xi'1 ⎤ ⎡ x1i1 x2i1 ... x Ki1 ⎤ ⎡ β1 ⎤


⎢ ' ⎥ ⎢ ⎥ ⎢β ⎥
⎢ xi 2 ⎥ ⎢ x1i 2 x2i 2 ... x Ki 2 ⎥ ⎢ 2⎥
⎢ . ⎥ ⎢ . ⎥
= ⎢⎢ ⎥⎥
.
xi =⎢ ⎥=⎢ ⎥; β
. . .
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ . ⎥ ⎢ . ⎥ ⎢ . ⎥
⎢x' ⎥ ⎢x ... x KiT ⎥⎦ ⎢⎣ β K ⎥⎦
⎣ iT ⎦ ⎣ 1iT x2iT
(T x K ) (Kx1)
15

ε i ' = (ε i1 , ε i 2, ..., ε iT , )
(1xT )

[ ]
con E ε i = 0 , [ ]
E ε i ε i = σ ε2 I T
'
y [ ]
E ε i ε j = 0 si i ≠ j
'

siendo I T la matriz identidad de orden T (T x T).

Es decir, cada ecuación i-ésima, es de la forma:

yi = ιT α i + xi β + ε i i=1,...,N

Esto puede escribirse en el marco del modelo de regresión tradicional mediante


la inclusión de una variable ficticia para cada unidad i en el modelo:
N
y it = ∑ α j d ij + xit' β + ε it (13)
j =1

donde d ij = 1 si i = j y 0, en otro caso. Es decir, se incluyen N variables ficticias en el

modelo, tantas como individuos. Los parámetros α1 ,...,α N y β pueden estimarse por

mínimos cuadrados ordinarios, a partir de (13). A los estimadores β así obtenidos se


les denomina estimador de variable ficticia de mínimos cuadrados.

Sin embargo, dado que normalmente N (la dimensión transversal) es elevada, la


regresión resultante (13) está constituida por un número muy elevado de regresores, lo
cual resulta poco atractivo. No obstante, afortunadamente los estimadores contenidos en
β pueden obtenerse de forma más sencilla, efectuando una regresión sobre las variables
obtenidas como desviaciones respecto a las medias individuales. Básicamente, esto
equivale a una transformación de los datos que implica la eliminación de los efectos
individuales α i . Para analizar este punto, a partir de las medias temporales de cada
variable se define el modelo:

yi = αi + xi β + ε i
'
(14)
16

T T T

∑ yit ∑ xit ∑ε it
donde y i = t =1
, xi = t =1
y εi = t =1
.
T T T

Restando miembro a miembro las expresiones (5) y (14), se obtiene:

yit − y i = (xit − x i ) β + (ε it − ε i )
'
(15)

A este modelo se le denomina trasformación intragrupos. A los estimadores


MCO para β , obtenidos a partir de este modelo transformado en desviaciones con
respecto a las medias individuales se les denomina estimadores intragrupos o
estimadores de efectos fijos (Fixed effect estimators, FE) y, como ya hemos comentado
son idénticos a los obtenidos a partir del estimador de variables ficticias mínimo
cuadrático. Estos estimadores, por tanto, se calculan a partir de la siguiente expresión:
−1
⎛ N T '⎞
= ⎜ ∑∑ (xit − x i )(xit − x i ) ⎟ ∑∑ (x − x i )( yit − y i )
^ N T
β FE it (16)
⎝ i =1 t =1 ⎠ i =1 t =1

El procedimiento anterior es equivalente a premultiplicar la ecuación i-ésima:

yi = ιT α i + xi β + ε i (17)

1
por una matriz Q de orden (T x T), simétrica e idempotente: Q = I T − ιT ιT' :
T

Q yi = QιT α i + Q xi β + Qε i = Q xi β + Qε i (18)

matriz, que aplicada a cualquier vector, lo transforma en desviaciones con respecto a su


media (y, aplicado a una matriz, transforma sus columnas en desviaciones con respecto
a su media). De esta forma, se elimina el término α i constante en el tiempo,
eliminándose, de esta forma el problema relativo a su probable correlación con las
variables incluidas en xit . Por ejemplo:
17

⎡ yi1 − yi ⎤
⎢ . ⎥
⎢ ⎥
Q yi = ⎢ . ⎥ y de forma análoga para Q xi y Qε i .
⎢ . ⎥
⎢ ⎥
⎣ yiT − yi ⎦

Haciendo uso de la nomenclatura anterior, el estimador de efectos fijos que se


obtiene al aplicar MCO al modelo transformado es igual a:
−1
^ ⎛ N ⎞ N
β FE = ⎜⎜ ∑ x i' Q x i ⎟⎟ ∑x '
i Q yi (18)
⎝ i =1 ⎠ i =1

Expresión equivalente a la recogida en (16)3.

En consecuencia, a partir de lo indicado, puede comprobarse como el modelo de


efectos fijos se concentra en las diferencias existentes “dentro” de los individuos. Es
decir, se explica hasta qué punto yit se diferencia de la media temporal de esa variable,

yi y, por tanto, no explica porque yi es diferente de y j .

Si se asume que todas las variables contenidas en xit son independientes de

todos los términos ε it , los estimadores de efectos fijos son estimadores insesgados de

β . Si además se impone normalidad para los términos de perturbación ε it , los


^
estimadores de efectos fijos, β EF , también siguen una distribución normal, por lo que
puede utilizarse los procedimientos de inferencia habituales. Para consistencia se
requiere:

E{(xit − x i )ε it } = 0 (19)

3
Este tipo de estimador es también equivalente al que se obtiene al transformar el modelo en primeras
diferencias y después aplicar MCG para corregir el esquema de correlación tipo MA generado en dicha
transformación.
18

La condición suficiente para que lo anterior sea cierto es que xit sea
estrictamente exógena, lo cual equivale a que:

E{xit ε is } = 0 para ∀ s, t (20)

es decir, que las variables explicativas no dependan ni de valores presentes, ni pasados


ni futuros del término de error.

Esta condición puede resultar muy restrictiva en algunas aplicaciones. Por


ejemplo, excluye la inclusión, como explicativa, de la variable endógena retardada así
como la inclusión de cualquier variable que dependa de la historia de la propia variable
endógena. Un ejemplo de esto último sería el caso de si para explicar la oferta laboral de
un individuo se desea incluir en el modelo los años de experiencia, los cuales dependen
de la propia historia laboral del individuo.

Además, en estas mismas circunstancias (variables explicativas estrictamente


exógenas), los N términos independientes se estiman de forma insesgada como:
^ ^
α i = y i − x i ' β FE i = 1,..., N (21)

si bien, tales estimadores sólo son consistentes cuando T → ∞ .

^
La matriz de varianzas y covarianzas para los estimadores de efectos fijos β FE ,

suponiendo que ε it se define de forma idéntica e independiente entre individuos y

tiempo, con varianza σ ε2 (es decir, hay homocedasticidad y no autocorrelación), viene


dada por:

−1 −1
⎧^ ⎫ ⎛ N T '⎞ ⎛ N ' ⎞
V ⎨ β FE ⎬ = σ ε2 ⎜ ∑∑ (xit − x i )(xit − x i ) ⎟ = σ ε2 ⎜⎜ ∑ xi Q xi ⎟⎟ (22)
⎩ ⎭ ⎝ i =1 t =1 ⎠ ⎝ i =1 ⎠
19

Una estimación consistente de σ ε2 se obtiene a partir de la suma de los

cuadrados de los residuos intragrupos dividido entre N (T −1) − K , es decir:

2
^ 2 1 N T
⎛ ^ ^

σε = ∑∑ − α − β FE ⎟ =
'
⎜ y x
N (T − 1) − K
it i it
i =1 t =1 ⎝ ⎠
2
(23)
⎛ ⎞
⎜ ( yit − y i ) − (xit − x i ) β FE ⎟
N T ^
1
= ∑∑
'

N (T − 1) − K i =1 t =1 ⎝ ⎠

Por último, se debe hacer notar que una formulación alternativa a (11) consiste
en introducir un término independiente medio μ :

yit = μ + α i + xit' β + ε it (24)

donde ahora μ y α i son constantes fijas, las cuales no son separadamente identificables
a no ser que se introduzcan restricciones adicionales. Lo habitual es introducir la
N
restricción ∑α
i =1
i = 0 . Entonces el efecto individual α i representa la desviación del

individuo i de la media común μ . El estimador del parámetro β es idéntico al ya


conocido. Los estimadores de μ y α i son, respectivamente:

^ ^ ^ ^ ^
μ = y − x ' β FE ; α i = y i − μ − x i ' β FE (25)

N T N T

∑∑ yit ∑∑ x it
donde y = i =1 t =1
y x = i =1 t =1

NT NT

2.2 MODELO DE COMPONENTE DEL ERROR EN DOS DIRECCIONES


20

Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresión


lineal cuyos términos independientes varían entre individuos y tiempo:

yit = α it + xit' β + ε it = α i + λt + xit' β + ε it (26)

En este caso, para obtener los estimadores de efectos fijos, se debe llevar a cabo
una transformación diferente de tal forma que desaparezcan tanto los efectos
individuales α i como los temporales λt . En este caso, los estimadores resultantes son
los que resultan de aplicar MCO a la siguiente ecuación de variables transformadas:

(y it )
− y i − y t + y = (xit − x i − x t + x ) β + (ε it − ε i − ε t + ε
'
) (27)

donde, como ya se ha definido con anterioridad:


T

∑y it
yi = t =1
es la media temporal;
T
N T

∑∑ y it
y = i =1 t =1
es la media total;
NT
N

∑y it
y yt = i =1
es la media por individuos.
N

Y ahora los estimadores de los efectos α i y λt vienen dados por:

α i = ( y i − y ) − (x i − x )' β EF
^ ^
(28)

λ t = ( y t − y ) − (x t − x )' β EF
^ ^
21

No obstante, para especificar este tipo de modelo se requiere que tanto T como N
sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles
(N elevado, pero T pequeño) este modelo es escasamente utilizado. En estos casos, lo
que se suele hacer es incorporar al modelo las correspondientes dummies temporales.

3. ENFOQUE INCONDICIONAL: EL ESTIMADOR GLS

Al igual que en el caso del modelo de efectos fijos consideraremos en primer


lugar, el modelo que incorpora, únicamente, la variación entre individuos (modelo de
componente del error en una dirección), dedicando un segundo epígrafe más breve al
modelo de componente del error en dos direcciones.

3.1 MODELO DE COMPONENTE DEL ERROR EN UNA DIRECCIÓN

Tal y como se ha comentado con anterioridad, en el modelo de efectos aleatorios


los efectos individuales α i son tratados como aleatorios y, además se distribuyen de
forma idéntica e independiente entre individuos, es decir:

yit = μ + xit' β + α i + ε it , ε it ~ IID(0, σ ε2 ) ; α i ~ IID(0,σ α2 ) (29)

donde μ denota al término independiente; α i + ε it es tratado como un término de error


compuesto de dos componentes: un componente específico individual (invariante en el
tiempo) y otro componente que varía entre individuos y en el tiempo y, que se supone
incorrelado temporalmente. Además, se asume que α i y ε it son independientes entre sí

e independientes de x js , para todo j y s .

Ó en términos matriciales: yi = ιT μ + xi β + ιT α i + ε i = xi+δ + vi (29’)

( )
siendo xi+ = (ιT , xi ); δ ' = μ , β ' ; vi' = (vi1 ,...viT ); y vit = α i + ε it
22

En consecuencia, teniendo en cuenta los anteriores supuestos, los estimadores


MCO de los parámetros μ y β ( δ ) en la ecuación (29’):

−1
^ ⎛ N ⎞ N
δ = ⎜⎜ ∑ xi+ ' xi + ⎟⎟ ∑x +'
i yi (30)
⎝ i =1 ⎠ i =1

son insesgados y consistentes.

Sin embargo, la estructura de componentes del error implica que el término de


error α i + ε it , presenta una forma particular de autocorrelación (a menos que σ α2 = 0 ).
En efecto, la matriz de varianzas y covarianzas del término de error para el individuo i,
vi = ιT α i + ε i , es igual a:

⎡σ α2 + σ ε2 σ α2 ... σ α2

⎢ ⎥
⎢ σα σα +σε σ α2
2 2 2

( ) ⎢
E vi vi' = Ω = σ ε2 I T + σ α2ι T ι T' = ⎢
.
.

⎥ (31)
⎢ ⎥
⎢ . ⎥
⎢ σ2 σ α2 2⎥
... σ α + σ ε ⎦
2
⎣ α

NOTA

Una forma muy cómoda de expresar la matriz anterior Ω es la siguiente:

ιT ιT' ιT ιT' ιT ιT'


Ω = σ ε2 I T + σ α2ιT ιT' = σ ε2 I T + Tσ α2 + σ ε2 − σ ε2 =
T T T
⎛ ιT ιT' ⎞ 2 ιT ιT
( )
'
= σ ε ⎜⎜ I T −
2
⎟ + Tσ α + σ ε
2

⎝ T ⎟⎠ T

⎛ ι ι' ⎞ ι ι'
ya que dadas las propiedades de ⎜⎜ I T − T T ⎟⎟ y T T se cumple que la potencia r de
⎝ T ⎠ T

dicha matriz es igual a:


23

En consecuencia, las desviaciones típicas estimadas por los procedimientos


habituales aplicado para MCO son incorrectas y, se debe de recurrir a estimadores
mínimo cuadráticos generalizados (Generalized Least Square, GLS) para obtener
estimadores más eficientes.

Como en casos análogos, se utiliza la inversa de la matriz Ω para derivar el


estimador GLS de los parámetros de la ecuación (29’):

−1
^ ⎛ N +⎞
N
δ GLS = ⎜⎜ ∑ xi+ ' Ω −1 xi ⎟⎟ ∑x +'
i Ω −1 yi (32)
⎝ i =1 ⎠ i =1

siendo:

1 ⎛ ιT ιT' ⎞ 1 ιT ιT'
Ω −1 = ⎜ I − ⎟ + =
σ ε2 ⎜⎝ T ⎟⎠ Tσ α2 + σ ε2 T
T

1 ⎡ ⎛ σ ε2 ⎞ ιT ιT' ⎤
= 2 ⎢ I T − ⎜⎜1 − 2 ⎟⎟ ⎥=
σ ε ⎣⎢ ⎝ σ ε + Tσ α
2
⎠ T ⎥⎦
1 ⎡⎛ 1 ⎞ 1 ⎤ 1 ⎡ 1 '⎤
= I − ιT ιT' ⎟ + ψ ιT ιT' ⎥ = 2
2 ⎢⎜ T ⎢⎣Q + ψ T ιT ιT ⎥⎦
σ ε ⎣⎝ T ⎠ T ⎦ σε

σ ε2
con ψ =
σ ε2 + Tσ α2

Por último, teniendo en cuenta que Q transforma los datos en desviaciones con
1 '
respecto a las medias individuales y que ιTιT toma medias individuales, el estimador
T
GLS para los parámetros del modelo pueden escribirse como (ver Hsiao, 2003):
−1
⎛ N '⎞
= ⎜ ∑ xi' Q xi + ψT ∑ (x i − x )(x i − x ) ⎟
^ N
β GLS
⎝ i =1 i =1 ⎠ (33)
⎛ N '⎞
.⎜ ∑ xi' Q yi + ψT ∑ (x i − x )( y i − y ) ⎟
N

⎝ i =1 i =1 ⎠
24

^ ^ '
μ GLS = y − β GLS x

A partir de la expresión anterior, se puede comprobar fácilmente como si ψ = 0


se obtiene el estimador de efectos fijos. Además, dado que ψ → 0 si T → ∞ , los
estimadores de efectos fijos y aleatorios son equivalentes para valores elevados de T .
Por otra parte, si ψ = 1 , el estimador GLS es simplemente el estimador MCO (y Ω es
diagonal).

Por último, destacar que a partir de la especificación anterior, puede derivarse la


siguiente expresión:

β GLS = Δ β B + (I K − Δ ) β FE
^ ^ ^
(34)

−1
⎛ ⎞
β B = ⎜ ∑ (x i − x )(x i − x ) ⎟ ∑ (x − x )( y i − y ) es el estimador entre grupos
^ N N
'
donde i
⎝ i =1 ⎠ i =1

(between estimator) de β . En otras palabras, este último estimador es el estimador


MCO en un modelo de medias individuales:

yi = μ + xi β + αi + ε i i = 1,2,..., N
'
(35)

y donde Δ es una matriz de ponderaciones, la cual es proporcional a la inversa de la


^
matriz de covarianzas de β B (ver Hsiao, 2003).

En otros términos, puede observarse como el estimador GLS se obtiene como


una media ponderada entre los estimadores “entre” y “dentro” de los grupos (between y
within group estimadores).

El estimador between ignora cualquier información existente dentro de los


individuos. Por tanto, el estimador GLS, bajos las suposiciones existentes, es la
25

combinación óptima entre los dos estimadores y, por tanto, es más eficiente que
cualquiera de ellos4. Concretamente, si las variables explicativas incluidas en (29) son
independientes de todos los términos ε it y α i , el estimador GLS es insesgado. Es un
estimador consistente si además de (19), también se cumple que:

E{x i ε it } = 0 y E{x iα i } = 0 (36)

(Observar que las condiciones anteriores son también el requisito para que sea
consistente el estimador between).

Una forma sencilla de calcular el estimador GLS consiste en estimar por MCO el
siguiente modelo transformado5:

⎡ y − ⎛ 1 − ψ 1 2 ⎞ y ⎤ = ⎡ μ ⎛ 1 − ⎛ 1 − ψ 12 ⎞ ⎞ ⎤ + ⎡ x − ⎛ 1 − ψ 1 2 ⎞ x ⎤ β + u
'

⎢⎣ it ⎜⎝ ⎟ i⎥ ⎢ ⎜ ⎜ ⎟ ⎟⎥ ⎢ it ⎜ ⎟ i⎥ (37)
⎠ ⎦ ⎣ ⎝ ⎝ ⎠ ⎠⎦ ⎣ ⎝ ⎠ ⎦ it

donde uit es un término de perturbación aleatorio que carece de autocorrelación. De


nuevo, observar que si ψ = 0 , se obtiene el estimador entre grupos o estimador within y
si ψ = 1 , el estimador MCO.

Finalmente, indicar que como es habitual los componentes de la varianza σ α2 y

σ ε2 son desconocidos en la práctica. En consecuencia, tras estimar dichos términos en


una primera etapa, se derivan, en una segunda etapa, los estimadores GLS factibles. El
estimador de σ ε2 se obtiene fácilmente a partir de los residuos de la regresión dentro de
grupos (within), tal y como se muestra en la expresión (23). Por último, un estimador

4
El estimador MCO (obtenido con ψ = 1 ) es también una combinación lineal de los dos estimadores,
pero no la eficiente.
−1 1
5
Lógicamente, a este modelo se llega obteniendo la matriz R, tal que Ω = R ' R , la cual es igual a
σε
2

1
− ⎛ ⎞
= ⎜ I T − ⎛⎜1 − ψ 2 ⎞⎟ ιTιT' ⎟ , y premultiplicando el modelo original (29’) por dicha matriz.
1 1
σεΩ 2

⎝ ⎝ ⎠T ⎠
26

consistente de σ α2 se obtiene teniendo en cuenta que la varianza del error de la regresión

1 2
entre grupos (between) es igual a σ α2 + σ ε , la cual puede estimarse consistentemente
T
como:
2
^ 2 1 N
⎛ ^ ^

σB = ∑ ⎜ yi − μ B − xi β B ⎟
'
(38)
N − (K + 1) i =1 ⎝ ⎠

^
donde μ B es el estimador between para μ . En consecuencia:

^ 2 ^ 2
1 ^2
σα =σ B− σε (39)
T

Al estimador GLS Factible (mínimo cuadrático generalizado factible) se le


conoce como estimadores de efectos aleatorios (random effects estimator) para β y μ
^
y, se denota como β RE .

Bajo ciertas condiciones de regularidad débil, el estimador de efectos aleatorios


es asintóticamente normal y, su matriz de varianzas y covarianzas viene dada por la
siguiente expresión:
−1
⎧^ ⎫ 2 ⎛ '⎞
V ⎨ β RE ⎬ = σ ε ⎜ ∑ xi Q xi + ψT ∑ (x i − x )(x i − x ) ⎟
N N
'
(40)
⎩ ⎭ ⎝ i =1 i =1 ⎠

que muestra como el estimador de efectos aleatorios es más eficiente que el de efectos
fijos si se cumple que ψ > 0 . La ganancia en eficiencia es debida a la utilización de la
variación entre grupos (x i − x ) .

En resumen, hasta el momento presente, hemos presentado una serie de


estimadores del vector de parámetros β . Los básicos son dos: el estimador entre
grupos (o between) y el estimador de efectos fijos (o within). Los otros dos estimadores
son el estimador MCO y el de efectos aleatorios. Ambos explotan las dos dimensiones
27

de los datos (between y within), pero mientras que el primero lo hace de forma
ineficiente, el segundo lo realiza de forma eficiente.

3.2 MODELO DE COMPONENTE DEL ERROR EN DOS DIRECCIONES

De forma análoga a lo comentado para el caso del modelo de efectos fijos, en


este caso se trata de incorporar los efectos temporales λt , pero también con la
característica de ser considerados de naturaleza aleatoria, distribuidos de forma idéntica
e independiente:

yit = μ + xit' β + α it + ε it = μ + xit' β + α i + λt + ε it


(41)

α i ~ IID(0,σ α2 ) ; λt ~ IID(0,σ λ2 ); ε it ~ IID(0, σ ε2 )

Además, igualmente se asume que α i , λt y ε it son independientes entre sí e

independientes de x js , para todo j y s .

A partir de aquí puede seguirse un proceso análogo al anterior, aunque más


complejo. (Vease Baltagi, 2001, por ejemplo). En cualquier caso, la estrategia más
sencilla es aplicar MCO al modelo original transformado mediante la premultiplicación
de las distintas variables por la correspondiente matriz R. Dicha transformación es la
siguiente (lo ilustro para la variable dependiente, sería análogo para el resto):

(
yit* = yit − θ 1 y i − θ 2 y t + θ 3 y ) (42)

σε σε
siendo θ1 = 1 − ; θ 2 = 1−
Tσ α2 + σ ε2 Nσ λ2 + σ ε2

σε
θ 3 = θ1 + θ 2 + −1
Tσ α + Nσ λ2 + σ ε2
2
28

Sin embargo, como ya se comentó con anterioridad, para especificar este tipo de
modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la
mayor parte se trabaja con micropaneles (N elevado, pero T pequeño) este modelo es
escasamente utilizado. Como se comentó con anterioridad, lo que se suele hacer es
incorporar al modelo las correspondientes dummies temporales.

4. ANÁLISIS DE ESPECIFICACIÓN

Tanto el modelo de efectos fijos como el de efectos aleatorios asumen que ε it es


incorrelado entre individuos y en el tiempo (no autocorrelación). Sin embargo, como en
el caso de los modelos de regresión conocidos, si tal supuesto no se cumple, aunque los
estimadores estándares siguen siendo consistentes, se invalida la inferencia realizada a
partir de los tradicionales contrastes. Además, los estimadores dejan de ser eficientes.
Además, de forma extensiva, la presencia de heteroscedasticidad en ε it (o, para los

modelos de efectos aleatorios en α i ) tiene efectos análogos. Como consecuencia de las


implicaciones señaladas es importante asegurarse de que nuestro modelo no presenta
ninguno de los dos problemas indicados, es decir, ni problema de autocorrelación ni de
heteroscedasticidad.

4.1 MODELO DE EFECTOS FIJOS

En el caso del modelo de efectos fijos, los contrastes son sencillos, dado que es
básicamente un modelo estimado por MCO. Un contraste bastante simple de
autocorrelación en el modelo de efectos fijos está basado en el contraste de Durbin-
Watson (DW). En consecuencia, se contrasta la hipótesis nula de no autocorrelación
29

frente a hipótesis alternativa que el término de perturbación para cada individuo sigue
un esquema AR(1), es decir:

ε it = ρε i ,t −1 + υ it (43)

donde υ it se encuentra idéntica e independientemente distribuido entre individuos y


tiempo.

En consecuencia, se contrasta autocorrelación en el tiempo con la restricción de


que todos los individuos tienen el mismo coeficiente de autocorrelación ρ .
Lógicamente, la hipótesis nula se plantea como H 0 : ρ = 0 , frente a la alternativa de una

cola ρ < 0 o ρ > 0 .

La generalización del estadístico de Durbin-Watson al caso que nos ocupa fue


propuesta por Bhargava, Franzini y Narendranathan (1982) y, sigue la siguiente
expresión:
2
⎛^ ⎞
N T ^
∑∑ ⎜ ε it − ε i ,t −1 ⎟

dw p = i =1 t =2 N⎝ T ^ ⎠ (44)
∑∑ ε
2
it
i =1 t =1

^
donde ε it son los residuos de la regresión within.

En este caso, los anteriores autores también derivaron los puntos críticos que,
lógicamente, ahora dependen de los valores de N , T y K . Además, al contrario que en
el caso de series temporales, las zonas de indeterminación para el estadístico de DW
para datos de panel son muy pequeñas, particularmente cuando el número de individuos
en el panel es elevado.
30

De forma análoga, para contrastar heteroscedasticidad en el término de


^
perturbación ε it , se puede utilizar también la serie de residuos de efectos fijos ε it para
calcular el contraste de tipo de multiplicadores de Lagrange desarrollado por Breusch-
Pagan. Lógicamente, se contrasta la hipótesis nula de homocedasticidad frente a la
alternativa de que

V {ε it } = σ 2 h zit' α( ) (45)

donde h es una función continuamente diferenciable, desconocida y, que al evaluarla en


0 se obtiene la unidad, h(0 ) = 1 . Este último requisito permite que la hipótesis nula se
plantee como H 0 : α = 0 .

El estadístico de prueba se construye a partir de los resultados de la estimación


de una regresión auxiliar que regresa el cuadrado de los residuos de la estimación de
^
efectos fijos (o residuos within), ε it , sobre una constante y sobre las J variables zit
2

que consideramos que pueden estar generando el problema de heteroscedasticidad. Bajo


la hipótesis nula, el estadístico de Breusch-Pagan se calcula como N (T − 1) veces el R 2
de la anterior regresión auxiliar y, se distribuye asintóticamente como una distribución
χ 2 con J grados de libertad.

No obstante, para este tipo de modelos (modelos de efectos fijos), una estrategia
muy utilizada consiste en utilizar la propuesta de Arellano (1987) consistente en utilizar
la corrección de White que permite obtener una estimación de la matriz de varianzas y
covarianzas asintótica de los estimadores within-groups robusta tanto ante problemas de
heteroscedasticidad y correlación serial de cualquier tipo, para valores fijos de T y N
grande (caso más habitual) que viene dada por la siguiente expresión:

−1 −1
⎧^ ⎫ ⎛ N ⎞ ⎛ N ' ⎞
^ N ^ ^
V ⎨ β EF ⎬ = ⎜⎜ ∑ xi' Q xi ⎟⎟ ∑ ε ε i ⎜ ∑ x i Q xi ⎟
⎜ ⎟
' '
x
i Q i i Q x (43)
⎩ ⎭ ⎝ i =1 ⎠ i =1 ⎝ i =1 ⎠
31

^ ^
donde ε i = Q yi − Q xi β FE son los residuos del modelo within estimado.

No obstante, si uno desea realizar supuestos acerca de ciertas formas de


heterocedasticidad o autocorrelación, es posible derivar estimadores más eficientes
explotando la estructura de covarianzas del error a través del estimador MCGF,
exactamente igual que en los modelos conocidos.

4.2 MODELO DE EFECTOS ALEATORIOS

La mayoría de los contrastes que permiten contrastar los supuestos de


homocedasticidad y no autocorrelación en el marco de modelos de efectos aleatorios
son complicados de realizar. No obstante, como el estimador de efectos fijos es
consistente incluso cuando realizamos el supuesto de que α i se encuentra idéntica e
independientemente distribuido y es independiente de las variables explicativas, los
contrastes para el modelo de efectos fijos pueden ser también utilizados en el caso de
los modelos de efectos aleatorios.

No obstante, la solución en estos casos viene por la estimación por MCGF tras
haber adoptado una forma específica para la matriz de varianzas y covarianzas. Veamos
los casos más generales.

Con respecto a la heterocedasticidad, en estos modelos puede aparecer porque la


varianza de α i varía con i (en consecuencia hemos de hablar de σ α2 i en vez de σ α2 ) o

porque la varianza de ε it varía con i (en consecuencia hemos de hablar de σ ε2i en vez de

σ ε2 ) o ambos a la vez. En consecuencia la matriz de varianzas y covarianzas del término


de perturbación es ahora:
32

( )
E vi vi' = σ ε2i I T + σ α2i ιT ιT' = Ω i (44)

−1
Y la matriz inversa, Ω i , sigue la expresión (32), sin mas que sustituir σ α2 y σ ε2

por σ α2 i y σ ε2i , respectivamente. Igualmente, el estimador GLS de δ se obtiene al


−1
sustituir Ω −1 por Ω i , en dicha ecuación. Lógicamente, reemplazando σ α2i y σ ε2 i

(valores desconocidos) por sus estimaciones, se obtiene el estimador GLS Factible, o en


dos etapas.

La estimación de σ ε2i puede efectuarse a partir de la estimación de la estimación


^
within. La varianza total puede estimarse a través de los residuos MCO vit :
2

1 T ⎛⎜ ^ ^ ⎞⎟

^ 2
σ vi = ∑ vit − vi ⎟⎟ obtenidos a partir de la estimación (30). A partir de aquí, se
T − 1 t =1 ⎜⎜
⎝ ⎠
^ 2 ^ 2 ^ 2
puede obtener la estimación para σ α2 i como: σ α i = σ vi − σ ε i .

En el caso de autocorrelación se procede de forma análoga. Tomaremos un


esquema de autorrelación tipo AR(1) como ejemplo. Es decir, supongamos que en el
modelo de efectos aleatorios en una dirección expresado en (29):

yit = μ + xit' β + α i + ε it , ε it ~ IID(0, σ ε2 ) ; α i ~ IID(0,σ α2 ) (45)

Ó en términos matriciales:

yi = ιT μ + xi β + ιT α i + ε i = xi+δ + vi (46)

el término de perturbación ε it deja de ser independiente y sigue el siguiente proceso


AR(1):
33

ε it = ρε it −1 + uit (47)

donde uit se distribuye de forma idéntica e independiente con media cero y varianza

σ 2u .

La estimación de dicho modelo por MCG se basa en idénticos supuestos que los
de cualquier otro tipo de especificación que presenta un problema de autocorrelación
AR(1). Teniendo en cuenta que el modelo transformado mediante la expresión:

( )
yit − ρ yit −1 = μ (1 − ρ ) + xit − ρ xit −1 β + (1 − ρ )α i + uit
'
(48)

presenta una perturbación ruido blanco, se puede efectuar un procedimiento iterativo del
tipo propuesto por Cochrane-Orcutt consistente, como se recordará, básicamente en lo
siguiente. La primera etapa comienza con la estimación de ρ utilizando la ecuación
(47) y los residuos de la regresión within. A continuación, se estima por MCO la
regresión (48) resultante tras utilizar el valor de ρ estimado, obteniendo un vector
inicial de estimadores. En una segunda etapa, se obtienen unos nuevos residuos within,
a partir de tales estimadores, con los que se repite el proceso. Así sucesivamente, hasta
que se alcance la convergencia.

También podría gustarte