Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Licenciatura: ECONOMICAS
TEMA 4:
Indice
1- Introducción.
2- Fuentes de heterogeneidad en conjuntos de datos panel.
3- Estimación en modelos de datos panel estáticos.
4- Contrastes de especificación en modelos de datos panel estáticos.
5- Efectos espaciales en modelos de datos panel.
3
1. INTRODUCCIÓN
libertad y, por tanto, mayor eficiencia. En efecto, la utilización de datos de panel, como ya
hemos comentado, permite utilizar un conjunto de datos más informativos, en el sentido de
que es capaz de recoger con mayor precisión la variabilidad en los datos, tanto la existente
entre individuos como la que existe a lo largo del tiempo.
3) A diferencia de los datos de corte transversal, una ventaja adicional de los datos
de panel radica en la posible modelización de efectos dinámicos. Por ejemplo, en los datos
de corte transversal podemos determinar qué porcentaje de la población consume un
determinado producto en un determinado momento. La utilización de datos de panel
permite analizar qué porcentaje de personas que consumían un producto siguen haciéndolo
y quienes han dejado de consumirlo. Un ejemplo de esto que acabamos de mencionar
referido al desempleo puede encontrarse en Ashenfelter (1978) y Ashenfelter y Solon
(1982).
4) Otra de las ventajas atribuidas a los datos de panel con respecto a los datos de
corte transversal es la gran capacidad que ofrecen al investigador de construir y
contrastar complicados modelos de comportamiento. De hecho, el análisis y la
modelización de la eficiencia técnica resulta más interesante realizarla utilizando datos
de panel (Baltagi y Griffin, 1988b; Cornwell y otros, 1990; y Kumbhakar, 1990, 1991,
1992, 1993). Además, es necesario introducir menos restricciones a la hora de estimar
modelos de retardos distribuidos usando datos de panel, en relación con los que son
necesarios cuando se utilizan datos de series temporales (Hsiao, 1986).
5
5) Por otra parte, los datos de panel permiten resolver o reducir la magnitud de
un problema econométrico muy importante que, a menudo aparece en los estudios
empíricos. Nos referimos a la presencia de variables omitidas (inobservadas u
observadas con error) que están correlacionadas con las variables explicativas del
modelo. Por ejemplo, consideremos el siguiente modelo de regresión:
donde dada la naturaleza de los datos, utilizaremos dos tipos de subíndices: i para los
individuos1 ( i = 1,..., N ) y t para el período temporal ( t = 1,..., T ) y donde xit y zit son
variables incluidas en zit son inobservables, y que además la covarianza entre xit y zit
no es cero, (es decir, están correlacionadas con xit ), entonces los estimadores MCO
1
Utilizaremos el término individuos para referirnos a las unidades de corte transversal. Como se ha
comentado con anterioridad, también puede tratarse de empresas, hogares, países, etc.
2
Siempre que se omiten variables relevantes se incurre en un problema de sesgadez de los parámetros
incluidos salvo que las variables incluidas y las omitidas sean ortogonales.
6
( )
yit − yi ,t −1 = xit − xi ,t −1 β + (ε it − ε i ,t −1 )
'
i = 1,..., N ; t = 1,..., T (2)
N N N
∑ yit ∑ xit ∑ε it
donde y t = i =1
, xt = i =1
y εt = i =1
.
N N N
Existen numerosas aplicaciones que permiten ilustrar este punto. Utilicemos, por
ejemplo, el trabajo de Baltagi y Levin (1992) en el que se estima la demanda de tabaco
en Estados Unidos de 46 estados durante 25 años. Concretamente, se modeliza el
consumo como una función de la renta, los precios y el consumo retardado. Estas
variables varían entre estados y en el tiempo. Sin embargo, hay muchas otras variables
que pueden ser invariantes en el tiempo o entre estados y pueden afectar al consumo.
Ejemplos de las primeras (invariantes en el tiempo) serían la religión o la educación.
Entre las segundas podría citarse la publicidad sobre radio o televisión que,
normalmente, relaciona negativamente el consumo de tabaco con la salud. La
7
Entre las limitaciones de los datos de panel hay que destacar las siguientes:
ii) Distorsiones debidas a errores de medida. Kalton y otros (1989) indican que
los errores de medida surgen a causa de respuestas falsas que, por su parte, son fruto de
respuestas ambiguas, errores de memoria, mentiras deliberadas de los encuestados
(sesgo de prestigio) o bien debidos a los sesgos que puede introducir el propio
encuestador.
iii) Una tercera limitación hace referencia a los posibles problemas de selección.
En ocasiones, es el propio investigador el que establece una especie de autoselección,
por ejemplo cuando sólo estamos interesados en aquellos que consumen por encima de
un determinado nivel, con lo que artificialmente estamos truncando la muestra con los
consiguientes problemas que eso puede traer consigo (Hausman y Wise, 1979). Otro
problema asociado con la selección hace referencia a la posible no respuesta debido a
que el encuestado rechaza participar o no está en casa, etc, aunque esto sólo ocurre en la
etapa inicial de la recogida de datos. Finalmente, destacamos el problema de lo que se
8
denomina “atrición” que, en cierto modo, también se puede catalogar como no respuesta
pero una vez que el panel está en funcionamiento. De las personas que originalmente
participan algunos pueden renunciar voluntariamente o bien se desplazan del lugar, o
bien mueren. En estas ocasiones, suelen sustituirse por personas de similares
características. Björklund (1989) y Ridder (1990, 1992) proporcionan una descripción
detallada de las consecuencias de la atrición.
Ilustremos con los siguientes gráficos los posibles sesgos al estimar el modelo
(4) (con parámetros homogéneos), cuando lo correcto habría sido especificar, por
10
y y
x x
Sin embargo entre los modelos 5-8, son los dos primeros los que generalmente
son utilizados en el marco de datos de panel. Es decir, lo habitual es incorporar
heterogeneidad a través del término independiente. En consecuencia, el efecto de un
cambio en las variables explicativas es el mismo para todos los individuos y períodos,
11
pero el nivel medio puede variar entre individuos (en 5) o entre individuos y tiempo (en
6).
1. Variables idénticas a lo largo del tiempo para cada individuo, pero que
varían entre individuos. Por ejemplo, los atributos de la dirección de una
empresa, la habilidad, el sexo así como muchas otras variables
sociodemográficas.
Las cuales se pueden ver reflejadas a través del término independiente variable
del modelo especificado.
Sin embargo, dado que las variables definidas como Mi y Pt son habitualmente
no observadas, su efecto se traduce en un término independiente que varía entre
empresas y/o tiempo tal y como se definió en las ecuaciones (5) y (6). De esta forma, se
demuestra en el trabajo mencionado que teniendo en cuenta la heterogeneidad entre
empresas y periodos se mejora la especificación del modelo, dado que se reduce o se
evita el sesgo por omisión de variables relevantes.
Por último, cabe mencionar que los efectos específicos de los individuos y/o del
tiempo recogidos en α i o α it en las ecuaciones (5) y (6), pueden tratarse como fijos o
como aleatorios, dando lugar a dos tipos diferentes de modelos:
{ }
¾ Efectos fijos: E yit xit α i = xit' β + α i o { }
E yit xit α it = xit' β + α it (10)
{
¾ Efectos aleatorios: E yit xit = xit' β }
Por este motivo los modelos de efectos fijos se obtienen en base al enfoque
condicional del modelo, mientras que los modelos de efectos aleatorios en base al
enfoque incondicional. Además, como ya se ha mencionado para ambos modelos (de
efectos fijos y aleatorios) se habla de modelos de componentes del error en una
dirección (one-way) cuando se incorpora el término α i (ecuación 5, solo variación entre
individuos), mientras que se habla de modelos de componentes del error en dos
direcciones (two-way) cuando se incorpora el término α it (ecuación 6, variación entre
individuos y tiempo). A continuación, procederemos a su definición.
En notación matricial:
siendo:
⎡ yi1 ⎤
⎢ . ⎥
⎢ ⎥
yi =⎢ . ⎥ ιT ' = (1, 1,..., 1)
⎢ . ⎥; (1xT )
⎢y ⎥
⎣ iT ⎦
(T x 1)
ε i ' = (ε i1 , ε i 2, ..., ε iT , )
(1xT )
[ ]
con E ε i = 0 , [ ]
E ε i ε i = σ ε2 I T
'
y [ ]
E ε i ε j = 0 si i ≠ j
'
yi = ιT α i + xi β + ε i i=1,...,N
modelo, tantas como individuos. Los parámetros α1 ,...,α N y β pueden estimarse por
yi = αi + xi β + ε i
'
(14)
16
T T T
∑ yit ∑ xit ∑ε it
donde y i = t =1
, xi = t =1
y εi = t =1
.
T T T
yit − y i = (xit − x i ) β + (ε it − ε i )
'
(15)
yi = ιT α i + xi β + ε i (17)
1
por una matriz Q de orden (T x T), simétrica e idempotente: Q = I T − ιT ιT' :
T
Q yi = QιT α i + Q xi β + Qε i = Q xi β + Qε i (18)
⎡ yi1 − yi ⎤
⎢ . ⎥
⎢ ⎥
Q yi = ⎢ . ⎥ y de forma análoga para Q xi y Qε i .
⎢ . ⎥
⎢ ⎥
⎣ yiT − yi ⎦
todos los términos ε it , los estimadores de efectos fijos son estimadores insesgados de
E{(xit − x i )ε it } = 0 (19)
3
Este tipo de estimador es también equivalente al que se obtiene al transformar el modelo en primeras
diferencias y después aplicar MCG para corregir el esquema de correlación tipo MA generado en dicha
transformación.
18
La condición suficiente para que lo anterior sea cierto es que xit sea
estrictamente exógena, lo cual equivale a que:
^
La matriz de varianzas y covarianzas para los estimadores de efectos fijos β FE ,
−1 −1
⎧^ ⎫ ⎛ N T '⎞ ⎛ N ' ⎞
V ⎨ β FE ⎬ = σ ε2 ⎜ ∑∑ (xit − x i )(xit − x i ) ⎟ = σ ε2 ⎜⎜ ∑ xi Q xi ⎟⎟ (22)
⎩ ⎭ ⎝ i =1 t =1 ⎠ ⎝ i =1 ⎠
19
2
^ 2 1 N T
⎛ ^ ^
⎞
σε = ∑∑ − α − β FE ⎟ =
'
⎜ y x
N (T − 1) − K
it i it
i =1 t =1 ⎝ ⎠
2
(23)
⎛ ⎞
⎜ ( yit − y i ) − (xit − x i ) β FE ⎟
N T ^
1
= ∑∑
'
N (T − 1) − K i =1 t =1 ⎝ ⎠
Por último, se debe hacer notar que una formulación alternativa a (11) consiste
en introducir un término independiente medio μ :
donde ahora μ y α i son constantes fijas, las cuales no son separadamente identificables
a no ser que se introduzcan restricciones adicionales. Lo habitual es introducir la
N
restricción ∑α
i =1
i = 0 . Entonces el efecto individual α i representa la desviación del
^ ^ ^ ^ ^
μ = y − x ' β FE ; α i = y i − μ − x i ' β FE (25)
N T N T
∑∑ yit ∑∑ x it
donde y = i =1 t =1
y x = i =1 t =1
NT NT
En este caso, para obtener los estimadores de efectos fijos, se debe llevar a cabo
una transformación diferente de tal forma que desaparezcan tanto los efectos
individuales α i como los temporales λt . En este caso, los estimadores resultantes son
los que resultan de aplicar MCO a la siguiente ecuación de variables transformadas:
(y it )
− y i − y t + y = (xit − x i − x t + x ) β + (ε it − ε i − ε t + ε
'
) (27)
∑y it
yi = t =1
es la media temporal;
T
N T
∑∑ y it
y = i =1 t =1
es la media total;
NT
N
∑y it
y yt = i =1
es la media por individuos.
N
α i = ( y i − y ) − (x i − x )' β EF
^ ^
(28)
λ t = ( y t − y ) − (x t − x )' β EF
^ ^
21
No obstante, para especificar este tipo de modelo se requiere que tanto T como N
sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles
(N elevado, pero T pequeño) este modelo es escasamente utilizado. En estos casos, lo
que se suele hacer es incorporar al modelo las correspondientes dummies temporales.
( )
siendo xi+ = (ιT , xi ); δ ' = μ , β ' ; vi' = (vi1 ,...viT ); y vit = α i + ε it
22
−1
^ ⎛ N ⎞ N
δ = ⎜⎜ ∑ xi+ ' xi + ⎟⎟ ∑x +'
i yi (30)
⎝ i =1 ⎠ i =1
⎡σ α2 + σ ε2 σ α2 ... σ α2
⎤
⎢ ⎥
⎢ σα σα +σε σ α2
2 2 2
⎥
( ) ⎢
E vi vi' = Ω = σ ε2 I T + σ α2ι T ι T' = ⎢
.
.
⎥
⎥ (31)
⎢ ⎥
⎢ . ⎥
⎢ σ2 σ α2 2⎥
... σ α + σ ε ⎦
2
⎣ α
NOTA
⎝ T ⎟⎠ T
⎛ ι ι' ⎞ ι ι'
ya que dadas las propiedades de ⎜⎜ I T − T T ⎟⎟ y T T se cumple que la potencia r de
⎝ T ⎠ T
−1
^ ⎛ N +⎞
N
δ GLS = ⎜⎜ ∑ xi+ ' Ω −1 xi ⎟⎟ ∑x +'
i Ω −1 yi (32)
⎝ i =1 ⎠ i =1
siendo:
1 ⎛ ιT ιT' ⎞ 1 ιT ιT'
Ω −1 = ⎜ I − ⎟ + =
σ ε2 ⎜⎝ T ⎟⎠ Tσ α2 + σ ε2 T
T
1 ⎡ ⎛ σ ε2 ⎞ ιT ιT' ⎤
= 2 ⎢ I T − ⎜⎜1 − 2 ⎟⎟ ⎥=
σ ε ⎣⎢ ⎝ σ ε + Tσ α
2
⎠ T ⎥⎦
1 ⎡⎛ 1 ⎞ 1 ⎤ 1 ⎡ 1 '⎤
= I − ιT ιT' ⎟ + ψ ιT ιT' ⎥ = 2
2 ⎢⎜ T ⎢⎣Q + ψ T ιT ιT ⎥⎦
σ ε ⎣⎝ T ⎠ T ⎦ σε
σ ε2
con ψ =
σ ε2 + Tσ α2
Por último, teniendo en cuenta que Q transforma los datos en desviaciones con
1 '
respecto a las medias individuales y que ιTιT toma medias individuales, el estimador
T
GLS para los parámetros del modelo pueden escribirse como (ver Hsiao, 2003):
−1
⎛ N '⎞
= ⎜ ∑ xi' Q xi + ψT ∑ (x i − x )(x i − x ) ⎟
^ N
β GLS
⎝ i =1 i =1 ⎠ (33)
⎛ N '⎞
.⎜ ∑ xi' Q yi + ψT ∑ (x i − x )( y i − y ) ⎟
N
⎝ i =1 i =1 ⎠
24
^ ^ '
μ GLS = y − β GLS x
β GLS = Δ β B + (I K − Δ ) β FE
^ ^ ^
(34)
−1
⎛ ⎞
β B = ⎜ ∑ (x i − x )(x i − x ) ⎟ ∑ (x − x )( y i − y ) es el estimador entre grupos
^ N N
'
donde i
⎝ i =1 ⎠ i =1
yi = μ + xi β + αi + ε i i = 1,2,..., N
'
(35)
combinación óptima entre los dos estimadores y, por tanto, es más eficiente que
cualquiera de ellos4. Concretamente, si las variables explicativas incluidas en (29) son
independientes de todos los términos ε it y α i , el estimador GLS es insesgado. Es un
estimador consistente si además de (19), también se cumple que:
(Observar que las condiciones anteriores son también el requisito para que sea
consistente el estimador between).
Una forma sencilla de calcular el estimador GLS consiste en estimar por MCO el
siguiente modelo transformado5:
⎡ y − ⎛ 1 − ψ 1 2 ⎞ y ⎤ = ⎡ μ ⎛ 1 − ⎛ 1 − ψ 12 ⎞ ⎞ ⎤ + ⎡ x − ⎛ 1 − ψ 1 2 ⎞ x ⎤ β + u
'
⎢⎣ it ⎜⎝ ⎟ i⎥ ⎢ ⎜ ⎜ ⎟ ⎟⎥ ⎢ it ⎜ ⎟ i⎥ (37)
⎠ ⎦ ⎣ ⎝ ⎝ ⎠ ⎠⎦ ⎣ ⎝ ⎠ ⎦ it
4
El estimador MCO (obtenido con ψ = 1 ) es también una combinación lineal de los dos estimadores,
pero no la eficiente.
−1 1
5
Lógicamente, a este modelo se llega obteniendo la matriz R, tal que Ω = R ' R , la cual es igual a
σε
2
1
− ⎛ ⎞
= ⎜ I T − ⎛⎜1 − ψ 2 ⎞⎟ ιTιT' ⎟ , y premultiplicando el modelo original (29’) por dicha matriz.
1 1
σεΩ 2
⎝ ⎝ ⎠T ⎠
26
1 2
entre grupos (between) es igual a σ α2 + σ ε , la cual puede estimarse consistentemente
T
como:
2
^ 2 1 N
⎛ ^ ^
⎞
σB = ∑ ⎜ yi − μ B − xi β B ⎟
'
(38)
N − (K + 1) i =1 ⎝ ⎠
^
donde μ B es el estimador between para μ . En consecuencia:
^ 2 ^ 2
1 ^2
σα =σ B− σε (39)
T
que muestra como el estimador de efectos aleatorios es más eficiente que el de efectos
fijos si se cumple que ψ > 0 . La ganancia en eficiencia es debida a la utilización de la
variación entre grupos (x i − x ) .
de los datos (between y within), pero mientras que el primero lo hace de forma
ineficiente, el segundo lo realiza de forma eficiente.
(
yit* = yit − θ 1 y i − θ 2 y t + θ 3 y ) (42)
σε σε
siendo θ1 = 1 − ; θ 2 = 1−
Tσ α2 + σ ε2 Nσ λ2 + σ ε2
σε
θ 3 = θ1 + θ 2 + −1
Tσ α + Nσ λ2 + σ ε2
2
28
Sin embargo, como ya se comentó con anterioridad, para especificar este tipo de
modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la
mayor parte se trabaja con micropaneles (N elevado, pero T pequeño) este modelo es
escasamente utilizado. Como se comentó con anterioridad, lo que se suele hacer es
incorporar al modelo las correspondientes dummies temporales.
4. ANÁLISIS DE ESPECIFICACIÓN
En el caso del modelo de efectos fijos, los contrastes son sencillos, dado que es
básicamente un modelo estimado por MCO. Un contraste bastante simple de
autocorrelación en el modelo de efectos fijos está basado en el contraste de Durbin-
Watson (DW). En consecuencia, se contrasta la hipótesis nula de no autocorrelación
29
frente a hipótesis alternativa que el término de perturbación para cada individuo sigue
un esquema AR(1), es decir:
ε it = ρε i ,t −1 + υ it (43)
dw p = i =1 t =2 N⎝ T ^ ⎠ (44)
∑∑ ε
2
it
i =1 t =1
^
donde ε it son los residuos de la regresión within.
En este caso, los anteriores autores también derivaron los puntos críticos que,
lógicamente, ahora dependen de los valores de N , T y K . Además, al contrario que en
el caso de series temporales, las zonas de indeterminación para el estadístico de DW
para datos de panel son muy pequeñas, particularmente cuando el número de individuos
en el panel es elevado.
30
V {ε it } = σ 2 h zit' α( ) (45)
No obstante, para este tipo de modelos (modelos de efectos fijos), una estrategia
muy utilizada consiste en utilizar la propuesta de Arellano (1987) consistente en utilizar
la corrección de White que permite obtener una estimación de la matriz de varianzas y
covarianzas asintótica de los estimadores within-groups robusta tanto ante problemas de
heteroscedasticidad y correlación serial de cualquier tipo, para valores fijos de T y N
grande (caso más habitual) que viene dada por la siguiente expresión:
−1 −1
⎧^ ⎫ ⎛ N ⎞ ⎛ N ' ⎞
^ N ^ ^
V ⎨ β EF ⎬ = ⎜⎜ ∑ xi' Q xi ⎟⎟ ∑ ε ε i ⎜ ∑ x i Q xi ⎟
⎜ ⎟
' '
x
i Q i i Q x (43)
⎩ ⎭ ⎝ i =1 ⎠ i =1 ⎝ i =1 ⎠
31
^ ^
donde ε i = Q yi − Q xi β FE son los residuos del modelo within estimado.
No obstante, la solución en estos casos viene por la estimación por MCGF tras
haber adoptado una forma específica para la matriz de varianzas y covarianzas. Veamos
los casos más generales.
porque la varianza de ε it varía con i (en consecuencia hemos de hablar de σ ε2i en vez de
( )
E vi vi' = σ ε2i I T + σ α2i ιT ιT' = Ω i (44)
−1
Y la matriz inversa, Ω i , sigue la expresión (32), sin mas que sustituir σ α2 y σ ε2
1 T ⎛⎜ ^ ^ ⎞⎟
−
^ 2
σ vi = ∑ vit − vi ⎟⎟ obtenidos a partir de la estimación (30). A partir de aquí, se
T − 1 t =1 ⎜⎜
⎝ ⎠
^ 2 ^ 2 ^ 2
puede obtener la estimación para σ α2 i como: σ α i = σ vi − σ ε i .
Ó en términos matriciales:
yi = ιT μ + xi β + ιT α i + ε i = xi+δ + vi (46)
ε it = ρε it −1 + uit (47)
donde uit se distribuye de forma idéntica e independiente con media cero y varianza
σ 2u .
La estimación de dicho modelo por MCG se basa en idénticos supuestos que los
de cualquier otro tipo de especificación que presenta un problema de autocorrelación
AR(1). Teniendo en cuenta que el modelo transformado mediante la expresión:
( )
yit − ρ yit −1 = μ (1 − ρ ) + xit − ρ xit −1 β + (1 − ρ )α i + uit
'
(48)
presenta una perturbación ruido blanco, se puede efectuar un procedimiento iterativo del
tipo propuesto por Cochrane-Orcutt consistente, como se recordará, básicamente en lo
siguiente. La primera etapa comienza con la estimación de ρ utilizando la ecuación
(47) y los residuos de la regresión within. A continuación, se estima por MCO la
regresión (48) resultante tras utilizar el valor de ρ estimado, obteniendo un vector
inicial de estimadores. En una segunda etapa, se obtienen unos nuevos residuos within,
a partir de tales estimadores, con los que se repite el proceso. Así sucesivamente, hasta
que se alcance la convergencia.