Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EconometriaTVIII PDF
EconometriaTVIII PDF
KLEIN
INTRODUCCIN A LA ESPECIFICACIN Y ESTIMACIN DE MODELOS
CON DATOS DE PANEL
Ramn Maha
Marzo de 2000
El trmino modelo de datos de panel se aplica en este contexto a aquel modelo de regresin que
utiliza, para la estimacin de los parmetros de inters, la variabilidad temporal y transversal de los
datos.
2.
Un anlisis del cumplimiento de la hiptesis de la paridad del poder adquisitivo en los pases de
la OCDE tomando los datos de precios y tipos de cambio nominales correspondientes a los
ltimos 40 aos.
Generalmente, los paneles de datos se distinguen unos de otros segn su amplitud transversal y
profundidad temporal. As, los paneles con un nmero muy amplio de observaciones transversales
(ejemplo 1 anterior) se denominan Paneles Micro, mientras que los paneles centrados en una amplia
dimensin temporal se suelen denominar Paneles Macro. En el caso, realmente extraordinario, de
contar con un panel con amplia dimensin tanto temporal como transversal hablaramos de un
Campo Aleatorio o Random Field.
Es importante dejar claro que, en sentido estricto, no son datos de panel los paneles rotatorios o la
mera agregacin de cortes transversales independientes1. Para construir un elemento verdaderamente
til de cara a la inferencia, se trata de que la variabilidad temporal y transversal corresponda a una
misma muestra de individuos para todas las observaciones. En este sentido, en el caso del anlisis
empresarial, la gran heterogeneidad dificulta la construccin de verdaderos paneles.
A este tipo de conjuntos de datos se los denomina pseudo - paneles existiendo algunas formas de
aprovechar eficientemente su informacin entre las que destacan las propuestas por Deaton (1985).
1.- De modo simtrico a lo expuesto en el punto anterior, algunas variables pueden presentar
variabilidad temporal pero no transversal de modo que su efecto slo podra captarse con
dimensin temporal.
2.- Si disponemos de ms de un corte temporal para los mismos individuos, la bsqueda de la
eficiencia sugerira una estimacin con todo el panel de datos. En este sentido, resulta prctico
tener en mente la siguiente relacin sencilla:
V ( ) =
V (U )
V (X )
3.- Por otro lado, disponer de ms de una observacin temporal permitir controlar (separar) la
heterogeneidad transversal inobservable utilizando transformaciones apoyadas precisamente en
disponer de ms de una observacin temporal (diferencias simples, diferencias ortogonales ...)
Expresin general
Un modelo de datos de panel podra formularse en trminos plenamente genricos como:
y it = it + 1i x1it + 2i x 2it + ..... + ki x kit + v it
i=1,2....N
t=1,2...........T
Modelo
I(a)
I(b)
II(a)
II(b)
III(a)
III(b)
IV
Ordenada
en el origen
Comn en i y t
Comn en i y t
Variando en i
Variando en i
Variando en i y t
Variando en i y t
Variando en i
Supuestos sobre:
Coeficientes
Vector de
perturbaciones v
de pendiente
De entre todos los modelos presentados en la tabla anterior, dos de ellos son los ms utilizados
tradicionalmente: los modelos II(a) y II(b). El modelo II(a) se denomina Modelo de efectos fijos y el
modelo II(b) Modelo de efectos aleatorios haciendo referencia al modo en que se considera la
heterogeneidad inobservable transversal en su relacin con la perturbacin aleatoria.
Contrariamente a lo que podra parecer tras una lectura rpida de un buen nmero de textos
economtricos, de lo anterior debe deducirse que la diferencia entre efectos fijos o aleatorios no radica en
la morfologa del modelo, que es siempre la siguiente:
y it = x it + i + v it
donde i representa la heterogeneidad transversal inobservable, sino que lo trascendental radica
en si esa heterogeneidad se considera fija, determinista, o por el contrario se define como la composicin
de una parte fija comn, ms una aleatoria especfica para cada individuo.
X '
=
X '
Yi
X i
con
2 1 0
1 2 1
=
0 1 O
0 0 L
0
M
3.- Utilizar MCO sobre el modelo en desviaciones ortogonales. Las desviaciones ortogonales
implican una transformacin sobre los datos X e Y equivalente a la ponderacin del producto XY del
procedimiento anterior.
4.- Utilizar el estimador MCO sobre el modelo en diferencias respecto a las medias grupales,
( y it y i ) = ( x it xi ) + (vit vi )
esta transformacin permitira concentrar la estimacin en un nico conjunto de parmetros
pudiendo calcularse posteriormente los parmetros i individuales simplemente como:
i = y i 1 x1i 2 x 2i .... k x ki
Esta estrategia resulta generalmente vlida por lo que es en la prctica la forma ms comn de
resolver la estimacin de un modelo de efectos fijos. El estimador anterior, recibe el nombre de
Estimador Intragrupos por considerarse para su aplicacin la desviacin intragrupal para X e Y.
Tambin recibe el nombre de estimador de efectos fijos o de covarianzas.
2.B.- ESTIMACIN DEL MODELO II(B) DE EFECTOS ALEATORIOS
En el modelo de efectos aleatorios se supone una sola ordenada en el origen y las N
ordenadas especficas correspondientes a cada individuo del panel se integran en la perturbacin aleatoria
de modo que:
v it = i + it
por esta razn a estos modelos se les llama tambin modelos con errores compuestos (error
components models).
La estimacin de los parmetros de un modelo de efectos aleatorios no requiere, como en el caso
de efectos fijos, diferencias o desviaciones o cualquier otra transformacin que elimine la presencia del
efecto fijo i. Muy al contrario, junto con la estimacin de los parmetros y interesa la
estimacin diferenciada de la varianza de los efectos aleatorios dentro de la estimacin global de la
varianza de la perturbacin aleatoria, por lo que no conviene que el efecto i sea obviado en el
procedimiento de estimacin. Llegados a este punto, podra pensarse en utilizar el estimador simple MCO
sobre el modelo en niveles:
y it = + x it + ( i + it )
Sin embargo, esta estrategia de estimacin no resulta vlida ya que la presencia de un efecto
temporalmente constante en la perturbacin aleatoria i provoca autocorreacin residual y modifica la
expresin tradicional de la varianza de la perturbacin aleatoria. As, la matriz de varianzas y covarianzas
de la perturbacin queda:
2 + 2
2
=
2
2
2
2
+ 2
2
2
2
2
O
L
2
=v
2 + 2
O M
L 1
con:
=
2
v2
Por tanto, la estrategia correcta consiste en usar MCG sobre el modelo en niveles utilizando
una estimacin adecuada de la anterior matriz . A este estimador se le denomina estimador BalestraNerlove Estimador Entre Grupos, nombre este ltimo que proviene de la equivalencia entre estos
resultados y los que se obtendran planteando la estimacin MCO entre las medias grupales de y y x.
Como siempre, debemos recordar que existe una transformacin previa sobre los datos que permite su
correcta estimacin simple por MCO evitando la utilizacin del estimador MCG (aunque nunca
eludiendo la estimacin de las varianzas 2 y 2v).
La estimacin Balestra - Nerlove requerir por tanto necesariamente dos etapas:
1.- Estimacin de un modelo previo del que utilizar los residuos para aproximar 2 y 2v.
Normalmente suele utilizarse, o bien una estimacin MCO simple del modelo, con trmino independiente
comn, o bien una estimacin del modelo con efectos fijos.
2.- Estimacin de las varianzas 2 y 2v y aplicacin del estimador MCG. Para este paso,
partiendo de:
v it = i + it
utilizaremos una aproximacin por descomposicin tradicional de la varianza del siguiente
modo:
(v
it
i ,t
)2 = (vit vi )2 + (vi v )2
i ,t
i ,t
(v
it
v i )2 =
i ,t
it
i )2
i ,t
(x
x i )2
= x2
T 1
it
(
i ,t
it
i )2 = N (T 1) 2
(v
i ,t
)2 = ( i )2 + ( i )2 + 2 ( i )( i )
i ,t
i ,t
i ,t
N
E ( i )2 = ( N 1) 2
i =1
teniendo ahora:
N
E
i
i =1
2
2
= ( N 1)
T
de modo que:
(v
)2 = ( N 1)T 2 ( N 1) 2
i ,t
En trminos operativos el clculo no resultara complejo en cuanto que implicara tan slo el
clculo inicial de 2:
En la segunda de las expresiones se entiende que cada una de las i que entran en la media se han
extrado de una poblacin N(0/T,2/T)
2 =
(v
it
vi
i ,t
N (T 1)
y a continuacin el de 2 como:
2 =
1
T
N 1
(v
N
i =1
X U = 0 Cov p ( f (u ), f ( x)) = 0
en la medida en que estas propiedades sean razonables, los parmetros representarn realmente
la dependencia de y sobre x:
Cov p (u , x) = 0 Cov( y x, x) = 0
Cov( y, x) V ( x ) = 0 =
Cov( x, y )
V ( x)
Cov( x, y )
E [x ]
V ( x)
Cov p (u , x) 0 Cov p ( z , u ) = 0
siendo: Cov p ( z , x) 0 . Sin embargo, una solucin alternativa consistira en acudir a los datos
de panel de modo que, al combinar la dimensin temporal y transversal, pudisemos neutralizar el efecto
de la correlacin (x,u ). Esto es precisamente lo que se logra cuando, suponiendo que la correlacin entre
x y i es constante en el tiempo, utilizamos el estimador Intra Grupos en el modelo de efectos fijos
utilizando el panel para separar la variacin transversal permanente. El nico requisito adicional consiste
en que los regresores X presenten variacin temporal.
Ejemplo Caso Prctico (1): Supongamos que disponemos de un corte transversal y queremos estudiar
la relacin entre el logaritmo de los ingresos, el nivel de educacin y la habilidad del trabajador.
Suponiendo inobservable la habilidad, aportara alguna ventaja la incorporacin de la dimensin
temporal?. Griliches. 1977.
Solucin: NO. Ya que el nivel de educacin no presenta variacin transversal lo que impedir incorporar
el efecto de la habilidad mediante la aplicacin de estimadores IG o EG.
Ejemplo Caso Prctico (2): Supongamos que disponemos de un corte transversal y queremos
relacionar las horas trabajadas con el salario percibido. Reconociendo la importancia y el carcter
inobservable de las percepciones acerca del flujo de salarios futuros sobre las horas trabajadas,
aportara alguna ventaja la incorporacin de la dimensin temporal?. MaCurdy, 1981.
Solucin: SI. En primer lugar, dado que en este caso las variables pueden presentar suficiente variacin
temporal, cabe pensar en incorporar esta dimensin. El problema consiste en que, dada la ms que
probable relacin entre salario percibido y expectativas futuras de salario, deberemos utilizar un
estimador IG por lo que perdemos la posibilidad de estimar el efecto de esta variable de expectativas
sobre las horas trabajadas.
2.- Si el estimador IG permite controlar el efecto de la heterogeneidad inobservable sobre
los parmetros
, qu puede motivar el uso de un estimador tipo Balestra Nerlove?.
Imaginemos un corte transversal con heterogeneidad i. Una estimacin en ese corte
transversal ya valdra para estimar adecuadamente salvo que sospechramos que i y xi estn
correlacionadas en cuyo caso utilizaramos un enfoque de VI. Imaginemos ahora que interesa aadir la
dimensin temporal por cualquiera de las razones previamente apuntadas y que podemos hacerlo dado
que xi presenta suficiente variacin temporal. En ese caso, para asegurar las posibles distorsiones de una
hipottica relacin i y xit estimaramos siempre por IG eligiendo la opcin ms robusta: es decir, en
el caso en que realmente no existiese relacin i xit, haber usado IG nos habra supuesto una pequea
prdida de eficiencia pero en cualquier caso tendramos siempre un estimador consistente. Qu puede
movernos a utilizar un estimador BN que no eliminar la presencia de i?
2.a.- La primera parte de la respuesta es obvia: que interesase considerar la influencia de ese
aspecto transversal i con carcter temporal permanente, sobre la variable endgena, estando seguros de
que la correlacin entre i y xit no existiese.
Ejemplo Caso Prctico (3): Supongamos que disponemos de un corte transversal y queremos
relacionar el input de una explotacin agrcola con el output de la misma. En la perturbacin aleatoria
quedaran shocks incontrolables como el rgimen de lluvias u otros cambios climticos. Sin embargo,
es posible que en la perturbacin quedase incluido tambin un factor trascendental: la calidad del suelo.
Si esa calidad del suelo fuese cuantificable se incorporara como una variable ms pero, si fuese
inobservable, podramos controlar su efecto incorporando la dimensin temporal ya que, ese efecto sera
constante en el tiempo. Pero adems, suponiendo la ausencia de correlacin entre calidad e input,
podramos usar un estimador EG que permitiese diferenciar los efectos de la variable de CALIDAD DEL
SUELO, efectos inobservables de naturaleza permanente, de otros shocks tambin de carcter
inobservable, pero cuyo efecto se diluye en el tiempo. Mundlak, (1978)
2
2 + v2
Cov( x it , i )
V ( x it )
Sin embargo, y por otro lado, el sesgo por error de medida se amplifica en el caso de estimar un
modelo en diferencias (Intragrupos en el caso de T=2) respecto al caso en niveles y lo mismo ocurre,
aunque en menor medida, con un modelo en desviaciones respecto a las medias o en desviaciones
ortogonales (Estimador Intragrupos). La razn proviene de la forma del sesgo por error de medida:
EN NIVELES
V
(
)
1+
V ( x*)
EN DIFERENCIAS
=
=
(V t + V t 1 2Cov t t 1 )
(2V 2Cov t t 1 )
1+
V (x*) 1 + (
(2Vx 2Covxt x t 1 )
Vx t + Vx t 1 2Covx t x t 1 )
A poco que la Cov(xtxt-1) sea mayor que la Cov(utut-1), cosa muy lgica, el
sesgo crece con relacin al caso en niveles.
(
)
1+
donde:
x = x * +
en una estimacin en niveles, los sesgos podran compensarse y esto es bueno, porque reduciria
el error de aplicar esta estimacin cuando no se debe
en una estimacin en diferencias o, en menor medida IG, la correccin del sesgo por efectos
fijos podra compensarse por el aumento de un sesgo previo por error de medida sin que se
notaran diferencias entre una estimacin MCO en niveles y una IG.
Error de
medida
Efectos Fijos
SI
NO
SI
NO
- La estimacin en niveles podra compensar los sesgos si - La estimacin en niveles estar sesgada
Cov(,x)>0 y >0. Pero si estos dos signos son diferentes el al alza (si Co(,x)>0) o a la baja (si
sesgo seguira existiendo al alza (para <0) y a la baja para Co(,x)<0).
(>0).
- La estimacin en diferencias o IG
- La estimacin en diferencias o IG solucionar todo sesgo de solucionar todo sesgo.
efectos fijos pero muy probablemente exacerbara el sesgo por
error de medida.
- La estimacin en niveles presentara el sesgo por error de - La estimacin en niveles no presentara
medida.
ningn sesgo.
- La estimacin en diferencias o IG slo servira para - La estimacin en diferencias o IG no
exacerbar el sesgo por error de medida.
presentara ningn sesgo si bien tampoco
mejorara la estimacin en niveles.
BIBLIOGRAFA BSICA
Arellano, M. y Bond, S. (1988). Some Test of Especification for Panel data: Monte Carlo Evidence and
and an Application to Employment Equiations. Applied Economics Discussion Papers 55, Oxford.
Arellano,M. y Bover, O. (1990). La Econometra de Datos de Panel. Investigaciones Econmicas. Vol.
14. N 1. pp. 3-45.
Deaton, A. (1985). Panel data from Times Series of Cross Sections. Journal of Econometrics, 30. pp.
109-126.
Chamberlain, G. (1984). panel data. Z. Griliches and M.D. Intrilligator (editores). Handbook of
Econometrics, Vol. II. Elsevier Science.
Griliches, Z. (1977). Estimating the returns of Schooling: some econometric problems. Economtrica,
45, pp. 1- 22.
Hausman, J. A. (1978). Specification tests in Econometrics. Econometrica, 46, pp. 1251-1272.
Johnston, J. (1992). Mtodos de Econometra. Ed. Vicens Vivens.
MaCurdy, T.E. (1981). An Empirical Model of Labor Supply in a Life-Cycle Setting. Journal of
Political Economy, 89, pp.1059-1085.
Mundlak, Y. (1978). On the pooling of time series and cross section data. Econometrica, 46, pp. 69-85.
Desde los trabajos iniciales de Balestra y Nerlove (1966), los modelos dinmicos de datos de panel
han jugado un importante papel en el anlisis emprico reciente con datos de panel en economa, la
razn radica en la aparicin cada vez ms frecuente de paneles o pseudo paneles con un nmero
relativamente largo de observaciones temporales, lo que permite centrar los esfuerzos de anlisis en
la dimensin temporal de los paneles y su tratamiento.
La extensin natural de los procedimientos tradicionales de series temporales al caso del modelo
dinmico de datos de panel presenta importantes limitaciones derivadas de que en el anlisis de datos
de panel convencional se asume que el tamao de la dimensin temporal T es fijo (y reducido)
mientras que el nmero de observaciones transversales tiende a infinito mientras que en el anlisis de
series temporales la aproximacin asinttica se establece en el otro sentido.
El anlisis de la dinamicidad en los modelos de datos de panel se centra en dos tipos de situaciones:
la estimacin de modelos dinmicos de efectos fijos y la estimacin de modelos dinmicos con
componentes de error. En el primer caso, los problemas de inferencia se centran en la correcta
estimacin de los parmetros en ausencia de exogeneidad estricta mientras que, en el segundo caso,
los problemas se centran en distinguir la dinmica genuina del sistema (proveniente de la inclusin
de retardos de la endgena) de la provocada por la presencia de la heterogeneidad inobservable en la
perturbacin aleatoria.
El sesgo de Nickell nos indica que la estimacin tradicional IG no sirve dado el carcter
endgeno de yit-1
Los resultados derivados por Nickell (1981), indican que, si se trata un modelo de panel dinmico de
efectos fijos:
y it = i + y it 1 + vit
1.
Estimar en niveles es una mala idea ya que yit-1, como explicativa, no es ni siquiera una variable
predeterminada (por estar relacionada con vit-1) sino endgena, al estar relacionadas con los
valores presentes de (vit+i).
2.
Si intentamos estimar en diferencias para eliminar la presencia del efecto fijo i a la manera de la
estrategia IG tenemos tambin correlacin, en este caso entre yi2 y vi3 lo que provocar un
sesgo a la baja (la correlacin entre yi2 y vi3 ser negativa ya que estamos hablando de yi2-yi1
con vi3-vi2 de modo que la relacin yi2 con vi2 ser negativa).
3.
El sesgo es algo menor si planteamos el modelo en desviaciones con respecto a las medias
transversales pero an as sigue existiendo para T pequeo (es decir, como en el caso de series
temporales, slo tiende a cero a medida que T tiende a ). Por tanto, la nica posibilidad es que
T sea suficientemente grande como para diluir el efecto.
El sesgo estimado por Nickell no es, ni mucho menos, despreciable. Por ejemplo, para el caso en
que =0.25 y T=10 (ntese que T=10 es un tamao aceptablemente grande en un panel micro), el sesgo
alcanzara un valor en torno a 0.21, esto es, ms de un 80% del verdadero valor del parmetro.
Sesgos asintticos del estimador IntraGrupos
en un modelo autorregresivo simple
T/
3
4
11
16
0.05
-0.52
-0.35
-0.11
-0.07
0.50
-0.75
-0.54
-0.16
-0.11
0.95
-0.97
-0.73
-0.26
-0.17
Ejemplo de combinacin de una explicativa predeterminada + efectos fijos : el uso del stock de hijos
como explicativa de la participacin de la mujer en el mercado laboral. Est claro que los shocks de
vit pasados (cierre de las empresas, promociones inesperadas....) habrn condicionado las decisiones
pasadas de fecundidad por lo que el stock actual de hijos estar en relacin con los shocks pasados
(de modo que el stock de hijos es predeterminada). Si estimsemos en niveles pensando que no hay
efectos i correlacionados con el stock de hijos no habra problemas, pero si pensamos que s existen
esos efectos fijos relacionados con el stocks de hijos (por ejemplo la educacin, las preferencias por el
trabajo o la familia o la renta) al plantear la ecuacin en diferencias para corregir el problema,
habremos introducido el sesgo comentado por ausencia de exogeneidad estricta en el stock de hijos.
Por ltimo, como problema adicional al del sesgo simple, si se considera adems la presencia de
variables exgenas Xijt estimndose el modelo en desviaciones a la media:
~
~
yt = ~
yt 1 + X t b + t
los resultados sealan que el sesgo en valor absoluto en la estimacin del parmetro
autorregresivo ser todava mayor que en el caso en que las variables xijt se omitan. As mismo, la
estimacin del parmetro o vector de parmetros b ser tambin sesgada, siendo ese sesgo tanto ms
amplio cuanto mayor sea la relacin entre las variables exgenas xijt y el retardo de la endgena yt-1.
y i 2 = i + y i1 + vi 2
y i 3 = i + y i 2 + vi 3
Para el control de i, se plantea la forma en diferencias para la que, en este caso, disponemos de una
sola ecuacin:
y i 3 = y i 2 + vi 3
Lgicamente, el problema bsico para la estimacin del parmetro por el mtodo tradicional de
regresin en esta ecuacin, es la existencia de correlacin entre yi2 y vi3 . La estimacin de variables
instrumentales, exigir encontrar un instrumento incorrelacionado con vi3 y, sin embargo,
correlacionado con la variable a la que deber sustituir yi2. El instrumento seleccionado, en este caso,
ser el valor del nivel yi1, o sea, el retardo en niveles de la variable predeterminada, ya que,
guardando relacin por construccin con yi2= yi2 - yi1 no estar correlacionado sin embargo con vi3. En
este caso (para T=3) el modelo estara exactamente identificado al contar con una variable instrumental
(una condicin de ortogonalidad) para la estimacin de un solo parmetro.
N
AH =
i1
[ yi3 y i 2 ]
i1
[ y i 2 y i1 ]
i =1
N
y
i =1
Es decir, en este caso no se usan, como en el caso en que xit sea exgena estricta, los niveles de las
exgenas como variables instrumentales en la ecuacin en diferencias, sino los retardos de esas variables
en niveles, y esto es consecuencia directa de la NO exogeneidad estricta de yit-1.
La estimacin por variables instrumentales ofrece una interpretacin intuitiva sencilla del Mtodo
Generalizado de Momentos introducido bsicamente en los trabajos de Arellano. Efectivamente, el
estimador GMM vendra a ser un caso especial de estimacin por variables instrumentales en el
que el sistema de ecuaciones e instrumentos estuviese sobreidentificado. En ese caso, dado que para la
estimacin de un parmetro contaramos con ms de una restriccin de momentos (condiciones de
ortogonalidad), el estimador GMM puede entenderse como una combinacin lineal de todos los
estimadores obtenidos con cada una de esas condiciones, debidamente ponderados por la precisin de
cada una de ellos. A su vez, esa precisin depender del grado de correlacin existente entre el
instrumento y la exgena y el instrumento y la perturbacin aleatoria.
Observemos la aplicacin de la tcnica en el caso anteriormente descrito pero para T>3, es decir,
veamos la estrategia MGM sobre ecuacin en diferencias. Recordando el uso de las variables
instrumentales, podemos asociar a cada una de las ecuaciones en diferencias para cada valor de t los
correspondientes instrumentos:
Instrumentos para un modelo
en 1as diferencias
Ecuaciones
Instrumentos
yi1
y i 3 = y i 2 + i 3
y i 4 = y i 3 + i 4
y iT = y i (T 1) + iT
yi1, yi2
0
y i1 , y i 2
M
0
O
0
L y i1 , y i 2 ,... y i (T 2)
L
L
0
0
i 3
i4 = 0
M
iT
2 1 0
1 2
1
2
2
E [ it it '] = H = 0 1 2
M
M
M
0 0 0
L 0
L 0
L 0
O M
L 2
AH =
y'
t
y'
t
t ( 1)
t ( 1)
Zt
Z ' HZ Z ' y
t
Z ' HZ Z ' y
Zt
t ( 1)
Otras formas del estimador MGM en el contexto de los modelos de datos de panel dinmicos
Cabe aadir ahora, que la estimacin en diferencias, no es la nica transformacin que permite la
aplicacin del estimador GMM antes descrito. Una transformacin muy til resulta la propuesta por
Arellano (1988) que considera las variables expresadas en desviaciones ortogonales, esto es, cada valor
de la variable menos todos sus adelantos (diferencia debidamente corregida para evitar la
heterogeneidad en varianza). Puede demostrarse que la estimacin MCO aplicada sobre los datos en
desviaciones ortogonales utilizando los mismos instrumentos que en el caso anterior, conduce al
mismo resultado que la estimacin MCG del modelo en primeras diferencias expuesta ms arriba.
Slo en el caso en que algunos de los instrumentos sean suprimidos los estimadores no sern
equivalentes.
Siendo indiferente una u otra transformacin segn lo visto, las desviaciones ortogonales son muy
recomendables, ya que pueden servir para suavizar algunos problemas colaterales. As, por ejemplo, es
bien conocido que el sesgo sobre el parmetro estimado derivado de un eventual error de medida en las
variables, puede quedar amplificado por la transformacin del modelo y que este problema es mucho ms
grave cuando se utilizan diferencias que cuando se utilizan desviaciones ortogonales.
En trminos generales puede afirmarse que el mtodo de variables instrumentales y GMM
resulta sorprendentemente flexible para eludir con relativa sencillez todo tipo de eventualidades que
aparezcan en un determinado ejercicio de especificacin. La base del mtodo consiste en la adecuada
seleccin de instrumentos conforme a las propiedades observadas en las variables con las que tratamos.
Esta seleccin no podr realizarse de forma automtica sino que, muy al contrario, requerir la plena
implicacin del investigador, que deber definir detalladamente el modelo terico considerado incluyendo
la posible existencia de errores de medida, autocorrelacin residual, heterogeneidad observable,
variabilidad exclusivamente temporal, etc.... Slo en ese caso, ser posible una adecuada seleccin de
instrumentos para cada parmetro a estimar. Por ese motivo, el propio Arellano, prefiere referirse al
Mtodo de Variables Instrumentales y no al Estimador de variables instrumentales.
Algunas situaciones especiales de seleccin de variables instrumentales para el uso del MGM
1.
Cuando la raz est muy cercana a la unidad, la relacin entre diferencias e instrumentos en
niveles es muy escasa. Una de las soluciones que se propone es completar la anterior estimacin
en diferencias con VI en niveles con una ecuacin en niveles utilizando como VI las diferencias
de yit-1. Por ejemplo, para T=5 tenemos el siguiente conjunto de ecuaciones e instrumentos:
Instrumentos para un modelo
en 1as diferencias
Ecuaciones en diferencias
y i 3 = y i 2 + i 3
y i 4 = y i 3 + i 4
Instrumentos
yi1
yi1, yi2
y i 5 = yi 4 + i 5
Ecuaciones en diferencias
Instrumentos
y i 3 = yi 2 + i + i 3
yi2=yi2- yi1
y i 4 = yi 3 + i + i 4
y i 5 = yi 4 + i + i 5
yi3=yi3- yi2
yi4=yi4- yi3
E [ y it , i ] = cte.
de modo que E
[y it ,i ] = 0 pudiendo
funcionar
supone una restriccin de estacionariedad en media del proceso sobre yit por lo que slo resulta
interesante utilizarlo, bien cuando T sea excesivamente pequeo, bien cuando estemos seguros de
que el proceso yit presenta una raz unitaria cercana a la unidad.
2.
Arellano, M. (1988). An alternative Transformation for Fixed Effects Models with Predetermined
Variables. Applied Economics Discussion Paper, 57. Oxford
Arellano, M. y Bover, O. (1990). La Econometra de Datos de Panel. Investigaciones Econmicas. Vol.
14. N 1. pp. 3-45.
Nickell, S. (1981). Biases in Dynamic Models with Fixed Effects. Econometrica, 49, pp 1417-26.
pg. 1
y it = i + it
con i
con
2
+
2
+1
Supongamos sin embargo ahora una determinada inercia en el proceso yit . Para representar esa
inercia, utilicemos el anterior modelo esttico permitiendo autocorrelacin en el error, esto es:
it = it 1 + it
<1
it iid (0, 2 )
La dinmica inducida por esta perturbacin autocorrelacionada puede observarse con una
sencilla sustitucin recursiva:
y it = i + it y it = i + it 1 + it
y it = i + ( y it 1 i ) + it y it = y it 1 + i (1 ) + it
Pues bien, el problema se deriva de que, en esta nueva situacin, la autocorrelacin de primer
orden para yit nos da la expresin:
Corr ( y it , y it 1 ) = = +
(1 )
+ (1 ) (1 + )
de modo que:
-
pg. 2
Modelo (2)
y it = i + it
y it = it
it Sin Autocorrelacin
it Autocorrelacionado
y11 y12 + y 21 y 22 + L + y N 1 y N 2
N
razn por la que un clculo de este tipo puede dificultar la percepcin aislada de y . El punto
clave consistir, por tanto, en disponer de un nmero de observaciones temporales T lo
suficientemente grande como para aproximar el tipo de autocorrelacin temporal para cada
individuo del panel.
Efectivamente, basta con que T=3 para que los modelos (1) y (2) definidos previamente no sean
observacionalmente equivalentes lo que permite distinguir si la autocorrelacin es transversal o proviene
de la perturbacin it. Concretamente, para T=3, sabemos que en el caso del modelo (2) = y 2=2
mientras que, en el caso del modelo (1) =2=/(1+) por lo que resultar fcil distinguir un caso de otro.
Lo anterior tiene una salvedad importante y es aquella situacin en la que est muy prximo a
la unidad (raz unitaria). Efectivamente, en los paneles micro suele observarse que est prximo a uno
lo que invita a pensar en una raz unitaria y, sin embargo, tras descomponerse se observa , por ejemplo,
=0.8 y =4, que aleja la hiptesis de raz unitaria.
1.B.- CMO SE AFRONTA LA ESTIMACIN DE UN MODELO DE EFECTOS ALEATORIOS
CON AUTOCORRELACIN
Ya escribimos antes que el modelo:
y it = i + it
con:
pg. 3
it = it 1 + it
puede reescribirse como:
y it = y it 1 + i (1 ) + it y it = y it 1 + i* + it
por lo tanto, todo lo que vimos sobre estimacin con variables instrumentales en presencia de
variables predeterminadas sirve ahora de nuevo con la salvedad de que ahora nos interesa tambin la
estimacin separada de la varianza de it y i (o sea, el conocimiento del parmetro ). En ese sentido, de
cara a aproximarnos correctamente a la estimacin del verdadero parmetro i deberemos especificar
previamente la forma de autocorrelacin supuesta para it.
1.C.- BREVE NOTA SOBRE LA DIFERENCIA ENTRE UN MODELO CON INERCIA
DERIVADA DE LA AUTOCORRELACIN Y UN MODELO DINMICO EN SENTIDO
ESTRICTO.
Llegados a este punto, quiz convenga recordar la diferencia entre un modelo dinmico, de
retardos distribuidos o de ajuste parcial de un modelo de inercia por autocorrelacin como el
considerado anteriormente.
En el primer caso, el modelo sera del tipo:
y it = y it 1 + xit + it
i iid (0, 2 )
Como puede observarse, los valores de X influyen en diversos momentos actuales y futuros del
tiempo (es decir xit-1 no slo influy en yit-1 sino tambin en yit ,2 en yit+1).
En el segundo caso, el modelo es:
y it = x it + it
con:
it = it 1 + it
de modo que puede escribirse como: