Está en la página 1de 53

Modelos Lineales para Datos Panel

Modelos lineales estáticos

Profesor: Graciela Sanroman

Maestría en Economía Internacional- DECON

Año 2019
De…nición de Panel (o Base de datos longitudinal)
I Es una muestra de N unidades y T observaciones por unidad
fwit g i = 1, .....N, t = 1, 2, .....T .
I O sea, hay observaciones repetidas a lo largo del tiempo para
las mismas unidades.
I Unidades: hogares, empresas, paises,industrias,personas
I Diferencia con cortes transversales repetidos.
I Paneles: balanceados, rotativos, etc..
Macropaneles: los individuos son países, sectores de actividad, etc.
El interés de los macropaneles está, generalmente, en realizar
análisis de series temporales multivariantes. N suele ser pequeño
en relación a T , es posible pensar que son N variables a explicar.
Micropaneles: los individuos son empresas, hogares, personas, etc.
Este es el tipo de problemas en que nos concentraremos. Aquí N
es grande en relación a T , es posible pensar que son T variables a
explicar.
Origen de los micropaneles: Encuestas, Registros administrativos,
Censos
La dimensión del panel es relevante para poder encontrar las
propiedades asintóticas de los estimadores (semiasintótica):
I N grande T chico lo usual en micropaneles
I T grande N chico lo usual en macropaneles
Recientes desarrollos analizan propiedades asintóticas de muestras
con N grande T grande.
El enfásis aquí será en N grande y T chico.
Es importante notar que el comportamiento de los estimadores no
será el deseable si tanto N como T son pequeños.
Ventajas generales de los micropaneles
Hay estadísticos que no puedo generar a partir de corte
transversales repetidos:
I transiciones desempleo/empleo, duración en el empleo, etc.
I momentos basados en distribuciones conjuntas; por ejemplo
probabilidades condicionales Pr(y2 = 1 jy1 = 0 ).
Ventajas de los micropaneles desde el punto de vista
econométrico:
Con respecto a las series temporales:
I es posible evitar los sesgos de agregación, lo que explota es
fundamentalmente la variabilidad individual.
Con respecto a los datos de corte transversal:
I controlar por la presencia de heterogeneidad individual
inobservable,
I descomponer componentes de error
I considerar la dinámica
I ofrecer instrumentos alternativos ante el problema de errores
de medida.
Limitaciones de los micropaneles:
I el efecto de los errores de medida puede verse ampli…cado,
I falta de representatividad de la muestra debido a desgaste
muestral (o atricción) o a que la muestra en cada período no
es representativa de la población
Modelo Heterogeneidad inobservable
Motivación
Considere la siguiente regresión simple utilizando una muestra de
corte transversal, fyi , xi g , i = 1, ..., N.

yi = βxi + ui (Linea de regresion)


ui = η i + vi (Componentes de error)

Era muy usual denominar a este modelo "Modelo de Efectos


Fijos", ahora "Heterogeneidad inobservable", "Efecto
inobservable", "Componente inobservable", "Efecto individual",
"Heterogeneidad individual".
yi = βxi + (η i + vi )
Si Cov (xi , η i ) = 0 es posible estimar β de forma insesgada por
MCO siempre que Cov (xi , vi ) = 0.
Si Cov (xi , η i ) 6= 0 no se puede identi…car β excepto que exista
alguna medición de η i o si existe algún instrumento externo zi que
permitiera realizar la identi…cación a través de IV.
Los datos panel ofrecen una alternativa adicional. Supongamos
que observo a los mismos individuos en dos oportunidades, ahora
tengo: fyit , xit g , i = 1, ..., N; t = 1, 2.

yi 1 = βxi 1 + η i + vi 1
yi 2 = βxi 2 + η i + vi 2

Es sencillo comprobar que si se cumple Cov (xis , vit ) = 0,


s, t = 1, 2, entonces, considerando la primera diferencia

∆yi 2 = β∆xi 2 + ∆vi 2

es posible estimar β de forma insesgada en una regresión MCO de


esa ecuación.
a) Ejemplos de heterogeneidad inobservable

1) Función de producción agrícola (Mundlak, 1961). En este


ejemplo:

yit : (log) del producto

xit : (log) de la horas trabajadas en el establecimiento

η i : calidad del suelo

vit : shock aleatorio (lluvia, heladas)


2) Oferta de trabajo intertemporal (MaCurdy, 1981)

yit : (log) de la horas trabajadas

xit : (log) del salario

η i : función desconocida de la utilidad marginal de la riqueza


(depende de expectativas sobre los salarios futuros, tasas de interés

y riqueza futura)

vit : shock aleatorio


3) Retornos de la educación (Griliches, 1977)

yit : (log) del salario


xit : años de educación
η i : habilidad del individuo
vit : shock aleatorio

Notar que en este último ejemplo esperamos que: xit = xi ,


entonces ∆xit 0 por lo tanto, la disposición de un panel de datos
no ayuda a resolver el problema de estimación de β. Notar que
2
V(bβ) = Vσ(x ) .
También surgen problemas si los errores de medida en la variable x
son relevantes, y/o si estamos en un modelo de coe…cientes
aleatorios βi .
2.2 El modelo de heterogeneidad inobservable
a) Supuestos
Tengo una muestra fyit , xit g , i = 1....N, t = 1....T , de…no un
modelo

yit = xit0 β + η i + vit (1)

E (vit j xi 1 ........xiT η i ) = 0 (Supuesto 1)


E vi vi0 j xi 1 ........xiT η i 2
= σ IT (Supuesto 2)
Notar que el Supuesto 1 es un supuesto de exogeneidad estricta, es
decir que las x no estarán correlacionados con el error
contemporáneo de la ecuación pero tampoco con los errores
pasados y futuros. Por ejemplo, si se incluye la variable
dependiente rezagada entre los regresores esto ya no se cumplirá.
Este es un supuesto muy fuerte, implica E(xis vit ) 8t, s, pero es más
generico porque incluye también a funciones no lineales de x.
También es necesario que vit sea independiente en media de η i .
El supuesto 2 es auxiliar, afectará la e…ciencia pero no la
b) El estimador intragrupos
El modelo [1] lo puedo pensar como un sistema:
1. de T ecuaciones en niveles con N observaciones c/u
2. de N ecuaciones en niveles con T observaciones c/u
3. de 1 ecuación en nivel con NT observaciones c/u.
En este caso nos concentraremos en la opción 1.
Si tengo T ecuaciones en niveles tengo T-1 ecuaciones en primeras
diferencias que no dependen de los efectos individuales, y puedo
representar el sistema de la siguiente manera:

yi 1 = xi01 β + η i + vi 1 (2.1)
∆yi 2 = ∆xi02 β + ∆vi 2 (2.2)
..
..
∆yiT = ∆xi02 β + ∆viT (2.T)

Pero, si Cov (xi , η i ) 6= 0, entonces la ecuación [2] no contiene


ninguna información para identi…car β.
Entonces me quedaré con las T 1 ecuaciones en diferencias.
Si T = 2 entonces el modelo está compuesto de una sóla ecuación,
aplico MCO. Si se cumple S1 MCO es consistente y si se cumple
S2 e…ciente.
Si T > 2 entonces el modelo está compuesto de más de una
ecuación. Puedo escribir el modelo utilizando un operador de
primeras diferencias D de dimensión (T 1) T ,
2 3
1 1 0 ...... 0 0
6 0 1 1 ...... 0 0 7
6 7
6 0 0 1 ...... 0 0 7
D=6
6
7
7
6 0 0 0 ...... 0 0 7
4 . . . ...... 1 0 5
0 0 0 ...... 1 1

Dyi j = DXi β + Dvi (2)


Notar que [2] es equivalente al sistema de ecuaciones dado por
[2.2] a [2.T].
Si aplicara MCO a este sistema tendría
" # 1 " #
N N
b
βMCO = ∑ (DXi )0 (DXi ) ∑ (DXi )0 (Dyi ) (3)
i =1 i =1

pero, supongamos T = 5

E Dvi vi0 D 0 j xi η i = DE vi vi0 j xi η i D 0 (4)


0
= σ2 DD
2 3
2 1 0 0
6 1 2 1 0 7
= σ2 6
4 0
7
1 2 1 5
0 0 1 2

y por lo tanto habra autocorrelación: MCO será insesgado y


consistente pero no óptimo.
En este caso, conozco la forma de D entonces, conozco la forma de
la matriz DD 0: Mínimos Cuadrados Generalizados es factible

" # 1 " #
N N
b
βMCG = ∑ (DXi ) 0
Ωi 1
(DXi ) ∑ (DXi ) 0
Ωi 1
(Dyi )
i =1 i =1
" # 1" #
N N
∑ (DXi ) ∑ (DXi )
0 0 1 0 0 1
= DD (DXi ) DD (Dyi )
i =1 i =1

Este es el estimador intragrupos, b


βWG .
Se puede demostrar que el estimador intragrupos b
βWG se puede
obtener de cuatro maneras diferentes:
1. Estimador de "Efectos Fijos" o Variables dummies VD_MCO,
en inglés Dummy Variables Least Square (DVLS)
2. Primeras diferencias PD_MCG, en inglés First Di¤erence
Generalized Least Square (FD_GLS)
3. Desvíos respecto a la media MCO, en inglés Whithin Group
(WG)
4. Desvios ortogonales MCO, en inglés Forward Orthogonal
Deviation.
Los estimadores b
βWG obtenidos de esas cuatro formas serán
numericamente idénticos en una muestra si se trata de un panel
balanceado. En paneles no balanceados los estimadores presentarán
diferencias númericas (pero son asintóticamente equivalentes).
1. Estimador de "Efectos Fijos" (Variables dummies VD_MCO)
Estimando por MCO la ecuación en niveles e incluyendo una
variable dummy a cada individuo (estimo η i ).

yit = xit0 β + η i + vit (5)

Estimar el efecto individual η i equivale a considerar un intercepto


diferente para cada individuo. Entonces, el vector de parámetros a
estimar es
( β, η 1 , η 2 , .....η N ).
Surge un problema de parámetros incidentales: en estos modelos
donde la asintótica es en N:
I el número de parámetros tiende a in…nito cuando N tiende a
in…nito
T
I la estimación b
ηi = 1
T ∑ (yit xit0 b
β) será generalmente muy
t =1
poco "…able" ya que T es …jo (y generalmente pequeño),
2. (Primeras diferencias MCG) Estimando por MCG la ecuación en
primeras diferencias

∆yit = ∆xit0 β + ∆vit

siendo

∆yit = yit yit 1


∆xit = xit xit 1
∆vit = vit vit 1

Este modelo lo podemos escribir como

Dyi j = DXi β + Dvi (6)

Recordar:
I D=matriz operadora de primeras diferencias
I en este caso MCG es factible, la matriz de ponderaciones es
Ωi 1 = (DD 0 )
3. (Desvíos respecto a la media MCO) Estimando por MCO una
ecuación en diferencias respecto a la media.
0
yeit = e
xit β + veit (7)

siendo
T
1
yeit = yit y i con y i =
T ∑ yit
t =1
T
1
e
xit = xit x i con x i =
T ∑ xit
t =1
T
1
veit = vit v i con v i =
T ∑ vit
t =1
El modelo lo podemos escribir como

yei = e
xi β + vei (8)

Qyi = QXi β + Qvi


donde, Q es la matriz operadora de desvíos respecto a la media,
también conocida como "operador intragrupos"
1 0
Q = IT ιι
T
ι es el vector (1, 1, ....1)0 de dimensión T

Por ejemplo Qy corresponde a,


0 1
yi 1 y i
B yi 2 y i C T
Qy = B C con y i = 1 ∑ yit
@ .. A T t =1
yiT y i

Notar que Q es idempotente.


4. (Desvios ortogonales) Estimando por MCO una ecuación en
desvíos ortogonales
Considero una transformación de las variables que implica restar a
cada variable su media en los períodos futuros:

yit = xit β + vit

T
1
yit = yit
T t ∑ yis
s =t +1
T
1
xit = xit
T t ∑ xis
s =t +1
T
1
vit = vit
T t ∑ vis
s =t +1
El modelo en desvios ortogonales lo puedo escribir como

Ayi = AXi β + Avi (9)


1/2
donde, A = (DD 0 ) D. Por ejemplo,
0 1
c1 yi 1 T 1 1 ∑Ts=2 yis
B C r
B ... C
B C T t
Ay = B C
B ct yit T 1 t ∑Ts=t +1 yis C con ct = T t + 1
B C
@ ..... A
1
cT 1 yiT 1 1 yiT

Nota: la matriz A antes de…nida cumple A0 A = Q y AA0 = IT 1


Modelos estáticos: Estimador IG desde la perspectiva MM
Las CO (condiciones de ortogonalidad) del estimador Intragrupos
utilizando desvios respecto a la media están dadas por:

E [Ψ(wi , θ )] = E e
xit yeit xit0 β
e
t = 1, 2..T

Notar que se requiere que se satisfaga el supuesto de exogeneidad


estricta

E e
xit yeit xit0 β
e = 0 ()
xi 1 + xi 2 + ... + xiT vi 1 + vi 2 + ... + viT
E xit vit =0
T T
Modelos estáticos: Estimador IG desde la perspectiva MM
El supuesto de exogeneidad estricta es muy "restrictivo". Notar
que, por ejemplo, la existencia de feed-backs desde los shocks en t
hacia las x futuras viola dicho supuesto.
Si escribieramos las CO correspondientes a los estimadores
VD_MCO, PD_MCG y DO encontraríamos que también se
requiere el cumplimiento del supuesto de exogeneidad estricta para
que las CO se cumplan y por lo tanto que el estimador IG sea
consistente.
Sin embargo, existen algunas alternativas para encontrar
estimadores para β cuya consistencia dependa de supuestos menos
restrictivos.
Modelos estáticos: Estimadores alternativos al IG desde la
perspectiva MM
Primeras diferencias MCO:

E [Ψ(wi , θ )] = E ∆xit ∆yit ∆xit0 β t = 2..T


Para que las CO anteriores se cumplan se requiere que se satisfaga
el siguiente supuesto:

E [(xit xit 1 ) (vit vit 1 )] =0

La existencia de feed-backs no violaría dicho supuesto en el caso


que el efecto demore más de un período en manifestarse....
Notar que también podríamos escribir las siguientes CO
E [xit (∆yit ∆xit0 β)] = 0. Ejercicio: encontrar el supuesto
necesario para que dichas CO sean válidas.
Modelos estáticos: Estimadores alternativos al IG desde la
perspectiva MM
Un estimador basado en desvíos ortogonales:
E [Ψ(wi , θ )] = E xit j yit xit 0 β
t = 2, 3, ...T j = 1, 2....t 1
T
1
yit = yit
T t ∑ yis
s =t +1
T
1
xit = xit
T t ∑ xis
s =t +1

Para que las CO anteriores se cumplan se requiere que se satisfaga


el siguiente supuesto:
vit +1 + vit +2 + ..viT
E xit j vit =0
T t
t = 2, 3, ...T j = 1, 2....t 1
Notar que la existencia de feek-backs desde los shocks hacia las x
no generaría problemas de inconsitencia para este estimador.
Heterocedasticidad y correlación serial
Supongamos ahora que E (vit j xi 1 ........xiT η i ) = 0 se cumple pero
E (vi vi0 j xi 1 ........xiT η i ) = σ2 IT no. Escribimos

E (vi j xi ) = 0
Var (vi j xi ) 6= σ2 IT

La fórmula
0 1
d b
Var βIG b2 X X
= σ
X = (In A) X
y = (In A) y
1
b2 =
σ (y X b
βIG )0 (y X b
βIG )
N (T 1) k

no es un estimador consistente de la varianza del estimador.


Tenemos:
0
!
X X p 1 N
∑ Xi
0
N b
βIG β = vi
N N i =1

0
Si se cumple E Xi vi = 0 el lado derecho es una media
muestral con media 0 a la que se puede aplicar el TCL
(considerando el caso de T …jo y N ! ∞)
N
1
∑ Xi
0 d 0 0
vi ! N 0, E Xi vi vi Xi
N i =1

Entonces, el estimador de la varianza de b βIG robusto a


heterocedasticidad y correlación serial (T …jo, N grande) puede
obtenerse a traves de
!
N
1 1 1

0 0 0 0
d b
Var βIG = X X Xi vbi vbi Xi X X
N i =1

vbi = (yi Xi b
βIG ). Sin embargo, esta alternativa no será
adecuada para casos con T grande y N …jo.
Estimador MCG óptimo ante heterocedasticidad y
autocorrelación de forma no conocida
0
E vi vi j xi = Var (vi j xi ) = Ω (xi )
El estimador óptimo (no factible) está dado por
" # 1
N N
βUGLS = ∑ Xi Ω (xi ) 1 Xi ∑ Xi Ω (xi )
0 0
b 1
yi
i =1 i =1

Un estimador factible, semi-paramétrico podría utilizar un


0
estimador de E vi vi j xi basado en los residuos del estimador
IG (bajo condiciones de regularidad y la elección de un estimador
no paramétrico apropiadoel estimador b βFGLS puede alcanza la
b
misma e…ciencia que el βUGLS (con N grande).
Un caso especial (robusto a heterocedasticidad en la serie temporal
y autocorrelación, no a heterocedasticidad condicional en x):
N
b = 1
b (xi ) = Ω
Ω ∑ vbi vbi
0

N i =1
Estimador GMM bajo heterocedasticidad y autocorrelación
de forma no conocida.

E (vi j xi ) = 0 ) E (h (xi ) vit ) = 0 t = 1, ..T 1


si Ω (xi ) = σ2 IT el instrumento óptimo será h (xi ) = ∑N 0
i =1 Zi Xi y
0
las condiciones de momentos óptimas E Xi vit = 0, la varianza
del correspondiente estimador del método de los momentos (que
en este caso es el estimador MCO de la transformación en desvíos
ortogonales o en desvíos respecto a la media) no podrá ser
reducida utilizando instrumentos alternativos.
Para Ω (xi ) arbritaria, las condiciones de momentos óptimas serán
0
E Xi Ω 1
(xi ) vit = 0 que coincide con el estimador UGLS,
pero que no puede ser utilizado directamente porque Ω (xi ) no es
conocido.
Sin embargo, puede obtenerse mejoras de e…ciencia cuando
Ω (xi ) 6= σ2 IT
Estimador GMM bajo heterocedasticidad y autocorrelación
de forma no conocida.
Una posibilidad es considerar
0 0
E (vi xi ) = E Zi vi = E Zi (yi Xi β) = 0
0
Zi = IT 1 xi

en este caso, el estimador GMM óptimo está dado por:


" ! !# 1 ! !
N N N N
∑ Xi ∑ ∑ Xi ∑ Zi yi
0 0 0
b
βGMM = Zi AN Zi0 Xi Zi AN
i =1 i =1 i =1 i =1
El cáracter óptimo del estimador GMM depende de la elección de
AN que tiene que ser un estimador consistente de (escalado por
0 0
una constante) E Zi vi vi Zi
0 0 0
Si Ω (xi ) = σ2 IT : entonces E Zi vi vi Zi = σ2 E Zi Zi y por
1
lo tanto la opción óptima es AN = ∑N 0
i =1 Zi Zi . En este caso,
el estimador resultante es numericamente el mismo que el
estimador Intragrupos, porque las columnas de Xi son
combinaciones lineales de las columnas de Zi
Estimador GMM bajo heterocedasticidad y autocorrelación
de forma no conocida.
En general, una selección óptima bajo heterocedasticidad y
autocorrelación será
! 1
N
∑ Zi vbi vbi
0 0
AN = Zi
i =1

El estimador resultante, al que denominamos b βOGMM será


b
asintóticamente equivalente al βIG bajo el supuesto 2, pero más
e…ciente cuando existe heterocedasticidad y/o autocorrelación. La
relación entre las varianzas de los estimadores será

Var b
βUGLS Var b
βOGMM Var b
βWG

con igualdad si el supuesto 2 es válido.


2.3 Estimador entre-grupos

" # 1 " #
N N
b
βBG = ∑ (xi x)0 (xi x) ∑ (xi x) 0 (y i y) (10)
i =1 i =1ii

Para que bβBG sea consistente se requiere que las x estén


incorrelacionadas con el error, pero de todos modos siempre será
ine…ciente.
Utilidad: cálculo de la varianza en estimador Balestra-Nerlove y
cuando hay errores de medida.
2.4 Modelo de Componentes de error
2.4.1. Modelo básico
El modelo de partida es uno del tipo:

yit = µ + η i + vit (11)

con

vit iid (0, σ2 )


ηi iid (0, σ2η )

vit y η i independientes uno del otro


El objetivo es separar la varianza del modelo en dos componentes:
uno permanente σ2η y otro transitorio σ2 .
Este modelo dice que existe una fracción

σ2η
σ2η + σ2

de la varianza que se mantiene constante a través del tiempo.


b
ηi = y i y (i = 1, 2, ....N ) (12)

N T
1
N (T 1) i =1 t∑

b2 =
σ (yit y i )2 (13)
=1
1 N
b2
σ
b2η
σ =
N ∑ (y i y )2
T
(14)
i =1

Problema: no negatividad no está asegurada.


El modelo de regresión con componentes de error:

yit = xit0 β + ui (15)


ui = η i + vit (16)

con

vit iid (0, σ2 )


ηi iid (0, σ2η )

vit yη i independientes uno del otro


ui j xi iid (0, Ω)
0 1
σ2η + σ2 σ2η σ2η
Ω=@ σ2η + σ2 σ2η A
2
ση + σ 2
Aquí supongo que η i y xi están incorrelacionadas. Entonces, si el
objetivo fuera estimar β de forma consistente: MCO en un corte
transversal. " # " # 1
N N
b
βMCO = ∑ Xi0 Xi ∑ Xi0 yi (17)
i =1 i =1

Pero aquí el interés no está en los β. El panel se utiliza para poder


separar los componentes de error en:
I variación entre individuos que se mantiene estable en el
tiempo (por ejemplo las diferencias salariales originadas en el
capital humano de los individuos),
I variación que se origina en shocks idiosincráticos.
El procedimiento que se sigue es utilizar MCG.
" # 1 " #
N N
b
βMCG = ∑ Xi0 Ω 1 Xi ∑ Xi0 Ω 1 yi (18)
i =1 i =1
Pero aquí MCG son no factible, conozco la forma que tendrá pero
no conozco σ2η ni σ2 . Entonces lo que se hace es estimar por
MCGF utilizando estimaciones consistentes de σ2η y σ2 . Una
alternativa es utilizar1 :
N T
1 2
b2 =
σ
N (T 1) k ∑∑ yeit xit0 b
e βWG
i =1 t =1

1 N 2 b2
σ
b2η
σ =
N ∑ yi x it0 b
βBG
T
(19)
i =1

yei = yi y i ; = y i ∑Ti=1 yit ; e


xi = xi x i ; x i = ∑Ti=1 xit El
estimador así obtenido es el denominado estimador de
Balestra-Nerlove, también conocido como estimador del Modelo de
Efectos aleatorios. Este estimador también es habitualmente
presentado como la regresión MCO de yit θy i sobre una
2
constante y xit θx i donde θ = b2 σb b2 .
σ +T σ η

1 También se podría utilizar el estimador b b2 y σ


βMCO para obtener σ b2η .
2.5 Contrastes de modelos
Modelo de efectos …jos (MFE) contra modelo efectos aleatorios
(MFA): es engañoso, no dice que en realidad lo que se contrasta es
la correlación entre los regresores y el error de la ecuación en
niveles. Además, ninguno de los dos modelos se pregunta sobre esa
correlación. MFE asume que hay correlación y MFA asume que no
hay correlación.
a) Contraste de Hausman
Tengo dos estimadores:

b
θE
b
θR
b
θ E es un estimador consistente y e…ciente bajo la hipótesis nula
(por ejemplo MCO en una regresión lineal de un modelo
homocedástico, bajo la hipótesis de no correlación entre las x y el
error)
b
θ R es un estimador consistente tanto bajo la hipótesis nula como
bajo la hipótesis alternativa, pero (probablemente) menos e…ciente
(por ejemplo IV) que b θ E bajo la nula
Hausman demostró que el estadístico
0h i 1
h = b
θR b θE b b
V θR b θE b
θR b θE (20)
0h i 1
= bθ R bθ E b b
V θR Vb b
θE b
θR b θE

y este estadístico se distribuye asintóticamente como una χ2k .


Aplicado a los estimadores de datos panel:

b
θE = b
βBN
b
θR = b
βWG

Notar: Balestra-Nerlove será e…ciente si los errores del modelo


original son homocedásticos. Esto no suele cumplirse.
b) Constraste de Sargan
Alternativa: puedo estimar por MGM el siguiente sistema

E xi yit xit0 β = 0 (21)


E xi ∆yi 2 ∆xi02 β = 0 (22)

E xi ∆yiT 0
∆xiT β = 0 (23)

Tengo K T condiciones de momentos, puedo hacer un contraste


incremental de Sargan, que será equivalente a realizar un contraste
de Hausman.
Otra alternativa Arellano (1993) (no lo veremos)
2.6. Modelo con errores en los regresores
Consideremos el siguiente modelo lineal para un corte transversal:

yi = α + βxi + vi (24)

Observamos (yi , xi ) con xi = xi + εi .


Suponemos que todos los no observables xi , vi y εi son
mutuamente independientes con varianzas σ2 , σ2v y σ2e

cov (yi , xi )
β=
var (xi )

cov (yi , xi ) 1
p lim b
β= =β
var (xi ) 1+λ
donde λ = σ2 /σ2e .
Dos alternativas para enfrentar el problema:
1. Utilizando una estimación de λ.
2. Si se cuenta con una medición alternativa zi = xi + ζ i .En
este caso procedemos estimando por MGM
2.6.2 Sesgo por error de medida y sesgo por heterogeneidad
inobservable
Modelo

yi = α + βxi + η i + vi
xi = xi + εi .

Los inobservables son idependientes excepto xi y η i

cov (yi , xi ) cov (η i + vi βεi , xi )


= β+
var (xi ) var (xi )
cov (η i , xi ) σ2e
= β+ β
σ2 + σ2e σ2 + σ2e
Errores de medida en el modelo en primeras diferencias
cov (∆yi 2 , ∆xi 2 ) 1
β = =β
var (∆xi 2 ) 1 + λ∆
λ∆ = var (∆εi 2 )/var (∆xi 2 ) > λ
2.6.3 Variables instrumentales con datos panel
Si se supone que el error de medida es iid a través del tiempo, que
no hay efectos individuales y que existen T > 2 observaciones para
cada individuo se podría estimar β de forma consistente a partir de
las siguientes condiciones de ortogonalidad
20 1 3
1
6B x C 7
6B i1 C 7
6B . C 7
6B C 7
6B . C 7
6B C 7
6B C 7
E 6B xi (t 1 ) C (yit α + βxit )7 = 0 (t = 1, 2...T )
6B C 7
6 B xi ( t + 1 ) C 7
6B C 7
6B . C 7
6B C 7
4@ . A 5
xiT
Suponiendo que existen efectos individuales y que hay disponibles
T > 3 observaciones para cada individuo
20 1 3
xi 1
6B . C 7
6B C 7
6B . C 7
6B C 7
6B xi (t 2 ) C 7
E6 B
6B xi (t +1 )
C (∆yit
C β∆xit )7
7=0 (t = 2, 3...T )
6B C 7
6B . C 7
6B C 7
4@ . A 5
xiT

Notar que requerimos que cov (xit , xi (t +j ) ) 6= 0 si x es RB


entonces el modelo no está identi…cado.

También podría gustarte