Está en la página 1de 19

Modelos de datos de panel de efectos no 1

observados lineales básicos

que tiene rango T - 1. El rango deficiente en la expresión (10.60) causa problemas para
el enfoque habitual de GLS, porque la matriz de varianza no se puede invertir. Una
forma de proceder es utilizar un inverso generalizado. Un enfoque mucho más fácil, y
uno que resulta ser algebraicamente idéntico, es eliminar uno de los períodos de
tiempo del análisis. Se puede demostrar (ver Im, Ahn, Schmidt y Wooldridge, 1999) que
no importa cuál de estos períodos de tiempo se descarte: el estimador de GLS
resultante es el mismo.
Para ser concretos, suponga que descartamos el período de tiempo T, dejando las
ecuaciones
y€I1 ¼ X€ i1 B þ tu€ yo1
.
. ð10:
61Þ
y€I; T—1 ¼ X€ I; T—1B þ tu€I;
T—1

Para que no tengamos que introducir una nueva notación, escribimos el sistema
(10.61) como ecuación (1 0 ,4 9 ) , in ge n io h th mi en tend iendo gramo e s o t N o w
€ yi es ðT - 1Þ × 1, X € I es ðT - 1Þ × K,y € ui es ðT - 1Þ × 1. Defina la matriz ðT - 1Þ × ðT -
1Þ positiva definida W 1 Eð € ui € ui0Þ. No necesitamos hacer explícita la dependencia
de W en L y QT; el punto clave es que, si no se imponen restricciones a L, W tampoco
está restringido.
Para estimar W, estimamos b mediante efectos fijos en la primera etapa. Después
de caer
thmi último período de tiempo para cada i, defina los residuos ðT - 1Þ × 1 u ^ u ^ , yo ¼
F
ui ¼ € yi - X € ib ^ E
1; 2; ...; N. Un estimador consistente de W es

W^ ¼ N n
—1 or ^ui ^ uuI
0
ð10: 62Þ
X
te

I¼1

El estimador de efectos fijos GLS (FEGLS) se define por


—1
n -1 X€ 0 W^ €yI !
B^FEGLS ¼ or X€ 0 W^
te !
—1 € X norte
X I X I
I¼1 I
I¼1

dondemiX € i e y € yi se de fi nen con el último período eliminado. Para mantener la


coherencia de FEGLS, reemplazamos el Supuesto FE.2 con una nueva condición de rango:

assumptionorte FEGLS.2: corriók


I EðX € 0 W—1X€ IÞ ¼ K:
2 Capítulo 10

Bajo los supuestos FE.1 y FEGLS.2, el estimador FEGLS es consistente. Cuando


agregamos el supuesto FEGLS.3, la varianza asintótica es fácil de estimar:

Av ^ !—1
n
arðb ^ €I 0
or X W^
te
—1 €
FEGL Þ¼ X X I
S I¼1
La suma de las estadísticas residuales cuadradas de FGLS se puede utilizar para
probar múltiples restricciones. Tenga en cuenta que G = T - 1 en el estadístico F en la
ecuación (7.53).
El estimador FEGLS fue propuesto por Kiefer (1980) cuando los ci se tratan como
parámetros. Como acabamos de mostrar, el procedimiento estima consistentemente b
cuando vemos ci como aleatorio y permitimos que se correlacione arbitrariamente con
xit.
El estimador FEGLS es asintóticamente no menos eficiente que el estimador
FEbajo el supuesto FEGLS.3, incluso cuando Lt ¼ s2IT. Generalmente,t si L 0 s2IT,
FEGLS u u

es más eficiente que FE, pero esta conclusión se basa en las asintóticas de N grande
y T fijo. Desafortunadamente, debido a que FEGLS todavía usa la transformación de
efectos fijos para eliminar ci, puede tener grandes errores estándar asintóticos si las
matrices X € i tienen col-
umns cercanos a cero.
En lugar de permitir que W sea una matriz sin restricciones, podemos imponer
restricciones a L que implican que W tiene una forma restringida. Por ejemplo,
Bhargava, Franzini y Narendranatahn (1982) (BFN) asumen que fuitg sigue un AR
homocedástico estable (1)
modelo. Esta suposición implica que W depende de solo tres parámetros, s2, s2 y
cu
el coeficiente AR, r, no importa cuán grande sea T. BFN obteneruna
transformación que
elimina el efecto no observado, ci, y elimina la correlación serial en uit. También
proponen estimadores de r, de modo que sea posible GLS factible. Modelar fuitg
como un proceso de serie de tiempo específico es atractivo cuando N no es muy
grande en relación con T, ya que la estimaciónuna matriz de covarianza no restringida
para € ui [el vector ðT - 1Þ × 1 de errores degradados en el tiempo] sin N grande puede
conducir a un desempeño deficiente de la muestra finita del estimador FGLS. Sin
embargo, las únicas afirmaciones generales que podemos hacer se refieren a fijos: ¡T,
N! y asintóticas. En este escenario, el estimador FGLS que usa W sin restricciones no es
menos asintóticamente eficiente que un estimador FGLS que pone restricciones en
W. Y, si las restricciones sobre W son incorrecto, el estimador que impone las
restricciones es menos eficiente asintóticamente. Por lo tanto, por motivos
teóricos, preferimos un estimador del tipo de la ecuación (10.62).
10.5.6 Uso de la estimación de efectos fijos para el análisis de políticas
Hay otras formas de interpretar la transformación de efectos fijos para ilustrar por qué
los efectos fijos son útiles para el análisis de políticas y la evaluación de programas.
Considere el modelo
yeso ¼ xitb þ vit ¼ zitg þ idiota þ vit
donde vit puede contener o no un efecto no observado. Sea wit la variable política de
interés; puede ser continuo o discreto. El vector zit contiene otros controles que
podrían estar correlacionados con el ingenio, incluidas las variables ficticias de período
de tiempo.
Como ejercicio, puede demostrar que lo suficiente para la consistencia de los efectos
fijos, junto con la condición de rango FE.2, es
E½xI0tDvit - viÞ] ¼ 0; t ¼ 1; 2; . . . ; T
Este supuesto muestra que cada elemento de xit, y en particular la variable de
política wit, puede correlacionarse con vi. Lo que los efectos fijos requieren para la
coherencia es que el ingenio no esté correlacionado con las desviaciones de vit del
promedio durante el período de tiempo. Entonces una políticaLa variable, como la
participación en el programa, se puede relacionar sistemáticamente con el componente
persistente en el error vit, medido por vi. Es por esta razón que FE suele ser superior a
OLS agrupados o efectos aleatorios para aplicaciones donde la participación en un
programa está determinada por atributos preprogramados que también lo afectan.

10.6 Primeros métodos de diferenciación

10.6.1 Inferencia
En la sección 10.1 usamos la diferenciación para eliminar el efecto no observado ci con
T = 2. Ahora estudiamos la transformación diferencial en el caso general del modelo
(10.41). Para completar, expresamos el primer supuesto de la siguiente manera:
suposición FD.1: Igual como Supuesto FE.1.
Enfatizamos que el modelo y la interpretación de b son exactamente como en la Sección
10.5. Lo que difiere es nuestro método para estimar b.
Retrasar el modelo (10.41) un período y restar da
D yeso ¼ Dxitb þ Duit; t ¼ 2; 3;. . . ; T ð10:
63Þ
donde D yit ¼ yit - yi; t — 1, Dxit ¼ xit - xi; t — 1 y Duit ¼ uit - ui; t — 1. Como con la
FEtransformación, esta transformación de primera diferenciación elimina el efecto no
observado ci. Al diferenciar, perdemos el primer período de tiempo para cada sección
transversal: ahora tenemos períodos de tiempo T - 1 para cada i, en lugar de T. Si
comenzamos con T ¼ 2, entonces, después de la diferencia
A diferencia, llegamos a un período de tiempo para cada sección transversal: D yi2 ¼
Dxi2b þ Dui2.
La ecuación (10.63) aclara que los elementos de xit deben variar en el tiempo
(para al menos algunas unidades de sección transversal); de lo contrario, Dxit tiene
elementos que son idénticamente cero para todo i y t. Además, mientras que la
intersección en la ecuación original se diferencia, la ecuación (10.63) contiene
cambios en las variables ficticias de tiempo si xit contiene variables ficticias de
tiempo. EnEn el caso de T = 2, el coeficiente de la variable ficticia de tiempo del
segundo período se convierte en el intercepto en la ecuación diferenciada. Si
diferenciamos la ecuación general (10.43) obtenemos
D yeso ¼ y2ðDd2tÞ þ ··· þ yT ðDdTtÞþ ðDd2tÞzig2
þ · · · þ DDdTtÞzigT þ Dwitd þ Duit ð10:
64Þ
Los parámetros y1 y g1 no se identifican porque desaparecen de la ecuación
transformada, al igual que con los efectos fijos.
La primera diferencia (FD) estimador, F , es el estimador MCO agrupado de la
b^ D

regresión
D yeso en Dxit; t ¼ 2; . . . ; T; I¼ 1; 2;. . . ; norte
ð10:sesenta y cincoÞ
Bajo el supuesto FD.1, la estimación combinada de MCO de las ecuaciones con la
primera diferencia será consistente porque

miDDxI0tDuitÞ ¼ 0; t ¼ 2; 3; . . . ; T ð10: 66Þ


Por lo tanto, se cumple el supuesto POLS.1 de la sección 7.8. De hecho, la exogeneidad
estricta se cumple en la primera ecuación diferenciada:
EðDuit j Dxi2; Dxi3; ...; DxiT Þ¼ 0; t ¼ 2; 3;. . . ; T
lo que significa que el estimador FD es en realidad insesgado condicional en X.
Para llegar al supuesto (10.66), claramente podemos arreglárnoslas con un supuesto
más débil que el supuesto FD.1. El punto clave es que el supuesto (10.66) falla si uit se
correlaciona con xi; t — 1, xit o xi; tþ1, por lo que asumimos que xis no está
correlacionado con uit para todo t y s.
Para completar, indicamos la condición de rango para el estimador FD:
assumptionorte FD.2: rango PT EðDx0 DxitÞ ¼ K.
t¼2 e
s
o

En la práctica, el supuesto FD.2 descarta las variables explicativas constantes en el


tiempo y la colinealidad perfecta entre las variables que varían en el tiempo.
Suponiendo que los datos se han ordenado como discutimos anteriormente, la
primera diferenciación es fácil de implementar siempre que llevemos un registro de
qué observaciones transformadas son válidas y cuáles no. Diferencias para los
números de observación 1, T þ 1, 2T þ 1;3T þ 1; ...; y ðN - 1ÞT þ 1 debe establecerse
en missing. Estas observaciones corresponden al primer período de tiempo para cada
unidad de sección transversal en el conjunto de datos original; por definición, no hay
primera diferencia para las observaciones t = 1. Se necesita un poco de cuidado para
que las diferencias entre el primer período de tiempo para la unidad i þ 1 y el último
período de tiempo para la unidad i no se consideren observaciones válidas. Asegurarse
de que estos se establezcan como perdidos es fácil cuando se han incluido variables
ficticias de un año o un período de tiempo en el conjunto de datos.
Una razón para preferir el FD estimador al estimador FE es que FD es más fácil
de implementar sin software especial. ¿Existen razones estadísticas para
preferir FD a FE? Recuerde que, en los supuestos FE.1-FE.3, el estimador de
efectos fijos es asintomático.
Totalmente eficientes en la clase de estimadores que utilizan el supuesto estricto
de exogeneidad FE.1. Por lo tanto, el primer estimador de diferencia es menos
eficiente que los efectos fijos de los supuestos FE.1-FE.3. El supuesto FE.3 es clave
para la eficiencia de FE. Asume homocedasticidad y no correlación serial en uit.
Suponiendo que el fuit: t ¼1; 2; ... Tg no están correlacionados en serie puede ser
demasiado fuerte. Un supuesto alternativo es que la primera diferencia de los errores
idiosincrásicos es 1 Duit; t = 2; ...; Tg, no están correlacionados en serie (y tienen
varianza constante):
assumptionorteFD.3: Eðeiei0 j xi1; ...; xiT; ciÞ¼ s2IT
m — 1, donde ei es el ðT - 1Þ × 1
vector que contiene eit, t = 2; ...; T. i

Bajo el supuesto FD.3 podemos escribir uit ¼ ui; t — 1 þ eit, de modo que ninguna
correlación serial en el eit implica que uit es un paseo aleatorio. Un paseo aleatorio
tiene una dependencia serial sustancial, por lo que el Supuesto FD.3 representa un
extremo opuesto al Supuesto FE.3.
Bajo los supuestos FD.1-FD.3 se puede demostrar que el estimador FD es más
eficiente en la clase de estimadores que utilizan el supuesto estricto de
exogeneidad FE.1. Además, a partir del análisis MCO agrupado de la Sección 7.8,
Av ^ arðb ^ Þ ¼ s^ 2DDX0 DXÞ — 1 ð10: 67Þ
F m
D
dondemi s ^ 2
esi un estimador consistente de s2. El estimador más simple se obtiene
comparando
ee
poniendo los residuales de OLS

mi^eso ¼ D yeso - Dx ^ ð10:


F itb
D 68Þ
de la regresión agrupada (10,65). Un estimador consistente de s2 es
m
i
s^2 ¼ ½NðT - 1Þ— K] Xnorte
—1

m XT ð10:
i 2m
e
69Þ
I¼1 t¼2 si

que es lo habitual estimador de la varianza del error de la regresión (10,65). Estas


ecuaciones muestran que, bajo los supuestos FD.1-FD.3, los errores estándar de
MCO habituales de la primera regresión de diferencia (10.65) son asintóticamente
válidos.
A diferencia de la regresión FE (10.48), el denominador en la ecuación (10.69) se
obtiene correctamente de la regresión (10.65). Eliminar el primer período de
tiempo captura adecuadamente los grados de libertad perdidos (N de ellos).
Bajo el supuesto FD.3, todas las estadísticas informadas de la regresión agrupada
sobre los primeros datos diferenciados son asintóticamente válidas, incluidas las
estadísticas F basadas en sumas de residuos cuadrados.
10.6.2 Matriz de varianza robusta

Si se viola el supuesto FD.3, entonces, como de costumbre, podemos calcular una


matriz de varianza robusta. El estimador de la ecuación (7.26) aplicado en este
contexto es

Av ^ arðb ^ Þ ¼ -1 —1
DDX0 DXÞ DXI0^ei ^ !DDX0 DXÞ ð10:
F
D norte 0 70Þ
eI DXi
X

1

donde DX denota la matriz NðT - 1Þ × K de las primeras diferencias apiladas de xit.


Ejemplo 10.6 (Estimación DF de los efectos de las subvenciones para formación
laboral): Ahora calculamos el efecto de las subvenciones de formación laboral en
logðscrapÞ utilizando la primera diferenciación. Específicamente, utilizamos MCO
agrupados en
DlogðscrapitÞ¼ d1 þ d2d89t þ b1Dgrantit þ b2Dgranti; t—1 þ Duit
En lugar de diferenciar las variables ficticias del año y omitir la intersección,
simplemente incluimos una intersección y una variable ficticia para 1989 para capturar
los efectos de tiempo agregados. Si estuviéramos específicamente interesados en los
efectos del año del modelo estructural (en niveles), entonces también deberíamos
diferenciarlos.
La ecuación estimada es

Dlogð ^ chatarraÞ¼ -:
091 - : 096 d89 - : 223 Dgrant - : 351 Dgrant—1
D: 091Þ D: 125Þ D: 131Þ D: 235Þ
½: 088] ½: 111] ½: 128] ½: 265]

R2 ¼: 037
donde los errores estándar habituales están entre paréntesis y los errores estándar
robustos entre paréntesis. Reportamos R2 aquí porque tiene una interpretación útil:
mide la cantidad de variación en el crecimiento en la tasa de desperdicio que se explica
por Dgrant y Dgrant — 1 (y d89). Las estimaciones de la subvención y la subvención — 1
son bastante similares a las estimaciones de efectos fijos, aunque la subvención ahora
es estadísticamente más significativa que la subvención — 1. La prueba F habitual para
la significación conjunta de Dgrant y Dgrant — 1 es 1,53 con un valor de p ¼: 222.
10.6.3 Prueba de correlación serial
DebajoSupuesto FD.3, los errores eit 1 Duit no deben correlacionarse en serie.
Podemos probar fácilmente esta suposición dados los residuales de MCO
agrupados de la regresión(10,65). Dado que se cumple el supuesto de exogeneidad
estricta, podemos aplicar la forma simple de la prueba de la sección 7.8. La regresión se
basa en períodos de tiempo T - 2:
mi^eso ¼ r^1 mi^yo; t—1 þ errorit; t ¼ 3; 4; . . . ; T; I ¼ 1; 2; . . . ; norte ð10: 71Þ
Thmi test statistiC Is thmi usual t statistiC onorte r ^ 1. Ingenioh T ¼ 2 estos test Is
Not disponible, ni es necesario. Con T = 3, la regresión (10.71) es solo una regresión de
sección transversal porque perdemos los períodos de tiempo t = 1 y t = 2.
Si los errores idiosincrásicos son: t = 1; 2; ...; Tg no están correlacionados al principio,
feit: t = 2; 3; ...; Tg se correlacionará automáticamente. De hecho, bajo el supuesto FE.3
se muestra fácilmente que Corrðeit; ei; t — 1Þ¼ -: 5. En cualquier caso, el hallazgo de
una correlación serial significativa en el eit justifica calcular la matriz de varianza
robusta para el estimador FD.
Ejemplo 10.6 (continuación): Probamos la correlación serial AR (1) en la primera
ecuación diferenciada regresando e ^ it sobre e ^ i; t — 1 usando el año 1989.
Obtenemos r ^1 ¼ : 237 ingenioh t estadística
¼ 1,76. Hay evidencia marginal de correlación serial positiva en las primeras
diferencias
Duit. Más, r ^ 1 ¼ : 237 Is very di¤erent de un lado a otrometro r1 ¼ -: 5, queh Is
implicarD By thmi Stan- Dard efectos aleatorios y fijos suposición de que las uit no
están correlacionadas en serie.

Una alternativa para calcular errores estándar robustos y estadísticas de prueba es


utilizar un análisis FDGLS bajo el supuesto de que Eðeiei0 j xiÞ es una matriz constante
ðT - 1Þ × ðT - 1Þ. Omitimos los detalles, ya que son similares al caso FEGLS en la Sección
10.5.5. As con FEGLS, podríamos imponer una estructura a Eðuiui0Þ, como un modelo AR
(1) estable y homoesdástico, y luego derivar Eðeiei0Þ en términos de un pequeño
conjunto de parámetros.
10.6.4 Análisis de políticas utilizando la primera diferenciación
Primero, diferenciar una ecuación estructural con un efecto no observado es un
método simple pero poderoso de evaluación de programas. Se pueden abordar
muchas preguntas teniendo un conjunto de datos de panel de dos años con grupos
de control y tratamiento disponibles en dos momentos.
Al aplicar la primera diferenciación, debemos diferenciar todas las variables que
aparecen en la ecuación estructural para obtener la ecuación de estimación,
incluido cualquier indicador binario que indique participación en el programa. Las
estimaciones deben interpretarse en la ecuación original porque nos permite
pensar en comparar diferentes unidades en la cruzsección en cualquier momento,
donde una unidad recibe el tratamiento y la otra no.
En un caso especial, no importa si la variable de política está diferenciada.
Suponga que T = 2, y que progit denote un indicador binario puesto a uno si la persona i
estaba en el programa en el momento t. Para muchos programas, progi1 = 0 para todo
i: nadie participó en el programa en el período de tiempo inicial. En el segundo período
de tiempo, progi2 es unidad para quienes participan en el programa y cero para quienes
no lo hacen. En este caso, Dprogi ¼ progi2, y la primera ecuación diferenciada se puede
escribir como
D yI2 ¼ y2 þ Dzi2g þ d1progi2 þ Dui2 ð10:
72Þ
El efecto de la política se puede obtener haciendo una regresión del cambio en y sobre
el cambio en zy el indicador de política. Cuando se omite Dzi2, la estimación de d1 de la
ecuación (10.72) es el estimador de diferencias en diferencias (DID) (consulte el
problema 10.4):
D^1¼ Tratar - D ycontrol. Esto es similar al estimador DID de la Secció n 6.3; consulte
ecuación (6.32), pero hay una diferencia importante: con datos de panel, las diferencias
a lo largo del tiempo son para las mismas unidades de sección transversal.
Si algunas personas participaron en el programa en el primer período de tiempo, o si
están involucrados más de dos períodos, la ecuación (10.72) puede dar respuestas
engañosas. En general, la ecuación que debe estimarse es
D yeso ¼ xt þ Dzitg þ d1Dprogit þ Duit ð10:
73Þ
donde el indicador de participación en el programa está diferenciado junto con
todo lo demás, y las xt son intercepciones de nuevos períodos. El ejemplo 10.6 es
uno de esos casos. Las extensiones del modelo, donde progit aparece en otras
formas, se analizan en el Capítulo 11.

10.7 Comparación de estimadores

10.7.1 Efectos fijos versus primera diferenciación

Cuando tenemos sólo dos períodos de tiempo, la estimación de efectos fijos y la


primera diferenciación producen estimaciones e inferencias idénticas, como se le pide
que muestre en el problema 10.3. La primera diferenciación es más fácil de
implementar y todos los procedimientos que se pueden aplicar a una sola sección
transversal, como la inferencia robusta a la heterocedasticidad, se pueden aplicar
directamente.
Cuando T> 2, la elección entre FD y FE depende de los supuestos sobre los
errores idiosincrásicos, uit. En particular, el estimador FE es más eficiente bajo el
supuesto FE.3 —las uit no están correlacionadas en serie— mientras que el
estimador FD es más eficiente cuando uit sigue un recorrido aleatorio. En muchos
casos, es probable que la verdad se encuentre en algún punto intermedio.
Si las estimaciones de FE y FD difieren de formas que no se pueden atribuir al
error de muestreo, deberíamos preocuparnos por el supuesto estricto de
exogeneidad. Si uit está correlacionado con xis para cualquier tys, FE y FD
generalmente tienen límites de probabilidad diferentes. Cualquiera de losLos
problemas de endogeneidad estándar, incluido el error de medición, las variables
omitidas que varían en el tiempo y la simultaneidad, generalmente causan correlación
entre xit y uit, es decir, correlación contemporánea, que luego hace que tanto FD como
FE sean inconsistentes y tengan diferentes límites de probabilidad. (Consideramos
explícitamente estos problemas en
Capítulo 11.) Además, la correlación entre uit y x es para s 0 t hace que FD y FE sean
inconsistentes. Cuando xit rezagado se correlaciona con uit, podemos resolver la
falta de exogeneidad estricta al incluir rezagos e interpretar la ecuación como un
modelo de rezago distribuido. Más problemático es cuando uit se correlaciona con
xit futuro: solo en raras ocasiones, poner valores futuros de variables explicativas
en una ecuación conduce a un modelo económico interesante. En el Capítulo 11
mostramos cómo estimar los parámetros de manera consistente cuando hay
retroalimentación de uit a xis, s> t.
Podemos probar formalmente los supuestos subyacentes a la consistencia de los
estimadores FE y FD utilizando una prueba de Hausman. Podría ser importante
utilizar una forma robusta de la prueba de Hausman que no mantenga ni el
Supuesto FE.3 ni el Supuesto FD.3 bajo la hipótesis nula. Este enfoque no es difícil
(consulte el problema 10.6), pero aquí nos centramos en las pruebas basadas en
regresiones, que son más fáciles de calcular.
Si T = 2, es fácil probar la exogeneidad estricta. En la ecuación D yi ¼ Dxib þ Dui, ni xi1
ni xi2 deben ser significativas como variables explicativas adicionales en la primera
ecuación diferenciada. Simplemente sumamos, digamos, xi2 a la ecuación FD y
realizamos una prueba F para determinar la significancia de xi2. Con más de dos
períodos de tiempo, una prueba de estricta
la exogeneidad es una prueba de H0: g = 0 en la ecuación expandida
D yt ¼ Dxtb þ wtg þ Dut; t ¼ 2; . . . ; T
donde wt es un subconjunto de xt (que excluiría las variables ficticias de tiempo).
Usando el enfoque de Wald, esta prueba se puede hacer robusta a la correlación
serial arbitraria o heteroescedasticidad; en los supuestos FD.1-FD.3, el estadístico F
habitual es asintóticamente válido.
Una prueba de exogeneidad estricta que utiliza efectos fijos, cuando T> 2, se
obtiene especificando la ecuación
yeso ¼ xitb þ wi; tþ1d þ ci þ uit; t ¼ 1; 2;.. . ; T- 1
donde wi; tþ1 es nuevamente un subconjunto de xi; tþ1. Bajo exogeneidad estricta, d =
0, podemos realizar la prueba usando la estimación de efectos fijos. (Perdemos el
último período de tiempo al guiar el ingenio). En el problema 10.12 se da un ejemplo.
Bajo estricta exogeneidad, podemos usar un procedimiento GLS en la ecuación
degradada en el tiempo o en la ecuación con la primera diferencia. Si la matriz de
varianza de ui no tiene restricciones, no importa qué transformación usemos.
Intuitivamente, este punto es bastante claro, ya que Permitirgramo miðuiui0Þ to Bmi
irrestrictoD lugars norteo restriccións onorte miðu€uiu € ui0Þ or miDDuiDui0Þ.
Im, Ahn, Schmidt y Wooldridge (1999) muestran formalmente que las FEGLS y
Los estimadores FDGLS son asintóticamente equivalentes bajo los supuestos
FE.1 y FEGLS.3 y las condiciones de rango apropiadas.
10.7.2 La relación entre los estimadores de efectos aleatorios y efectos fijos

En los casos en que las variables clave en xt no varían mucho con el tiempo, los efectos
fijos y los métodos de primera diferenciación pueden llevar a estimaciones imprecisas.
Es posible que nos veamos obligados a utilizar la estimación de efectos aleatorios para
aprender algo sobre los parámetros de la población. Si un análisis de efectos aleatorios
es apropiado, es decir, si ci es ortogonal axit, entonces los estimadores de efectos
aleatorios pueden tener varianzas mucho más pequeñas que los estimadores FE o FD.
Ahora obtenemos una expresión para el estimador RE que nos permite compararlo con
el estimador FE.
0
Usingramo thmi fact esot jT jT ¼ T, wmi Californianorte escriturami W under
thmi randometro efectos estructurami como
W ¼ s2ESO þ ¼ s IT þ Ts ðj0 Þ—1j 0
s2j j0 j 2 2 j
uc TT tu c TT T T
22 2 2
¼ stu ESO þ TsC PAGT ¼ ðstu þ TsC ÞðPT þ hQT Þ
donde PT 1 IT - QT ¼ j 0
T DJ
—1
Þ j 0 y h 1 s2 = ðs2 þ Ts2Þ. A continuación, defina
j TT T ST 1 t t C
PT þ hQT. EntoncesTS — 1 ¼ PT þ ð1 = hÞQT, comou puede
u verse por la multiplicación
directa de matrices.
ción. Además, S —T 1 = 2 ¼ PT þ ð1 = p ffi Th ffiffi ÞQ, porque multiplicar esta matriz por sí
misma
da S — 1 (la matriz es claramente simétrica, ya que PT y QT son simétricos).
Después T

simplmi álgebra, It Californianorte Bmi


T
shownorte esot S —1= 2 ¼ ð1 - lÞ —
pag ffiffiffi
1½IT - lPT ], dondemi l ¼ 1 - h .
Por lo tanto,
—1= 2 —1
W—1= 2 ¼ ðs2t þ Ts2ÞC ð1 - lÞ ½IT - lPT ] ¼ ð1= suÞ½ESO - lPT ]
u
1=2
dondemi l ¼ 1 - ½s2=ðs2
t t þ Ts2Þ]
C . Assummi for thmi moment esot wmi know l.
Lanorte la u u

El estimador de RE se obtiene estimando la ecuación transformada CT yi ¼ CT Xib þ


CT vi By sistemametro OLS, dondemi Connecticut 1 ½ESO - lPT ].
Escriturami thmi transformarD equati onorte como

yˇyI ¼ Xˇ I B þ ˇvi ð10: 74Þ


Thmi La matriz de varianza de ˇvi es Eðˇviˇvi0Þ¼ CT WCT t ¼ s2IT, que verifica que ˇvi tiene
Matriz de varianza ideal para la estimación de OLS delu sistema.
Thmi tt h element oF ˇyi Is fácily vernorte to Bmiyit - lyi, y de manera similar para
Xˇi. Por lo tanto, la estimación de MCO del sistema de la ecuación (10.74) es solo una
estimación combinada de MCO de
yeso - lyI ¼ ðxit - lxiÞb þ Dvit - lviÞ
sobre todo ty i. Los errores en esta ecuación no están correlacionados en serie y
son homoes- dásticos bajo el Supuesto RE.3; por lo tanto, satisfacen las
condiciones clave para el análisis de MCO agrupado. El estimador de ER factible
reemplaza el l desconocido con su esencia.
temporizador, l ^, R se puede calcular a partir de la regresión MCO agrupada
so esot B ^ E

yˇeso onorte X eso; t ¼ 1;


. . . ; T; I ¼ 1; . . . ; norte ð10: 75Þ

También podría gustarte