Está en la página 1de 19

10 Modelos de datos de panel de efectos no observados lineales básicos

En el Capítulo 7 cubrimos una clase de modelos de datos de panel lineal donde, como
mínimo, se asumió que el error en cada período de tiempo no estaba correlacionado
con las variables explicativas en el mismo período de tiempo. Para ciertas aplicaciones
de datos de panel, esta suposición es demasiado fuerte. De hecho, una motivación
principal para usar datos de panel es resolver el problema de las variables omitidas.
En este capítulo estudiamos modelos de población que contienen explícitamente un
efecto no observado, constante de tiempo. El tratamiento en este capítulo es
"moderno" en el sentido de que los efectos no observados se tratan como variables
aleatorias, extraídas de la población junto con las variables explicadas y explicativas
observadas, en contraposición a los parámetros a estimar. En este marco, la cuestión
clave es si el efecto no observado no está correlacionado con las variables explicativas.

10.1 Motivación: el problema de las variables omitidas

Es fácil ver cómo se pueden usar los datos de panel, al menos bajo ciertos supuestos,
para obtener estimadores consistentes en presencia de variables omitidas. Sea y y x 1
(x1; x2; ...; Xk) ser variables aleatorias observables, y sea c un rango no observable
variable dom; el vector ( y; x1; x2; ...; xK; c) representa la población de interés. Como
Como suele ser el caso de la econometría aplicada, nos interesan los efectos parciales
de las variables explicativas observables xj en la función de regresión poblacional.

10: 1
En palabras, nos gustaría mantener c constante al obtener efectos parciales de las
variables explicativas observables. Seguimos a Chamberlain (1984) al usar c para
denotar la variable no observada. Gran parte de la literatura sobre datos de panel utiliza
una letra griega, como a o f, pero queremos enfatizar que lo no observable es una
variable aleatoria, no un parámetro a estimar. (Discutiremos este punto con más detalle
en la Sección 10.2.1.)
Suponiendo un modelo lineal, con c ingresando aditivamente junto con xj,
tenemos

ð10: 2
dóndeel interés radica en el vector K × 1 b. Por un lado, si c no está correlacionado con
cada xj, entonces c es simplemente otro factor no observado que afecta a y que no está
sistemáticamente relacionado con las variables explicativas observables cuyos efectos
son de interés. Por otro lado, si Covðxj; cÞ 0 0 para algunos j, poner c en el término de
error puede causar serios problemas. Sin información adicional no podemos estimar
consistentemente b, ni podremos determinar si existe un problema (excepto por
introspección o concluyendo que las estimaciones de b son de alguna manera
"irrazonables"
24 Capítulo 10
8
Bajo supuestos adicionales, hay formas de abordar el problema Covðx; cÞ 0 0. Hemos
cubierto al menos tres posibilidades en el contexto del análisis de sección transversal: (1)
podríamos encontrar una variable proxy adecuada para c, en cuyo caso podemos estimar
una ecuación por MCO donde la variable proxy está conectado para c; (2) podemos
encontrar instrumentos para los elementos de x que están correlacionados con cy usar
una
método de variables estructurales, como 2SLS; o (3) podemos encontrar indicadores de
c que luego se pueden usar en el procedimiento de variables instrumentales de
indicadores múltiples. Estas soluciones se tratan en los Capítulos 4 y 5.
Si tenemos acceso a una sola sección transversal de observaciones, entonces los tres
remedios enumerados, o ligeras variantes de ellos, agotan en gran medida las
posibilidades. Sin embargo, si podemos observar las mismas unidades de sección
transversal en diferentes puntos en el tiempo, es decir, si podemos recopilar un
conjunto de datos de panel, entonces surgen otras posibilidades.
Por ejemplo, suponga que podemos observar y y x en dos períodos de tiempo
diferentes; llamadaestos yt, xt para t = 1; 2. La poblaciónahora representa dos períodos
de tiempo en la misma unidad. Además, suponga que la variable c omitida es una
constante de tiempo. Entonces estamos interesados en la función de regresión
poblacional

10: 3Þ
donde

indica la variable j en el tiempo t. El modelo (10.3) supone que c tiene el mismo efecto
sobre la respuesta media en cada período de tiempo. Sin pérdida de generalidad,
establecemos el coeficiente de c igual a uno. (Porque c no se observa
y virtualmente nunca tiene una unidad de medida natural, no tendría sentido tratar de
estimar su efecto parcial).
La suposición de que c es constante en el tiempo (y tiene un efecto parcial constante
en el tiempo) es crucial para el siguiente análisis. Una variable de constante de tiempo
no observada se denomina efecto no observado en el análisis de datos de panel.
Cuando t representa diferentes periodos de tiempo para el mismo individuo, el efecto
no observado a menudo se interpreta como características captadoras de un individuo,
como la capacidad cognitiva, la motivación o la crianza familiar temprana, que se dan y
no cambian. hora. De manera similar, si la unidad de observación es la empresa, c
contiene características de la empresa no observadas, como la calidad o la estructura de
la gestión, que pueden considerarse (aproximadamente) constantes durante el período
en cuestión. Cubrimos varios ejemplos específicos de modelos de efectos no
observados en la Sección 10.2.
Para discutir los supuestos adicionales suficientes para estimar b, es útil escribir el
modelo (10.3) en forma de error como
Modelos de datos de panel de efectos no 24
observados lineales básicos 9

10: 4Þ
donde, por definición,
10: 5Þ
Una implicación de la condición (10.5) es

10: 6Þ

IFsi asumiéramos que , podríamos aplicar MCO agrupados, como


cubrimos en la Sección 7.8. Si c está correlacionado con cualquier elemento de xt,
entonces MCO agrupado está sesgado e inconsistente.
Con dos años de datos podemos diferenciar la ecuación (10.4) entre los dos períodos
de tiempo para eliminar la constante de tiempo no observable, c. Defina

. Entonces, la ecuación diferencial (10.4) da

10: 7Þ
que es solo un modelo lineal estándar en las diferencias de todas las variables
(aunque la intersección se ha eliminado). Es importante destacar que el vector de
parámetros de interés, b, aparece directamente en la ecuación (10.7) y su presencia
sugiere estimar la ecuación (10.7) por MCO. Dado un conjunto de datos de panel
con dos períodos de tiempo, la ecuación (10.7) es solo una ecuación de sección
transversal estándar. ¿Bajo qué supuestos será consistente el estimador MCO de la
ecuación (10.7)?
Como asumimos una muestra aleatoria de la población, podemos aplicar los
resultados del capítulo 4 directamente a la ecuación (10.7). Las condiciones clave para
que MCO estime consistentemente b son la condición de ortogonalidad (Supuesto
MCO.1)

10: 8Þ
y la condición de rango (Supuesto MCO.2)

corriók ð10: 9Þ
Considerarr conditi onorte (10,8) primero . It Is equivalent to E½ðx2 - x1Þ0ðu2
- tu1 Þ ] ¼ 0 o, después álgebra simple,

ð10: 10Þ
Los primeros dos términos de la ecuación (10.10) son cero según la condición (10.6),
que se cumple para t = 1; 2. Pero la condición (10.5) no garantiza que x1 y u2 no estén
correlacionados o que x2 y u1 no estén correlacionados. Podría ser razonable suponer
que la condición (10.8) se cumple, pero debemos reconocer que no se sigue de la
condición (10.5). Suponiendo que el error ut no está correlacionado con x1 y x2 para t =
1; 2 es un ejemplo de un supuesto estricto de exogeneidad en modelos de datos de
panel de componentes no observados. Discutimos los supuestos de exogeneidad
estricta en general en la Sección 10.2. Por ahora, enfatizamos
eso asumiendo para todo t y s no impone restricciones a la
correlación entre xt y el efecto no observado, c.
El segundo supuesto, la condición (10.9), también merece algo de atención ahora
porque los elementos de xt que aparecen en la ecuación estructural (10.3) se han
diferenciado a lo largo del tiempo. Si xt contiene una variable que es constante en el
tiempo para cada miembro de la población, entonces Dx contiene una entrada que es
idénticamente cero y la condición (10.9) falla. Este resultado no es sorprendente: si se
permite que c se correlacione arbitrariamente con los elementos de xt, el efecto de
cualquier variable que sea constante a lo largo del tiempo no puede
distinguirse del efecto de c. Por lo tanto, podemos estimar consistentemente bj solo si
existe alguna variación en xtj a lo largo del tiempo.
En el resto de este capítulo, cubriremos varias formas de tratar la presencia de
efectos no observados bajo diferentes conjuntos de supuestos. Suponemos que
tenemos observaciones repetidas en una sección transversal de N individuos, familias,
empresas, distritos escolares, ciudades o alguna otra unidad económica. Como en el
capítulo 7, asumimos en este capítulo que tenemos los mismos períodos de tiempo,
denotados t = 1; 2; ...; T, para cada observación de sección transversal. Este conjunto de
datos se suele denominar panel equilibrado porque están disponibles los mismos
períodos de tiempo para todas las unidades de sección transversal. Si bien la mecánica
del caso desequilibrado es similar al caso equilibrado, un tratamiento cuidadoso del
caso desequilibrado requiere una descripción formal de por qué el panel puede estar
desequilibrado, y los problemas de selección de la muestra pueden ser algo sutiles. Por
lo tanto, nos abstenemos de cubrir
paneles balanceados hasta el Capítulo 17, donde discutimos la selección de muestras y
temas de deserción.
Todavía nos enfocamos en las propiedades asintóticas de los estimadores, donde la
dimensión de tiempo, T, es fija y la dimensión de sección transversal, N, crece sin límite.
Con asintóticas N grandes, es conveniente ver las observaciones de la sección
transversal como extracciones independientes distribuidas de manera idéntica de la
población. Para cualquier observación de sección transversal i, que denota un solo
individuo, empresa, ciudad, etc., denotamos las variables observables para todos los
períodos de tiempo T por fð yit; xitÞ: t = 1; 2; ...; Tg. Debido al supuesto de T fijo, el
análisis asintótico es válido para la dependencia temporal arbitraria y la heterogeneidad
distributiva en t.
Al aplicar el análisis asintótico a los métodos de datos de panel, es importante
recordar que los asintóticos son útiles en la medida en que proporcionan una
aproximación razonable a las propiedades de la muestra finita de estimadores y
estadísticos. Por ejemplo, a priori es difícil saber si N! y la asintótica funciona bien
con, digamos,norte ¼ 50 estados en los Estados Unidos y T ¼ 8 años. Pero
podemos estar bastante seguros de que N!y asintóticason más apropiados que
T! y asintóticos, a pesar de que N es prácticamente fijo mientras que T puede
crecer. Con grandes regiones geográficas, el supuesto de muestreo aleatorio en
la dimensión de la sección transversal es conceptualmente defectuoso.
Sin embargo, si N es suficientemente grande en relación con T, y podemos asumir
una independencia aproximada en la sección transversal, entonces nuestro análisis
asintótico debería proporcionar aproximaciones adecuadas.
Si T es del mismo orden como N (por ejemplo, N = 60 países y T = 55 años
posteriores a la Segunda Guerra Mundial), un análisis asintótico que hace
suposiciones explícitas sobre se necesita la naturaleza de la dependencia de la serie
temporal. (En casos especiales, las conclusiones sobre la estimación consistente y la
normalidad aproximada de las estadísticas t serán las mismas, pero no en general). Esta
área recién está comenzando a recibir una atención cuidadosa. Si T es mucho mayor
que N, digamos N = 5 empresas y T = 40 años, el marco se convierte en un análisis de
series de tiempo múltiple: N puede mantenerse fijo mientras T! y.

10.2 Supuestos sobre los efectos no observados y las variables explicativas

Antes de analizar con más detalle los métodos de estimación de datos de panel, es
útil discutir en general la naturaleza de los efectos no observados y ciertas
características de las variables explicativas observadas.
10.2.1 ¿Efectos fijos o aleatorios?
El modelo básico de efectos no observados (UEM) se puede escribir, para una
observación de sección transversal dibujada al azar i, como
yeso ¼ xitb þ ci þ uit; t¼ 1; 2;. . . ; T ð10:
11Þ

donde xit es 1 × K y puede contener variables observables que cambian en t pero no i,


variables que cambian en i pero no t, y variables que cambian en i y t. Además del
efecto no observado, hay muchos otros nombres que se le dan a ci en las aplicaciones:
el componente no observado, la variable latente y la heterogeneidad no observada son
comunes. Si i indexa individuos, entonces ci a veces se denomina efecto individual o
heterogeneidad individual; Se aplican términos análogos a familias, empresas, ciudades
y otras unidades transversales. Los uit se denominan errores idiosincrásicos o
perturbaciones idiosincrásicas porque cambian tanto en t como en i.
Especialmente en los artículos metodológicos, pero también en las aplicaciones, a
menudo se ve una discusión sobre si ci se tratará como un efecto aleatorio o un
efecto fijo. Origi-Finalmente, tales discusiones se centraron en si ci se ve
correctamente como una variable aleatoria o como un parámetro a estimar. En el
enfoque tradicional de los modelos de datos de panel, ci se llama un '' efecto aleatorio ''
cuando se trata como una variable aleatoria y un '' efecto fijo '' cuando se trata como un
parámetro a estimar para cada observación de la sección transversal i. Nuestra opinión
es que las discusiones sobre si la IC debe ser tratada como
las variables aleatorias o como parámetros a estimar están equivocadas para
aplicaciones de datos de panel microeconométrico. Con un gran número de
extracciones al azar de la sección transversal, casi siempre tiene sentido tratar los
efectos no observados, ci, como
extracciones al azar de la población, junto con yit y xit. Este enfoque es ciertamente
apropiado desde una perspectiva de variables omitidas o de heterogeneidad
desatendida. Como sugiere nuestra discusión en la Sección 10.1, la cuestión clave que
involucra a ci es si no está correlacionada con las variables explicativas observadas xit, t
= 1; 2; ...; T. Mundlak (1978) planteó este argumento hace muchos años y todavía es
persuasivo.
En el lenguaje econométrico moderno, "efecto aleatorio" es sinónimo de correlación
cero entre las variables explicativas observadas y el efecto no observado: Covðxit; ci = 0,
t = 1; 2; ...; T. [En realidad, una independencia media condicional más fuerte
supuesto, Eðci j xi1; ...; xiT Þ¼ EðciÞ, será necesario para justificar completamente la
información estadística
ference; más sobre este tema en la Sección 10.4.] En artículos aplicados, cuando ci se
denomina, digamos, un "efecto aleatorio individual", entonces probablemente se
asume que ci no está correlacionado con xit.
En aplicaciones microeconométricas, el término «efecto fijo» no suele significar que
ci se trate como no aleatorio; más bien, significa que uno está permitiendo una
correlación arbitraria entre el efecto no observado ci y las variables explicativas
observadas xit. Por tanto, si ci se denomina «efecto fijo individual» o «efecto fijo fi
rme», entonces, a efectos prácticos, esta terminología significa que se permite que ci
esté correlacionado con xit. En este libro, evitamos referirnos a ci como un efecto
aleatorio o un efecto fijo. En cambio, nos referiremos a ci como efecto no observado,
heterogeneidad no observada, etc. No obstante, más adelante etiquetaremos dos
métodos de estimación diferentes: estimación de efectos aleatorios y estimación de
efectos fijos. Esta terminología está tan arraigada que no tiene sentido intentar
cambiarla ahora.
10.2.2 Supuestos estrictos de exogeneidad en las variables explicativas
Los modelos tradicionales de datos de panel de componentes no observados toman el
xit como fijo. Nunca asumiremos que xit no son aleatorios porque la retroalimentación
potencial de yit a x es para
s > t debe abordarse explícitamente.
En el Capítulo 7 discutimos supuestos de exogeneidad estricta en modelos de datos
de panel que no contenían explícitamente efectos no observados. Ahora
proporcionamos supuestos estrictos de exogeneidad para modelos con efectos no
observados.
En la Sección 10.1 establecimos el supuesto estricto de exogeneidad en términos de
correlación cero. Para las discusiones de inferencia y eficiencia, necesitamos establecer
el supuesto estricto de exogeneidad en términos de expectativas condicionales, y esta
afirmación también le da al supuesto un significado claro. Con un efecto no observado,
la forma más reveladora del supuesto estricto de exogeneidad es
Eð yeso j xi1; xi2;. . . ; xiT; ciÞ¼ Eð yeso j xit; ciÞ¼ xitb þ ci ð10:
12Þ
para t = 1; 2; ...; T. La segunda igualdad es el supuesto de forma funcional en Eð yit j xit;
ciÞ. Es la primera igualdad la que da su interpretación a la exogeneidad estricta.
Significa que, una vez que se controlan xit y ci, xis no tiene un efecto parcial sobre yit
para s 0 t. Cuando se cumple el supuesto (10.12), decimos que fxit: t = 1; 2; ...; Tg son
estrictamente exógenas condicionadas al efecto no observado ci. Supuesto (10.12) y la
Chamberlain (1982) introdujo y utilizó la terminología correspondiente. En el
próximo capítulo cubriremos explícitamente el enfoque de Chamberlain para
estimar modelos de efectos no observados, pero su manera de enunciar supuestos
es instructiva incluso para el análisis de datos de panel tradicional.
El supuesto (10.12) restringe cómo el valor esperado de yit puede depender de
variables explicativas en otros períodos de tiempo, pero es más razonable que la
exogeneidad estricta sin condicionamiento sobre el efecto no observado. Sin
condicionamiento sobre un efecto no observado, el supuesto estricto de exogeneidad
es
Eð yeso j xi1; xi2;. . . ; xiTÞ ¼ Eð yeso j xitÞ¼ xitB ð10:
13Þ
t ¼ 1; . . . ; T. Para ver que la suposición (10.13) tiene menos
probabilidades de ser válida que la suposición (10.12), considere primero
un ejemplo. Suponga que yit es la producción de soja para la finca i
durante el año t, y xit contiene capital, trabajo, materiales (como
fertilizantes), lluvia y otros insumos observables. El efecto no observado,
ci, puede capturar la calidad promedio de la tierra, la capacidad de
gestión de la familia que administra la finca y otros factores constantes
de tiempo no observados. Una suposición natural es que, una vez que se
han controlado las entradas de corriente junto con ci, las entradas
utilizadas en otros años no tienen ningún efecto en la producción
durante
el año actual. Sin embargo, dado que la elección óptima de insumos en cada año
generalmente depende de ci, es probable que exista alguna correlación parcial
entre la producción en el año t y los insumos en otros años si no se controla ci: el
supuesto (10.12) es razonable mientras que el supuesto (10.13) no lo es.
De manera más general, es fácil ver que el supuesto (10.13) falla siempre que el
supuesto (10.12) se cumple y el valor esperado de ci depende de ðxi1; ...; xiT Þ. A partir
de la ley de las expectativas iteradas, si se cumple el supuesto (10.12), entonces
Eð yeso j xi1; . . . ; xiTÞ ¼ xitb þ Eðci j xi1; ...; xiT Þ
y así el supuesto (10.13) falla si Eðci j xi1; ...; xiT Þ 0 EðciÞ. En particular, el supuesto
(10.13) falla si ci está correlacionado con cualquiera de los xit.
Ecuación dada (10.11), el supuesto de exogeneidad estricta se puede establecer
en términos de los errores idiosincrásicos como
Eðuit j xi1; ...; xiT; ciÞ¼ 0; t = 1; 2; ...;T ð10:
14Þ
Este supuesto, a su vez, implica que las variables explicativas en cada período de
tiempo no están correlacionadas con el error idiosincrásico en cada período de
tiempo:
miðxI0suitÞ ¼ 0;s; t¼ 1; . . . ; T ð10:15Þ
Esta suposición es mucho más fuerte que asumir una correlación contemporánea cero:
Eðxi0tuitÞ¼ 0, t ¼ 1; ...; T. Sin embargo, el supuesto (10.15) permite una correlación
arbitraria entre ci y xit para todo t, algo que descartamos en la sección 7.8. Más
adelante, utilizaremos el hecho de que el supuesto (10.14) implica que uit y ci no están
correlacionados.
Para examinar la consistencia de los estimadores de datos de panel, el supuesto
de correlación cero ción (10.15) generalmente es suficiente. Además, la suposición
(10.15) es a menudo la forma más fácil de pensar si es probable que la exogeneidad
estricta se mantenga en una aplicación en particular. Pero las formas estándar de
inferencia estadística, así como las propiedades de eficiencia de los estimadores
estándar, se basan en la formulación de media condicional más fuerte en el supuesto
(10.14). Por tanto, nos centramos en el supuesto (10.14).
10.2.3 Algunos ejemplos de modelos de datos de panel de efectos no observados
Nuestras discusiones en las Secciones 10.2.1 y 10.2.2 enfatizan que en cualquier
aplicación de datos de panel debemos enfocarnos inicialmente en dos preguntas: (1) ¿El
efecto no observado, ci, no está correlacionado con xit para todo t? (2) ¿Es razonable el
supuesto de exogeneidad estricta (condicional a ci)? Los siguientes ejemplos ilustran
cómo podríamos organizar nuestro pensamiento sobre estas dos preguntas.
Ejemplo 10.1 (Evaluación del programa): Un modelo estándar para estimar los
efectos de la capacitación laboral u otros programas en los salarios posteriores es
logðwageitÞ¼ yt þ zitg þ d1progit þ ci þ uit

ð10:dieciséisÞ

donde i indexa el individuo yt el período de tiempo. El parámetro yt denota una


intersección variable en el tiempo, y zit es un conjunto de características observables
que afectan el salario y también pueden estar correlacionadas con la participación en el
programa.
Los conjuntos de datos de evaluación a menudo se recopilan en dos momentos. En t
= 1, nadie ha participado en el programa, por lo que progi1 = 0 para todo i. Luego, se
elige un subgrupo para participar en el programa (o los individuos eligen participar), y
los salarios subsiguientes se observan para los grupos de control y tratamiento en t = 2.
El modelo (10.16) permite cualquier cantidad de períodos de tiempo y patrones
generales de participación en el programa. La razón para incluir el efecto individual, ci,
es la habitual historia de habilidad omitida:
si las personas eligen participar o no en el programa, esa elección podría estar
correlacionada con la capacidad. Esta posibilidad a menudo se denomina problema de
autoselección. Alternativamente, los administradores pueden asignar personas
basándose en características que el econometrista no puede observar.
El otro problema es el supuesto estricto de exogeneidad de las variables
explicativas, particularmente el progit. Normalmente, nos sentimos cómodos
asumiendo que uit no está corregido.lated con progit. Pero ¿qué pasa con la
correlación entre uit y, digamos, progi; tþ1? La participación futura en el programa
podría depender de uit si las personas eligen participar en el futuro en función de los
choques a su salario en el pasado, o si los administradores eligen a personas como
participantes en el momento t þ 1 que tenían un uit bajo. Tal retroalimentación podría
no ser muy importante, ya que se permite ci, pero podría serlo. Ver, por ejemplo, Bassi
(1984) y Ham y Lalonde (1996). Otro problema, que se resuelve más fácilmente, es que
el programa de formación podría tener efectos duraderos. Si es así, entonces
deberíamos incluir rezagos de progit en el modelo (10.16). O bien, el programa en sí
puede durar más de un período, en cuyo caso el progit puede reemplazarse por una
serie de variables ficticias sobre el tiempo que la unidad i en el tiempo t ha estado
sujeta al programa.
Ejemplo 10.2 (modelo de retraso distribuido): Hausman, Hall y Griliches (1984)
estiman modelos de rezagos distribuidos no lineales para estudiar la relación
entre las patentes otorgadas a una empresa y los niveles actuales y pasados de
gasto en I + D. Una versión lineal de cinco rezagos de su modelo es
patentar ¼ yt þ zitg þ d0RDit þ d1RDi ; t—1 þ · · · þ d5RDi; t—5 þ ci þ uit ð10:
17Þ
donde RDit es el gasto en I + D de la empresa i en el momento t y zit contiene
variables como el tamaño de la empresa (medido por ventas o empleados). La
variable ci es un término de heterogeneidad firme que puede in fl uir en las
patentes y que puede estar correlacionado con el actual, pasado ygastos futuros en I
+ D. El interés radica en el patrón de los coeficientes dj. Al igual que con los otros
ejemplos, debemos decidir si es probable que el gasto en I + D esté correlacionado con
ci. Además, si los choques a las patentes actuales (cambios en uit) influyen en el gasto
en I + D en fechas futuras, entonces la exogeneidad estricta puede fallar y los métodos
de este capítulo no se aplicarán.
El siguiente ejemplo presenta un caso en el que el supuesto de exogeneidad estricta
es necesariamente falso, y el efecto no observado y la variable explicativa deben estar
correlacionados.
Ejemplo 10.3 (Variable dependiente rezagada): Un modelo dinámico simple de
determinación de salarios con heterogeneidad no observada es
logðwageitÞ¼ b1 logðwagei; t — 1Þþ ci þ uit; t ¼ 1; 2;. . . ; T ð10:
18Þ
A menudo, el interés radica en cuán persistentes son los salarios (medidos por el
tamaño de b1) después de controlar la heterogeneidad no observada
(productividad individual), ci. Dejando yit ¼ logðwageitÞ, una suposición estándar
sería
Eðuit jyI; t—1; . . . ; yI0; ciÞ¼ 0 ð10:
19Þ
lo que significa que todas las dinámicas son capturadas por el primer rezago. Sea xit ¼
yi; t — 1. Entonces, bajo el supuesto (10.19), uit no está correlacionado con ðxit; xi; t —
1; ...; xi1Þ, pero uit no puede descorrelacionarse con ðxi; tþ1; ...; xiT Þ, como xi; tþ1 ¼
yit. De echo,
Eð yeso uitÞ¼ B1Eð yI; t—1uitÞþ EðciuitÞþ Eðu2Þ¼
e Eðu2Þ
e >0 ð10:
s s
20Þ
porque Eð yi; t — 1uitÞ¼ 0 y EðciuitÞ¼ 0 bajo el supuesto (10.19). Por lo tanto, losEl
supuesto estricto de exogeneidad nunca se cumple en modelos de efectos no
observados con retraso
variables dependientes.
Además, yi; t — 1 y ci están necesariamente correlacionados (ya que en el tiempo t -
1, yi; t — 1 es la variable del lado izquierdo). No solo debe fallar la exogeneidad estricta
en este modelo, sino que
También se viola el supuesto de exogeneidad requerido para la estimación combinada
de MCO del modelo (10.18). Estudiaremos la estimación de tales modelos en el Capítulo
11.

10.3 Estimación de modelos de efectos no observados por MCO agrupados

Bajo ciertos supuestos, el estimador MCO agrupado se puede utilizar para obtener un
estimador consistente de b en el modelo (10.11). Escribe el modelo como
yeso ¼ xitb þ vit; t¼ 1; 2;. . . ; T ð10:
21Þ
donde vit 1 ci þ uit, t ¼ 1; ...; T son los errores compuestos. Para cada t, vit es la suma
del efecto no observado y un error idiosincrásico. De la sección 7.8, sabemos que la
estimación combinada de MCO de esta ecuación es consistente si Eðxi0tvitÞ¼ 0, t ¼ 1;
2; ...; T. Prácticamente hablando, la falta de correlación entre xit y vit significa que
estamos asumiendo Eðxi0tuitÞ¼ 0 y
miðxi0tciÞ¼ 0; t ¼ 1; 2; . . . ; T ð10: 22Þ
Equationorte(10.22) es el supuesto restrictivo, ya que Eðxi0tuitÞ¼ 0 se cumple si
hemos modelado con éxito Eð yit j xit; ciÞ.
En modelos de rezagos distribuidos estáticos y finitos, a veces estamos dispuestos a
hacer la suposición (10.22); de hecho, lo haremos en la siguiente sección sobre
estimación de efectos aleatorios. Como se ve en el ejemplo 10.3, los modelos con
variables dependientes rezagadas en xit deben violar el supuesto (10.22) porque yi; t —
1 y ci deben estar correlacionados.
Incluso si se cumple el supuesto (10.22), los errores compuestos estarán
correlacionados en serie
debido a la presencia de ci en cada período de tiempo. Por lo tanto, la inferencia
que utiliza MCO agrupada requiere el estimador de matriz de varianza robusto y las
estadísticas de prueba robustas del capítulo
7. Dado que vit depende de ci para todo t, la correlación entre vit y vis generalmente no
disminuye a medida que aumenta la distancia jt - sj; en el lenguaje de series de tiempo,
las vit son

También podría gustarte