Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En el Capítulo 7 cubrimos una clase de modelos de datos de panel lineal donde, como
mínimo, se asumió que el error en cada período de tiempo no estaba correlacionado
con las variables explicativas en el mismo período de tiempo. Para ciertas aplicaciones
de datos de panel, esta suposición es demasiado fuerte. De hecho, una motivación
principal para usar datos de panel es resolver el problema de las variables omitidas.
En este capítulo estudiamos modelos de población que contienen explícitamente un
efecto no observado, constante de tiempo. El tratamiento en este capítulo es
"moderno" en el sentido de que los efectos no observados se tratan como variables
aleatorias, extraídas de la población junto con las variables explicadas y explicativas
observadas, en contraposición a los parámetros a estimar. En este marco, la cuestión
clave es si el efecto no observado no está correlacionado con las variables explicativas.
Es fácil ver cómo se pueden usar los datos de panel, al menos bajo ciertos supuestos,
para obtener estimadores consistentes en presencia de variables omitidas. Sea y y x 1
(x1; x2; ...; Xk) ser variables aleatorias observables, y sea c un rango no observable
variable dom; el vector ( y; x1; x2; ...; xK; c) representa la población de interés. Como
Como suele ser el caso de la econometría aplicada, nos interesan los efectos parciales
de las variables explicativas observables xj en la función de regresión poblacional.
10: 1
En palabras, nos gustaría mantener c constante al obtener efectos parciales de las
variables explicativas observables. Seguimos a Chamberlain (1984) al usar c para
denotar la variable no observada. Gran parte de la literatura sobre datos de panel utiliza
una letra griega, como a o f, pero queremos enfatizar que lo no observable es una
variable aleatoria, no un parámetro a estimar. (Discutiremos este punto con más detalle
en la Sección 10.2.1.)
Suponiendo un modelo lineal, con c ingresando aditivamente junto con xj,
tenemos
ð10: 2
dóndeel interés radica en el vector K × 1 b. Por un lado, si c no está correlacionado con
cada xj, entonces c es simplemente otro factor no observado que afecta a y que no está
sistemáticamente relacionado con las variables explicativas observables cuyos efectos
son de interés. Por otro lado, si Covðxj; cÞ 0 0 para algunos j, poner c en el término de
error puede causar serios problemas. Sin información adicional no podemos estimar
consistentemente b, ni podremos determinar si existe un problema (excepto por
introspección o concluyendo que las estimaciones de b son de alguna manera
"irrazonables"
24 Capítulo 10
8
Bajo supuestos adicionales, hay formas de abordar el problema Covðx; cÞ 0 0. Hemos
cubierto al menos tres posibilidades en el contexto del análisis de sección transversal: (1)
podríamos encontrar una variable proxy adecuada para c, en cuyo caso podemos estimar
una ecuación por MCO donde la variable proxy está conectado para c; (2) podemos
encontrar instrumentos para los elementos de x que están correlacionados con cy usar
una
método de variables estructurales, como 2SLS; o (3) podemos encontrar indicadores de
c que luego se pueden usar en el procedimiento de variables instrumentales de
indicadores múltiples. Estas soluciones se tratan en los Capítulos 4 y 5.
Si tenemos acceso a una sola sección transversal de observaciones, entonces los tres
remedios enumerados, o ligeras variantes de ellos, agotan en gran medida las
posibilidades. Sin embargo, si podemos observar las mismas unidades de sección
transversal en diferentes puntos en el tiempo, es decir, si podemos recopilar un
conjunto de datos de panel, entonces surgen otras posibilidades.
Por ejemplo, suponga que podemos observar y y x en dos períodos de tiempo
diferentes; llamadaestos yt, xt para t = 1; 2. La poblaciónahora representa dos períodos
de tiempo en la misma unidad. Además, suponga que la variable c omitida es una
constante de tiempo. Entonces estamos interesados en la función de regresión
poblacional
10: 3Þ
donde
indica la variable j en el tiempo t. El modelo (10.3) supone que c tiene el mismo efecto
sobre la respuesta media en cada período de tiempo. Sin pérdida de generalidad,
establecemos el coeficiente de c igual a uno. (Porque c no se observa
y virtualmente nunca tiene una unidad de medida natural, no tendría sentido tratar de
estimar su efecto parcial).
La suposición de que c es constante en el tiempo (y tiene un efecto parcial constante
en el tiempo) es crucial para el siguiente análisis. Una variable de constante de tiempo
no observada se denomina efecto no observado en el análisis de datos de panel.
Cuando t representa diferentes periodos de tiempo para el mismo individuo, el efecto
no observado a menudo se interpreta como características captadoras de un individuo,
como la capacidad cognitiva, la motivación o la crianza familiar temprana, que se dan y
no cambian. hora. De manera similar, si la unidad de observación es la empresa, c
contiene características de la empresa no observadas, como la calidad o la estructura de
la gestión, que pueden considerarse (aproximadamente) constantes durante el período
en cuestión. Cubrimos varios ejemplos específicos de modelos de efectos no
observados en la Sección 10.2.
Para discutir los supuestos adicionales suficientes para estimar b, es útil escribir el
modelo (10.3) en forma de error como
Modelos de datos de panel de efectos no 24
observados lineales básicos 9
10: 4Þ
donde, por definición,
10: 5Þ
Una implicación de la condición (10.5) es
10: 6Þ
10: 7Þ
que es solo un modelo lineal estándar en las diferencias de todas las variables
(aunque la intersección se ha eliminado). Es importante destacar que el vector de
parámetros de interés, b, aparece directamente en la ecuación (10.7) y su presencia
sugiere estimar la ecuación (10.7) por MCO. Dado un conjunto de datos de panel
con dos períodos de tiempo, la ecuación (10.7) es solo una ecuación de sección
transversal estándar. ¿Bajo qué supuestos será consistente el estimador MCO de la
ecuación (10.7)?
Como asumimos una muestra aleatoria de la población, podemos aplicar los
resultados del capítulo 4 directamente a la ecuación (10.7). Las condiciones clave para
que MCO estime consistentemente b son la condición de ortogonalidad (Supuesto
MCO.1)
10: 8Þ
y la condición de rango (Supuesto MCO.2)
corriók ð10: 9Þ
Considerarr conditi onorte (10,8) primero . It Is equivalent to E½ðx2 - x1Þ0ðu2
- tu1 Þ ] ¼ 0 o, después álgebra simple,
ð10: 10Þ
Los primeros dos términos de la ecuación (10.10) son cero según la condición (10.6),
que se cumple para t = 1; 2. Pero la condición (10.5) no garantiza que x1 y u2 no estén
correlacionados o que x2 y u1 no estén correlacionados. Podría ser razonable suponer
que la condición (10.8) se cumple, pero debemos reconocer que no se sigue de la
condición (10.5). Suponiendo que el error ut no está correlacionado con x1 y x2 para t =
1; 2 es un ejemplo de un supuesto estricto de exogeneidad en modelos de datos de
panel de componentes no observados. Discutimos los supuestos de exogeneidad
estricta en general en la Sección 10.2. Por ahora, enfatizamos
eso asumiendo para todo t y s no impone restricciones a la
correlación entre xt y el efecto no observado, c.
El segundo supuesto, la condición (10.9), también merece algo de atención ahora
porque los elementos de xt que aparecen en la ecuación estructural (10.3) se han
diferenciado a lo largo del tiempo. Si xt contiene una variable que es constante en el
tiempo para cada miembro de la población, entonces Dx contiene una entrada que es
idénticamente cero y la condición (10.9) falla. Este resultado no es sorprendente: si se
permite que c se correlacione arbitrariamente con los elementos de xt, el efecto de
cualquier variable que sea constante a lo largo del tiempo no puede
distinguirse del efecto de c. Por lo tanto, podemos estimar consistentemente bj solo si
existe alguna variación en xtj a lo largo del tiempo.
En el resto de este capítulo, cubriremos varias formas de tratar la presencia de
efectos no observados bajo diferentes conjuntos de supuestos. Suponemos que
tenemos observaciones repetidas en una sección transversal de N individuos, familias,
empresas, distritos escolares, ciudades o alguna otra unidad económica. Como en el
capítulo 7, asumimos en este capítulo que tenemos los mismos períodos de tiempo,
denotados t = 1; 2; ...; T, para cada observación de sección transversal. Este conjunto de
datos se suele denominar panel equilibrado porque están disponibles los mismos
períodos de tiempo para todas las unidades de sección transversal. Si bien la mecánica
del caso desequilibrado es similar al caso equilibrado, un tratamiento cuidadoso del
caso desequilibrado requiere una descripción formal de por qué el panel puede estar
desequilibrado, y los problemas de selección de la muestra pueden ser algo sutiles. Por
lo tanto, nos abstenemos de cubrir
paneles balanceados hasta el Capítulo 17, donde discutimos la selección de muestras y
temas de deserción.
Todavía nos enfocamos en las propiedades asintóticas de los estimadores, donde la
dimensión de tiempo, T, es fija y la dimensión de sección transversal, N, crece sin límite.
Con asintóticas N grandes, es conveniente ver las observaciones de la sección
transversal como extracciones independientes distribuidas de manera idéntica de la
población. Para cualquier observación de sección transversal i, que denota un solo
individuo, empresa, ciudad, etc., denotamos las variables observables para todos los
períodos de tiempo T por fð yit; xitÞ: t = 1; 2; ...; Tg. Debido al supuesto de T fijo, el
análisis asintótico es válido para la dependencia temporal arbitraria y la heterogeneidad
distributiva en t.
Al aplicar el análisis asintótico a los métodos de datos de panel, es importante
recordar que los asintóticos son útiles en la medida en que proporcionan una
aproximación razonable a las propiedades de la muestra finita de estimadores y
estadísticos. Por ejemplo, a priori es difícil saber si N! y la asintótica funciona bien
con, digamos,norte ¼ 50 estados en los Estados Unidos y T ¼ 8 años. Pero
podemos estar bastante seguros de que N!y asintóticason más apropiados que
T! y asintóticos, a pesar de que N es prácticamente fijo mientras que T puede
crecer. Con grandes regiones geográficas, el supuesto de muestreo aleatorio en
la dimensión de la sección transversal es conceptualmente defectuoso.
Sin embargo, si N es suficientemente grande en relación con T, y podemos asumir
una independencia aproximada en la sección transversal, entonces nuestro análisis
asintótico debería proporcionar aproximaciones adecuadas.
Si T es del mismo orden como N (por ejemplo, N = 60 países y T = 55 años
posteriores a la Segunda Guerra Mundial), un análisis asintótico que hace
suposiciones explícitas sobre se necesita la naturaleza de la dependencia de la serie
temporal. (En casos especiales, las conclusiones sobre la estimación consistente y la
normalidad aproximada de las estadísticas t serán las mismas, pero no en general). Esta
área recién está comenzando a recibir una atención cuidadosa. Si T es mucho mayor
que N, digamos N = 5 empresas y T = 40 años, el marco se convierte en un análisis de
series de tiempo múltiple: N puede mantenerse fijo mientras T! y.
Antes de analizar con más detalle los métodos de estimación de datos de panel, es
útil discutir en general la naturaleza de los efectos no observados y ciertas
características de las variables explicativas observadas.
10.2.1 ¿Efectos fijos o aleatorios?
El modelo básico de efectos no observados (UEM) se puede escribir, para una
observación de sección transversal dibujada al azar i, como
yeso ¼ xitb þ ci þ uit; t¼ 1; 2;. . . ; T ð10:
11Þ
ð10:dieciséisÞ
Bajo ciertos supuestos, el estimador MCO agrupado se puede utilizar para obtener un
estimador consistente de b en el modelo (10.11). Escribe el modelo como
yeso ¼ xitb þ vit; t¼ 1; 2;. . . ; T ð10:
21Þ
donde vit 1 ci þ uit, t ¼ 1; ...; T son los errores compuestos. Para cada t, vit es la suma
del efecto no observado y un error idiosincrásico. De la sección 7.8, sabemos que la
estimación combinada de MCO de esta ecuación es consistente si Eðxi0tvitÞ¼ 0, t ¼ 1;
2; ...; T. Prácticamente hablando, la falta de correlación entre xit y vit significa que
estamos asumiendo Eðxi0tuitÞ¼ 0 y
miðxi0tciÞ¼ 0; t ¼ 1; 2; . . . ; T ð10: 22Þ
Equationorte(10.22) es el supuesto restrictivo, ya que Eðxi0tuitÞ¼ 0 se cumple si
hemos modelado con éxito Eð yit j xit; ciÞ.
En modelos de rezagos distribuidos estáticos y finitos, a veces estamos dispuestos a
hacer la suposición (10.22); de hecho, lo haremos en la siguiente sección sobre
estimación de efectos aleatorios. Como se ve en el ejemplo 10.3, los modelos con
variables dependientes rezagadas en xit deben violar el supuesto (10.22) porque yi; t —
1 y ci deben estar correlacionados.
Incluso si se cumple el supuesto (10.22), los errores compuestos estarán
correlacionados en serie
debido a la presencia de ci en cada período de tiempo. Por lo tanto, la inferencia
que utiliza MCO agrupada requiere el estimador de matriz de varianza robusto y las
estadísticas de prueba robustas del capítulo
7. Dado que vit depende de ci para todo t, la correlación entre vit y vis generalmente no
disminuye a medida que aumenta la distancia jt - sj; en el lenguaje de series de tiempo,
las vit son