Está en la página 1de 40

JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

El análisis econométrico de datos de panel


JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

Badi H. Baltagi

Badi H. Baltagi obtuvo su doctorado en Economía en la Universidad de Pennsylvania en 1979. Se unió a la facultad de
Texas A & MUniversity en 1988, después de haber servido previamente en la facultad en la Universidad de Houston. Él
es el autor de El análisis econométrico de datos de panel y Econometría, y editor de A Companion a la Econometría
teórica; Los avances recientes en la econometría de datos de panel, Volúmenes I y II; Los paneles no estacionarios,
Panel de cointegración, y paneles dinámicos; y autor o coautor de más de 100 publicaciones, todo en la conducción de
Economía y Estadística revistas. Profesor Baltagi es el titular de la George Summey, Jr. Profesor Cátedra de Artes
Liberales y fue galardonado con el Premio al Logro Distinguido en Investigación. Es co-editor de Empírica Economía, y
editor asociado de Journal of Econometrics y

Los comentarios econométricos. Es el editor de la replicación Journal of Applied Econometría


y el editor de la serie de Las contribuciones al análisis económico. Él es un miembro de la Journal of Econometrics y un
recipiente de la concesión de Plura scripsit Teoría Econométrica.
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

El análisis econométrico de datos de panel

Tercera edicion

Badi H. Baltagi
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

Derechos de autor©do2005 John Wiley & Sons Ltd, el atrio, Puerta del Sur, Chichester, West Sussex PO19

8SQ, Inglaterra Teléfono (+44) 779 777 1243

E-mail (para pedidos y consultas de servicio al cliente): cs-books@wiley.co.uk Visita nuestra


página inicial en www.wileyeurope.com o www.wiley.com

Todos los derechos reservados. Ninguna parte de esta publicación puede ser reproducida, almacenada en un sistema de
recuperación o transmitida en cualquier forma o por cualquier medio, electrónico, mecánico, de fotocopiado, de grabación, de
exploración o de otra manera, excepto bajo los términos del Derecho de Autor, Diseños y Patentes de 1988 o bajo los términos de
una licencia expedida por la copyright Licensing Agency Ltd, 90 Tottenham Court Road, Londres W1T 4LP, Reino Unido, sin el
permiso por escrito del editor. Las solicitudes al Editor deben dirigirse al Departamento de Permisos, John Wiley & Sons Ltd, el atrio,
Puerta del Sur, Chichester, West Sussex PO19 8SQ, Inglaterra, o por correo electrónico a permreq@wiley.co.uk , o por fax al (+44 )
1243 770620.

Esta publicación está diseñada para proporcionar información precisa y fidedigna relacionada con el tema en cuestión.
Se vende en el entendimiento de que la editorial no se dedica a prestar servicios profesionales. Si se requiere un
asesoramiento profesional u otra asistencia de expertos, los servicios de un profesional competente deben ser
buscados.

Badi H. Baltagi ha afirmado su derecho en virtud del Derecho de Autor, Diseños y, de 1988, sobre patentes que se identifican como el autor
de este trabajo.

Otros Wiley Editorial fi cinas

John Wiley & Sons Inc., 111 River Street, Hoboken, NJ 07030, EE.UU. Jossey-Bass, 989 Market Street, San Francisco, CA

94103 hasta 1741, EE.UU. Wiley-VCH Verlag GmbH, Boschstr. 12, D-69469 Weinheim, Alemania John Wiley & Sons Ltd

Australia, 33 Park Road, Milton, Queensland 4064, Australia John Wiley & Sons (Asia) Pte Ltd, 2 Clementi Loop # 02-01, Jin

Xing Distripark, Singapur 129809 John Wiley & Sons Ltd. Canadá, 22 Worcester Road, Etobicoke, Ontario, Canadá M9W 1L1

Wiley también publica sus libros en una variedad de formatos electrónicos. Parte del contenido que aparece en la impresión puede no estar
disponible en los libros electrónicos.

Biblioteca del Congreso de datos Catalogación en la Publicación

Baltagi, Badi H. (Badi Hani)


El análisis econométrico de datos de panel / Badi H. Baltagi. - 3ª ed.
pag. cm.
Incluye referencias bibliográficas e indice. ISBN
0-470-01456-3 (pbk:.. Alk papel)
1. Econometría. 2. Análisis de Panel. I. Título.
HB139.B35 2005 330 '. 01 ' 5195-DC22
2005006840

Catalogación Biblioteca Británica de datos de publicación

Un registro de catálogo de este libro se encuentra disponible en la Biblioteca Británica

ISBN-13 978-0-470-01456-1 ISBN-10


0-470-01456-3

Componer en 10 / 12pt veces por TechBooks, Nueva Delhi, India


Impreso y encuadernado en Gran Bretaña por Anthony Rowe Ltd, Chippenham, Wiltshire
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

A mi esposa, Phyllis
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

Contenido

facio xi

ntroducción 1
1.1 Panel de datos: algunos ejemplos 1
1.2 ¿Por qué debemos utilizar datos de panel? Sus bene fi cios y limitaciones 4
Nota 9

2 de una vía de error de componentes modelo de regresión 11


2.1 Introducción 11
2.2 Los efectos modelo fijo 12
2.3 El modelo de efectos aleatorios 14
2.3.1 Fijo vs aleatoria 18
2.4 Estimación de máxima verosimilitud 19
2.5 Predicción 20
2.6 Ejemplos 21
2.6.1 Ejemplo 1: Grunfeld Inversión Ecuación 21
2.6.2 Ejemplo 2: Gasolina Demand de 23

2.6.3 Ejemplo 3: Capital Pública Productividad 25


2.7 Las solicitudes seleccionadas 28
2.8 Nota Computacional 28
notas 28
Problemas 29

3 de dos vías de error de componentes modelo de regresión 33


3.1 Introducción 33
3.2 Efectos El modelo fijo 33
3.2.1 Pruebas de efectos fijos 34
3.3 El modelo de efectos aleatorios 35
Experimento 3.3.1 Monte Carlo 39
3,4 estimación de máxima verosimilitud 40
3.5 Predicción 42
3.6 Ejemplos 43
3.6.1 Ejemplo 1: Grunfeld Inversión Ecuación 43
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

viii Contenido

3.6.2 Ejemplo 2: Gasolina Demand 45


3.6.3 Ejemplo 3: Capital Pública Productividad 45
3.7 Las solicitudes seleccionadas 47
notas 47
Problemas 48

4 Prueba de hipótesis con datos de panel 53


4.1 Las pruebas de posibilidad de unificar los Datos 53
2 Nuevo Testamento
4.1.1 Prueba de posibilidad de unificar bajo u ~ NORTE( 0, σ yo ) 54
4.1.2 Prueba de posibilidad de unificar bajo la suposición general u ~ NORTE( 0, ) 55
4.1.3 Ejemplos 57
4.1.4 Otras pruebas para la posibilidad de unificar 58
4.2 Pruebas para individuales y Tiempo Efectos 59
4.2.1 El Breusch--Pagan prueba 59
4.2.2 Rey y Wu, Honda y las pruebas estandarizadas del multiplicador de Lagrange
61
4.2.3 Gourieroux, Holly y prueba Monfort 62
4.2.4 Las pruebas condicionales LM 62
4.2.5 ANOVA F y las pruebas de coeficiente de probabilidad 63
4.2.6 Resultados de Monte Carlo 64
4.2.7 Ejemplo ilustrativo sesenta y cinco

4.3 Prueba especí fi cación de Hausman 66


4.3.1 Ejemplo 1: Grunfeld Inversión Ecuación 70
4.3.2 Ejemplo 2: Gasolina Demand 71
4.3.3 Ejemplo 3: Huelga Actividad 72
4.3.4 Ejemplo 4: comportamiento de la producción de los aserraderos 72
4.3.5 Ejemplo 5: La boda de salarios de Premium 73
4.3.6 Ejemplo 6: Unión Monetaria y Comercio 73
Prueba de Hausman 4.3.7 para el modelo de dos vías 73
4.4 Lectura adicional 74
notas 74
Problemas 75

5 Heterocedasticidad y correlación de serie en el modelo de componentes de error 79


5.1 Heterocedasticidad 79
5.1.1 Prueba de homocedasticidad en un modelo de componentes de error 82
5.2 Correlación de serie 84
5.2.1 El AR (1) Proceso 84
5.2.2 El AR (2) Proceso 86
5.2.3 La AR (4) Proceso de Datos trimestrales 87
5.2.4 El MA (1) Proceso 88
5.2.5 Paneles Desigual espaciada con AR (1) Alteraciones 89
5.2.6 Predicción 91
5.2.7 Pruebas de correlación serial y efectos individuales 93
5.2.8 Extensiones 103
notas 104
Problemas 104
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

Contenido ix

gresiones aparentemente no relacionadas con componentes de error 107


6.1 El Modelo de una vía 107
6.2 El modelo de dos vías 108
6.3 Aplicaciones y Extensiones 109
Problemas 111

cuaciones simultáneas con componentes de error 113


7,1 sola ecuación de estimación 113
7,2 empírica Ejemplo: Crime en Carolina del Norte 116
7.3 Sistema de Estimación 121
7.4 El Hausman y Taylor Estimador 124
7,5 empírica Ejemplo: Ganancias Ecuación Usando PSID Data 128
7.6 Extensiones 130
notas 133
Problemas 133

odelos dinámicos los datos del panel 135


8.1 Introducción 135
8.2 El Estimador de Arellano y Bond 136
8.2.1 Pruebas de efectos individuales en modelos autorregresivos 138
8.2.2 Modelos con variables exógenas 139
8.3 El Estimador Arellano y Bover 142
8.4 Las condiciones de momentos Ahn y Schmidt 145
8.5 El Blundell y Bond System GMM Estimador 147
8.6 El Keane y Runkle Estimador 148
8.7 Desarrollos posteriores 150
8,8 empírica Ejemplo: demanda dinámica para los cigarrillos 156
8.9 Lectura adicional 158
notas 161
Problemas 162

esequilibradas modelos de panel 165


9.1 Introducción 165
9.2 La unidireccional no balanceado Modelo componente de error 165
9.2.1 Métodos ANOVA 167
9.2.2 estimadores de máxima verosimilitud 169
9.2.3 Mínimo norma y de mínima varianza cuadráticas Unbiased Estimadores
(MINQUE y MIVQUE) 170
9.2.4 Resultados de Monte Carlo 171
9.3 Ejemplo empírica: hedónico Vivienda 171
9.4 El bidireccional desequilibrado modelo de componentes de error 175
9.4.1 El modelo de efectos fijos 175
9.4.2 El modelo de efectos aleatorios 176
9.5 Las pruebas para individuales y hora efectos utilizando datos de panel no balanceado 177
9.6 El modelo de componente anidado Error desequilibrada 180
9.6.1 empírica Ejemplo 181
notas 183
Problemas 184
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

X Contenido

10 Temas especiales 187


10.1 Error de medición y datos de panel 187
10.2 paneles giratorios 191
10.3 pseudopaneles 192
10.4 Métodos Alternativos de Agrupación de series temporales de datos de corte transversal 195
10.5 Los paneles espaciales 197
10.6 a corto plazo frente a estimaciones correr de duración en modelos Mancomunados 200
10.7 Los paneles heterogéneos 201
notas 206
Problemas 206

11 Las variables dependientes limitadas y datos de panel 209


11.1 fijos y modelos Probit y Logit aleatoria 209
11.2 Simulación estimación de modelos de variables dependientes limitadas con datos de panel
215
11.3 panel dinámico de datos limitado Modelos variable dependiente 216
El sesgo de selección 11.4 en datos de panel 219
11.5 censuradas y modelos truncado panel de datos 224
11.6 aplicaciones empíricas 228
Oferta de trabajo de las enfermeras: 11.7 Ejemplo empíricos 229
11.8 Lectura adicional 231
notas 234
Problemas 235

12 paneles no estacionarias 237


12.1 Introducción 237
12.2 unidad de panel de Roots Análisis Suponiendo que la sección transversal de la Independencia 239
12.2.1 Levin, Lin y Chu prueba 240
12.2.2 Im, Pesaran y prueba de Shin 242
Prueba de 12.2.3 Breitung 243
12.2.4 La combinación pag- Las pruebas de valor 244
12.2.5 Prueba LM Residual-Based 246
12.3 unidad de panel de Roots Análisis Permitir para la dependencia de la sección transversal 247
12.4 Regresión espurias en datos de panel 250
12.5 Análisis Panel de cointegración 252
12.5.1 Pruebas-residuales Basado DF y ADF (Pruebas de Kao) 252
12.5.2 Prueba LM Residual-Based 253
Pruebas 12.5.3 Pedroni 254
Test de cointegración probabilidad basada en 12.5.4 255
12.5.5 Propiedades muestra finita 256
12,6 estimación e inferencia en modelos de panel de cointegración 257
12,7 Ejemplo empírica: paridad de poder adquisitivo 259
12.8 Lectura adicional 261
notas 263
Problemas 263

referencias 267

Índice 291
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

Prefacio

e libro está dirigido a un curso de posgrado en la econometría de datos de panel. Los requisitos previos incluyen una
ena formación en estadística matemática y econometría a nivel de Greene (2003). presentaciones de matriz son necesarios
a este tema.
Algunas de las características principales de este libro son que proporciona una A hoy la cobertura de las técnicas de datos de panel,
ecialmente para la correlación en serie, correlación espacial, heterocedasticidad, regresiones aparentemente no relacionadas,
aciones simultáneas, dynamicmodels, paneles incompletos, variables dependientes limitadas y los paneles no estacionarios. He
ado de mantener las cosas sencillo,
trando las ideas básicas utilizando el misma notación para una literatura diversa con notación heterogéneo. Muchas de las
nicas de estimación y pruebas se ilustran con conjuntos de datos que están disponibles para uso en el aula en el sitio web de
ey (www.wiley.com/go/baltagi3e). El libro también cita y resume varios estudios empíricos que utilizan técnicas de datos de
el, de modo que el lector pueda relacionar los métodos econométricos con las aplicaciones económicas. Avanza el libro de
odos uniecuacionales a métodos de ecuaciones simultáneas como en cualquier texto de econometría estándar, por lo que
e resultar agradable a los estudiantes graduados.

El libro da la coveragewithout básica es enciclopédica. Hay una gran cantidad de investigación en esta área y no están
biertos todos los temas. La primera conferencia de datos de panel se realizó en Parismore hace más de 25 años, y esto
ultó en dos volúmenes de la Annales de l'INSEE
ado por Mazodier (1978). Desde entonces, se han producido once conferencias internacionales sobre datos de panel, el último
a Texas A & M University, College Station, Texas, junio de 2004.
Al llevar a cabo esta revisión, me beneficiado de la enseñanza de cursos cortos de datos de panel en la Universidad de
ifornia en San Diego (2002); Fondo Monetario Internacional (FMI), Washington, DC (2004, 2005); Universidad de
zona (1996); Universidad de Cincinnati (2004); Instituto de Estudios Avanzados, Viena (2001); Universidad de Innsbruck
02); Universidad del Rosario, Bogotá (2003); Universidad Nacional de Seúl (2002); Centro Interuniversitario de
onometría (CIDE) -Bertinoro (1998); TorVergataUniversity en Roma (2002); Instituto de Investigación Económica (IWH)
alle (1997); Banco Central Europeo, Francfort (2001); Universidad de Mannheim (2002); Centro de Estudios Económicos
ES-IFO), Munich (2002); Instituto Alemán de Investigación Económica (DIW), Berlín (2004); Universidad de París II,
nthéon (2000); Modelado Conferencia internacional sobre la economía de Asia y el Pacífico, Cairns, Australia (1996). La
cera edición, como el segundo, sigue utilizando ejemplos más empíricos de la literatura de datos de panel para motivar el
o. se han eliminado todas las pruebas dadas en los apéndices de la primera edición. Hay ejemplos trabajados a cabo
zando Stata y EViews. Los conjuntos de datos, así como la salida y programas para implementar los procedimientos de
mación y pruebas que se describen en el libro
JWBK024-Baltagi 30 de de marzo de, de 2005 07:47 Conde Char = 0

xii Prefacio

se proporcionan en el sitio web Wiley (www.wiley.com/go/baltagi3e). Actividades adicionales se han añadido y soluciones a los
ejercicios seleccionados se proporcionan en el sitio web Wiley. Problemas y soluciones publicado en Teoría econométrica y se
utiliza en este libro no se dan en las referencias, como en las ediciones anteriores, para ahorrar espacio. Estas pueden ser
fácilmente rastreados hasta su origen en la revista. Por ejemplo, cuando el libro se refiere al problema 99.4.3, esto se puede
encontrar en
Teoría Econométrica, en el año 1999, número 4, 3 problema.
Varios capítulos han sido revisados ​y en algunos casos acortado o ampliado sobre. Más especí fi camente, el capítulo 1
se ha actualizado con direcciones de sitios web para las fuentes de datos de panel, así como una mayor motivación para qué
hay que utilizar datos de panel. Capítulos 2, 3 y 4 tienen estudios empíricos ilustrados con Stata y EViews salida. El material
de heterocedasticidad en el capítulo 5 está completamente revisada y actualizada con los últimos resultados de estimación y
prueba. El material en la correlación en serie se ilustra con Stata y TSP. Se añade un ejemplo de ecuaciones simultáneas
utilizando datos crimen al Capítulo 7 y se ilustra con Stata. El método de Hausman y Taylor también se ilustra con Stata
utilizando datos PSID para estimar una ecuación de ingresos. Capítulo 8 actualiza la literatura datos de panel dinámico
utilizando documentos recientemente publicados e ilustra los métodos de estimación utilizando una demanda dinámica de los
cigarrillos. Capítulo 9 incluye ahora salida Stata en la estimación de una ecuación de la vivienda hedónica utilizando datos de
panel no balanceadas. Capítulo 10 tiene una actualización de paneles espaciales, así como paneles heterogéneos. Capítulo
11 actualiza los modelos de datos de panel variables dependientes limitadas con los recientes trabajos sobre el tema y
agrega una aplicación en la estimación de la oferta de trabajo de las enfermeras en Noruega. Capítulo 12 en los paneles no
estacionarios es completamente reescrito. La literatura ha continuado a explotar, con varios resultados teóricos, así como
influyentes trabajos empíricos que aparecen en este periodo. Se añade una ilustración empírica sobre paridad de poder
adquisitivo y se ilustra con EViews.

Me gustaría dar las gracias a mis co-autores de lo que me permite dibujar libremente en nuestro trabajo conjunto. En
particular, me gustaría agradecer Ene Askildsen, Georges Bresson, Young-Jae Chang, Peter Egger, Jim Griffith n, Tor Helge
Holmås, Chihwa Kao, Walter Krämer, Dan Levin, Dong Li, Qi
Li, Michael Pfaffermayr, Nat Pinnoi, Alain Pirotte, Dan Rich, Seuck Heun Song y Pingwu. Muchos colegas que tenían
directa e indirecta influencia sobre el contenido de este libro incluyen Luc Anselin, George Battese, Anil Bera, Richard
Blundell, Trevor Breusch-, Chris Cornwell, Bill Griffiths, Cheng Hsiao, Max King, Kajal Lahiri, GS Maddala, Roberto
Mariano , László Mátyás, ChiaraOsbat, M.HashemPesaran, PeterC.B. Phillips, Peter Schmidt, PatrickSevestre, Robin
Sickles, Marno Verbeek, TomWansbeek y Arnold Zellner. Clint Cummins proporciona resultados de referencia para los
ejemplos de este libro utilizando TSP. David Drukker proporciona ayuda con Stata en el procedimiento de Hausman y
Taylor, así como EC2SLS en el capítulo 7. Además, la prueba Baltagi y Wu LBI en el Capítulo 9. Glenn Sueyoshi
proporciona ayuda con EViews en las pruebas de raíz unitaria en el capítulo 12 del panel. Gracias también a Steve
Hardman y Rachel Goodyear a Wiley por su e fi ciente y ayuda editorial profesional, Teri Tenalio que escribió numerosas
revisiones de este libro y mi esposa Phyllis cuyo aliento y apoyo me dio la energía necesaria para completar este libro.
Las responsabilidades de los errores y omisiones son mi propio.
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

1.

Introducción

DATOS 1.1 PANEL: algunos ejemplos

este libro, el término “datos de panel” se refiere a la puesta en común de las observaciones en una muestra representativa de
hogares, países, firmas, etc. lo largo de varios períodos de tiempo. Esto puede lograrse mediante una encuesta a varios
ares o individuos y siguiendo themover tiempo. Dos ejemplos bien conocidos de los datos del panel de Estados Unidos son el
udio sobre el ISR (PSID) recogidos por el Instituto de Investigaciones Sociales de la Universidad de Michigan
p://psidonline.isr.umich.edu) y la Encuesta Nacional Longitudinal ( NLS), que es un conjunto de encuestas patrocinadas por el
eau of Labor Statistics (http://www.bls.gov/nls/home.htm).

El PSID se inició en 1968 con 4800 familias y ha crecido a más de 7000 familias en
01. By2003, thePSIDhad recogido informationonmore than65 000 individuos que abarca hasta 36 años de su
a. entrevistas anuales se llevaron a cabo entre 1968 y 1996. En 1997, este surveywas rediseñado para la
opilación de datos bienal. Además, childrenwas introdujeron los samplewas núcleo reducidos y una muestra de
aso de las familias inmigrantes post-1968 y su adulto. El foco central de los datos es anddemographic
onómica. La lista de variables incluye el ingreso, el estado de la pobreza, la asistencia pública en forma de
mentos o vivienda, otros asuntos financieros (por ejemplo, impuestos, transferencias entre hogares), la estructura
miliar y las medidas demográficas, el trabajo del mercado de trabajo, el tiempo de las tareas del hogar, la vivienda,
movilidad geográfica, socioeconómica fondo y la salud. Otros temas suplementarios incluyen características de la
enda y de vecinos, la motivación de logro, cuidado de niños,

El NLS, por el contrario, son un conjunto de encuestas diseñadas para recopilar información en múltiples puntos de tiempo en las

vidades del mercado de trabajo y otros eventos de la vida signi fi cativas de varios grupos de hombres y mujeres:

El NLSY97 consiste en una muestra representativa de aproximadamente 9.000 jóvenes


que eran de 12-16 años de edad a partir de 1997. El NLSY97 está diseñado para documentar la transición de la escuela al trabajo y
en la edad adulta. Se recoge una amplia información sobre el comportamiento del mercado de trabajo jóvenes y experiencias
educativas en el tiempo.
El NLSY79 consiste en una muestra representativa a nivel nacional de 12 686 hombres jóvenes y
las mujeres que eran de 14-24 años de edad en 1979. Estos individuos fueron entrevistados por año hasta 1994 y en la
actualidad son entrevistados cada dos años.
Los niños y los adultos jóvenes NLSY79. Esto incluye a los niños nacidos de biológicos
mujeres en el NLSY79.
El NLS de mujeres maduras y mujeres jóvenes: cuenta con un grupo de mujeres que 5083
estaban entre las edades de 30 y 44 en 1967. También, 5159 mujeres que estaban entre las edades de 14 y 24 en
1968. Los encuestados en estas cohortes siguen siendo entrevistado en forma bienal.
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

2 El análisis econométrico de datos de panel

(5) El NLS de los hombres mayores y hombres jóvenes: cuenta con un grupo de hombres que eran 5020
entre las edades de 45 y 59 en 1966. Además, un grupo de 5225 hombres que estaban entre las edades de 14 y 24 en
1966. Las entrevistas para estos dos cohortes cesó en 1981.

La lista de variables incluye información sobre la escolarización y de la carrera transiciones, el matrimonio y la fertilidad, las inversiones en

formación, el uso de cuidado infantil y consumo de drogas y alcohol. Un gran número de estudios han utilizado los conjuntos de datos de NLS y

PSID. revistas de mano de obra en particular, tienen numerosas aplicaciones de estos paneles. Klevmarken (1989) cita una bibliografía de 600

artículos y monografías que utilizan los conjuntos de datos PSID publicados. Estos abarcan una amplia gama de temas, incluyendo la oferta de

trabajo, los ingresos, la situación económica de la familia y los efectos de los programas de transferencia de ingresos, cambios en la composición

de la familia, la movilidad residencial, el consumo de alimentos y la vivienda.

Los paneles también se pueden construir fromtheCurrent PopulationSurvey (CPS), hogar amonthly nacional surveyof unos
50 000households conductedby theBureauofCensus para theBureau of Labor Statistics (http://www.bls.census.gov/cps/). Esta
encuesta se ha llevado a cabo durante más de 50 años. En comparación con los datos de NLS y PSID, el CPS contiene menos
variables, se extiende por un período más corto y no sigue los motores. Sin embargo, se cubre una muestra mucho mayor y es
representativo de todos los grupos demográficos.

Aunque los paneles de Estados Unidos comenzó en la década de 1960, no fue hasta la década de 1980 que los paneles
europeos comenzaron a establecer. En 1989, una sección especial de la Revisión Económica Europea artículos publicados utilizando
el Panel Socioeconómico Alemán (ver Hujer y Schneider, 1989), el estudio sueco del mercado doméstico y actividades no de
mercado (ver BJ orklund, 1989) y la
Intomart panel de holandesa de los hogares (ver Alessie, Kapteyn y Melenberg, 1989). La primera ola del panel socioeconómico alemán (GSOEP) se

recogió por el DIW (Instituto Alemán de Investigación Económica, Berlín) en 1984 e incluyó 5921 hogares alemanes Hueso (www.diw.de/soep). Esto

incluyó 12 290 encuestados. Las variables estándar demográficas, así como los salarios, ingresos, pagos bene fi t, nivel de satisfacción con diversos

aspectos de la vida, esperanzas y temores, participación política, etc. Se recogen. En 1990, 4453 adultos encuestados en 2179 hogares de Alemania del

Este se incluyeron en el GSOEP debido a la uni fi cación de Alemania. La tasa de desgaste ha sido relativamente baja en GSOEP. Wagner, Burkhauser y

Behringer (1993) informan de que a través de ocho olas del GSOEP, el 54,9% de los encuestados originales del panel tienen registros sin años que faltan.

Un inventario de los estudios nacionales utilizando datos de panel se le da al (http://psidonline.isr.umich.edu/Guide/PanelStudies.aspx). Estos incluyen el

Panel socioeconómico belga (www.ufsia.ac.be/CSB/sep nl.htm) que entrevistas una muestra representativa de 6471 hogares en Bélgica en 1985, 3800 en

1988 y 3800 en 1992 (incluyendo una nueva muestra de 900 hogares) . También, 4632 hogares en 1997 (incluyendo una nueva muestra de 2375

hogares). Encuesta TheBritishHouseholdPanel (BHPS) que es un hogares privados surveyof anuales en Gran Bretaña primera recogido en 1991 por el

Instituto de Investigación Social y Económica de la Universidad de Essex (www.irc.essex.ac.uk/bhps). Se trata de una muestra representativa nacional de

unos 5.500 hogares y 10 300 individuos dibujado from250 áreas de Gran Bretaña. Los datos recogidos incluye características demográficas y de uso

doméstico, organización del hogar, labormarket, la salud, la educación, la vivienda, el consumo y el ingreso, social y valores políticos. El Panel de Hogares

de Swiss (SHP), cuya onda primera en 1999 entrevistó a 5074 hogares que comprenden 7799 individuos (www.unine.ch/psm). TheLuxembourgPanel

Socio-Economique “Liewen zu Letzebuerg” (PSELL I) (1985-1994) se basa en una muestra representativa de 2012 hogares y 6110 individuos. En 1994, el

PSELL II amplió a 2978 hogares y 8232 individuos. El Grupo Mercado sueco de estudio y actividades de no mercado (SUH) se recogieron en 1984,

TheLuxembourgPanel Socio-Economique “Liewen zu Letzebuerg” (PSELL I) (1985-1994) se basa en una muestra representativa de 2012 hogares y 6110

individuos. En 1994, el PSELL II amplió a 2978 hogares y 8232 individuos. El Grupo Mercado sueco de estudio y actividades de no mercado (SUH) se

recogieron en 1984, TheLuxembourgPanel Socio-Economique “Liewen zu Letzebuerg” (PSELL I) (1985-1994) se basa en una muestra representativa de

2012 hogares y 6110 individuos. En 1994, el PSELL II amplió a 2978 hogares y 8232 individuos. El Grupo Mercado sueco de estudio y actividades de no

mercado (SUH) se recogieron en 1984,

1986, 1988, 1991, 1993, 1996 y 1998 (http://www.nek.uu.se/faculty/klevmark/hus.htm).


WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

Introducción 3

datos correspondientes a 2619 individuos fueron recolectados en el cuidado de niños, la vivienda, el trabajo de mercado, los ingresos y la

eza, la reforma fiscal (1993), la disposición a pagar por un buen ambiente (1996), impuestos locales, servicios públicos y actividades de la

nomía negro (1998) .

El Panel de Hogares de la Comunidad (PHOGUE) está diseñado y coordinado por el estadístico O fi cina de las
munidades Europeas (Eurostat) en el centro, ver Peracchi (2002). La onda primera se llevó a cabo en 1994 e
uyó a todos los miembros actuales de la UE excepto Austria, Finlandia y Suecia. Austria se unió en 1995,
landia en 1996 y los datos de Suecia se obtuvo de la Encuesta de Condiciones de Vida de Suecia. El proyecto se
so en marcha para obtener información comparable entre los países miembros sobre la renta, el trabajo y el
pleo, la pobreza y la exclusión social, la vivienda, la salud, y muchos otros indicadores sociales diversos que
ican las condiciones de vida de los hogares y las personas. El EHCP estaba vinculado desde el principio a los
neles nacionales existentes (por ejemplo, Bélgica y Holanda) o corría paralela a paneles existentes con contenido
milar, a saber, GSOEP, PSELL y la BHPS.

Otros estudios de panel incluyen: la Encuesta Canadiense de Dinámica de Ingresos de Trabajo (SLID) recogidos por
tistics Canada (www.statcan.ca), que incluye una muestra de aproximadamente 35 000 hogares ubicados a lo largo de las
z provincias. Años 1993 a 2000 son disponibles. La Encuesta de panel japonés en los consumidores (JPSC) recogido en
94 por el Instituto de Investigación sobre Economía del Hogar (www.kakeiken.or.jp). Esta es una muestra representativa
ional de 1500 mujeres de 24 y 34 años en 1993 (cohorte A). En 1997, se añadieron 500 mujeres con edades
mprendidas entre 24 y 27 (cohorte B). La información recopilada incluye la composición familiar, el comportamiento del
rcado de trabajo, los ingresos, el consumo, el ahorro, activos, pasivos, vivienda, bienes de consumo duraderos, la
ministración del hogar, el uso del tiempo y la satisfacción. El Monitoreo Longitudinal de Rusia Encuesta (RLMS) recogidos
1992 por el Centro de Población de Carolina en la Universidad de Carolina del Norte
ww.cpc.unc.edu/projects/rlms/home.html). El RLMS es una encuesta de hogares representativa a nivel nacional diseñado
a medir los efectos de las reformas rusas en el bienestar económico. Los datos incluyen la salud individual y la ingesta
ética, la medición de los gastos y la utilización de servicios y datos a nivel de la comunidad, incluyendo los precios fi cas
ecí-región y la infraestructura comunitaria. La Corea del Trabajo y Renta Estudio de Panel (KLIPS) disponible para
98-2001 encuestas de 5000 hogares y sus miembros de siete ciudades metropolitanas y áreas urbanas en ocho provincias
p://www.kli.re.kr/klips). El dueño de casa, Los ingresos y la dinámica laboral en Australia (HILDA) es una encuesta panel
hogares cuya primera ola se llevó a cabo por el Instituto de Melbourne Económica Aplicada e Investigación Social en 2001
p://www.melbourneinstitute.com/hilda). Esto incluye hogares con 7682 13 969 488 miembros de diferentes regiones
inas a través de Australia. La Encuesta de Vida Familiar Indonesia (http://www.rand.org/FLS/IFLS) está disponible para
93-1994, 1997-1998 y 2000. En 1993, esta encuesta 7224 familias que viven en 13 de las 26 provincias de Indonesia.

Esta lista de conjuntos de datos de panel es de ninguna manera exhaustiva, pero ofrece una buena selección de
njuntos de datos de panel de fácil acceso para la investigación económica. En contraste con estas encuestas micro del
nel, hay varios estudios sobre la paridad de poder adquisitivo (PPA) y la convergencia de crecimiento entre los países
e utilizan paneles de macro. -recurso utilizado es awell las Tablas PennWorld disponibles en www.nber.org. estudios de
mercio internacional que utilizan paneles indicadores usingWorldDevelopment están disponibles en el Banco Mundial en
w.worldbank.org/data, Dirección de los datos de comercio y estadísticas financieras internacionales fromthe
ernationalMonetaryFund (www.imf.org). Varias características específicas de cada país para estos estudios por países
upados se pueden obtener de “World Factbook” de la CIA disponible en la web en
p://www.odci.gov/cia/publications/factbook.
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

4 El análisis econométrico de datos de panel

Prácticamente todos los textos graduado en la econometría contiene un capítulo o una sección importante de la econometría
de datos de panel. Lecturas recomendadas sobre este tema incluyen (2003) Sociedad Econométrica monografía de Hsiao junto
con dos capítulos de la Handbook of Econometría:
capítulo 22 por Chamberlain (1984) y en el capítulo 53 por Arellano y Honor' e (2001). Maddala
(1993) editado dos volúmenes que recogen algunos de los artículos clásicos sobre el tema. Esta colección de lecturas se
actualiza con dos volúmenes más que cubren el período de 1992 a 2002 y editado por Baltagi (2002). Otros libros sobre el
tema incluyen Arellano (2003), Wooldridge (2002) y un manual sobre los econometría de datos de panel que en su segunda
edición contenían 33 capítulos editados byM'
aty' como y Sevestre (1996). Un libro en honor de GS Maddala, editado por Hsiao et al.
(1999); un libro en honor de Pietro Balestra, editado por Krishnakumar y Ronchetti (2000); y un libro con una buena perspectiva
histórica sobre datos de panel por Nerlove (2002). Publicaciones recientes de la encuesta incluyen Baltagi y Kao (2000) y Hsiao
(2001). Los últimos números especiales de revistas en datos de panel incluyen dos volúmenes de la Annales d'Economie et
Statistique de editado por Sevestre (1999), una edición especial de la Oxford Boletín de Economía y Estadística editado por
Banerjee (1999), dos números especiales (Volumen 19, Números 3 y 4) de Los comentarios econométricos editado por
Maasoumi y Heshmati, una edición especial de Los avances en Econometría editado por Baltagi, Fomby y Hill (2000) y una
edición especial de Economía empírica editado por Baltagi (2004).

El objetivo de este libro es proporcionar una simple introducción a algunas de las cuestiones básicas de análisis de datos
de panel. Está destinado a economistas y social scientistswith el fondo habitual en estadística y econometría. datamethods
panel se han utilizado en la ciencia política, véase Beck y Katz (1995); en sociología, consulte England et al. (1988); en
finanzas, véase Brown, Kleidon y Marsh (1983) y Boehmer y Megginson (1990); y en la comercialización, ver Erdem (1996) y
Keane (1997). Mientras que restringe el enfoque del libro a los temas básicos no puede hacer justicia a esta literatura en
rápido crecimiento, sin embargo es inevitable en vista de las limitaciones de espacio del libro. Los temas que no se tratan en
este libro incluyen modelos de duración y funciones de riesgo (véase Heckman y Singer, 1985; Florens, Forg'

ERE y Monchart, 1996; Horowitz y Lee, 2004).


Además, los datos del panel literatura de frontera de producción usando (ver Schmidt y Sickles, 1984; Battese y
Coelli, 1988; Cornwell, Schmidt y Sickles, 1990; Kumbhakar y Lovell, 2000; Koop y el Acero, 2001) y la literatura
sobre tiempo- parámetros variables, randomcoef coe fi andBayesianmodels, ver Swamy y Tavlas (2001) andHsiao
(2003). La literatura programevaluation, ver Heckman, Ichimura y Todd (1998) y Abbring y Van den Berg (2004), por
mencionar algunos.

1.2 ¿Por qué SHOULDWE USO DEL PANEL DE DATOS? sus beneficios
Y LIMITACIONES

Hsiao (2003) y Klevmarken (1989) Lista de varios beneficios del uso de datos de panel. Estos incluyen los siguientes.

(1) El control de heterogeneidad individual. Los datos de panel sugiere que los individuos, fi rma, estados o países son
heterogéneos. Time-serie y estudios de sección transversal no controlar esta heterogeneidad corren el riesgo de obtener
resultados sesgados, por ejemplo, ver Moulton (1986, 1987). Para demostrar esto con un ejemplo empírico. Baltagi y Levin (1992)
consideran que la demanda de cigarrillos en 46 estados americanos de los años 1963-88. El consumo se modela como una
función del lag consumo, precios e ingresos. Estas variables varían con los estados y tiempo. Sin embargo, hay una gran
cantidad de otras variables que pueden ser invariante por el estado o invariante en el tiempo que pueden afectar al consumo.
Llamemos a estos Z yo y W t, respectivamente. Ejemplos de Z yo son la religión y la educación. Para la variable religión, uno puede no
ser capaz de obtener el porcentaje de la población
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

Introducción 5

decir, por ejemplo, Mormón en cada estado para todos los años, ni que uno espera que eso cambie mucho en el tiempo. Lo mismo es
to para el porcentaje de la población de completar la escuela secundaria o un título universitario. Ejemplos de W t incluir publicidad en
elevisión y radio. Esta publicidad es a nivel nacional y no varía entre los estados. Además, algunas de estas variables se di fi culto a
dir o difícil de obtener por lo que no todo el Z yo o W t variables están disponibles para su inclusión en la ecuación de consumo. La
sión de estas variables conduce a un sesgo en las estimaciones resultantes. Los datos de panel son capaces de controlar para estas
ables estatal y invariantes en el tiempo, mientras que un estudio de series de tiempo o un estudio de sección transversal no puede.
hecho, a partir de los datos se observa que Utah tiene menos de la mitad de la media de consumo per cápita de cigarrillos en los
UU. por habitante. Esto se debe a que es sobre todo un estado mormón, una religión que prohíbe fumar. El control de Utah en una
ción transversal de regresión se puede hacer con una variable ficticia que tiene el efecto de eliminar la observación de que el estado
a regresión. Este no sería el caso para los datos de panel, como vamos a descubrir en breve. De hecho, con datos de panel, se
ría primera diferencia de los datos de deshacerse de todos Z yo - escriba las variables y por lo tanto controlar de manera efectiva para
as las características especí-estatales fi c. Esto es válido si el Z yo son observables o no. Alternativamente, la variable ficticia para Utah
trola para cada efecto c especificidad por el estado que es distintivo de Utah sin omitir las observaciones para Utah.

Otro ejemplo está dado por Hajivassiliou (1987), que estudia el problema de la deuda externa reembolsos usando un panel de
países en vías de desarrollo observados durante el período 1970-1982. Estos países difieren en cuanto a su historia colonial,
instituciones financieras, afiliaciones a fi religiosos y regímenes políticos. Todas estas variables especí fi cas de cada país
ctan a las actitudes que estos países tienen con respecto a los préstamos y el impago y la forma en que son tratados por los
stamistas. Sin tener en cuenta esta heterogeneidad país provoca graves cación fi misspeci.

Deaton (1995) da otro ejemplo de la economía agrícola. Esto se refiere a la cuestión de si las pequeñas fincas son más productivas que las

ndes. Regresiones MCO de rendimiento por hectárea en los insumos como la tierra, la mano de obra, fertilizantes, la educación de los

cultores, etc. por lo general encontramos que la señal de la estimación de la tierra ciente coe fi es negativo. Estos resultados implican que

granjas más pequeñas son más productivos. Algunas explicaciones de la teoría económica argumentan que una mayor producción per

ta es una respuesta óptima a la incertidumbre por los pequeños agricultores, o que el trabajo contratado requiere más supervisión de mano

obra familiar. Deaton (1995) ofrece una explicación alternativa. Esta regresión sufre de la omisión de la heterogeneidad no observada, en

e caso “calidad de la tierra”, y esta variable omitida se correlaciona de forma sistemática con el (tamaño de la finca) variable explicativa. De

ho, granjas en las zonas marginales de baja calidad (semidesérticas) son típicamente grandes, mientras que las granjas en las zonas

estres de alta calidad suelen ser pequeños. Deaton argumenta que mientras que los jardines AñadirMás valor añadido por hectárea que

estación de ovejas, esto no implica que las estaciones de ovejas deben organizarse como jardines. En este caso, la diferenciación no

de resolver la cuestión “pequeñas granjas son productivas”, ya que por lo general tamaño de la explotación cambiar poco o nada en

oluto durante períodos cortos.

(2) datos de panel dan los datos más informativos, más variabilidad, menos colinealidad entre las variables, más grados de libertad y
más e. estudios de series temporales están plagadas de multicolinealidad; por ejemplo, en el caso de la demanda de cigarrillos
eriores, existe una alta colinealidad entre el precio y el ingreso en la serie de tiempo agregado de los EE.UU.. Esto es menos
bable con un panel a través de los Estados Americanos desde la dimensión de la sección transversal añade una gran cantidad de
abilidad, añadiendo más datos informativos sobre precios e ingresos. De hecho, la variación de los datos se puede descomponer en
ación entre estados de diferentes tamaños y características, y la variación dentro de los estados. El ex variación es generalmente
s grande. Con adicional, más informativo de datos puede producir estimaciones de los parámetros más fiables. Por supuesto, la
ma relación tiene que sostener para cada estado,

decir, los datos tienen que ser agrupables. Esta es una hipótesis comprobable y que vamos a abordar en su debido momento.
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

6 Análisis econométrico de datos de panel (3) datos de panel son más capaces de estudiar la dinámica del ajuste. distribuciones
de la sección transversal que se ven relativamente estable esconden una multitud de cambios. Períodos de desempleo, la rotación
laboral, residencial y incomemobility son mejores paneles studiedwith. Los datos de panel son adecuados alsowell para estudiar la
duración de los estados económicos como el desempleo y la pobreza, y si estos paneles son lo suficientemente largos, que pueden
arrojar luz sobre la velocidad de los ajustes a los cambios de política económica. Por ejemplo, en la medición de desempleo, datos
transversales pueden estimar qué proporción de la población está en paro en un punto en el tiempo. Repetidas secciones transversales
pueden mostrar cómo esta proporción cambia con el tiempo. un panel de datos sólo se pueden estimar qué proporción de los que están
en el paro en un período puede permanecer en paro en otro periodo. cuestiones de política importantes, como la determinación de si
las experiencias de la pobreza de las familias, el desempleo y la dependencia del bienestar son transitorias o crónicas requieren el uso
de paneles. Deaton (1995) sostiene que, a diferencia de las secciones transversales, encuestas de panel producen datos en cambios para
los individuos u hogares. Se nos permite observar cómo el nivel de vida individuales cambian durante el proceso de desarrollo. Nos
permite determinar quien es bene fi ción del desarrollo. También nos permite observar si la pobreza y la privación son transitorios o de
larga duración, la cuestión de dinámica de ingresos. Los paneles también son necesarios para la estimación de las relaciones
inter-temporales, ciclo de vida y modelos intergeneracionales. De hecho, los paneles pueden relacionar experiencias y el
comportamiento del individuo en un momento dado en el tiempo a otras experiencias y el comportamiento en otro punto en el tiempo.
Por ejemplo, en la evaluación de programas de formación, un grupo de participantes y no participantes se observó antes y después de
la implementación del programa de formación. Se trata de un panel de al menos dos períodos de tiempo y la base de la “diferencia en
diferencias” estimador por lo general se aplica en estos estudios; ver Bertrand, Du fl o y Mullainathan (2004).

(4) datos de panel son más capaces de identificar y medir los efectos que simplemente no son detectables en sección transversal puro o series

cronológicas de datos puros. Supongamos que tenemos una sección transversal de las mujeres con un promedio de tasa de actividad del 50% anual. Esto

podría deberse a (a) cada mujer que tiene un 50% de posibilidades de estar en la fuerza de trabajo, en un año determinado, o (b) el 50% de las mujeres

que trabajan todo el tiempo y el 50% no en todos. El caso (a) tiene una alta rotación, mientras que el caso (b) no tiene ninguna rotación. un panel de datos

sólo podían discriminar entre estos casos. Otro ejemplo es la determinación de si los aumentos de miembros unión o disminuye los salarios. Esto puede

ser mejor respondida, mientras se observa un trabajador en movimiento de la unión a empleos no sindicalizados o viceversa. La celebración de las

características del individuo constante, estaremos mejor equipados para determinar si la afiliación sindical afecta a los salarios y por cuánto. Este análisis

se extiende a la estimación de otros tipos de diferenciales de salarios que llevan a cabo las características de los individuos constante. Por ejemplo, la

estimación de las primas salariales pagados en trabajos peligrosos o desagradables. Los economistas que estudian los niveles de satisfacción de los

trabajadores con el problema de anclar en un estudio de corte transversal, ver WinkelmannandWinkelmann (1998) inChapter 11. El surveyusuallyasks

thequestion: ‘¿cómo satis fi cado está usted con su vida’, con lo que significa cero insatisfecho completamente fi cado y el 10 significado completamente

satisfecha. El problema es que cada individuo ancla su escala en diferentes niveles, lo que hace comparaciones interpersonales de respuestas sin sentido.

Sin embargo, en un estudio de panel, donde la métrica utilizada por los individuos es invariante en el tiempo durante el período de observación, se puede

evitar este problema, ya que la diferencia (o efectos fijos) estimador hará que la inferencia basada sólo en intra en lugar de la comparación interpersonal

de satisfacción. la estimación de las primas salariales pagados en trabajos peligrosos o desagradables. Los economistas que estudian los niveles de

satisfacción de los trabajadores con el problema de anclar en un estudio de corte transversal, ver WinkelmannandWinkelmann (1998) inChapter 11. El

surveyusuallyasks thequestion: ‘¿cómo satis fi cado está usted con su vida’, con lo que significa cero insatisfecho completamente fi cado y el 10 significado

completamente satisfecha. El problema es que cada individuo ancla su escala en diferentes niveles, lo que hace comparaciones interpersonales de

respuestas sin sentido. Sin embargo, en un estudio de panel, donde la métrica utilizada por los individuos es invariante en el tiempo durante el período de

observación, se puede evitar este problema, ya que la diferencia (o efectos fijos) estimador hará que la inferencia basada sólo en intra en lugar de la comparación interpersonal de satisfacción. la estim

(5) los modelos de datos de panel nos permiten construir y probar los modelos de comportamiento más complicados que la sección
transversal o de series de tiempo de datos puramente. Por ejemplo, técnica e fi ciencia ha sido mejor estudiada andmodeledwith
paneles (seeBaltagi andGrif fi n, 1988b; Cornwell, Schmidt y Sickles, 1990; Kumbhakar y Lovell, 2000; Baltagi, Griffith n y Rich, 1995;
Koop y del Acero, 2001). También,
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

Introducción 7

nos restricciones pueden ser impuestas en los paneles en un modelo lag distribuido que en un estudio puramente timeseries (ver
ao, 2003).
(6) datos de panel Micro reunieron en los individuos, firmas y los hogares se pueden medir con más precisión que
ablesmeasured similar en themacro nivel. Los sesgos resultante fromaggregation sobre rms Fi o individualsmay ser
minado reducedor ( seeBlundell, 1988; Klevmarken, 1989). Para ventajas fi cas y desventajas de los modelos del ciclo de
a de estimación utilizando micro datos de panel, véase Blundell y Meghir (1990).

(7) los datos de panel macro en otra parte tienen una serie de tiempo más largo y a diferencia del problema de las distribuciones no estándar

os de las pruebas de raíces unitarias en análisis de series temporales, Capítulo 12 muestra que las pruebas de raíz unidad de panel tienen

ibuciones asintóticas estándar.

Limitaciones de datos de panel incluyen: (1) recogida de datos de diseño y los problemas. Para una extensa discusión de los
blemas que surgen en el diseño de encuestas de panel, así como cuestiones de recopilación de datos y gestión de datos ver
sprzyk et al. (1989). Estos incluyen problemas de cobertura (relación incompleta de la población de interés), la falta de respuesta
bido a la falta de cooperación del demandado o debido a un error del entrevistador), memoria (encuestado no recordar
rectamente), la frecuencia de la entrevista, el espaciamiento entrevista, período de referencia, el uso de delimitador y el sesgo de
mpo dentro de la muestra (ver Bailar, 1989). 1

(2) Las distorsiones de los errores de medición. Los errores de medición pueden surgir a causa de las respuestas
óneas debido a cuestiones poco claras, errores de memoria distorsión deliberada de las respuestas (por ejemplo, el
go de prestigio), informantes inapropiados, registro erróneo de las respuestas y los efectos del entrevistador (véase
ton, Kasprzyk y McMillen, 1989). Herriot y Spiers (1975), por ejemplo, un partido de CPS y datos Servicio de Impuestos
ernos sobre los ingresos de los mismos individuos y muestran que hay discrepancias de al menos el 15% entre las dos
ntes de ingresos para casi el 30% de la muestra pareada. El estudio de validación por Duncan y Hill (1985) en el PSID
mbién ilustra la significación del problema error de medición. Se comparan las respuestas de los empleados de una gran fi
a con los registros del empleador. Duncan y Hill (1985) fi nd sesgos de respuesta pequeños excepto forwork hourswhich
sobrestiman. La varianza error de relación ofmeasurement a la varianza verdadera se encuentra que es 15% para los
resos anuales, 37% para las horas de trabajo anuales y 184% para ganancias medias por hora. Estas cifras son para un
ro de un año, es decir, 1.983 para el año 1982, y que aremore doubledwith dos años de retiro. Brown and Light (1992)
estigan la inconsistencia en las respuestas de tenencia de empleo en el PSID y NLS. De la sección transversal de datos
los usuarios no tienen más remedio que creer los valores reportados de tenencia (a menos que tengan información
erna), mientras que los usuarios de los datos de panel pueden comprobar si hay inconsistencias de las respuestas de
encia con el tiempo transcurrido entre las entrevistas. Por ejemplo, un demandado puede pretender tener tres años de
manencia en una entrevista y un año más tarde reclamar seis años. Esto debería alertar al usuario de este panel a la
sencia de error de medición.

(3) problemas de selectividad. Estos incluyen: (a) Auto-selectividad. La gente elige no trabajar porque el salario de reserva
es mayor que
el salario ofrecido. En este caso observamos las características de estos individuos, pero no sus salarios. Dado que
sólo le falta su salario, la muestra está censurada. Sin embargo, si no observamos todos los datos de estas personas
esto sería una muestra truncada. Un ejemplo de truncamiento es el experimento impuesto negativo Nueva Jersey.
Sólo estamos interesados ​en la pobreza, y las personas con ingresos mayores que 1,5 veces el nivel de pobreza se
eliminan de la muestra. Inferencia a partir de esta muestra truncada introduce un sesgo que no se alivia con más
datos, debido al truncamiento (ver Hausman y Wise, 1979).
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

8 Análisis econométrico de datos de panel (b) La falta de respuesta. Esto puede ocurrir en la ola inicial del panel debido a la

negativa a participar,
nadie en casa, unidad de muestra sin marcar, y por otras razones. Artículo (o parcial) la falta de respuesta se produce
cuando una o más preguntas se dejan sin respuesta o se encuentran no para proporcionar una respuesta útil. la falta de
respuesta completa se produce cuando no hay información disponible en el hogar de la muestra. Además de los datos
tomissing debido ef pérdida de e fi, esta falta de respuesta puede causar serios problemas de identificación de los
parámetros de la población. Horowitz y Manski (1998) muestran que la gravedad del problema es directamente proporcional
a la cantidad de falta de respuesta. tasas de no respuesta en la primera ola de los paneles europeos varían de un país
desde el 10% en Grecia e Italia, donde la participación es obligatoria, con el 52% en Alemania y 60% en Luxemburgo. La
tasa de no respuesta global es del 28%, ver Peracchi (2002). La tasa de no respuesta comparable para la primera ola de la
PSID es del 24%, para la BHPS (26%), para el GSOEP (38%) y para PSELL (35%). (do) Desgaste. Mientras que la falta de
respuesta se produce también en los estudios de la sección transversal, es una más grave

paneles problemin porque las ondas posteriores del panel todavía están sujetos a la falta de respuesta. Los encuestados pueden

mueren, o se mueven, o nd fi que el coste de la respuesta es alta. ver BJ orklund


(1989) y Ridder (1990, 1992) sobre las consecuencias del desgaste. El grado de desgaste varía dependiendo en el panel
estudiado; ver Kalton, Kasprzyk y McMillen (1989) para varios ejemplos. En general, las tasas globales de incremento de
desgaste de una onda a la siguiente, pero la tasa de aumento disminuye con el tiempo. Becketti et al. (1988) estudian la
representatividad de la PSID después de 14 años desde que empezó. Los autores nd fi que sólo el 40% de los que
originalmente en la muestra en 1968 permaneció en la muestra en 1981. Sin embargo, sí nd fi que, en lo que se refiere a la
dinámica de entrada y salida, el PSID sigue siendo representativa. Las tasas de desgaste entre la primera y la segunda
onda varían de 6% en Italia a 24% en el Reino Unido. La tasa de desgaste media es de aproximadamente 10%. Las tasas
comparables de desgaste de la primera a la segunda onda son 12% en el BHPS, 12. 4% para la muestra de Alemania
Occidental y el 8,9% para la muestra de Alemania del Este en el GSOEP y 15% para PSELL, ver Peracchi (2002). Con el fin
de contrarrestar los efectos de desgaste, paneles giratorios se utilizan a veces, donde un porcentaje fijo de los encuestados
se sustituyen en cada ola para reponer la muestra. Más en rotación y pseudo-paneles en el Capítulo 10. Un número
especial de la Diario de Recursos Humanos, La primavera de 1998, se dedica a la atrición en las encuestas longitudinales.
(4) Breve dimensión de series temporales. paneles micro típicos implican datos anuales que cubren un corto espacio de
tiempo para cada individuo. Esto significa que los argumentos asintóticos dependen fundamentalmente de la cantidad de
individuos que tienden a infinito. Aumentar el espacio de tiempo del panel no está exenta de costos, ya sea. De hecho, esto
aumenta las posibilidades de desgaste y aumenta la dif computacional di fi para los modelos de variables dependientes
limitadas de datos de panel (véase el capítulo 11).

(5) Sección transversal dependencia. paneles macro en países o regiones con una serie mucho tiempo que no dan cuenta de
cross-country dependencemay conducen tomisleading inferencia. Capítulo 12 muestra que varias pruebas de raíz unitaria del panel
sugeridas en la literatura asume sección transversal independencia. Contabilización de sección transversal dependencia resulta ser
importante y afecta a la inferencia. pruebas de raíz unitaria panel de alternativa se sugiere que dan cuenta de esta dependencia.

Los datos de panel no es una panacea y no va a resolver todos los problemas que una serie temporal o un estudio de sección transversal

no podía manejar. Se dan ejemplos en el capítulo 12, en el que citan estudios econométricos alegando que los datos de panel rendirá más

potentes de raíces unitarias que de series de tiempo individual. Esto a su vez debería ayudar a arrojar más luz sobre la paridad del poder

adquisitivo y las cuestiones de convergencia crecimiento. De hecho, esto llevó a una Urry fl de aplicaciones empíricas junto con algunos

escépticos que argumentaron que los datos de panel no ha guardado el PPP o el problema de la convergencia del crecimiento,
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0

Introducción 9

Maddala (1999), Maddala, Wu y Liu (2000) y Banerjee, Marcelino y Osbat (2004,


5). La recogida de datos de panel es bastante costoso, y siempre existe la pregunta de con qué frecuencia se debe entrevistar a los
uestados. Deaton (1995) sostiene que el desarrollo económico está lejos de ser instantánea, por lo que los cambios de un año a otro
probablemente demasiado ruidoso y demasiado corto plazo a ser realmente útil. Su conclusión es que la recompensa por datos de
el es durante períodos de tiempo largos, cinco años, diez años, o incluso más tiempo. Por el contrario, para los temas de salud y
ición, especialmente de los niños, se podría argumentar el caso contrario, es decir, se necesitan esos paneles con un lapso de tiempo
s corto con el fin de controlar la salud y el desarrollo de estos niños.

Este libro hará que el caso de que los datos de panel proporciona varias ventajas digno de su coste. Sin embargo, como Griliches (1986)

utieron sobre los datos económicos en general, más que tenemos de él, cuanto más demanda de la misma. El economista de datos de

el utilizando o cualquier otro dato de que la materia tiene que saber sus limitaciones.

NOTA

ounding se usa para prevenir el desplazamiento de eventos desde fuera del periodo de recuerdo en el periodo de recuerdo. Tiempo dentro de la muestra se
observa sesgo cuando un nivel diferente signi cativamente fi para una característica se produce en la primera entrevista que en entrevistas posteriores,
cuando uno esperaría el mismo nivel.
WBK024-Baltagi 30 de de marzo de, de 2005 4: 0 Conde Char = 0
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

2
El componente de error de una vía

Modelo de regresión

2.1 INTRODUCCIÓN

regresión de datos de panel difiere de una serie de tiempo regular o sección transversal de regresión en que tiene un doble subíndice en

variables, es decir,

y it = α + X ' eso β + u eso i = 1, . . . , NORTE; t = 1, ..., T (2,1)

yo hogares que denotan, los individuos, firmas, países, etc., y t que denota el tiempo. los yo
índice, por lo tanto, denota la dimensión en sección transversal mientras t denota la dimensión de series de tiempo. α es un escalar, β es K ×

X eso es el eso ésima observación en K variables explicativas. La mayoría de las aplicaciones de datos de panel utilizan un modelo de
mponente de error de un solo sentido para las perturbaciones, con

u it = μ i + ν eso (2,2)

de μ yo denota la inobservable individuo especí efecto fi c y ν eso denota la perturbación resto. Por ejemplo, en una ecuación de
esos en la economía del trabajo, y eso medirá ganancias de la cabeza de la familia, mientras X eso puede contener un conjunto de
ables como la experiencia, la educación, la afiliación sindical, el sexo, la raza, etc. Tenga en cuenta que μ yo es invariante en el
mpo y es responsable de cualquier efecto c fi individuo especí que no está incluido en la regresión. En este casewe podría
sar que es la capacidad no observada del individuo. La perturbación resto ν eso varía con las personas y tiempo y puede ser
sado como la perturbación habitual en la regresión. Alternativamente, para una función de producción que utiliza los datos de
as a través del tiempo, y eso medirá la producción y

so medirá entradas. Los efectos fi c rm especí inobservable fi serán capturados por el μ yo


odemos pensar en ellos como las habilidades empresariales o de gestión no observables de los ejecutivos de la fi rma. Las
meras aplicaciones de componentes de error en economía incluyen Kuh (1959) sobre la inversión, Mundlak (1961) y Hoch
62) en las funciones de producción y Balestra y Nerlove (1966) en la demanda de gas natural. En forma vectorial (2.1) se
de escribir como

y = αι NT + X β + u = Z δ + u (2,3)

de y es Nuevo Testamento × 1, X es Nuevo Testamento × K, Z = [ ι NT, X], δ '= ( α ', β ') y ι Nuevo Testamento es un vector de los de dimensión NT. También, (2.2) se

de escribir como

u = Zμ μ + ν (2,4)

de u '= ( u 11, . . . , u 1 T, u 21, . . . , u 2 T, . . . , u norte 1, . . . , u NT) con las observaciones apilados de tal manera que el índice más lento es sobre los

viduos y el índice más rápido es el paso del tiempo. Z μ = yo norte ⊗ ι T


de yo norte es una matriz de identidad de dimensión NORTE, ι T es un vector de los de dimensión T y ⊗
notesKronecker producto. Z μ es un selectormatrix de unos y ceros, o simplemente thematrix de maniquíes individuales
e onemay incluyen en la regresión para estimar la μ yo si se supone que son parámetros fijos. μ '= ( μ 1, . . . , μ N) y ν '= ( ν 11, . . . , ν 1 T, . . . , ν
1, . . . , ν NT). Tenga en cuenta que
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

12 El análisis econométrico de datos de panel

Z μ Z ' μ = yo norte ⊗ J T dónde J T es una matriz de los de dimensión T y P = Z μ ( Z ' μ Z μ) - 1 Z ' μ, la


matriz de proyección en Z μ, reduce a yo norte ⊗ ¯ J T dónde J T = J T / T. PAG es una matriz que tiene un promedio

la observación a través del tiempo para cada individuo, y Q = I Nuevo Testamento - PAG es una matriz que obtiene las desviaciones
de medios individuales. Por ejemplo, la regresión y en la matriz de variables ficticias Z μ obtiene los valores predichos Py que
tiene un elemento típico y yo. = Σ T
t = 1 y eso / T re-

Peated T veces para cada individuo. Los residuos de esta regresión se dan por Qy que tiene un elemento típico ( y eso - y yo.
)
. PAG y Q son (i) matrices simétricas idempotentes, es decir, PAG '= PAG
y PAG 2 = pag. Esto significa que el rango ( P) = tr ( P) = N y rango ( Q) = tr ( Q) = N (T - 1). Esto utiliza el resultado de que el rango de
una matriz idempotente es igual a su trace (ver Graybill, 1961, teorema 1.63). También, (ii) PAG y Q son ortogonales, es decir, PQ = 0
y (iii) la suma es la matriz de identidad P + Q = I NT. De hecho, cualesquiera dos de estas propiedades implican la tercera (ver
Graybill, 1961, teorema 1.68).

2.2 El modelo de efectos fijos

En este caso, el μ yo se supone que son parámetros fijos para ser estimados y el resto con perturbaciones estocásticas ν eso
)
independientes e idénticamente distribuidos IID (0, σ 2
ν
. los X eso
se supone independiente de la ν eso para todos yo y t. El modelo de efectos fijada es un catión específico apropiado si nos centramos en un
conjunto específico de norte firmas, por ejemplo, IBM, GE, Westinghouse, etc., y nuestra inferencia se limita a la conducta de estos
conjuntos de firmas. Alternativamente, podría ser un conjunto de norte países de la OCDE, o norte los Estados Americanos. Inferencia en
este caso está condicionada a lo particular norte fi rms, países o estados que se observan. Uno puede sustituir las perturbaciones dadas
por (2.4) en (2.3) para obtener

y = αι NT + X β + Z μ μ + ν = Z δ + Z μ μ + ν (2,5)

y luego realizar los mínimos cuadrados ordinarios (MCO) en (2.5) para obtener estimaciones de α, β y μ. Tenga en cuenta que Z es Nuevo

Testamento x ( K + 1), y Z μ, la matriz de maniquíes individuales, es Nuevo Testamento × NORTE. Si norte es grande, (2.5) incluirá demasiados
maniquíes individuales, y la matriz para ser invertida por MCO es grande y de dimensión ( N + K). De hecho, desde α y β son los parámetros

de interés, se puede obtener la LSDV (mínimos cuadrados variables ficticias) estimador de (2.5), por premultiplicando el modelo por Q y la

realización de OLS en el modelo transformado resultante:

Qy = QX β + Q ν (2,6)

Esto utiliza el hecho de que QZ μ = Q ι = NT 0, ya PZ μ = Z μ. En otras palabras, el Q matriz elimina los efectos individuales.
Esto es una regresión de ~ y = Qy con elemento típico ( y eso - ¯ y yo.)
en ~ X = QX con elemento típico ( X que, k - ¯ X i., k) Para el k º regresor, k = 1, 2, . . . , K. Esta
implica la inversión de un ( K × K) matriz en lugar de ( N + K) x ( N + K) como en (2,5). El estimador OLS resultante es

~ β = ( X ' QX) - 1 X ' Qy (2,7)

con var ( ~ β) = σ 2 ν ( X ' QX) - 1 = σ 2 ν ( ~ X ' ~ X) - 1. ~ β podría haber sido obtenido a partir de (2.5) utilizando re-

sultados en inversa con particiones o el teorema Frisch-Waugh-Lovell discutidos en Davidson y MacKinnon (1993, p. 19).
Esto utiliza el hecho de que PAG es la matriz de proyección en Z μ y
Q = I Nuevo Testamento - PAG ( véase el problema 2.1). Además, los mínimos cuadrados generalizados (GLS) en (2.6), utilizando el inverso generalizado, será

también el rendimiento ~ β ( véase el problema 2.2).


WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión 13

Tenga en cuenta que por la simple regresión

y it = α + β X it + μ i + ν eso (2,8)

n promedio de más tiempo da

yȳ yo. = α + β ¯ X yo. + μ i + ¯ ν yo. (2,9)

lo tanto, restando (2.9) a partir de (2.8) da

y eso - ¯ y yo. = β ( X eso - ¯ X yo.) + ( ν eso - ¯ ν yo.) (2,10)

bién, con un promedio a través de todas las observaciones en (2.8) da

Ȳ .. = α + β ¯
Y X.. + ¯ ν .. (2,11)

erewe utilizarse la restricción de que Σ norte i=1μi= 0. Esto es una restricción arbitraria en el maniquí
ables coeficientes para evitar la trampa de la variable ficticia, o multicolinealidad perfecta; ver Trajes (1984) para formulaciones
rnativas de esta restricción. De hecho, sólo β y ( α + μ yo ) son estimable a partir de (2.8), y no α y μ yo por separado, a menos que una
ricción como Σ norte
i = 1 μ i = 0 se impone. En
e caso, ~ β se obtiene a partir de regresión (2,10), ~ α = ¯ Y .. - ~ β X..
¯ puede ser recuperado a partir de (2.11)
X̄..

μi= ¯ y yo. - ~ α - ~ β XX̄¯ yo. a partir de (2.9). Para los grandes paneles de trabajo o de consumo, donde norte es muy grande,
resiones como (2.5) puede no ser factible, ya que uno está incluyendo ( norte - 1) maniquíes en la regresión. Este fijos efectos
) de mínimos cuadrados, también conocidos como mínimos cuadrados variables ficticias (VENB), adolece de una gran pérdida
grados de libertad. Estamos estimando ( norte - 1) parámetros adicionales, y también muchos maniquíes pueden agravar el
blema de multicolinealidad entre las variables. Además, este estimador FE no se puede estimar el efecto de cualquier variable
ariante en el tiempo como el sexo, la raza, la religión, la educación o la participación sindical. Estas variables invariantes en el
mpo son eliminados por el Q transformación, las desviaciones frommeans transformación (ver (2.10)). Alternativamente, uno
de ver que estas variables invariantes en el tiempo se abarcado por los maniquíes individuales en (2.5) y por lo tanto cualquier
uete de regresión de intentar (2.5) fallarán, señalización multicolinealidad perfecta. Si (2,5) es el modelo verdadero, LSDV es el
mador insesgado mejor lineal (BLUE) mientras ν eso es la disturbancewithmean clásica 0 y varianza-covarianza matriz estándar σ 2

ν yo NT. Tenga en cuenta que a medida T → ∞, el estimador es consistente FE. Sin embargo, si T es fijo y

te → ∞ Como es típico en los paneles de trabajo cortos, sólo entonces el estimador de FE β es consistente; los estimadores de Fe de los
ctos individuales ( α + μ yo ) no son consistentes puesto que el número de estos parámetros aumenta a medida norte aumenta. Este es el

blema de parámetros incidentales discutido por Neyman y Scott (1948) y revisado más recientemente por Lancaster (2000). Obsérvese

cuando el modelo verdadero es efectos fi jo como en (2.5), OLS en (2.1) proporciona estimaciones sesgadas e inconsistentes de los

ámetros de regresión. Se trata de un sesgo de las variables de omisión, debido al hecho de que elimina los maniquíes OLS individuales,

ndo en realidad son relevantes.

(1) Las pruebas para efectos fijos. Uno podría probar la significación conjunta de estos maniquíes, es decir,

μ 1 = μ 2 = · · · = μ norte - 1 = 0, mediante la realización de una F- prueba. (Pruebas de los efectos individuales será tratado ampliamente en
Capítulo 4.) Este es un simple test de Chow con las cantidades restringidas de cuadrados residuales (RRSS) siendo la de OLS en
modelo agrupado y las sumas residuales de libre disposición de cuadrados (URSS) es que de la regresión LSDV. Si norte es
nde, se puede realizar la transformación y el uso Dentro de esa suma residual de cuadrados como la URSS. En este caso

HO
F 0 = ( RRSS - URSS) / ( norte - 1) URSS / ( Nuevo ~ F norte - 1, NUEVO TESTAMENTO - 1) - K (2,12)
Testamento - norte - K)
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

14 Análisis econométrico de datos de panel (2) advertencia computacional. Una precaución computacional para aquellos que

utilizan theWithin regresión dado por (2.10). los s 2 de esta regresión tal como se obtiene a partir de un paquete de regresión típica divide

las sumas residuales de los cuadrados por Nuevo Testamento - K ya que no se incluyen la intersección y los maniquíes. El correcto s 2, decir

s * 2 de la regresión LSDV en (2.5), dividiría las mismas sumas residuales de los cuadrados por NUEVO TESTAMENTO - 1) - K. Por lo

tanto, uno tiene que ajustar las varianzas obtenidas de la Dentro de regresión (2,10) multiplicando la matriz de varianza-covarianza por ( s *

2/ s 2) o simplemente multiplicando por [ Nuevo Testamento - K] / [N (T - 1) - K].

(3) estimaciones robustas de los errores estándar. Para el estimador Dentro, Arellano (1987) sugiere un método simple para
obtener estimaciones robustas de los errores estándar que permiten una matriz de varianza-covarianza general sobre la ν eso como
en White (1980). Uno podría apilar el panel como una ecuación para cada individuo:

y i = Z yo δ + μ yo ι T + ν yo (2,13)

dónde y yo es T × 1, Z i = [ ι T, X yo ], X yo es T × K, μ yo es un escalar, δ '= ( α, β '), ι T es un vector de los de dimensión T y ν yo es T × 1. En


general, MI( ν yo ν '
i) = i para i = 1, 2, . . . , NORTE, dónde
yo es una matriz positiva de finito de dimensión T. Todavía suponemos MI( ν yo ν ' j) = 0, por i = j. T se supone pequeño y norte grande
como en el hogar o empresa paneles, y se llevan a cabo los resultados asintóticos para norte → ∞ y T fi ja. Dentro de llevar a cabo
la transformación de este conjunto de ecuaciones (2.13) se obtiene

~ y i = ~ X yo β + ~ ν yo (2,14)

dónde ~ y = Qy, ~ X = QX y ~ ν = Q ν, con ~ y = ( ~ y ' 1, . . . , ~ y' N) ' y ~ y i = ( yo T - ¯ J T) y yo . com-


puting robustos mínimos cuadrados en este sistema, como se describe por White (1980), bajo la restricción de que cada
ecuación tiene la misma β uno tiene la Dentro del estimador β que tiene la siguiente distribución asintótica:

norte 1/2 ( ~ β - β) ~ NORTE( 0, METRO - 1 VM - 1) (2,15)

dónde M = Plim ( ~ X ' ~ X) / N y V = Plim Σ norte i = 1 ( ~ Xyo' yo ~ X yo )/ NORTE. Tenga en cuenta que ~ X i = ( yo T - ¯
J T) X yo
y ~ X ' Q diag [ yo ] Q ~ X = ~ X ' diag [ yo ] ~ X ( véase el problema 2.3). En este caso, V se estima por
~ V = Σ norte
i = 1 ~ Xyo' ~ u yoyo~ ~
u 'X yo / NORTE, dónde ~ u i = ~ y yo - ~ X yo ~ β. Por lo tanto, el robusto varianzas y asintótica
matriz de covarianza de β se estima por
[ norte ]
Σ
var ( ~ β) = ( ~ X ' ~ X) - 1 ~ X' ( ~ X ' ~ X) - 1 (2,16)
yo ~ u yoyo~~uX' yo
i=1

2.3 EL MODELO RANDOM EFECTOS

Hay demasiados parámetros en el modelo de efectos fi ja y la pérdida de grados de libertad puede ser evitado si el μ yo se
puede suponer aleatorio. En este caso μ yo ~ IID (0, σ 2
μ), ν eso ~ IID (0, σ 2 ν)
y el μ yo son independientes de la ν eso . además, el X eso son independientes de la μ yo y ν eso ,
para todos yo y t. El modelo de efectos aleatorios es un catión específico apropiado si estamos dibujando norte

individuos al azar de una población grande. Este suele ser el caso para los estudios de panel de hogares. Hay que tener
cuidado en el diseño del panel tomake que “representativa” de la población que estamos tratando de hacer inferencias
acerca. En este caso, norte suele ser grande y un modelo de efectos fijada llevaría a una enorme pérdida de grados de
libertad. El efecto individual se caracteriza como al azar y la inferencia se refiere a la población fromwhich esta muestra se
extrajo al azar.
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión 15

o ¿cuál es la población en este caso? Nerlove y Balestra (1996) enfatizan (1944) la opinión de que la población Haavelmo
nsiste no de un infinito de individuos, en general, sino de un infinito de decisiones ”Que cada individuo puede hacer. Este punto
vista es consistente con una de efectos aleatorios específico de cationes. A partir de (2.4), se puede calcular la matriz de
anza-covarianza

= E (uu ') = Z μ MI( μμ ') Z ' μ+ MI( νν ') (2,17)

= σ 2 μ ( yo norte ⊗ J T) + σ 2 ν( yo norte ⊗ yo T)

o implica una varianza var homocedásticos ( u IT) = σ 2 μ + σ 2 ν para todos yo y t, y un equicorrelated


riz de covarianza diagonal por bloques que muestra la correlación en serie en el tiempo sólo entre las perturbaciones del
mo individuo. De hecho,

cov ( u eso , u js) = σ 2 μ+ σ2 ν


para i = j, t = s

= σ2μ para i = j, t = s

ero en caso contrario. Esto también significa que el coeficiente de correlación entre fi u eso y u js es

ρ = correl ( u eso , u js) = 1 para i = j, t = s


= σ 2 μ / ( σ 2μ + σ 2 ν)
para i = j, t = s

ero en caso contrario. Con el fin de obtener el estimador GLS de los coe fi cientes de regresión, necesitamos - 1. Esta es una matriz
rme para paneles típicos, y es de dimensión Nuevo Testamento × NT. Sin la fuerza bruta de inversión debe ser tratado, incluso si la
cación del investigador tiene una pequeña norte y T. 1

mos a seguir un simple truco ideado por Wansbeek y Kapteyn (1982b, 1983) que permite la derivación de - 1 y - 1 /
En esencia, se reemplaza J T por T ¯ J T y yo T por ( mi T + ¯ J T)
de mi T es por definición ( yo T - ¯ J T). En este caso

= T σ 2 μ ( yo norte ⊗ ¯ J T) + σ 2 ν( yo norte ⊗ mi T) + σ 2 ν( yo norte ⊗ ¯ J T)

ecogida de términos con las mismas matrices, obtenemos

= ( T σ 2μ + σ 2 ν) ( yo norte ⊗ ¯ J T) + σ 2 ν( yo norte ⊗ mi T) = σ 2 1P + σ2 νQ
(2,18)

nde σ 2 1= T σ2 μ+ σ2 ν. ( 2.18) es la representación de la descomposición espectral , con σ 2 1

ndo la primera raíz única característica de la de la multiplicidad norte y σ 2 ν la segunda singular


z característico de de la multiplicidad NUEVO TESTAMENTO - 1). Es fácil de verificar, utilizando las propiedades de

G y Q, ese

-1= 1
P+1 Q (2,19)
σ21 σ ν2

- media = 1
P+1 Q (2,20)
σ1 σν

hecho,
r=( σ2
1) r P + ( σ 2 ν) r Q dónde r es un escalar arbitrario. Ahora podemos obtener GLS como
nimos cuadrados ponderados. Fuller andBattese (1973, 1974) suggestedpremultiplying la ecuación de regresión dada en
3) por σ ν - media = Q + ( σ ν / σ 1) PAG y la realización de OLS en la regresión transformada resultante. En este caso, y * = σ ν - 1/2 y tiene
elemento típico y eso - θ ¯ y yo. dónde
1 - ( σ ν / σ 1) ( véase el problema 2.4). Esta regresión transformado invierte una matriz de dimensión ( K + 1) y puede ser fácilmente
lementado utilizando cualquier paquete de regresión.
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

dieciséis El análisis econométrico de datos de panel

Los mejores imparciales (BQU) estimadores cuadráticos de los componentes de la varianza surgen naturalmente de la
descomposición espectral de . De hecho, Pu ~ ( 0, σ 2 1 PAG) y Qu ~ ( 0, σ 2 ν Q) y

Σ norte
̂ σ 2 1 = u ' Pu ū 2yo./ norte
u (2,21)
tr ( P) = T
i=1

y
ΣT
i=1 t=1( u eso - ¯ u yo.) 2
̂ σν2= u ' Qu (2,22)
tr ( Q) = Σ norte NUEVO TESTAMENTO - 1)

proporcionar los estimadores BQU de σ 2 1y σ2 ν, respectivamente (véase el problema 2.5).


Estos son los análisis de los estimadores de tipo varianza de los componentes de varianza y son varianza sin sesgo bajo
normalidad de las perturbaciones mínima (véase Graybill, 1961). Las perturbaciones verdaderas no son conocidos y por lo tanto
(2.21) y (2.22) no son factibles. Wallace y Hussain (1969) sugieren la sustitución de OLS residual ̂ u OLS en lugar de la verdadera u. Después
de todo, bajo el modelo de efectos aleatorios, las estimaciones MCO siguen siendo imparcial y consistente, pero fi ciente ya no ef.
Amemiya (1971) muestra que estos estimadores de los componentes de la varianza tienen una distribución asintótica diferente de
que el conocimiento de las perturbaciones verdaderos. Se sugiere el uso de los residuos LSDV en lugar de los residuos MCO. En
este caso ~ u = y - ~ αι Nuevo Testamento - X ~ β dónde

~ α = ¯Y .. - ¯ X '. . ~ β y ¯ X '. . es un 1 × K vector de los promedios de todos los regresores. sustituyendo estos ~ u para

u en (2.21) y (2.22) se obtienen los estimadores de tipo Amemiya de los componentes de la varianza. Las estimaciones resultantes de los
componentes de la varianza tienen la misma distribución asintótica como que el conocimiento de las alteraciones verdaderas:

( √ NT ( ̂ σ 2 ) ( ( 2 σ4 ) )
σ2 0
√ NORTE( ̂ σν 2- ν)
~ norte 0,
ν
(2,23)
μ- σ2 μ)
0 2 σμ4

dónde ̂ σ 2μ = ( ̂ σ 2 1- ̂ σ2 ν) / T. 3
Swamy y Arora (1972) sugieren la ejecución de dos regresiones para obtener estimaciones de los componentes de la varianza
de los errores cuadráticos medios correspondientes de estas regresiones. La primera de regresión es la Dentro de regresión, dada
en (2.10), que se obtiene la siguiente s 2:

̂ σ2 (2,24)
ν=[ y ' Qy - y ' QX (X ' QX) - 1 X ' Qy] / [N (T - 1) - K]

El segundo de regresión es la Entre regresión que se ejecuta la regresión de los promedios a través del tiempo, es decir,

yȳ yo. = α + ¯ X 'yo. β + ¯ u yo. i = 1, . . . , norte (2,25)

Esto es equivalente a premultiplicando themodel en (2.5) por PAG y runningOLS. La única precaución es que esta última tiene la regresión Nuevo
Testamento observaciones, ya que repite los promedios T veces para cada individuo, mientras que la regresión sección transversal en
(2.25) se basa en norte observaciones. Para remediar esto, se puede ejecutar la regresión sección transversal

√T¯
y yo. = α √ T + √ T ¯ X 'yo. β + √ T ¯ u yo. (2,26)

donde se puede verificar fácilmente que var ( √ T ¯ u i.) = σ 2 1. Esta regresión producirá una s 2 dada por

̂ σ2 (2,27)
1=( y ' Py - y ' PZ (Z ' PZ) - 1 Z ' Py) / (N - K - 1)
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión 17

ga en cuenta que el apilamiento de las siguientes dos regresiones transformados nosotros los rendimientos acaba de realizar
( Qy ) ) )
= ( QZ δ + ( Qu (2,28)
Py PZ Pu

error de transformada tiene media 0 y matriz de varianza-covarianza dada por


( σ2 )
νQ 00
σ 2 1 PAG

blema 2.7 pide al lector para verificar que OLS en este sistema de 2 Nuevo Testamento observaciones rinde OLS en el modelo
upado (2.3). También, GLS en este sistema produce GLS en (2,3). Alternativamente, se podría deshacerse de la constante α ejecutando
siguientes regresiones apiladas:
( Qy ) ) )
= ( QX β + ( Qu (2,29)
( PAG - ¯ J NT) y ( PAG - ¯ J NT) X ( PAG - ¯ J NT) u

o se deduce del hecho de que Q ι = NT 0 y ( PAG - ¯ J NT) ι = NT 0. El error transformada tiene


triz media y la varianza-covarianza cero
( σ2 )
νQ
0

0 σ 2 1 ( PAG - ¯ J NT)

S en este sistema rinde OLS en (2.3) y GLS en (2.29) proporciona GLS en (2,3). De hecho,

̂ β GLS = [( X ' QX / σ 2 J NT) X/ σ 2


ν) + X '( PAG - ¯ 1] - 1 [( X ' Qy / σ 2 ν)

+ X '( PAG - ¯ J NT) a / a σ 2 1] (2,30)

= [ W XX + φ 2 segundo XX] - 1 [ W xy + φ 2 segundo xy]

n var ( ̂ β GLS) = σ 2 ν[ W XX + φ 2 segundo XX] - 1. Tenga en cuenta que W XX = X ' QX, B XX = X '( PAG - ¯ J NT) X
2= σ2 ν/ σ 21.
21. Además, el estimador Dentro de β es ~ β dentro = W - 1 XX W xy y el Entre
mador de β es ̂ β entre = segundo - 1 XX segundo Xy. Esto muestra que ̂ β GLS es un promedio ponderado de matriz
Dentro y ̂ β Entre pesando cada estimación por la inversa de su correspondiente varianza. De hecho

̂ β GLS = W 1 ~ β dentro + W 2 ̂ β Entre (2,31)

nde

W 1 = [ W XX + φ 2 segundo XX] - 1 W XX

W 2 = [ W XX + φ 2 segundo XX] - 1 ( φ 2 segundo XX) = yo - W 1

o fue demostrado por Maddala (1971). Tenga en cuenta que (i) si σ 2 μ= 0 entonces φ 2 = 1 y ̂ β GLS
uce a ̂ β MCO. ( ii) Si T → ∞, entonces φ 2 → 0 y ̂ β GLS tiende a ~ β Dentro. También si W XX es enorme en comparación con segundo XX entonces ̂ β GLS

ará cerca de ~ β Dentro. Sin embargo, si segundo XX domina W XX entonces ̂ β GLS


nde a ̂ β Entre. En otras palabras, el estimador Dentro ignora la variación entre y el estimador Entre Dentro ignora la
iación. El OLS correo s timator da la misma importancia a la Entre variaciones ydentro. A partir de (2.30), es evidente
e var ( ~ β Dentro) - var ( ̂ β GLS) es una matriz infinita SEMIDE positivo, ya φ 2 es positivo. Sin embargo, como T → ∞ para
alquier fi jo NORTE, φ 2 → 0 y ambos ̂ β GLS y ~ β Dentro tienen la misma varianza asintótica.

Otra estimador de los componentes de la varianza fue sugerido por Nerlove (1971a). Su sugerencia es estimar σ 2

μ como Σ nortei = 1 ( ̂ μ yo - ̂ μ) 2 / ( norte - 1) donde ̂ μ yo son los coe fi cientes ficticia


WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

18 El análisis econométrico de datos de panel

las estimaciones de la regresión VENB. σ 2 ν se estima a partir theWithin sumas residuales de los cuadrados
dividido por Nuevo Testamento sin corrección de grados de libertad. 4
Tenga en cuenta que, excepto por el método de Nerlove (1971a), uno tiene que recuperar ̂ σ 2 μ como ( ̂ σ 21 - ̂ σ 2 ν) / T. En
este caso, no hay garantía de que la estimación de ̂ σ 2 μ sería negativo. Searle (1971)
tiene una extensa discusión del problema de las estimaciones negativas de los componentes de la varianza en la literatura
biometría. Una solución es reemplazar estas estimaciones negativas por cero. Esto, de hecho, es la sugerencia del estudio de
Monte Carlo por Maddala y el monte (1973). Este estudio fi NDS que las estimaciones negativas sólo se produjo cuando el
verdadero σ 2
μ era pequeño y cercano a cero. En
Estos casos MCO sigue siendo un estimador viable. Por lo tanto, la sustitución negativo ̂ σ 2 μ por cero no es una
mala después de todo pecado, y el problema es despedido por no ser grave. 5
¿Qué hay de las propiedades de los diversos estimadores GLS factibles de ß? Bajo el modelo de efectos aleatorios, GLS
basado en los verdaderos componentes de la varianza es azul, y todos los estimadores GLS factibles consideradas son
asintóticamente e fi ciente, ya sea como norte o T → ∞. Maddala y Monte (1973) OLS comparación, Dentro, el medio, métodos
GLS factibles, MINQUE, el método III de Henderson, verdaderos GLS y la estimación de máxima verosimilitud utilizando su
estudio Monte Carlo. Ellos encontraron pocas diferencias entre los diversos estimadores GLS viables en muestras pequeñas y
argumentaron en favor de los métodos que eran más fáciles de calcular. EMNCI fue despedido como más difíciles de calcular y el
investigador aplicado da una oportunidad en los datos fue advertido para calcular al menos dos métodos de estimación, como un
ANOVA GLS factibles y de máxima verosimilitud para asegurarse de que no producen resultados drásticamente diferentes. Si
ellos dan diferentes resultados, los autores diagnostican fi cación misspeci.

Taylor (1980) deriva resultados de la muestra finitos exactas para el modelo de componente de error de un solo sentido. Se
comparó el estimador Dentro de la Swamy-Arora estimador GLS factible. Él encontró los siguientes resultados importantes:

(1) Factible GLS es más e fi ciente que VENB para todos, pero los grados de libertad menor cantidad. (2) La varianza de GLS
factible es nunca más de 17% por encima del Cramer-Rao límite inferior. (3) Más estimadores fi cientes de los componentes de
la varianza donot necessarilyyieldmore e fi ciente
GLS factibles estimadores.

Estos resultados de la muestra finita son confirmada por los experimentos de Monte Carlo realizadas por Maddala y
Monte (1973) y Baltagi (1981a).
Bellmann, Breitung y Wagner (1989) consideran el sesgo en la estimación de los componentes de la varianza utilizando el método
de Wallace y Hussain (1969) debido a la sustitución de las perturbaciones verdaderos por MCO residuos, también el sesgo en los coe fi
cientes de regresión debido a la utilización de estimada componentes de la varianza en lugar de los verdaderos componentes de la
varianza. La magnitud de este sesgo se calcula utilizando métodos de rutina de carga para dos aplicaciones económicas. La primera
aplicación se refiere innovaciones de producto, presión de las importaciones y insumos de factores usando un panel a nivel de industria.
La segunda aplicación calcula las ganancias de 936 a tiempo completo que trabajan los varones alemanes sobre la base de la primera y
segunda oleada del Panel Socioeconómico Alemán. Sólo la primera aplicación revela un sesgo importante en la estimación σ 2

μ. Sin embargo, esto no afectó el sesgo


tanto en las correspondientes coe fi cientes de regresión.

2.3.1 Fijo vs aleatoria

Después de haber analizado los efectos fijos y aleatorios del modelo de efectos y las suposiciones subyacentes a los mismos, el
lector se queda con la pregunta de enormes proporciones, cuál elegir? Esto es
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión 19

es tan fácil elegir como podría parecer. De hecho, la fi ja frente a los efectos aleatorios tema ha generado un gran
bate en la literatura biometría y estadísticas que se ha extendido a la literatura econometría de datos de panel. Mundlak
61) y Wallace y Hussain (1969) fueron los primeros proponentes del modelo de efectos fijos y Balestra y Nerlove (1966)
n defensores del modelo de componente de error aleatorio. En el Capítulo 4, estudiaremos una prueba fi especificación
puesto por Hausman (1978) que se basa en la diferencia entre el fi jo y estimadores de efectos aleatorios. Por
sgracia, los investigadores aplicados han interpretado como un rechazo a la adopción del modelo de efectos fi ja y no
hazar como una adopción del modelo de efectos aleatorios. 6

amberlain (1984) mostró que el modelo de efectos fijos impone restricciones comprobables en los parámetros del modelo
forma reducida y se debe comprobar la validez de estas restricciones antes de adoptar el modelo de efectos fijos (véase el
ítulo 4). Mundlak (1978) argumentó que el modelo de efectos aleatorios asume exogeneidad de todos los regresores con
efectos individuales aleatorias. En contraste, el modelo de efectos fijos permite endógeno de la todos los regresores con
os efectos individuales. Por lo tanto, es un “todo” o la opción “nada” de exogeneidad de las variables independientes y los
ctos individuales, véase el Capítulo 7 para una discusión más formal de este tema. Hausman y Taylor (1981) permitió algunos
os regresores que se correlaciona con los efectos individuales, en lugar de todo o nada la elección. Estas restricciones fi
ión sobre-identi son comprobables mediante una prueba de tipo Hausman (véase el capítulo 7). Para el investigador
cado, la realización de efectos fijos y de efectos aleatorios y la prueba de Hausman asociado reportado en paquetes
ándar como Stata, LIMDEP, TSP, etc., el mensaje es claro: no se detienen aquí. Prueba de las restricciones que implica el
ectsmodel fijo derivado byChamberlain (1984) (cap 4) y comprobar si un Hausman y Taylor (1981) especí fi cación podría
una alternativa viable (véase el capítulo 7).

2.4 estimación de máxima verosimilitud

o la normalidad de las perturbaciones, se puede escribir la función de verosimilitud como

L ( α, β, φ 2, σ 2 ν) = constante - Nuevo Testamento ν+ norte u '- 1 u (2,32)


2 log σ 2 2 log φ 2 - 1 2 σν2

nde = σ 2 ν
, φ2= σ2 ν/ σ 21 y = Q + φ - 2 PAG a partir de (2.18). Esto utiliza el hecho de que | |=
ducto de sus raíces características = ( σ 2 1) (Nσ=2 (
ν) NUEVO TESTAMENTO - 1) σ2 ν) NT ( φ 2) - N. Tenga en cuenta que hay una
o-a-uno correspondencia entre φ 2 y σ 2 μ. De hecho, 0 ≤ σ 2 μ < ∞ se traduce en 0 < φ 2 ≤
a fuerza bruta maximización de (2.32) conduce a condiciones no lineal de primer orden (ver Amemiya,
71). En su lugar, Breusch (1987) concentra la probabilidad con respecto a α y σ 2 ν. En esto
so, ̂ α = MLE ¯ Y .. - ¯ X '. . ̂ β MLE y ̂ σ 2 ν, MLE = ( 1 / NT) ̂ u ' ̂ - 1 ̂ u dónde ̂ u y ̂ se basan onmaximum
maciones de probabilidad de β, φ 2 y α. Dejar d = y - X ̂ β MLE entonces ̂ α MLE = ( 1 / NT) ι ' Nuevo Testamento re y ̂ u = d - ι Nuevo Testamento ̂ α = MLE re - ¯

J Nuevo Testamento re. Esto implica que ̂ σ 2


ν, MLE puede ser reescrito como

̂ σν,2= MLE re '[ Q + φ 2 ( PAG - ¯ J NT)] d / NT (2,33)

probabilidad concentrada se convierte

L DO( β, φ 2) = constante - Nuevo Testamento J NT)] re} + N (2,34)


2 log { re '[ Q + φ 2 ( PAG - ¯ 2 log φ 2
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

20 El análisis econométrico de datos de panel

Maximizar (2.34) a lo largo φ 2, dado β ( véase el problema 2.9), los rendimientos

re ' qd re yo.) 2
̂ φ2= (2,35)
( T - 1) re '( PAG - ¯ J NT) d = ΣΣ ( Tre(T
eso--1)
¯Σ(¯ re yo. - ¯ re..) 2

Maximizar (2.34) a lo largo β, dado φ 2, rendimientos

̂ β MLE = [ X '( Q + φ 2 ( PAG - ¯ J NT)) X] - 1 X '[ Q + φ 2 ( PAG - ¯ J NT)] y (2,36)

Uno puede recorrer entre β y φ 2 hasta la convergencia. Breusch (1987) muestra que proporcionan
T> 1, cualquier yo ª iteración β, llámalo β yo , da 0 < φ 2 i+1< ∞ en el ( i + 1) -ésima iteración. Más
importante, Breusch (1987) muestra que estas φ 2 yo tener
un “notable propiedad” de formar una
secuencia monótona. De hecho, a partir del estimador Dentro de β, para φ 2 = 0, el siguiente φ 2
es finito y positivo y comienza una secuencia monótona creciente de φ 2. Del mismo modo, a partir de la Entre
estimador de β, para ( φ 2 → ∞) el siguiente φ 2 es finito y positivo y comienza una secuencia monótona decreciente de φ 2. Por
lo tanto, para proteger contra la posibilidad de un máximo local, Breusch (1987) sugiere a partir de ~ β Dentro y ̂ β Entre y la
iteración. Si estas dos secuencias convergen a la misma máxima, entonces este es el máximo global. Si se parte de

β OLS para φ 2 = 1, y la siguiente iteración obtiene una mayor φ 2, thenwe tienen una maximumat local de la frontera φ 2 = 1. nds
Maddala (1971) fi que hay a lo sumo dos máximos para la probabilidad
L ( φ 2) para 0 < φ 2 ≤ 1. Por lo tanto, tenemos que evitar un máximo local.

2.5 PREDICCIÓN

Supposewewant para predecir S períodos futuros para el yo ª persona. Para theGLSmodel, conocer la estructura de
varianza-covarianza de las perturbaciones, Goldberger (1962) mostró que el mejor predictor lineal insesgado (BLUP) de y i, T +
S es

̂ y i, T + S = Z ' i, T + S ̂ δ GLS + w '- 1 ̂ u GLS para s ≥ 1 (2,37)

dónde ̂ u GLS = y - Z ̂ δ GLS y w = UE i, T + S u). Tenga en cuenta que para el período T + S

u i, T + S = μ i + ν i, T + S (2,38)

y w = σ2 μ ( l yo ⊗ ι T) dónde l yo es el yo ésima columna de yo N, es decir, l yo es un vector que tiene 1 en el yo º posición y 0 en otras partes. En
este caso

[1 ] = σ2
μ
w '- 1 = σ 2 μ( l 'yo
yo ⊗ ι ' T)
P+1 Q ( l yo' ⊗ ι ' T) (2,39)
σ21 σ ν2 σ21

ya que ( l ' yo ⊗ ι ' T) P = (l ' yo ⊗ ι ' T) y(l' yo ⊗ ι ' T) Q = 0. Utilizando (2.39), el elemento típico de
w '- 1 ̂ u GLS se convierte en (( T σ 2μ / σ 21)
21) ̂ u yo., GLS) dónde ̂ u yo., GLS = Σ T t = 1 ̂ u eso, GLS / T. Por lo tanto, en (2.37),
la MPLI de y i, T + S corrige la predicción GLS por una fracción de la media de los residuales GLS correspondiente a ese yo
ª persona. Este predictor fue considerado por Taub (1979).
Baillie y Baltagi (1999) consideran la situación práctica de la predicción del modelo de regresión componente de error
cuando no se conocen los componentes de la varianza. Se derivan tanto evidencia teórica y simulación en cuanto a la
relativa deficiencia ef de cuatro predictores alternativos: (i) un predictor ordinaria, basado en el predictor óptimo dada en
(2.37), pero con la sustitución de MLEs parámetros de la población; (Ii) un predictor truncada que ignora la corrección
componente de error, dado por el último término de (2.37), pero utiliza MLEs por sus parámetros de regresión; (Iii) un
misspeci predictor fi ed que utiliza MCO estimaciones de los parámetros de regresión; y (iv) un fi ja efectos predictor que
asume que los efectos individuales son parámetros fi jo que pueden
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión 21

mar. La fórmula asintótica para la predicción MSE se derivan para los cuatro predictores. Utilizando los resultados numéricos
mulación, estos se muestran para llevar a cabo de manera adecuada en tamaños de muestra realistas ( N = 50 y 500 y T = 10
0). Tanto los resultados analíticos y de muestreo muestran que hay una mejora sustancial en la predicción de error cuadrático
dio mediante el predictor ordinario en lugar de la ed fi misspeci o los predictores truncadas, especialmente con el aumento

σ 2 μ / ( σ 2μ + σ 2 ν) valores. El inMSE reducción es de aproximadamente diez veces para ρ = 0,9 y un poco más de
doble de ρ = 0,6 para varios valores de norte y T. El predictor efectos fijos realiza muy bien, siendo un segundo
ca del predictor común para todos los experimentos. Simulación evidencia confirma la importancia de tomar en
enta los efectos individuales al hacer predicciones. El predictor ordinario y el fijada predictor efectos superan a los
dictores fi ed truncadas y misspeci y se recomiendan en la práctica.

Para una aplicación en la ciencia actuarial para el problema de la predicción de necesidades futuras de una clase de riesgo, teniendo en cuenta

eclamaciones anteriores de que los y las clases de riesgo asociado, véase libera, joven y Luo (1999). Ver también Chamberlain y Hirano (1999)

eren que la combinación de formas óptimas de historial de ganancias personales de un individuo con un panel de datos sobre las trayectorias de

ancias de otros individuos para proporcionar una distribución condicional para las ganancias de este individuo.

2.6 EJEMPLOS

.1 Ejemplo 1: Grunfeld Inversión Ecuación

unfeld (1958) examinó la siguiente ecuación de inversión:

yo it = α + β 1 F it + β 2 do it + u eso (2,40)

de yo eso denota la inversión bruta real para fi rm yo en el año t, F eso es el valor real de la fi rma (acciones en circulación) y do eso es el
or real del capital social. Estos datos de panel se componen de 10 grandes de los Estados Unidos de fabricación fi rms más de 20
s, 1935-1954, y están disponibles en el sitio web Wiley como Grunfeld. Fi l. Este conjunto de datos, incluso aunque anticuado, es
un tamaño manejable para el uso en clase y ha sido utilizado por Zellner (1962) y Taylor (1980). Tabla 2.1 da los OLS, Entre

Tabla 2.1 Datos de Grunfeld. Unidireccional Resultados componente de error

β1 β2 ρ σμ σν

OLS 0,116 0,231


(0.006) * (0.025) *
Entre 0,135 0,032
(0.029) (0.191)
Dentro 0,110 0,310
(0.012) (0.017)
WALHUS 0,110 0,308 0,73 87.36 53.75
(0.011) (0.017)
Amemiya 0,110 0,308 0,71 83.52 52.77
(0.010) (0.017)
SWAR 0,110 0,308 0,72 84.20 52.77
(0.010) (0.017)
Imle 0,110 0,308 0.70 80.30 52.49
(0.010) (0.017)

* Estos están sesgadas errores estándar cuando el modelo verdadero tiene perturbaciones componente de error (véase

Moulton, 1986).
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

22 El análisis econométrico de datos de panel

y dentro de los estimadores de los coe fi cientes pendiente junto con sus errores estándar. La entre las estimaciones son
diferentes de la Dentro de las estimaciones y un (1978) Prueba de Hausman en base a su diferencia se da en el Capítulo 4.
OLS y GLS factibles son combinaciones de matriz ponderada de estos dos estimadores. Tabla 2.1 informa tres GLS
estimaciones factibles de los coeficientes de regresión fi junto con las correspondientes estimaciones de ρ, σ μ y σ ν. Estos son
WALHUS, Amemiya y SWAR. EViews calcula el estimador de Wallace y Hussain (1969) como una opción en el procedimiento
de datos de panel de efectos aleatorios. Esta salida EViews se reproduce en la Tabla 2.2. De manera similar, la Tabla 2.3 da la
salida EViews para el procedimiento Amemiya (1971), que se denomina Wansbeek y Kapteyn (1989) en EViews, ya que el
último documento generaliza el método Amemiya para hacer frente a los paneles desequilibradas o incompletos, véase el
capítulo 9. La Tabla 2.4 da la salida EViews para el Swamy y procedimiento Arora (1972). Tenga en cuenta que en la Tabla 2.4,

σ μ = 84.2, ̂ σ ν = 52.77 y ̂ ρ = ̂ σ 2 μ/( ̂ σ 2μ + ̂ σ 2 ν) = 0.72. Esto no es ̂ θ, pero el último puede ser


obtenido como ̂ θ = 1 - ( ̂ σ ν / ̂ σ 1) = 0.86. A continuación, (1987) la estimación de máxima probabilidad iterativo de Breusch se
realiza (Imle). Este procedimiento convergió a un máximo global en tres o cuatro repeticiones dependiendo de si se inició
desde el entre o dentro de los estimadores. No hay mucha diferencia entre las estimaciones de GLS factibles o el iterativa
MLE y todos están cerca de la Dentro de las estimaciones. Esto es comprensible teniendo en cuenta que ̂ θ para estos
estimadores está cerca de 1.

Tabla 2.2 Grunfeld de datos: Wallace y Hussain RE Estimador

Variable dependiente: I
Método: Panel EGLS (de la sección transversal de efectos aleatorios) de la muestra:

1935 1954 Las secciones transversales incluyen: 10

Total Panel (equilibradas) Observaciones: 200


Wallace y Hussain estimador de las varianzas de los componentes

Variable Coeficiente Std. Error t- Estadística Prob.

do - 57.86253 29.90492 - 1.934883 0,0544


F 0.109789 0.010725 10.23698 0.0000
K 0.308183 0.017498 17.61207 0.0000

Efectos Speci fi cación

Sección transversal SD azar / rho 87.35803 0.7254


SD azar Idiosincrático / rho 53.74518 0.2746

Estadísticas tabuladas

R- al cuadrado 0.769410 varianza depende media 19.89203


Equilibrado R- al cuadrado 0.767069 varianza depende SD 109.2808
SE de regresión 52.74214 Suma al cuadrado residual 548001.4
F- estadística 328.6646 estadístico de Durbin-Watson 0.683829
Prob ( F- estadística) 0.000000

Las estadísticas no ponderadas

R- al cuadrado 0.803285 varianza depende media 145.9582


Suma al cuadrado residual 1841243 estadístico de Durbin-Watson 0.203525
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión de 23

bla 2.3 Datos de Grunfeld: Amemiya / Wansbeek y Kapteyn RE Estimador

able dependiente: I
do: Panel EGLS (de la sección transversal de efectos aleatorios) de la muestra:

1954 Las secciones transversales incluyen: 10

al Panel (equilibradas) Observaciones: 200


nsbeek y Kapteyn estimador de las varianzas de los componentes

iable Coeficiente Std. Error t- Estadística Prob.

- 57.82187 28.68562 - 2.015710 0,0452


0.109778 0.010471 10.48387 0.0000
0.308081 0.017172 17.94062 0.0000

Efectos Speci fi cación

ción transversal SD azar / rho 83.52354 0.7147


azar Idiosincrático / rho 52.76797 0.2853

Estadísticas tabuladas

cuadrado 0.769544 varianza depende media 20.41664


ibrado R- al cuadrado 0.767205 varianza depende SD 109.4431
de regresión 52.80503 Suma al cuadrado residual 549309.2
stadística 328.9141 estadístico de Durbin-Watson 0.682171
b ( F- estadística) 0.000000

Las estadísticas no ponderadas

cuadrado 0.803313 varianza depende media 145.9582


a al cuadrado residual 1840981 estadístico de Durbin-Watson 0.203545

.2 Ejemplo 2: Gasolina Demand

tagi y Grif fi n (1983) considera la siguiente ecuación demanda de gasolina:

En Gas + β 3 En coche (2,41)


Autos = α + β 1 En Y N + β 2 En PAG MG
PAG PIB
PAG N+u
nde el gas / Car es el consumo de gasolina de motor per auto, Y / N es el ingreso real per cápita,
G MG / PAG PIB es verdadero motor precio de la gasolina y el coche / norte denota el stock de vehículos por habitante. Este panel
siste en observaciones anuales en 18 países de la OCDE, que abarca el período 1960-1978. Los datos para este ejemplo se dan
mo Gasoline.dat en el sitio web de Wiley. Tabla 2.5 da las estimaciones de los parámetros para OLS, Entre, dentro y tres GLS
maciones factibles de los coeficientes pendiente fi junto con sus errores estándar, y las correspondientes estimaciones de ρ, σ μ y σ

87) iterativa de máxima verosimilitud de Breusch- convergió a un máximo global en cuatro a seis iteraciones en
ción de si se parte de la entre o dentro de los estimadores. Para el procedimiento de SWAR, ̂ σ μ = 0,196, ̂ σ ν = 0,092, ̂ ρ = 0,82
θ = 0.89. Una vez más las estimaciones de θ están más cerca de 1 a 0, lo que explica que sea factible GLS está más
ca del estimador Dentro de que el estimador MCO. Entre los MCO y elasticidad precio estimaciones de la demanda
gasolina son más del doble que para los de dentro y GLS factibles estimadores.
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

24 El análisis econométrico de datos de panel

Tabla 2.4 Grunfeld de datos: Swamy y Arora RE Estimador

Variable dependiente: I
Método: Panel EGLS (de la sección transversal de efectos aleatorios) de la muestra:

1935 1954 Las secciones transversales incluyen: 10

Total Panel (equilibradas) Observaciones: 200 Swamy y Arora estimador


de varianzas de componentes

Variable Coeficiente Std. Error t- Estadística Prob.

do - 57.83441 28.88930 - 2.001932 0,0467


F 0.109781 0.010489 10.46615 0.0000
K 0.308113 0.017175 17.93989 0.0000

Efectos Speci fi cación

Sección transversal SD azar / rho 84.20095 0.7180


SD azar Idiosincrático / rho 52.76797 0.2820

Estadísticas tabuladas

R- al cuadrado 0.769503 varianza depende media 20.25556


Equilibrado R- al cuadrado 0.767163 varianza depende SD 109.3928
SE de regresión 52.78556 Suma al cuadrado residual 548904.1
F- estadística 328.8369 estadístico de Durbin-Watson 0.682684
Prob ( F- estadística) 0.000000

Las estadísticas no ponderadas

R- al cuadrado 0.803304 varianza depende media 145.9582


Suma al cuadrado residual 1841062 estadístico de Durbin-Watson 0.203539

Tabla 2.5 Los datos de demanda de gasolina. Unidireccional Resultados componente de error

β1 β2 β3 ρ σμ σν

OLS 0,890 - 0,892 - 0,763


(0,036) * (0.030) * (0,019) *
Entre 0,968 - 0,964 - 0,795
(0.156) (0.133) (0.082)
Dentro 0,662 - 0,322 - 0,640
(0.073) (0.044) (0.030)
WALHUS 0,545 - 0,447 - 0,605 0.75 0,197 0,113
(0.066) (0.046) (0.029)
Amemiya 0,602 - 0,366 - 0,621 0.93 0,344 0,092
(0.066) (0.042) (0.027)
SWAR 0,555 - 0,402 - 0,607 0.82 0,196 0,092
(0.059) (0.042) (0.026)
Imle 0,588 - 0,378 - 0,616 0.91 0,292 0,092
(0.066) (0.046) (0.029)

* Estos están sesgadas errores estándar cuando el modelo verdadero tiene perturbaciones componente de error (véase Moulton, 1986).

Fuente: Baltagi y Grif fi n (1983). Reproducido con permiso de Elsevier Science Publishers BV (North-Holland).
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

El error de una vía de componentes modelo de regresión 25

.3 Ejemplo 3: Capital Pública Productividad

lowingMunnell (1990), y Baltagi Pinnoi (1995) considera la relación siguiente función de producción
bb-Douglas investigar la productividad del capital público en la producción privada:

En = Y α + β 1 En K 1 + β 3 En K 2 + β 3 En L + β 4 DESEMP + u (2,42)

de Y es producto estatal bruto, K 1 es capital público que incluye carreteras y calles, instalaciones de agua y alcantarillado y otros
icios públicos y estructuras, K 2 es el stock de capital privado con sede en la Oficina de las estimaciones nacionales de la acción el
lisis económico, L se mide como insumo de trabajo empleo en nóminas no agrícolas, DESEMP es la tasa de desempleo del estado se
uye para captar los efectos del ciclo económico. Este panel consiste en observaciones anuales para los 48 estados contiguos durante
eríodo 1970-1986. Este conjunto de datos fue proporcionado por Munnell (1990) y se da como Produc.prn en el sitio web Wiley. Tabla
da las estimaciones para un modelo de componente de error de un solo sentido. Tenga en cuenta que ambos OLS y el Entre los
madores informan de que el capital público es productivo y significativo en los estados de producción privada. Por el contrario,
Within y GLS factibles estimadores encontramos que el capital público es insignificante. Este resultado también fue reportado por
z-Eakin (1994) quien encontró que después de controlar por efectos especí fi cos estatales, el capital del sector público no tiene
gún papel en que afecta a la producción privada.

Tablas 2.7 y 2.8 dan la salida Stata reproducir el entre y dentro de las estimaciones de la Tabla 2.6. Esto se hace usando el
mando xtreg con opciones (,) el importe correspondiente entre y (Fe) de efectos fijos. Tenga en cuenta que la fi ja efectos
resiones de regresión a cabo la F- prueba para la significación de los efectos del estado en la parte inferior de la salida. Este es
- ensayo descrito en (2.12). Verifica si todos los coe fi cientes maniquí de estado son iguales y en este caso se produce una F( 47764)
5.82 que es estadísticamente significativa. Esto indica que los maniquíes estatales son conjuntamente significativos. También
nifica que las estimaciones MCO que omiten estos maniquíes estatales sufren de una omisión de variables problemrendering
mbiased e inconsistente. 2.9gives Tabla theSwamy andArora (1972) estimación del modelo de efectos aleatorios. Esta es la
ión por defecto en Stata y se obtiene a partir del comando xtreg con la opción (, re). Finalmente, la Tabla 2.10 da la salida Stata
a el estimador de máxima verosimilitud. Estos se obtienen a partir de la opción xtreg commandwith (, MLE).

a 2.6 Pública de Capital datos de productividad. Unidireccional Resultados componente de error

β1 β2 β3 β4 ρ σμ σν

S 0,155 0,309 0,594 - 0,007


(0,017) * (0.010) * (0,014) * (0.001) *
re 0,179 0,302 0,576 - 0,004
(0.072) (0.042) (0.056) (0.010)
ntro - 0,026 0,292 0,768 - 0,005
(0.029) (0.025) (0.030) (0.001)
LHUS 0,006 0,311 0,728 - 0,006 0.82 0,082 0,039
(0.024) (0.020) (0.025) (0.001)
emiya 0,002 0,309 0,733 - 0,006 0.84 0,088 0,038
(0.024) (0.020) (0.025) (0.001)
AR 0,004 0,311 0,730 - 0,006 0.82 0,083 0,038
(0.023) (0.020) (0.025) (0.001)
e 0,003 0,310 0,731 - 0,006 0.83 0,085 0,038
(0.024) (0.020) (0.026) (0.001)

tos están sesgadas errores estándar cuando el modelo verdadero tiene perturbaciones componente de error (véase Moulton, 1986).
WBK024-Baltagi 23 de de marzo de, de 2005 11:46 Conde Char = 0

26 El análisis econométrico de datos de panel

Tabla 2.7 La productividad del capital público de los datos: El Entre Estimador

xtreg lny LNK1 lnk2 LNL u, estar entre regresión

(regresión Número de obs = 816


en medios de grupo)
variable de grupo (i): stid Número de grupos = 48

R-cuadrados: dentro de = 0,9330 Obs por grupo: min = 17


entre = 0,9939 avg = 17.0
global = 0,9925 max = 17

F (4,43) = 1.754,11
sd (ui + avg (e i.)) = 0,0832062 Prob> F = 0.0000

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
lny | Coef. Std. Errar. t P> | t | [95% Conf. Intervalo]
- - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
LNK1 | . 1793651 .0719719 2.49 0,017 . 0342199 . 3245104
lnk2 | . 3019542 .0418215 7.22 0.000 . 2176132 . 3862953
LNL | . 5761274 .0563746 10.22 0.000 . 4624372 . 6898176
u | -.0038903 0.0099084 -0.39 0,697 - . 0238724 . 0160918
contras | 1.589444 .2329796 6.82 0.000 1.119596 2.059292
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Tabla 2.8 La productividad del capital público de datos: Efectos fijos Estimador

xtreg lny LNK1 lnk2 LNL u, Fe fijos efectos de regresión

(dentro de) Número de obs = 816


variable de grupo (i): stid Número de grupos = 48

R-cuadrados: dentro de = 0,9413 Obs por grupo: min = 17


entre = 0,9921 avg = 17.0
global = 0,9910 max = 17

F (4,764) = 3.064,81
corr (ui, xb) = 0,0608 Prob> F = 0.0000

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
lny | Coef. Std. Errar. t P> | t | [95% Conf. Intervalo]
- - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
LNK1 | -.0261493 0.0290016 -0,90 0,368 -.0830815 . 0307829
lnk2 | . 2920067 .0251197 11.62 0.000 . 2426949 . 3413185
LNL | . 7681595 .0300917 25.53 0.000 . 7090872 . 8272318
u | -.0052977 0.0009887 -5,36 0,000 -.0072387 -.0033568 contras |
2.352898 .1748131 13.46 0.000 2.009727 2.696069
- - - - - - - - +- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Sigma u | .09057293 sigma E |
.03813705
Rho | . 8494045 (fracción de la varianza debido a ui)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
F prueba que todo ui = 0: F (47, 764) = 75,82 Prob> F = 0,0000

También podría gustarte