Está en la página 1de 694

ECONOMETRA:

MODELOS Y PRONSTICOS

ECONOMETRA:
MODELOS Y PRONSTICOS
Cuarta edicin

ROBERT S. PINDYCK
Massachusetts Institute of Technology

DANIEL L. RUBINFELD
University of California at Berkeley

Traduccin

Jorge Alberto Velzquez Arellano


Traductor profesional
Revisin tcnica

Vctor Aguirre Torres


Instituto Tecnolgico Autnomo de Mxico

Ma. Teresa Lpez lvarez


Consultor independiente

McGRAW-HILL
M X I C O BU E N O S A I R E S C A R A C A S G U A T EM A L A LI S BO A MA D R I D
N U EVA Y ORK SA N JU AN SAN TAF DE BOGO T SAN TIA GO SAO PA ULO

AUCKLAND LONDRES MILN MONTREAL NUEVA DELHI SAN FRANCISCO SINGAPUR


ST. LOUIS SIDNEY TORONTO

Gerente de producto: Ricardo del Bosque Alayn


Supervisor de edicin: Arturo Gonzlez Maya
Supervisor de produccin: Zeferino Garca Garca

ECONOMETRIA: MODELOS Y PRONSTICOS


Cuarta edicin
Prohibida la reproduccin total o parcial de esta obra, por
cualquier medio, sin autorizacin escrita del editor.
DERECHOS RESERVADOS 2001, respecto a la primera edicin en espaol por:
McGRAW-HlLL/INTERAMERlCANA EDITORES, S.A. de C.V.
A Subsidiary of The McGraw-Hill Companies, Inc.
Cedro Nm. 512, Col. Atlampa,
Delegacin Cuauhtmoc,
C.P. 06450, Mxico, D.F.
Miembro de la Cmara Nacional de la Industria Editorial Mexicana, Reg. Nm. 736
ISBN 970-10-2925-9
Translated from the fourth English edition of:
ECONOMETRIC MODELS AND ECONOMETRIC FORECASTS
Copyright 1998 by R. Pindick and D. Rubinfeld
Copyright 1998 by the McGraw-Hill Companies, Inc.
All rights reserved.
ISBN 0-07-913292-8
1234567890

098765432 01

Impreso en Mxico

Printed in Mxico

Esta obra se termin de


imprimir en Octubre del 2000 en
Impresora OFGLOMA S.A. de C.V.
Calle Rosa Blanca Nm. 12
Col. Santiago Acahualtepec
Mxico, 13 D.F.
Se tiraron 7,000 ejemplares

ACERCA
DE LOS AUTORES

ROBERT S. PINDYCK es Profesor Mitsubishi Bank de Economa Aplicada en la


Sloan School of Management del Massachusetts Institute of Technology. El
profesor Pindyck se incorpor al cuerpo docente del M.I.T. despus de recibir un
doctorado ah en 1971. Tambin ha sido Profesor Visitante de Economa en la
Universidad de Tel Aviv y es Investigador Asociado del National Bureau of
Economic Research. Es coautor, con Daniel Rubinfeld, de Microeconomics, que en
la actualidad se encuentra en su cuarta edicin.
DANIEL L. RUBINFELD es Profesor Robert L. Bridges de Leyes y Profesor de
Economa en la University of California, Berkeley. El profesor Rubinfeld recibi
un doctorado en 1972 del M.I.T. Ha enseado en la Suffolk University, Wellesley
College y en la University of Michigan. Ha sido miembro del National Bureau of
Economic Research, The Center for Advanced Study in the Behavioral Sciences
y The Guggenheim Foundation, y en la actualidad es coeditor de la revista
International Review of Law and Economics.

Para nuestras esposas,


Nurit y Gail

CONTENIDO

EJEMPLOS
PREFACIO
INTRODUCCIN

PARTE 1

xiv
XV
xix

LOS FUNDAMENTOS DEL ANLISIS DE REGRESIN

1
1

Introduccin al modelo de regresin


3
1.1

AJUSTE DE CURVA

1.2

DERIVACIN DE MNIMOS CUADRADOS

3
7
Apndice 1.1

El uso del operador sumatoria

Apndice 1.2 Derivacin de los estimadores de parmetros de mnimos cuadrados


2

Estadstica elemental: a revisin

13
17
20

2.1

VARIABLES ALEATORIAS

20

2.2

ESTIMACIN

25

2.3

PROPIEDADES DESEABLES DE LOS ESTIMADORES

30

2.4

DISTRIBUCIONES DE PROBABILIDAD

34

2.5

PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA

40

2.6

ESTADSTICA DESCRIPTIVA
Apndice 2.1

Las propiedades del operador de expectativas

Apndice 2.2 Estimacin de mxima verosimilitud

47
50
53

ix

CONTENIDO

El modelo de regresin de dos variables


3.1

EL MODELO

59

3.2

MEJOR ESTIMACIN LINEAL INSESGADA

63

3.3

PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA

69

3.4

ANLISIS DE VARIANZA Y CORRELACIN

73

Apndice 3.1 Varianza del estimador de la pendiente


de los mnimos cuadrados
Apndice 3.2 Algunas propiedades de los residuales de mnimos cuadrados
4

El modelo de regresin mltiple

EL MODELO

87

ESTADSTICAS DE REGRESIN

90

4.3

PRUEBAS F, R Y R CORREGIDA

91

4.4

MULTICOLINEALIDAD

98

4.5

COEFICIENTES ESTANDARIZADOS Y ELASTICIDADES

101

4.6

CORRELACIN PARCIAL Y REGRESIN POR ETAPAS

102

Estimacin del parmetro de mnimos cuadrados

108

Apndice 4.2 Coeficientes de regresin

109

Apndice 4.3 El modelo de regresin mltiple en forma matricial

110

MODELOS DE REGRESIN DE UNA SOLA ECUACIN

119

Usando el modelo de regresin mltiple

121

5.1

EL MODELO LINEAL GENERAL

121

5.2

USO DE VARIABLES INDICADORAS

126

5.3

EL USO DE PRUEBAS f Y FPARA HIPTESIS QUE INVOLUCRAN MS

5.4

REGRESIQN LINEAL POR SEGMENTOS

141

5.5

EL MODELO DE REGRESIN MLTIPLE CON VARIABLES EXPLICATIVAS


ESTOCSTICAS
Apndice 5.1 Pruebas que involucran coeficientes de variable indicadora

143
144

132

Correlacin serial y heterocedasticidad

150

6.1

HETEROCEDASTICIDAD

151

6.2

CORRELACIN SERIAL
Apndice 6.1

87

4.2

DE UN PARMETRO

82
83

4.1

Apndice 4.1

PARTE 2

59

Estimacin de mnimos cuadrados generalizados

Variables instrumentales y especificacin del modelo

164
177
186

7.1

CORRELACIN ENTRE UNA VARIABLE INDEPENDIENTE Y EL


TRMINO DEL ERROR

187

7.2

ERRORES EN LAS VARIABLES

188

CONTENIDO

7.3

ERROR DE ESPECIFICACIN

7.4

DIAGNSTICO DE REGRESIN

198

7.5

PRUEBAS DE ESPECIFICACIN

203

Apndice 7.1
8

Estimacin de variables instrumentales en forma de matricial

Pronstico con un modelo de regresin de una sola ecuacin

11

12

211

PRONSTICO INCONDICIONAL

213

PRONSTICO CON ERRORES CORRELACIONADOS EN FORMA SERIAL

224

8.3

PRONSTICO CONDICIONAL
Pronstico con el modelo de regresin mltiple

231
234

Estimacin de una sola ecuacin: temas avanzados

239

9.1

MODELOS DE REZAGO DISTRIBUIDO

239

9.2

PRUEBAS PARA CAUSALIDAD

253

9.3

OBSERVACIONES FALTANTES

257

9.4

EL USO DE DATOS DE PANEL

261
273

Estimacin no lineal y de mxima verosimilitud

277

10.1

ESTIMACIN NO LINEAL

278

10.2

ESTIMACIN POR MXIMA VEROSIMILITUD

285

10.3

MODELOS ARCH Y GARCH

298

Apndice 10.1

306

Estimacin por el mtodo de momentos generalizado

Modelos de eleccin cualitativa

312

11.1
11.2
11.3

312
334
340

MODELOS DE ELECCIN BINARIA


MODELOS DE ELECCIN MLTIPLE
MODELOS DE REGRESIN CENSURADA
Apndice 11.1 Estimacin de mxima verosimilitud de los modelos
logit y probit

PARTE 3

207

8.2

Apndice 9.1 Estimacin de intervalos de confianza para elasticidades


a largo plazo
10

192

8.1

Apndice 8.1
9

XI

345

MODELOS DE ECUACIONES MLTIPLES

351

Estimacin de ecuaciones simultneas

353

12.1

INTRODUCCIN A LOS MODELOS DE ECUACIONES SIMULTNEAS

354

12.2

EL PROBLEMA DE LA IDENTIFICACIN

358

12.3

ESTIMACIN CONSISTENTE DE LOS PARMETROS

363

12.4

MNIMOS CUADRADOS DE DOS ETAPAS

365

12.5

ESTIMACIN DE ECUACIN SIMULTNEA CON CORRELACIN


SERIAL Y VARIABLES DEPENDIENTES REZAGADAS

373

Xii

CONTENIDO

12.6

13

14

15

16

383

El problema de la identificacin en forma matricial

Apndice 12.2 Mnimos cuadrados de dos etapas en forma matricial

389

Apndice 12.3 Estimacin de regresin aparentemente no relacionada en


forma matricial

392
398

13.1

EL PROCESO DE SIMULACIN

399

13.2

EVALUACIN DE MODELOS DE SIMULACIN

404

13.3

UN EJEMPLO DE SIMULACIN

410

13.4

ESTIMACIN DEL MODELO

416

13.5

MODELOS NO ESTRUCTURALES: AUTORREGRESIONES VECTORIALES

420

13.6

MODELADO CON DATOS LIMITADOS

427

Comportamiento dinmico de los modelos de simulacin

434

14.1
14.2

435

COMPORTAMIENTO DEL MODELO: ESTABILIDAD Y OSCILACIONES


COMPORTAMIENTO DEL MODELO: MULTIPLICADORES Y RESPUESTA
DINMICA
LA FUNCIN DE RESPUESTA AL IMPULSO Y AUTORREGRESIONES
VECTORIALES

443
453

14.4

AJUSTE DE MODELOS DE SIMULACIN

457

14.5

SIMULACIN ESTOCSTICA

461

Apndice 14.1

464

Un modelo macroeconmico pequeo

MODELOS DE SERIES DE TIEMPO

487

Suavizamiento y extrapolacin de series de tiempo

491

15.1

MODELOS DE EXTRAPOLACIN SIMPLE

491

15.2

SUAVIZAMIENTO Y AJUSTE ESTACIONAL

502

Propiedades de las series de tiempo estocsticas

514

16.1
16.2

514

16.3
16.4

17

375

Apndice 12.1

Introduccin a los modelos de simulacin

14.3

PARTE 4

MTODOS DE ESTIMACIN MS AVANZADOS

INTRODUCCIN A LOS MODELOS DE SERIES DE TIEMPO ESTOCSTICAS


CARACTERIZACIN DE SERIES DE TIEMPO: LA FUNCIN
DE AUTOCORRELACIN
PRUEBAS PARA CAMINATAS ALEATORIAS

520
532

SERIES DE TIEMPO COINTEGRADAS

539

Apndice 16.1

542

La funcin de autocorrelacin para un proceso estacionario

Modelos lineales de series de tiempo

547

17.1 MODELOS DE PROMEDIO MVIL


17.2 MODELOS AUTORREGRESIVOS
17.3 MODELO MIXTO AUTORREGRESIVO-PROMEDIO MVIL

548
553
561

CONTENIDO

18

19

Xiii

17.4

PROCESOS NO ESTACIONARIOS HOMOGNEOS: MODELOS ARIMA

17.5

ESPECIFICACIN DE MODELOS ARIMA

567

Apndice 17.1

570

Estacionariedad, invertibilidad y homogeneidad

564

Estimacin y pronstico con modelos de series de tiempo

575

18.1

ESTIMACIN DEL MODELO

575

18.2

VERIFICACIN DIAGNSTICA

581

18.3

PRONSTICOS CON ERROR CUADRTICO MEDIO MNIMO

586

18.4

CLCULO DE UN PRONSTICO

588

18.5

EL ERROR DE PRONSTICO

589

18.6

INTERVALOS DE CONFIANZA DE PRONSTICOS

590

18.7

PROPIEDADES DE LOS PRONSTICOS ARIMA

591

18.8

DOS EJEMPLOS

599

Aplicaciones de los modelos de series de tiempo

606

19.1

REVISIN DEL PROCESO DE MODELADO

607

19.2

MODELOS DE VARIABLES ECONMICAS: INVERSIN EN INVENTARIOS

608

19.3

PRONSTICO DE DATOS TELEFNICOS ESTACIONALES

613

19.4

COMBINACIN DEL ANLISIS DE REGRESIN CON UN MODELO


DE SERIES DE TIEMPO: MODELOS DE FUNCIN DE TRANSFERENCIA
UN MODELO COMBINADO DE REGRESIN Y SERIES DE TIEMPO
PARA PRONSTICO DE FLUJOS DE DEPSITO DE AHORROS
A CORTO PLAZO
UN MODELO COMBINADO DE REGRESIN Y SERIES DE TIEMPO
PARA PRONSTICO DE TASAS DE INTERS

19.5

19.6

TABLAS ESTADSTICAS
SOLUCIONES A PROBLEMAS SELECTOS

617

619
624
631
639

EJEMPLOS
1.1 Promedio de calificaciones, 10
1.2 La explosin de los litigios, 12
1.3 Precios de acciones de compaas de servicio
pblicas, 13
2.1 Covarianza y correlacin, 24
2.2 Error cuadrtico medio, 32
2.3 Distribucin normal, 36
2.4 xito en las solicitudes de empleo, 46
3.1 Promedio de calificaciones, 68 (continuacin)
3.2 Gastos de consumo, 72
3.3 Ventas de automviles al menudeo, 78
3.4 Promedio de calificaciones, 80 (continuacin)
3.5 Inscripcin en universidades pblicas y privadas, 80
4.1 Ventas de automviles, 89
4.1 Ventas de automviles, 94 (continuacin)
4.2 Tasas de inters, 95
4.3 Funcin de consumo, 96
4.4 El valor de los boletos de ftbol revendidos, 104
4.5 Ventas de bienes duraderos, 106
5.1 Una funcin de costo para la industria de ahorros
y prstamos, 124
5.2 Prediccin de precios de vinos, 125
5.3 Diferenciales de salarios, 130
5.4 Certificados de depsito, 131
5.5 Demanda de vivienda, 135
5.6 Demanda de vivienda, 138
5.7 Demanda de vivienda, 139
6.1 Gastos de vivienda, 156
6.2 Prueba de Goldfeld-Quandt, 159
6.3 Pruebas de Breusch-Pagan y White, 162
6.4 Correccin de la heterocedasticidad, 163
6.5 Carbn bituminoso, 173
6.6 Tasas de inters, 174
6.7 Consumo agregado, 177
7.1 Demanda de dinero, 197
7.2 El efecto de la contaminacin del aire y el crimen en
el valor de la propiedad, 201
7.3 Prueba para error de medicin en un modelo de gasto
pblico, 206
8.1 Pronstico de promedios de calificaciones, 221
8.2 Pronstico de tasas de inters, 222
8.3 Pronstico de tasas de inters, 226
8.4 Pronstico de la demanda de carbn, 227
9.1 Funcin de consumo, 250
9.2 Inversin en inventario, 251
9.3 El petrleo y la economa, 255
9.4 Cul fue primero: la gallina o el huevo?, 256
XIV

9.5 Ayuda a los estados, 260


9.6 Aplicaciones de patentes y gasto en investigacin y
desarrollo, 268
9.7 Ayuda extranjera, 271
10.1 Funcin de consumo, 284
10.2 Energa, clima y el valor de la vivienda residencial, 292
10.3 Prueba de la linealidad de una funcin de
consumo, 297
10.4 Tasas de inters a largo plazo, 301
10.5 Rendimiento de acciones, 304
11.1 Prediccin de incumplimiento de bonos, 317
11.2 Comportamiento de la votacin, 321
11.3 Votacin para un presupuesto escolar, 328
11.4 Prediccin del comportamiento de asistencia a la
universidad, 330
11.5 Logro ocupacional, 337
11.6 Voto del Congreso sobre Medicare, 339
11.7 La demanda de escuelas pblicas, 343
12.1 Demanda de electricidad, 368
12.2 Gasto pblico, 372
12.3 Asistencia pblica, 379
12.4 Modelo macroeconmico, 381
13.1 Modelado de la dinmica del mercado de la
calefaccin con petrleo, 422
14.1 Modelo St. Louis, 445
14.2 Demanda de automviles, 448
14.3 Otro modelo macroeconomtrico, 450
14.4 Comportamiento dinmico del mercado del petrleo
para la calefaccin, 455
15.1 Pronstico de las ventas de una tienda de
departamentos, 497
15.2 Construccin residencial nueva mensual, 505
15.3 Construccin residencial nueva mensual, 508
16.1 Tasa de inters, 526
16.2 Precios diarios de cerdos, 528
16.3 Produccin porcina, 530
16.4 Los precios de las mercancas siguen caminatas
aleatorias?, 535
16.5 La cointegracin del consumo y el ingreso, 541
17.1 Inversin en inventario, 560
17.2 Precio del papel peridico, 568
17.3 Tasas de inters, 569
17.4 Produccin porcina, 570
18.1 Tasas de inters, 583
18.2 Produccin porcina, 585
18.3 Pronstico de tasas de inters, 599
18.4 Pronstico de la produccin porcina, 602

PREFACIO

Las nuevas tendencias en econometra, as como los comentarios y sugerencias


de una gran cantidad de usuarios de las primeras tres ediciones de este libro,
nos han conducido a realizar cambios extensos en esta cuarta edicin. Hemos
agregado varios temas y ejemplos nuevos y actualizado muchos de los ejemplos
anteriores. Adems, hemos reestructurado el libro en cuatro partes en lugar de
tres.
En funcin del contenido del libro, la parte uno abarca temas que proporcionan al estudiante una comprensin bsica del modelo de regresin mltiple. El
captulo 2, que expone la estadstica elemental, ha sido revisado y ampliado.
Tambin se incluye material y ejemplos nuevos sobre estadstica descriptiva.
La parte dos cubre temas sobre modelos de regresin de una sola ecuacin.
El captulo 10 es nuevo, presenta un tratamiento profundo de la estimacin no
lineal y de mxima verosimilitud. La adicin de este captulo refleja la creciente
importancia de estos temas en aos recientes. El captulo 10 tambin contiene
una seccin nueva sobre la estimacin y uso de los modelos Arch y Garch, los
cuales han encontrado muchas aplicaciones en las finanzas y la macroeconoma. Otros cambios importantes en la parte dos es que se incluye material nuevo
sobre pruebas para heterocedasticidad en el captulo 6 y la seccin sobre el uso
de los datos de panel en el captulo 9.
La parte tres del libro se concentra en los modelos de ecuaciones mltiples.
Adems de contener ejemplos nuevos y actualizados, se ha revisado gran parte
de la exposicin y hemos incluido un pequeo modelo macroeconmico especificado y estimado de nuevo (construido por Michael Donahue del Colby College) en el apndice 14.1.
En la parte cuatro se incluye una exposicin revisada y actualizada de los
anlisis de series de tiempo. El captulo 18 combina dos captulos de la tercera
edicin, el primero sobre estimacin y el segundo sobre pronstico con modelos
de series de tiempo.
xv

XVi

PREFACIO

Como en la edicin anterior, los datos para muchos de los ejemplos se han
incluido en el texto mismo o en el Manual del maestro. Acompaando a esta
edicin, proporcionamos un disquet con los datos de los ejemplos. El Manual del
maestro contiene las respuestas a todas las preguntas planteadas al final de los
captulos. Todas las preguntas empricas se relacionan con los conjuntos de
datos proporcionados en el texto y en el Manual del maestro, adems de incluirse
en el disquet, de modo que los maestros puedan usar en forma directa las tareas
en sus cursos.
Al elaborar este libro para la cuarta edicin, nos hemos beneficiado mucho
de los comentarios y crticas de nuestros colegas y estudiantes al igual que de las
sugerencias que nos hicieron una gran variedad de personas. Agradecemos a
Steven Dietrich y Annette Hall, quienes nos ayudaron a planear y editar la
primera edicin; a Bonnie Lieberman y Susan Norton, quienes ayudaron con la
segunda edicin, y a Scolt Stratford, quien inspir nuestro trabajo para la tercera
edicin. Lucille Sutton y sus asociados en McGraw-Hill han sido de gran
ayuda en la preparacin de esta cuarta edicin.
No nos es posible agradecer a todas las personas que nos proporcionaron
ayuda con esta nueva edicin, pero deseamos agradecer en especial a Sergio
Schmukler, quien nos ayud a redactar de nuevo y actualizar muchos de los
ejemplos; a Michael Donahue, quien elabor el nuevo modelo macroeconmico
que aparece en el apndice del captulo 14, y a Jeanette Sayre y Lynn Steele, por
proporcionar un valioso apoyo editorial y administrativo. Tambin deseamos
dar las gracias a nuestros colegas Ernst Berndt, Bronwyn Hall, Paul Ruud y
Thomas Stoker por ofrecernos numerosos comentarios y sugerencias tiles.
Tambin deseamos agradecer a los revisores que nos orientaron durante la
planeacin y elaboracin de la cuarta edicin; Walter Park de la American
University; Houson Stokes de la University of Illinois-Chicago; William Parke de
la University of North Carolina, Chapel Hill; Walter Mayer de la University of
Mississippi; Mukhtar M. Al de la University of Kentucky; Tom Taylor de la
Wright State University; Cari Moody del College of William and Mary; David
Selover de la Wesleyan University; Steven Hansen de la Western Washington
University. Adems, debemos mencionar a algunas de las personas que han
establecido correspondencia con nosotros, sugiriendo muchos cambios y mejoras para el libro. Nos referimos a Imad Al-Akhdar del Central Bank of Jordn;
Walter Bell de la Princeton University; Christiaan Heij y Marius Ooms de la
Universidad Erasmo en Rotterdam; Hiroyuki Kawakatsu de la University of
California en Irvine, California; Huston McCulloch de la Ohio State University;
Jeffrey Perloff de la University of California en Berkeley; Roben Rycroft del
Mary Washington College; Sergio Schmukler de Berkeley, California, y Kenneth
White de la University of British Columbia.
Tambin nos gustara extender nuestro agradecimiento a Data Resources
Incorporated, subsidiaria de McGraw-Hill, Inc., por poner a nuestra disposicin
su base de datos Citibase para el desarrollo de muchos de nuestros ejemplos, a
David Lilien y Quantitative Micro Software de Irvine, California, por permitirnos usar el programa de software EVIEWS, y a Bronwyn Hall y TSP International por su oferta comparable de su programa PC-TSP.

PREFACIO

XVii

El Manual del maestro se actualiz a partir de la tercera edicin. Se encuentran disponibles dos guas en software: el manual EVIEWS de Hiroyuki
Kawakatsu y el manual TSP de Sergio Schmukler. Estas guas en software, al
igual que el Manual del maestro, pueden obtenerse en forma directa en McGrawHill.
Robert S. Pindyck
Daniel L. Rubinfeld

INTRODUCCIN

Las personas que pretendan predecir el futuro sern consideradas alborotadoras bajo la
subdivisin 3, seccin 901 del cdigo criminal, y se harn acreedoras a una multa de 250
dlares y lo seis meses de prisin.

Seccin 889, Cdigo de Procedimientos Penales del Estado de Nueva York.


Este libro es una introduccin a la ciencia y el arte de construir y usar modelos.
Al contrario de las leyes penales de Nueva York, dirigidas a aquellos que pretendan predecir con bolas de cristal, creemos que estos modelos pueden ser una
herramienta de pronstico muy til. La ciencia de la construccin de modelos
consiste de un conjunto de herramientas cuantitativas que se usan para construir y luego probar representaciones matemticas del mundo real. La elaboracin y uso de estas herramientas se incluyen bajo el encabezado temtico de la
econometra. El arte de construir modelos es, por desgracia, difcil de describir
con palabras, pues consiste principalmente de juicios intuitivos que se hacen
durante el proceso de modelado. En vista de que no hay reglas definidas para
hacer estos juicios, el arte de la construccin de modelos tambin puede ser
difcil de dominar. No obstante, uno de los propsitos de este libro es transmitir
la naturaleza de este arte. Esto se lograr en parte con ejemplos y exposiciones
de la tcnica, pero tambin alentando a los lectores a construir sus propios
modelos.
El libro se centra en modelos de procesos que se producen, en general, en el
comercio, la economa y las ciencias sociales. Estos modelos de procesos pueden
incluir modelos de actividad econmica agregada, las ventas de una empresa
individual o un proceso poltico. Como podra esperarse, pueden usarse y a
menudo se han usado muchos tipos de modelos para pronstico y anlisis de
polticas. Este libro no intenta abarcar el espectro de los tipos de modelos y
metodologas de modelado; en lugar de ello, se concentra en modelos que pueden expresarse en forma de ecuacin, relacionando variables en forma cuantixix

XX

INTRODUCCIN

tativa. Entonces, se usan los datos para estimar los parmetros de la ecuacin o
ecuaciones, y las relaciones tericas se prueban en forma estadstica. Esto an
deja una gama bastante amplia de modelos de donde escoger. En un extremo de
esta gama podra determinarse el efecto de polticas monetarias alternativas en
el comportamiento de la economa estadounidense, construyendo un modelo
economtrico grande de ecuaciones mltiples de la economa y luego simularlo
usando diferentes polticas monetarias. El modelo resultante sera bastante
complicado y supondra explicar una estructura compleja en el mundo real. En
el otro extremo de la gama podra desearse pronosticar el volumen de ventas de
una empresa y, creyendo que dichas ventas siguen un patrn cclico fuerte, usar
un modelo de series de tiempo para extrapolar a partir del comportamiento
pasado de las ventas.
Esta gama de modelos es el tema de este libro y el objetivo es dar al lector
alguna comprensin de la ciencia y arte de determinar qu tipo de modelo construir -el ms apropiado-, probar el modelo en forma estadstica y luego aplicarlo
a problemas prcticos en pronstico y anlisis.
1

POR QU MODELOS?

Muchos de nosotros a menudo usamos o hacemos pronsticos de una forma u


otra. Pocos de nosotros reconocemos, sin embargo, que alguna clase de estructura lgica o modelo, est implcita en cada pronstico. Considere, por ejemplo,
que un corredor de bolsa le dice que el Promedio Industrial Dow Jones se elevar el prximo ao. El corredor de bolsa puede haber hecho este pronstico
debido a que el promedio Dow Jones se ha elevado durante los aos anteriores
y el corredor siente que sea lo que sea que ha hecho que aumente continuar
hacindolo en el futuro. De manera alternativa, el sentimiento de que el Dow
Jones se elevar el prximo ao puede resultar de una creencia de que esta
variable est vinculada con un conjunto de variables econmicas y polticas a
travs de una serie de relaciones compleja. El corredor de bolsa puede creer, por
ejemplo, que el promedio Dow Jones est relacionado, de cierta manera, con el
producto interno bruto y con las tasas de inters, de modo que dadas otras
creencias acerca del comportamiento futuro ms probable de esas variables,
parecera probable un incremento en el promedio Dow Jones.
Si tenemos que encontrar una palabra para describir el mtodo por el que
nuestro corredor de bolsa hizo este pronstico, es probable que dijramos que
fue intuitivo, aunque la cadena de razonamiento difiri de manera considerable
en los dos casos citados antes. Pero en cada caso estaba involucrada alguna
forma implcita de construccin de modelo. Un corredor de bolsa que ha basado
el pronstico optimista para el promedio Dow Jones en incrementos anteriores
en efecto ha construido un modelo de series de tiempo que extrapola tendencias
pasadas al futuro. Si, en lugar de ello, el pronstico estaba basado en un conocimiento de la economa, an estara involucrado de manera implcita un modelo; estara compuesto de las relaciones que fueron concebidas en forma vaga en
la mente del corredor de bolsa como resultado de su experiencia pasada.

INTRODUCCIN

XXi

Por tanto, incluso un pronosticador intuitivo construye algn tipo de modelo, quiz sin percatarse de que lo hace. Por supuesto, es razonable preguntar
por qu uno podra querer trabajar con un modelo explcito para producir pronsticos? Valdra la pena, por ejemplo, que nuestro corredor de bolsa leyera
este libro para construir un modelo explcito, estimarlo y probarlo en forma
estadstica? Nuestra respuesta es que hay varias ventajas en trabajar con modelos de manera explcita. Construir modelos obliga al individuo a pensar con
claridad y explicar todas las interrelaciones importantes implicadas en un problema. Fiarse de la intuicin puede ser peligroso a veces debido a la posibilidad
de que se ignoren o se usen de manera inapropiada relaciones importantes.
Adems, es importante que las relaciones individuales sean validadas de alguna
manera. Por desgracia, generalmente no se hace esto cuando se realizan pronsticos intuitivos. Sin embargo, en el proceso de construir un modelo, una persona
debe validar no slo el modelo en conjunto sino tambin las relaciones individuales que forman el modelo.
Al hacer un pronstico, tambin es importante proporcionar una medida de
la precisin que esperamos del pronstico. El uso de mtodos intuitivos, por lo
general, impide cualquier medida cuantitativa de confianza en el pronstico
resultante. El anlisis estadstico de las relaciones individuales que forman un
modelo, y del modelo como un conjunto, hace posible adjuntar una medida de
confianza a los pronsticos del modelo.
Una vez que se ha construido un modelo y se ha adecuado a los datos, puede
usarse un anlisis de sensibilidad para estudiar muchas de sus propiedades. En
particular, pueden evaluarse los efectos de cambios pequeos en variables individuales en el modelo. Por ejemplo, en el caso de un modelo que describe y
predice tasas de inters, uno podra medir el efecto en una tasa de inters particular de un cambio en el ndice de inflacin. Este tipo de estudio de sensibilidad slo puede realizarse si el modelo est en forma explcita.
2

TIPOS DE MODELOS

En este libro se examinan tres clases generales de modelos que pueden construirse para propsitos de pronstico o anlisis de polticas. Cada una implica un
grado diferente de complejidad de modelo y supone un nivel diferente de comprensin acerca de los procesos que uno est tratando de modelar.
Modelos de series de tiempo En esta clase de modelos suponemos no
saber nada sobre la causalidad que afecta a la variable que estamos tratando de
pronosticar. En lugar de ello, examinamos el comportamiento pasado de una
serie de tiempo a fin de inferir algo acerca de su comportamiento futuro. Cada
mtodo usado para producir un pronstico puede implicar el uso de un modelo
determinista simple como una extrapolacin lineal o el uso de un modelo estocstico complejo para pronstico adaptable.
Un ejemplo del uso del anlisis de series de tiempo sera una extrapolacin
simple de una tendencia pasada en la prediccin del crecimiento de la pobla-

XXii

INTRODUCCIN

cin. Otro ejemplo puede ser la elaboracin de un modelo estocstico lineal


complejo para nmero de pasajeros en una lnea area. Los modelos de series de
tiempo se han usado para el pronstico de la demanda de capacidad para la
aerolnea, la demanda telefnica estacional, el movimiento de las tasas de inters a corto plazo y otras variables econmicas. Estos modelos tambin son tiles
en particular cuando se sabe poco acerca del proceso subyacente que uno est
tratando de pronosticar. La estructura limitada de los modelos de series de tiempo los hace confiables slo a corto plazo, pero no obstante son bastante tiles.
Modelos de regresin de una sola ecuacin En esta clase de modelos la
variable bajo estudio es explicada por una funcin nica (lineal o no lineal) de
un nmero de variables explicativas. La ecuacin a menudo ser dependiente
del tiempo (es decir, el ndice de tiempo aparecer de manera explcita en el
modelo), de modo que uno puede predecir la respuesta a travs del tiempo de la
variable bajo estudio ante los cambios en una o ms de las variables explicativas.
Un ejemplo de un modelo de regresin de una sola ecuacin podra ser una
ecuacin que relacione una tasa de inters particular, como la tasa de un bono
de Tesorera a tres meses, con un conjunto de variables explicativas como la
oferta de dinero, el ndice de inflacin y la tasa de cambio en el producto interno
bruto.
Modelos de ecuaciones mltiples En estos modelos la variable que se va
a estudiar puede ser una funcin de diversas variables explicativas, las cuales
ahora son relacionadas entre s al igual que la variable bajo estudio por medio
de un conjunto de ecuaciones. La construccin de un modelo de ecuaciones
mltiples comienza con la especificacin de un conjunto de relaciones individuales, cada una de las cuales es ajustada a los datos disponibles. La simulacin es el proceso de resolver estas ecuaciones simultneamente sobre algn
intervalo.
Un ejemplo de un modelo de ecuaciones mltiples sera un modelo completo
de la industria textil estadounidense que contiene ecuaciones que explican
variables como la demanda textil, la produccin textil, el empleo de trabajadores
de produccin en la industria textil, la inversin en la industria y los precios
textiles. Estas variables se relacionaran entre s y con otras variables (como el
ingreso nacional total, el ndice de precios al consumidor y las tasas de inters)
por medio de un conjunto de ecuaciones lineales o no lineales. Dadas las suposiciones acerca del comportamiento futuro del ingreso nacional, las tasas de
inters, etc., uno podra simular este modelo en el futuro y obtener un pronstico para cada una de las variables del modelo. Un modelo como ste puede
usarse para analizar el impacto en una industria de los cambios en variables
econmicas externas.
Los modelos de ecuaciones mltiples explican mucho la estructura del proceso real que se est estudiando. Es decir, no slo se especifican relaciones
individuales, el modelo tambin explica la interaccin de todas estas interrelaciones. Por tanto, un modelo de cinco ecuaciones en realidad contiene ms

INTRODUCCIN

XXiii

informacin que la suma de cinco ecuaciones de regresin individuales. Esto es,


el modelo no slo explica las cinco relaciones individuales sino tambin describe la estructura dinmica implicada por la operacin simultnea de estas relaciones.
La eleccin del tipo de modelo a elaborar implica hacer intercambios entre
tiempo, energa, costos y la precisin deseada del pronstico. La construccin de
un modelo de simulacin de ecuaciones mltiples puede requerir grandes gastos
de tiempo y dinero. Las ganancias de este esfuerzo pueden incluir una mejor
comprensin de las relaciones y estructura involucrada al igual que la capacidad
para hacer un mejor pronstico. Sin embargo, en algunos casos estas ganancias
pueden ser lo bastante pequeas para ser superadas por los grandes costos implicados. Debido a que el modelo de ecuaciones mltiples necesita una buena
cantidad de conocimiento sobre el proceso que se est estudiando, la construccin de estos modelos puede ser extremadamente difcil.
La decisin de construir un modelo de series de tiempo, por lo general,
ocurre cuando se sabe poco o nada sobre los determinantes de la variable que se
est estudiando, cuando se dispone de una gran cantidad de puntos de datos y
cuando el modelo se va a usar en gran medida para pronsticos a corto plazo.
Sin embargo, dada alguna informacin sobre los procesos relacionados, puede
ser razonable que un pronosticador construya ambos tipos de modelos y compare
su desempeo relativo.
3

QU CONTIENE EL LIBRO

El libro est dividido en cuatro partes, cada una de las cuales contiene una clase
diferente de modelos. La clase ms fundamental, expuesta en la primera y segunda partes del libro, es el modelo de regresin de una sola ecuacin. Estos
mtodos economtricos elaborados y usados para construir modelos de regresin de una sola ecuacin encontrarn aplicacin, con modificaciones, en la
construccin de los modelos de ecuaciones mltiples y los modelos de series de
tiempo.
Los captulos 1 y 2 inician la parte uno con una introduccin a los conceptos
bsicos del anlisis de regresin y una revisin de la estadstica elemental. Luego se desarrolla en detalle el modelo de regresin, comenzando con un modelo
de dos variables en el captulo 3 y procediendo hasta el modelo de regresin
mltiple en el captulo 4.
El captulo 5 da comienzo a la parte dos, continuando el desarrollo del
captulo 4 de las pruebas y procedimientos estadsticos que pueden usarse para
evaluar un modelo de regresin. En las tcnicas de estimacin usadas en el
anlisis de regresin simple se requiere que se hagan ciertas suposiciones acerca
de los datos y del modelo y a veces estas suposiciones no se cumplen. En los
captulos 6 y 7 se inicia una exposicin de lo que puede hacerse en algunos de
estos casos. El captulo 6 trata de la heterocedasticidad y la correlacin serial e
incluye pruebas estadsticas para estos problemas al igual que los mtodos de
estimacin que los corrigen. El captulo 7 trata del error de medicin y los erro-

XXiV

INTRODUCCIN

res causados por una especificacin errnea, concentrndose adems, en la elaboracin de la tcnica de estimacin por variable instrumental y diagnsticos de
la regresin.
El captulo 8 expone el uso de un modelo de regresin de una sola ecuacin
para propsitos de pronstico. El captulo no slo expone los mtodos con los
que se produce un pronstico sino tambin las medidas que describen la
confiabilidad de ste, como los intervalos de confianza y el error del pronstico.
Los ltimos tres captulos en la parte dos presentan una visin ms amplia
del modelo de regresin. Estos captulos son un poco ms avanzados y pueden
ser omitidos por estudiantes principiantes. El captulo 9 trata de los problemas
de observaciones faltantes, modelos de retraso distribuido, el uso de datos de
panel y las pruebas de causalidad. El captulo 10 expone la estimacin no lineal
y la de mxima verosimilitud, incluyendo los modelos Arch y Garch. El captulo
11 trata de los modelos en los que la variable que se va a explicar es de
naturaleza cualitativa. En estos modelos se incluyen los modelos de probabilidad lineal, probit, logit y de regresin censurada.
Los fundamentos de econometra de las partes uno y dos son esenciales para
la elaboracin de modelos de ecuaciones mltiples en la parte tres del libro. Esta
parte comienza con un captulo sobre tcnicas de estimacin particulares para
modelos de ecuaciones simultneas. ste incluye problemas de identificacin
del modelo al igual que tcnicas como mnimos cuadrados en dos etapas y en
tres etapas. Los captulos 13 y 14 exponen la metodologa para construir y usar
modelos de ecuaciones mltiples. El captulo 13 es una introduccin a los modelos de simulacin en los que se incluyen una exposicin del proceso de estimacin, mtodos para evaluar los modelos de simulacin, mtodos alternativos
para estimar modelos de simulacin y enfoques generales de la construccin de
modelos. El captulo 14 es de naturaleza ms tcnica y expone mtodos para
analizar el comportamiento dinmico de los modelos de simulacin, adems de
incluir aspectos de estabilidad del modelo, multiplicadores dinmicos y mtodos
para afinar y ajustar modelos de simulacin. El captulo 14 concluye con una
exposicin del anlisis de sensibilidad y de la simulacin estocstica. Se construye un macromodelo pequeo de la economa estadounidense y se usa para
un anlisis simple de polticas en el apndice del captulo.
La parte cuatro de este libro est dedicada a los modelos de series de tiempo,
los cuales pueden verse como una clase especial de los modelos de regresin de
una sola ecuacin. Por tanto, las herramientas economtricas elaboradas en las
partes uno y dos encontrarn una aplicacin extensa en la parte cuatro. Los
captulos 15 y 16 dan inicio a la parte cuatro, en stos se exponen tcnicas de
suavizacin y extrapolacin bsicas, introducen las propiedades bsicas de las
series de tiempo aleatorias al igual que la nocin de un modelo de series de
tiempo. El captulo 16 tambin expone las propiedades de las series de tiempo
estacionarias y no estacionarias, la funcin de autocorrelacin, las pruebas de
raz unitaria y el concepto de series de tiempo cointegradas.
Los captulos 17 y 18 elaboran mtodos, por medio de los cuales se especifican, estiman y usan para el pronstico los modelos de series de tiempo. El
captulo 17 cubre los modelos de series de tiempo lineales en detalle, incluyendo

INTRODUCCIN

XXV

modelos de promedio mvil, modelos autorregresivos, modelos mixtos y por


ltimo modelos de series de tiempo no estacionarias. El captulo 18 desarrolla
mtodos de regresin que pueden usarse para estimar un modelo de series de
tiempo como tambin mtodos para verificacin diagnstica que pueden usarse
para asegurar lo bien que se "ajusta" a los datos el modelo estimado. El captulo
18 tambin trata del clculo del pronstico con error cuadrtico medio mnimo,
el error de pronstico y los intervalos de confianza del pronstico.
El ltimo captulo de la parte cuatro se dedica por completo a ejemplos de
la construccin y uso de los modelos de series de tiempo. Despus de que revisamos el proceso de modelado, construimos modelos de diversas variables econmicas y los usamos para producir pronsticos a corto plazo. Por ltimo, demostramos cmo pueden construirse modelos que combinen series de tiempo
con anlisis de regresin.
4

USO DE HERRAMIENTAS MATEMTICAS

Este libro est escrito en un nivel bastante elemental, y puede ser comprendido
por lectores con un conocimiento limitado de clculo y sin conocimiento del
lgebra matricial. Las derivaciones y pruebas matemticas, por lo general, se
reservan para los apndices o se suprimen por completo. En las partes uno y dos
del libro, la elaboracin del modelo de regresin en forma matricial se incluye en
los apndices. Por tanto, la mayor parte del libro, si no es que todo, deber ser
accesible para los estudiantes de licenciatura avanzados como para los estudiantes graduados.
Es deseable que el lector tenga algunos antecedentes de estadstica. Aunque
el captulo 2 contiene una revisin breve de probabilidad y estadstica, un estudiante sin estos antecedentes puede encontrar algunas dificultades en algunas
partes del libro. De manera tpica, este libro se usara en un curso de econometra aplicada o de pronstico comercial que un estudiante podra tomar despus
de terminar un curso introductorio de estadstica.
5

USOS ALTERNATIVOS DEL LIBRO

El libro tiene el propsito de tener un espectro amplio de usos. Estos usos en los
planes de estudio incluyen un curso de licenciatura o introductorio de posgrado
sobre econometra y un curso de licenciatura o de posgrado en pronstico de
negocios. Adems, este libro puede ser de valor considerable como libro de referencia para personas que hacen anlisis estadsticos de datos econmicos y
comerciales o para el cientfico social o analista de negocios interesados en la
aplicacin de modelos de simulacin dinmica para pronstico o anlisis de
polticas.
La cobertura en un curso introductorio de econometra o de pronstico de
negocios depender en alguna medida, por supuesto, de los antecedentes de los
estudiantes y las metas del maestro. El nfasis en el uso de tcnicas economtricas con el propsito de pronosticar proporcionar un enfoque, pero se dispone

XXVi

INTRODUCCIN

de otras alternativas. A continuacin enumeramos varios usos alternativos del


libro, pero enfatizamos que por la variedad del material se deja una buena cantidad a criterio del maestro.
1. Econometra para licenciatura (un semestre)
a) Estndar
Parte uno: captulos 1 a 4
Parte dos: captulos 5 a 7; porciones de los captulos 8 a 11 opcionales
b) nfasis en la simulacin
Parte uno: captulos 1 a 4
Parte dos: captulos 5, 6, 8
Parte tres: captulos 12 a 14
Ambos cursos omitiran todos los apndices de matrices.
2. Primer ao de posgrado en econometra
a) Un semestre
Parte uno: captulos 1 a 4
Parte dos: captulos 5, 6, 8; captulos 9 a 11 opcionales
Parte tres: captulos 12 a 14
Fragmentos de lo anterior y los apndices pueden ser opcionales.
b) Dos semestres
Parte uno: captulos 1 a 4
Parte dos: captulos 5 a 11
Parte tres: captulos 12 a 14
Parte cuatro: captulos 15 a 17; algunas secciones del captulo 17 a 19
opcionales
El nfasis en la simulacin y/o el anlisis de series de tiempo dependera
del inters del maestro.
3. Pronstico de negocios (posgrado o estudiantes de licenciatura avanzados)
a) Un semestre
Parte dos: captulo 8 ms una revisin de los captulos 1 a 7
Parte tres: captulos 13, 14
Parte cuatro: captulos 15 a 19 (fragmentos seleccionados)
b) Dos semestres
Parte uno: captulos 1 a 4 Parte
dos: captulos 5 a 8 Parte tres:
captulos 12 a 14 Parte cuatro:
captulos 15 a 19
4. Mtodos cuantitativos para el anlisis de polticas
a) Licenciatura, un semestre
Parte uno: captulos 1 a 4
Parte dos: captulos 5 a 8
Parte tres: captulos 13, 14
b) Posgrado, un semestre
Parte uno: captulos 1 a 4
Parte dos: captulos 5 a 8
Parte tres: captulos 12 a 14

INTRODUCCIN

XXVii

c) Posgrado, dos semestres Parte

uno: captulos 1 a 4
Parte dos: captulos 5 a 8; captulos 9 a 11 opcionales
Parte tres: captulos 12 a 14 Parte cuatro: captulos 15
a 19

El libro tambin puede ser usado para cursos sobre modelado cuantitativo
en ciencias sociales (como se ensea en los departamentos de sociologa o ciencias polticas). Es probable que un curso as que use este libro como texto abarcara la mayor parte de las partes uno a tres.
6

QU DISTINGUE A ESTE LIBRO DE OTROS?

La mayor parte de los libros de texto sobre econometra elaboran el modelo de


regresin de una sola ecuacin como una entidad autnoma y aislada. El lector
a menudo infiere que los modelos de regresin estadstica son algo distintos e
independientes de otros aspectos del modelado, as como el anlisis de la estructura dinmica del modelo y el uso de anlisis de series de tiempo para pronosticar una o ms variables exgenas en el modelo. Por supuesto que ste no es el
caso. Al elaborar un modelo de ecuacin mltiple, por ejemplo, uno debe estar
informado no slo de los mtodos de regresin sino tambin acerca de la forma
en que el comportamiento dinmico de un modelo resulta de la interaccin de
sus ecuaciones individuales.
Creemos que esta amplitud en la cobertura es deseable. Las tcnicas de
simulacin y de series de tiempo que forman las partes tres y cuatro de este
libro, por lo general, slo son presentadas en un nivel avanzado. Sentimos que
la ventaja de este libro es que la cobertura es amplia e incluye estas tcnicas
avanzadas pero est presentado en un nivel que puede ser comprendido y apreciado por un estudiante principiante.

PARTE

UNO
LOS FUNDAMENTOS
DEL ANLISIS DE REGRESIN

La parte uno de este libro trata de los conceptos ms bsicos del modelado
economtrico, centrndose en los modelos de regresin de una sola ecuacin,
los cuales son simples en la forma, pero bastante poderosos en funcin de la
variedad de sus posibles aplicaciones en los negocios y la economa. En estos
modelos, la variable bajo estudio se considera una funcin lineal de diversas
variables explicativas. Los modelos de regresin de una sola ecuacin son importantes, no slo porque pueden usarse para probar hiptesis y para pronosticar, sino tambin debido a que forman la base para el anlisis de modelos de
ecuaciones simultneas y modelos de series de tiempo.
En el captulo 1 se exponen los conceptos elementales de ajuste de curvas y
la nocin de mnimos cuadrados. El captulo 2 contiene una revisin extensa de
las ideas estadsticas bsicas que son necesarias para los anlisis que siguen. En
el captulo 3 el modelo de dos variables se usa como un medio para enfocarse en
las propiedades estadsticas que son necesarias para las estimaciones de parmetros de regresin. Este captulo pone nfasis en la prueba de hiptesis y en la
medicin de la bondad de ajuste. El captulo 4 extiende el modelo de regresin
al caso de variables mltiples. La presencia de ms de una variable explicativa
en el modelo de regresin conduce a problemas economtricos adicionales, incluyendo la multicolinealidad que afecta la interpretacin de los coeficientes de
regresin. Tambin se comentan las estadsticas de regresin adicionales que
ayudan con estos problemas.

CAPTULO

INTRODUCCIN AL MODELO
DE REGRESIN

En este captulo comenzamos nuestra exposicin de la econometra con el modelo de regresin lineal de dos variables. En la primera seccin, se comenta el
ajuste de la curva usando un ejemplo basado en los promedios de calificaciones
de los estudiantes. Se presenta el criterio de mnimos cuadrados para el ajuste
de la curva y se compara con varios esquemas alternativos para este ajuste. En
la segunda seccin derivamos el procedimiento de estimacin de mnimos cuadrados. El captulo concluye con tres aplicaciones elementales de la tcnica de
regresin de mnimos cuadrados.

1.1 AJUSTE DE CURVA


Los datos que resultan de la medicin de variables pueden provenir de cualquier
cantidad de fuentes y en diversas formas. Los datos que describen el movimiento de una variable a lo largo del tiempo son llamados datos de series de tiempo y
pueden ser diarios, semanales, mensuales, trimestrales o anuales. Los datos que
describen las actividades de personas individuales, empresas u otras unidades
en un punto dado en el tiempo son llamados datos de corte transversal. Estos
datos pueden ser empleados, por ejemplo, en un estudio de mercado que tiene
que ver con los gastos familiares en un tiempo dado. Tambin podran usarse
para examinar un grupo de declaraciones de contabilidad comercial, con el propsito de estudiar patrones de comportamiento entre empresas individuales en
una industria. Los datos combinados, los cuales combinan datos de series de tiempo y de corte transversal, pueden usarse para estudiar el comportamiento de un
grupo de empresas a lo largo del tiempo.

PARTE UNO: Los fundamentos del anlisis de regresin

CUADRO 1.1
PROMEDIO DE CALIFICACIONES E INGRESO FAMILIAR
Y

(promedio de calificaciones)

(ingreso de los padres en miles de dlares)

4.0

21.0

3.0
3.5
2.0
3.0
3.5

15.0
15.0
9.0
12.0
18.0
6.0
12.0

2.5
2.5

Supngase que estamos interesados en la relacin entre dos variables X y Y.


Para describir esta relacin de manera estadstica necesitamos un conjunto de
observaciones para cada variable y una hiptesis que exponga la forma matemtica explcita de la relacin. El conjunto de observaciones se llama muestra} Nos
interesaremos inicialmente en el caso en que se supone que la relacin entre X
y y es lineal, es decir, descrita por una lnea recta. Dada la linealidad, nuestro
objetivo es especificar una regla por la que pueda determinarse la "mejor" lnea
recta que relacione a X y Y.
Por ejemplo, supngase que deseamos probar la hiptesis de que el promedio de calificaciones de un estudiante puede explicarse por el ingreso econmico
de sus padres. Se obtuvieron (hipotticamente) ocho puntos mustrales que se
describen en el cuadro 1.1. y se colocaron en una grfica como un diagrama de
dispersin en la figura 1.1. Pueden elegirse muchas lneas rectas para ajustar los
puntos, una de ellas podra conectar los puntos del valor menor de X con el valor
mayor de X (lnea l 1 ), o se podra dibujar una lnea punteada que parezca ajustarse a la dispersin completa de puntos (lnea l 2 ). Un procedimiento mejor
podra ser elegir una lnea de modo que la suma de las distancias verticales
(positiva y negativa) de los puntos en la grfica a la lnea sea cero. (Estas distancias, conocidas como desviaciones, se muestran en la figura 1.2). Este criterio
asegurara que a las desviaciones que son iguales en magnitud e iguales en
signo se les da igual importancia. Por desgracia, este procedimiento tiene la
propiedad indeseable de que las desviaciones que son iguales en tamao pero de
signo opuesto se cancelan, y como resultado, se podra encontrar una lnea (o
ms de una, respecto a eso) que tenga una suma de desviaciones igual a cero
pero que no se ajuste a los datos como se pretende.
Se puede mejorar este mtodo si minimizamos el valor absoluto de las desviaciones de los puntos mustrales de la lnea ajustada. Aqu est implcito el
juicio de que la importancia de la desviacin es proporcional a su magnitud.
Aunque la minimizacin de la suma de las desviaciones absolutas es atractiva,
1
Los datos de una muestra son observaciones que se han elegido de una poblacin subyacente,
la cual representa la relacin verdadera bajo estudio.

CAPITULO 1: Introduccin al modelo de regresin

Figura 1.1

Diagrama de
dispersin.

sufre de varias desventajas. La primera es que el procedimiento es difcil desde


el punto de vista del clculo. Tambin podra ser que las desviaciones grandes
sern tratadas con una atencin relativamente mayor que las desviaciones pequeas. Por ejemplo, es probable que una prediccin que implique un error de
dos unidades se considerara peor que una prediccin que implicara dos errores
de una unidad cada uno.
Existe un procedimiento cuyo clculo es simple y que penaliza relativamente ms los errores grandes que los errores pequeos. ste es el mtodo de mniFigura 1.2
Desviaciones.

PARTE UNO: Los fundamentos del anlisis de regresin

mos cuadrados. El criterio de mnimos cuadrados es el siguiente: Se dice que la


"lnea de mejor ajuste" es aquella que minimiza la suma de las desviaciones al cuadrado
de los puntos de la grfica desde los puntos de la lnea recta (con distancias medidas en

forma vertical). Veremos en los dos captulos siguientes que los mnimos cuadrados tambin son convenientes porque permiten realizar pruebas estadsticas.
En este libro nos basaremos mucho en el procedimiento de mnimos cuadrados, pero tambin hay otras tcnicas de estimacin que son factibles y en
ocasiones deseables. Podemos ver cmo los mnimos cuadrados se relacionan
con algunas de estas tcnicas alternativas observando la figura 1.3a y b. En la
figura 1.3a se presenta la grfica de la desviacin de un punto de los datos desde
la lnea recta en el eje horizontal y la "prdida" asociada con esta desviacin en
el eje vertical. Con los mnimos cuadrados, la prdida asociada con cada desviacin individual es esa desviacin al cuadrado. Con la estimacin del valor absoluto mnimo, la prdida es el valor absoluto de la desviacin. Las funciones de
prdida asociadas con los mnimos cuadrados y con los valores absolutos mnimos, son simtricas con respecto al signo de la desviacin, pero la funcin de
prdida de mnimos cuadrados penaliza ms las desviaciones grandes que la
funcin de prdida del valor absoluto mnimo.
Un problema con los mnimos cuadrados ocurre cuando hay una o ms
desviaciones grandes. Supngase que se cometi un error de reporte con respecto al promedio de calificaciones del primer estudiante, habindose reportado

Figura 1.3
a) Funcin de prdida
b) funcin de prdida
alternativa.

a)
Prdida

CAPTULO 1: Introduccin al modelo de regresin

una calificacin de 1.0 en lugar de la cifra correcta de 4.0. Si la lnea l2 en la


figura 1.1 fuera considerada como una posible lnea de mnimos cuadrados,
la desviacin asociada con el primer punto de los datos sera muy grande y la
desviacin al cuadrado sera an ms grande. La recta de mnimos cuadrados de
mejor ajuste cambiara en forma considerable, es decir, su pendiente se hara
ms plana. La penalidad grande asociada con los mnimos cuadrados ha forzado
al procedimiento de estimacin a poner mayor nfasis en la relacin entre la
lnea recta y el primer punto de los datos. El resultado es que la pendiente (y el
intercepto) de la recta de mnimos cuadrados es muy sensible a los puntos que
se encuentran lejos de la verdadera lnea de regresin. Llamamos puntos atpicos
a aquellos puntos que estn a ms de una cierta distancia de la lnea de regresin. Por supuesto, los puntos atpicos pueden representar informacin importante acerca de la relacin entre diversas variables, por tanto, nunca deben
desecharse sin un mayor anlisis. El examen cuidadoso de los puntos atpicos puede ayudarnos a encontrar errores, en cuyo caso puede hacerse una correccin.
Qu puede hacerse con respecto a la sensibilidad de los mnimos cuadrados
con los puntos atpicos? La solucin ms simple es volver a calcular la recta de
mnimos cuadrados eliminando el punto atpico. Al reportar tanto la pendiente
de mnimos cuadrados original como la nueva y las intersecciones, podemos
determinar la sensibilidad de nuestros resultados ante la presencia de puntos atpicos. Debido a que la decisin es arbitraria respecto a cules son puntos
atpicos, un procedimiento mejor colocara relativamente menos peso en las
desviaciones grandes. Un ejemplo de este procedimiento se da en la figura 1.3b,
en la cual se muestra una funcin de prdida que es menos sensible a los puntos
atpicos que los mnimos cuadrados o el valor absoluto mnimo.

1.2 DERIVACIN DE MNIMOS CUADRADOS


El propsito de construir relaciones estadsticas es, por lo general, predecir o
explicar los efectos de una variable resultante de los cambios en una o ms
variables predictoras o explicativas. Para la dispersin de puntos en la figura 1.1,
podemos escribir la ecuacin lineal Y = a + bX, donde Y, la variable de la izquierda, es llamada variable dependiente y X, la variable de la derecha, es llamada
variable independiente. Debido a que se trata de explicar o predecir movimientos
en Y, es natural elegir como nuestro objetivo la minimizacin de la suma vertical
de las desviaciones cuadrticas a partir de la recta ajustada.2
2

En general, nuestra decisin de escribir una ecuacin en la forma Y = a + bX, en lugar de la


forma inversa X = A + BY, implica que se ha hecho un juicio de que los movimientos en la variable
Y son "causados" por movimientos en la variable X y no viceversa. Por tanto, en el ejemplo del
promedio de calificaciones hemos asumido de manera implcita que el promedio de calificaciones es
determinado por el ingreso familiar. Si revisamos nuestra opinin de la causalidad a una que establezca que el ingreso familiar es determinado por el promedio de calificaciones, escribiramos la
ecuacin X = A + BY y de acuerdo con esto estara nuestro criterio de ajuste de curvas. Esto es
importante debido a que las dos ecuaciones generan dos rectas de regresin diferentes.

PARTE UNO: Los fundamentos del anlisis de regresin

Para obtener la frmula de mnimos cuadrados para calcular los valores de


a y b, debemos usar algunas herramientas matemticas bsicas. Se sugiere una
revisin del apndice 1.1, el cual habla acerca de las propiedades de los operadores
de sumatoria y enfatizamos que no es importante que se entiendan todos los
detalles sobre el uso de derivados parciales.
El criterio de los mnimos cuadrados puede replantearse de manera formal
como sigue:
(1.1)

donde i= a + bXi representa la ecuacin para una lnea recta con un intercepto a
y pendiente b. En esta notacin Yi es el valor real de Y para la observacin i y
corresponde al valor de X para esa observacin, mientras que N es el nmero de
observaciones. i, llamado valor ajustado o pronosticado de Yi, es el valor de Y en
la lnea recta asociado con la observacin Xi. Esto puede verse con claridad en la
figura 1.4, donde la desviacin se calcula restando el valor ajustado de Yi del
valor real. Es decir, para cada observacin en X, hay una desviacin correspondiente del valor ajustado del valor real de Y. La suma de cuadrados de estas
desviaciones es la que deseamos minimizar y que nos permitir (en el captulo
3) calcular una medida de lo bien que se ajusta la lnea recta a los datos.
El problema es elegir valores para a y b que minimicen la expresin en la
ecuacin (1.1). Esto puede hacerse usando clculo elemental o lgebra. Los
detalles de la derivacin del clculo se estudiarn en el apndice 1.1.3 Como se
muestra ah, las soluciones de mnimos cuadrados para la pendiente y el intercepto son:
(1.2)
(1.3)
donde Y y X son las medias mustrales de Y y X, respectivamente.
Ahora consideremos cmo las frmulas en las ecuaciones (1.2) y (1.3) se
simplifican en el caso especial, donde X y Y tienen medias mustrales igual a 0.
Primero, escribiendo de nuevo la ecuacin (1.3), notamos que:

a = Y b X = 0

(1.4)

3
Alentamos al lector a seguir la derivacin para familiarizarse ms con nuestra notacin y
nuestro uso de los operadores de sumatoria.

CAPTULO 1: Introduccin al modelo de regresin


Figura 1.4
Valores ajustados.

Por tanto, cuando las medias mustrales de X y Y son 0, el intercepto de la lnea


de regresin ajustada ser 0. Para obtener la estimacin de la pendiente correspondiente en este caso especial, se divide tanto el numerador como el denominador de la ecuacin (1.2) entre N2:

Sustituyendo Y y X nos da

Pero Y = X = 0 por suposicin. Por consiguiente,

(1.5)
El hecho de que la ecuacin (1.5) sea menos complicada que la ecuacin (1.2)
sugiere que simplificar las cosas e incrementar nuestra comprensin si escribimos los estimadores de mnimos cuadrados en funcin de variables que son
expresadas como desviaciones de sus respectivas medias mustrales, sean o no
estas medias cero. Para hacer esto, transformamos los datos a forma de desviaciones expresando cada observacin en X y Y en trminos de desviaciones de sus
respectivas medias:

Con esta definicin, el estimador de la pendiente de mnimos cuadrados .puede


obtenerse (en el caso general) directamente de la ecuacin (1.5), en vista de que
las variables x y y tienen media cero.4 En efecto hemos centrado los datos mo4

Por ejemplo,

10

PARTE UNO: Los fundamentos del anlisis de regresin

viendo el origen de la grfica que relaciona X y Y a la media muestral. En este


caso las variables en minscula son versiones "centradas" de las variables en
mayscula.
El estimador de la pendiente de mnimos cuadrados es:
(1.6)
El proceso de centrado que transforma las variables en forma de desviaciones se describe en la figura 1.5 a y b. La lnea de regresin se representa en la
grfica a usando las observaciones originales, mientras que en b se usan las
desviaciones. Ntese que las pendientes estimadas de ambas lneas de regresin
son idnticas. Esto es obvio a partir de la ecuacin (1.6), en vista de que slo las
variables en forma de desviaciones entran en el clculo. Sin embargo, el intercepto de la lnea de regresin en la figura 1.5b es idnticamente igual a 0. Esto
se deriva de la ecuacin (1.4) y del hecho de que x y y son iguales a 0. Por
tanto, si elegimos trabajar con los datos en forma de desviaciones, se mueve el
origen de la lnea de regresin a la media muestral pero no se altera la
pendiente. Observe tambin que la lnea en la figura 1.5b pasa por el origen.
Esto es equivalente al hecho de que la lnea en la figura 1.5a pasa por el punto
de las medias ( Y , X ).

EJEMPLO 1.1

Promedio de calificaciones

En el ejemplo del promedio de calificaciones descrito en el texto, el procedimiento de mnimos cuadrados nos permite obtener un intercepto de 1.375 y una

Figura 1.5
Uso de la forma
de desviaciones.

Ingreso familiar
(en miles de dlares)
a) Recta de regresin original

b) Regresin transformada
x= X - 1 3 . 5
y= V-3.0

CAPTULO 1: Introduccin al modelo de regresin

11

pendiente de .12, produciendo la lnea = 1.375 + .12X.5 Los detalles de los


clculos aparecen en el cuadro 1.2. (La lnea de regresin l2 y los puntos de
los datos originales se muestran en la figura 1.2.) Para cualquier ingreso familiar dado X, la lnea de regresin nos permite predecir un valor para el promedio
de calificaciones Y. Por ejemplo, un ingreso familiar de 12 mil dlares nos llevara a un promedio de calificaciones pronosticado de = 1.375 + .12(12) = 2.815.
Aunque el promedio de calificaciones pronosticado no dar necesariamente una
estimacin exacta cada vez, proporcionar una buena aproximacin. Por ejemplo, podramos notar que los dos estudiantes en la muestra original (vase el
cuadro 1.1) con padres que tienen ingresos de 12 mil dlares tenan promedios
de calificaciones de 3.0 y 2.5. El promedio de calificaciones pronosticado resulta
encontrarse entre los dos puntos de datos reales.
La pendiente nos dice que un cambio de mil dlares en el ingreso familiar
conducira a un cambio esperado de .12 en el promedio de calificaciones. El
valor positivo para la pendiente es consistente con la hiptesis de que los estudiantes con promedios de calificaciones relativamente altos vienen de familias
con ingresos relativamente altos. El intercept de 1.375 nos dice que si el ingreso familiar fuera proyectado a cero, la mejor prediccin para el promedio de
calificaciones sera 1.375. En vista de que ninguna de las familias en nuestra
muestra tena un ingreso cercano a cero, no confiaremos mucho en este resultado.

CUADRO 1.2

5
A lo largo de la parte uno de este libro colocamos un "sombrero" encima de la variable dependiente para denotar el valor ajustado. Relajaremos esta regla en otras partes del texto para simplificar
la presentacin.

12

PARTE UNO: Los fundamentos del anlisis de regresin

El modelo de regresin lineal de dos variables se examinar con mucho


mayor detalle en el captulo 3, pero es apropiado hacer aqu un comentario final.
En el modelo Y = a + bX, la inclinacin b es una estimacin de dY/dX, la razn de
un cambio en Y para un cambio en X Esto nos permite interpretar la
pendiente de regresin en forma bastante natural. La interpretacin de el
intercepto, sin embargo, depende de si se dispone de suficientes
observaciones cercanas a X= 0 para producir resultados estadsticamente
significativos. Si ste es el caso, se puede interpretar el intercepto como un
estimado de Y cuando X = 0. Sin embargo, si no se dispone de suficientes
observaciones, la interseccin tan slo es la altura de la recta de mnimos
cuadrados.

EJEMPLO 1.2

La explosin de los litigios

Qu tan rpido ha crecido con el tiempo el nmero de casos presentados en los


tribunales de Estados Unidos, y qu tan constante ha sido este crecimiento? Un
estudio reciente proporciona informacin til sobre las tendencias en las demandas de derechos civiles.6 Usando datos de series de tiempo trimestrales para
el periodo que comienza en el segundo trimestre de 1977 y llega al tercer trimestre de 1988, se estim una ecuacin de regresin que relaciona el nmero de
demandas presentadas por trimestre Y, con una variable de tendencia de tiempo
T, la cual se define igual a 1 en el segundo trimestre de 1977 y con un incremento
de 1 en cada trimestre posterior. La ecuacin estimada es:
= 13.00 + 51.03T
El coeficiente de la pendiente de regresin nos dice que en efecto hay una explosin, en el nmero de casos presentados incrementndose por poco ms de
51 en cada trimestre. Por supuesto, una ecuacin de regresin no es esencial
para calcular este ndice de crecimiento de los litigios. Veremos en el captulo 3
que una Ventaja importante, del enfoque de la regresin, es que nos permite
determinar la significacin estadstica de la estimacin de la razn de crecimiento.
El estudio encontr que el crecimiento de los litigios no fue constante a lo
largo del periodo y que este crecimiento es sensible al ciclo comercial; entre
mayor es el ndice de desempleo U, es ms probable que se presenten demandas
de derechos civiles. La ecuacin de regresin estimada es:
= -144.38 + 168.91U

6
Vase P. Siegelman y J.J. Donohue III, "The Selection of Employment Discrimination Disputes
for Litigation: Using Business Cycle Effects to Test the Priest-Klein Hypothesis", Journal of Legal
Studies, vol. 24, pp. 427-462, junio de 1995. Estos resultados reportados son una simplificacin del
estudio, considerablemente, ms completo descrito en el artculo.

CAPTULO 1: Introduccin al modelo de regresin

13

Esta ecuacin nos dice que para cada incremento del 1% en el ndice de desempleo, se presentaron casi 170 casos adicionales.

EJEMPLO 1.3

Precios de acciones de compaas de servicio pblicas

Como parte de un ambicioso estudio financiero corporativo, se ha planteado la


hiptesis de que las razones entre precio e ingresos para las compaas de servicio pblicas son influidas por sus razones entre deuda y capital contable. Esto
es razonable, en vista de que uno esperara que una razn mayor entre deuda y
capital contable conducira a un patrn de ingresos ms variable para una compaa y que este riesgo aadido conducira a un precio menor de las acciones, y
por tanto a una razn menor entre precio e ingresos. El modelo puede expresarse de manera formal como:
Y = a + bX
donde Y= la razn entre precio e ingresos de la compaa (el precio de una
accin de la reserva comn dividida entre los ingresos por accin)
X = su razn entre deuda y capital contable (deuda a largo plazo dividida entre la deuda ms el capital contable)
Esperamos que b tenga un valor negativo pero no tenemos una expectativa
a priori respecto al valor del intercepto. Se obtuvieron observaciones para las
variables Y y X para un corte transversal de compaas de servicio pblicas
(en un punto fijo en el tiempo). El resultado de la regresin lineal es:
= 10.2 - 4.07X
El coeficiente de -4.07 parece confirmar la hiptesis planteada. Sin embargo,
para conocer con ms detalle cunta confianza debemos tener en la hiptesis,
necesitamos usar algunas de las pruebas estadsticas que se exponen en el captulo 2.

APNDICE 1.1
El uso del operador sumatoria

Debido a que muchas proposiciones elementales en econometra implica el uso


de sumas de nmeros, ser til revisar (o conocer) los signos de sumatoria. A lo
largo del libro la letra griega sigma mayscula , representa la sumatoria de los
valores de cada una de las observaciones para una variable. Por ejemplo, supon-

14

PARTE UNO: Los fundamentos del anlisis de regresin

gamos que X representa la variable "ingreso familiar". Entonces, usando la notacin con subndices, se escribe:
X 1 , X 2 , . . ., X N

y representan los valores tomados por cada una de las N observaciones de ingre
so familiar. Entonces el ingreso familiar total (X1 +X2 + +XN) puede representarse
como
(A1.l)

Las siguientes reglas del operador sumatoria son tiles.


Regla 1 La sumatoria de una constante por k veces una variable es igual a
la constante por la sumatoria de esa variable.

(A1.2)
Regla 2 La sumatoria de la suma de observaciones en dos variables es
igual a la suma de sus sumatorias.
N

(Xi + Yi) = Xi + Yi

i =1

i =1

(Al.3)

i =1

Regla 3 La sumatoria de una constante sobre N observaciones es igual al


producto de la constante por N.
N

k = kN

(A1.4)

i =1

Usando estas tres reglas, se pueden obtener algunos resultados tiles concernientes a las medias, varianzas y covarianzas de variables aleatorias. En vista
de que estos conceptos se exponen en forma ms completa en el captulo 2, nos
restringiremos aqu a una exposicin de propiedades algebraicas (en lugar de
estadsticas). Primero, definiremos que la media o promedio de N observaciones
en la variable X es:

(A1.5)
Usando esta definicin, podemos demostrar la regla 4.

CAPITULO 1: Introduccin al modelo de regresin

15

Regla 4 La sumatoria de las desviaciones de observaciones sobre X alrededor de su media es cero.


N

(X i - X ) = 0

(A1.6)

i =1

(Vase la nota de pie de pgina 4 para la prueba.) En el texto tendremos


oportunidades frecuentes para usar la forma de desviaciones. Usando letras
minsculas para representar la forma de desviaciones, es decir, xi = Xi X , la
regla 4 se vuelve:
N

xi = 0

(A1.7)

i=1

Ahora definimos la varianza de X como:


(A1.8)
y la covarianza de X y Y como:
(A1.9)
Usando estas definiciones y los resultados anteriores, se pueden demostrar las
ltimas dos reglas de sumatorias.
Regla 5 La covarianza entre X y Y es igual al promedio de los productos de
observaciones en X y Y menos el producto de sus medias:
(Al.10)
PRUEBA

y usando la regla 1, se obtiene

16

PARTE UNO: Los fundamentos del anlisis de regresin

Ahora, recordando la definicin de la media de X y la media de Y, se tiene:

La regla 6 se deriva con facilidad de la regla 5, en vista de que se aplica al caso


en el que X y Y son la misma variable.
Regla 6 La varianza de X es igual al promedio de los cuadrados de las
observaciones en X menos su media al cuadrado.

(Al.11)
Ntese, de manera incidental, que cuando X y Y resultan tener medias iguales
a cero (como ocurre cuando son medidas como desviaciones alrededor de sus
medias), las definiciones de covarianza y varianza se vuelven: (aqu se ha omitido el rango del ndice)

En ciertas situaciones ser necesario usar sumatorias que se aplican a dos


variables aleatorias, llamadas sumatorias dobles. De manera especfica, supongamos que Xij es una variable aleatoria que adopta N valores para cada resultado
de i y j. Habr, por supuesto, N2 resultados totales. Ahora definimos la sumatoria doble de estos N2 resultados como:

Las siguientes dos reglas de sumatoria doble sern tiles.

CAPTULO 1: Introduccin al modelo de regresin

17

Regla 7
(Al.12)
Ntese que la sumatoria doble en la regla 7 es muy diferente de la sumatoria
N
sencilla i =1XiYi la cual contiene N (en lugar de N2) trminos.
Regla 8

(A1.13)

APNDICE 1.2
Derivacin de los estimadores de parmetros de mnimos cuadrados

Como se estableci en el texto, nuestra meta es minimizar (Yi - i)2, donde


i =a + bXi es el valor ajustado de Yi correspondiente a una observacin Xi particular.
Minimizamos la expresin tomando las derivadas parciales con respecto a a
Y b, estableciendo cada una igual a 0, y solucionando el par resultante de
ecuaciones simultneas:7
(Al.14)

(Al.15)

Al igualar estas derivadas a cero y dividirlas entre -2, obtenemos:


(Yi - a - bXi) = 0
Xi (Yi - a - bXi) = 0

(Al.16)
(Al.17)

Por ltimo, escribiendo de nuevo las ecuaciones (Al.16 y Al.17) obtenemos un


par de ecuaciones simultneas (conocidas como las ecuaciones normales):
Yi = aN + bXi

(Al. 18)

XiYi = aXi + bX2i

(Al. 19)

7
No aparece ndice en los signos de sumatoria, pero se asume que el ndice abarca todas las
observaciones 1, 2, . . . . N.

18

PARTE UNO: Los fundamentos del anlisis de regresin

Ahora se puede resolver para a y b de manera simultnea al multiplicar la ecuacin (Al. 18) por Xi y al multiplicar la ecuacin (Al. 19) por N:

Xi Yi = aN Xi+ b(Xi)2

(A1.20)

NXiYi = aN Xi + bN X2i

(A1.21)

Al restar la ecuacin (Al.20) de la ecuacin (A1.21), se obtiene:

NXiYi - Xi Yi = b[N X2i - (Xi)2]

(A1.22)

de lo cual se desprende que


(A1.23)
Dado b, podemos calcular a con la ecuacin (Al. 18):
(A1.24)
EJERCICIOS
1.1 Suponga que est a cargo de una autoridad monetaria central en un pas mtico. Se
le dan los siguientes datos histricos sobre la cantidad de dinero e ingreso nacional
(ambos en millones de dlares):
Cantidad

Ingreso

Cantidad

Ingreso

Ao

de dinero

nacional

Ao

de dinero

nacional

1987

2.0

5.0

1992

4.0

7.7

1988
1989
1990
1991

2.5
3.2
3.6
3.3

5.5
6.0
7.0
7.2

1993
1994
1995
1996

4.2
4.6
4.8
5.0

8.4
9.0
9.7
10.0

a) Haga una grfica de estos puntos en un diagrama de dispersin. Luego estime


la regresin del ingreso nacional Y sobre la cantidad de dinero X y haga la grfica de la
recta en el diagrama de dispersin.
b) Cmo interpreta el intercepto y la pendiente de la recta de regresin?
c) Si tuviera el control nico sobre el suministro de dinero y deseara lograr un nivel
de ingreso nacional de 12.0 en 1997, en qu nivel establecera el suministro de dinero?
Explquelo.

CAPITULO 1: Introduccin al modelo de regresin

19

1.2 Calcule la regresin del ingreso sobre el promedio de calificaciones en el ejemplo


descrito en este captulo y comprela con la regresin del promedio de calificaciones
sobre el ingreso. Por qu son diferentes estos dos resultados?
1.3 a) Suponga que se obtienen los estimadores de mnimos cuadrados para la relacin
Y = a + bX. Despus de terminar el trabajo, se decide multiplicar las unidades de la
variable X por un factor de 10. Qu le suceder a la pendiente e intercepto de mnimos
cuadrados resultante?
b) Generalice el resultado de la parte a) evaluando los efectos en la regresin del
cambio de unidades de X y Y en la siguiente manera:
Y* = C 1 +

c2Y

X* = d 1 + d 2 X

Qu puede concluir?
1.4 Qu le sucede a la estimacin del intercepto y la pendiente de los mnimos cuadra
dos cuando todas las observaciones en la variable independiente son idnticas? Puede
explicar de manera intuitiva por qu ocurre esto?
1.5 Demuestre que la lnea de regresin estimada pasa por el punto de las medias
(Y , X ).
Pista: Muestre que Y y X satisfacen la ecuacin Y = a + bX, donde a y b son
definidas en las ecuaciones (1.2) y (1.3).
1.6 Cmo interpretara el valor -144.38 del intercepto en la regresin de Y en U en el
ejemplo 1.2? Explique por qu no es probable que el valor del intercepto sea de mucho
inters prctico.
1.7 Para probar la sensibilidad de los estimadores de mnimos cuadrados del intercepto
y la pendiente ante la presencia de puntos a tpicos, realice los siguientes clculos:
1. Estime de nuevo la pendiente y el intercepto en el ejemplo 1.1 bajo la suposicin
de que la primera observacin fue (21.0, 1.0) en lugar de (21.0, 4.0).
2. Estime de nuevo la pendiente y el intercepto dejando fuera la primera observacin de la muestra.
a) Describa cmo los estimadores de la pendiente e interceptos en 1 y 2 se comparan con aquellos dados en el ejemplo. Una grfica de ambas lneas rectas sera til. Por
qu los estimadores de mnimos cuadrados son tan sensibles a los puntos individuales?
b) Habiendo trazado la grfica de la lnea de mnimos cuadrados en el caso 1,
concluira que el primer punto de los datos es un punto atpico? Explique.

CAPTULO

ESTADSTICA ELEMENTAL:
A REVISIN

El estudio de la econometra, aun en su forma ms prctica, requiere un buen


entendimiento de la estadstica. Asumimos que la mayora de nuestros lectores
poseen estudios de estadstica pero puede ser que este conocimiento deba actualizarse. Antes de continuar el estudio de la econometra, revisaremos las ideas
estadsticas que se usarn en varias etapas en el texto. Para ayudar al lector a
enfocarse en ideas importantes en lugar de en los detalles, hemos colocado la
mayor parte de las derivaciones en el apndice 2.1.

2.1 VARIABLES ALEATORIAS


Una variable aleatoria es una variable que toma valores alternativos, cada uno con
una probabilidad menor que o igual a 1. Podemos describir una variable aleatoria al examinar el proceso que genera sus valores. Este proceso, llamado distribucin de probabilidad, enumera todos los resultados posibles y la probabilidad de
que ocurra cada uno. Se puede definir una variable aleatoria, como una funcin
que asigna un nmero real a cada resultado de un experimento. Por ejemplo,
supongamos que asignamos un valor de 1 a las caras de lanzamientos de una
moneda y el valor de 0 al nmero de cruces (si usamos una moneda legal, la
probabilidad de las caras ser de 21 ). En este caso podemos interpretar el valor
de los lanzamientos de una moneda como una variable aleatoria; el proceso
generado por la variable aleatoria es la distribucin de probabilidad binomial.

Es til distinguir entre variables aleatorias discretas y continuas. Una variable aleatoria continua puede tomar cualquier valor en la lnea de nmeros reales,
mientras que una variable aleatoria discreta slo puede tomar un nmero espec-

20

CAPTULO 2: Estadstica elemental: a revisin

21

Figura 2.1

Densidades
de probabilidad.

fico de valores reales. La figura 2.1 ilustra las funciones de probabilidad discretas y continuas. Con la distribucin discreta, vemos que los valores 10 y 20
ocurren con probabilidad de .25, mientras el valor 40 se presenta con una probabilidad de .50. Con la distribucin continua, la probabilidad de que un valor
particular se encuentre entre cualesquiera dos valores de la distribucin es determinada por el rea bajo la funcin de densidad continua entre esos dos valores. En este ejemplo, la probabilidad de que los valores de la distribucin se
encuentren entre 10 y 20 es aproximadamente igual a .30, como se muestra en
el rea sombreada de la figura.

2.1.1

Valores esperados

Las distribuciones de probabilidad, a menudo, se describen en funcin de sus


medias y varianzas, las que a su vez son definidas en funcin del operador de valor
esperado E. En virtud de que trabajaremos al principio con variables aleatorias
discretas, entonces supongamos que X1, X2,, XN representan los N resultados
posibles asociados con la variable aleatoria X. Es decir, la media o valor esperado
de X es un promedio ponderado de los resultados posibles, donde las probabilidades de los resultados sirven como los pesos apropiados. De manera especfica,
la media de X, denotada x, se define por:
(2.1)
donde pi es la probabilidad de que ocurra Xi, pi = 1 y E( ) es el operador de valor
esperado.
El valor esperado debe distinguirse de la media muestral, la cual nos dice el
promedio de los resultados obtenidos en una muestra en la que se han elegido
un nmero de observaciones (por lo general al azar) de la distribucin de probabilidad subyacente. Denotamos la media muestral de un conjunto de resultados de X por X .

22

PARTE UNO: Los fundamentos del anlisis de regresin

La varianza de una variable aleatoria proporciona una medida de la extensin o dispersin alrededor de la media. Es denotada por 2x , y (en el caso
discreto) se define como
(2.2)

Por tanto, la varianza es un promedio ponderado de los cuadrados de las desviaciones de los resultados de X de su valor esperado, sirviendo como ponderaciones las probabilidades correspondientes de que cada resultado ocurra. La
varianza en la ecuacin (2.2) es en s misma un valor esperado, ya que
(2.3)

La raz cuadrada (positiva) de la varianza se llama desviacin estndar.


Hay varias propiedades del operador de valor esperado que encontraremos
tiles, en especial al exponer las medias y varianzas de variables aleatorias.
Alentamos al lector para que examine con cuidado los detalles que se describen
en el apndice 2.1. Tres de los resultados principales concernientes al operador
de valor esperado son los siguientes:
Resultado 1

E(aX + b) = aE(X) + b

donde X es una variable aleatoria y a y b son constantes.


Resultado 2

E[(aX)2] = a2E(X 2)

Resultado 3

Var (aX + b) = a2 Var (X)

2.1.2

Distribuciones conjuntas de variables aleatorias

Ser til estudiar las distribuciones conjuntas de X y una segunda variable aleatoria Y. En el caso discreto, las distribuciones conjuntas se describen con una
lista de probabilidades de ocurrencia de todos los resultados posibles tanto de X
como de Y. Por ejemplo, si Y es una variable aleatoria que toma el valor de 1 si
el jefe de una familia tiene una educacin universitaria y de 0 si esa persona no
la tiene, mientras que X es la variable del ingreso familiar descrita con anterioridad, entonces la distribucin conjunta de X y Y podra ser como sigue:

CAPTULO 2: Estadstica elemental: a revisin

23

Ntese que todas las probabilidades son no negativas y suman 1.


Como en el caso de una sola variable aleatoria, el operador de valor esperado
es til para describir las caractersticas importantes de las distribuciones conjuntas. La covarianza de X y Y se define como el valor esperado del producto de
X y Y cuando ambas son medidas como desviaciones alrededor de sus medias;
Cov (X, Y) = E[(X - E(X))(Y - E(Y))]
(2.4)

donde pij representa la probabilidad conjunta de que ocurran X y Y.


La covarianza es una medida de la asociacin lineal entre X y Y. Si ambas
variables siempre estn por encima y por debajo de sus medias al mismo tiempo,
la covarianza ser positiva, como en la figura 2.2b. Si X est por encima de su
media cuando Y est por debajo de su media y viceversa, la covarianza ser
negativa, como se muestra en la figura 2.2a. El valor de la covarianza depende
de las unidades en las que sean medidas ,Y y Y. Como resultado, frecuentemente
tendremos la oportunidad para usar el coeficiente de correlacin

(2.5)

donde x y Y representan las desviaciones estndar de X y Y, respectivamente.


A diferencia de la covarianza, el coeficiente de correlacin se ha normalizado y
es independiente de la escala. Puede mostrarse que el coeficiente de correlacin
siempre caer entre -1 y +1. Una correlacin positiva indica que las variables se
mueven en la misma direccin, mientras que una correlacin negativa implica
que se mueven en direcciones opuestas.

Figura 2.2

Covarianza.

24

PARTE UNO: Los fundamentos del anlisis de regresin

Varias de las propiedades del operador de valor esperado son tiles cuando
se trata con distribuciones de probabilidad conjuntas. stas se plantean aqu
y se demuestran en el apndice 2.1.
Resultado 4 Si X y Y son variables aleatorias, E(X + Y) = E(X) + E(Y)
Resultado 5 Var (X+Y)= Var (X) + Var (Y) + 2 Cov (X, Y)

EJEMPLO 2.1

Covarianza y correlacin

La distribucin de probabilidad conjunta del ingreso (en miles de dlares) y


la educacin (en aos) para los cinco empleados de una empresa pequea es la
siguiente:
Ingreso (X)

5 10 15 20 25

Educacin (Y) 10

8 10 15 12

Las medias y varianzas de cada una de las variables son:


E(X) = (5 + 10 + 15 + 20 + 25)/5 = 15
Var(X) = [(-10) 2 + (-5) 2 + 0 2 + 5 2 + 10 2 ]/5 = 50
E(Y) = ( 10 + 8 + 10 + 15 + 12)/5 = 11
Var(7) = [(-1) 2 + (-3) 2 + (-1) 2 + 4 2 + l 2 ]/5 = 5.6
Entonces la covarianza entre X y Y est dada por:
Cov(X,Y) = [(-10)(-l) + (-5)(-3) + (0)(-l) + (5)(4) + (10)(1)]/5=11
Por ltimo, la correlacin entre X y Y es:
p(X, Y) = ll/[(50)(5.6)]1/2 = .66

2.1.3

Independencia y correlacin

La probabilidad de un resultado asociado con Y, en ciertos casos, no estar


relacionado con el resultado asociado con X y viceversa. En este caso decimos
que X y Y son variables aleatorias independientes. Como un ejemplo, considrese
el lanzamiento de una moneda para la cual la probabilidad de caras y la probabilidad de cruces son ambas de 21 . Ahora supngase que los primeros cinco
lanzamientos son todos caras. La probabilidad de que ocurra una cruz en el
sexto lanzamiento ser de 12 y sta es independiente de los lanzamientos anteriores.

CAPTULO 2: Estadstica elemental: a revisin

25

Cuando dos variables son independientes, los clculos que introducen al


operador de valor esperado se simplifican. La consecuencia es resumida en los
resultados 6 y 7 para el operador de valor esperado, los cuales se demuestran en
el apndice 2.1.
Resultado 6 Si X y Y son independientes, E(XY) = E(X)E(Y).
Resultado 7 Si X y Y son independientes, Cov (X, Y) = 0.
El resultado 7 establece que si dos variables aleatorias son independientes,
la covarianza entre ellas es 0. Esto tiene sentido de manera intuitiva, debido a
que la independencia de X y Y significa que, no hay relacin entre los resultados
de una variable y los resultados de la otra variable. Si no hay relacin, esperaramos que las desviaciones en X alrededor de su media no estuvieran relacionadas con las desviaciones en Y. Es importante observar, sin embargo, que el
resultado no se sostiene en la direccin opuesta. Dos variables pueden tener una
covarianza de cero, pero puede haber dependencia entre las variables. La clave
es que la covarianza y la correlacin miden dependencia lineal, las variables
pueden estar relacionadas no linealmente pero an as tener una covarianza de
cero.
Como por ejemplo, suponga que X y Y siguen la distribucin de probabilidad
X

-2

-1 0

1 0

Se asume que todas las observaciones suceden con una probabilidad igual (
En este caso E(X) = 0, E(Y) = 2, y

1
5

).

Cov (X, Y) = 1/5

X (Y
i = 1

- 2) = 0

Sin embargo, es claro que las variables aleatorias de seguro no son independientes. De hecho, las cinco parejas listadas satisfacen la relacin Y = X 2 , de modo
que hay una relacin no lineal exacta entre X y Y.

2.2 ESTIMACIN
2.2.1

Estimadores de media, varianza y covarianza

Las medias, varianzas y covarianzas pueden medirse con exactitud slo si conocemos casi todos los resultados posibles, es decir, la poblacin. Sin embargo, por
lo general, cuando emprendemos un estudio, slo tenemos una muestra de la
poblacin. Entonces desearemos hacer inferencias acerca de las caractersticas

26

PARTE UNO: Los fundamentos del anlisis de regresin

de la poblacin a partir de la muestra. Mostraremos en este captulo cmo podemos tomar una muestra de N puntos de datos, obtener estimaciones de las
caractersticas de la poblacin y luego sacar conclusiones acerca de la relacin
entre las estimaciones de la muestra y los correspondientes parmetros de la
poblacin. En vista de que no podemos conocer la verdadera media y varianza
de una variable aleatoria, o la verdadera covarianza entre dos variables aleatorias, usaremos la informacin muestral para obtener las mejores estimaciones
posibles.
El objetivo es determinar una regla que d una estimacin muestral para
todas y cada una de las muestras posibles. Para distinguir la estimacin de la
regla ms general, llamaremos a esta ltima estimador. Es comn que los estudiantes confundan "estimaciones" y "estimadores", pero esta confusin puede
eliminarse si recordamos que los estimadores son reglas, mientras que las estimaciones son nmeros.
Hallar el mejor estimador, para cualquier muestra dada, es un asunto complejo que se expone con mayor detalle en la seccin 2.3. Por el momento,
supngase que un requisito mnimo es que el estimador de un parmetro (como
la media o variacin) produce estimaciones que se aproximan mucho a ese
parmetro. De manera ms especfica, nos gustara que el estimador fuera
insesgado en el sentido de que el valor esperado del estimador es igual al parmetro
mismo. Como un ejemplo, reconsidrese la media muestral de una variable
aleatoria X con media x. El estimador X se define por:
(2.6)
Es muy importante sealar que X
es una variable aleatoria cuyos valores
variarn de una muestra a otra, aun cuando el parmetro de poblacin
correspondiente permanezca sin cambio. Debido a que las estimaciones
mustrales varan de una muestra a otra, podemos representar su distribucin
de probabilidad. Esta distribucin muestral se consigue obteniendo, de manera
repetida, muestras nuevas y calculando las medias y varianzas mustrales cada
vez. La distribucin muestral para la media medir la probabilidad de que la
media muestral caiga dentro de una serie de intervalos especficos (recurdese el
estudio previo de las distribuciones de probabilidad).
Dado que X tiene una distribucin muestral, es natural preguntar si el valor
esperado del estimador X es igual a la media poblacional; en otras palabras, X
es un estimador insesgado de ?Para mostrar que X es insesgado, demostraremos que E(X ) = x:

CAP
PTULO 2: Estadsstica elemental: a revisin
r

27

Una elecci
n razonable para un estim
mador de la varianza de un
na variable
aleeatoria es:

El problema es que este estim


mador es sesg
gado. Como see muestra en el apndice
2.1
1, en el resulttado 9, un esstimador insessgado de la varianza
v
de una
u variable
aleeatoria (con media
m
descono
ocida), est dado
d
por:
(2.7)
Po
or qu dividim
mos entre N - 1 (en lugar de
d entre N) paara obtener un
n estimador
inssesgado de la varianza
v
muestral? La resp
puesta exacta sse encuentra en
e la prueba
dell resultado dado en el apn
ndice 2.1, pero
o una respuestta intuitiva pu
uede basarse
en el concepto de
d grados de libertad. Se sabe que, nueestra muestra contiene N
pun
ntos. Sin emb
bargo, al calcu
ular la varian
nza muestral u
un primer passo necesario
fuee el clculo dee la media mueestral. Esto co
oloca una restrriccin en los N puntos de
dattos de que las N observacio
ones se suman
n N veces a la media calculaada X . Esto
dejja N - 1 obserrvaciones sin
n restriccioness con las cualles se estima la varianza
mu
uestral.
Por ltimo, considrese
c
c
mo podramo
os obtener un estimador insesgado de la
cov
varianza entree dos variabless aleatorias. Ya
Y que la covarrianza se defin
ne como:
Cov (X, Y) = E[(X - E(X))(Y - E
E(Y))]
la covarianza
c
po
odra medirse como el prom
medio del prod
ducto de las desviaciones
d
de X y Y alreded
dor de sus meedias, es decirr,

Co
omo en el caso
o anterior, estee estimador seer sesgado. P
Para obtener un
u estimador
inssesgado dividimos la sumatoria anterior entre el nmeero de grados de libertad.
Sin
n embargo, al calcular la su
uma del producto de las desv
viaciones en X y Y, hay N
observaciones en
e los resulttados conjunttos de X y Y y por tantto N piezas
ind
dependientes de informaci
n. Sin embaargo, una piezza de informaacin se usa
parra calcular laas medias de X y Y: la restriccin
r
dee que la sum
ma de las N
obsservaciones es igual a N v
veces las med
dias de X y Y,
Y respectivam
mente. Como
ressultado hay N - 1 grados de libertad, y el
e estimador insesgado
i
es::
( 2.8)

28

PARTE UNO: Los fundamentos del an


nlisis de regresin
n

Para distingguir la covarianza muestrral de la real se coloca unn sombrero (^)


encima de laa Cov.
Por ltim
mo, podemos definir el coeeficiente de coorrelacin muuestral entre dos
d
variables paara que corressponda al coefficiente poblaacional definiido con anteriioridad. El coeeficiente de correlacin muuestral es:
(2.9)

Para distinguuir rXY de otraas medidas ms


m complejass de correlacin, la llamam
mos
correlacin simple
s
entre X y Y. Como suu contraparte ppoblacional, rXY
X vara en vallor
de -1 a +1, de
d modo que su cuadrado se
s encuentra eentre 0 y 1. Se puede seallar
que la correllacin simple se relaciona en
e forma direccta con la covaarianza muestrral
entre X y Y como
c
sigue:

En el esstudio de la eeconometra se
s incluyen laas relaciones entre variablees.
Uno de los fundamentos de la econom
metra aplicadda es, que la covarianza nos
n
indica si doss variables esstn relacionadas y en qu medida. Es decir,
d
una covvarianza posittiva supone qque cuando X se encuentrra por encima de su mediia,
tambin lo estar Y, y que
q cuando X se encuenttra por debaj o de su meddia,
tambin lo estar
e
Y. Esto ssugiere (vasee la figura 2.2aa) que la lnea de mejor ajusste
a travs de un
u conjunto de
d puntos con covarianza neegativa tendr una pendiennte
negativa.
Podemoos ver esto ccon ms clarridad si relaacionamos la medida de la
covarianza muestral conn el estimadorr de la pendiiente de mnimos cuadraddos
dado en el captulo
c
1. Reeplanteando el
e estimador de
d la covariannza muestral en
forma de dessviaciones, coon xi = Xi - X y yi = Yi < Y ,
(2.10)
Ntese que hemos dejadoo de lado el ndice i = 1, 2, . . ., N poor conveniencia.
Recordemoss tambin quee nuestro estiimador muestral de la varrianza de X, en
2
ocasiones deenotado comoo s X , est dadoo por:

CA
APITULO 2: Estadstica elemental: a revisin

29

Ahhora considerre la expresin obtenida al dividir la covvarianza muestral entre la


vaarianza muesttral:

Essta razn es igual a la esttimacin de la pendiente obtenida en la ecuacin


(1.6). Para cualquier muestraa, el estimadorr de la pendiennte de mnimoos cuadrados
pu
uede medirse por la razn dde covarianza, la cual tomaa la direccin de
d la recta, y
la varianza tom
ma un nmeroo positivo quee sirve para noormalizar las unidades en
qu
ue son medidos los datos.
Para aplicaar lo anterior, considrese el
e ejemplo dell promedio dee calificacionees. Nuestros clculos
c
para lla estimacin de la pendiennte de mnimoos cuadrados
pu
uede usarse paara calcular m
medias mustrrales, varianza y covarianzza. Por tanto,
los datos en form
ma de desviacciones, x y y = 0. La covariianza entre X y Y est dada
poor:

m
mientras
que laa varianza de X est dada por:
p

See tiene que la covarianza ess positiva, lo que indica unna pendiente positiva,
p
y la
raazn de la covvarianza muestral y la variianza muestraal, 2.79/23.144, produce la
esstimacin de la
l pendiente, .12.

2.2.2

El teorema
t
de
el lmite cen
ntral

Q
Qu le sucedee a la distribuucin muestral de la mediia conforme se hace ms
grrande el tamaao de la muuestra? De manera
m
intuitivva, esperaraamos que un
tam
mao de mueestra ms grannde conducira a un estimaador de la meedia que est
enn promedio ms
m cerca de la media pob
blacional. Dee hecho, si laa muestra se
vu
uelve grande en forma arbbitraria, o igual a la pobllacin, el esttimado de la
m
media
muestraal sera idnticcamente iguaal a la media ppoblacional.
Esta intuiccin, que se ccumple para las
l distribucioones de probabilidad con
m
medias
finitas y no se limitaa a la normal,, se resume dde manera form
mal como el
teoorema del lmitte central:

Teorema del lmite centraal. Si la variaable aleatoriaa X tiene unaa media y


T
u varianza 2, entonces lla distribucinn muestral dee X se vuelvee aproximauna
d
damente
norm
mal con mediia y varianzza 2/N conforme N se incrrementa.

30

PARTE UNO: Los fundamentos del anlisis de regresin

El teorema del lmite central proporciona una razn importante para el estudio de la distribucin normal en la seccin 2.4; veremos que para tamaos de
muestras suficientemente grandes, la suposicin de normalidad nos permitir
simplificar, en gran medida, nuestras pruebas estadsticas. Antes de estudiar
esta descripcin, haremos una breve interrupcin para exponer las propiedades
deseables en un estimador estadstico.

2.3

PROPIEDADES DESEABLES DE LOS ESTIMADORES


Hemos afirmado que una propiedad til de un estimador estadstico es que sea
insesgado y en vista de que la bsqueda de estimadores est en el corazn de la
ciencia de la econometra, haremos una pausa aqu para considerar otras propiedades deseables. Para ligar nuestra exposicin con el anlisis del modelo de
regresin, tendramos que preguntar qu propiedades debemos buscar al elegir
un estimador para un parmetro arbitrario , como el estimador de la pendiente
de una lnea recta. Hay cuatro propiedades importantes de los estimadores que
son:
2.3.1

Ausencia de sesgo

Una propiedad muy deseable asociada con un parmetro de regresin estimado


es que la distribucin del estimador tenga al parmetro como su valor medio.
Entonces, si pudiramos analizar datos nuevos, nos aseguraramos de estar en
el promedio correcto. Diramos que es un estimador insesgado si la media o
valor esperado de es igual al valor verdadero; es decir, E ( ) = . La diferencia
entre un estimador sesgado y un estimador insesgado puede verse en la figura
2.3. Para aclarar la exposicin definiremos el sesgo asociado con un parmetro
estimado como sigue:

Sesgo = E( ) -
Aunque la ausencia de sesgo en un estimador es una propiedad deseable, no
supone nada acerca de la dispersin del estimador alrededor del parmetro verdadero. En general, a uno le gustara que el estimador fuera insesgado y tambin
que tuviera una dispersin muy pequea alrededor de la media. Esto nos sugiere
que debemos definir un segundo criterio que le permitiera elegir entre
estimadores insesgados alternativos.

2.3.2

Eficiencia

Decimos que, es un estimador insesgado eficiente si para un tamao muestral


dado la varianza de es menor que la varianza de cualesquier otros estima-

CA
APTULO 2: Estadsstica elemental: a revisin

31

Figura 2.3

Sesgo.

dorres insesgadoss. Esto, en ocaasiones es difcil, de modo que


q es naturall describir a
los estimadores en funcin de su eficiencia relativa. Un estimaddor es ms
eficciente que otro
o si tiene una varianza mennor. Esta eficiencia es deseaable debido
a que
q entre mayyor sea la eficciencia asociaada con un prooceso de estim
macin son
ms fuertes las afirmacioness estadsticas que puede hhacer uno aceerca de los
parrmetros estim
mados. Por taanto, en el casso extremo dee un estimadoor (insesgado)) con varianzza cero, podeemos afirmarr con certezaa el valor nuumrico del
parrmetro de reg
gresin verdaadero. En la figura
f
2.4, se muestra de manera
m
grficaa un estimador relativam
mente eficieente y un esstimador relaativamente
ineficiente.

2.3
3.3

Erro
or cuadrticco medio mnimo
m

En diversas circu
unstancias noss vemos obliggados a sacrificar el sesgo y la varianza
de los estimadoores. Esto es, cuando la meta
m
de un m
modelo es maaximizar la
precisin de las predicciones,, por ejemplo, un estimadoor con una vaarianza muy
baja y un pequeo sesgo pueede ser ms deeseable que uun estimador insesgado

Figura 2.4
Eficiencia.

32

P
PARTE
UNO: Los fundamentos
f
del anlisis de regresi
n

con una vaarianza alta. Un


U criterio que
q es til a este respectoo es la meta de
minimizar el
e error cuadrrtico medio, el
e cual se definne como:

No es difcil mostrar quee esta definicin es equivaalente a:1

Por tanto, el
e criterio de minimizar
m
el error cuadrttico medio toma en cuentaa la
varianza y el
e cuadrado ddel sesgo del estimador.
e
Cuuando es insesgado, el errror
cuadrtico medio
m
y la vaarianza de son iguales.

EJEMPL
LO 2.2

Error cuadr
tico medio

Supngase que estamos iinteresados enn estimar la media


m
de una variable
v
aleatooria
X, con meddia poblacionaal desconocid
da y desviaccin estndar , y que puedden
recolectarsee 10 puntos por
p muestreo aleatorio. Deebido a que laa recoleccin de
datos es costosa, un inveestigador proopone recolectar slo cincoo puntos al azzar.
Qu efectto tiene estee procedimieento de mueestreo ms limitado
l
en las
propiedades del estimaddor de la mediia?
El prim
mer estimador dde muestra coompleta est dado
d
por: X = (X1 + +X10
1) /
10, mientraas que el seguundo estimado
or de muestraa limitada est dado por: X ' =
(X1 + +X
X 5)/5. Ambos estimadores so
on insesgadoss en vista de quue:

Sin embarggo, el primer estimador


e
es ms
m eficiente que el segunddo debido a quue
tiene una varianza
v
menoor. Para ver por
p qu, ntesse que:

De hecho, el estimadoor de la mediaa muestral, laa cual utiliza todos los datos
disponiblees (ponderadoos en forma iggual), es el estimador ms eficiente
e
posibble.

CAP
PTULO 2: Estadsstica elemental: a revisin
r

2.3
3.4

33

Conssistencia

Parra completar laa exposicin, considerarem


mos las propieedades de los estimadores
e
connforme el tam
mao de la m
muestra es ms
m grande, es decir, las propiedades
p
asinntticas, o de muestra grannde. Nos gustaara que el esttimador se acerque a la
verdadera confforme se incrrementa el tam
mao de la muestra.
m
De manera
m
especfica, esperamos que conform
me el tamaoo de la muestrra se hace ms grande, la
probabilidad de que diferrir de se har
h
muy peqquea. Para aplicar este
conncepto probabbilstico a la eleccin
e
del estimador,
e
deffinimos el lm
mite de probabbilidad de (plim
(
, probability limit of
o ) de la siguuiente maneraa:
pllim es igua
al a si, confoorme N se aprroxima al infin
nito, la probaabilidad de
qu
ue - seer menor qu
ue cualquier nmero
n
positiivo arbitrariaamente pequ
ueo se aprox
xime a 1.
Con este conncepto es natuural definir el criterio de coonsistencia com
mo sigue:
es un estiimador consistente de si el
e lmite de proobabilidad de es .2

Habblando en form
ma aproximada, un estimaador es consisttente si la disttribucin de
proobabilidad dell estimador see plega a un solo punto ((el parmetroo verdadero)
con
nforme el tam
mao de la muuestra se hacee arbitrariameente grande. En
E la figura
2.5, esto se describe en formaa grfica.

Figura 2.5
Consistencia.

En sentido esttricto, converrge con en el lm


mite de probabiliidad si para cualqquier > 0,

lm Prob( - < ) = l
N

34

P
PARTE
UNO: Los fundamentos
f
del anlisis
a
de regres
sin

Como una
u regla, los cronometristtas tienden a ppreocuparse ms
m con la coonsistencia quee con la falta de sesgo. Un estimador sesgado pero coonsistente pueede
no igualar al
a parmetro verdadero enn promedio, pero
p
se aproxximar al parrmetro verdaadero conform
me la informacin de la m
muestra se haace ms grandde.
Esto es mss tranquilizador, desde un punto
p
de vistta prctico, qu
ue la alternatiiva
de encontrarr un estimadoor del parmeetro que sea innsesgado, perro contine deesvindose enn forma considderable del parmetro verddadero conforrme crece el tat
mao de la muestra. En lla figura 2.6, se
s ilustran dos estimadoress de parmetroos,
uno de los cuales es im
mparcial con una
u varianza grande. Debbido a las collas
grandes, un segundo estiimador, aunqu
ue sesgado, tiiene una variaanza suficienttemente pequuea para teneer en total unn error cuadrtico medio ms
m pequeo..
Es naturral considerarr como un critterio alternativvo el objetivoo de que el errror
cuadrtico medio del estimaador debera aproximarse
a
a cero conforme se incrementa la

muestra. Ell criterio del error cuadrtico medio iimplica que el


e estimador es
asintticameente insesgadoo y que su variianza va a ceroo conforme creece el tamao de
la muestra. Resulta que un estimadoor con un errror cuadrticoo medio que se
aproxime a cero ser unn estimador coonsistente perro que lo con
ntrario no neccesariamente es
e cierto. Adeems, en la mayor
m
parte dee las aplicacioones los estim
madores consisstentes tienenn errores cuad
drticos mediios que se aprroximan a cerro;
estos dos crriterios se usaan en forma inntercambiablee.

2.4

DISTRIBU
UCIONES DE
E PROBABIL
LIDAD
Hay varias distribuciones
d
s de probabiliidad especficas que sern tiles

en uno o
ms temas de
d este libro.. Las cuatro distribucione
d
s cubiertas soon la normal,, ji
cuadrada, t y F. La expposicin que sigue
s
pretendee ser descripttiva, no riguroosa.

2.4.1

La distribuccin norma
al

La distribuucin normal es una distribucin de proobabilidad coontinua en forrma


de campanaa, como se iluustra en la fig
gura 2.7. Unaa distribucin normal puedde

Figura 2.6
6;
Error cuadrtico medio.

CA
APTULO 2: Estad
dstica elemental: a revisin

35

deescribirse, com
mpletamente por su media y su varianzaa, de modo quue si X estuviiera distribuidda en forma normal,
n
escribbiramos X ~ N(x, 2x), loo cual se lee
"X
X est distribuida como unna variable normal
n
con m
media x y varrianza 2x".
Si X est distribuida en fforma normal (y exp A = eA),

Para los prropsitos de lla prueba estaadstica, es ttil saber que:


Prob (x - 11.96 x < Xi < x + 1.96 x) .95

(2.12)

Prob (x - 22.57 x < Xi < x + 2.57x) .99

(2.13)

doonde x y x son la mediia y la desviaacin estndaar de la variaable aleatoria


noormal X. La probabilidad
p
dde que una sola observacin de una variiable X distribuuida en formaa normal caerr dentro de alrededor
a
de 2 desviaciones estndar de
suu media es approximadamennte .95. La prrobabilidad dee estar dentro de alrededor
2 21 desviacionees estndar ess de aproximaadamente .99. A la inversaa, la probabiliddad de que unna sola observvacin estar a ms de 2 (22 21 ) desviacioones estndar
dee distancia dee la media es de .05 (.01). La figura 2.77 contiene unna ilustracin
dee una variablee normal con media 0 y deesviacin estnndar 1. La pro
obabilidad de
quue una observvacin de la vvariable aleato
oria X estar en una u otraa de las reas
soombreadas es igual a .05. Para
P ejemplifiicar lo anterioor, supngase que las puntuuaciones en loos exmenes dde admisin a la universidadd (SAT) estnn distribuidos
enn forma norm
mal con una ppuntuacin media
m
de 500 y una desviaccin estndar
dee 100, entonnces, la probbabilidad de que cualquieer puntuacinn de prueba
paarticular estarr dentro del rango de 304
4 a 696 [5000 1.96(100))] es, .95. De
m
manera
corresspondiente, slo el 2.5% de las puntuuaciones de prueba
p
sern
m
mayores
que 696,
6
mientras que el 2.5% ser menor qque 304.
Por qu estudiar
e
la diistribucin no
ormal? La diistribucin noormal es una
elleccin frecueente de la disttribucin de probabilidad
p
aal menos por dos
d razones:
1. Es simtrica y en foorma de cam
mpana, una foorma razonabble para que
deescribamos laa distribucin de los parm
metros, como la pendiente y el intercepto
o, que esperam
mos estimar.
2. La distrribucin es deescrita por completo por suu media y su varianza,
v
de
m
modo
que no necesitamos
n
p
preocuparnos
por otras propiedades com
mo el sesgo y
laa kurtosis.
El siguientte resultado aayuda con mu
uchas de las ppruebas estadsticas usadas
enn econometraa.
Resultadoo 10 Si dos ((o ms) variaables aleatorrias estn disstribuidas en
foorma normal con medias y varianzas iddnticas, cuallquier suma ponderada
p
de
estas variabless estar distriibuida en form
ma normal.

36

PAR
RTE UNO: Los fund
damentos del anlisis de regresin

Probab
bilidad

Figura 2.7

Distribucin
n normal
estndar.

EJEMPLO 2.3

Distribucin normal

La distribucin de los ndicces de salario por


L
p hora de unna poblacin de
d trabajadorees
e distribuidda en forma aproximadam
est
a
ente normal ccon media de 9.60 dlares y
d
desviacin
estndar de 55.25 dlares. Qu porceentaje de la poblacin de
d
e
empleados
gaana ms de 20.00
2
dlares por hora? M
Menos de 5.000 dlares poor
h
hora?
Para reesponder ambbas preguntas,, determinamoos que 20.00 dlares est a
(20.00 - 9.60))/5.25 = 1.98 ddesviaciones estndar
e
por enncima de la media,
m
mientraas
q 5.00 dlaares est a (9.660 - 5.00)/5.25 = .88 desviaaciones estnd
que
dar por debajoo
d la media. Usando la taabla 1 al finaal del libro para
de
p
la distrib
bucin normaal
e
estandarizada
a, encontram
mos que 2.39%
% de la distrribucin se encuentra
e
a la
l
d
derecha
de 1..98 desviacionnes estndar por
p encima de
d la media, mientras
m
que el
e
18.94% se enncuentra a la izzquierda de .888 desviaciones estndar poor debajo de la
l
m
media.
Por co
onsiguiente, approximadameente el 2.39% de los empleaados gana ms
d 20.00 dllares por horra, mientras que
de
q aproximadamente el 18.94% ganna
m
menos
de 5.000 dlares porr hora.

2.4.2

D
Distribucin
ji cuadrad
da

La ji cuadradda es til para probar hipteesis que tieneen que ver conn varianzas de
L
d
v
variables
aleaatorias. Su aplicacin se deeriva del resultado 11.
Resultaddo 11 La sumaa de los cuadra
ados de N variiables aleatoriias distribuidaas
independienteemente en forrma normal (ccon media 0 y varianza 1) est
e distribuidda
como ji cuadrrada con N grrados de liberttad.
Supngase, por
p ejemplo, qque calculamoos la varianzaa muestral s2 de N observaaciones extrad
das de una ddistribucin no
ormal con vaarianza 2. Enntonces, no es
e
2 2
difcil mostraar que (N - 1 )s / estar distribuida como ji cuadraada con N - 1
grados de libertad.3 Al exaaminar valorees crticos de la distribucin ji cuadradaa
3

Vase a W.H.
W
Greene, Ecoonometric Analysiis (Nueva York: Macmillan,
M
1990),, pp. 62-63.

CAP
PTULO 2: Estadstica elemental: a revisin

37

conn el nmero appropiado de ggrados de libeertad, podemoos decidir si see rechaza la


hip
ptesis de quee la varianza dde la variable aleatoria es iigual a un nm
mero determinnado.
La ji cuadraada comienzaa en el origen
n, es sesgada hacia la dereecha y tiene
unaa cola que se extiende infinnitamente haccia la derechaa (como se muuestra en la
figuura 2.8). La foorma exacta dd la distribuccin depende del nmero de
d grados de
libeertad, con la distribucin volvindose cada vez ms simtrica conforme
c
el
nm
mero de gradoos de libertad se hace ms grande. Cuanndo los gradoss de libertad
se hacen
h
muy grrandes, la disttribucin ji cuuadrada se aprroxima a la normal.
n
Una
tabla de la ji cuaadrada, a mennudo denotadaa como x2, see proporciona al final del
librro (tabla 2),

2.44.3

La diistribucin
nt

En ocasiones, enn estadstica, se


s asume que la
l varianza dee una variable aleatoria es
connocida. Cm
mo probamos hiptesis cuaando la variannza no es conocida? La
resppuesta se encuentra en la ddistribucin t.. El resultado central que nos
n permite
usaar la distribucin t es el sigguiente.
Resultado 12
1 Supngase que X est diistribuida en forma
f
normall con media
0 y varianza 1 y que Z est distribuida como ji cuaadrada con N grados de
libeertad. Entoncces si X y Z son independiientes, X Z/N
/N se tiene unna distribucin t con N graados de libertaad.
Como la norrmal, la t es ssimtrica, y see aproxima a la normal paara tamaos
de muestra gran
ndes, pero la t tiene colas ms
m gruesas que
q la normaal, una ocurren
ncia que es prronunciada enn especial parra tamaos dee muestras dee aproximadam
mente 30 o menos.
m
La figuura 2.9 ilustraa la distribucin t. Para verr cmo nos
ayuuda el resultaado 12, recurdese que paara la X norm
mal, (X - x)/(x/N) est
disttribuida en forma
f
normall con media 0 y varianzaa unitaria. Perro si no se
connoce x, debem
mos remplazaar 2x por la varianza
v
mueestral s2x . En vista
v
de que
2
2
(N--1) s x / x siguee una distribuucin ji cuadrada y que (X- x)/(x/N)) es normal
uniitaria, el resulltado 12 nos dice que:

siguue una distribbucin t. Por taanto, la distribbucin t puedee usarse para probar si la
med
dia de una variable
v
aleatooria es igual a cualquier nmero partticular, aun
cuaando se desconozca la variaanza de la varriable aleatoria.
Puede ser ttil hacer un exxamen breve de los percenntiles de la disstribucin t
dadda en la tabla 3 al final dell libro. Para una
u prueba dee significanciia al 5%, el
valo
or crtico de la
l distribucinn t se aproxim
ma a 1.96, el vvalor crtico de
d la distribuccin normal, conforme N sse hace grandde. Para una m
muestra de 200 o ms el

38

P
PARTE
UNO: Los fundamentos del anlisis de regresin

Figura 2..8

Distribuccin
ji cuadrad
da.

valor crticoo de 2.0 es unna aproximacin razonable. Para ilustrar, reconsidresee el


ejemplo dell SAT mencioonado antes, peero supngasee que la mediaa muestral de uuna
distribucin de 21 puntuuaciones de prueba
p
es 5000 y que la desv
viacin estnndar
estimada (een oposicin a la desviacin estndar vverdadera) es 100. En vistaa de
que el valorr crtico de la distribucin t (para un niveel de significanncia del 5%) con
c
20 grados de
d libertad ess 2.086, la proobabilidad de que cualquieer puntuacin de
prueba dadda ser mayorr que 708 [500 + 2.086(100)] es de 2.5%
%.

2.4.4

La
L distribucin F

En ocasion
nes cuando deeseamos probbar hiptesis cconjuntas quee implican doos o
ms parm
metros de regreesin; por ejemplo, la hiptesis de que el
e intercepto y la
pendiente son cero contra la alternativa de que uuna o la otra o ambas no son
s
cero. La esstadstica de prueba
p
apropiaada se basa enn la distribuciin F y se carracteriza por dos parmettros, estando asociado el primero conn el nmero de
parmetross estimados y el segundo con el nmeero de gradoss de libertad. La
distribucin
n F, como la jji cuadrada, tieene una formaa sesgada y vaara en valor de
d 0
al infinito (vase
(
figura 2.10).
La disttribucin F puuede usarse paara probar la igualdad de doos varianzas. Su
S
utilidad se deriva del resultado 13.
Resulttado 13 Si X y Z son ind
dependientess y estn distrribuidas como ji
cuadrada coon N1 y N2 graddos de libertadd, respectivameente, entonces (X/N1)/(Z/N2)
Figura 2.9

Distribuccin f.

CAP
PTULO 2: Estadsstica elemental: a revisin
r

39

Figura 2.10
Distribucin F.

est distribuida de
d acuerdo coon una distribuucin F con N1 y N2 grados de libertad.
Parra ver la utilid
dad del resultaado 13, supnngase que hem
mos obtenido muestras
m
de
tam
mao N1 y N2 de dos distribbuciones norm
males diferenttes X y Z. La varianza de
X es
e estimada co
omo:

y laa varianza de Z es estimadda como

Si deseamos
d
pr obar si 2x = 2Z., podemoss calcular la eestadstica s x /s Z . Si X
y Z son independ
dientes, entoncces (N1 - 1)s2x /
/ 2x . est distrribuida como ji cuadrada
2
conn N1 - 1 gradoos de libertad y (N2 - 1) s Z /
/ 2Z. est distrribuida como ji cuadrada
conn N2 - 1 gradoos de libertad. Entonces, ussando el resulltado 13, sabeemos que el
cocciente

estaar distribuiddo como una distribucin


d
F.
F Ntese quee si 2x = 22 , esto se re2 2
ducce a ) s x /s Z y el cociente de las variannzas estimadaas sigue una distribucin
d
F con
c N1 - 1 y N2 - 1 grados de libertad.
La estadsticca F siempre sse tabula con el
e estimador m
mayor de la vaarianza en el
num
merador y ell estimado m
menor en el denominador.
d
. El cocientee resultante
siem
mpre es mayoor que 1, y prroporciona informacin resspecto a la coola superior
de la distribucin F. Entre m
mayor es la diferencia
d
enttre las dos vaarianzas, es
maayor la estadsttica F. Por tannto, un valor grande
g
de F im
mplica que es improbable
quee las dos varianzas de erroor sean iguales. En la prcttica, la pruebaa se lleva a
cab
bo eligiendo un
u nivel de significancia y luego buscanndo el valor crtico
c
de la
distribucin F en
e una tabla eestndar de F..

40

PARTE UNO: Los fundamentos del anlisis de regresin

Como por ejemplo, supngase que deseamos saber si la varianza de la prueba


de matemticas del SAT difiere de la varianza de la prueba verbal del SAT.
Supngase tambin que de los 21 estudiantes, todos respondieron la prueba
verbal pero slo 16 respondieron la prueba de matemticas. La varianza
muestral de la prueba de matemticas es 100 000, mientras que la varianza
muestral de la prueba verbal es 80 000. Al asumir que las poblaciones de las
puntuaciones de prueba estn distribuidas en forma normal, la estadstica F es
1.25 (100 000/80 000) con 20 y 15 grados de libertad. En vista de que el valor
crtico del 5% de la distribucin F es 2.33, no podemos descartar la posibilidad
de que las varianzas reales son iguales (1.25 < 2.33). Ya que hemos elegido una
proporcin F mayor que 1 en la cola superior de la distribucin, entonces nuestra
prueba de significancia al 5% es una prueba unilateral. Si deseamos interpretar
nuestros resultados en el contexto de una prueba bilateral que permitiera que la
varianza de las puntuaciones de la prueba de matemticas fuera superior o
inferior que la varianza de las puntuaciones de la prueba verbal, llegaramos a la
misma conclusin en el nivel de significancia del 10%.4

2.5

PRUEBA DE HIPTESIS E INTERVALOS


DE CONFIANZA
En esta seccin revisaremos el problema de probar hiptesis. Las hiptesis que
ocurren ms a menudo en econometra implican pendientes e interceptos de
lneas de regresin, pero tambin pueden implicar varianzas o covarianzas de
distribuciones de probabilidad. Para una aplicacin simple, reconsidrese el
ejemplo del promedio de calificaciones del captulo 1. La pendiente de .12 nos da
una buena conjetura acerca del efecto del ingreso familiar en las calificaciones,
pero qu tan confiable es esa conjetura? De manera especfica, cmo podemos
estar seguros de que la pendiente en realidad no es cero, de modo que el ingreso y
el promedio de calificaciones no estn relacionados? ste es un problema de
prueba de hiptesis, y el concepto de un intervalo de confianza est relacionado
con esta prueba. Mientras que .12 es una buena estimacin de la pendiente, de
seguro no estaramos preparados para afirmar que .12 mide la pendiente de la
relacin entre el ingreso y las calificaciones de todos los estudiantes. Para demostrar qu tan confiables son los resultados, necesitaremos usar los datos para
hacer afirmaciones probabilsticas acerca de nuestra estimacin de la pendiente.
De manera especfica, podramos encontrar que se puede afirmar que con una
probabilidad de .95 el intervalo de .06 a .18 contiene la pendiente verdadera. El
intervalo de .06 a .18 se llama intervalo de confianza del 95% para la pendiente.
4
Si elegimos hacer una prueba bilateral con un nivel de significancia del 5% usando el cociente
de la estimacin de la varianza mayor sobre la menor, podramos usar informacin acerca de las
pruebas de significancia al 2.5% para la distribucin F (no disponible al final de este libro). De
manera alternativa, podramos calcular la cola inferior de la distribucin invirtiendo los grados de
libertad y usando como valor crtico el recproco del valor crtico enumerado en la tabla para los
grados de libertad invertidos.

CA
APTULO 2: Estadsstica elemental: a revisin

41

La relacinn entre la pruueba de hiptesis y los inntervalos de confianza


c
es
esstrecha. Para ver esto, supponga que deeseamos probbar la hiptesis de que la
peendiente es 0. Entonces, deccimos que la hiptesis nulaa es que la pendiente es 0.
Siin embargo, enn vista de quee sabemos quee 0 se encuenntra afuera del intervalo de
co
onfianza del 955%, concluim
mos (con una confianza
c
del 95%)
9
que poddemos rechazaar la hiptesiss nula de una pendiente dee cero.
Para continnuar esta revisiin, hay que considerar
c
cm
mo se relacion
nan la prueba
dee hiptesis y los
l intervaloss de confianzaa con la deterrminacin de la media de
un
na variable aleatoria.
a
De manera espeecfica, supnngase que coonocemos la
vaarianza de unaa variable aleeatoria X (la cual
c
est distrribuida en forrma normal)
peero que se descconoce la meddia verdadera.. Deseamos haacer afirmacioones respecto
a la
l precisin co
on la que hem
mos estimado el valor descoonocido de laa media, y en
vissta de que ess difcil hacerr afirmacioness de confianzza acerca de estimaciones
e
pu
untuales, usam
mos intervaloss de confianzza. Entonces, vamos a supponer que se
qu
uiere obtener un intervalo de confianza del 95% aceerca de la meddia muestral
(see dice que stta se asocia coon un nivel dee significancia del 5%). Ell intervalo se
ob
btiene utilizanndo el hecho de que X est distribuida een forma norm
mal con una
deesviacin estndar x /N, donde N es el
e nmero dee observacionnes. El intervaalo de confian
nza del 95% es

Su
upngase, porr ejemplo, quee N= 100 y x = 10. Entonnces X est distribuida
d
en
forma normal con
c una desviaacin estndar de 1. Si la esstimacin pun
ntual de x es
X = 3, el interrvalo de con
nfianza del 955% ser 1 x 5. El intervalo de
coonfianza del 955% sugiere quue es muy prob
bable que el inntervalo (1,5) contendr la
media verdaderra x.
La interprettacin de la afirmacin de que "con una confianza del 95% 1 x
5" es como sigue. Si pudiiramos obten
ner un nmerro grande de muestras de
tam
mao N = 100, obtendraamos muchass estimacioness puntuales diferentes
d
de
x . Si calculam
mos el intervvalo X 2 x /N
/
correspoondiente a la estimacin
dee /ux de cada muestra,
m
tendrramos variass afirmaciones de intervaloos como:

Pu
uede esperarsee que algunoss de estos inteervalos excluyyan a la mediia verdadera.
Siin embargo, con
c una gran cantidad de estos
e
clculoss, puede espeerarse que el
955% de los inteervalos obtennidos contengan a la mediaa verdadera.
Los intervaalos de confiianza puedenn usarse para probar hipttesis. Ahora
coonsideremos laa hiptesis nuula de que la media
m
verdadeera es igual a cero para la
media muestrall de 3, en el ejemplo
e
anterrior vemos quue es improbaable que sea
veerdadera la hiptesis nula y la rechazam
mos (con un nnivel de signifficancia del

42

PA
ARTE UNO: Los fundamentos del an
lisis de regresin
n

5%) a favor de la hiptesis alternativa,, bastante vagga, de que la media


m
no es 00.
Ntese que la
l hiptesis nuula ha sido reechazada debido a que es im
mprobable quue
hubiramos obtenido unaa media muesstral de 3 si lla media verd
dadera hubierra
sido 0.
Como unn atajo para pprobar la hiptesis nula de que la media es 0, podemoos
calcular Z = X /(x/N) Esta
E estadstica se distribuirr en forma normal
n
con unna
varianza de 1 y, si la hipttesis nula es verdadera, unaa media de 0. Si
S la estadsticca
es mayor quee 1.96 en valoor absoluto, podemos
p
rechaazar la hiptessis nula con un
u
nivel del 5%,, mientras quee si es mayor que
q 2.57, podeemos rechazarrla con un nivel
del 1% (una afirmacin m
ms poderosa desde
d
el punto de vista estaddstico). Ahora,
suponiendo que sabemoss que para unna muestra dada
d
el valorr Z fue 2.13 y
observando la tabla 1 al final del librro, bajo la coolumna .03 y en la fila 2.1,
encontraram
mos que la proobabilidad de que Z sea maayor o igual a 2.13 es igual a
.0166. Del mismo
m
modo la probabiliddad de que Z sea menor o igual a -2.113
tambin es .00166. Tomanndo en cuenta ambas, asociiaramos un nivel
n
de signifficancia de .03332, o 3.32%, con Z. En virrtud de que Z es mayor que 1.96, podemoos
rechazar la hiptesis
h
nulaa de que la meedia verdaderra de la distribucin es cerro
en un nivel del
d 5%.
Hemos asumido
a
que la
l varianza de X se conoce, pero es ms probable
p
que la
varianza no sea conocida. Por consigu
uiente, necesittamos remplaazar la varianzza
desconocida 2x con la varrianza muestrral estimada s2x . (Ms adeelante nos refe
feriremos a laa varianza dell error verdaddero estimada por s2.) Laa estadstica de
d
prueba aproopiada se obttiene sustray
yendo la meddia verdaderaa de la mediia
muestral y dividiendo
d
la ddiferencia enttre la desviaccin estndar muestral:

Cuando desseamos probaar la hiptesiis nula de quue x = 0, estoo se simplificca


a:

En vista de que
q esta estaddstica sigue una
u distribucin t, la llamarremos estads-tica t.
La estaddstica t puedee usarse para construir inteervalos de confianza de unna
manera anlloga a la distrribucin norm
mal. Un interrvalo de conffianza del 95%
%
sera:

donnde tc es el vaalor crtico dee la distribuciin t (determiinado con la tabla 3 al finnal


dell libro) basado
o en el nmerro de grados de
d libertad y eel nivel de siggnificancia

CAP
PITULO 2: Estadsstica elemental: a revisin
r

43

desseado. El nm
mero de gradoos de libertad es igual al nmero de datoos menos el
nm
mero de restrricciones colocadas en los datos
d
por el pprocedimientoo estadstico
quee se est usanndo. Como unn ejemplo de la
l forma de caalcular tc, debemos seleccio
onar un valorr de la tabla de la distribuucin t, de m
modo que el 2.5% de la
disstribucin t see encuentre affuera de cualqquier extremoo del intervaloo correspondieente. Esto se muestra
m
en la ffigura 2.11 paara una distribbucin t con 60
6 grados de
libertad. Entoncces, si deseam
mos que haya 2.5% en caada cola, seleeccionamos
tc = 2.00, leyenddo en la colum
mna denomin
nada .05.
Para probar la hiptesis dde que la med
dia verdadera es igual a unn valor dado
*X , especificam
mos la hiptesiis nula x= *x y la hiptessis alternativaa x *x as
com
mo un nivel de significanncia. Usando el valor crttico de la disstribucin t,
callculamos el in
ntervalo de cconfianza aprropiado. Si laa media hipotttica *x se
enccuentra fuera del intervalo de confianza,, rechazamos la hiptesis nula,
n
pero si
stta se encuentrra dentro, no la podemos rechazar.
r
Las hiptesiis alternativass no necesitann ser de la vaariedad bilaterral, en cuyo
casso la media verdadera
v
pueede ser negattiva o positivva. Es frecueente que las
pruuebas unilaterrales sean deseeables. Esto slo implica ajuustes menoress en la construcccin de los intervalos
i
de confianza. Por ejemplo, ssupngase que deseamos
pro
obar la hiptessis de que x = 0 pero teneemos razones poderosas parra creer que
si x no es iguall a 0, entoncees es positiva. Aqu es aproopiada una prrueba unilateraal. La prueba es
e como antes,, pero el valor crtico tc se elige de modo que
q el 5% de
la distribucin
d
c
caiga
en una ccola, como see muestra en lla figura 2.12. En el caso
don
nde el nmero
o de grados dee libertad es 60,
6 leemos quee el valor crtiico es 1.671
en la columna de
d la tabla t deenominada .10.
Para explicaar lo anterior, supngase qu
ue una muestrra de 64 puntu
uaciones de
pru
uebas de mattemticas dell SAT tiene una
u media de 520 y una desviacin
esttndar estimad
da de 100 y ddeseamos proobar la hiptesis nula de quue la media
pobblacional de laas puntuacionnes del SAT es 500 con un nivel de signiificancia del
5%
%. Para hacer esto, encontraamos que el valor
v
crtico dee la distribuciin t con 63
graados de liberttad es aproxim
madamente 2..0. De esto see deriva que un
u intervalo
de confianza del 95% est daado por:

Enn vista de que 500 se encuenntra dentro deel intervalo dee confianza deel 95%, no
pod
demos rechazzar la hiptesis de que la media
m
poblaciional es iguall a 500.

2.S
S.1

Erro
ores Tipo I y Tipo II

La eleccin del nivel


n
de signifficancia, por lo
l general 1 o 5%, correspoondiente a la
eleeccin del tam
mao del intervvalo de confiaanza, se comprrende mejor al considerar
qu tipos de errrores podrann cometerse cuando se hacen las prueebas de las
hip
ptesis. Supngase que probamos la hipptesis nula dde que = 0 y que a un

44

PA
ARTE UNO: Los fu
undamentos del anlisis
a
de regresi
n

Figura 2.11
Prueba bilateral.

nivel de siggnificancia dell 5% la recha


azamos. Es posible
p
que haayamos rechaazado en
forma incorrrecta la hiptesis nula. Este
E
error se lllama error Tipo
T
I, y la probabip
lidad de su ocurrencia
o
es .05. Ahora, sii recolectamoos un conjuntoo de datos difeerente y
encontramoos un interrvalo de coonfianza dell 95% entrre -.02 y .26 no
podemos reechazar la hiptesis
h
nulaa de que = 0 y por tanto
t
aceptamos de
manera impplcita que ess verdadera. Sin embargoo, es posible que estemoss cometiendo un errror en este ccaso. El valorr verdadero dde podra ser .05, en cuuyo caso
habramos aceptado
a
la hiptesis nula de que = 0 cuando de hecho
h
era falsa.
Este error, llamado erroor Tipo II, ess una posibiliidad probablee ya que el intervalo
de confianza contiene unn gran nmeroo de puntos.
En otro casso, si cambiamos el niveel de significcacin del 5%
5 al 1%. Entonces
E
la confianzaa del 95% paara se incrementar al 99%. Esto im
mplica que laa probabilidad de rechazar
r
de m
manera incorrrecta la hiptesis nula (eerror Tipo I) cae del
5% al 1%, pero al mismo tiempo se inccrementa la prrobabilidad dee un error Tipoo II. Por
tanto, al seleeccionar el niivel de signifiicancia, uno enfrenta
e
un inntercambio: coonforme
disminuimoos la probabiliidad del error Tipo I, increm
mentamos la probabilidad
p
d error
del
Tipo II. La eleccin quee se tomar depende
d
del pproblema enn particular, pero en
econometraa es usual eleggir un nivel dee significanciaa bastante bajjo y una probaabilidad
baja de erroor Tipo I.

Figura 2.1
12
Prueba un
nilateral.

CAPITULO 2: Estadstica elemental: a revisin

2.5.2

45

Valores p

La mayor parte de los anlisis estadsticos reportan pruebas de significancia


estadstica sealando cules coeficientes son significativos al 1%, 5% u otro
nivel de significancia apropiado. Sin embargo, en ocasiones es til proporcionar
informacin adicional en forma de un valor p (valor de probabilidad). Un valor p
describe el nivel de significancia exacto asociado con un resultado economtrico
particular. Por tanto, un valor p de .07 indica que un coeficiente es significativo
estadsticamente en un nivel de .07 (pero no en nivel del 5%). En el contexto de
una prueba bilateral usando una distribucin normal, esto significa que el 7% de
la distribucin t se encuentra afuera del intervalo, ms o menos, 1.96 desviaciones
estndar de la media.
Usualmente la hiptesis nula que se est probando ser la hiptesis de que
un coeficiente de regresin particular es igual a 0. Por consiguiente, el valor p es la
probabilidad de obtener datos que generen una estimacin del coeficiente
estimado tan grande o mayor que el coeficiente estimado, dado que la hiptesis
nula de un coeficiente cero es verdadera. Entre menor sea el valor p para un
estudio dado, ms sorprendente ser ver un resultado as, si la hiptesis nula es
vlida. De manera correspondiente, un valor p grande indica que los datos son
consistentes con la hiptesis nula.
El valor p mide la probabilidad de un error Tipo I (como se expone en la
seccin 2.5.1), es decir, la probabilidad de rechazar en forma incorrecta una
hiptesis nula correcta. Entre mayor es el valor p, es ms probable que ser un
error rechazar la hiptesis nula; entre menor sea el valor p estaremos ms seguros
al rechazarla.

2.5.3

La potencia de una prueba

Un valor p alto significa que un coeficiente no es significativamente diferente de


cero; como resultado el investigador no puede rechazar la hiptesis nula de que el
coeficiente es cero. Cules son las razones para este "fracaso"? Una razn
obvia podra ser que la hiptesis nula es verdadera. Sin embargo, una posibilidad
alternativa es que la hiptesis nula es falsa pero el conjunto de datos particular
usado para la prueba resulta ser consistente con la nula. (Una tercera
posibilidad, que el modelo es invlido, se comentar ms adelante en el libro.)
El concepto estadstico que nos ayuda a evaluar la importancia de la segunda
explicacin es la potencia de la prueba. La potencia es la probabilidad de rechazar la

hiptesis nula cuando de hecho es falsa. Por consiguiente para cualquier hiptesis
nula particular, la potencia est dada por 1 menos la probabilidad de que haya un
error Tipo II, es decir, 1 menos la probabilidad de que uno aceptar la hiptesis
nula como verdadera cuando sta es falsa.
La potencia no slo depende del tamao del efecto que se ha medido, sino
tambin del tamao del conjunto de datos que se est estudiando. Siendo iguales
otras cosas, entre mayor sea el efecto y mayor sea la muestra, la prueba ser ms
potente. Cuando un anlisis estadstico con potencia relativamente baja no

46

PARTE UNO: Los fundamentos del anlisis de regresin

puede mostrar un valor p significativo, no deberamos deducir, en forma definitiva, que no hay efecto. Ms bien, debemos aceptar el hecho de que el estudio
pueda no ser concluyente debido a que el conjunto de datos no es suficiente
como para que nos permita distinguir entre las hiptesis nula y alternativa.
Se proporciona un resumen de la relacin entre los errores Tipo I y Tipo II y
la potencia de una prueba estadstica en el cuadro que sigue denotando la
hiptesis nula como Ho. Ocurre un error Tipo I cuando la hiptesis nula es
verdadera pero es rechazada por nuestra prueba; la probabilidad de que suceda
esto est dada por el valor p. Un error Tipo II ocurre cuando la hiptesis nula es
falsa pero no podemos rechazarla. Su probabilidad es igual a 1 menos la potencia
de la prueba estadstica.
POTENCIA Y ERRORES TIPO

TIPO II

Decisin
No puede rechazarse Ho
Rechaza Ho

EJEMPLO 2.4

Ho Verdadera
Decisin correcta
Error Tipo I (valor p)

Ho Falsa
Error Tipo II (1 - potencia)
Decisin correcta

xito en las solicitudes de empleo

Supngase que una reserva de solicitantes de empleo contiene 10 000 hombres y


10 000 mujeres y que deseamos saber si hay una diferencia significativa entre el
xito de las mujeres y el de los hombres para obtener empleos.5 Para una muestra
particular de 50 hombres y 50 mujeres, el ndice de aprobacin fue del 58% para
las mujeres (29 de 50) y del 38% para los hombres, de modo que el diferencial
fue del 20%. La distribucin de la poblacin de las diferencias en los ndices de
aprobacin se aproxima a una distribucin normal, con una media de 20 puntos
porcentuales y una desviacin estndar de 9.7 puntos porcentuales.6
Considrese la hiptesis nula de que los hombres y las mujeres tienen un
ndice de xito idntico en sus solicitudes. Con una distribucin normal, un
intervalo del 95% para el diferencial del ndice de aprobacin est dado por
20 1.96*9.7 = 20 19.0 = (1.0, 39.0). Los diferenciales que son menores que 1
punto porcentual o mayores que 39 puntos porcentuales tienen ms o menos
una probabilidad de ocurrencia del 5%. El valor p asociado con un diferencial de 0
es algo menor que el 5%; de hecho, la probabilidad de obtener un diferencial
menor o igual a 0 (y mayor o igual a 40) est dada por la probabilidad de que
una distribucin normal con media 0 y una desviacin estndar de 1 tome
valores menores que -20/9.7 = -2.06, o mayores que 2.06, la cual es del 4%.
En vista de que el valor p es menor que el 5%, rechazamos la hiptesis nula
de ndices de xito iguales con un nivel de significancia del 5%. Debido a que
5
Este ejemplo se basa en D. Kaye y D. Freedman, "Reference Guide on Statistics", en Reference
Manual on Scientiftc Evidence (Washington, D.C.: Federal Judicial Center, 1994).
6
La desviacin estndar se determina como la desviacin estndar de una diferencia en dos
proporciones y para una poblacin grande es igual a [.58 (1 - .58)/50 + .38( 1 - 38)/50]5 = .096. Vase
a D. Freedman y cols., Statistics (Nueva York: Norton, 1991), p. 67.

CAPTULO 2: Estadstica elemental: a revisin

47

hemos rechazado escasamente la nula, podra ser interesante preguntarse respecto a la potencia de la prueba estadstica. Para evaluar la potencia, necesitamos especificar la hiptesis alternativa de manera explcita. Supngase que la
alternativa es que el 55% de las mujeres aprobarn, al igual que el 45% de los
hombres, un diferencial de 10 puntos porcentuales. Con una distribucin normal
que tiene una desviacin estndar de 9.7, slo diferenciales mustrales mayores
que aproximadamente 9.7*1.96 o 19.0 puntos, o menores que -19.0 puntos,
seran considerados estadsticamente significativos en un nivel del 5%. Para una
distribucin normal que est centrada en el 10% (reflejando la hiptesis
alternativa), podemos determinar que aproximadamente el 18% de la distribucin se encuentra arriba de 19.0 puntos porcentuales y que slo un porcentaje muy pequeo se encuentra debajo de -19.0. Por consiguiente, la potencia de la
prueba, contra la alternativa que se acaba de especificar, es del 18%. Vemos, por
consiguiente, que debido a que la prueba tiene una potencia algo limitada contra
esta alternativa particular, la probabilidad de rechazar la hiptesis nula cuando
la alternativa es correcta es de slo el 18%; hay, por supuesto, una probabilidad
del 82% de aceptar la hiptesis nula cuando la alternativa es correcta.
Ahora supngase que se ha duplicado el tamao de la muestra, de 50 hombres y 50 mujeres a 100 hombres y 100 mujeres, y que los ndices de aprobacin
permanecen iguales: 58% para las mujeres y 38% para los hombres. Entonces, la
desviacin estndar estimada de la poblacin cae de 9.7 puntos porcentuales a
6.9 puntos porcentuales. El intervalo de confianza del 95% para el diferencial
del ndice de aprobacin es 20 1.96*6.9 = 20 13.5 = (6.5, 33.5). Ahora el valor p
asociado con un diferencial de 0 es ms o menos 0.3%, el cual mide la probabilidad de que el diferencial real de 20 puntos porcentuales (o uno mayor) pudiera haber resultado de un mundo en el que los hombres y las mujeres tuvieran
ndices de aprobacin iguales. Ahora, la potencia de la prueba tambin ha cambiado. Con esta muestra mayor, el diferencial de los ndices de aprobacin mayores que 6.9*1.96 o 13.5 puntos, o menor que -13.5 puntos, sern significativos.
Con una distribucin centrada en 10 puntos porcentuales (asociados con la
hiptesis alternativa del 55%, 45%), la probabilidad de que ocurrir dicho diferencial de los ndices de aprobacin es la probabilidad de que una distribucin
normal con media 10 y desviacin estndar 6.9 ser mayor que 13.5 o menor
que -13.5, la cual aproximadamente es del 31%. Por consiguiente, la duplicacin del tamao de la muestra ha incrementado la potencia de la prueba contra
esta alternativa particular del 18 al 31%.

2.6

ESTADSTICA DESCRIPTIVA
Un histograma es un instrumento til para describir los datos asociados con un
valor particular. Este histograma tabula la distribucin de frecuencia de los
datos y, usualmente, divide la distancia entre los valores mnimo y mximo de

48

PARTE UNO: Los fundamentos del anlisis de regresin

la serie de datos en intervalos iguales, para despus poder tabular el nmero de


observaciones que caen dentro de cada intervalo.
La figura 2.13a presenta un histograma que describe el nmero de individuos por cada mil de poblacin inscritos en instituciones pblicas de educacin
superior (PBLICA) en cada uno de los 50 estados de Estados Unidos en el ao
acadmico 1984-1985. El histograma correspondiente para las inscripciones privadas por cada mil (PRIVADA) aparece en la figura 2.132b. En la primera figura
vemos que los tres estados en el extremo inferior del espectro tuvieron una
matrcula de entre 25 y 27.5 por cada mil en la educacin pblica (el ms bajo fue
Georgia), mientras que un estado (Arizona) inscribi algo ms de 60 por cada
mil. Con respecto a la matrcula privada, el estado ms bajo no tuvo instituciones
privadas (Wyoming) mientras que la inscripcin en Massachusetts fue de ms de
40 por cada mil.7
Al principio de este captulo nos centramos en la media y la desviacin
estndar como medidas descriptivas de las propiedades de una serie de datos. El
histograma tiende a enfatizar el mnimo y el mximo de esta serie, as como la
distribucin de los datos individuales. Adems, hay otras medidas de resumen
de series de datos, en general, que pueden proporcionar instrumentos descriptivos tiles y que pueden ser favorables en particular cuando uno desea evaluar si
una serie de datos se aproxima a una distribucin de probabilidad particular
como la normal.
La mediana es una medida de tendencia central que es ms robusta a los
errores o puntos de datos inusualmente extremos que la media. Para un nmero
impar de observaciones, la mediana es la observacin intermedia cuando los
datos son colocados del menor al mayor (o del mayor al menor). Cuando el
nmero de observaciones es par, la mediana, por lo general, se calcula por convencin como el promedio de las dos observaciones intermedias.
El sesgo es una estadstica que proporciona informacin til sobre la simetra
de una distribucin de probabilidad. La estadstica de oblicuidad S para una
variable X est, dada por:

donde s es la desviacin estndar de X. S es igual a cero para todas las distribuciones simtricas incluyendo la normal. Para distribuciones que no son simtricas, la estadstica de sesgo es positiva cuando la cola superior de la distribucin
es ms gruesa que la cola inferior y negativa cuando la cola inferior es ms
gruesa.
La kurtosis proporciona una medida del "grosor" de las colas de una distribucin. La estadstica de kurtosis K, est dada por

7
Para mayores detalles, vase J. Quigley y D. Rubinfeld, "Public Choices in Public Higher
Education", en C. Clotfelter y M. Rothschild (eds.), Studies of Supply and Demand in Higher Education
(Chicago, University of Chicago Press, 1993), pp. 245-283.

CAPTULO 2: Estadsstica elemental: a revisin

49

Figura 2.13
Matrcula en escuelas
e
pblicas y priv
vadas.

Paara una distribbucin normaal es igual a 3. Cuando las ccolas de la distribucin


so
on ms gruesaas que la norm
mal, K ser mayor
m
que 3 y viceversa.
A menudo es til probarr si una serie de datos dadaa se aproximaa a la distribuucin normal. Esto puede evvaluarse, de manera
m
informaal, revisando para
p ver si la
meedia y la mediana son casi iguales, si el sesgo es aprooximadamentee cero y si la
kuurtosis est cerca de 3. Unaa prueba ms formal de norrmalidad est dada por la
esttadstica Jarque-Bera:
JB
B = [N/6][S2 + (K
( - 3)2 /4]

50

PARTE UNO: Los fundamentos del anlisis de regresin

La estadstica JB sigue una distribucin ji cuadrada con 2 grados de libertad. Si


la estadstica JB es mayor que el valor crtico de la ji cuadrada, rechazamos la
hiptesis nula de normalidad.
Para ilustrar diversas de estas medidas estadsticas, hemos tabulado cada
una de ellas para las series de datos de inscripcin, PBLICA y PRIVADA, descritas con anterioridad:
Pblica
Media
Mediana
Desviacin estndar
Sesgo
Kurtosis
Jarque-Bera

39.29
38.84
8.17
0.38
2.61
1.54

Privada
10.53
7.84
8.24
1.78
6.24
48.26

La serie de inscripcin pblica tiene una mediana que slo es ligeramente


inferior que la media y un sesgo que est cerca de cero. Como se sugiri en el
histograma en la figura 2.13a, la serie es razonablemente simtrica. Por el contrario, es claro que la serie de inscripcin privada no lo es. Tiene una mediana
que est considerablemente por debajo de la media, un resultado tpico para una
serie con una cola superior larga. Adems, la estadstica de sesgo de 1.78 es
mucho mayor que 0.
Cualquiera de las series se aproximan de manera razonable a una distribucin normal? Para PRIVADA, es evidente que la respuesta es no, en vista de que
la kurtosis de 6.24 es considerablemente mayor que 3 (ms gruesa que las colas
normales) y la estadstica Jarque-Bera de 48.26 es mucho mayor que el valor
crtico de la distribucin ji cuadrada 5.99 (con un nivel de significancia del 5%).
Sin embargo, no podemos rechazar la suposicin de que PBLICA es aproximadamente normal. Aunque el histograma no refleja en forma directa la normal,
debemos tomar en cuenta el hecho de que, con slo 50 observaciones no esperaramos que la aproximacin fuera cercana en extremo. Adems, la kurtosis de
2.61 es cercana a 3 y la estadstica Jarque-Bera de 1.54 no es significativamente
diferente de 0 con un nivel de significancia del 5%.

APNDICE 2.1
Las propiedades del operador de expectativas

Este apndice revisa algunas de las propiedades tiles del operador de valor
esperado.
Resultado 1

E(aX + b) = aE(X) + b

donde X es una variable aleatoria, y a y b son constantes.

(A2.1)

CA
APITULO 2: Estad
dstica elemental: a revisin

Resultado
o28
Resultado 3

51

E[(aX)2] = a2E(X2)

(A2.2)

V
Var (aX + b) = a 2 Var (X)

(A2.3)

DEMOSTRACIN
N Por definiciin

Pero E(aX + b) = a E (X) + b, usando el resulltado 1. Por co


onsiguiente,
V (aX + b) = E[aX - E(aX
Var
X)] 2 = E[aX - aE(X)] 2
= E[a(X - E(X)))]2 = a2E[X - E
E(X)]2

por el
e resultado 2

= a2 Var (X)
Ahora, podem os usar el opeerador de valoor esperado p ara probar alg
A
gunos resultaados concerniientes a la covvarianza entrre dos variabl es aleatorias.
Resultadoo 4

Si X y Y son variablees aleatorias, entonces:


E
E(X + Y) = E(X)
E
+ E(Y)

Resultadoo 5
DEMOSTRACIN
N

(A2.4)

Var (X + Y) = Var (X
X) + Var (Y) + 2 Cov (X, Y))

(A2.5)

Var (X + Y)
Y = E[(X + Y)) - E(X + Y)]2
= E[(X + Y) - E(X) - E(Y)] 2

por el resu
ultado 4

= E[(X - E(X
X)) + (Y - E(Y
Y))) 2
= E[X - E(X))] 2 + E[Y-E((Y)] 2
+ 2E[(X - E(X
(X))(Y - E(Y)))]
= Var (X) + Var
V (Y) + 2 C ov (X, Y)
Resultado 6

Si X y Y son indepen dientes, entonnces E(XY) = E(X)E(Y).

8
Ntese que no
n es verdad que E(X2) = [E(X)]2. Para ver esto enn el caso ms simp
mple, supongamos
qu
ue X = 1 cuando
o aparecen caras en una moneda y X= 0 cuando apparecen cruces. Enntonces para una
1
1
2
1
2
1
2
1
moneda
m
legal, p1 = 2 y p0 = 2 ,dee modo que E(X
E ) = 2 (l ) + 2 (0 ) = 2 (l) = 12 . Sin embargo,

E(X) = 12 (1) + 12 (0) = 21 , y [E(X)]2 = 14 .

52

PAR
RTE UNO: Los fund
damentos del anlisis de regresin

Resultadoo 7
DEMOSTRACI
N

Si X y Y son indepenndientes, entoonces Cov (X,, Y) = 0.


COV (X, Y) = E[X-E(X
X)][Y -E(Y)]
= E[XY - E(X
X)Y - XE(Y) + E
E(X)E(Y)]
= E(XY)-E(X
X)E(Y)
= 0

por el resultado 6

Resultado
o8

donde
d
X es la media
m
muestrral de una var iable aleatori a con media y varianza 2x

D EMOSTRACIN
N

El resulttado 8 muestrra que la var ianza del esttimador de laa media X caee
conforme se incrementa
i
el tamao de la muestra.
m
Por tanto,
t
con mss informacinn,
cada vez obteenemos ms precisin
p
en nu
uestras estimaaciones de la media .
Resultad
do 9
DEMOSTRACI
N
sumatoria:

Primero,, consideremoos el trmino qque involucra al operador dee

CAPTULO
C
2: Estad
dstica elemental: a revisin

53
3

Por consiguuiente, tomanndo valores esperados da:

APNDICE 2.2
2
Es
stimacin de mxima
m
verosim
militud

Laa estimacin de
d mxima veerosimilitud see centra en el hecho de quee poblaciones
diferentes geneeran muestrass diferentes; cualquier muuestra que se est examinaando tiene maayor, probabiliidad de haberr provenido dee algunas poblaciones que
dee otras. Por ejjemplo, si unno estuviera tomando
t
mueestras de lanzamientos de
moonedas y se obtuviera
o
unaa media muesstral de 0.5 (representandoo la mitad de
caaras y la mitaad de cruces),, la poblacinn ms probable de la que se
s extrajo la
muuestra sera una
u poblacinn con una meedia de 0.5. La
L figura A2.1, ilustra un
caaso ms general en el que see sabe que unaa muestra (X1,,X2,. .. ,X8) fuee extrada de
unna poblacin normal
n
con vaarianza dada pero media dessconocida. Suupngase que
lass observacionnes provienen ya sea de la distribucin
d
A o de la distriibucin B. Si
la poblacin veerdadera fueraa B, la probabbilidad de quee hubiramoss obtenido la
muuestra mostrrada sera baastante pequ
uea. Sin em
mbargo, si laa poblacin
veerdadera fueraa A, la probabbilidad sera coonsiderablem
mente mayor. Por
P tanto, las
obbservaciones "seleccionan"
"
a la poblacin A como la que tiene maayor probabilid
dad de haber generado los datos observvados.

54

PA
ARTE UNO: Los fu
undamentos del an
nlisis de regresi
n

Figura A2.1

Estimacin
n de mxima
verosimilitud.

Definim
mos el estimaador de mxiima verosimilitud de un parmetro como
el valor de que sera ms probablle que generaara las obserrvaciones muustrales
observadas Y1, Y2, ..., YN. E
En general, sii Yi est distribbuida de form
ma normal y caada una
de las Y es extrada
e
en foorma indepenndiente, el esttimador de mxima
m
verosiimilitud
maximiza
P(Y1)p(Y2) p(YN)

donde cada p representa una probabillidad asociadaa con la distrribucin norm


mal. Por
tanto, la estiimacin de m
mxima verosimilitud calcuulada es una funcin
fu
de la muestra
m
particular dee Y elegida. U
Una muestra diiferente dara como
c
resultaddo una estimaacin de
mxima vero
osimilitud differente.
A menuddo se hace referrencia a P(Y1)p((Y2) p (Yn) coomo la funcin de verosimilitu
ud. Esta
funcin no slo
s
depende de los valorres mustraless sino tambin de los parmetros
desconocido
os del problema. Al describir la funcin de verossimilitud, a menudo
m
pensamos enn los parmetrros desconociidos como varriables mientrras que las Y soon fijas.
La estimacin por mxim
ma verosimilitu
ud implica unna bsqueda entre
e
estimaddores de
parmetros alternativos para enconntrar aquellos estimadorees que con mayor
probabilidad
d generan la muestra.
m
Para verr cmo puede aplicarse el principio de m
mxima verosim
militud, notam
mos que
si X est disstribuida en foorma normal con media y desviacin
n estndar (seccin
2.4.1),

donde exp representa laa funcin ex


xponencial. L
La funcin de
d probabilidad est
dada entonces por:

CAPT
TULO 2: Estadstic
ca elemental: a re
evisin

55

Tom
mando el logaaritmo de ambbos lados se produce
p
la funncin log-vero
osimilitud:
ln L = - N ln - N ln(2) 1 / 2 - (l/2 2 ) (X i - ) 2
Para obtenerr el estimadorr de mxima verosimilitud
v
de la media ,
notamos
que slo entra en el ltimo trmino, el cual
c
es preceddido por un signo negativoo. Por consigu
uiente, para m
maximizar el valor
v
de la fuuncin de verrosimilitud,
min
nimizamos (X
(X i - ) 2 , lo ccual se logra con el estimadoor de mnimoss cuadrados
X, la
a media mueestral. Resultta que si X esst distribuidda de forma normal,
n
la
meddia muestral es el estimaddor de mxim
ma verosimiliitud de la meedia poblacion
nal.
Para obtenerr el estimadorr de mxima verosimilitud
v
de 2, diferennciamos ln
L coon respecto a e igualamoos el resultaddo a 0, obteniendo

-N/ - 1/2 (X i - ) 2 (-2/ 3 ) = 0


Muultiplicando am
mbos lados poor - 3 / N, obttenemos comoo un estimadoor de la variannza poblacionnal a:

stee es un estimaador consistennte de la variaanza pero sessgado.

EJE
ERCICIOS
Algunas de las prreguntas siguieentes perteneceen al conjuntoo de datos del cuadro 2.1.
Estoos datos fueronn recopilados en una encuesta de estudiaantes de econoometra. Las
variiables estn deffinidas como
REN
NTA = renta m
mensual total enn dlares
NP = nmero de personas enn un departam
mento
NH = nmero de habitacionees
1 si ess mujer
SE
EXO=
0 si es hombre
D
DIST
= distanciia desde el cenntro del campuss en calles
RENTA
RPP
R =--------- = renta por perssona
NP
2.1 RPP
R es una meedida de renta ppagada por perso
ona. Mustresee que (RENTA//NP) = RPP
no es
e igual a RENT
TA/NP.

56

PARTE UNO: Los fundamentos del anlisis de regresin

CUADRO 2.1
DATOS DE RENTA
Renta

NP

NH

Sexo

$230
245
190
203
450
280
310
185
218
185
340
230
245
200
125
300
350
100
280
175
310
450
160
285
255
340
300
880
800
450
630
480

2
2
1
4

2
2
1
2
2
2
2
1
2
1
2
2
1
2
1
3
2
1
2
1
2
2
1
1
2
2
2
6
5
3
6
3

1
0
1
0
1

3
2
2
2
2
1
2
2
1
2
1
3
2
1
2
2
2
3
2
1
2
4
2
6
5
3
6
3

1
0
0
0
1
1
0
1
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
1
0
0
0

RPP = Renta/NP

Dist
7
24
0
24
4
6
8
8
42
8
3
60
24
36

$115.00
122.50
190.00
50.75
150.00
140.00
155.00
92.50
109.00
185.00
170.00
115.00
245.00
100.00
125.00
100.00
175.00
100.00
140.00
87.50
155.00
150.00
80.00
285.00
127.50
85.00
150.00
146.67
160.00
150.00
105.00
160.00

3
9
16
5
6
4
10
12
4
8
3
11
6
10
5
24
24

2.2 El resultado del ejercicio 2.1 sugiere que en general E(Y/X) E(Y)/E(X). Muestre que
para el siguiente ejemplo E(Y/X) es positivo y E(Y)/E(X) es negativo:
X = -4

Y= -8

Prob =

X=2

Y = 60

Prob =

1
2
1
2

2.3 Suponga que la RPP est distribuida en forma normal con media RPP y varianza
2RPP . Pruebe la hiptesis de que RPP = $135 con un nivel de significancia del 5% si a)
2RPP = 2 150 o b) 2RPP es desconocida. Ponga atencin particular a su eleccin de la
estadstica de prueba.
2.4 Ahora suponga que la RPP entre los hombres se distribuye en forma normal con
media mRPP y varianza (mRPP )2 . Tambin suponga que la RPP entre las mujeres se distribuye
f
f
en forma normal con media RPP y varianza (RPP )2. Pruebe la hiptesis de que
m
f
RPP = RPP con un nivel de significancia del 5% cuando se le da que 2f = 2m = 1 681.
RPP

RPP

CAP
PTULO 2: Estadsstica elemental: a revisin

57

m
2.5 (Difcil) Repitaa el ejercicio 2..4 asumiendo que
qu 2fRPP = 2m
v
comn
RP
PP pero que su valor
se desconoce.
2.6 En la parte a)) del ejercicio 2.3 asumimos que la RPP esstaba distribuidda en forma
norm
mal con media desconocida
d
RPPP y varianza co
onocida 2RPP = 2 150. Asumienddo, como lo
2
hicim
mos en la partee b), que o RPPP se desconocee, pruebe con un
u nivel de signnificancia del
5% que 2R PP =2 1550. Sugerencia:: Bajo la hipteesis de que 2R PPP =2 150, encu
uentre la distribuucin (N- 1)s2/2
/ 150, donde:

2.7 En el ejercicio 2.6 asumimos qque ( mRPP )2 = (fRPP )2. Pruebe eesta igualdad coon un nivel
de significancia
s
deel 5%.
2.8 Suponga que X es una variabble aleatoria diistribuida en foorma normal coon media x
y vaarianza 2x . Suupongamos quee Z = (X - x)//x es una variiable aleatoria nueva. Demueestre que Z est distribuida en
e forma norm
mal con media 0 y una varianzza de 1/N.
2.9 Suponga que X est distribuuida en forma normal con media
m
10 y variianza 625.
Enccuentre la probaabilidad de quee X 30.
2.100 Una monedaa es lanzada seiis veces. Ustedd desea probar la hiptesis dee que la probabiilidad de caras = probabilidadd de cruces = 12 . Cmo proocedera?
2.111 El coeficiente de correlacin muestra! enttre dos variablees X y Y se denoota (X, Y) y
est dado por:

Mueestre que si unoo estima las reegresiones


Y = a + bX
b
X = A + BY
B

el prroducto de los estimadores ppara b y B ser igual a r2XY


2.122 Si X est disttribuida en forrma normal conn media y vaarianza 2, encuuentre una
tran
nsformacin dee X que tenga laa distribucin ji
j cuadrada conn 1 grado de liibertad.
2.13
3 Demuestre que
q E(X)2 = (E((X))2 slo ocurrre si X toma unn solo valor co
on probabilidad 1.
2.144 Suponga quee 1 y 2 son vaariables aleatoriias independienntes, cada una con media
0 y varianza
v
2. Sup
ponga que obseerva a X1 yX2, loos cuales se relaacionan con 1 y 2 como
siguue:

donde p es una coonstante, -1 p 1.


a) Cul es laa covarianza enntre X1y X2? C
Cul sera la corrrelacin?
b) Cul es la
l media del ppromedio X = (X 1 + X 2 )/2 dde X 1 y X 2?
c) Cul es laa varianza del ppromedio X ? Evale
E
la variaanza de = -l, - 1 ,- 1 , 0, 1 ,
2
2
4
1 , 1.. Qu concluy
ye acerca de la precisin
p
de loss promedios muustrales cuanddo los datos
2
suby
yacentes no so
on variables aleeatorias indepeendientes?

58

PARTE UNO: Los fundamentos del anlisis de regresin

2.15 Suponga que es un agricultor interesado en la cantidad de lluvia que cae en sus
campos. Donde X denota la precipitacin pluvial anual en pulgadas y (por su modelo)
que X est distribuida en forma lognormal, esto es que loge X se distribuye en forma
normal con media x. Las cantidades observadas de lluvia para el periodo de 10 aos de
1988 a 1997 estn dadas como sigue:
Ao

Precipitacin

Ao

pluvial
1988
1989
1990
1991
1992

51.06
30.06
31.81
74.46
32.41

Precipitacin
pluvial

1993
1994
1995
1996
1997

35.48
30.42
33.09
30.39
41.08

a) Estime la media x y la varianza 2x de loge X.


b) Use una estadstica ji cuadrada para probar la hiptesis de que las cantidades de
precipitacin pluvial varan 20% por ao (es decir, que la varianza log 2x es igual a .04).
2.16 Usando los datos de rentas del cuadro 2.1, calcule la media, la mediana, el sesgo y
la kurtosis de la variable RPP. Usando estas estadsticas describa la distribucin de la
renta per capita en forma tan completa como sea posible.

CAPTULO

EL MODELO DE REGRESIN
DE DOS VARIABLES

En el captulo 1 describimos el mtodo de mnimos cuadrados como uno de los


medios posibles por el cual una curva puede ajustarse a los datos. Nuestra preocupacin era la estimacin del parmetro en lugar de las estadsticas de prueba
del modelo. En este captulo exponemos la prueba estadstica del modelo de
regresin de mnimos cuadrados con una variable dependiente y una variable
independiente. Primero describiremos las suposiciones subyacentes en el modelo, y luego analizaremos las propiedades estadsticas de los estimadores de mnimos cuadrados. Veremos que bajo ciertas situaciones los estimadores de
mnimos cuadrados son insesgados, consistentes y eficientes. La distribucin
de los estimadores de los parmetros ser usada luego para construir intervalos de
confianza y para probar hiptesis acerca del modelo. Para completar el captulo
introducimos R2, una medida del ajuste del modelo de regresin.

3.1

EL MODELO
Para explorar la naturaleza probabilstica del modelo de regresin, contaremos
con el hecho de que para un valor observado dado de X (la variable independiente),
podemos observar muchos valores posibles de Y (la variable dependiente). Como
un ejemplo considrese el consumo de un individuo que recibe un ingreso
de 20 000 dlares cada ao. Debido a que es probable que la cantidad de dinero
gastada en alimento vare cada ao, suponemos que para cada observacin X
(ingreso), las observaciones en Y (compras de alimento) diferir en forma
aleatoria. Para describir esta situacin de manera formal, agregamos un componente de "error" aleatorio al modelo, escribindolo como:
Yi = + Xi + i

(3.1)
59

60

PARTE UNO: Los fundamentos del anlisis de regresin

donde Y es una variable aleatoria, X es fija o no estocstica, y es un trmino de error

aleatorio cuyo valor se basa en una distribucin de probabilidad subyacente.


(Hemos cambiado nuestra notacin para usar las letras griegas y para representar el intercepto y la pendiente de la lnea; es decir, los parmetros de regresin, en vista de que nuestro modelo ahora contiene un trmino de error aleatorio. )
El trmino de error puede surgir por medio de la interrelacin de varias
fuerzas.1 En primer lugar, los errores aparecen debido a que el modelo es una
simplificacin de la realidad. Por ejemplo, asumimos que el precio es el nico
determinante de la demanda para un producto. Pero de hecho, diversas variables omitidas relacionadas con la demanda, como son gustos individuales, poblacin, ingreso y clima, pueden estar incluidas en el trmino del error. Si estos
efectos omitidos son pequeos, es razonable asumir que el trmino del error es
aleatorio. Una segunda fuente de error se asocia con la recoleccin y medicin de
los datos. Los datos econmicos y empresariales con frecuencia son difciles de
medir. Por ejemplo, una empresa individual puede no estar dispuesta a proporcionar informacin explcita de costos, de modo que no se obtendrn datos
sobre costos libres de errores. Dadas estas fuentes de error, nuestra decisin de
representar la relacin en la ecuacin (3.1) como estocstica, debera ser clara.
Para cada valor de X existe una distribucin de probabilidad de y por consiguiente una distribucin de probabilidad de las Y. Esto se describe en forma
grfica en la figura 3.1.
Ahora estamos en posicin de especificar por completo el modelo de regresin
lineal de dos variables enumerando sus suposiciones importantes.
1.
2.
3.
4.

La relacin entre y y X es lineal y est dada por la ecuacin (3.1).


Las X son variables no estocsticas cuyos valores son fijos.
El error tiene un valor esperado cero: E() = 0.
El trmino del error tiene una varianza constante para todas las observaciones; es decir, E(2) = 2.
5. Las variables aleatorias i son estadsticamente independientes. Por tanto,
E(i j) = 0, para todas las i j.
6. El trmino del error est distribuido en forma normal.
Las suposiciones 1 a 5 constituyen el modelo de regresin lineal clsico.
La ecuacin (3.1), a menudo, es denominada la especificacin del modelo.
Ntese que hemos asumido que Y se relaciona con X en lugar de viceversa.
Tambin, nos hemos restringido a una variable de la derecha. La suposicin de
que cada X es fija es equivalente a la suposicin de que cada variable independiente en cuestin es controlada por el investigador, quien puede cambiar su
valor de acuerdo con objetivos experimentales. Dicha suposicin es irreal en el
El trmino del error debe distinguirse del residual (^ i = Yi Y
i ) o la desviacin de la observacin de
la variable dependiente de su valor ajustado. Los errores se asocian con el modelo de regresin
verdadero, mientras que los residuales surgen del proceso de estimacin.
1

CA
APTULO 2: Estadstica elemental: a revisin

61

Figura 3.1
Modelo de regresin de dos variables.

esttudio de la maayor parte dee los problemaas empresariaales y econm


micos; se ha
heccho con propsitos de expoosicin.
La suposicin de que el ttrmino del errror tiene un valor
v
esperadoo de cero se
hacce en parte poor convenienccia. Para ver esto, se tiene que, el efecto promedio
de las variables omitidas es igual
i
a '; es decir, E(i) = '. Entoncees, podemos
esccribir el modeelo de dos variables como:

Por tanto, si el trmino del error tiene una


u media que no es cero,, el modelo
oriiginal sera eqquivalente al m
modelo nuevoo con un interrcepto diferennte pero con
un trmino del error tenienddo media cero
o.
Si el trminoo del error tienne una varianzza constante (ccomo se supu
uso antes), lo
llam
mamos homoocedstico, peero si la variaanza es cambbiante, lo llam
mamos error
hetterocedstico. La
L heterocedastticidad (en opossicin a la homoocedasticidad) puede surgir
si uno est exxaminando unna muestra representativva de empressas en una
inddustria. Puedee haber una raazn para creeer que los trm
minos de erroor asociados
con
n empresas muy
m grandes teendrn una vaarianza mayor que aquelloos asociados
con
n empresas peequeas. La fiigura 3.2 ilusttra dos casos dde heterocedasticidad. En
a) la
l varianza deel trmino del error disminuuye conforme se incrementaa el valor de
X, mientras que en la figura b)) la varianza de
d los errores se
s incrementaa con X.
La suposicin de que los errores corresspondientes a diferentes observaciones
sonn independienntes y por connsiguiente caarecen de relaacin es impo
ortante

62

P
PARTE
UNO: Los fundamentos
f
del anlisis
a
de regresin

Figura 3.22
Heteroced
dasticidad.

tanto en esstudios de seeries de tiem


mpo como en los de cortee transversal.. Cuando
los trminoos del error de diferentees observacioones estn correlacionad
c
os, decimos que el proceso de error
e
est corrrelacionado serialmente.
s
L figura 3.3 ilustra la
La
correlacin serial negatiiva y positivaa en un estuddio de series de tiempo (X
( t representa el valor de X en el momento t). La correllacin serial negativa
n
signnifica que
los errores negativos enn un periodoo estn asociados con errrores positivvos en el
siguiente, y viceversa, como en la figura 3.3a. Sin embargoo, cuando occurre una
correlacin serial positivva, como en la figura 3.33b, un error positivo en un
u periodo tender a estar asociaado con un errror positivo een el siguientte periodo.
Como un corolario de las suposiciones plannteadas 2 y 3,
3 estamos assumiendo
de manera implcita quue el trmin
no del error es independiiente de las X y por
consiguientte no est coorrelacionado
o con las X. Esto resultaa de la supossicin de
que las X noo son estocstticas. Entoncees,
E(X i i) = X iE(i) = 0
Necesitarem
mos esta supoosicin planteeada de mannera explcita cuando habllemos de
modelos enn los que lass X son estoccsticas. Adeems, la supo
osicin 3 noss permite
concluir quue el valor espperado de la suma de los errores en cualquier mueestra ser
idnticamennte cero; es decir,
d
E( i) = E(i) = 0
Esto resultaa de la suposiccin de que E(
E i) = 0, lo cuual implica qu
ue el valor espperado de
los trminoss del error asoociados con unna X particulaar sern idntticamente ceroo para un
muestreo reepetido de Y aasociadas con esa X. Fijamoos cada valor de X; luego extraemos
muestras para los errorres aleatorioss de una pooblacin con una distribuucin de
probabilidaad conocida. E
Entonces, el valor
v
que asum
mimos que ess idnticamentte cero es
el valor espeerado de cadaa una de estass muestras de ttrminos del error.
En la suuposicin 4, hhemos descritto que cada trmino del errror tiene una varianza
constante 2. Esta variannza es un parmetro desconnocido y debee esti-

CAPTUL
LO 3: El modelo de
e regresin de doss variables

63
3

Figura 3.3
Correlacin serial.

marse como parte


m
p
del moddelo de regressin. Por tantto, el modeloo de regresinn
d
descrito
aqu tiene
t
tres parrmetros desconocidos, miientras el moddelo de ajustee
d curvas del captulo
de
c
1 sllo tena dos. Las
L suposicionnes del modelo se han dadoo
e funcin dee la perturbaccin del errorr , pero con igual facilidaad podramoss
en
h
haber
escrito las
l suposicionnes en funcin de la distriibucin de proobabilidad dee
Y En este caso aparecerann como sigue:
Y.
3'. La variab
ble aleatoria Y tiene un vallor esperado + X:
E(Yi) = E( + Xi + i) = + Xi + E (i) = + Xi
4'. La variab
ble aleatoria Y tiene vrianzza constante.
5. Las varia
ables aleatoriaas Yi son indeependientes.

Para realizzar pruebas esstadsticas en el


e modelo lineeal, necesitam
mos especificarr
laa distribucinn de probabiliddad del trminno del error. En el modelo
o de regresinn
liineal normal clsico agregaamos la supossicin 6. Esta suposicin enn la que el tr-mino
m
del error est distribuuido en form
ma normal es importante para la pruebaa
estadstica
e
dell modelo. Si uno
u cree que los errores inndividuales soon pequeos e
in
ndependientes entre s, la suposicin dee normalidad es razonable.. Dado que ell
trmino del errror e est disttribuido en fo
orma normal, resulta que Y tambin est
distribuida
d
enn forma norm
mal (en vista de que Xi es una constan
nte, pero i ess
normal).
n

3.2

MEJOR ESTTIMACIN LINEAL


L
INSE
ESGADA
Para
P
examinarr las caractersticas de las estimacioness de los parm
metros de m-nimos
n
cuadraddos, recurdeese que resultan de una muuestra especffica de obser-vaciones
v
de laas variables dependiente
d
e independiennte. Entonces si la muestraa
puede
p
variar, las
l estimacionnes pueden vaariar tambinn y por tanto estn
e
asocia-

64

PARTE UNO: Los fundamentos del anlisis de regresin

das con una variable aleatoria.2 Debido a que el modelo es estocstico, hemos
mostrado las frmulas para el intercepto y pendiente de regresin como y
(donde los "sombreros" sobre y representan valores estimados), pero es
importante darse cuenta que la notacin sirve para un doble propsito: se
refiere a la estimacin de la pendiente resultante de una muestra especfica al
igual que al estimador (una frmula que se aplica a cualquier muestra) que sigue
una distribucin de probabilidad.
Esperamos que los estimadores de mnimos cuadrados ordinarios (OLS, por sus

siglas en ingls) sean insesgados y consistentes. De hecho, una de las propiedades


buenas del estimador de mnimos cuadrados ordinarios (el cual no requiere de
normalidad del trmino del error) es que de todos los estimadores que son
lineales [como en la ecuacin (3.1)] y que producen estimaciones insesgadas,
las estimaciones resultantes del estimador OLS tienen la varianza mnima. sta
es la base del teorema Gauss-Markov.
Teorema. Gauss-Markov- Dadas las suposiciones 1 a 5, los estimadores
y son los mejores (ms eficientes) estimadores lineales insesgados de y
en el sentido de que tienen la varianza mnima de todos los estimadores
lineales insesgados.
Para entender la importancia del teorema de Gauss-Markov, debemos notar
primero que (y ) es un estimador lineal, en vista de que puede escribirse
como un promedio ponderado de las observaciones individuales en Y. Hay una
gran cantidad de estimadores lineales posibles que podran usarse para estimar
el intercepto y la pendiente, y una porcin de estos estimadores ser insesgado.3
Sin embargo, tienen la propiedad adicional de que su distribucin de probabilidad tiene la varianza menor de todos los estimadores lineales que son
insesgados. El objetivo de hallar el mejor estimador lineal insesgado (BLUE, por sus
siglas en ingls) es uno que surgir una y otra vez en este libro. Veremos que si
ciertas de las suposiciones del teorema de Gauss-Markov no se cumplen, los
estimadores de mnimos cuadrados ya no sern BLUE. Nuestra meta ser entonces obtener un estimador distinto de los mnimos cuadrados que sea BLUE.
Es importante percatarse de que el teorema de Gauss-Markov no se aplica a
estimadores no lineales. Estos estimadores no lineales pueden ser insesgados y
tener una varianza inferior o un error cuadrtico medio inferior que un estimador lineal de mnimos cuadrados. Esto nos dice que, puede haber circunstancias en las que uno debera usar un objetivo distinto al "mejor estimador lineal
insesgado" cuando se seleccionan caractersticas de la estimacin. Por ejemplo,
2
Si seleccionamos una sola muestra de Y observaciones asociadas con los valores de la variable independiente, podemos obtener una "estimacin" de la pendiente de la regresin. Si replicamos el experimento con los mismos valores de X, obtenemos un nuevo conjunto de observaciones
en Y (debido a que las e diferirn en la muestra nueva) y por tanto una estimacin nueva de la
pendiente. Si extraemos muestras suficientes de Y, obtenemos una distribucin de estimadores de
la pendiente.
3
Vase el ejercicio 3.10 para un ejemplo.

CAPTUL
LO 3: El modelo de
e regresin de doss variables

65
5

lo
os estimadorees no lineales sesgados conn error cuadrtico medio mnimo
m
tienenn
varias
v
aplicaciiones tiles.
No intentaaremos demoostrar el teorem
ma de Gauss--Markov en este
e momentoo
(la prueba se encuentra enn el apndice 4.3), pero enncontraremoss expresioness
para
p
la mediaa y la varianzza de los estiimadores de mnimos cuaadrados. Paraa
simplificar
s
traabajaremos coon los datos en
e forma de desviaciones.
d
A partir de
d la ecuacinn (3.1), se recordar que Yi = + Xi + i . Sumandoo
todas las N obbservaciones y dividiendo entre N, encoontramos quee:
(3.2))

ddonde repreesenta la meddia muestral del


d trmino deel error. Restaando la ecua-c
cin
(3.2) de la
l ecuacin (33.1) y combinnando trminos se obtiene:

o
(3.3))

no ser iguaal a 0 en la muuestra, aun cuaando E(i) = 0.


0 Sin embargo
o, la ecuacinn

(3.3) slo se usar


u
cuando derivemos reesultados conncernientes all sesgo de loss
e
estimadores.
P consiguiennte, para simpplificar hacem
Por
mos la suposiccin implcitaa
d que = 0 y escribimoss el modelo en
de
n forma de desviaciones
d
(descrita en ell
c
captulo
1) com
mo:
yi = X
Xi + i

(3.4))

La recta de reggresin verdaadera es E(yi) = Xi. La penndiente estimaada de la rectaa


L
e
es:
(3.5))

Debido a que yi es una variable aleattoria, tambiin ser aleatooria, de modoo


qque es naturall determinar las
l propiedaddes de la distrribucin de . Los detalless
s relativameente sencilloss, pero en virttud de que sonn algo tediosoos, los hemoss
son
d
dejado
al apnndice 3.1. Lass pruebas dep
penden sobre todo de los resultados quee
innvolucran loss operadores de sumatoriaa y valor espeerado, como se
s describe enn
los apndices 1.1. y 2.1, ass como de laas suposicionees del modeloo de regresinn
lineal clsico. El primer ressultado es quee:

E ( ) =
de
d modo que es un estimaddor insesgado de .

(3.6))

66

PAR
RTE UNO: Los fun
ndamentos del an
lisis de regresin

El segunddo resultado ees que


(3.77)

dde modo que la varianza dde depende slo de la vaarianza del errror, la varianz de las X y el nmero dee observacionnes. Adems, la media y laa varianza del
za
e
estimador
dell intercepto soon: (Vase ejeercicio 3.11)
(3.8)
(3.9)

P ltimo, laa covarianza entre y est


Por
e dada porr:
(3.100)

Con inforrmacin respecto a las meedias y variannzas de los estimadores dee


mnimos cuad
m
drados y su ccovarianza, esstamos listos para exponerr la prueba est
tadstica
del modelo
m
lineal. Para hacerlo,, necesitamos la suposicin
n 6, un trminoo
d error disstribuido en forma normaal. Primero, observe, ya que es unn
del
p
promedio
ponnderado de lass y y en vista de que las yi estn distribuuidas en formaa
n
normal,
el estimador estarr distribuido en forma norm
mal. (Una com
mbinacin lineaal

dde variables independiente


i
es distribuidaas en forma noormal estar distribuida enn
f
forma
normaal.) Aun si laas y no estnn distribuidass en forma normal,
n
puedee
m
mostrarse
quee la distribuciin de es assintticamentee normal (bajjo condiciones
r
razonables)
recurriendo all teorema dell lmite centraal de la estad
dstica.4 Resuu5
m
miendo,
(3.11)
(3.12)
(3.13)

4
Hablando aproximadamennte, el teorema deel lmite central eestablece que la distribucin de la
m
media
muestral de
d muestra de vvariables indepenndientes tender hacia la normalidad conforme el
e

ttamao de la mueestra se vuelve innfinitamente grannde. Se aplica a debido a que es una combinaac lineal de las yi.
cin
5

La ecuacin (3.11) dice quue sigue una distribucin norm


mal con una med
dia y una variannza

/x 2i .

CAPTULO 3: El modelo de re
egresin de dos variables
v

67

Ntese que la varianza dde vara en forma directaa con la varian


nza de . Por
tannto, siendo igguales otras coosas, es probaable que obtenngamos estim
maciones ms
prrecisas de la pendiente
p
cuaando la varian
nza del trmiino del error es pequea.
Sin embargo, la
l varianza dde vara inv
versamente ccon xi2. Por tanto, entre
maayor es la variianza de Xi, ess probable quee le resulte meejor la estimaccin de . De
heecho, ser diffcil determinnar la pendieente con preecisin cuanddo los datos
mu
ustrales en las
l X estn lim
mitados a un intervalo peqqueo.
La varianzza de alcannza su mnim
mo de 2/N cuuando la meddia de X es
idnticamente cero.
c
Tambinn observe quee el signo de la
l covarianza de y es
oppuesto en sign
no a X .Si laa media de X es positiva, ppor ejemplo, es probable
quue un sobrestiimado de eest asociado con un subestimado de .
El anlisis no
n est completo, ya que necesitamos
n
oobtener un estiimador de la
vaarianza poblaccional 2. Usaaremos el siguuiente estimaddo muestral dee la varianza
veerdadera 2:
(33.14)
do
onde i = Yi i es residual dde la regresin
n. La varianza residual s2 es un estimador
inssesgado al iguual que consistente de la varrianza del erroor, (s, y en ocaasiones SER,
po
or sus siglas enn ingls, es llam
mado error esstndar de la rregresin.) El lector podra
2
preeguntarse por qu la suma de los residuuales al cuadra
rado i fue diividida entre
N - 2 para obbtener un esttimador insesgado de la varianza veerdadera. La
respuesta es que mientras haay N puntos dee datos, la estiimacin de laa pendiente y
el intercepto pone dos restriccciones en los datos.
d
Esto deeja N - 2 obserrvaciones sin
restricciones coon las cuales eestimar la varrianza residuaal. Por esta razzn, se hace
referencia al diivisor de N - 2 como el n
mero de graddos de libertaad.
Con una esstimacin de 2, podemos reegresar a las ecuaciones
e
(3.11) a (3.13)
paara obtener unna estimacinn de la covarianza y estimaaciones musstrales de las
vaarianzas asociiadas con los parmetros estimados
e
y . Cada unaa se enlista a
coontinuacin:
(3.15)

(3.16)

(3.17)
S y S , los errrores estndaar de los coefiicientes estimaados y , reespectivamente,, proporcionann una medidda de la disspersin de llos estimadores alrededor
dee sus medias (como
(
lo haceen los estimadoores mustralees de las varian
nzas). No

68

PA
ARTE UNO: Los fu
undamentos del an
nlisis de regresi
n

deben confuundirse con el error estndaar de la regressin s, el cual mide la dispersin del trm
mino del errorr asociado coon la recta de regresin.

EJEMPLO
O 3.1

Promedio de calificaciones

Reconsidrese el ejemploo del promedio


o de calificacciones del cap
ptulo 1. La reelacin estimadda entre el proomedio de callificaciones Y y el ingreso familiar X eraa

Los clculoss que nos perrmiten determ


minar s2 se prroporcionan en
e el cuadro 3.1
(vase el cuuadro 1.2 parra los detallees preliminarees). En este caso s, el errror
estndar de la
l regresin, es igual a 0.333. Esto representa el 11% de la media del
promedio dee calificacionees. (Entre mennor sea el cocciente de s con la media dee la
variable deppendiente, se ajustan en fo
orma ms esttrecha los dattos a la recta de
regresin.) En
E vista de quue x2i = 162, es fcil calcuular el error esstndar de . De
manera espeecfica,

Del missmo modo, puede


p
usarse la ecuacin (3.16) para calcular
c
el errror
estndar de como 0.3688. Suponienndo errores noormales, deteerminamos quue
est distribu
uida en formaa normal con media
m
0.12 y desviacin estndar
e
0.0266 y
que est distribuida
d
en forma normaal con media 1.375 y desv
viacin estnddar
0.369.

CUADRO 3.1
2
CLCULO DE s
Clculos del prromedio de calificaciones

CAPTULO 3: El modelo de regresin de dos variables

3.3

69

PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA


Dado el conocimiento de las distribuciones de y , es posible construir intervalos de confianza y probar hiptesis concernientes a los parmetros de regresin. Los intervalos de confianza proporcionan un rango de valores que es probable que contengan los parmetros de regresin verdaderos. Con cada intervalo
de confianza asociamos un, nivel de significancia estadstica; Los intervalos de confianza se construyen de modo que la probabilidad de que el intervalo contenga el
parmetro de regresin verdadero sea 1 menos el nivel de significancia.
Los intervalos de confianza son tiles en particular para probar hiptesis
estadsticas acerca de los parmetros de regresin estimados. Comenzamos con
una hiptesis nula, la cual, por lo general, establece que un cierto efecto no est
presente. Debido a que frecuentemente esperamos "aceptar" el modelo, la hiptesis nula se construye de tal manera que pueda hacer posible su rechazo.
Para probar la validez de un modelo establecemos la hiptesis nula de que es
igual a 0. Esperamos rechazar la hiptesis nula obteniendo un valor de que sea
suficientemente diferente de 0 para arrojar una duda significativa sobre la
hiptesis de que es igual a 0. Supngase, por ejemplo, que es 0.9. Si elegimos
un nivel de significancia del 10%, el intervalo de confianza del 90% para
podra ser:
.6 < < 1.2

Esto significa que la probabilidad de que est dentro del rango 0.6 a 1.2 es
0.90. Adems significa que podemos rechazar la hiptesis nula de que es igual a
0 con una confianza del 90%.
En la prueba de hiptesis debe elegirse alguna regla de aceptacin y rechazo.
Con frecuencia se usa una regla que implica el nivel de significancia del 5%, el
cual usa un criterio de que el rechazo de la hiptesis nula cuando es verdadera
debera ocurrir menos del 5% del tiempo. La eleccin del nivel de significancia
depende de la importancia relativa de dos fuentes de error. La prueba de hiptesis en la econometra clsica trata casi en forma exclusiva con el problema de
rechazar en forma incorrecta una hiptesis verdadera (un error Tipo I). Debido a
la naturaleza de las hiptesis probables que son especificadas, las hiptesis
alternativas a menudo se definen mal, dificultando juzgar el nmero de veces
que uno aceptara la hiptesis nula cuando de hecho es falsa (un error Tipo II).
Por esta razn, a menudo afirmaremos que una hiptesis nula ha sido rechazada
con un nivel de significancia del 5% mientras dejamos implcita la aceptacin de
la hiptesis alternativa.
Examinar la estadstica de prueba y los errores estndar de los coeficientes
en forma cuidadosa es una norma en el trabajo economtrico aplicado. Cuando el
rechazo de la hiptesis nula es vlido, por lo general, el modelo es aceptado, al
menos hasta que se disponga de mayor informacin que muestre lo contrario. El
nivel de significancia necesario para la aceptacin del modelo vara en forma
considerable entre los investigadores y entre los tipos de modelos que se estn
investigando. Por ejemplo, un modelo estimado con un gran nmero de obser-

70

PAR
RTE UNO: Los fun
ndamentos del an
lisis de regresin
n

vaciones pueede, permitirlee a uno rechaazar hiptesiss nulas de coeeficientes cero


para muchas variables exp
plicativas. Porr tanto, podraamos elegir, seleccionar un
n
nivel de signiificancia algo
o inferior paraa hacer ms d
difcil el rechaazo de la hip
tesis nula.

3.3.1

Prruebas sob
bre coeficien
ntes de regresin

La prueba estadstica para rrechazar hipttesis nulas aso


ociadas con un
n coeficiente de
d
regresin, po
or lo general, se basa en la distribuciin t. La disstribucin t es
e
relevante deb
bido a que paara la prueba estadstica necesitamos uttilizar un estiimado muestraal de la varian
nza del error en
n lugar de su v
valor verdaderro. Para usar la
distribucin t para consstruir intervaalos de conffianza del 95%
9
para lo
os
parmetros estimados, priimero estandaarizamos el parmetro de regresin
r
estiimado, digamo
os , restando
o su valor verd
dadero hipottiico 0 y dividindolo entre el
e
estimador dee su error estndar. Esto puede
p
verse con mayor faccilidad cuand
do
consideramoss la hiptesis n
nula de que = 0 o, de man
nera equivalen
nte, que no haay
relacin entree las variabless X y Y en el modelo
m
de do
os variables. En
E este caso la
l
estadstica t est
e
dada por::

Si la estadstiica t es mayorr que tc, en magnitud,


m
a el valor crtico rechazamos lla
hiptesis nula. En vista de que tc = 1.96 para muesstras grandes y un nivel de
d
significancia del 5%, unaa regla empriica frecuente es que un vaalor t con un
na
magnitud de 2 o mayor no
os permite recchazar la hip
tesis nula.
De maneera ms generaal, podemos probar
p
la hip
tesis nula de que = 0. Para
hacerlo, calcu
ulamos la estaadstica t:
3.18)

La variable esstandarizada tN-2 tambin sig


gue una distrib
bucin t con N - 2 grados de
d
libertad. El valor
v
crtico ees definido, en
n una prueba del 5%, de modo
m
que:
P
Prob
(-tc< tN-2 < tc) = .95

(3.19
9)

donde Prob significa probaabilidad.


Ahora, su
ustituyendo d
de la ecuacin (3.18) obteneemos:
(3.20
0)

CAPTULO 3: El modelo de re
egresin de dos va
ariables

71

Moodificando liggeramente la eecuacin (3.2


20),
(3.21)
Dee la ecuacin (3.21) obteneemos un intervvalo de confiaanza del 95%
% para :
(3.22)
Ussando un procedimiento sim
milar, obtenem
mos un intervaalo de confiannza del 95%
parra :
(3.23)

Es posible determinar
d
inttervalos de coonfianza para cualquier niv
vel de significancia en tantoo el valor crticco de la distrib
bucin t sea eelegido en form
ma correcta.
Lo
os intervalos de
d confianza para
p los parm
metros desconnocidos nos prroporcionan
unaa afirmacin estadstica acerca
a
del ranngo de valorees, que es prrobable que
conntenga el parmetro verdaddero. Por tantto, la ecuacin (3.22) nos dice que un
intervalo de tc deesviaciones esstndar a ambbos lados del estimador
e
de la
l pendiente
tiene una probaabilidad de 0.95 de contener el parmettro verdadero
o.
En ocasionees los anlisis economtricoos proporcionnarn informaccin adicionall en forma dee un valor p. Un
U valor p deescribe el niveel de significaancia exacto
asoociado con unn resultado ecconomtrico. Por tanto, unn valor p de 0.07 indica
quee un coeficiennte es estadstticamente signnificativo en uun nivel 0.07 (pero no en
un nivel del 5%
%). En este casso el 7% de laa distribucinn t se encuentrra afuera de
un intervalo de tc desviacionnes estndar del
d estimador de la pendiennte.

EJEMPLO 3.1

(co
ontinuacin) Prromedio de calificaciones

Parra probar el parmetro


p
de la pendiente en el ejemploo del promediio de calificacciones, podem
mos usar los cclculos hechoos en la expossicin inicial del
d ejemplo
3.1
1. Comenzam
mos seleccionaando un nivell de significanncia, en este caso
c
el 5%.
Luuego encontram
mos el valor crtico
c
de la distribucin
d
t (de la tabla 3 al final del
libro) asociado con una probbabilidad de 0.05
0
y 6 grados de libertadd (hay ocho
obsservaciones y dos parmettros estimadoss). En este caaso,
t c = 2..447

Enntonces, un inntervalo de coonfianza del 95% para el parmetro dee pendiente


serra:

72

PARTE UNO: Los fun


ndamentos del an
lisis de regresin

Adems,

Observamos que 0 se encuuentra afuera


a del intervaloo de confianzaa del 95% parra
, lo que noss permite rechhazar con un nivel
n
de signifficancia del 5%,
5 la hiptesis
nula de que = 0. De mannera equivalen
nte, podemos observar que el valor calcuulado de t (4.66) es mayor qque el valor crtico
c
de 2.455 y de nuevo rechazamos la
l
hiptesis nulla.

EJEMPLO
O 3.2

Gastos de con
nsumo

Supngase que
q deseamos construir un modelo de doos variables que
q explique el
valor en dlaares de los gaastos de conssumo agregaddos C, medidos en miles de
d
millones de dlares
d
(ajustaados estacionalmente).6 Coomo una variaable explicativva
usamos el ing
greso disponibble personal agregado
a
Y, m
medido en miles de millonees
de dlares (aajustados estaacionalmente). Cuando C ees regresado sobre
s
Y usanddo
datos trimesttrales del prim
mer trimestree de 1959 al segundo trim
mestre de 1995,
obtenemos el siguiente resultado (los errores
e
estnddar estn entree parntesis):

En este caso
o, el interceptto de -27.53 es significativvo con un niivel del 5% ((la
estadstica t es -6.18 [-27.53/4.45]). Dee mayor impoortancia, la esstadstica t asoociada con el coeficiente de
d ingreso disponible es 5517 (0.93/0.00018). Podemoos
rechazar conn claridad la hiptesis nulla de una incclinacin ceroo a favor de la
hiptesis alteernativa de quue la pendien
nte no es ceroo. El rechazo de la hiptessis
nula nos perm
mite aceptar, al menos en forma
f
provisioonal, el modeelo de regresin
de dos variaables. Por suupuesto, una mayor investtigacin podrra permitirnoos
encontrar un
n modelo de ggastos de con
nsumo agregaados que sea ms adecuaddo
que el que see acaba de deescribir.
Supngaase (para proppsitos ilustraativos) que rem
mplazamos Y como una variable explicaativa por unaa variable aleaatoria. (Elegim
mos una variable X que fuue
extrada cadda vez de unna distribuci
n normal coon una mediaa de 50 y unna
varianza de 25.) Entonces, esperaram
mos que aproxximadamente 1 vez en 20 el
coeficiente en
e la variablee X sera signnificativamentte diferente de cero (con uun
nivel de signnificancia del 5%). Encontrramos que tom
m 22 ensayos antes de quee
6
Este ejem
mplo usa datos suuministrados por la base de datos Citibase. Los daatos originales (G
GC
y GYD) estn ajjustados estacionaalmente a tasas anuales.
a

CAPTULO
O 3: El modelo da regresin de dos variables
v

73

see obtuviera unn coeficiente significativam


mente negativo. Esto mueestra que sin
im
mportar cun confiable
c
o caarente de conffiabilidad seaa un estimadorr estadstico,
sieempre hay una posibilidad estadstica dee que uno har inferencias inncorrectas al
baasarse en los resultados
r
de regresin.

3.4

ANLISIS DE
E VARIANZA
A Y CORRE
ELACIN
3..4.1

Bon
ndad de aju
uste

Loos residuales de regresinn pueden prooporcionar unna medida til del ajuste
en
ntre la lnea de
d regresin eestimada y loss datos. Una buena
b
ecuacin de regresi
n es aquella que ayuda a explicar una proporcin
p
grrande de la vaarianza de Y.
Loos residuales grandes
g
impliican un ajustee deficiente, m
mientras que loos residuales
peequeos implican un buen ajuste. El prooblema con eel uso de residduales como
unna medida de la bondad de ajuste es que su valor depeende de las unnidades de la
vaariable dependdiente. Para eencontrar unaa medida de bbondad de ajuuste que est
lib
bre de unidad
des, parece raazonable usarr la varianza rresidual divid
dida entre la
vaariacin de Y.
Nu
uestra meta ess dividir la varriacin de Y enn dos partes, la
l primera expplicada por la
eccuacin de reegresin y la segunda asoociada con laa porcin ineexplicada (el
trrmino del erroor) del modello. Supngasee primero quee se sabe que la pendiente
deel modelo de regresin
r
lineeal es 0 y ajusttamos una reggresin estimaando slo un
inttercepto. Entoonces la mejoor prediccin para Yi asociiada con cualq
quier Xi est
daado por la meedia muestral de Y:

Enn este caso esspecial podem


mos concluir que
q la variacin de Y mide el cuadrado
dee la diferenciia entre los vvalores obserrvados Yi y los
l valores prronosticados
Yi=Y
.
Cuando la pendiente noo es cero poddemos mejoraar nuestras prredicciones
exxplicando que Yi es dependiiente de Xi,

Laa informacinn adicional reeducir la porrcin inexpliccada de la varriacin en Y.


Paara ver esto, considrese
c
la siguiente idenntidad, la cual se cumple para
p todas las
obbservaciones:

(3.24)

74

PA
ARTE UNO: Los f undamentos del anlisis
a
de regresi
n

El trmino a la izquierd
da del signo de igualdad denota la differencia entree el
valor muesttral de Y y laa media de Y,
Y el primer trmino de la
l derecha daa el
residual ^ i, y el segundo
o trmino de la derecha daa la diferenciia entre el vaalor
pronosticado
o de Y y la m
media de Y. Esto se describee en la figura 3.4.
Para meedir variacin
n, elevamos al
a cuadrado am
mbos lados de
d la ecuacin
n
(3.24) y luego sumamos todas las observaciones i = 1, 2, ..., N:

Puede mosttrarse que el


ltimo trmin
no en la ecuaacin (3.25) es
e idnticameente
0 usando do
os propiedadees de los resiiduales de m
mnimos cuadrrados, ^ i = 0 y
^i Xi = 0. Las
L derivacion
nes aparecen en
e el apndicee 3.2. Resultaa que

vaariacin total de Y
(o suma de
cuaadrados del totall)

TSS

variacin residual
de Y (o suma de
cuadrado
os del error)

ESS
E

variacin expplicada
de Y (o sum
ma de
cuadrados de la
regresinn)

RSS

(3.2
26)

Para normallizar, dividim


mos ambos lad
dos de la ecuaccin (3.26) en
ntre la suma to
otal
de cuadrado
os para obteneer:

Definim
mos la R cuadrrada (R2) de laa ecuacin de regresin com
mo:

(3.27
7)

R2 es la prop
porcin de laa variacin tottal en Y explicada por la reegresin de Y en
X. Ya que laa suma de cuaadrados del errror vara en valor
v
entre 0 y el total de la
l
Figura 3.4
4

Descomp
posicin de Yi.

CAPTULO
O 3: El modelo de rregresin de dos variables
v

75

suuma de cuadraados, es fcil ver que R2 vara


v
en valorr entre 0 y 1. Una R2 de 0
occurre cuando el modelo de regresin lineeal no hace naada para ayud
dar a explicar
laa variacin enn Y. Esto pueede ocurrir cuuando los vaalores de Y see encuentran
alleatoriamentee alrededor de
d la lnea ho
orizontal Y = Y o cuandoo los puntos
m
mustrales
se encuentran
e
enn un crculo (figura 3.5b).. Una R2 de 1 slo puede
occurrir cuandoo todos los puuntos mustraales se encuenntran en la lnnea de regresin estimada (figura
(
3.5a).
Para relacioonar R2 con loos parmetros de regresin eestimados conn anterioridad
en
n este captuloo, escribimos los valores prronosticados dde yi como:

Luuego, cada ob
bservacin de la variable deependiente puuede subdividdirse como:

doonde ^i es el residual
r
de la regresin. Ah
hora,

dee lo cual resullta que:

La ecuacin (3.28)
(
proporrciona una frrmula simple para calcularr R2.

Figura 3.5

Medicin de R cuadrada.

76

PARTE UNO: Los fundamentos del anlisis de regresin

Observe que R2 slo es una estadstica descriptiva. Hablando en forma


aproximada, asociamos un valor alto de R2 con un buen ajuste de la lnea de
regresin y asociamos un valor bajo de R2 con un mal ajuste. Debemos darnos
cuenta, sin embargo, de que un valor bajo de R2 puede ocurrir por varias razones
relacionadas. Esto es, en ciertos casos X puede no ser una buena variable explicativa. Aun cuando hay razn para creer que X ayuda en la prediccin de Y, la
variacin inexplicada en Y puede permanecer aun despus de que X ha aparecido
en la ecuacin. En estudios de series de tiempo, sin embargo, a menudo obtenemos valores altos de R2 simplemente porque es probable que cualquier variable
que crece con el tiempo haga un buen trabajo explicando la variacin de cualquier otra variable que crece con el tiempo. En estudios de cortes transversales,
por el contrario, puede ocurrir una R2 baja aun si el modelo es un satisfactor
debido a la variacin grande a travs de unidades de observacin individuales.7
En ocasiones es til resumir el desglose de la variacin en Y en funcin de
un anlisis de varianza. En tal caso, el total de las variaciones inexplicada y explicada en Y son convertidas en varianzas, dividiendo entre el nmero apropiado de
grados de libertad.8 Por tanto, la varianza en Y es la variacin total dividida entre
N - 1, la varianza explicada es igual a la variacin explicada (puesto que la
regresin slo involucra una restriccin adicional adems de la usada para estimar la media de y), y la varianza residual es la variacin residual dividida entre
N - 2.

3.4.2

Correlacin

Debido a que R2 tiene valor para analizar un modelo con una relacin causal
entre la variable dependiente Y y la variable independiente X, R2 es interpretada
como ms que una medida de correlacin entre dos variables. Las tcnicas de
correlacin no involucran una suposicin implcita de causalidad, mientras que
las tcnicas de regresin s. En el captulo 1 vimos que la eleccin de las variables dependiente e independiente en un modelo de regresin es crucial. La variable dependiente es la variable que se va a explicar, mientras que la variable
independiente es la fuerza motriz. La tcnica de mnimos cuadrados es apropiada
slo si la estructura causal del modelo puede determinarse antes de que los datos
sean examinados. Si se especifica un modelo Y = + X, uno puede interpretar
una estadstica t significativa en el parmetro de pendiente de regresin como
evidencia tendiente a validar el modelo. Por el contrario, una estadstica
insignificante lo invalidara.
7
Esto sugiere que R2 sola puede no ser una medida adecuada del grado en que es satisfactorio
un modelo. Una medida general mejor podra ser una estadstica que describa el poder predictivo del
modelo frente a datos nuevos.
8
El nmero de grados de libertad es el nmero de observaciones menos el nmero de restricciones colocadas en los datos por el procedimiento de clculo. Por tanto, una estimacin de la variacin en Y implica N - 1 grados de libertad debido a que se coloca una restriccin en los datos cuando
se miden las desviaciones alrededor de la media muestral (la cual en s misma debe ser calculada).
Un grado de libertad adicional se usa en el clculo del parmetro de pendiente, dejando N-2 grados
de libertad asociados con la variacin inexplicada en el problema.

CAPTULO
O 3: El modelo del regresin de dos variables
v

77

Como un ejemplo
e
de coorrelacin sin
n causalidad, considrese una serie de
obbservaciones a lo largo del tiempo que podran
p
haberrse obtenido en
e un estudio
deel siglo XIX de
d medicina en
e frica. Uno
o podra encoontrar una corrrelacin alta
en
ntre el nmero
o de doctores presentes en una regin y la frecuencia de enfermedaades en esa reegin, pero seera errneo inferir
i
que la presencia dee doctores es
un
na causa de laa propagacinn de enfermedades.
Por tanto, las correlacioones altas noo establecen uuna inferenciia de causalid
dad. Uno debee especificar a priori (basad
do en informaccin previa) quue el nmero
dee doctores en una regin es
e una funcin de la frecuuencia de enfeermedades y
prrobar estadsticamente si se mantiene un
na relacin ass, si uno usa la regresin
enn forma correcta. Las tcniicas de correllacin, a mennudo, se usan para sugerir
hiptesis o parra confirmar sospechas que
q se tenann con anteriooridad. Tales
prrocedimientoss son aceptabbles en tantoo uno no infiiera causalidaad en forma
directa a partir de
d los datos. H
Hay numerosoos casos en ecconoma, com
mercio y otros
caampos en los que
q dos variabbles se correlaacionan en forrma alta pero ambas estn
deeterminadas por
p una tercerra variable suubyacente. Cuando ste es el caso, la
vaariable subyaccente debera aparecer en ell modelo de regresin
r
com
mo la variable
inndependiente.
Qu le su
ucede al parm
metro de pen
ndiente de la rregresin cuaando se hace
unna especificaccin causal inncorrecta? Com
mparemos loss parmetros de
d pendiente
associados con los
l siguientess modelos de regresin:

Lo
os estimadorees de mnimoos cuadrados de
d b y B son

Laas dos pendientes producirn conclusionnes idnticas acerca


a
de la reelacin entre
el movimiento en
e X y el movvimiento en Y slo
s si b = 1/B
B, o de maneraa equivalente
si R2 = 1 (vasee ejercicio 3.44). As tenemoos que, la elecccin de especcificacin del
modelo
m
de regrresin afectarr a nuestras estimaciones de los parm
metros y prediicciones.

3.4.3

Pru
ueba de la e
ecuacin de regresin
n

Ell procedimiennto de subdivvidir la variaccin en Y en ddos componeentes sugiere


unna prueba estaadstica de la existencia dee una relacinn lineal entre Y y X. Consid
drese el siguuiente cocientee:

78

PARTE UNO: Los fundamentos del anlisis de regresin

Siendo iguales otras cosas, esperaramos que una relacin estadstica fuerte
entre X y Y resultar en una razn grande entre varianza explicada e inexplicada. Esta prueba puede aplicarse en forma directa debido a que F1,N - 2 sigue la
distribucin F con 1 y N - 2 grados de libertad. Los subndices en F describen el
nmero de grados de libertad en el numerador y el denominador, respectivamente. El valor de la estadstica F ser 0 slo cuando la varianza explicada en la
regresin es 0. Uno asocia un valor bajo con una relacin (lineal) dbil entre X
y Y y un valor alto con una relacin (lineal) fuerte. Afortunadamente, la distribucin numrica de la estadstica F es conocida (vase tabla 4 al final del libro
para la distribucin F). Por ejemplo, rechazaramos la hiptesis nula de ninguna
relacin entre Y y X con un nivel de significancia del 5% buscando el valor crtico
apropiado de la distribucin F (significancia del 5%) con 1 y N - 2 grados de
libertad. Si el valor de F1,N - 2 calculado a partir de la regresin es mayor que el
valor crtico, rechazamos la hiptesis nula en el nivel del 5%. Si el valor de
F1,N - 2 es menor que el valor crtico, no podemos rechazar la hiptesis nula.
La prueba F guarda una relacin estrecha con la prueba t asociada con la
2
hiptesis nula de que = 0. De hecho, F1,N - 2 = t N - 2 para cualquier nivel de
significancia. Se ha introducido aqu la prueba F debido a que ser til para
pruebas conjuntas de hiptesis, incluyendo pruebas de significancia de ecuaciones de regresin mltiple.

EJEMPLO 3.3

Ventas de automviles al menudeo

Se realiz un estudio de la relacin entre las ventas de automviles al menudeo


(variable dependiente) y el nivel de sueldos y salarios agregados en la economa
(variable independiente).9 Uno esperara que un nivel superior de sueldos y
salarios conducira a un incremento en las ventas de automviles. Lo siguiente es
un resumen de la regresin de las ventas al menudeo sobre los sueldos y
salarios usando datos de series de tiempo trimestrales. La ecuacin que se va a
estimar es:
S = + W +
donde, S son las ventas trimestrales de automviles al menudeo, del primer
trimestre de 1959 al segundo trimestre de 1995, en miles de millones de dlares
y W son los sueldos trimestrales para el mismo periodo en miles de millones
de dlares. La recta de regresin ajustada se muestra a continuacin. Se ha
incluido la estadstica t entre parntesis debajo de los coeficientes estimados
y colocado un "sombrero" arriba de la variable dependiente como un recordato-

9
Los datos fueron proporcionados por la base de datos Citibase. Las variables son gastos de
consumo personal trimestrales en automviles nuevos, ajustados estacionalmente (GCDAN) y sueldos
y salarios agregados, ajustados estacionalmente (GWY).

CAPTULO
O 3: El modelo de regresin
r
de dos variables
v

79

rioo de que la ecuacin


e
se uusa para calccular valores estimados dee la variable
deependiente.

La constannte positiva (reepresentando el trmino deel intercepto) implica que,


hiipotticamentte, si no hubieera sueldos en un mes detterminado, loos individuos
an comprarann automviless. Puede interppretarse que ell coeficiente de
d la variable
dee sueldos signnifica que un incremento de
d mil millonees de dlares en sueldos y
saalarios conduccir a un increemento de 30
0.8 millones de
d dlares en las
l ventas.de
auutomviles. (E
El modelo poddra usarse parra predecir el nivel futuro de
d las ventas
dee automviless condicional a los salarioss futuros.) Obbserve que, enn general, se
in
nterpreta que el coeficientte de la penddiente mide el
e cambio enn la variable
deependiente aso
ociado con unn cambio pequeo en la vaariable indepeendiente. (De
heecho, en el modelo lineal, = dS/dW se cumple para todos los cam
mbios en W.)
Ell coeficiente estimado
e
no eest libre de un
nidades. Su vaalor se relacio
ona en forma
diirecta con lass unidades dee medicin de la variable dependiente S (miles de
m
millones
de d
lares) y la variable indeependiente W (miles de millones de
d
lares). En estte ejemplo heemos elegido escribir
e
entre parntesis la estadstica t,
enn lugar de loss errores estndar estimad
dos. Usando la estadsticaa t, podemos
reechazar la hiptesis nula dee que el interccepto y la penndiente son 0 (tomadas en
fo
orma individuaal) con un nivvel de significaancia del 1% al igual que del
d 5%. La R2
dee 0.91 implicaa que la ecuaccin de regresiin explica el 91% de la vaariacin en la
vaariable depend
diente. El valoor F de 1 3788 le permite a uno rechazarr la hiptesis
nu
ula de que noo hay relacin entre las ventas
v
de autoomviles y lo
os sueldos y
saalarios (en el nivel
n
del 1%)).
Si tuviram
mos la certezaa de creer quue la grfica dde ventas de automviles
coontra sueldos y salarios deebe pasar por el origen, a pesar del hecho de que
heemos rechazaado la hiptessis nula de un
u intercepto 0, sera natuural correr la
reegresin sin unn trmino connstante. Los reesultados paraa la muestra iddntica son:

Au
unque la prueeba t le permiite a uno rechhazar la hipteesis nula, la supresin
s
del
trrmino constaante significattivo ha dismin
nuido el podeer explicativo
o de la ecuaci
n.10 Por tantto, estimaram
mos l modeloo de regresinn con un inteercepto. Slo
si hay una razn fuerte para forzar la ecuuacin a travs del origen debera
d
igualarrse el intercep
pto con 0.

10
Cuando see elimina la consstante, la derivaccin de R2 debe modificarse. Enn este caso, una
coomparacin de loss valores pronostiicados de las variiables dependienttes dej claro quee el poder explicaativo de la ecuacin haba declinaado.

80

PA
ARTE UNO: Los fu
undamentos del an
nlisis de regresi
n

EJEMPLO
O 3.4

Usando el prroblema del p romedio de caalificaciones (ejemplo 1.1)) podemos callcular las siguuientes estadsticas adicionnales:
R 2 = .78

F l,6 =221.57

La R 2 de 0.778 nos permitee concluir que la variable del ingreso faamiliar ayudaa a
explicar el 78
8% de la variaacin en el proomedio de caliificaciones parra la muestra dde
ocho individduos. La estaadstica F noss permite proobar la hipteesis nula de no
n
relacin entrre el promedi o de calificacciones y el inngreso familiaar. Para hacerrlo
as, usamos una tabla de la distribucin F para deteerminar el vaalor crtico as ociado con unn nivel de siignificancia del
d 5% y 1 y 6 grados dee libertad en el
numerador y el denominaador, respectiivamente. (Ell 1 grado de libertad se u sa
porque el moodelo incluye una sola variaable explicativva, mientras que
q los 6 gradoos
de libertad reesultan del heccho de que hayy ocho observaaciones y dos parmetros quue
se van a estiimar.) En estee caso el valoor crtico de F en el nivel del
d 5% es 5.999.
Puesto que l a F calculada de 21.57 es mayor
m
que el valor crtico, rechazamos la
hiptesis nu la con un niv el de significcancia del 5%
%.

EJEMPLO
O 3.5

Inscripcin en
n universidade
es pblicas y privadas

En la seccin
n 2.6, describbimos dos varriables que carracterizan los niveles de innscripcin pbllica (PBLIC
CA) y privada (PRIVADA) en institucionees de educacin
superior (porr cada mil indiividuos) en Esstados Unidoss. Las primeraas universidades
en Estados Unidos fuerron escuelas privadas enn el este. Laas instituciones
pblicas florrecieron en unna poca posterior y en coonsecuencia su
s mayor creccimiento fue en
e el oeste dee Estados Unnidos. De mannera interesannte, los estadoos
con inscripciones privadaas considerablles eligieron nno expandir sus
s sistemas de
d
educacin pblica tan rppido como lo hicieron
h
aqueellos con inscrripciones privvadas relativam
mente dbiles. Este patrn se evidencia con fuerza enn una regresin
de corte trannsversal que reelaciona las in
nscripciones ppblicas con laas inscripcionnes
privadas parra los 50 estaddos. La regressin (con estaadstica t entree parntesis) es
como sigue:

Hay unaa relacin neggativa estadssticamente siggnificativa enntre las inscrippciones pblicas y privadaas. La regresin sugiere quue conforme se incrementaan
las inscripcio
ones privadass en un estado por 1 (por mil individuo
os), las inscripp1
ciones pblicas en el estaado disminuyeen casi en 2 . La
L estadsticaa t de -3.47 y la
estadstica F de 12.04 noos dicen que el coeficientee negativo enn PRIVADA es
significativaamente diferente de 0 con un
u nivel de siignificancia del
d 5%.

CAPTULO 3: El modelo de re
egresin de dos va
ariables

81

Para evaluaar ms la validdez del modello de regresin de dos variaables, trazamo


os un histograama de los ressiduales en la figura 3.6. Deebido a que lo
os residuales
de mnimos cuaadrados sumaan cero, no es sorprendentte que la disttribucin de
loss residuales se
s centre en 0. Sin embarrgo, otros atrributos asociaados con la
disstribucin de residuales sonn bastante infformativos e incluyen
i
los siguientes:
s
Meediana
Mnimo
Mximo
Deesviacin estndar
Seesgo
Kuurtosis
Jarrque-Bera

0.63
--15.4
19.6
7.31
0.21
2.79
0.47

La inscripccin media paara institucion


nes pblicas es de 39.3 por cada mil
habbitantes. Vistoos desde esta perspectiva, los
l residuales,, qu van de -15.4
a 19.6,
sonn bastante alttos; este ranggo, junto con la desviacinn estndar relativamente
alta de 7.31 es consistente
c
coon la R2 baja de
d 0.20. Es cllaro que hay espacio
e
para
meejorar en el deesarrollo de uun modelo quee explique lass inscripcionees pblicas.
Por ltimo, podemos preeguntar si la suposicin dde errores disttribuidos de
forrma normal ess razonable. E
El patrn de loos residuales proporciona informacin
i
tiil. La medianaa de 0.63 y ell sesgo de 0.221 nos dicen qque la cola suuperior de la
disstribucin es ligeramente m
ms gruesa, con
c ms obserrvaciones quee la cola inferrior. La kurtossis de 2.79 slo es ligeram
mente inferior qque 3.00, lo que
q nos dice
quue la distribuccin residual ttiene colas quue son ligeram
mente ms deelgadas que
lass normales. Poor ltimo, la estadstica
e
de Jarque-Bera de 0.47 es mu
ucho menor
quue el valor crttico de la distrribucin ji cuaadrada con 2 grados
g
de libeertad, que es
5.9
99. Por consiguiente, no podemos recchazar la hipptesis nula de que los
ressiduales estn
n distribuidos en forma norrmal y podem
mos concluir que
q las pruebas t y F que deescribimos con anterioridadd son significcativas.

Figura 3.6
Histograma de
e residuales.

82

PA
ARTE UNO: Los fu
undamentos del an
nlisis de regresi n

APNDICE
E 3.1
Varianza del estimador
e
de la pendiente de
e los mnimos cuadrados

Resultaddo 1

DEMOSTR
RACIN Recu
uerde que = xiyi /xi . Seea:
2

(A3.1)

Cada ci es un
na constante, ya
y que las X soon fijas. Sustittuyendo en la ecuacin paraa

, obtenemoss

(A3.22)
lo cual expreesa el estimaddor de la pen
ndiente como una suma po
onderada de laas
observacionees en la variaable dependieente. (Se asum
me de maneraa implcita quue
todas las sum
matorias impplican observaaciones i = 1, 2, ..., N.) En
ntonces,
(A3.3)

Por consiguiiente,

Pero E(i) = 0, de modo que:

El hecho de que
q ciXi = 1 resulta
r
en form
ma directa de la definicin de
d ci:

Resultad
do 2
DEMOSTRA
ACIN

CAPTUL
LO 3: El modelo dee regresin de dos variables

Pero

83

dde la ecuacin (A
A3.3)

e el resultado 1
de la derivacin en

Porr consiguientee,

(A3.4)

Porr suposicin laas e, no estn correlacionaddas; es decir E


E(i j) = 0, paara i j. Por
con
nsiguiente,

Peero
(A3.5)

Porr consiguientee,
AP
PNDICE 3.2
Alg
gunas propiedaades de los resiiduales de mn imos cuadradoos

Lass primeras doos de las siguiientes propieddades se cum


mplen para loss residuales
de mnimos cuadrados tanto en modelos de
d dos variablles como en modelos
m
de
reg
gresin mltip
ple. Ningn reesultado depeende de la norrmalidad del proceso de
erro
or ni de la suuposicin de que los estim
madores de m
mnimos cuadrados son
BL
LUE best lineaar unbiased esstimation. Ms bien, resulttan de maneraa directa de
las ecuaciones normales
n
(Al..18) y (Al.19)).
Propiedad 1

(A3.6)

DEMOSTRAC
CIN En el modelo
m
de dos variables, i = xi. Por defiinicin.

Entonces
ya que X = y = 0 cuando los datos esstn en formaa de desviaciiones.

84

PA
ARTE UNO: Los f undamentos del anlisis
a
de regresi
n

Propied
dad 2
DEMOSTR
RACIN

(usando
o la Propiedadd 1). Entonces,
Pero es
e el estimaddor de mnimoos cuadrados,, y = xiyi /x
/ i. Por conssiguiente,
2

Propied
dad 3

DEMOSTR
RACIN

Propieddad 4

s2 es un estimadorr insesgado dee 2.

DEMOST
TRACIN Recu
urdese que
guiente,,

. Pero yi = xi + i. Por connsi-

(Como en el texto hemos


h
asumiddo de maneraa implcita quue los erroress i
tienen una
u media muuestral de ceroo.) Elevando al
a cuadrado y sumando toddas
las N obbservaciones, encontramoss que:

Ahora, tomando el vvalor esperado


o de ambos laados, obtenem
mos:

Pero,
vase la ecuacin (A3.5)
vase el resultado 9 del apndice
a
2.1

CAPTULO 3: El modelo de re
egresin de dos va
ariables

Adems,
= 1 de modoo que

85

Esto resulta de
d (A3.3) y deel hecho de qu
ue cixi
y

Combinandoo estos tres reesultados,

EJERCICIOS
3.1 Para el ejerciccio 1.1. construuya intervalos de
d confianza dell 95% para los parmetros
Pu
uede rechazar laa hiptesis nulaa de que = 0? = 1 ?
3.2 Discuta las diiferencias en laas pruebas estadsticas asociaadas con los parrmetros de
unaa regresin cuaando:
a) La varianzza del error es conocida o no se conoce.
b) El tamaoo de la muestraa es finito o inffinito.
3.3 En vista de quue el error estnndar del coeficciente de regressin vara invversamente
conn la varianza dee X, uno puedee mejorar la sig
gnificancia del parmetro estiimado seleccion
nando valores de
d X en los punt
ntos extremos deel rango de valoores posibles. Explique
E
por
qu esto es verdaddero y discuta si es deseable un procedimieento as.
3.4 Demuestre qu
ue la pendiente estimada de la regresin de Y en X ser iguaal al recproco de
d la pendientee estimada de la regresin de X en Y slo si R2 = 1.
3.5 Puede dar unn ejemplo de unn estimador qu
ue sea asintticaamente insesgaado pero no
connsistente?
3.6 Cuando la meedia de X es idnticamente 0, la covarianza eentre la pendiennte estimada
y ell intercepto es 0. Puede explicar de manerra intuitiva porr qu es verdad
dero esto?
3.7 Suponga que est intentando construir un modelo que exxplique el com
mportamiento
de los
l ahorros agrregados como uuna funcin deel nivel de las ttasas de interss. Obtendra
su muestra
m
durantte un periodo dde tasas de inters fluctuantees o durante unn periodo en
el que
q las tasas dee inters son reelativamente co
onstantes? Exppliqese.
3.8 Demuestre qu
ue los residuales estimados de la regresin linneal y los valorres mustrales correspondienttes de X no esttn correlacion
nados; esto es,
X1 ^ i = 0. Suugerencia: El
problema ser ms fcil si trabaaja con los dato
os en forma de desviaciones.
3.9 Demuestre quue R2 para la reegresin de dos variables no ccambia si se hacce una transform
macin lineal enn ambas variablles; es decir, Y** = a1+ a2Y, X* = b1 + b2X.
3.100 Regrese una vez ms a los datos del ejerciicio 1.1. Dividaa los datos en dos
d grupos de
cincco observacionnes cada uno, dde acuerdo con el orden de maagnitud de la variable
v
indepenndiente (suminiistro de dinero)). En otras palaabras, el primerr grupo deber contener los
cincco puntos musstrales asociadoos con los cinco valores ms pequeos
p
del suministro de
dineero. Calcule ell siguiente parmetro:

86

PARTE UNO: Los f undamentos del anlisis


a
de regresin

donde el subbndice se refieere al nmero del


d grupo. (Y2 es
e la media dee todas las Y enn el
segundo gruppo.)
a) Descrriba el procesoo anterior en forma geomtricca. En qu sen
ntido B es un esstimador de la pendiente?
b) Comppare su estimaddor con el estim
mador de la penndiente de mniimos cuadrados.
Puede demoostrar que B ess un estimador insesgado del parmetro verddadero de la peendiente de la regresin?
r
c) Demuuestre que la vaarianza del parrmetro B debee ser mayor o iggual a la variannza
del estimadoor de mnimos ccuadrados.
3.11 Demueestre que:

donde es el
e estimador deel intercepto de
d mnimos cuaadrados.
3.12 Demueestre que:

donde es el
e estimador deel intercepto y , es el estim
mador de la penndiente.

CAPTU
ULO

EL MO
ODELO DE
D REGR
RESIN
N MLTIIPLE

En este captuloo se mostrar el modelo de


d regresin ccon dos o ms variables
inddependientes (adems del trmino consstante); es deccir, el modelo de regresinn mltiple. Taambin, descrribiremos las suposiciones que subyacen
n en el modello de regresin mltiple cllsico y mosttraremos cm
mo pueden ob
btenerse las
estiimaciones dell parmetro dee mnimos cuadrados. Lueggo se har un comentario
sobbre la interpreetacin de los coeficientes de regresin. Como verem
mos, pueden
surrgir problemaas debido a laa interaccin entre las variiables explicaativas en la
ecuuacin de regrresin. Pondrremos nfasis particular en las diversas estadsticas
de regresin
r
quee ayudan en la interpretacinn del modelo,, incluyendo coeficientes
c
estaandarizados, elasticidades y coeficientees de correlaciin parcial.

EL MODELO
Exttendemos el modelo
m
de doss variables asu
umiendo que lla variable deppendiente Y
es una
u funcin liineal de una sserie de variabbles independdientes X1, X2, , Xk y un
trm
mino del erro
or. Este moddelo es una extensin
e
natuural del moddelo de dos
varriables y, por tanto, ser neecesario derivvar todos los rresultados antteriores con
tod
do detalle.
Escribimos el
e modelo de reegresin mltipple como:
(4.1)

donnde Y es la varriable dependiiente, las X son las variabless independien


ntes y es el
trm
mino del erroor. X2i represeenta, por ejem
mplo, la ia obbservacin en la variable
exp
plicativa X2. 1 es el trminno constante o intercepto dde la ecuacin
n.
87

88

PA
ARTE UNO: Los fu
undamentos del anlisis de regresi
n

Las suposiciones del modelo de reegresin mltiiple son bastaante similares a


las del modeelo de dos varriables:
1. La relaccin entre Y y X es lineal y est dada poor la ecuacinn (4.1).
2. Las X son
s variables no estocsticcas. Adems, no existe unaa relacin lnnea
exacta enntre dos o ms variables indeppendientes.
3. El errorr tiene un valoor esperado de
d cero para toodas las obseervaciones.
4. El trm
mino del errorr tiene una vaarianza consttante para toddas las observvaciones.
5. Los errrores correspoondientes a observaciones
o
diferentes soon independieentes y po
or consiguientte no estn co
orrelacionadoos.
6. El trm
mino del error est distribuido en forma normal.
Por sim
mplificacin trabajaremos con un caso esspecial del mo
odelo de regreesin mltiplle, el modelo de tres variabbles:
(4
4.2)

El procedim
miento de mnnimos cuadraados es equivvalente a busccar estimacio-nes del parmetro que m
minimicen la suma de cuaadrados del errror, definidaa
como:

Del mismo modo en quee lo hicimos en el captulo 1, podemos encontrar loos


valores de 1, 2 y 3 que minimicen ESS. Suponiiendo que hayy ms de tress
observacionnes y que las eecuaciones sub
byacentes sonn independienttes, la solucin
(vase el appndice 4.1 paara los detallees) es:
(4.3)
donde:

(4.4)
(44.5)
En este modelo de trres variables [ecuacin
[
(4.22)] el coeficieente 2 mide el
e
|cambio en Y asociado coon un cambio unitario en X2 con la supossicin de que la

CA
APTULO 4: El mo
odelo de regresin mltiple

89

varriable X3 se mantiene
m
consstante. Del mismo
m
modo, el coeficientee 3 mide el
cam
mbio en Y asoociado con un cambio unitarrio en X3 mantteniendo consstante X2. En
am
mbos casos laa suposicin de que los valores
v
de laas variables explicativas
resstantes son coonstantes es ccrucial para nuuestra interprretacin de los coeficientess. En el apnddice 4.2 mosttramos y suggerimos seguir con ms deetalle cmo,
exactamente, see mantienen constantes
c
lass otras variabbles

EJEMPLO 4.1

Ven
ntas de autom
viles

Parra predecir las ventas trimeestrales de auutomviles usaando un modeelo de ecuacin sencilla, ess probable que sean de valor tres variabbles explicativvas. Uno esperrara que las ventas
v
se movvieran en la misma
m
direcciin que el inggreso disponib
ble, pero que se relacionaraan en forma inversa
i
con el costo de peddir prestado
din
nero para finaanciar la comppra. Por consiguiente neceesitaramos los siguientes
dattos para nuestro modelo:
S = consumoo personal trim
mestral de auttomviles nuevos, miles de
d millones
de dlares actuales
Y = ingreso personal
YP
p
trimeestral, miles de
d millones de
d dlares actuuales
R = tasa de boonos de tesorrera a tres meeses, en porcentaje anual
CP
PI = ndice de Precios al Coonsumidor triimestral (19833 = 100)
Las variables de ventas, ingresos y taasa de interss deflactadas desinfladas
porr el CPI para ser medidas een trminos reeales (por ejeemplo, SR = S/CPI,
S
YPR/
CP
PI, RR = R/CP
PI). La ecuaciin que se va a estimar es:

donnde t denota que los datoss son medido


os en el momeento t. Usand
do datos del
perriodo de 1975
5 hasta el seguundo trimestrre de 1995, laa regresin esttimada es:
El coeficiennte de ingreso personal sign
nifica que un incremento de mil milloness en el ingresoo disponible rreal conducir a un incremento de 7 millones en las
venntas de autom
mviles realess, con los efecctos de todas las otras variiables manten
nidos constanttes. Adems, si la tasa de inters
i
se elevva en 1 punto porcentual,
lass ventas de au
utomviles diisminuirn enn 1.366 mil millones
m
de dlares en el
sigguiente trimesstre.

Los datos usaados en este ejem


mplo fueron obtennidos de la base de
d datos Citibasee. Las variables
orig
ginales fueron GCDAN, GMP
PY, FYGN3 y PUNEW. Todoos los datos estn
e
ajustados
estaacional-mente. Las
L ltimas tres variables estnn medidas menssualmente. Usam
mos promedios
trim
mestrales en cadaa caso.

90

4.2

PA
ARTE UNO: Los fundamentos del anlisis de regresi
n

ESTADSTTICAS DE RE
EGRESIN
Para probar la significanccia estadstica de coeficienttes de regresi
n individualees,
es natural preguntar si ell teorema de Gauss-Markoov se extiendde al modelo de
d
regresin m
ltiple y si unno puede obtener un estimaador insesgado
o de la variannza
2, as como informacin acerca de la distribucin
d
dee los parmetrros de regresin
estimados. Las
L derivacioones de las propiedades estadsticas del
d modelo de
regresin m
ltiple son rellegadas al apndice 4.3. Aqqu proporcioonamos un ressumen de los resultados
r
im
mportantes:
1. Dadaas las suposiciiones de la 1 a la 5 del moddelo de regresin mltiple, el
teorema de Gauss-Markov
G
v se aplica; ess decir, el estim
mador de mn
nimos cuadraddos
ordinarios dee cada coeficiiente j = 1, 2,
2 ..., k, es BL
LUE. (Cuandoo el trmino del
d
error est diistribuido en forma normaal, tambin es equivalente al estimador de
mxima vero
osimilitud; vaase el apndice 2.2.)
2. Un estimador
e
inseesgado y conssistente de 2 ees proporcionnado por:

3. Cuan
ndo el error est distribuiddo en forma normal, puedeen aplicarse laas
pruebas t deebido a que:

En otras paalabras, los parmetros


p
dee regresin esstimados, los cuales son norman
lizados restaando la mediia y dividiend
do entre el errror estndar estimado, sigguen la
distribucin t con N - k ggrados de libeertad. Los errrores estndarr de cada unoo de los
coeficientess S^1, S^2, . . . , S^k son derivaddos en el apnddice 4.3, debid
do a que su clculo
c
involucra laa inversin dee una matriz.. Dado que, dde manera ocasional usareemos el
modelo de tres variablees para ejempplos, reproduuciremos aquu tres frmulas; las
primeras doos calculan la varianza esttimada de cadda coeficientee, y la terceraa da la
covarianza entre
e
los dos::

es la correlacinn simple entree x2 y x3.

CA
APTULO 4: El modelo de regresin mltiple

4.3

91

P RUEBAS F , R 2 Y R 2 CORREGIDA
C
A
Paara usar R2 coomo una mediida de bondad
d del ajuste en el modelo de
d regresin
m
ltiple, extenddemos la expposicin anteriior (seccin 33.4) acerca dee la descompo
osicin de la variacin
v
en lla variable deppendiente Y.
Para cada observacin,
o
ppodemos desccomponer la ddiferencia enttre Yi y su
meedia Y como sigue:
s

Ellevando al cuaadrado amboss lados y sum


mando todas laas observacio
ones (1 a N),
obbtenemos:2

o, usando la terrminologa inntroducida en el captulo 3,


TSS
Suma del totall
de cuadrados

ESS

Suma de cuadrados
de los resiiduales

RSS
Sum
ma de cuadradoss
de rregresin

Enntonces definiimos R2 como:


(4.9)
La R2 midee la proporcin de la variiacin en Y que
q es "expliccada" por la
eccuacin de reggresin mltipple. R2 a mennudo se usa de
d manera infformal como
un
na estadstica de
d bondad de ajuste y para comparar
c
la vaalidez de los resultados
r
de
la regresin bajoo especificaciones alternativ
vas de las varriables indepenndientes

te cero,
c
ya que

e idnticamenPero el ltimo trmino es

92

PA
ARTE UNO: Los fu
undamentos del an
nlisis de regresi n

en el modeloo. Sin embarggo, existen varrios problemaas con el uso de


d R2. Primerro,
todos nuestros resultados estaadsticos se derivan de la supossicin inicial de que el modelo es

correcto; no tenemos procedimiento qu


ue compare especificacion
e
nes alternativaas.
Segundo, R2 es sensible aal nmero de variables inddependientes incluidas en el
modelo de reegresin. Puedde ser que la adicin
a
de ms variables inndependientess a
la ecuacin de
d regresin nnunca dismin
nuya a R2 sin eembargo, es probable
p
que la
eleve. (La addicin de unaa nueva variaable explicativva no altera la
l TSS pero es
e
probable quee incremente la RSS.) Porr tanto, uno podra
p
simpleemente agregar
ms variables a una ecuaccin si slo deesea maximizaar R2. Por ltim
mo, la interprretacin y uso de
d R2 se vuelvve difcil cuand
do se formula un "delo quue es restringiddo
a tener un inntercepto 0. Enn tal caso la proporcin
p
dee la suma de cuadrados
c
de la
regresin y la
l suma de cuuadrados total no necesita eencontrarse deentro del ranggo
de 0 a 1.
La dificuultad con R2 ccomo una meddida de bondaad de ajuste ess que R2 slo se
s
relaciona conn la variacin explicada e innexplicada enn Y y, por conssiguiente, no da
d
cuenta del nmero de graddos de libertadd. Una solucin natural es usar varianzaas,
no variacionees, eliminanddo, por tanto, la
l dependenciia de la bondaad de ajuste del
d
nmero de variables
v
indeppendientes enn el modelo. (Recurdese
(
q la varianzza
que

es igual a la variacin divvidida entre loos grados de llibertad.) Defiinimos R 2, o R2


corregida, coomo

donde las vaarianzas musstrales de ^ y Y se calculann como sigue:3

donde k es el
e nmero dee variables in
ndependientees. Aun cuanndo disminuyya
(o permanezzca igual) la ssuma de cuaddrados de resiiduos, o del error,
e
conform
me
se agregan nuuevas variablees explicativas, la varianza residual no neecesita hacerloo.
Ntese que tanto el num
merador com
mo el denomiinador en la definicin de
d
Var (e) cambbian cuando se agrega unaa variable adicional al moodelo. Adems,
observe [de la ecuacin (44.9)] que:
(4.100)

3
Dividimo
os entre N - 1 al calcular
c
la variannza de Y porque sse usa 1 grado dee libertad cuando
se
calcula la mediaa de Y. Sin embargo, dividimos en
ntre N - k cuando ccalculamos la varrianza de ^ debiddo
^
a que deben esttimarse k parmeetros del modelo
o de regresin anntes de que pueda calcularse (ppor
tanto la prdida de k grados de liibertad de la N original).

CA
APTULO 4: El mo
odelo de regresin mltiple

93

Essto nos permiite derivar unaa frmula4 paara la relacinn entre R2 y R 2 :


(4.11)
Sii examina la ecuacin
e
(4.11), ver que:
1. Si k = 1, entonces R2 = R 2 .
2. Si k es mayor
m
que 1, entonces
e
R2 R2 .
2
3. R puede ser negativaa.
R 2 tiene varias propiedades que la hacenn una medida de bondad de
d ajuste ms
deeseable que R2. Cuando se agregan nuev
vas variables a un modelo de
d regresin,
R2 siempre s inncrementa, m
mientras que R 2 puede elevarrse o disminuir.5 El uso de
2
R elimina al menos algun
nos de los in
ncentivos para que los investigadores
inncluyan numeerosas variablles en un moddelo sin refleexionar muchho respecto a
po
or qu deberaan aparecer. U
Un ejemplo iluustrativo es unn modelo estim
mado con 25
ob
bservaciones, con una R2 reeportada de 0.8. Sin embarrgo, este valorr result slo
deespus de quee se incluyeronn 17 variabless independienntes en el moddelo. El valor
dee R 2 asociado con
c el mismo modelo slo es
e 0.4. Es eviddente que la R2 corregida da
un
n panorama ms
m preciso dde las limitaciiones de este modelo.
La estadsttica F calculadda por la may
yor parte de loos programas de regresin
pu
uede usarse en
n el modelo dee regresin m
ltiple para prrobar la signifficancia de la
esstadstica R2. La
L estadsticaa F con k - 1 y N - k gradoos de libertadd nos permite
prrobar la hipteesis de que ninnguna de las variables
v
expliicativas ayudaa a explicar la
vaariacin de Y alrededor dde su media. En otras ppalabras, la estadstica
e
F
prrueba la hipteesis conjunta de
d que 2 = 3 = = k = 00 Puede mosttrarse que:
(4.12)
Sii la hiptesis nula es verddadera, entonnces esperaraamos que RSS, R2 y, por
co
onsiguiente, F,
F estuvieran ccerca de 0. Po
or tanto, un valor
v
alto de la
l estadstica
F es un fundam
mento para recchazar la hiptesis nula. Unna estadstica F no signi4
De la ecuacinn (4.10) resulta que l - R 2 = [ s 2 /Var (Y)][(N - k)/(N - 1)]. Peero 1- R2 = [s 2
/V ar (Y). Por cons iguiente, 1-R 2 = (1 R 2 )[(N -k)//(N -1)]. Resolviiendo, obtenemoos R 2 = 1 - (1 -

R2)[(N-1)/(N-k)]].
5
Si se desea maximizar
m
R 2 corrregida hay una regla simple: Si las, variables in
ndependientes se
dej
ejan en la ecuacin de regresin cuando
c
su estadsstica t es mayor que
q 1 y se elimin
nan en cualquier
2
otrro caso, entoncess la R corregida ser maximizadaa. Para los detallles, vase P.J. Dhhrymes, "On the
Gaame of Maximizinng R2 ", Australiaan Economic Pap
pen, vol. 9, diciem
mbre de 1970.

94

PA
ARTE UNO: Los fundamentos del anlisis de regresin
n

ficativamentee diferente dee 0 nos permite concluir quue las variablles explicativaas
hacen poco para
p explicar laa variacin dee Y alrededor de
d su media. En
E el modelo de
d
dos variabless, por ejempllo, la estadsttica F pruebaa si la recta de
d regresin es
e
horizontal. En tal caso, R2 = 0 y la regreesin no explicca nada de la variacin en la
l
variable depeendiente. Nttese que no prrobamos si la regresin passa por el origeen
(1 = 0); nuesstro objetivo ees tan slo verr si podemos explicar cualqquier variacin
alrededor de la media de Y.
La prueb
ba F de la signnificancia de una
u ecuacin de regresin puede permittir
el rechazo de
d la hiptesiss nula, aun cuando se enccuentre que ninguno
n
de loos
coeficientes de
d regresin ees significativvo de acuerdoo con pruebas t individuales.
Esta situacin puede surggir, por ejempplo, si las varriables indepeendientes estn
muy correlaccionadas entree s. El resultaado puede serr errores estnndar altos parra
los coeficienttes y valores t bajos, pero el
e modelo en conjunto pueede ajustar bieen
los datos.
Qu passara si usram
mos R2 para comparar
c
la validez
v
de moddelos de regreesin alternatiivos cuando lla variable deependiente varra de una reg
gresin a otraa?
Esto ocurre en
e la construcccin de modelos economtrricos cuando el investigadoor
tiene poca informacin resspecto a la forrma funcionall de la variablle dependientee.
Considrensee los siguientes modelos

El modelo I difiere del m


modelo II slo
o en la diferenncia de las vaariables depenndientes. (Y poodran ser loss gastos guberrnamentales tootales, incluyendo subsidioos
federales y X2 podran serr subsidios, haciendo
h
que la segunda variable
v
depenndiente sean los
l gastos paggados por inggresos recaudaados en formaa local.) Puedde
mostrarse (vase ejercicioo 4.1) que
1. Las medidas
m
R2 y R 2 .asociadas con
c los modellos I y II diferrirn.
2. 1 =1, 2 = 2 1 y 3 = 3.
3. Los errores, los ressiduos de mn
nimos cuadraddos y la varian
nza residualess
sern idnticcos en los dos modelos.
Ambas versio
ones del moddelo proporcioonan informaccin idntica, pero las meddidas de bondaad de ajuste vvariarn de maanera consideerable de un caso a otro. Poor
tanto, R2 no puede
p
usarse en
e forma direecta para comp
mparar modelos con variablees
dependientess diferentes.

EJEMPLO
O 4.1

(continuacin)) Ventas de au
utomviles

En nuestro ejemplo
e
anterrior, de ventaas de automviles, los resultados de la
l
regresin com
mpleta son coomo sigue:

CAPTULO 4: El modelo de regresin mltiple

Coeficiente

1
2
3

Valor

.60
.0070
-1.366

Error estndar

95

Estadstica t

.14
.0028
.688

4.22
2.46
-1.98

Nmero de variables = 3 (Incluyendo la constante)


Nmero de observaciones = 82 Grados de libertad = 79
R2 = 0.42
R2 = 0.40
F(2, 79) = F2, 79 = 28.1
Error estndar de la regresin o regresiones = 0.118
Suma de cuadrados del error = ESS = 1.105

Todos los coeficientes estimados son significativos con un nivel del 5% (o


marginalmente significativo en el caso de la variable de la tasa de inters) en
vista de que todas las estadsticas t son mayores o iguales a 1.98 en valor absoluto
y hay 79 grados de libertad. Por esta razn, ninguna de las variables debe
excluirse de la regresin. Las estadsticas R2 y R 2 tienen una magnitud muy
cercana, como se esperaba, en virtud de que hay una gran cantidad de grados de
libertad en el modelo. La estadstica F con 2 y 79 grados de libertad es muy
significativa, permitindonos rechazar la hiptesis nula de que todos los coeficientes de variables explicativas conjuntamente son 0. Por ltimo, el lector debera verificar la relacin entre la suma de cuadrados de los residuales y el error
estndar de la regresin: s2 = ESS/79.

EJEMPLO 4.2

Tasas de inters

En este ejemplo, usamos mnimos cuadrados para estimar un modelo que explique el movimiento de las tasas de inters mensuales de enero de 1960 a agosto de
1995. Este ejemplo lo veremos en otros diversos puntos en el libro, como cuando
tratemos la correlacin serial (captulo 6), pronstico de una sola ecuacin
(captulo 8), ecuaciones simultneas (captulo 12) y pronstico Arima (captulo
18).
Se cree que las tasas de inters estn determinadas por la demanda agregada
y suministro de activos lquidos. Las variables que subyacen al modelo de
regresin son como sigue:6
R = tasa de bonos de tesorera a tres meses, en porcentaje anual
IP = ndice del Consejo de la Reserva Federal de produccin industrial (1987
= 100)
M2 = suministro de dinero nominal, en miles de millones de dlares
PW = ndice de precios al productor para todas las mercancas (1982 = 100)
6

y PW.

Estas variables se basan en las que se tomaron de la base de datos Citibase: FYGN3, IP, FM2

96

PARTE UNO: Los fun


ndamentos del anlisis de regresin
n

El ndicee de producciin industriall proporcionaa una medidaa til de la deemanda de activos lquidos; es por esto qu
ue esperaram
mos que los inccrementos en la
l
produccin implicaran
i
inncrementos en
e la demandda, lo cual a su vez increementara las tasas de inteers. El suminnistro de dineero es una addicin obvia al
a
modelo, de modo
m
que los ccambios en laa poltica de laa reserva fedeeral que causaan
cambios en el
e suministro de dinero innfluyen en forrma directa en
e las tasas de
d
inters. Una historia simiilar se aplica a los cambioos en los preccios, ya que un
u
incremento en
e la tasa de inflacin con
nducira a un incremento en
e las tasas de
d
inters.
Las variaables de cambbio de dinero y precio particulares usadaas en el modello
de regresin fueron:

La ecuacin estimada (con la estadsticca t entre parntesis) es:

La producci
n industrial ttiene un efectoo positivo fueerte y significcativo sobre laas
tasas de interrs, como se esperaba. Laa variable de inflacin, en
ntrando con un
u
rezago de un mes, tambinn tiene el signoo esperado y es significativaa. Sin embargoo,
el signo posiitivo en la varriable de creccimiento del ddinero GM, es
e directamentte
contrario a nuestras expecctativas. Una preocupacin
p
n ms es la R2 relativamentte
baja y el erroor estndar reelativamente alto
a de la reggresin. El errror estndar de
d
2.481 es apro
oximadamentte el 40% de la
l media, lo ccual es alto para un modello
macroeconm
mico de este tipo.
t
En el cap
ptulo 6 verem
mos que cuand
do mejoramoss la especificaacin y usamoos
un mtodo dee estimacin ms
m eficiente para
p esta ecuaacin de la tassa de inters, el
e
signo de la vaariable del creecimiento del dinero
d
cambiaar y el ajuste de la ecuacin
mejorar de manera
m
consiiderable.

EJEMPLO
O 4.3

Funcin de co
onsumo

Se pueden ussar tres ecuacciones de regrresin separaddas para ilusttrar algunas de


d
las cuestionees economtriicas que surgen con la esttimacin de una
u funcin de
d
consumo agrregado simplee, relacionanddo consumo ppersonal (C),, ahorros (S) e
ingreso perso
onal disponible (Y). Los trres modelos son los siguienntes (los datoos
son trimestraales, de 1954--1, el primer trimestre de 1954, a 19955-2, en dlarees
actuales):7
7
Los datoss fueron tomadoss de la base de daatos Citibase. Laas variables usadaas son GC y GYD
(medidas en milles de millones dde dlares).

CA
APITULO 4: El mo
odelo de .regresin
n mltiple

97

Lo
os resultados de regresin se enumerann en el siguiennte cuadro:

El modelo I describe la forma ms siimple de la fuuncin de connsumo, en la


quue el consumo
o est determ
minado slo po
or el ingreso ddisponible Y en el mismo
peeriodo. El coeeficiente de laa variable de ingrese dispoonible mide laa propensin
m
marginal
a conssumir. En el modelo
m
II se agrega
a
un trm
mino para incluir el efecto
deel consumo reezagado sobree el consumo
o presente. El trmino es inncluido para
peermitir que ell consumo acctual dependaa del comporttamiento de consumo
c
recieente al igual que
q el del ingrreso. El coeficiente del trm
mino del ingresso disponible
deebe interpretaarse en formaa diferente en
n el modelo III que en el modelo
m
I. El
vaalor de 0.18 en
n el modelo III se refiere al cambio en el consumo asociado con un
caambio de 1 unnidad en el inngreso disponnible, asumienndo que el coonsumo en el
peeriodo previo ha permaneccido inmutabble. Observe que el efectoo total de un
caambio en el inngreso disponnible sobre l consumo tenndr lugar conn el tiempo y
slo puede med
dirse calculando la propenssin marginal a consumir a largo plazo,
assumiendo quee el consumo es inmutable a lo largo dell tiempo.8 Resolviendo Ct
= Ct - 1, encontrramos que la propensin
p
m
marginal
a conssumir a largo plazo implicaada por el modelo II es 0.18/(1 - 0.81) = 0.95.
Ntese el ligero
l
incremeento en R2 deel modelo I all modelo II. Dado
D
que R2
paara la ecuacin original yaa es bastante alta, es tentaador suponer que agregar
vaariables adicioonales ya no puede aadirr ms al poderr explicativo del modelo,
peero la estadsttica t significaativa en el trrmino de conssumo rezagad
do en el modeelo II muestraa que ste no es el caso.
8
Un anlisis detallado
d
del moddelo II se presentta en el captulo 9 cuando se expoonen los rezagos
disstribuidos.

98

PARTE UNO: Los fundamentos del anlisis de regresin

El modelo III representa una funcin de ahorro, no una funcin de consumo,


pero un examen rpido de los resultados de la regresin muestra que las dos se
relacionan en forma estrecha. Esto no es sorprendente, en virtud de que el ahorro
es la diferencia entre el ingreso disponible y el consumo. Observe que los
coeficientes estimados se relacionan en forma estrecha entre s. Los interceptes
de los modelos I y III slo difieren por el signo y la suma de los dos coeficientes
de pendiente es igual a 1. El lector puede ver por qu es verdad esto sustituyendo
Yt Ct por St en el modelo III y comparando los resultados con el modelo I.
Adems, la regresin de la suma de cuadrados, el error estndar de las regresiones
y los residuales son idnticos en ambos modelos.
Lo que parece sorprendente al principio es que la R2 caiga de manera considerable cuando uno pasa del modelo I al modelo III. La razn para este descenso
puede verse al recordar que R2 = 1 - ESS/TSS. Dado que los residuales estimados
son idnticos en ambas ecuaciones, la suma de cuadrados del error tambin es
idntica. Sin embargo, la suma de cuadrados total es diferente debido a que las
variables dependientes son diferentes. Por tanto, los modelos pueden ser
parecidos en casi todos los aspectos pero diferir de manera considerable en R2. En
el captulo 8 veremos que el error estndar de la regresin a menudo es ms til
como una medida del poder predictivo de una ecuacin de regresin que R2.

4.4

MULTICOLINEALIDAD
4.4.1

Colinealidad perfecta

Una de las suposiciones del modelo de regresin mltiple es que no hay una
relacin lineal exacta entre cualquiera de las variables independientes en el
modelo. Si existe dicha relacin lineal, decimos que las variables independientes
son perfectamente colmales o que existe la colinealidad perfecta. Supngase, por
ejemplo, que el modelo del promedio de calificaciones del captulo 1 consisti en
las siguientes tres variables independientes:
X2 = ingreso familiar, miles de dlares
X3 = promedio de horas de estudio por da
X4 = promedio de horas de estudio por semana
Las variables X3 y X4 son perfectamente colineales debido a que X4 = 7X3 para
todos y cada uno de los estudiantes que se investigaron. Cada parmetro tiene un
sentido perfecto si slo aparece una de las variables colineales en el modelo.
Cuando aparecen ambas, nos enfrentamos con un problema imposible. El coeficiente de la variable X3 es un coeficiente de regresin parcial que mide el cambio
en Y asociado con un cambio unitario en X3 con todas las otras variables constantes.
En vista de que es imposible mantener constantes todas las otras variables, no

CAPTULO 4: El modelo de regresin mltiple

99

podemos interpretar (o incluso definir) el coeficiente de regresin.9 La colinealidad perfecta es fcil de descubrir debido a que ser imposible calcular las
estimaciones de mnimos cuadrados de los parmetros. (Con la colinealidad, el
sistema de ecuaciones que se resolver contiene dos o ms ecuaciones que no
son independientes.)
4.4.2

Los efectos de la multicolinealidad

A menudo, en la prctica, nos enfrentamos con el problema ms difcil de tener


variables independientes con un alto grado de multicolinealidad. La multicolinealidad surge cuando dos o ms variables (o combinaciones de variables) estn
altamente (pero no perfectamente) correlacionadas entre s. Supngase que dos
variables estn relacionadas de esta manera. Entonces, ser posible obtener las
estimaciones de mnimos cuadrados de los coeficientes de regresin, pero la
interpretacin de estos coeficientes ser bastante difcil. Se interpreta que el coeficiente de regresin de la primera de las dos variables, altamente correlacionadas
mide el cambio en Y y que es debido a un cambio en la variable en cuestin,
siendo iguales otras cosas. En el momento en que ocurre un cambio dado en una
variable, es probable que se observe en su pareja correspondiente altamente
correlacionada, un cambio de una forma predeciblemente similar. Por tanto, la
presencia de multicolinealidad implica que habr muy pocos datos en la muestra
para darle a uno confianza respecto a dicha interpretacin.
No nos sorprende que las distribuciones de los parmetros de regresin
estimados sean bastante sensibles a la correlacin entre variables independientes,
y tambin a la magnitud del error estndar de la regresin. (Recurdese que en el
2
modelo de dos variables, la varianza estimada de es s2/ x i.) Esta sensibilidad
se muestra en forma de errores estndar muy altos para el parmetro de
regresin. Esto puede verse si examinamos las frmulas para las varianzas de los
parmetros estimados dadas en las ecuaciones (4.6) y (4.7). Ambos denominadores incluyen el trmino 1 - r2. Cuando X2 y X3 no estn correlacionadas en la
muestra, r = 0 y las frmulas son esencialmente idnticas. Sin embargo, cuando r
se vuelve alta (cercana a 1) en valor absoluto, la multicolinealidad est presente,
con el resultado de que las varianzas estimadas tanto de 2 como de 3 se vuelve
muy grande. Esto nos dice que aunque 2 y 3 permanecern como estimadores
insesgados, la confianza que podemos colocar en el valor de una u otra ser
pequea. Esto representa un problema si creemos que una o ambas de las dos
variables debera estar en un modelo, pero no podemos rechazar la hiptesis nula
debido a los errores estndar estimados grandes. Puede ser razonable en tales
casos quitar una de las dos variables de la ecuacin y volver a estimarla. En el
captulo 7 veremos que esto puede causar tendencia en el

9
Con la colinealidad perfecta, no podemos calcular los estimadores de mnimos cuadrados. Para
ver esto, reconsidrense las ecuaciones (4.3) a (4.5) cuandoX2 y X3) son perfectamente colineales. En
este caso las ecuaciones (4.4) y (4.5) no sern independientes y no existir solucin.

100

PARTE UNO: Los fundamentos del anlisis de regresin

modelo reestimado, pero nos ayudar a determinar el efecto de la multicolinealidad en el modelo original.10
La manera ms fcil de decir si la multicolinealidad est causando problemas es examinar los errores estndar de los coeficientes. Si varios coeficientes
tienen errores estndar altos, quitar una o ms variables de la ecuacin disminuye los errores estndar de las variables restantes y, por lo general, la multicolinealidad ser la fuente del problema. Un anlisis ms complejo tomara en
cuenta el hecho de que la covarianza entre parmetros estimados (al igual que
los errores estndar individuales) puede ser sensible a la multicolinealidad.
Como lo muestra la ecuacin (4.8), un alto grado de colinealidad se asociar con
una covarianza relativamente alta (en valor absoluto) entre parmetros estimados. Esto sugiere que si un parmetro estimado i sobreestima el parmetro
verdadero i, es probable que un segundo parmetro estimado i subestime a
j, y viceversa (asumiendo que r > 0).

4.4.3

Indicaciones de multicolinealidad

Un modelo estimado con errores estndar altos y estadstica t baja podra ser
indicativo de multicolinealidad, pero de manera alternativa podra sugerir que el
modelo subyacente es deficiente. Cmo puede probar uno la presencia de
multicolinealidad?
Hemos visto que la multicolinealidad ocurre en una muestra particular
cuando dos o ms de las variables explicativas estn altamente correlacionadas
por lo que dificultan la separacin de los efectos de una variable explicativa en la
variable dependiente de los efectos de las otras variables explicativas. Estas
variables explicativas rara vez no estn correlacionadas entre s, y por tanto la
multicolinealidad es una cuestin de intensidad; en consecuencia, se usan varios
procedimientos para indicar su presencia.
1. Una R2 relativamente alta en una ecuacin con una estadstica t poco
significativa es un indicador de multicolinealidad. De hecho, es posible que la
estadstica F para la ecuacin de regresin sea altamente significativa, mientras
que ninguna de las estadsticas t individuales sea significativa en s misma.
2. Las correlaciones simples relativamente altas entre uno o ms pares de
variables explicativas pueden indicar multicolinealidad. Sin embargo, las conclusiones sobre la presencia o ausencia de multicolinealidad que slo se basan
en estas correlaciones deben hacerse con cuidado. Es posible que con algunos
conjuntos de datos, en especial aquellos que implican series de tiempo, las correlaciones entre muchos pares de variables sern altas, pero los datos le permitirn a uno separar los efectos de las variables explicativas individuales sobre la
10
Para un tratamiento adicional de pruebas para multicolinealidad, vase D.E. Farrar y R.R.
Glauber, "Multicollinearity in Regression Analysis: The Problem Re-visited", Review of Economics and
Statistics. vol. 49, pp. 92-107, 1967. Vase tambin D. Belsley, E. Kuh y R. Welsch, Regression Diagnostics:
Identifying Influential Data and Sources of Collinearity (Nueva York: Wiley, 1980).

CA
APTULO 4: El mo delo de regresin mltiple

101
1

vaariable dependiente. Una limitacin adiicional es quee un examen de las correlaciones simplees en pares nno permitir detectar
d
la muulticolinealidaad que surge
deebido a que trres o cuatro variables
v
estn relacionadaas entre s.
3. Se han propuesto
p
varrias pruebas formales
f
paraa la multicolinnealidad a lo
largo de los aos, pero ninnguna ha enccontrado una aceptacin amplia.
a
Una
prrueba implica el clculo de un nmero dee condicin associado con ell conjunto de
daatos de la variiable explicattiva. Un nmeero de condicin mayor quue 20 o 30 es
inndicativo de laa presencia dee multicolineaalidad.11

4.5

COEFICIENTES ESTAND
DARIZADOS
S Y ELASTIC
CIDADES
4..5.1

Coe
eficientes estandarizad
dos

Lo
os coeficientess estandarizaddos describen la importanciia relativa de las variables
in
ndependientess en un modelo de regresi
n mltiple. Para
P
calcular coeficientes
esstandarizados, tan slo se realiza
r
una reegresin lineaal en la que cada
c
variable
ess normalizada
a restndole suu media y divvidindola enttre su desviaccin estndar
esstimada. El modelo
m
de regrresin normaalizado se pressenta como siigue:

Loos coeficientees estandarizaddos guardan una


u relacin estrecha
e
con loos coeficientes estimados del
d modelo dee regresin mltiple
m
no norrmalizado oriiginal. No es
diifcil demostraar que:12
(4.14)
En
n otras palabrras, el coeficciente estandaarizado ajustaa el parmetrro de la pendeente estimadoo por el cociennte entre la deesviacin estndar de la vaariable indepeendiente y la desviacin eestndar de laa variable deppendiente. Unn coeficiente
esstandarizado de
d 0.7 signiffica que un caambio de 1 ddesviacin esstndar en la
vaariable indepeendiente condducir a un caambio de 0.7 desviacin esstndar en la
vaariable dependdiente.
Tanto los coeficientes
c
eestandarizadoss como los cooeficientes dee correlacin
paarcial estn coonectados conn la varianza de
d Y, la variabble dependiennte. Sin em11

Describimoos esta prueba aquu slo en forma breve debido a qque implica lgebbra matricial. Se

expplica en D. Belsleyy, E. Kuh y R. Weelsch, Regression Diagnostics:


D
Identtifying Influential Data
D
and Sources
of Collinearity (Nuueva York: Wileey, 1980). Para un resumen mss reciente, vasee W.H. Greene,
Ecconometric Analyssis, 2a. ed. (Nuev a York: Macmillaan, 1993), seccinn 9.2.
12
Escribiendo
o la ecuacin (4.113) en forma de desviaciones y multiplicando
m
ambbos lados por sy,
obtenemos yi = *2 (sY / sx2)x2i + *3 (sY /ssx3) x3i + + *k (S
Sy/Sxk1) xki + *i .de lo cual se deriva nuestro
n
resultado

en
n forma directa.

102

PARTE UNO: Los fundamentos del anlisis de regresin

bargo, el reescalamiento asociado con la regresin normalizada posibilita comparar los coeficientes estandarizados de manera directa. Esto no puede hacerse
con las X originales, debido a que las variables dependientes estn en unidades
diferentes con varianzas diferentes. Es interesante sealar que el coeficiente
estandarizado de la variable independiente en el modelo de dos variables es
idnticamente igual a la correlacin simple entre las dos variables. El coeficiente
estandarizado del trmino constante es indefinido, en vista de que el trmino
constante se omite como resultado del proceso de normalizacin.

4.5.2

Elasticidad

La elasticidad mide el efecto en la variable dependiente de un 1% de cambio en


una variable independiente. Esta elasticidad de Y con respecto a X2, por ejemplo,
es el porcentaje de cambio en Y dividido entre el porcentaje de cambio en X2.
En general, las elasticidades no son constantes sino que cambian cuando
son medidas en diferentes puntos a lo largo de la lnea de regresin. Las elasticidades que, por lo general, son impresas por programas de computadora se
calculan en el punto de la media de cada una de las variables independientes. Para el

coeficiente jsimo la elasticidad es evaluada como:

Los valores de la elasticidad son ilimitados y pueden ser positivos o negativos.


Las elasticidades son tiles debido a que estn libres de unidades; es decir, sus
valores son independientes de las unidades en que son medidas las variables.
Por ejemplo, si Ej = 2.0, podemos decir que alrededor de la media de las variables
un incremento del 1% en Xj conducir a un incremento del 2% en Y. Por otra
parte, si Ej = -0.5, un incremento del 1% en Xj conducir a una disminucin del
0.5% en Y. En general, las elasticidades grandes implican que la variable dependiente es muy sensible a los cambios en la variable independiente.

4.6

CORRELACIN PARCIAL Y REGRESIN POR ETAPAS


En el modelo de regresin mltiple, es natural extender el concepto de correlacin simple para ver cunto estn relacionadas la variable dependiente y una
variable independiente despus de eliminar completamente el efecto de otras
variables independientes en el modelo. Para hacer esto, consideramos el siguiente modelo:
Y i = 1 + 2 X 2i + 3 X 3i + i
El coeficiente de correlacin parcial entre Y y X2 debe definirse de tal manera que
mida el efecto de X2 en Y que no es explicado por las otras variables en el modelo. De

CAP
PITULO 4: El mode
elo de regresin mltiple
m

103

maanera ms esppecfica, el coeeficiente de coorrelacin parrcial se calculaa eliminando


el efecto lineall de X3 en y (as como el
e efecto lineal de X3 en X2) y luego
ejeecutando la reegresin aproopiada. Los paasos son los siguientes:

1. Ejecutarr la regresin de Y en X3 y obtener valorres ajustados:

2. Ejecutarr la regresin de X2 en X3 y obtener valores ajustados:

3. Eliminarr la influenciaa de X3 en Y y X2. Se tiene que:


q

4. La correelacin parciaal entre X2 y Y es, entonces, la correlacin simple


en
ntre Y* y X*2.
Para saber por qu la reegresin de Y*
Y sobre X*2 nnos dar el cooeficiente de
coorrelacin parccial deseado, ntese que Y*
* y X*2 no estn correlacionnadas con X3
13
poor construcci
n. Entoncess la regresin de Y* sobre X*2 relaciona la
l parte de Y
quue no est corrrelacionada con
c X3 con la parte de X2 que
q no est co
orrelacionada
coon X3. Denotam
mos el coeficciente de correelacin parciaal y las correlaciones simples de la siguiiente forma:
r

Yx2x3 =

coorrelacin parccial de Y y X2 (controlado por X3)

rYX2 = coorrelacin simp


mple entre Y y X2
x2 x3 = co
orrelacin sim
mple entre X2 y X3

Dada la deefinicin de ccorrelacin paarcial, no es difcil


d
derivarr la relacin
enntre la correlaccin parcial y la correlacin simple. Exxpresamos el resultado
r
sin
prrueba, dado quue los detalles son compliccados:
(4.16)
(4.17)
Laas correlacionnes parciales deben
d
variar enn valor de -1 a +1, del mism
mo modo en
quue deben haceerlo las correlaaciones simplles (recurdesse la derivacin de la co13
El hecho dee que Y* y X3 (poor ejemplo) no esttn correlacionaddas se deriva en fo
orma directa del
hecho de que Y* reepresenta el residdual de la regresiin de Y en X3. H
Hemos visto en ell captulo 3 que
loss residuales de laa regresin no esttn correlacionaddos con las variabbles explicativas.

104

PA
ARTE UNO: Los fu
undamentos del anlisis de regresi
n

r
rrelacin
simpple). Una corrrelacin parciial de cero enntre Y y X2 ind
dica que no haay
r
relacin
lineal entre Y y X2 ddespus de que el efecto lineall de X3 en cadaa uno haba siddo

explicado. Enn tal caso conccluiramos que X2 no tiene un efecto direecto en Y en el


e
m
modelo.
De hecho,
h
los coeeficientes de correlacin
c
paarcial a menud
do se usan parra
determinar laa importancia relativa de variables
v
diferrentes en moddelos de regreesin mltiple.
Ahora veeremos la relacin entre la correlacin
c
paarcial y R2. Enn el modelo de
d
dos variables es fcil mostrrar que uno puuede interpretaar R2 como el cuadrado de lla
correlacin siimple entre laas variables dependiente
d
e independientte. Tambin ees
posible interppretar la correelacin parciall entre Y y X2 como la razz cuadrada deel
porcentaje dee la varianza een Y que no es explicada poor X3, pero quue es explicadda
por la parte de
d X2 que no eest correlacioonada con X3. Dado este hecho, es posiblle
derivar la sigguiente relacin entre la co
orrelacin mltiple y parciial:

A partir de laa ecuacin (44.18) puede deeterminarse eel coeficiente de correlacin


parcial toman
ndo la raz cuuadrada del porcentaje
p
de la varianza en
e Y explicadda
por X2 (con ambas
a
variablles ajustadas para
p eliminar el efecto de X3).
Quiz el uso ms freccuente de la correlacin
c
parcial ocurre en el proceddimiento de reg
gresin por etaapas. En la reggresin por etaapas se aadenn variables a un
u
modelo para maximizar
m
R 2. La correlacin parcial entrre cada variablle explicativa y
la variable deependiente es til para deteerminar cul variable
v
aadirr, debido a quue
nos dice si un
na variable deeterminada afe
fecta a la variaable dependiente despus de
d
que se ha elim
minado el imppacto de todas las variables incluidas coon anterioridaad
en el modelo. Aunque la reegresin por etapas
e
puede ser til para examinar
e
datoos
cuando hay una
u gran canntidad de posibles variablees explicativaas, es de pocco
valor cuando
o uno est inttentando anallizar un moddelo desde el punto de vistta
estadstico. La razn es quee las pruebas t y F consideraan la prueba de una hiptesiis
nula, bajo la suposicin dee que el modeelo est especiificado en form
ma correcta. Si
S
hemos buscad
do en un conjuunto grande dee variables, seeleccionando aquellas
a
que se
s
ajustan bien,, es probablee que obtengamos pruebaas t significattivas con graan
frecuencia. Como
C
resultaddo, la estadsttica t grande no nos permiite rechazar la
l
hiptesis nulla con un niveel dado de sig
gnificancia.
EJEMPLO
O 4.4

El valor de los
s boletos de fttbol revendidos
s

14

Durante las teemporadas dee 1978 y 19799, el equipo dee ftbol de la Universidad
U
d
de
Alabama estuuvo en la peleea por el camppeonato de Esstados Unidoss. Los boletoss
14
Este eje mplo se basa enn Terrence F. Martell
M
y Hassan Tehranian, "Thee Determinants of
o
Scalped Ticket Prices",
P
Northeast Journal of Businness & Economicss, vol. 14, pp. 33--43, otoo/inviernno,
1987-1988.

CAPTULO 4: Et modelo de regresin mltiple

105

para la temporada regular estaban agotados y se desarroll un mercado activo


para la "reventa" de boletos. En Alabama, a diferencia de muchos otros estados,
la reventa de boletos para eventos deportivos es legal. Cada boleto vendido
durante este periodo tena un precio de lista de 10 dlares, pero los precios del
mercado reales variaron en forma considerable debido a los cambios en la
demanda de boletos por las personas que no los tenan para la temporada y los
cambios en el suministro de boletos revendidos por aquellos con boletos para la
temporada. El modelo de regresin relaciona el precio promedio de los
boletos revendidos para cada uno de los 22 juegos realizados durante las dos
temporadas con diversas variables de demanda y suministro. La ecuacin de los
boletos revendidos es:
Pi = 1+ 2SECi + 3TVi+ 4RANKi + 5LWINi
+ 6WINi + 7HOMEi + i
donde P = el precio promedio de un boleto revendido
SEC = 1 si el oponente est en la Conferencia del Sureste de Alabama;
0 si es de otra manera
TV = 1 si el juego se transmite por televisin; 0 si es de otra manera
RANK = clasificacin de Alabama en la semana anterior en las encuestas
de ftbol
LWIN = el porcentaje de juegos ganados y perdidos del oponente durante
el ao anterior
WIN = el porcentaje de juegos ganados y perdidos del oponente durante
el ao en curso
HOME = 1 si el juego es local; 0 si es de otra manera
Los resultados de la regresin, incluyendo los coeficientes regulares y estandarizados, se muestran en el siguiente cuadro:

Variable
Constante
SEC
TV
RANK
LWIN
WIN
HOME

Coeficiente
Coeficiente estandarizado
4.64
5.59
-9.21
-1.20
.30
.06
4.97

19.77
13.05
-18.10
-13.87
22.10
9.57
11.28

Estadstica t (para
coeficientes
estandarizados)
1.83
-2.03
-2.03
-2.05
2.68
1.41
1.96

Los coeficientes en la segunda columna nos dicen el efecto sobre la variable


dependiente de una unidad de cambio en cada una de las variables indepen-

106

P
PARTE UNO: Los fundamentos del anlisis de regressin

dientes. Sinn embargo, es difcil com


mparar la im
mportancia dee las variablees independientes en la determiinacin de loss precios de los
l boletos rev
vendidos, en vista de
que varann las unidades de mediccin. Los cooeficientes esstandarizadoss, en la
tercera columna, son m
ms apropiaddos para este propsito. El
E determinannte ms
importante del precio de
d reventa ess el porcentajje de juegos ganados y perdidos
p
del oponen
nte en la tem
mporada anteerior (el coefficiente estan
ndarizado es el ms
alto de toddas las variabbles independientes). Tennemos que entre mejor es
e el rcord del opponente, mayyor el precio del boleto. T
Todas las varriables restanttes tambin tienenn los signos que esperaramos. En orden de impoortancia encontramos
que entre mayor
m
era la clasificacin de Alabama, mayor el prrecio del boleeto (una
clasificacin alta signiffica un nmeero menor paara la variablle RANK), laa cobertura en la televisin disminuye el precio
p
del booleto (en vistta de que loss individuos puedeen ver el jueggo en su hog
gar), los jueggos de la Connferencia del Sureste
son ms caaros que los juegos que no
n son de la conferencia, los boletos para
p
los
juegos locaales son ms costosos quee los boletos para juegos en otras ciuudades y
entre mejorr es el rcord actual del opponente, mayoor el precio del
d boleto.

EJEMPL
LO 4.5

Ventas de biienes duradero


os

Para predecir las ventass mensuales de bienes duuraderos por medio


m
de un modelo
de regresin lineal, se usaron los siguientes daatos para el periodo de julio
j
de
1967 a agossto de 1995:15
1. Variable dependiiente
SD = ventas mennsuales al meenudeo de bieenes duradero
os (millones de
dlares)
2. Variables indepenndientes
DI = inventario aal menudeo de
d tiendas de departamento
d
os en bienes dud
raderos (milllones de dlaares)
IS = proporcionees de ventas de
d inventario ppara todos loss bienes duradderos, tiendas al menudeo
I = tasa en el mercado
m
abieerto de papel comercial prreferente a seeis
meses (porccentaje)
E = ingresos brrutos promediio por hora dee los trabajaddores (dlaress)
P = ndice de P
Precios al Consumidor parra bienes durraderos (19833 =

100)

El modelo se especifica como


c
sigue:

15
Las sigguientes variabless ajustadas estacioonalmente fueron usadas de la basee de datos Citibase:
RTDR, 1VRDR
R (IS = IVRDR/RT
TDR), FYCP, LEH
H y PUCD.

CAPTULO
C
4: El modelo
m
de regresi
n mltiple

10
07

Los
L resultados de la regressin son los siguientes:

No es unaa coincidenciaa que se haya elegido que ttodas las variaables indepen-ddientes estuvieran rezagadaas al menos un
u periodo. E
Esto explica laas demoras enn
la respuesta mientras
m
al m
mismo tiempoo hacen ms ffcil la prediccin. Si unoo
d
desea
predecirr ventas menssuales al menu
udeo de bienees duraderos en
e el momentoo
t,, uno tan sloo usara la sigguiente ecuaccin de regressin:

Para evaluar SD
P
S en el perioodo t + 1, se sustituyen
s
valoores para DI dados
d
6 mesess
p
previamente,
IS
I dado 1 mes previamentee, etc. Si las vvariables indeppendientes noo
f
fueran
retrasad
das, sera neccesaria algunaa clase de proceso de extraapolacin paraa
p
pronosticar
suus valores anntes de que pudiera
p
hacerrse una prediccin para laa
v
variable
depen
ndiente.
La columnna denominadda parcial con
ntiene la lista dde los coeficieentes de corre-laacin parcial, mientras la coolumna denom
minada coeficiientes estanda
arizados se de-f
fine
por s solla. En este ejemplo, los co
oeficientes dee la variable independiente
i
e
c la estadsstica t ms grrande en valo
con
or absoluto tieenden a tenerr los mayoress
c
coeficientes
de correlacin estandarizadaa y parcial. E
El coeficiente estandarizadoo
d 0.21 en loss ingresos rezzagados signiffica que un inncremento dee 1 desviacinn
de
e
estndar
en loss ingresos rezzagados conduucir a un incrremento de 0.221 desviacio-

108

PA
ARTE UNO: Los fundamentos del an
nlisis de regresin
n

nes
n estndar en
e las ventas al menudeo de bienes duuraderos. El coeficiente
c
dee
correlacin
c
paarcial de 0.31 en la misma variable
v
de inngresos implicca que el 9.4%
%
2
(0.31
(
) de la varianza de SD
D no explicadaa por las otras variables indeependientes ess
explicada
e
por los ingresos. Al examinar las
l elasticidaddes, vemos quue las ventas al
a
menudeo
m
de bienes
b
duraderros son sensibbles a los cam
mbios en los inngresos brutoss
de
d los trabajaadores pero nno al ndice de Precios all Consumidoor para bieness
duraderos.
d
Si los ingresos sse elevaran en
n un 1%, entonnces podramoos esperar quee
las
l ventas al menudeo
m
se inncrementaran poco ms dell 0.3%. Pero si
s el ndice dee
Precios
P
al Co
onsumidor see elevara en un 1%, se essperara que las ventas al
menudeo
m
dism
minuyeran alrrededor del 0.02%.

A
APNDICE
4.1
E
Estimacin
dell parmetro de mnimos cuad
drados

Nuestra
N
meta es minimizaar ESS = (Y
Yi - 1 - 2X2i - 3 X3i)2. Poddemos hacerloo
calculando
c
loss derivados parciales con respecto
r
a los tres parmetrros desconocidos
d 1, 2 y 3 igualando caada uno a 0, y resolviendo. Para simplifiicar usamos el
e
modelo
m
en forrma de desviaaciones, de modo
m
que:

E
Entonces
(A4.1)

(A4.22)
Para resolverr, multiplicam
P
mos la ecuacin (A4.1) poor x 23i y mu
ultiplicamos laa
e
ecuacin
(A44.2) por x2ix3i3 y luego resttamos el ltim
mo del primerro:

Se sigue que:

CAPTULO 4: El modello de regresin mltiple

109

Po
or ltimo, si establecemos
e
la derivada de
d ESS con reespecto a 1 igual a cero,
enccontramos quue:

AP
PNDICE 4.2
4
Coeficientes de re
egresin

Coonsidrese el modelo
m
de reggresin mltiiple de tres vaariables
(A4.3)
Exxplicamos en el texto que 2 mide el effecto de X2 een Y, con el efecto
e
de X3
maantenido consstante. Cmoo se aplica en
n realidad estte concepto cuuando obtenem
mos estimadoores de mnim
mos cuadradoos para 2 (as como para 3)? La respuesta es que ell coeficiente estimado
e
en ell modelo de regresin de trres variables
puuede calcularse realizando ddos regresionnes de dos varriables. (Este resultado se
gen
neraliza a cuaalquier modeloo de regresin
n mltiple.) Laa primera regrresin ajusta
la variable X2 para
p
"manteneer constante X3", mientras que la segundda regresin
esttima el efecto de esta variabble ajustada enn Y. El proceddimiento se mu
uestra en los
sigguientes pasos.
Paso 1 Reggresar X2 en X3. Cuando se
s ha estimaddo la ecuacin, podemos
calcular los valores ajustaados y residuaales del modello. Para simplificar, trabajaremos con
n los datos en forma de desvviaciones, de modo que el modelo
m
es:

Nuestro inteers se encuenntra en i, la cual


c representta la porcin de
d X2 que no
est correlaacionada con X3. (Recuerdde que los residuales de regresin
r
no
estn correllacionados coon la variablee de la derechha.) De hecho, mantener
constante X3 significa eliiminar deX2 el
e componentee que est corrrelacionado
con X3.

Paso 2

R
Regresar
Y en . El modeloo es

Cuuando se estim
ma, encontram
mos que:

110

PARTE UNO: Loss fundamentos del anlisis de regre


esin

representaa el efecto de "X2 ajustada" en Y y de accuerdo con nu


uestro argumennto
debera med
dir el efecto de
d X2 en Y manteniendo
m
coonstante X3 Si
S estamos enn lo
correcto, deb
be ser que = 2 . Para observar esto se nnecesita realizzar los siguienntes
clculos alggebraicos:

Pero

Por consiguuiente,

Ahora, multtiplicando am
mbos lados deel cociente poor x 23i y simpplificando, obbtenemos:

APNDIC
CE 4.3
El modelo de
e regresin m
ltiple en form
ma matricial

REPRESEN
NTACIN DE
EL MODELO
O
DE REGRE
ESIN MLT
TIPLE

El propsitoo de este apnndice es presenntar generalizzaciones de deetalles textualles


importantes. Sera difcil lograr esto siin usar lgebra matricial, pero suponemoos
que el lectorr tiene este coonocimiento previo.
p
Comenzzamos represeentando el moodelo lineal en forma matrricial. Se recordar del texto que el moddelo de regressin incluye k + 1 variablees, una variabble
dependientee y k variabless independienntes (incluyenndo el trminoo constante). E
En
virtud de quue hay N obseervaciones, podemos
p
resuumir el modello de regresin
escribiendo una serie de N ecuacioness, de la manerra siguiente:

CAPTULO 4: El m
modelo de regresin mltiple

111
1

La
L corresponddiente formulacin matriciial del modeloo es:
Y = X+
X

(A4.5))

e la cual:
en

donde
d
Y = N x 1 vector de columna de observaciones
o
de la variablee dependientee
X = N x k matriz dee observacionnes de la variaable independdiente
= k x 1 vector collumna de parmetros descoonocidos
= N x 1 vector coolumna de errrores
En nuestrra representaacin matriciaal X, cada componente
c
Xji tiene doss
subndices,
s
el primero signiificando la coolumna apropiiada (variable)) y el segundoo
significando
s
la fila apropiaada (observacin). Cada coolumna de X representa unn
vector
v
de N observaciones
o
s de una variiable determinnada, con tod
das las obser-vaciones
v
asocciadas con el iintercepto igu
ual a 1.
Las supossiciones del modelo
m
de regrresin lineal cllsico puedenn representarsee
c
como
sigile:
i. La esp
pecificacin ddel modelo estt dada por laa ecuacin (A
A4.4).
ii. Los ellementos de X son fijos y tienen una vvarianza finitaa. Adems, X
t
tiene
rango k,, el cual es m
menor que el nmero
n
de obbservaciones N.
N
iii. est, distribuida enn forma norm
mal con E() = 0 y E(') = 2I, donde I ess
una
u matriz dee identidad N x N.
La suposicin de que X tiene un ranngo k garantizza que no estaar presente laa
colinealidad
c
p
perfecta.
Con esta colinealiidad perfecta, una de las coolumnas de X
sera
s
una com
mbinacin lineeal de las resstantes colum
mnas, y el ranggo de X seraa
menos
m
que k. Las suposiciiones sobre el
e error son laas ms fuertes posibles, enn
vista
v
de que garantizan
g
las propiedades estadsticas aal igual que aritmticas
a
del
proceso
p
de esttimacin de m
mnimos cuaddrados ordinarrio. Adems de
d la normalidad
d asumimoss que cada trrmino del erroor tiene mediaa 0, todas las varianzas sonn
constantes
c
y to
odas las covariianzas son 0. La
L matriz variaanza-covariannza 2I aparecee
de
d la siguientee manera:

112

PA
A RTE UNO: Los fu
undamentos del an
nlisis de regresi
n

donde
d
es ell vector transppuesto 1 x N de .
E
ESTIMACI
N DE MNIIMOS CUAD
DRADOS
^

N
Nuestro
objetivo es enconntrar un vecto
or de parmettros que min
nimice,
(A4.88)

donde,

(A4.99)

(A4.100)

representa el
e vector N x 1 de residuales de la regresiin, mientras representa el
e

vector
v
N x 1 de valores ajustados
aj
paraa Y. Sustituyeendo las ecuaaciones (A4.99)
y (A4.10) en la ecuacin (A4.8), obteneemos:

El
E ltimo passo resulta porrque 'X'Y y Y'X son escaalares ambos y son igualees
entre
e
s. Paraa determinar los estimadorees de mnimoos cuadrados, minimizamoos
ESS
E como siggue:
(A4..12)
La
L matriz XX
X, llamada maatriz de produuctos cruzadoss, garantiza teener un inverso
debido
d
a nuesstra suposicin de que X tiene
t
rango k.16
16
Las condiciones de segunddo orden para la minimizacin
m
de ESS
E se derivan deel hecho de que
X es una matriiz definida positiiva.
XX

CAP
PTULO 4: El mod
delo de regresin mltiple
m

113

Dos resultad
dos concernieentes a los resiiduales de mnimos cuadraados pueden
serr tiles en alggunas de las ddesviaciones que resultan:
(A4.133)
(A4.144)
El primer resulttado demuesttra que la sum
ma de los prroductos cruzzados de las
varriables indepeendientes y loos residuales es
e 0. ste es eel anlogo muuestral de la
supposicin de que
q E(X') = 00.
Ahora conssidrense las ppropiedades del estimadorr de mnimoss cuadrados
^
. Primero,
P
podemos demosttrar que es un
u estimador insesgado dee :

Observando
o la ecuacin (A4.15), notaamos que A=
= (X'X)-1X' representa
r
la
reggresin de en
e X. En tantoo los efectos de las variables faltantes estn
e
distribuiidos en formaa aleatoria inndependientem
mente de X y tengan mediia 0, el estimaador de mnim
mos cuadradoos del parmeetro ser insessgado.
El estimado
or de mnimoss cuadrados estar
e
distribuuido en formaa normal, en
^
vissta de que es
e una funcinn lineal de y est distrribuido en forrma normal.
Laas propiedadees de las variianzas de las i individualles y sus covvarianzas se
detterminan com
mo sigue:

(A4.166)
Lo
os elementos diagonales
d
dee V representaan las varianzzas de los parrmetros estim
mados, mientras los trminoos fuera de laa diagonal reppresentan las covarianzas.
c
En
n ocasiones esscribiremos V = Var ( ). Entonces,
E

114

PARTE UNO: Los fundamentos del anlisis de regresin

en vista de que A y A' son matrices de nmeros fijos. Pero,

Por consiguiente,

(A4.17)

Ya hemos demostrado que el estimador de mnimos cuadrados es lineal e


insesgado. De hecho, es el mejor estimador insesgado lineal de en el sentido
de que tiene la varianza mnima de todos los estimadores insesgados. Para completar la prueba del teorema de Gauss-Markov, necesitamos mostrar que cualquier
otro estimador lineal insesgado b tiene una varianza mayor que . Recurdese
que = AY. Sin prdida de generalidad, podemos escribir (para cualquier matriz C)
b = (A + C)Y = AY + CY = + CY = (A + C)X + (A + C)
Si b es insesgado, entonces:
E(b) = (XX) -1 XX + CX = (I + CX) =

(A4.18)

Una condicin necesaria y suficiente para que esto se cumpla para todas las es
que:
CX = 0
Ahora examinemos la matriz Var (b). Dado que b - = (A + C),17
Var (b) = B[(b - )(b - )] = E[(A + C)][(A + C)]
= E[(A + C) ' (A + C)'] = (A + C)E( ' )(A + C)'
= 2(A + C)(A + C)'
Pero

(A + C)(A + C)' = AA' + CA' + AC + CC


= (X'X)-1X'X(X'X)-1 + CX(X'X)-1
+ (X'X)-1X'C + CC
= (X'X)-1 + CC
dado que CX =X'C' = O

17
En vista de que AX = (X'X)-1X'X = I, b - = (A + C)X= (A + C) = AX + CX+
(A + C) = (A + C).

CA
APTULO 4: El mod
delo de regresin mltiple
m

115

Por consiguientee,
(A4.19)
Podemos observvar que CC es una matrizz semidefinida positiva. Ell nico caso
en el que la forrma cuadrtiica asociada con esta ma triz ser 0 ess cuando C
= 0 (todos los elementos soon 0). Cuand
do C = 0, el estimador
e
altternativo se
vueelve el estim
mador de mniimos cuadrad
dos ordinarioos y el teorrema queda
dem
mostrado.
ES
STIMACIN DE 2, PRUE
EBAS t

Parra calcular laa matriz de varianza-cova


v
arianza de loss parmetros estimados,
neccesitamos determinar un esstimador para
a escalar 2. U
Una eleccin natural
n
es:

(A4.20)
Es tedioso, peroo no difcil, demostrar que s2 proporcionna un estimad
dor insesga-1
do de 2. Resuulta que s2(XX
X) produce un estimador insesgado de
d Var ().
Cuuando s2 se ussa para aproxiimar 2 nos basamos
b
en ell uso de la pruueba t. Para
haccerlo, empleaaremos los sigguientes resultados estadstticos:

tad
d.

1. ^ ^ /2 esst distribuiddo como ji cuaadrada con N - k grados de libertad.


2. (N k)s2/2 est distribbuido como ji cuadrada conn N - k grados de
d liber-

3. (i i), para
p i = 1, 2,..., k, est disttribuida en forrma normal con
c media
0 y varianza 2Vi, donde Vi es el isimo elem
mento diagonnal de (X'X)-1.
4. (N k)s2/2 y i i estn
e
distribuiidos en formaa independiennte.
El resultado es que
q

(A4.21)

estt distribuido en forma t coon N - k gradoos de libertadd. Esto nos peermite construuir intervaloss de confianzza para parm
metros de reggresin indivviduales en
unaa manera anloga al procedimiento desccrito en el capptulo 2. Paraa probar una
hip
ptesis respecto a un valor pparticular de i, sustituimoss ese valor en la ecuacin
(A
A4.21). Si el valor
v
t es lo bastante gran
nde en valor absoluto, recchazamos la
hip
ptesis nula en
e el nivel de confianza eleegido de mannera apropiada. Un intervallo de confianzza del 95% paara i, est daddo por:
(A4.22)

116

PARTE
P
UNO: Los fundamentos del anlisis de regressin

donde tc es el
e valor crticco de la distribbucin t asociada con un nivel
n
de signifficancia del 5%
%.
R2, PRUEBA
AF
Como se expplica en el texxto, nosotros podemos
p
diviidir la variaci
n total de Y en
dos porcionees, una repressentando la vaariacin expliicada y la seggunda represeentando la varriacin inexpllicada. Primerro asumimos que la variab
ble Y tiene unna
media 0. Enn notacin mattricial, la deriivacin resulta del hecho de
d que podem
mos
^
escribir el vector
v
Y com
mo la suma dee sus valores pronosticadoos = X y el
vector residdual ^:

Entonces,

TS
SS =RSS + ESS
E

donde TSS = suma total de cuadradoos


RSS = suma de cuuadrados de laa regresin (eexplicados)
ESS = suma de cuuadrados del error (inexplicados)
Entonces,

(A4.24))

Cuando la variable
v
depenndiente no tieene media 0, debemos modificar un poco
nuestra defiinicin de R2. Entonces yi = Yi Y, de lo cual resultta que:

Ahora, sustrrayendo NY 2 de ambos laddos de la ecuaacin (A4.23) y sustituyenddo,


encontramos que:
(A44.25)
Para corrregir la depenndencia de laa bondad de ajjuste de los grrados de liberrtad,
definimos R
2 como

(A44.26)

CAP
PTULO 4: El modelo de regresin mltiple
m

117

Ahora, es apropiado
a
connsiderar las pruebas
p
estadsticas sobre conjuntos
c
de
co
oeficientes dee regresin. La
L prueba usaada con mayoor frecuencia involucra la
prrueba de hiptesis conjuntaa de que 2 = 3 =
= k = 0. La estadstica F
ap
propiada es:

En
n ocasiones se usan otras ppruebas que involucran
i
coombinaciones de los parm
metros
de regreesin. Una veez ms, supn
ngase que Y tiiene una med
dia 0. En este
caaso podemos usar
u el resultado de que:

esst distribuidaa en forma F con k - 1 y N - k gradoss de libertad. Para probar


hiptesis conjuuntas que invvolucran los parmetros
p
d regresin individuales,
de
i
tan
n slo sustituuimos los vaalores de prueeba apropiadoos por y evaluamos
e
la
esstadstica F. Un
U valor sufi
ficientemente grande de F nos permitee rechazar la
hiptesis nula.
EJ
JERCICIOS
4.1 Considere lo
os siguientes doos modelos:

a) Demuestrre que
b) Demuesttre que los resiiduales de mn
nimos cuadrados son idnticos, es decir,
^ i = ^ i para i = 1,
1 2, , N.
c) Bajo qu
u condiciones la R2 asociadaa con el modello II ser menoor que la R2
asociada con el modelo
m
I?
4.22 Considere loos siguientes prrocedimientos experimentalees:
1. Ejecutar laa regresin Yi = 1 + 2X2i + 3 X3i + i.
^
2. Ejecutar la regresin X2i = 1+2 X3i +'i , calcular los residuales i ,y por ltimo
ejecutar la
l regresin
P
Puede demostraar que 2 = 2 ? Puede expliicar en forma inntuitiva por qu es verdadero
este resultado?
4.33 Un investigaador algo ingeenuo intenta esstimar una funccin de consum
mo agregado
paara la economaa estadounidensse regresando unna variable de cconsumo C sob
bre el ingreso
disponible Y y loos ahorros S. Ell modelo es
C = 1 + 2Y + 3 S +

118

PARTE UNO: Los fundamentos del anlisis de regresin

Qu tan buen ajuste es probable que obtenga este investigador cuando se ejecute esta
ecuacin? Puede generalizar su conclusin? Sugerencia: Observe que es C = Y - S idnticamente para todas las observaciones.
4.4 Suponga que las varianzas mustrales (y desviaciones estndar) de todas las variables en un modelo de regresin mltiple son idnticamente las mismas. En este caso,
cul es la relacin entre los coeficientes estandarizados estimados y los parmetros de
regresin estndar?
4.5 "Los parmetros de regresin estimados, elasticidades, coeficientes estandarizados y
coeficientes de correlacin parcial siempre tendrn el mismo signo." Esto es verdadero
o falso? Explique.
4.6 Explique las diferencias entre los conceptos de correlacin simple, correlacin parcial y correlacin mltiple. Por qu es til cada uno?

PARTE

DOS
MODELOS DE REGRESIN
DE UNA SOLA ECUACIN

La parte dos de este libro extiende el tratamiento del modelo de regresin de


una soja ecuacin. Comenzamos en el captulo 5 expandiendo la exposicin del
modelo de regresin mltiple, enfocndonos en la especificacin del modelo y la
prueba estadstica., Los temas en este captulo incluyen el uso de formas funcionales diferentes, variables indicadoras y pruebas t y F.
Las tcnicas de estimacin usadas en la primera parte del libro dependen en
forma decisiva de varias suposiciones relacionadas con la forma de los datos y la
especificacin del modelo. Los captulos 6 y 7 tratan con varias de estas suposiciones. En el captulo 6 nos enfocamos en la posible existencia de heterocedasticidad y correlacin serial, describiendo pruebas de su existencia y correcciones
para cuando estn presentes. En el captulo 7 nos ocupamos de las dificultades
que surgen en el modelo de regresin. Para corregir estos problemas, se introduce
el mtodo de variables instrumentales. Debido a que es probable que las
preocupaciones en este captulo surjan cuando el modelo que se est estudiando
es simultneo, el captulo 7 tambin sirve como una introduccin importante al
material de la parte tres (en especial el captulo 12). El captulo 7 se centra en los
problemas que surgen cuando los modelos de regresin son especificados en
forma incorrecta.
En el captulo 8 se discute el problema de pronosticar con un modelo de una
sola ecuacin. Se exponen los medios para obtener un pronstico y alguna medida de la confiabilidad del pronstico cuando se conocen las variables explicativas, del mismo modo que cuando son desconocidas y cuando los errores del
modelo de regresin se correlacionan en forma serial. El material en el captulo 8
establece las bases para el anlisis ms avanzado del pronstico en las partes
tres y cuatro.

119

120

PARTE DOS: Modelos de regresin de una sola ecuacin

Los tres captulos restantes en la parte dos contienen material de naturaleza


ms avanzada que el material en los primeros ocho captulos del libro. Todos
estos captulos se relacionan con extensiones del modelo de regresin que pueden ser importantes en l trabajo de econometra aplicada. El captulo 9 contiene
un tratamiento de cuatro temas importantes en el modelado economtrico: la
especificacin y estimacin de modelos rezagados distribuidos, pruebas estadsticas de causalidad; el problema de observaciones faltantes y el uso de datos
de panel (datos de corte transversal combinados y datos de series de tiempo).
En el captulo 10 se estudia la estimacin no lineal y la estimacin de mxima
verosimilitud. Aqu permitimos que se estimen modelos que son no lineales en los
parmetros. La estimacin de mxima verosimilitud es una tcnica poderosa que
se usa en forma amplia en el modelado economtrico. Este captulo expone
tambin la especificacin y estimacin de los modelos Arch y Garch, modelos en
los que el trmino del error es heterocedstico condicionalmente y, en particular,
la varianza del trmino del error depende de volatilidades en periodos previos.
Los modelos Arch y Garch, que han encontrado aplicaciones amplias en
finanzas, son estimados con tcnicas de mxima verosimilitud.
El captulo 11 trata de la estimacin de modelos en los que la variable que se
va a estudiar es cualitativa en lugar de cuantitativa. El captulo enfatiza la
forma en que pueden usarse los modelos de probabilidad lineal, probit, logit y
de regresin censurada para estudiar problemas que implican opciones mltiples. El contenido del captulo 11 es autnomo y puede leerse de manera independiente del captulo 10.

CAPTULO

USANDO EL MODELO
DE REGRESIN MLTIPLE

En el captulo 4 se hizo una introduccin del modelo de regresin mltiple,


enfatizando la forma en que no interpreta los coeficientes estimados, mide la
bondad del ajuste y realiza pruebas estadsticas. En este captulo nos enfocaremos en e1 uso del modelo de regresin mltiple. Comenzamos considerando la
forma funcional, concentrndonos en la distincin entre los modelos lineales y
los no lineales. Luego consideramos cmo, puede aplicarse el modelo de regresin cuando una o ms de las variables explicativas es una variable indicadora.
Tambin se estudiarn las estadsticas t y F apropiadas que se usan para realizar
las pruebas de hiptesis que implican grupos de variables independientes.

5.1

EL MODELO LINEAL GENERAL


Hemos estado tratando con ecuaciones que son combinaciones lineales de las X.
Esta especificacin no es tan limitante como podra parecer, debido a que el
modelo de regresin lineal puede aplicarse a una clase ms general de ecuaciones que son inherentemente lineales. Los modelos inherentemente lineales pueden expresarse en una forma que es lineal en los parmetros al transformar las
variables. Los modelos inherentemente no lineales, por el contrario, no pueden
transformarse1 a una forma lineal. Suponga que comenzamos con el modelo (no
lineal)
Y = F(X 2 , X 3 , . . ., X k , )

121

122

P
PARTE
DOS: Mod
delos de regresin
n de una sola ecua
acin

Figura 5.1

Formas funcionales no
lineales.

El modelo es
e inherentem
mente lineal sii puede ser trransformado en:
e

La relaccin en la ecuuacin (5.1) es inherentem


mente lineal deebido a que es
lineal con resspecto a los paarmetros 1, 2, 3, . . . , k. Dirigiremoos nuestra atenncin a la esttimacin de m
modelos inherrentemente noo lineales en el
e captulo 100.
Por el momeento, sin embaargo, ser imp
portante obserrvar algunos casos
c
especiaa-

El modelo I (el modelo poolinomial) pro


oporciona un medio
m
para prrobar si la reaacin entre Y y X2 es no linneal (aunque el
e modelo en ss es lineal en los coeficien-tes). Y se esppecifica para qque sea una funcin
fu
cuadrtica de X2 (sse muestra unaa
en la figura 5.1a).
5
Otra pruueba til paraa determinar nno linealidadess es proporcioonada por unaa prueba t esttndar de la hiiptesis nula de que 3 = 0.
0
El modeelo II tambinn es lineal en los
l parmetros y usa el logaritmo de cadda
variable.1 Au
unque la elecccin de la basee de los logarittmos no impoorta de maneraa
1

En vista de que d log Y/d Y = 1/Y, cada parrmetro 2,3 , . . . es una elasticidaad.

CAPTULO 5: Usando el mod


delo de regresin mltiple
m

123

coonsiderable (sslo afecta al trmino consstante en el m


modelo), de manera
m
tpica
ussaremos logarritmos naturaales para la baase e ( 2.7188) en nuestro anlisis. Un
ejemplo simplee de la funcinn logartmica se
s ilustra en laa figura 5.1b). El modelo II
puuede usarse si
s uno tiene razones paraa creer que laas variables entran en la
eccuacin multiiplicativamennte en lugar de
d aditivamennte. Esto puedde verse con
m facilidad notando
ms
n
que ell modelo II puuede derivarsee del modelo III (el modelo
m
multiplicativo)
tomando los logaritmos dee ambos ladoss.2 La equivallencia de los
doos modelos see ve al notar que:
q
1 = log 1

2 = 2

3 = 3

= log *

El modelo IV parece seer muy similaar al modelo III, pero la semejanza


s
es
enngaosa debiddo a que ninguuna transform
macin del moodelo IV propporcionar un
m
modelo
nuevo que sea lineaal en los parm
metros.
No caiga enn la trampa cuuando consideere las transformaciones quue hacen a los
m
modelos
linealees en los parmetros. A meenudo se pierdde algo en el proceso. Por
ejemplo, considdrese la transformacin deel modelo III al modelo II. Si se asume
quue el proceso de error est distribuido en
e forma norm
mal, el processo de error en
ell modelo III (*).no
(
ser nnormal. Por loo general, asuumimos que * sigue una
diistribucin cuuyo logaritmoo en s mism
mo est distribbuido en form
ma normales
deecir, ser lognoormal.3
Algunas esspecificaciones adicionales del modelo, qque son tiles en el trabajo
applicado, son como
c
las siguiientes:
V

Modello exponenciaal:

Y = exxp [(1 + 2X2 + 3X3)]

(5.6)

Toomando logarritmos de ambbos lados, este modelo pueede escribirse como:


log Y = 1 + 2X2 + 3X3 + lo g
VI

Modelo recproco:
r

(5.7)

Este modelo puuede transforrmarse en:

V Modelo semilog:
VII
s

(5.8)

V Modelo de
VIII
d interaccinn:

(5.9)

Ntese
N
que log Ab = b log A y log AB = log A + log
g B para cualquierr A, B y b.
Si
S * es normal, las pruebas de ssignificancia sern invlidas cuanndo se aplican al modelo II
daado que log * no
o seguir la distriibucin normal.
3

124

PARTE DOS: Modelos de regresin de una sola ecuacin

El modelo VIII es digno de atencin especial debido a la presencia de la tercera


variable de la derecha, el producto de las variables X2 y X 3. Para ver cmo afecta este
trmino de interaccin a la interpretacin que hace uno de los resultados de la
regresin, considrese el impacto de un cambio en X2 sobre Y. Si se omitiera el
trmino de interaccin, el efecto sera medido por 2. Sin embargo, con la
interaccin, el efecto es 2 + 4 X 3 [obtenemos esto diferenciando la ecuacin (5.9)
con respecto a X2]. Por tanto, el efecto de X2 en Y depende del nivel de la variable
X 3. Si 4 es positivo, el efecto de X2 en Y se incrementar conforme se incremente
el valor de X 3. Por supuesto, esto puede lograrse con otras formas de ecuaciones,
pero el trmino de interaccin es una opcin simple y directa.4

EJEMPLO 5.1

Una funcin de costo para la industria de ahorros y prstamos

La comprensin del aumento progresivo de las ganancias en la industria


de ahorros y prstamos es importante para los reguladores que deben decidir
si las fusiones y adquisiciones son de inters pblico, y para los administradores
que deben tomar decisiones internas acerca del tamao eficiente de las operaciones. En ambos casos la estimacin emprica de una funcin de costo puede
ser til.5
La produccin Q es medida como las acciones totales (en millones de dlares) de cada asociacin de ahorros y prstamos. Los costos operativos promedio
a largo plazo LAC, se miden como el gasto operativo anual promedio (en millones de dlares) como un porcentaje de las acciones totales. Usando datos para
86 asociaciones de ahorros y prstamos, se obtiene la siguiente relacin:
LAC = 238 - .615Q + .00054Q 2
La funcin LAC estimada tiene forma de U y alcanza su punto de costo
promedio mnimo cuando las acciones totales de la asociacin de ahorros y
prstamos alcanzan 569 millones de dlares.6 Debido a que la mayor parte de los
ahorros y prstamos tenan considerablemente menos que 569 millones de dlares en acciones, el anlisis de funcin de costos sugiere que una expansin de
los ahorros y prstamos a travs de su crecimiento o fusiones podra haber sido
valioso.

4
Los trminos de interaccin pueden combinarse
con2trminos cuadrticos para producir expre2
siones como Y = 1 + 2X2 + 3X3 + 4X2X3 + 5 X 2 + 6X 3 + . Probar la hiptesis nula de que 4 = 0
proporciona una prueba para la interaccin, y probar la hiptesis conjunta de que 4 = 5 = 6
= 0 proporciona una prueba de si estn presentes no linealidades. Estas pruebas se describen en la
seccin 5.3.
5
Este ejemplo se basa en J. Holton Wilson, "A Note on Scale Economies in the Savings and
Loan Industry", Business Economies, pp. 45-49, enero de 1981.
6
Esto puede verse haciendo la grfica de la curva o diferenciando la funcin de costo promedio
con respecto a Q, establecindola igual a 0 y resolviendo para Q.

CAPTULO 5: usando el mod elo de regresin mltiple


m

EJEMPLO 5..2

125

Prrediccin de prrecios de vinos


s

De manera traddicional, el prooceso de valuuacin de la caalidad de coseechas nuevas


dee vino se haba dejado a caatadores de viinos expertos.. Esta tradici
n haba sido
coonmocionada en forma graave por una seerie de anlisiis economtriccos recientes
dee valuacin de
d vinos que mostraban
m
qu
ue puede preddecirse el vallor futuro de
unna cosecha (ao de recolecccin) de un vin
no slo con baase en el climaa. Un estudio
in
nteresante en particular
p
impplica la valuaacin de vinoos cosechadoss en diversos
caastillos en la regin
r
de Burrdeos de Francia.7
Es bien, saabido en la inndustria vincola que los precios
p
de meercado de los
viinos produciddos en diferenntes pocas del
d mismo caastillo varan mucho. Por
ejemplo, los prrecios de subbasta en 1990-1991 en Lonndres para un
na docena de
bootellas de vinoos Chateau Laafitte 4g la dccada de 1960 variaron de un
u mnimo de
2223 dlares parra la cosecha 1968 a un mximo de 4 3335 dlares parra la cosecha
1,961. Hay doss razones paraa esta variabiliidad; una es que
q si los vinoos ms viejos
y ms maduross han de ser guardados
g
y vendidos
v
en ell mercado, deeben merecer
unna ganancia ecconmica (unn precio superrior) que reflej
eje el costo de oportunidad
dee guardar el viino, La segunnda razn es qu
ue hay una vaariacin consiiderable en la
caalidad de las uvas usadas para
p
hacer ell vino. La callidad de las uvas
u
a su vez
deepende en graan medida del .clima.
En un estuddio economtrrico del precio
o de los vinos ppara 10 cosechhas de 1952 a
19
980 para 60 vinos
v
diferentees de seis casstillos, Orley Ashenfelter y sus colegas
m
mostraron
que ambas razonnes son apoyadas por la eevidencia estaadstica. Los
auutores estimarron una regreesin de cortee transversal en la que la variable depeendiente, el logaritmo nattural del preccio de una doocena de boteellas de vino
(P
PRICE,), fue regresada coontra un trm
mino constantee (no. reportaado aqu), la
eddad de la coseecha (AGE,),, la temperatuura promedi durante la teemporada de
cuultivo (TEMP
P,), la precipittacin pluviall en septiembbre y agosto (RAIN,)
(
y la
prrecipitacin pluvial
p
en los meses anteriiores a la cosecha, de octu
ubre a marzo
(W
WRAIN,). Obtuvieron los ssiguientes resuultados (los errrores estndaar estn entre
paarntesis):

Cada uno dejos


d
coeficieentes de regreesin es estaddsticamente significativo
co
on un nivel del
d 5% usandoo una prueba t. Cada una de las variab
bles independiientes tiene un
na correlacinn relativamentte baja con caada una de lass otras variablles independiientes, y por tanto la mullticolinealidadd no es un problema.
p
El
co
oeficiente AG
GE proporcionna una medidaa de la tasa dee ganancia reeal al guardar
viinos de Burdeeos: cada ao aadicional de madurez
m
aumeenta alrededorr de un 2.4%
7
0. Ashenfellter, D. Ashmore y R. Lalonde, "B
Bordeaux Wine V
Vintage Quality annd the Weather"
Chhance, vol. 8, nm
m. 4, pp. 7-14, 19995.

126

P
PARTE
DOS: Mode
elos de regresin de una sola ecuaccin

el valor del vino.


v
El coeficciente de temp
peratura tienee el signo que predeciran loos
expertos en vinos: entre ms calurosa la temporaada de cultivo
o, siendo otraas
cosas igualess, mayor la caalidad de las uvas
u
que se cosechan.
c
La variable
v
TEM
MP
refleja un asppecto adicionaal del fenmeno de la tempperatura: un peeriodo calurosso
justo antes de
d la cosecha es importante en especial para la caliddad de las uvaas
cosechadas. Por ltimo, laa lluvia previa a la vendim
mia es un deteerminante possitivo muy siggnificativo de la calidad de la uva, mienttras que la lluuvia justo antees
de la cosechha tiene un efeecto negativoo muy fuerte een la calidad..
La contrroversia que rodea
r
el uso del
d anlisis dde regresin para
p
predecir el
precio de lass cosechas de vinos por los lagares surgee debido a que la calidad del
d
vino puede ser
s pronosticaada antes de que la cosechha se complette y, en consecuencia, antees de que cualquier vino en
n realidad seaa degustado. Es
E por esto quue
no es sorprenndente quiz qque el crtico de
d vinos Robeert Parker, Jr., haya llamadoo a
8
este enfoque una "forma tiipo Neanderthhal de ver el vino".
v
Los ecoonometristas sse
dan cuenta de
d que cualqquier modelo de regresinn con un ajusste menos quue
perfecto gennerar muchoss valores pron
nosticados quue son mayores que el valoor
real y muchoos que son m
menores. De acuerdo
a
con A
Ashenfelter, la
l revista Winne
Spectator al parecer no enntiende esta affirmacin, criticando el enffoque, "las prredicciones se volvieron cieertas con exactitud slo trees veces en las 27 cosechaas
desde 1961... Los precios pronosticados estn tanto por
p debajo como por encim
ma
de los precioos reales".

5.2

USO DE VARIABLES
V
INDICADOR
RAS
Las variabless usadas en lass ecuaciones de
d regresin, ppor lo general, toman valorees
a lo largo de un rango conntinuo. Sin em
mbargo, esto nno tiene que ser as y a vecees
podemos dessear usar una o ms variab
bles independi
dientes que tom
men dos o ms
valores distinntos. (La estim
macin cuand
do la variable dependiente es una variabble
indicadora see expone en ell captulo 11.)) Por ejemplo, podemos deesear explicar el
hecho de quee algunos inddividuos van a la universiddad y otros no
o. Para hacerlo,
creamos unaa variable indicadora que toma
t
el valor de 1 si el inddividuo va a la
universidad y 0 si el indiividuo no va.. Las variablees indicadoras son tiles en
e
particular cuuando se est tratando conn datos cualitaativos.
Ahora, suponga
s
que uuna empresa usa
u dos tipos de procesos de produccinn.
Bajo la hipttesis de que laa produccin obtenida de ccada proceso est
e distribuidda
en forma no
ormal con vaalores esperaddos diferentees pero variannzas idnticaas,
podemos reppresentar el prroceso de prodduccin comoo una ecuacinn de regresinn:
(5.100)

1995.

Robert Paarker, Jr., "Wine Equation


E
Puts Som
me Noses Out of Joint", New York Times,
T
4 de marzoo de

CAPTULO 5: Usando el mod


delo de regresin mltiple
m

127

doonde Yi es la produccin
p
associada con ell isimo proceeso de insumoo y Xi es una
vaariable indicad
dora:
1
0

Xi =

si la pproduccin ess obtenida de lla mquina A


si la pproduccin ess obtenida de lla mquina B

En
n este ejempllo bastante sim
mple, 1 midee la produccin esperada asociada
a
con
laa mquina B, mientras 2 m
mide la difereencia en la prooduccin asociada con un
caambio de la mquina
m
B a la mquina A. Esto puedde verse tomaando valores
essperados en am
mbos lados dde la ecuacinn (5.10) para Xi = 0 y Xi = 1:

Debe quedar claro


D
c
que unaa prueba de laa hiptesis nuula de que 2 = 0 es una
prrueba de la hipptesis de quee no hay diferrencia en la prroduccin asoociada con las
m
mquinas
A y B.
B De hecho, las estimacion
nes de mnim
mos cuadrados reales de los
paarmetros de regresin sonn la produccin media asociada con la mquina
m
By
laa diferencia en
ntre las produucciones meddias de A y B,, respectivam
mente.
Este proceedimiento pueede modificarrse con faciliddad si estn involucrados
i
m de dos vallores distintoss. Por ejemplo
ms
o, pueden empplearse dos vaariables indicaadoras para exxplicar el heccho de que la produccin pproducida porr cada uno de
tres procesos (A, B y C) puede no ser idntica. En el siguiente modelo:
(5.11)
donde
d

X2ii =

1 si laa produccin es
e obtenida dee la mquina A
0 de lo contrario

X2ii =

1
0

si laa produccin es
e obtenida dee la mquina B
de loo contrario

Po
or tanto, los tres
t procesos de produccin estn repreesentados porr la siguiente
coombinacin de
d valores tom
mados por las variables inddicadoras:
Mquina
M
A
B
C

X2

X3

1
0
0

0
1
0

Obteniendo loss valores espeerados, podem


O
mos interpretaar los resultad
dos de la regrresin:

128

PARTE DOS: Mode


elos de regresin de
d una sola ecuaccin

1 representaa el valor espeerado de la prroduccin aso


ociada con la mquina C, 2
representa la diferencia en
n produccin asociada
a
con un
u cambio de la mquina C a
la mquina A,
A y 3 mide el cambio pro
omedio en la produccin asociada
a
con un
u
cambio de laa mquina C a la mquina B.
B Una pruebaa de la hipteesis nula de qu
ue
2 = 0 propo
orciona una prrueba de la hiiptesis de qu
ue no hay difeerencia entre el
proceso de produccin aso
ociado con la mquina A y el asociado con
c la mquin
na
C, mientras que
q una prueb
ba anloga qu
ue compara B con C es prop
porcionada po
or
una prueba t en el coeficieente 3.
Observe que los tres prrocesos de pro
oduccin alterrnativos fueron
n representado
os
por dos variaables indicado
oras (con la terrcera implcitaa). La represeentacin de este
fenmeno haaciendo que u
una variable tome
t
tres valores, por ejem
mplo, mquin
na
A = 2, mquina B = 1, mquina C = 0, no es equivallente a la tcn
nica de variab
ble
indicadora a menos que laas diferenciass entre las pro
oducciones aso
ociadas con laas
comparaciones de la mquiina B con la A y de la mquiina C con la B sean idnticaas.
No comeeta el error dee representar el proceso dee variable indiicadora usand
do
tres variabless de dos vas X2, X3 y X4, do
onde X4 tome eel valor de 1 cuando
c
se usa la
mquina C y el valor de 0 de lo contraario. La introd
duccin de la variable X4 n
no
aade ms in
nformacin pero agrega un
na ecuacin n
no independieente en la derrivacin de loss estimadores de mnimos cuadrados.
c
De hecho, hay una
u colinealida
ad
perfecta en el
e modelo debido a que X4i = 1 - X2i X3ii para cada ob
bservacin i.
Supngaase que deseam
mos probar la hiptesis nulaa de que no haay cambio en la
produccin asociada
a
con un movimien
nto de la mqu
uina A a la mquina
m
B. Para
este propsito sera apro
opiada una prrueba F de lla hiptesis nula
n
donde lo
os
coeficientes de
d regresin 2 Y 3 son ig
guales. Sin em
mbargo, al replantear la ecu
uacin de regreesin, podem
mos hacer la misma
m
prueba usando la esstadstica t pro
oporcionada por
p los resultaados de la reg
gresin estnd
dar. Escribimo
os el modelo de
d
regresin com
mo:
Y i = 1 + 2 X 2i + 3 (X 3i + X 2i ) + i
Luego consid
deramos los trres casos:

La prueba esst dada por una


u prueba t de la hiptessis nula de qu
ue 2 = 0.
Ahora ex
xtendemos la nocin de varriables indicad
doras al caso ms general en
e
el que algunas de las variiables indepen
ndientes son ccontinuas mieentras otras so
on
indicadoras. Un ejemplo cclsico es el caaso de la funciin de consum
mo agregado, en
e
la que el raccionamiento, las campaaas de ahorro, etc., hacen que
q el compo
ortamiento de consumo en ttiempo de guerra sea diferrente del comp
portamiento en
e
tiempo de paaz. Distinguirremos entre cinco
c
casos d
diferentes de una
u funcin de
d
consumo agrregado simplee en la que el consumo agrregado est deeterminado po
or
el ingreso disponible agreegado sin rezaagos involucraados.

CAPTULO 6: Usando el modelo de regresin m


ltiple

Caaso I:

Ct = 1 + 2Yt + t

129

(5.12)

stte es el caso en
n el que Se suupone que el comportamiennto de consumo en tiempo
de paz y en tiem
mpo de guerraa es idntico en todos los aspectos.
Caaso II:

C t = 1 + 2Y t + Dt+ t

(5.13)

donnde Dt es iguaal a 1 si es tieempo de guerrra y es igual a 0 en tiempo


o de paz. Al
nottar que E(Ct) es igual a 1 + 2 E(Yt) enn tiempo de ppaz y es igual a ( 1+ ) +
2 E(Yt) en tiemp
po de guerra, vemos que ell caso II corressponde a la su
uposicin de
quee el interceptoo de la funcin de consum
mo cambia durrante el tiemppo de guerra
perro que el parmetro de la pendiente peermanece iguual. Una prueeba de si un
cam
mbio as es esstadsticamentte significativ
vo es proporciionada por un
na prueba de
la hiptesis
h
nulla de que = 0.
Caaso III:

C t = 1 + 2 Y t + (Dt Y t) + t

(5.14)

Ntese que E(Ct) = 1 + 2 E(Y


E t) en tiempo
o de paz y E(C
Ct) = 1+ ( 2 + ) E(Yt) en
tiem
mpo de guerrra, de modo quue el caso III corresponde a la suposici
n de que el
intercepto ha permanecido coonstante pero la pendiente ha
h cambiado. Una prueba
de si este cam
mbio es signifficativo es proporcionada
p
a por una prrueba de la
hipptesis nula dee que el coefiiciente de DtY t es 0.
Caaso IV:

C t = 1 + 2Y t + Dt + (Dt Y t) + t

(5.15)

Aq
qu se permitee que cambienn tanto la penddiente como eel intercepto. Sin
S embargo,, note que el modelo
m
todava ha sido exppresado en unaa sola ecuacin en la que
se supone que la
l varianza deel trmino del error es la m
misma en aoos de guerra
y de
d paz. La estiimacin por m
mnimos cuadrrados producee una estimacin nica
dell error estndaar de la" regreesin y de las distribucionees de los estim
madores de
loss parmetros de
d la regresin.

Enn este caso heemos permitiddo que la varrianza del errror vare de los
l aos de
gueerra a los aos de paz, E1 caso
c
V corresponde a ejecuutar dos regressiones separad
das y obtener estimaciones
e
separadas de los errores esstndar de la reegresin. El
lecctor puede veerificar para ver que los parmetros de regresinn estimados
en el caso IV y en el caso V son equivalenntes (1 , + 1 , 1*= 1 + , 2 = 2 , 2*
= 2 + ). La eleeccin del moodelo IV o el modelo
m
V depeende de si unoo cree que la
varrianza del errror es constannte a lo largo de
d todos los aaos del mod
delo.9
9

Es posible proobar la hiptesis nula de que la varianza


v
del errorr es constante enntre los aos de
gueerra y paz o, de manera ms genneral, cuando ess razonable deciddir asumir que loos modelos de
regrresin en verdadd cambian de un periodo a otro. Vase, por ejem
mplo, R.E. Quanddt, "Test of the
Hyppothesis That a Linear
L
Regressionn System Obeys Two
T Separate Reggimes", Journal of
o the American
Stattistical Association
n, vol. 55, pp. 3244-330, 1960.

130

PARTE
P
DOS: Mode
elos de regresin de
d una sola ecuacin

EJEMPLO
O 5.3

Diferenciales de salarios

Para evaluarr si las mujerres son discrim


minadas en la fuerza labo
oral en relacin
con los homb
bres, pueden estudiarse loss diferencialess de salarios usando
u
datos de
d
corte transveersal obtenidoos de la encueesta actual de poblacin deel Bureau of thhe
Census de Estados
E
Unidoos. En este esttudio de regreesin mltiplee se incluyeroon
las siguientes variables:
W = tasa salarrial de trabajaadores empleados en dlarres por hora
SEX
X = 1 si la peersona es mujer, 0 si es hom
mbre
ED
D = aos de eeducacin AG
GE = edad dell empleado
NONWH
H = 1 si la peersona no es hispana
h
ni es blanca; 0 de lo contrario
HISP
P = 1 si la peersona es hisppana; 0 de lo contrario
Entre los ressultados de reegresin obtennidos para unaa muestra de 206 empleadoos
se encontr lo siguiente ((estadstica t entre parnteesis):
= 10
0.93 - 2.73
3 SEX
(22
2.10)

R2 = .068

(-3.86)

F(l 20 4) = 14.9

La variable indicadora reepresentando el sexo del em


mpleado fue significativa
s
e
en
el nivel del 5%. En vista dee que el salario
o medio general por hora es de 9.60 dlarees,
la variable indicadora
i
noos dice que el
e salario proomedio de la mujer es 2.773
inferior o 6.8
87 dlares.
El difereencial salariall significativoo no desapareece cuando ell modelo de rer
gresin se expande para tomar en cueenta la edad y educacin del
d empleado al
igual que la raza o etnicidad de la perrsona:
= -66.41 - 2.76 S
SEX+.99ED + .12 AGE --1.06 NONW
WH+.24 HISP
P
(--3.38)

(-4.61)

(8.54)

R2 = .367

(4.63)

(-1.07)

(.22)

F(5 2000) = 23.2

Ntese que aunque


a
la eduucacin y la ed
dad son deterrminantes signnificativos de la
tasa salarial,, el diferenciaal entre hombbre y mujer siigue siendo esstadsticamennte
significativo.
Por ltim
mo, se observaa que el difereencial es inmuutable en gran medida cuanddo
se toma en cuenta
c
la posibilidad de unna relacin noo lineal entre AGE y la taasa
salarial, com
mo en la siguieente regresinn:

CAPTULO 5: Usando el modelo de regresin mltiple

131

Los trminos de edad en esta regresin nos dicen que, siendo iguales otras variables, conforme envejecen los trabajadores, su tasa salarial se incrementa (0.62),
pero con una tasa decreciente (-0.0063). Un estudio ms profundo de esta relacin muestra que la tasa salarial se incrementa hasta que se maximiza a la
edad de 49.2 aos y luego declina en forma constante de ah en adelante.10

EJEMPLO 5.4

Certificados de depsito

En este ejemplo se estima una ecuacin que predice el volumen total de certificados de depsito (CD, certificates of deposit) negociables posedos por el pblico
con una base mensual.11 La ecuacin es una relacin de demanda, y esperaramos
que la variable dependiente estuviera supeditada a la riqueza personal total y a la
tasa de inters que reciben los individuos cuando parte de esa riqueza es
invertida en un certificado de depsito. Por consiguiente, se eligi la tasa de
inters primaria sobre certificados de depsito (RCDP, rate on certificates of deposit)
como una variable explicativa. Sin embargo, los certificados de depsito deben
competir con otras acciones que producen intereses, como los bonos del tesoro y
los bonos corporativos. Por tanto, las tasas de inters sobre bonos del tesoro
(RTB, rates on Treasury bills) y bonos corporativos (Rbaa, corporate bonds) tambin
son Variables explicativas; cuando se incrementan estas variables, la demanda
total de certificados de depsito debera disminuir. Estas variables de tasas de
inters son multiplicadas por el ingreso personal (PI, personal income), esta ltima
variable sirve como una representacin para la riqueza personal. La diferencia
entre la tasa de inters de los bonos corporativos y la tasa de inters sobre papel
comercial de primara calidad (RCP, rate on prime comercial paper) tambin es una
variable explicativa, que representadla diferencia entre las tasas de inters a largo
y a corto plazo; cuando esta diferencia se incrementa, una inversin a largo
plazo (como un certificado de depsito) se vuelve ms atractiva. Finalmente,
tambin se introduce la variable dependiente rezagada para reflejar los rezagos
(captulo 9).
Dado que el volumen de certificados de depsito, al igual que muchas otras
variables financieras, exhibe un comportamiento estacional definido, se introduce un conjunto de variables indicadoras estacionales para explicar tanto de
este comportamiento estacional como sea posible. Las variables estacionales
(denominadas 53) toman la forma de variables indicadoras mensuales multiplicadas por el ingreso personal. En vista de que la primera indicadora estacional
toma el valor de 1 en enero y 0 en otro mes, la primera variable estacional toma
el valor del ingreso personal en enero. Hay un total de 12 variables estacionales
en el modelo, y el trmino constante ha sido quitado para eliminar el problema
10

Uno puede encontrar el 49.2 por sustitucin o usando clculo, resolviendo para encontrar la
edad a la que la tasa de cambio de la tasa salarial es igual a cero.
11
Este ejemplo ha sido adaptado de R. Pindyck y S. Roberts, "Optimal Policies for Monetary
Control", Annals of Economic and Social Measurement, vol. 3, pp. 207-237, enero de 1974.

132

P
PARTE
DOS: Mode
elos de regresin de una sola ecuaccin

dee la colinealid
dad. La ecuaciin fue estimaada usando mnimos cuadraados ordinarioos
coon los siguienntes resultadoss (la estadsticca t se encuenntra entre parntesis):

Coeeficientes estaciionales
Mes Coeficiente Estadstica
E
t Me
es
Ene.
Feb.
Mar.
Abr.

.01057
.00977
.00974
.00916

2.886
2.768
2.279
2.607

Ma
ayo
Jun
nio
Julio
Ago
o.

Coeficiente
e Estadstica t Mes Coeficiente Estadstic
ca t
.00952
.00971
.00163
.01208

2.656
2.659
3.137
3.265

Sept
Oct.
Nov.
Dic.

.01113
3
.01179
9
.01117
7
.01147
7

2.986
3.167
3.016
3.086

Los coefficientes estaccionales son todos


t
significativos en el nivel
n
del 5%, lo
que sugiere que
q las variacciones estacion
nales en el voolumen de los certificados dde
depsito sonn bastante im
mportantes. Los
L resultados sugieren qu
ue de agosto a
enero son loos meses de appogeo para teener cartera ppblica de CD
D, mientras quue
de febrero a julio las cartteras son relattivamente infferiores.

5.3

EL USO DE
E PRUEBAS
S t Y F PAR
RA HIPTES
SIS
QUE INVO
OLUCRAN MS
M
DE UN PARMET
TRO
La distribuciin F puede sser til para prrobar hiptesis en el conteexto del modeelo
de regresinn mltiple. El ejemplo ms importante oocurre cuando deseamos prrobar la hipteesis nula de qque un solo cooeficiente de regresin es igual a cero (o
cualquier otrro nmero). E
En este caso, laa prueba, F se reduce a una prueba t, con la
estadstica t relevante
r
calcculada como la
l proporcin del coeficientte estimado coon
el error estndar estimaado. La prueb
ba F tambinn se puede utilizar
u
cuanddo
deseamos prrobar la hipteesis nula de que
q todos los ccoeficientes de
d regresin soon
iguales a ceero. Aunque stas

son las dos situacionnes que ocurrren con mayyor


frecuencia enn econometraa, hay otros casos,
c
que a ccontinuacin se nombran, een
los que puedden ser tiles las pruebas t y/o F:
1. Prueb
bas conjuntass sobre varios coeficientes de regresin
2. Prueb
bas que involuucran las funcciones linealees de los coefficientes de reegresin
3. Prueb
bas que involuucran la igualldad de coeficcientes de reggresiones difeerentes

CAPITULO 5: Usando el modelo de regresin mltiple

5.3.1

133

Pruebas conjuntas sobre varios


coeficientes de regresin

La prueba F en R2 proporciona una prueba de la hiptesis nula de que todos los


coeficientes de regresin son cero, pero hay circunstancias en las que podramos
desear probar la significancia conjunta de un subconjunto de todos los coeficientes de regresin. (Las pruebas F conjuntas para muestras grandes son ejemplos de pruebas Wald, las cuales se describen con ms detalle en el captulo 10.)
Se proporciona un caso en la exposicin de las variables indicadoras. Recurdese
que en el caso IV en la seccin 5.2 incluimos una variable indicadora y un
trmino de interaccin indicador para permitir un cambio en la pendiente y el
intercepto de la funcin de consumo. Un segundo uso de la prueba conjunta
ocurre cuando uno desea ver si un grupo de variables explica el cambio en la
variable dependiente. Esto se aplica con frecuencia para modelos que incluyen
conjuntos de variables indicadoras, pero tambin se aplica en forma mucho ms
general.
Para ver cmo funciona la prueba conjunta, reconsidrese el modelo de
regresin mltiple
Y = 1+ 2X2 + + kXk +

(5.17)

Llamamos a ste el modelo no restringido (UR, unrestricted model), en vista de que


no se han hecho suposiciones acerca de alguno de los coeficientes de regresin.
Supngase que deseamos probar si un subconjunto q de los coeficientes de regresin es conjuntamente igual a cero. Para hacerlo es til volver a plantear la
ecuacin (5.17), dividiendo las variables en dos grupos, el primero conteniendo
k - q variables (incluyendo la constante) y el segundo incluyendo q variables:
Y = 1+ 2X2 + + k - q X k - q + k q

+1

Xk-q

+1

+ + kXk +

(5.18)

Si todos los ltimos coeficientes q son iguales a cero, el modelo correcto ser el
modelo restringido (por los coeficientes cero), denominado como R:
Y = 1+ 2X2 + + k - q X k - q +

(5.19)

La hiptesis nula, entonces, es que k q + 1 = = k = 0.


La prueba de la hiptesis nula es sencilla. Cuando eliminamos las variables
q del modelo y estimamos el modelo restringido en la ecuacin (5.19), la suma de
cuadrados del error (ESSR, error sum of squares) debe ser mayor que la suma de
cuadrados del error asociados con el modelo no restringido ESSUR. (Omitimos el
caso especial en el que ESSR = ESSUR.) Esto es equivalente al resultado de que R2
siempre se incrementa cuando se agregan variables adicionales al modelo de
regresin. Si la hiptesis nula es correcta, la eliminacin de las variables q tendr
poco efecto en el poder explicativo de la ecuacin y ESSR ser slo ligeramente
mayor que ESSUR. Por supuesto, cualquier prueba de la hiptesis nula debe
explicar el nmero de restricciones; es decir, el nmero de coeficientes

134

PARTE DOS: Modelos de regresin de una sola ecuaccin

establecidoss igual a ceroo y el nmeroo de grados de


d libertad disponible en el
modelo de regresin
r
no rrestringido.
La estad
dstica de prueeba apropiadaa es:

Aqu el num
merador es el incremento en
n la suma de cuadrados deel error dividida
entre el nm
mero de restriccciones de paarmetros impplcito en la hiptesis
h
nula,, y
el denominaador es la sum
ma de cuadraddos del error en el modelo
o no restringiddo
original diviidida entre el nmero de grados de liberrtad en el modelo no restriingido. Si la hiptesis
h
nulaa es cierta, la estadstica dee prueba dadaa en la ecuacin
(5.20) tendrr una distribbucin F con q grados de libertad en el
e numeradorr y
N - k en el denominadorr.12 La pruebaa F en el subbconjunto de coeficientes de
regresin see lleva a cabo igual que la
l prueba F een la ecuacin de regresin
entera. Elegiimos un nivel de
d significanccia, digamos 1 o 5%, y luegoo comparamos la
estadstica de
d prueba con el valor crticco de la distribbucin F. Si la
l estadstica de
prueba es mayor
m
que el vvalor crtico, reechazamos laa hiptesis nulla y concluim
mos
que el subconjunto de vvariables es estadsticamennte significativo. Como unna
regla generaal deben estim
marse dos ecuaaciones de regrresin separaddas para apliccar
la prueba enn forma correcta.
Aplicar la prueba F no es lo missmo que haceer un conjuntto de pruebass t
individualess en cada unaa de las variabbles en el subbconjunto. No
o es improbabble
que todas laas pruebas t sern
s
insignifi
ficantes aunquue la prueba F conjunta seer
significativaa. Estamos proobando si el grupo
g
de variiables es significativo, no las
l
variables inddividuales en ese
e grupo. (En
n el apndice 55.1 estudiarem
mos el problem
ma
especial de probar
p
cundoo estn involu
ucrados grupoos de variables indicadoras.)
La prueba F que se aacaba de desccribir es una ggeneralizacinn de la pruebaa F
en R2 que see expuso en ell captulo 4. Para
P verificar lla forma en que
qu se relacionnan
las dos, nottamos primerro que la prueeba F en un subconjunto de coeficienttes
puede escrib
birse en funciin de las R2 de las dos ecuaciones de regresin. Paara
hacer la com
mparacin, reccuerde que R2 = 1 - ESS/TSS, donde (TSS, total sum of
squares) es la suma de cuuadrados totaal en la regresiin. Entoncess,

Am
mbas ecuacioones de regressin tienen laa misma variaable dependieente y por tannto
la misma
m
suma dde cuadrados total,
t
de modoo que TSSUR = TSSR. Sustittu12
La distrribucin F resultaa porque (bajo laa hiptesis nula) ttanto el numeradoor como el denom
minador represenntan sumas de vaariables al cuadraado y estn distrribuidos (de mannera independiennte)
como ji cuadraada.

CAPTULO 5: Usando el modelo de regresin m


ltiple

135

yenndo las dos eccuaciones antteriores en la ecuacin (5.220), encontram


mos que la
esttadstica de prrueba tambin puede escriibirse como:
(5.21)
Ahhora el hecho de que la pruueba F en R2 es un caso especial
e
pued
de verse con
faccilidad. Para la
l prueba en R2, la hiptesiis nula es quee todas las varriables k - 1
disstintas que la constante, soon conjuntam
mente iguales a cero. En este
e caso, el
nm
mero de restrricciones de pparmetros se vuelve q = k - 1. Ademss, el modelo
resstringido es la regresin de Y en una constante. Dado que
qu R2 es una medida
m
de la
2
varriacin expliccada alrededorr de la mediaa, R es idntiicamente ceroo en el caso
resstringido. La sustitucin
s
de ambas piezass de informaccin en la ecuaacin (5.21)
muuestra que R 2URR =R2.

EJEMPLO 5.5
5

De
emanda de vivie
enda

Para estudiar laa demanda de vivienda, se especific el siguiente moodelo de regreesin:


log Q = 1 + 2 logg P + 3 log Y +
doonde Q = meddida de la canntidad de vivieenda en pies cuuadrados conssumidos por
cada una de 3 1220 familias po
or ao
P = preccio por unidad de viviendaa en la localiddad de la famiilia
Y = meddida del ingreeso familiar
Loos resultados de
d la estimaccin fueron (loos errores esttndar estn entre
e
parntessis):

Loos resultados implican unaa elasticidad del


d precio de la demanda de
d -0.247 y
unna elasticidadd del ingreso de 0.96. Am
mbas elasticiddades son sig
gnificativameente diferentees de cero, enn virtud de quue las razoness t son aproxim
madamente
14 y 37 en vallor absoluto. Sin embargo
o, es ms intteresante pregguntar si la
elaasticidad del ingreso
i
de 0.996 es significaativamente diiferente de 1. La estadstica correcta es:

136

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

o, en estte caso,

En vista de que el valor ccrtico de la diistribucin t een el nivel dell 5% es 1.96, no


podemos reechazar la hipptesis nula de
d que la elastticidad del inngreso de la ded
manda es 1.
Ahora supngase
s
quue deseamos saber si la demanda
d
de vivienda
v
de los
l
negros difiere de la de loss blancos. Porr tanto se expande el modeelo para permiitir
diferentes pendientes e innterceptos. Si suponemos qque D represennta una variabble
indicadora igual
i
a 1 paraa las viviendas de negros y 0 de lo contrrario, el modeelo
expandido es:
e
log Q = 1 + 1D + 2 log P + 2D log P + 3 log Y + 3D log Y +
Cuando se estim
e
este m
modelo expanddido, los resuultados fueron
n

Las pruebass t en los coefficientes indiv


viduales de loos trminos quue involucrann a
las variabless indicadoras m
muestran que el primero es insignificantee (en el nivel ddel
5%), el seggundo apenas insignificantee y el terceroo significativoo. Sin embarggo,
deseamos probar la hipttesis nula de que
q los coeficcientes indicaadores son toddos
conjuntameente igual a ceero; es decir,
1 = 2 = 3 = 0
Debido a quue nuestra infoormacin est dada en funcin de R2, apliccamos la form
mu2
lacin dadaa en la ecuaccin (5.21). En
E funcin dde esa notacin, R UR = .3880,
2
R R = .371, N = 3 120, k = 6 y q = 3. La
L estadstica F apropiada es:
e

Esto excedee el valor crtiico de la distriibucin F ya ssea en el niveel del 1% o enn el


del 5%, y por tanto recchazamos la hiptesis nulla de demanda de viviennda
idntica parra negros y bllancos. Ntesse que con unn conjunto de datos suficieentemente graande no se reequiere demasiado incremento en R2 para permitirnnos
rechazar la hiptesis nulla de igualdadd entre un subbconjunto de coeficientes.

CAPTULO 5:
5 Usando el mode
elo de regresin mltiple
m

5..3.2.

137

Prue
ebas que in
nvolucran fu
unciones lineales
de los coeficientes de reg
gresin

En
n ocasiones se puede desear probar hip
ptesis que im
mplican combiinaciones lineeales de coefiicientes de reegresin. Sup
ngase, por eejemplo, que ha estimado
un
na funcin de consumo C = 1 + 2YL + 3YNL + , don
nde YL represen
nta el ingreso
lab
boral y YNL representa el ingreso no laboral. Podra desear probar laa hiptesis de
qu
ue la propensi
n marginal a consumir es 1; es decir, 2 + 3 = 1. O podra
p
desear
prrobar si las dos propen
nsiones marg
ginales a con
nsumir son iguales; es
deecir, 2 = 3.
En esta sub
bseccin se eestudiar cada uno de esto
os dos casos especiales.
Co
omenzaremoss con el modeelo no restring
gido de dos v
variables:
Yi = 1 + 2X2i + 3X3i + i
Co
onsidrese prrimero la hip
tesis nula dee que los dos coeficientes de regresin
so
on iguales. Si la hiptesis n
nula es ciertaa, estimaremo
os un modelo de mnimos
cu
uadrados restrringido, dado por:
Yi = 1 + 2 (X
X2i + X3i) + i
Laa prueba F aprropiada est d
dada por la ecu
uacin (5.20) o la ecuacin (5.21),
(
con el
n
mero de resttricciones q ig
gual a l .
La misma hiptesis
h
nulaa puede probarse tambin usando
u
una pru
ueba t. Para
haacer la pruebaa, estime la siiguiente ecuaccin:
Yi = 1 + 2 (X2i + X3i) + X3i + i

(5.22)

Sii la hiptesis nula es verd


dadera, = 0,, lo cual pued
de probarse usando
u
una
prrueba t estnd
dar del coeficciente estimad
do en X3 en laa ecuacin (5.22).
Ahora, si se
s desea prob
bar la hiptessis de que 2 + 3 = 1. El modelo no
reestringido es como el anteerior. Para esstimar el mod
delo restringiido, tan slo
su
ustituimos 3 = 1 - 2 en el modelo no reestringido:

Laa estimacin de este ltim


mo modelo resstringido (con
n variable dependiente Yi
- X3i y variable independientee X2i X3i) pro
oporciona el iinsumo necesaario para una
prrueba F. Una vez ms hay una restricci
n, as que q = 1.

138

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuacin

EJEMPLO
O 5.6

Demanda de vivienda
v

Supngase que
q hemos esttimado el mod
delo no restriingido del ejeemplo 5.5 (coon
una R2 de 0.380). Deseam
mos probar laa hiptesis nuula de que la elasticidad deel
ingreso de laa demanda parra la viviendaa de negros ess igual a 1. Baajo la hiptesiis
nula 3 + 3 = 1. Sustituyenndo 3 = 1 - 3 en el modelo expandido y replantendolo
r
o,
obtenemos el modelo resttringido:
log Q - Dlo
og Y = 1 + 1D + 2logP + 2DlogP +3(log Y - Dlog Y) +
La R2 asociaada con el m
modelo restrinngido (el cuaal tiene una restriccin)
r
ees
0.3785. De la ecuacin (55.21), la estaddstica F relevvante est dadda por:

Dado que F es mayor quee el valor crtiico con un nivvel de significcacin del 5%
%,
podemos recchazar la hiptesis nula.

5.3.3.

P
Pruebas
que
e involucran la igualda
ad
de
e coeficienttes de regre
esiones dife
erentes

En ocasioness uno no est seguro de si un modelo sse aplica a doos conjuntos de


d
datos diferenntes. Por ejem
mplo, en la funncin de conssumo usada enn la exposicin
anterior de laas variables inndicadoras. El caso IV ilustrra la formulacin del modello
en el que un
n modelo de regresin se aplica en aos de guerra y un segunddo
modelo se applica en aos de paz. Difierre del caso V en virtud de que asumimoos
que los parm
metros de penndiente e interrcepto son disstintos pero taambin que loos
errores en am
mbas ecuacioones tienen la misma variaanza. (En el captulo 6 mosstraremos cm
mo probar la suposicin dee varianza idntica.)
Para probar si la supoosicin de quee hay dos moddelos de regreesin diferentees
es correcta, comenzamos
c
con la hipteesis nula de quue las regresiiones son idnnticas y vemo
os si podemos rechazar estaa hiptesis. Parra hacer la prrueba de Chow
w,
considrensee los siguientees modelos dee regresin:

En la primeraa ecuacin poonemos como subndices lass variables conn i para indicaar
observaciones que van dee 1 a N.13 En la segunda eccuacin poneemos sub13
Esta pruueba fue disea da por Gregory C. Chow en "T
Tests of Equalityy between Sets of
Coefficients in Two
T
Linear Regrressions", Econom
metrica, vol. 28, pp. 591-605, jullio de 1960. Vaase
tambin Frankllin M. Fisher, ""Tests of Equaliity between Setts of Coefficien ts in Two Line ar
Regressions: Ann Expository Notee", Econometrica,, vol. 38, pp. 361 -366, marzo de 1970.

CAPTULO 5: Usando el modelo de regresin m


ltiple

139

nd
dices con j parra las variablees que van de 1 a M. Hemos permitido qu
ue todos los
coeeficientes de regresin difiieran de la eccuacin (5.23aa) a la ecuaciin (5.23b).
Suupngase que estimamos ell modelo impllicado por lass dos ecuacion
nes aplicando mnimos cuaadrados ordinaarios a cada ecuacin
e
de m
manera individdual. Ya que
no se han colocado restriccioones en los paarmetros del modelo, podeemos calcularr la suma de cuadrados
c
no restringida co
omo la suma de las sumass de cuadradoss de los errorees de las ecuacciones individduales, ESSUR = ESS1 + ESS
S2. El nmero de grados dee libertad es lla suma del nmero
n
de graados de liberttad en cada
reggresin indiviidual; es deciir, (N - k) + (M
M - k) = N + M - 2k.
Supngase que la hipteesis nula es verdadera,
v
es decir, 1= 1, 2 = 2,...,
k = k , y Var(i) = Var(j). Enntonces, el mod
delo de regresiin puede escrribirse como
la siguiente ecuuacin nica:
Yi = 1 + 2 X2i + + k Xki +

(5.24)

don
nde el subnddice i corre ahhora de la ob
bservacin 1 a la observacin N + M.
Ahhora estimam
mos la ecuacin (5.24) usanndo mnimoss cuadrados ordinarios
o
y
callculamos la suuma de cuadraados del error restringida
r
ES
SSR. Si la hiptesis nula es
verrdadera, las restricciones no daarn el poder exxplicativo dell modelo y
ES
SSR no ser muucho mayor quue ESSUR. Como antes, poddemos realizarr una prueba
F para
p
ver si laa diferencia entre las dos sumas
s
de cuaadrados de los errores es
siggnificativa. Puuesto que hayy N + M - 2kk grados de libbertad en la regresin
r
no
resstringida y hayy k restriccionnes, la estadsstica F apropiaada es:14

Si la estadsticaa F es mayor qque el valor crtico de la diistribucin F con k y N +


M--2k grados dee libertad, poddemos rechazzar la hiptessis nula. Aqu el rechazo
im
mplica que debben estimarsee dos regresiones separaddas: los datos no pueden
com
mbinarse.

EJEMPLO 5.7
7

De
emanda de vivie
enda

Su
upngase que creemos que la demanda de
d vivienda es modelada meejor por dos
ecuuaciones, unaa que describee la demanda de
d vivienda de los negros y la otra que
describe la dem
manda de los blancos. (Esto es equivalentte al caso V en
n la seccin
sobbre variables indicadoras.)) El modelo es:

14
La estadsticca sigue una distrribucin F debid
do a que cada sum
ma de cuadrados del error sigue
unaa distribucin ji cuadrada
c
(vase el captulo 2), ell numerador con k grados de liberrtad y el denominnador con N + M - 2k. Dado quee las dos distribucciones son indepeendientes, el cociiente sigue una
disttribucin F.

140

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

Deseamos probar
p
la hipttesis nula de que
q el conjuntto de coeficieentes en la ecuuacin de dem
manda de los nnegros es iguall al conjunto de
d coeficientes en la ecuacin
de demandaa de los blanccos. La hipteesis nula es qque (conjuntam
mente):
1 = 1

2 = 2

3 = 3

Para reaalizar la pruebba estimamoss primero el m


modelo anterioor y agregam
mos
la suma de cuadrados
c
dell error en cadaa una de las eecuaciones. En
ncontramos que
q
ESSUR = 13 640. Ahora suuponemos quee la hiptesis nula
n es verdadeera. Entonces, el
modelo se reduce
r
a:
lo
og Q = 1 + 2 log P + 3 log
gY+

p todas las familias


para
f

Cuando estiimamos este modelo restriingido, enconntramos que la


l suma de cuuadrados del error
e
es ESSR = 13 838. Daddo que hay k = 3 restriccionnes y en vista de
que N + M - 2k = 3 120 - 6 = 3 114 graados de libertaad, la estadsttica F apropiaada
con 3 restriccciones y 3 114 grados de libertad es:

Ya que el vaalor de la estaddstica F es maayor que el vaalor crtico de la


l distribucinn F
en el nivel del 5%, rechhazamos la hiiptesis nula. Es incorrecto asumir coeeficientes iguaales.

La concclusin del ejeemplo 5.7 no es sorprendeente a la luz de


d los resultaddos
de la pruebaa anterior en los ejemplos 5.5 y 5.6. Loo que podra parecer
p
sorpreendente es quee la estadsticaa de prueba aqqu es idnticaa a la estadstiica calculada en
el ejemplo 5.5. En el m
modelo no resttringido del ejemplo
e
5.5 permitimos
p
q
que
variaran el intercepto
i
y todos los coefficientes de peendiente, iguaal que lo hem
mos
hecho aqu, especificanddo dos ecuacioones de demaanda diferentees. Cuando esstimamos usaando la estim
macin de mnimos cuadrados ordinarios, ambos pap
rmetros sern idnticos, puesto que ambos modelos son analtticamente equuivalentes. Esstos que perm
miten que cam
mbie el mismoo parmetro, tienen
t
el mism
mo
nmero de grados
g
de libertad y tienen
n los mismos residuales. La
L suma de cuuadrados del error
e
en la especificacin de
d dos ecuaciiones es la suuma de los ES
SS
para cada ecuacin. Por tanto, aunquee probar subcconjuntos de coeficientes, en
general, no ser lo mism
mo que probaar la igualdadd de coeficienntes entre ecuuaciones, los dos son idnnticos cuando
o uno introduuce variables indicadoras de
modo que cambien todoss los parmetrros en el modeelo.

CAPITULO
O 5: Usando et mod
delo de regresin mltiple

5.4

141

REGRESIN
N LINEAL PO
OR SEGMEN
NTOS
La mayor partte de los moddelos econom
L
mtricos que hhemos estudiado han sidoo
c
continuos,
conn cambios peqqueos en unna variable quue tienen un efecto
e
mensu-raable en otra variable.
v
Estaa estructura fuue modificadaa cuando usam
mos variabless
inndicadoras paara explicar los
l cambios en
e la pendiennte o en el inttercepto o enn
a
ambos.
Por coonsiguiente ess razonable extender el annlisis un pasoo ms permitiiendo cambioos en la penddiente, con la restriccin dde que la lnea que se est
e
estimando
seaa continua. Un
U ejemplo simple
s
se muuestra en la figura
f
5.2. Ell
m
modelo
verdad
dero es continnuo, con un roompimiento esstructural. Si estuviramoss
e
explicando
el consumo com
mo una funciin del ingresso, por ejempplo, el rompi-m
miento
estructtural podra ocurrir en alg
n momento durante
d
la Seg
gunda Guerraa
M
Mundial
(o po
odra haber doos rompimienttos, uno al priincipio y uno al final). N-teese que no hayy una disconttinuidad o cam
mbio en el nivvel de consum
mo de un ao a
o Este modeelo lineal por ssegmentos con
otro.
nsiste en dos ssegmentos de lnea
l
recta.
Los modeelos lineales por
p segmentoos son casos eespeciales dee un conjuntoo
m
mucho
mayor de modelos o relaciones llaamado funcionnes en tiras. Esstas funcioness
tiienen piezas distintas,
d
peroo la curva quee representa a cada pieza ess una funcinn
c
continua
y no necesariamennte una lnea recta. En un caso tpico, se
s escoge quee
laa ranura sea un
u polinomio del tercer graado y el proceedimiento garrantiza que laa
p
primera
y seguunda derivadaas sern contin
nuas.15
Para estim
mar el modelo dado en la fig
gura 5.2, conssidrese la sig
guiente expresin:
s
C t = 1 + 2 Y t + 3 (Y t Y t 0 )D t + t

(5.26)

donde
d
C t = co
onsumo
Yt = ing
greso
Y t 0 = in
ngreso en el ao en que ocuurre el rompim
miento estructural

Para
P los aos anteriores e iincluyendo ell rompimientoo, Dt = 0, de modo
m
que:
E(Ct) = 1 + 2 Y t

(5.27)

S embargo, despus del rompimiento,


Sin
r
Dt = 1, de modo que:

(5.28)
15
Vase D.J.. Poirier, The Econometrics of Strucctural Change (A
Amsterdam: North--Holland, 1976), o
D. Suits, A. Masoon y L. Chan, "Sppline Functions Fitted
D
F
by Standardd Regression Metthods", Review off
E
Economics
and Sta
atistics, vol. LX, pp.
p 132-139, febreero de 1978.

142

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaci
n

Figura 5.2
Modelo de regresin
r
lineal por se
egmentos.

Antes del rom


A
mpimiento la lnea tiene unaa pendiente 2, pero despus la pendientee
c
cambia
a 2 + 3 (y tambinn cambia el inntercepto). Obbserve, sin em
mbargo, que noo
h discontin
hay
nuidad ya quee,

Ntese
N
tambi n que cuanddo 3 = 0, la eccuacin de coonsumo se red
duce a un soloo
^
segmento
s
de lnea recta, dde modo que una prueba t de 3 = 0 prooporciona unaa
prueba
p
simplee para el cam
mbio estructur al.
Qu pas ara si hubierra dos rompim
mientos estruccturales, ocurrriendo en los
momentos
m
t 0 y t 1? Entonce s, el modelo apropiado
a
sera:

ddonde Yt1 reppresenta el inggreso en el quue ocurre un segundo rom


mpimiento est
tructural
y

L ecuacionnes de cada unno de los tres segmentos dee lnea son enntonces:
Las

5.4.1

M
Mtodo
de regresin co
on cambio estructurall

P
Pueden
haberr situaciones en las que yaa no es apropiiado asumir que
q el modeloo
d regresin ess continuo. Enn el modelo de regresin con cambio estrucctural ms gede

CAPTULO 5: Usando el modelo de regresin mltiple

143

neral, se supone que la varianza del trmino del error es la misma a lo largo del
periodo que se est estudiando pero tanto el intercepto como la pendiente pueden cambiar en el punto del rompimiento estructural. Cuando se conoce el
punto del rompimiento, el modelo de regresin puede escribirse como:
C t = 1 + 2Y t + 3D t + 4D t Y t + t

(5.29)

el cual es el modelo que fue presentado originalmente como el caso IV en la


seccin 5.2 sobre el uso de variables indicadoras.
Cuando no se conoce el punto de rompimiento, ste al igual que los
parmetros de regresin pueden estimarse usando el mtodo de mxima verosimilitud.16 Al suponer que la varianza del error es igual para el periodo entero en
estudio, implica estimar la ecuacin (5.29) para diferentes valores del punto de
rompimiento estructural t0. Elegimos como el punto de rompimiento el valor de t0
que minimiza la suma de cuadrados de residuales de la regresin (o de manera
alternativa que maximiza R2).

5.5

EL MODELO DE REGRESIN MLTIPLE


CON VARIABLES EXPLICATIVAS ESTOCSTICAS

Hasta este punto hemos asumido que las variables independientes en el modelo
de regresin mltiple eran fijas, es decir, no estocsticas. En ocasiones, sin
embargo (como cuando el investigador obtiene muestras de valores tanto para
X como para Y), ser ms apropiado asumir que las X son extradas al azar de
una distribucin de probabilidad. Por suerte, podemos hacer esto y an mantener la mayor parte de los resultados anteriores. Haremos las siguientes suposiciones:
1. La distribucin de cada una de las variables explicativas es independiente de los parmetros de regresin verdaderos.
2. Cada una de las variables explicativas est distribuida en forma independiente de los errores en el modelo.
Todas las propiedades bsicas de los estimadores de mnimos cuadrados continan mantenindose. Sin embargo, ahora pensamos en los parmetros de regresin como si se hubieran estimado en forma condicional a los valores dados de
las X.
16
El mtodo funciona maximizando la funcin de verosimilitud usual (vase el apndice 2.2) y
buscando todos los puntos de rompimiento posibles. Para mayores detalles, vase S.M. Goldfeld y
R.E. Quandt, "The Estimation of Structural Shifts by Switching Regressions", Annals of Economics and
Social Measurement, vol. 2, pp. 475-485, octubre de 1973. Una aplicacin interesante que trata de los
mercados en desequilibrio se expone en R.C. Fair y D.M. Jaffee, "Methods of Estimation for Markets
in Disequilibrium", Econometrica, vol. 40, pp. 497-514, 1972.

144

PARTE DOS: Modelos de regresin de una sola ecuacin

Si examinamos las propiedades incondicionales del estimador OLS, la falta


de sesgo ya no est garantizada. Sin embargo, afortunadamente todava es posible mostrar que el OLS es consistente y eficiente para muestras grandes
(asintticamente). Por ltimo, tambin es cierto que los estimadores de mnimos cuadrados son los estimadores de mxima verosimilitud de los parmetros
de regresin verdaderos.
Debido a los resultados precedentes concernientes a las variables explicativas estocsticas (y al hecho de que los estimadores a menudo son sesgados por
otras razones), los econometristas tienden a enfocarse en propiedades de las
muestras grandes de los estimadores como la consistencia. En general, haremos
lo mismo, en especial en el captulo 12, donde se exponen modelos de ecuacin
simultnea.

APNDICE 5.1
Pruebas que involucran coeficientes de variable indicadora

En el anlisis de regresin mltiple, los coeficientes en cada variable indicadora


miden el impacto diferencial entre la categora incluida (recibiendo un valor de
1) y la categora o indicadora que se ha eliminado de la regresin. Como resultado, la prueba t evala la hiptesis nula de que la pertenencia a las categoras
incluidas y excluidas tendr un impacto idntico. Sin embargo, cuando hay dos o
ms conjuntos de variables indicadoras, los resultados de la regresin se vuelven
ms difciles de interpretar y probar. Como un ejemplo, supngase que estamos
prediciendo los gastos totales en vivienda como una funcin del ingreso y el
nmero de hijos, cada uno de los cuales se ha clasificado en diversas categoras.
Para ser especficos, se tiene que:
H = Gasto anual en vivienda
1 si el ingreso 10000 dlares (ingreso bajo)
I1
I2

I3
Ct

0 de lo contrario
1

si el ingreso > 10000 dlares pero 20000 dlares (ingreso medio)

0 de lo contrario
1

si el ingreso > 20000 dlares (ingreso alto)

0 de lo contrario
1

si no tiene hijos

0 de lo contrario

C2

1 si tiene 1 o 2 hijos
0 de lo contrario

C3

1 si tiene ms de 2 hijos
0 de lo contrario

CAPTUL
LO 5: Usando el moodelo de regresin mltiple
m

145

Cu
uando eliminaamos la prim
mera variable indicadora
i
enn cada categorra pero incluuimos un trm
mino constantte, la especifiicacin del m
modelo es:

Coon esta especcificacin 2 mide los gasstos diferenciaales en viviennda para un


ind
dividuo sin hijos y un ingrreso medio en
n relacin conn un individuoo sin hijos y
coon un ingreso bajo. La pruueba t evala la hiptesis nnula de que loos gastos en
viv
vienda son igguales para am
mbos grupos. La comparaccin se hace por
p tanto en
rellacin con to
odas las categgoras represeentadas por iindicadoras que
q han sido
eliiminadas del modelo.
m
Con ffrecuencia estta comparacin no ser til. Un anlisis
ms constructivvo podra invvolucrar la medicin de loos gastos difeerenciales en
vivvienda de un individuo coon ingreso meedio en relaciin con un in
ndividuo con
inggreso bajo, los cuales tieneen ambos el mismo
m
nmeroo de hijos que el promedio
dee todos los inddividuos en laa muestra.
Para ver cmo puede addaptarse la reg
gresin mltiiple para mannejar esta situaacin, considdrense las siiguientes variiables y la esspecificacin del modelo
revvisado:

Paara todas las co


ombinacioness posibles de caractersticas
c
familiares el valor esperaddo de la variaable dependieente es como sigue:
Ca
ategora

Valor esperado E(H)

Ing
greso bajo, 0 hijo
os

a + b1+ C1

Ing
greso medio, 0 hijos
Ing
greso alto, 0 hijo
os
Ing
greso bajo, 1 o 2 hijos
Ing
greso medio, 1 o 2 hijos
Ing
greso alto, 1 o 2 hijos
Ing
greso bajo, ms de 2 hijos
Ing
greso medio, m
s de 2 hijos
Ing
greso alto, ms de
d 2 hijos

a + b2 + C1
a - b1 b2 + C1
a + b1 + C2
a + b2 + C2
a - b1 - b2 + C2
a + b 1 - C1 - C2
a + b2 - C1 - C2
a - b1 - b2 + C1 - C2

Sii luego sumam


mos las nueve categoras, encontramos qque el valor essperado geneeral (el efecto promedio) ess igual a a, el trmino consstante. Si sum
mamos toda

146

PARTE DOS: Modelos de regresin de una sola eccuacin

las categooras tomadas en combinacciones de tres (por ejemploo, 0 hijos, 1 o 2


hijos, mss de 2 hijos), podemos
p
encontrar el efectoo promedio paara cada categoora o gruppo.
La intterpretacin dde los coeficieentes es senciilla. Por ejem
mplo, b1 mide la
extensin con la qque los inddividuos conn ingresos bajos gastaan
diferenciaalmente en vivvienda en relaccin con el indiividuo promediio en la muestrra.
c1 mide el gasto
g
diferenciial asociado con no tener hij
ijos. Para indivviduos sin hijoos
y con inggresos bajos, el diferenciaal es b1 + c1. La prueba t asociada coon
b1 entoncees proporcionaa una prueba de
d la hiptesiss nula de que el gasto de loos
individuos de ingresos bajos es diferrente del prom
medio, mientraas que la pruebba
t asociadaa con c1 pruebaa si las familias sin hijos gaastan en form
ma diferente del
d
promedio.
Hay, por supuesto,, una relacin
n estrecha entrre los coeficieentes en amboos
modelos. En particularr,
2

b2 - b1

2 = c 2 c 1

= - 2 b1 -

3 =

- 2 c1 -

b2

c2

a = a + b1 +

c1

Cul esp
pecificacin de la forma para variablles indicadorras deberamoos
elegir? Laa respuesta deepende de cul hiptesis nula
n
nos gustaara probar. En
E
muchos casos
c
las hiptesis nulas associadas con la especificaccin alternativva
son ms apropiadas que aquellass que surgenn en forma directa de la
especificaacin usual dee variable inddicadora. De hhecho, la espeecificacin ms
nueva pueede ser til enn especial cuuando hay connjuntos granddes de variables
indicadoraas como pronnosticadores, debido a quee hace que suu interpretacin
sea sencillla. Sin embaargo, cuando uno
u o ms dee los pronostiicadores es unna
variable continua,
c
la interpretacin
i
n se vuelve ms
m difcil y la ventaja del
d
procedim
miento es limittada.
EJERCIC
CIOS
5.1 Dado el
e siguiente moodelo:
l Y = 1 + 2 log X 2 + 3 log X 3 +
log
demuestre que los coeficiientes de regressin estimadoss son las elasticidades asociaddas
con Y y cad
da una de las X y que estas elaasticidades son constantes a loo largo de la lnea
de regresin.
5.2 Deseam
mos analizar laa demanda de vivienda estudiaantil en el rea del
d campus de Ann
A
Arbor a paartir de los datoos de renta prop
porcionados en el cuadro 2.1. Como una meddida
de la demaanda para los servicios de unaa unidad, consttruya las variab
bles RENT PE
ER y
ROOM PE
ER, definidas coomo sigue: RE
ENT PER = RE
ENT (por unidaad)/NO (nmeroo de
personas enn la unidad). (R
RENT PER se denota
d
como RP
PP en el captullo 2.) ROOM PER
P
= RM (hab
bitaciones)/NO
O (nmero de personas). Lueggo se estiman loos modelos:

CAPITULO 5: Usando el modelo de regresin mltiple

147

(En el modelo II, 2 est restringida a ser cero.)


a) En el modelo I, pruebe la hiptesis de que 3 = 0 (en oposicin a que 3 > O).
Esto es lo que esperara?
b) En el modelo I, pruebe la hiptesis de que 4 = 0 (en oposicin a que 4 < 0).
Esto es lo que esperara?
c) En el modelo I, use una prueba t para probar la hiptesis de que 2 = 0. Ahora,
usando la suma de cuadrados residuales de los estimados de los modelos I y II,
haga una prueba F para probar la hiptesis de que 2 = 0. Deber recordar que
si X = (ESSII ESS1)/(ESS1/(32-4)), X sigue una distribucin F con (1,28) grados
de libertad. Cmo se relacionan las dos pruebas?
5.3 Se sugiere que los hombres y las mujeres pueden no tener la misma apreciacin por
la espaciosidad (medida por ROOM PER) o por la proximidad al campus (medida por
DIST). Estime el modelo III.
III

RBNT PER = 1 + 2(SEX) + 3(ROOM PER) + 4(DIST)


+ 5[(ROOMPER)(SEX)] + 6[(DIST)(SEX)] +
a) Pruebe por separado la hiptesis de que 5 = 0 y que 6 = 0.
b) Use una prueba F para probar la hiptesis conjunta de que 5 = 6 = 0.
c) Calcule R2 para los modelos I, II y III.

5.4 Los resultados del ejercicio 5.3 sugieren que la demanda de vivienda de hombres y
mujeres es fundamentalmente diferente. Para ver la diferencia, haga lo siguiente. Divida
los datos en dos grupos de acuerdo con el sexo y estime los modelos:
IV

RENT PER = o + 1(ROOM PER) + 2(DIST) +

slo hombres

RENT PER = o + 1 (ROOM PER) + 2(DIST) +

slo mujeres

a) Pruebe por separado las hiptesis de que 1 = 0 y que 2 = 0.


b) Pruebe la hiptesis conjunta de que 1 = 2 = 0.
5.5 Cmo puede recuperar las estimaciones de 0, 1, 2 (ejercicio 5.4) a partir de las
estimaciones de 1, 2, 3, 4, 5 y 6 en el modelo III?
5.6 Cmo interpretara (desde el punto de vista econmico) los coeficientes 1 y 2 (del
ejercicio 5.5)? Por qu podra ser positivo 2?
5.7 En el modelo I (ejercicio 5.2), calcule los coeficientes estandarizados asociados con
cada variable explicativa.
5.8 En este problema se estudiar la variacin de series de tiempo en los gastos de
consumo en Estados Unidos durante el periodo de 1977 (primer trimestre) a 1988 (primer trimestre). Un modelo macroeconmico estndar explica el consumo como una
funcin general del ingreso disponible y los valores de consumo previos. Sin embargo,
algunos puntos de vista opuestos son los siguientes:
1. El consumo es un proceso interestelar, del cual los economistas saben muy poco, y
por tanto es mejor explicar el consumo por una actividad interestelar representativa, como las observaciones de OVNIS.

148

PA
ARTE DOS: Modelos de regresin de
d una sola ecuaci
n

2. Los caambios en el coonsumo son unna actividad inteerestelar, de modo


m
que el connsumo debera
d
explicaarse por los valoores de consum
mo previos, al igual que por laas
observaaciones de OVN
NIS.
3. Cuando
o las personas deciden cuntoo gastar, slo consideran
c
su ingreso
i
actual, y
por tannto el consumoo debera expliccarse slo por eel ingreso disponible.
4. Las personas revisan sus planes de consumo por medio
m
de un prroceso aleatorioo,
de moddo que el conssumo debera ser igual al connsumo pasado ms
m una perturrbacin.
5. El connsumo es una ffuncin tanto del consumo pasado como del ingreso, de
d
modo que
q un incremeento de un dlaar en el ingresoo tiene el mism
mo efecto que un
u
increm
mento de un dllar en el consuumo pasado.
Use la sigguiente ecuacin de regresinn para investiggar estos puntos de vista:

donde Yt = connsumo estadouunidense en el momento t


X2t = inggreso personal disponible estaadounidense enn el momento t
X3t = connsumo estadouunidense en el momento t - 1
X4t = obsservaciones de OVNIS en Esttados Unidos een el momento t
t = trm
mino de error
a) Estim
me la ecuacin aanterior, usanddo los datos dell ejemplo 4.3 y su propia estimacin de observaciones de OVNIS.
b) Pruebbe las siguientees hiptesis usaando las pruebaas t apropiadass.
i. 4 = 0
(modelo tradicional)
ii. 2 = 0
(2)
c) Pruebe las siguientes hiptesis usaando las pruebaas F apropiadass.
i. 2 = 3 = 0
(Opinin 1)
ii. 3 = 4 = 0
(Opinin 3)
iii. 3 = 1, 2 = 4 = 0 (Opinin 4)
iv. 4 = 0, 2 = 3
(Opinin 5)
v. 2 = 3 = 4 = 0
(Ningn podder explicativo de alguna de las
l X)
Indiquue el modelo rrestringido aproopiado para caada una de estaas hiptesis. 5..9
Usted pronto ser entrevisttado para el puesto
p
de anaalista poltico en una de laas
estaciones de televisin
t
localles. En vista dee que todas lass estaciones de televisin estn
dedicando unaa gran cantidadd de tiempo al aire
a a la cobertuura de las eleccciones, su conoocimiento mund
dano no ser suuficiente para asegurarle el puuesto. En conseccuencia, debera
considerar cm
mo usar un moddelo de regresin para respalddar sus opinionnes respecto a laas
elecciones legiislativas de 19996.
Para llenaar tiempo al airre, necesitar tres
t modelos. T
Todos los moddelos tratarn de
d
explicar difereencias entre esttados en el porccentaje de votoos recibidos po
or los candidatoos
demcratas en
ntre todos los vvotos emitidos para candidatoos a diputados en cada estadoo.
Por consiguiennte, la variable dependiente tiiene 50 observaciones, una paara cada estadoo.
Tiene cuatro tiipos de variables explicativass:
1. La tasaa de desempleoo en cada estad
do
2. Variabbles indicadorass regionales po
or si el estado est en el nordeste, sur, medio
oeste u oeste

CAPTULO 5: Usando el modelo de regresin mltiple

149

3. Una variable indicadora por si Bill Clinton apareci en ese estado para hacer
campaa por los candidatos a la legislatura
4. Trminos de interaccin entre las indicadoras regionales y la indicadora de
Clinton
Sus tres modelos difieren slo en las variables explicativas que contienen:
El modelo I contiene las variables (1) y (2).
El modelo II contiene las variables (1), (2) y (3).
El modelo III contiene las variables (1) y (4).
a) Escriba cada modelo en una ecuacin de regresin. Esto puede hacerse en ms
de una forma; escoja cualquier formulacin que prefiera. Asegrese de definir
toda la notacin y describa cmo discernirn las variables explicativas los efectos del inters, interpretando los efectos que se van a estimar.
b) Usando las variables en estos modelos, indique cmo probara las siguientes
hiptesis. Si propone una prueba F, proporcione las ecuaciones de regresin
restringida y no restringida.
i. La aparicin de Clinton no importa.
ii. El regionalismo es insignificante: el pas entero vot en forma uniforme, sin
diferencias regionales.
iii. El nordeste y el medio oeste (el "cinturn congelado") votaron en forma
uniforme.
iv. El cinturn congelado vot en forma uniforme, el "cinturn soleado" (el sur
y el oeste) vot en forma uniforme, pero el cinturn congelado y el cinturn
soleado combinados no necesariamente votaron en forma uniforme.
v. La aparicin de Clinton tuvo el mismo efecto en todas las regiones.

CAPTULO

CORRELACIN SERIAL
Y HETEROCEDASTICIDAD

Ahora que se ha completado el estudio del modelo de regresin lineal clsico,


revisaremos cada una de las suposiciones del modelo con el objetivo de
determinar aquellas situaciones en las que se violan estas suposiciones y
encontrar los procedimientos de estimacin para mejorar el procedimiento de
mnimos cuadrados ordinarios en el momento que dichas violaciones ocurren.
Las suposiciones son las siguientes:
1. El modelo se especifica como:
Yi = 1 + 2X2i + 3X3i + + kXki + i

(6.1)

2. Las X son fijas y no existe relacin lineal entre dos o ms de las variables
independientes.
3. Los errores estn distribuidos de manera independiente de una pobla-cin normal con valor esperado 0 y varianza constante.
En el captulo 7, nos enfocaremos en la suposicin de que el modelo especificado en la ecuacin (6.1) es correcto. En la suposicin dos se escribe el problema de la colinealidad que ya se detall en el captulo 4. La tercera suposicin
consiste de varias partes importantes. Aun sin normalidad, es posible demostrar
que los estimados de regresin de mnimos cuadrados de los parmetros
verdaderos son insesgados y consistentes. Sin embargo, sin esta normalidad no
se pueden realizar pruebas estadsticas usando las frmulas estndar para las
distribuciones t y F. Por fortuna, las pruebas estadsticas estndar son
aproximadamente correctas para tamaos de muestra grandes.
150

CAPTULO 6: Correlacin serial y heterocedasticidad

151

Aunque hay mtodos estadsticos que le permiten a uno probar la normalidad (vase el captulo 2), estas pruebas estadsticas, generalmente, no se usan.1
Una razn de esto es que las pruebas no son potentes desde el punto de vista
estadstico, en el sentido de que a menudo podemos fallar en rechazar la hiptesis nula de normalidad, aun cuando la distribucin del error no es normal.
Adems, si decidimos que la suposicin de normalidad es invlida, los procedimientos de estimacin y pruebas estadsticas alternativos seran ms complicados que aquellos asociados con el modelo de regresin clsico normal.
La hiptesis de que el trmino del error tiene un valor esperado de cero no es
importante; pero si el valor esperado no es cero, los parmetros de pendiente de
la regresin estimada permanecern inmutables mientras el intercepto
absorver el efecto. Con esto ser imposible diferenciar entre el intercepto verdadero y el valor esperado no cero en el trmino del error, aunque en la mayor
parte de las aplicaciones economtricas el trmino de intercepto no es de inters.
Por ltimo, la suposicin de independencia de los errores se considerar en la
seccin 6.2, y en la seccin 6.1 nos centraremos en que los errores tienen
varianza constante.

6.1

HETEROCEDASTICIDAD
En el modelado economtrico hay ocasiones en que la suposicin de varianza
del error constante u homocedasticidad, no es razonable. Por ejemplo, si examinamos un corte transversal de empresas en una industria, los trminos del error
asociados con empresas muy grandes podran tener varianzas mayores que
aquellos trminos de error asociados con empresas ms pequeas; es decir, las
ventas de empresas ms grandes podran ser ms voltiles que las ventas de
empresas ms pequeas. Otro ejemplo es el estudio de un corte transversal del
ingreso y los gastos familiares.2 Aqu se esperara que los individuos de ingresos
bajos gastaran a un ritmo constante, mientras que los patrones de gasto de las
familias de ingresos altos sean relativamente voltiles. Esto sugiere que en un
modelo en el que los gastos son la variable dependiente, las varianzas del error
asociadas con las familias de ingresos altos sean mayores que sus contrapartes
de ingresos bajos. La heterocedasticidad o varianzas desiguales, por lo general, no
ocurre en estudios de series de tiempo debido a que es probable que los cambios
en la variable dependiente y los cambios en uno o ms de las variables independientes sean del mismo orden de magnitud.3 Por ejemplo, en los ejemplos de
funcin de consumo agregado en el captulo 3, tanto el consumo como el ingreso
disponible crecen ms o menos en la misma proporcin en el tiempo.
1

Un procedimiento de una prueba directa es el siguiente. Calcule los residuales estandarizados


de una regresin mltiple dividiendo cada residual entre el error estndar de la regresin. Si los
errores son normales, la distribucin de residuales estandarizados sera normal unitaria. Vase D.A.
Belsley, E. Kuh y R.E. Welsch, Regression Diagnostics (Nueva York: Wiley, 1980), pp. 16-18.
2
Este ejemplo se estudia en detalle en S.J. Prais y H.S. Houthakker, The Analysis of Family Budgets
(Cambridge: Cambridge University Press, 1955).
3
Por supuesto las varianzas pueden disminuir con el tiempo conforme mejoran las tcnicas de
medicin.

152

PARTE DOS: Mo
odelos de regresin de una sola ecuacin

Para un
n modelo conn perturbacionnes de error hheterocedsticcas aceptarem
mos
que cada trmino del errror i est distribuido en foorma normal con varianza 2i,
donde la varianza Var(i) = E( 2i) = 2i no es constante entree observacionnes.
Cuando estt presente laa heterocedastticidad, la esttimacin de mnimos
m
cuaddrados ordinarrios da ms ponderacin
p
a las observacciones con vaarianzas de errror
grandes quee en aquellas con varianzas de error meenores. La ponnderacin ocuurre
debido a que
q es probabble que la sum
ma de residuuales cuadradoos asociada con
c
trminos dee error de varrianza grande sea consideraablemente maayor que la suuma
de residualees cuadrados asociada con errores de varrianza baja. La
L lnea de reggresin se ajuustar para miinimizar la suuma total de residuales cu
uadrados, y esto
e
puede lograarse mejor gaarantizando un
u ajuste muyy bueno en laa porcin de los
datos de vaarianza grandee. Debido a esta
e ponderaciin implcita, los estimadoores
de parmettros de mnim
mos cuadradoss ordinarios son insesgados y consistenttes,
pero no sonn eficientes; ess decir, las vaarianzas de loss parmetros estimados
e
no son
s
las varianzaas mnimas. A
Adems, las varianzas
v
estim
madas de los parmetros estie
mados sern estimadorees sesgados de la varianza verdadera dee los parmettros
estimados.
El hechho de que los estimadores de
d parmetross sean insesgaados puede veerse
en el contexxto del modeloo de dos variaables con las variables medid
das como desvviaciones alreededor de sus medias. Entoonces,

Observe quue las varianzas de los trrminos del errror no desem


mpean ninguuna
funcin enn la prueba dee que los estim
madores de m
mnimos cuad
drados son inssesgados.
La difiicultad con laas varianzas de
d los parmettros estimados tambin puede
presentarsee en el caso dde dos variablees. Entonces, a partir de loo estudiado enn el
captulo 3, sabemos quee:
(66.2)
La varianzza del error see extrajo del signo de sum
matoria durannte la derivacin
debido a qu
ue se asumi que la varianzza era constannte. Sin embaargo, cuando est
e
presente la heterocedastiicidad, la variianza no es coonstante y la derivacin noo se
cumple. Ell resultado ess que la frm
mula estndar [ecuacin (6.2)] conducirr a
estimados sesgados de las
l varianzas de cada uno de los parm
metros estimaddos.
Si se usan estos estimaddos parciales, las pruebas eestadsticas y los intervaloss de
confianza sern
s
incorrecctos.

CAPTULO 6:
6 Correlacin serial y heterocedasticidad

153

La frmula para
p el error eestndar correecto cuando los
l errores sonn heterocedssticos puede derivarse
d
en una forma siimilar a la deerivacin en el
e caso del
modelo de regresin lineal bsico. Las varianzas de los estimadores de
d parmetross estn dadas por4:

Hallbert White ha
h mostrado que
q un estimaador consistennte de las varrianzas correcctas puede ob
btenerse susttituyendo ^ 2i, el cuadrado de cada resiidual de la
reggresin, por 2i en esta frm
mula.5
Por ltimo, es importantee tener en cueenta que la inneficiencia dell estimador
de mnimos
m
cuad
drados surge aun si las varrianzas de los estimados dee parmetro
sonn determinadaas en forma coorrecta. En este caso, las varianzas
v
sern mayores
quee las varianzaas asociadas ccon un estimaador insesgadoo lineal alternnativo, esto
se expone
e
a conttinuacin.

6.1
1.1

Correcciones pa
ara la heterrocedasticid
dad

Exp
ponemos la tcnica de estim
macin apropiada (la cual ees insesgada, consistente
y eficiente)
e
en dos
d casos coonceptualmentte separados. Cada caso se
s basa, en
niveles diferentees, en informaacin previa y muestral, peero ambos im
mplican proceddimientos de estimacin
e
reelativamente simples.
s
Varianzas conocidas
c
Prrimero asumim
mos que se ddispone de sufficiente conoccimiento prevvio para conoocer los valorres de cada una
u de las varianzas del
erro
or. En el trab
bajo economtrico, el caso
o de varianzaas conocidas,, ocurre en
form
ma ocasional pero es importante conoccer cmo haccer la correcccin para la
heteerocedasticidaad. La tcnica apropiada, llaamada mnimos
os cuadrados ponderados,
p
es un
u caso especial de una ttcnica econo
omtrica ms general conoocida como
mn
nimos cuadrad
dos generalizaados. Una deriivacin matriccial del proced
dimiento de
mnnimos cuadraados generalizzados se muesstra en el apndice 6.1.
El procedim
miento de estim
macin de mnimos cuadraados ponderaddos, el cual
pueede derivarse de la funcinn de mxima verosimilitudd, se ilustra mejor
m
en el
modelo de dos variables. El estimador ap
propiado se oobtiene minim
mizando la
exp
presin:

La derivacin resulta en formaa directa de la derrivacin dada en eel resultado 2 dell apndice 3.1.

En esa
e derivacin, Var(
V ) = c2i E ( 2i ). Sustituir ci = xt /x 2i da el resultado.
5
H. White, "A Heteroskedasticit
H
ty-Consistent Cov
variance Matrix Estimator
E
and a Direct
D
Test for
Heteeroskedasticity", Econometrica,
E
vool. 48, pp. 817-838, mayo de 1980.

154

PARTE DOS: Modelos de regresin


n de una sola ecuacin

^ y son, por supuestoo, los estimados de parm


metros deseaddos. Cuando las
variables orriginales se esscriben en forrma de desviaciones, el objetivo originall se
modifica paara minimizarr la expresin
n:6

Resolvienddo para los estimados de paarmetros de m


mnimos cuaddrados (como en el
captulo 1),, encontramos que:

De este modo, el procediimiento de esttimacin que se desea se lo


ogra ponderanndo
los datos orriginales y lueego, en el mod
delo transform
mado, se realiiza la estimacin
de mnimoss cuadrados oordinarios.
Para ussar mnimos cuadrados
c
pon
nderados en eel caso de reggresin mltipple,
redefinimoss las variabless en el modelo
o de regresinn original de la
l ecuacin (66.1)
como:

En lugar deel modelo lineal original [eccuacin (6.1)] usamos el mo


odelo transforrmado:

o, de maneera equivalennte,
Ntese quee el trmino deel error transfformado es hoomocedstico (tiene varianzza
constante):

6
Para ser correcta, la form
ma de desviacioness debe obtenerse transformando
t
el modelo (dividienndo
entre i ) y lueggo sustrayendo laas medias de la variable.
v

CAPTULO 6: Correlacin serrial y heterocedastticidad

155

Por qu este procedimiento


p
produce estim
madores de parmetros
p
efi
ficientes? La
razzn es que el modelo transsformado por construccin satisface toddas las suposicciones del mod
delo de regressin lineal clsico (que inccluye la variannza del error
connstante). Por consiguiennte sabemos (de acuerddo con el teorema
t
de
Gaauss-Markov)) que los estim
madores debeen ser eficienttes.
Este anlisis se limita poorque las variaanzas del errorr individualess no siempre
se conocen. De hecho, la infformacin neccesaria para lla aplicacin de mnimos
cuaadrados pondderados es la m
magnitud relattiva de las varrianzas del errror. En vista
de que hay mucchas situacionnes en las quee no se conocee la magnitudd relativa de
lass varianzas deel error, es im
mportante connsiderar casos especiales enn los que se
disspone de infoormacin mueestral suficiennte para hacerr suposicioness razonables
de las varianzass del error verrdaderas.
Las varianzzas del error varan en forrma directa coon una variab
ble indepen-

dieente Una possibilidad es laa existencia de


d una relacin entre las vaarianzas del
errror y los valorres de una de las variables explicativas
e
en el modelo de
d regresin.
Dee manera espeecfica, suponnga que:

do
onde C es una constante no ccero y X2i es una
u observacin en una de las
l variables
ind
dependientes en el modeloo de regresinn lineal generral:

En
ntonces, se prrocede como si las varianzzas fueran connocidas. Paraa hacer esto,
reddefinimos las variables en lla ecuacin an
nterior de la ssiguiente maneera (el valor
de la constante C no afecta al procedimiento de mnim
mos cuadradoos ponderadoos):

Laa ecuacin de regresin traansformada ess:

Po
odemos ver que
q el trminoo del error trransformado es homocedstico, dado
qu
ue:

Enn este caso paarticular el trm


mino de interrcepto originaal se ha converrtido en un
trrmino variable, mientras quue el parmetrro de pendientte asociado coon la varia-

156

PARTE
P
DOS: Mod
delos de regresin de una sola ecuaccin

ble X2 se haa convertido en el nuevo trmino de inntercepto. Loos estimados de


d
regresin dee mnimos cuuadrados ordiinarios de loss parmetros en la ecuacin
(6.4) produccirn los estim
mados de parrmetros aproopiados (eficientes), en vissta
de que los errores
e
en la eecuacin transsformada sonn homocedstticos.
EJEMPLO
O 6.1

Gastos de viv
vienda

En este ejem
mplo considerramos un estuudio de corte ttransversal dee los gastos dee
vivienda anuuales e ingressos anuales de
d cuatro gruppos de familiaas:

Se plantea la
l hiptesis de que el modelo de gastos de vivienda es:
Yi = + Xi + i
donde Yi sonn los gastos dee vivienda y Xi es el ingresso. Una regressin de mnim
mos
cuadrados ordinarios prodduce los siguieentes estimadoos de regresin (la estadstica
t aparece en
ntre parntesiss):

Un exam
men grfico de los datos y el conocim
miento de estu
udios de gasttos
anteriores suugiere que esst presente laa heterocedassticidad en el modelo.
El modeelo de gastos de vivienda puede
p
estimarsse con una correccin para la
heterocedasticidad. El modelo transformado es:

y los resultaados de regressin son:

CAPTULO
O 6: Correlacin se
erial y heterocedassticidad

157

Ntese
N
que el estimado revvisado del coeeficiente de rregresin asociado con el
in
ngreso es 0.2449, ste es un incremento soobre el estimaado de mnimoos cuadrados
orrdinarios. Com
mo se esperaba, el uso correecto de las esttadsticas t y F todava nos
peermite concluuir que todos llos coeficientes de regresin son significativos en el
niivel del 5%. Ntese que lla medida de R2 asociada con el proceedimiento de
mnimos
m
cuadrrados ponderrados es menor que la R2 asociada conn el procedimiento
m
no pond
derado. La dissminucin en R2 no debe toomarse como un
u indicio de
quue la correcccin de la hetterocedasticiddad fue incorrrecta, ya quee el procedimiento
m
de mnnimos cuadraddos ponderaddos implica ell uso de una variable depeendiente transsformada.
Por consigu
uiente, la R2 reeportada no prroporciona unna medida til de la bondad
dee ajuste para el modelo orriginal. Una medida mejoor resultara del
d uso de la
eccuacin original y los esttimados de parmetros
p
efi
ficientes para calcular las
reesiduales de laa regresin ^i = Yi -.7529-.249Xi.Entoncces, tenemos dos
d opciones
paara medir la bondad de ajusste. La primera, es que podeemos usar la frmula
f
de R2
2
esstndar para calcular 1 - ES
SS/TSS. Esta R no necesariiamente se enccuentra entre
0 y 1. Por tal razn
r
sugerim
mos una segu
unda alternatiiva. sta es laa de usar los
paarmetros esstimados en forma eficieente para esstimar valorees ajustados
i = .7529 + .2249Xi y utilizaar como nuesttra medida dee bondad del ajuste
a
el cuadrrado de la correlacin sim
mple entre Yi y i. En este ejemplo partiicular ambas
oppciones produujeron medidaas de ajuste de
d 0.92.

Uso de esttimadores coonsistentes dee las varianzaas Con la hetterocedasticidaad, la estimaccin sesgada e inconsistentee de las variannzas de los esttimadores de
paarmetros de mnimos cuuadrados ordinnarios causa que las inferrencias estadsticas sean in
nvlidas. Hal White ha suggerido un mttodo para obttener estimado
ores consisten
ntes de varianzzas y covarian
nzas de estim
mados OLS (O
Ordinary least
sq
quares) que prroporcionan ppruebas estadsticas vlidas para muestrass grandes.7 El
esstimador consisstente de heterrocedasticidad (HCE, heterosscedasticity-conssistent estima-

toor) se basa en el principio dee mxima verosimilitud, el cual se exponne con detalle
enn el captulo 10.
1
Como un ejemplo, recuurdese que, de la ecuacin (6.2), en el
e modelo de
reegresin de doos variables,

geenera un estim
mado sesgadoo de la varianzza de . Un esstimador insessgado, dado
enn la ecuacin (6.3), es:

7
H. White, "A
A Heteroskedasticcity-Consistent Covariance Matrixx Estimator and a Direct Test for
Heteroskedasticity", Econometrica, vol. 48, pp. 817-838, mayo de 19880.
H

158

PARTE DOS: Modelos de regresin de una sola ecuacin

El estimador consistente de heterocedasticidad (HCE) usa la ecuacin (6.3)


como su base, remplazando la desconocida 2i con los cuadrados de los residuales ^ 2i . El estimador HCE, con frecuencia, se encuentra disponible en la actualidad en muchos paquetes de regresin estadstica. Con el uso de la estimacin
HCE, la R2 para la regresin ser la misma, pero todos los estimados de errores
estndar y estadsticas relacionadas cambiarn debido a que se generan estimados de varianza consistentes. Sin embargo, esto no proporciona los estimados de
parmetros ms eficientes. Para una estimacin eficiente, debe usarse uno de
los procedimientos de estimacin de mnimos cuadrados ponderados.

6.1.2

Pruebas para heterocedasticidad

Al exponer las modificaciones del procedimiento de mnimos cuadrados en dos


casos separados, es natural para nosotros considerar si pueden encontrarse procedimientos estadsticos apropiados para probar la heterocedasticidad. En cada
caso deseamos encontrar una prueba de la hiptesis nula de homocedasticidad, es
decir, 21= 22= 32 = 2N , donde N es el nmero de observaciones. La hiptesis
alternativa especfica, contra la cual se prueba la hiptesis nula, depende del
procedimiento de estimacin que consideremos que produzca la correccin ms
deseable para la heterocedasticidad.
Aunque hay varias pruebas especficas para la heterocedasticidad, un primer procedimiento til es el informal, ste examina el patrn de los residuales
para ver si las varianzas estimadas difieren de una observacin a otra. Para
hacer esto, sugerimos calcular los cuadrados de los residuales, ^ 2i . Si el modelo
en cuestin es un modelo de series de tiempo, una grfica de estos residuales
cuadrados contra el tiempo nos dir si, por ejemplo, las varianzas estimadas se
incrementan con el tiempo. Si el modelo se aplica a un corte transversal, una
grfica de los residuales cuadrados contra una o varias variables explicativas, o
contra , servir para el mismo propsito.
Ahora consideraremos varias pruebas de heterocedasticidad formales, todas
las cuales se basan en una forma o en otra en los cuadrados de los residuales.
Prueba de Goldfeld-Quandt8 Supngase que estamos considerando un
modelo de dos variables y deseamos probar la hiptesis nula de homocedasticidad contra la hiptesis alternativa de que 2i - CX 2i . El procedimiento de la
prueba de Goldfeld-Quandt implica el clculo de dos lneas de regresin de
mnimos cuadrados, una usando datos que se consideran asociados con errores
de varianza baja y la otra con errores de varianza alta. Si las varianzas de los
residuales asociadas con cada lnea de regresin son aproximadamente iguales,
la suposicin de homocedasticidad no puede ser rechazada, pero si la varianza

S.M. Goldfeld y R.E. Quandt, "Some Tests for Homoscedasticity", Journal of the American
Statistkal Society, vol. 60, pp. 539-547, 1965.

CAPITULO 6: Correlacin serial y heterocedasticidad

159

residual incrementa de modo considerable, es posible rechazar la hiptesis nula.


La prueba puede realizarse de la siguiente manera:
1. Ordene los datos por la magnitud de la variable independiente X, la cual
creemos que se relaciona con la varianza del error.
2. Omita las observaciones de en medio. Podra elegirse, por ejemplo, que d
sea aproximadamente un quinto del tamao total de la muestra.
3. Ajuste dos regresiones separadas, la primera (indicada por el subndice
1) para la porcin de los datos asociados con valores bajos de X y la segunda
(indicada por el subndice 2) asociada con valores altos de X. Cada regresin
implicar (N - d)/2 piezas de datos y [(N - d)/2] - 2 grados de libertad, d debe ser
lo bastante pequea para asegurar que se dispone de suficientes grados de
libertad para permitir la estimacin apropiada de cada una de las regresiones
separadas.
4. Calcule la suma de cuadrados residuales asociados con cada regresin:
ESS1 asociada con las abajas, y ESS2 asociada con las faltas. (ESS se describe
en el captulo 3.)
5. Suponiendo que el proceso de error est distribuido en forma normal (y
no est presente una correlacin serial), la estadstica ESS2/ESS1 estar distribuida como una estadstica F con (N - d - 4)/2 grados de libertad tanto en el
numerador como en el denominador. Podemos rechazar la hiptesis nula en un
nivel elegido de significancia si la estadstica calculada es mayor que el valor
crtico de la distribucin F.
La prueba de Goldfeld-Quandt puede aplicarse con facilidad al modelo lineal
general, ordenando las observaciones por la magnitud de una de las variables
independientes. El nmero de grados de libertad en la estadstica F ser (N
- d - 2k)/2, donde k es el nmero de variables independientes (incluyendo un
trmino constante) en el modelo. Esta prueba funciona porque permite la estimacin de la regresin independiente de los datos de observacin tanto altos
como bajos. Sin embargo, hay un costo importante implicado. Debido a que no
se hacen restricciones en los parmetros de regresin (al igual que en las varianzas del error) en cada una de las dos ejecuciones de regresin, se pierde el poder
estadstico. Una prueba ms poderosa (una que tiene errores tipo II ms pequeos) tomara en cuenta la informacin de que los parmetros de regresin son
idnticos para ambos conjuntos de datos y que slo ha cambiado la varianza del
error. Por ltimo, la seleccin del nmero de observaciones de en medio que se
eliminan de la prueba es un tanto arbitraria. Si no se eliminan observaciones de
en medio, la prueba todava es correcta, pero la experiencia muestra que la
eliminacin del procedimiento de prueba de observaciones asociadas con errores
de varianza es casi igual mejora el poder de la prueba.
EJEMPLO 6.2

Prueba de Goldfeld-Quandt

La prueba de Goldfeld-Quandt puede aplicarse al ejemplo de gastos de vivienda


que se us antes. Los datos se dividen en dos muestras, la primera incluyendo

160

PARTE DOS: Modelo


os de regresin de
e una sola ecuacin

aaquellos con ingresos


i
de 5 000 y 10 000 dlares y laa segunda inccluyendo a lass
f
familias
con in
ngresos superiiores (15 000 y 20 000). No
o se eliminan observaciones
o
s
d en medio de
de
d la muestraa debido a quee se dispone d
de un rompim
miento naturall
e los datos sin que se omiitan observaciiones. El resu
en
ultado asociad
do con las doss
e
ecuaciones
dee regresin sep
paradas es co
omo sigue (la estadstica t aparece entree
p
parntesis;
los datos estn en miles de dlares):
d
I

Familias de
d ingresos baajos:

I
II

Familias de
d ingresos alltos:

La estadstica F que se u sa para probar la suposiccin de homo


L
ocedasticidad
d
e ESS2/ESS1 = 6.7. sta eestar distribuiida bajo la hip
es
ptesis nula, como
c
F con 8
g
grados
de libeertad en el num
merador y el denominador.
d
El examen dee la tabla de laa
d
distribucin
F muestra que el valor crtico de F en el niivel del 5% dee significanciaa
e 3.44. Conclluimos que podemos rechazzar la hiptesiss nula a favor de
es
d la hiptesiss
a
alternativa
dee heterocedastticidad.

Prueba de
d Breusch-P
Pagan9 La pru
ueba de Gold
dfeld-Quandt es
e una pruebaa
natural
n
para aplicarla cuand
do se pueden ordenar las ob
bservaciones en funcin dee
la
l varianza crreciente del trmino del errror (o una varriable indepen
ndiente). Hay
y
una
u prueba alternativa que no requiere dicho
d
ordenam
miento y es fcil de aplicarr,
sta
es la prueeba de Breusch
h-Pagan.
Considreese el siguientte modelo, el cual incluye u
una suposici
n general res-p
pecto
a la relaacin entre la varianza del error verdadeera y una variiable indepen-d
diente
Z:
(6.5))
(6.6))
La
L ecuacin (6.6)
(
proporciona la especifficacin de laa forma tomad
da por la hete-rocedasticidad
r
d, si es que est
e
presente en realidad. f(
f ) representaa una funcin
n
general
g
que permite,
p
por eejemplo, tanto
o formas lineeales como lo
ogartmicas. Z
podra
p
ser la variable
v
indep
pendiente X o podra representar un grupo de variabless
independiente
i
es distintas a X.
9
Vase T.S. Breusch y A.R
R. Pagan, "A Simple Test forr Heteroskedastticity and Ranndom
Coefficient
C
Variattion", Econometriica, vol. 47, pp. 1287-1294,
1
1979.

CAPTULO
O 6: Correlacin se
erial y heterocedasticidad

161

Para probbar la heteroccedasticidad, primero calcculamos los residuales


r
de
mnimos cuaddrados ^i de laa regresin en
m
e la ecuacinn (6.5). Al mismo
m
tiempo
u
usamos
estos residuales
r
paara estimar:

Ahora
A
ejecutam
mos la siguiennte regresin::
(6.8)
Si el trmino del
S
d error en la ecuacin (6.5) est distrribuido en forrma normal y
n hay heteroccedasticidad, entonces, unna mitad de laa suma de cuaadrados de laa
no
reegresin RSS
S/2, proporcioona una estaddstica de prueba adecuadaa. De maneraa
e
especfica,
bajjo la hiptesiss nula de hom
mocedasticidadd,

Generalmente,
G
, cuando hay p variables inndependientes Z, RSS/2 segguir una dis-trribucin ji cuuadrada con p grados de liibertad. Entree mayor sea el
e valor de laa
suma
s
de cuadrrados de la regresin, ms alto se correlacionar Z co
on la varianzaa
del
d error y, por
p consiguiente, ser men
nos probablee que la hiptesis nula see
mantenga.
m
Ahora con
nsidere que deetectamos la heterocedasti
h
cidad usando la prueba dee
B
Breusch-Pagan
n, como en laa ecuacin (6.8
8) que es el caaso de una sola variable Z.
E
Entonces
un medio
m
obvio para
p
corregir la heterocedaasticidad es trransformar laa
e
ecuacin
origiinal usando laa variable Z enn lugar de la variable X2 en
n la ecuacinn
(6.4).10 Sin em
mbargo, cuanndo usamos formas
f
ms ggenerales de la prueba dee
B
Breusch-Paga
an, no hay unna forma natuural por la cual se puedaa hacer dichaa
c
correccin.

10
Un enfoqu
ue mejor implicara la estimacin po
or mxima verosiimilitud. Con heteerocedasticidad laa
fuuncin de log-veerosimilitud est ddada por:

Supngase,
S
por ejjemplo, que la heeterocedasticidad es multiplicativaa, es decir,

Sustituyendo esta expresin en logg (L) y maximizan


S
ndo con respecto a , , y prodduce estimacioness
d mxima verosiimilitud de los paarmetros de reggresin y heteroceedasticidad.
de

162

PA
ARTE DOS: Modelo
os de regresin de
e una sola ecuaci
n

La prueb
ba de Whitee11 La pruebaa de Breusch
h-Pagan depen
nde en formaa
i
importante
dee la suposicin
n de un trmino del error normal.
n
Hal White
W
propuso
o
u prueba esstrechamente relacionada que
una
q no depend
de de manera tan crucial dee
l normalidad
la
d. Supngasee que en lugar de la eccuacin (6.8)) usamos loss
r
residuales
de la regresin para
p
ejecutar la siguiente rregresin:

a partir de la cual
c
calculamo
os la medida de
d la bondad de
d ajuste R2. La
L prueba de
White
W
se basaa en el hecho de que cuand
do hay homoccedasticidad,
NR2~X2

(6.10))

con
c 1 grado de
d libertad. Dee manera mss general, cuan
ndo hay p varriables independientes
p
Z,, la distribuci
n tendr p grrados de liberrtad.
Dado quee las pruebas de
d White y Breeusch-Pagan sson tan similarres, cualquieraa
de
d stas pued
de ser una eeleccin apro
opiada, depen
ndiendo de laa facilidad dee
aplicacin.
a
Paara el procediimiento de prrueba la elecccin de variab
bles Z es mss
importante.
i
W
White
sugieree, que si la heterocedastic
h
cidad se relacciona con unaa
variable
v
particcular como X, se podran usar
u
las variab
bles X y X2 paara permitir no
o
linealidades.
l
De
D manera altternativa, si X y Z fueran d
dos variables relevantes, see
podran
p
usar X2, Z2 y XZ.

EJEMPLO 6.3

P
Pruebas
de Bre
eusch-Pagan y White

Aplicamos tan
A
nto la prueba de Breusch-Pagan como la de White al ejemplo
e
de loss
g
gastos
de viviienda (ejempllo 6.1). En am
mbos casos ussamos al prin
ncipio la supos
sicin
de que la heterocedaasticidad adop
pt la forma:

Para
P
aplicar la
l prueba de B
Breusch-Pagaan, ejecutamos la regresin
n de Y en X y
guardamos
g
lo
os residuales calculados. Encontramos
E
que ^ 2 = 0.12523. Luego
o
regresamos
r
lo
os residuales n
normalizadoss en X para ob
btener:

La
L suma de cu
uadrados de laa regresin (laa cual puede calcularse
c
a paartir de R2 y laa
suma
s
de cuad
drados del erro
or) fue igual a 13.732. Por consiguiente,, la estadsticaa
de
d prueba aprropiada es:

11
H. White, "A Heteroskedassticity-Consistent Covariance Matrrix Estimator and a Direct Test for
Heteroskedasticit
H
y", Econometricaa, vol. 48, pp. 8177-838, mayo de 1980.

CAPTULO 6: Correlacin serrial y heterocedastticidad

163

la cual sigue un
na distribucinn ji cuadrada con 1 grado de libertad. Dado
D
que el
vallor crtico de la ji cuadradaa es 3.84 en ell nivel del 5%
%, rechazamos la hiptesis
nuula de homoceedasticidad a favor de la prresencia de hheterocedasticcidad.
La prueba dee White es ann ms fcil de aplicar. La R2 asociada con la regresin
de los residualess normalizados es 0.36. Peroo sta es la missma R2 que obbtendramos
si la ecuacin no
n fuera norm
malizada. (Muultiplicar la vvariable depen
ndiente por
unna constante no
n afecta el ajjuste de una ecuacin.)
e
Poor tanto, la esstadstica de
pru
ueba apropiadda es:
20(R2) = 7.20
la cual sigue un
na distribucinn ji cuadrada con 1 grado dde libertad. Una
U vez ms
(daado que 7.20 > 3.84) rechaazamos la hip
ptesis nula dde homocedassticidad.
Por ltimo, ntese que laa prueba de White
W
(o la prrueba de Breuusch-Pagan)
puueden aplicarsse a casi cuaalquier formaa funcional dee X. Usando una forma
cuadrtica, calcculamos la reggresin de loss residuales ccuadrados en X y X2, del
cual se obtiene el siguiente rresultado:
con una R2 de 0.4130.
0
La esttadstica de prrueba apropiaada es:
20(R2) = 8.260
la cual sigue unna distribucin ji cuadrad
da con 2 graddos de libertaad. El valor
crtico de la ji cu
uadrada con 2 grados de lib
bertad es 5.999. Tal como anntes se hizo,
recchazamos la hiptesis
h
nulaa de homoceddasticidad (daado que 8.26 > 5.99).

EJEMPLO 6.4
4

Co
orreccin de la heterocedastic
cidad

See podra esperrar que el coonsumo de ennerga a lo laargo del tiem


mpo creciera
conforme aumeentan la poblaacin y el ingrreso, pero quee declinara, siendo
s
otras
cosas iguales, conforme
c
se inncrementa el precio de la eenerga. Usan
ndo datos de
serries de tiempo
o anuales de 1960 a 1985, estimamos uuna regresin de mnimos
cuadrados ordinnarios utilizanndo las siguien
ntes variabless:12
Q = logarritmo de la caantidad de eneerga suministtrada [cuadrnngulos (1015
BTU))]
Y
YEAR
= 1 en 1960, . . . 26 en 1985
P = logarritmo del preccio de un cuaadrngulo (dlares de 1975
5)
INC = logarritmo del ingreso por hogaar (dlares dee 1975)
12
Los datos fuueron preparados por el Laboratorrio de Energa dell MIT. Las fuentees originales de
loss datos son del U.S.
U Departmentt of Commerce Petroleum
P
and Minerals
M
Yearboo
ok y la Energy
Infformation Agency
y. Deseamos agrradecer a Daniel McFadden
M
por prroporcionar las seeries de datos.

164

P
PARTE
DOS: Modelos de regresin de una sola ecuaccin

Los resultaddos de la regrresin (con laa estadstica t entre parnteesis) fueron

Es decir todoos los coeficieentes tienen loos signos espeerados, y la reegresin generral
se ajusta bieen. No obstannte, nos preoccupamos por la
l posibilidad
d de que las vav
rianzas del error
e
se increementaran conn el tiempo cconforme se incrementara
i
el
consumo dee energa. Al realizar una prueba de Brreusch-Pagan para heteroccedasticidad, usando
u
la especificacin dee que la variaanza del errorr estaba relaciionada en form
ma directa conn el ao de laa medicin. De manera especfica, usamoos
los cuadradoos de los residduales como laa variable dependiente (ESQ
Q) y estimamoos
la siguiente ecuacin:

Nuestra estaadstica de pruueba calculadda de 4.28 es m


mayor que el valor crtico de
d
la distribucin ji cuadradda con 1 grado de libertad en el nivel del
d 5% (el vallor
crtico es 3.84). Por tantoo, rechazamoos la hiptesiss nula de hom
mocedasticidaad.
Para mejoraar la eficienciaa se estim ell modelo OLS
S usando mniimos cuadraddos
ponderados. Los pesos fueron elegiddos de la reggresin anteriior; de maneera
especfica, ponderamos
p
ccada observaccin por el invverso de la raaz cuadrada de
d
los valores pronosticadoos de la regreesin (cualessquier valoress pronosticaddos
negativos erran sustituidos por un nm
mero positivo pequeo). Loos resultados de
d
los mnimoss cuadrados pponderados soon los siguienntes:

Los resultaddos son simillares a aquelllos que obtuvvimos con an


nterioridad. Sin
S
embargo, la significanciaa de varios de los coeficienntes se ha incrrementado y, lo
ms importaante, los erroores estndar que subyaceen en la signiificancia de los
clculos sonn los correctoss. Por ltimo,, ntese que R2 ha disminuuido un poco, lo
cual se espeera cuando lass estadsticas se basan en llos datos origginales (no poonderados).

6.2

CORRELAC
CIN SERIA
AL
La suposiciin de que loss errores correespondientes a diferentes ob
bservaciones no
n
estn correelacionados, a menudo se viola
v
en los eestudios de seeries de tiemppo.

CAPTULO 6: Correlacin serial y heterocedasticidad

165

Recurdese que cuando los trminos del error de periodos diferentes (por lo
general adyacentes) estn correlacionados, decimos que el trmino del error
est correlacionado serialmente. La correlacin serial ocurre en los estudios de series de tiempo cuando los errores asociados con las observaciones, en un momento determinado, son llevados a periodos futuros. Por ejemplo, si estamos
prediciendo el crecimiento de los dividendos de acciones, es probable que un
sobrestimado en un ao conduzca a sobrestimados en-aos siguientes. Esto
puede ocurrir en forma ocasional en cortes transversales cuando las unidades de
observacin tienen un ordenamiento natural, por ejemplo, por tamao o geografa.
En esta seccin, se estudiar el problema de la correlacin serial de primer
orden, en la que los errores en un periodo se correlacionan en forma directa con
los errores en el periodo siguiente.13 Aunque es posible que la correlacin serial
pueda ser negativa al igual que positiva, nos interesa, principalmente, el caso de
la correlacin serial positiva, en la que los errores en un periodo se correlacionan
en forma positiva con los errores en el periodo siguiente. La correlacin serial
positiva se produce con frecuencia en estudios de series de tiempo ya sea debido a
la correlacin en la medicin del componente de error del trmino del error o,
tambin, debido al alto grado de correlacin a lo largo del tiempo que est
presente en los efectos acumulativos de variables omitidas.
La correlacin serial no afecta el insesgamiento o consistencia de los
estimadores de regresin de mnimos cuadrados ordinarios, pero afecta su eficiencia.14 En el caso de la correlacin serial positiva, esta prdida de eficiencia
estar oculta por el hecho de que los estimados de los errores estndar obtenidos
de la regresin de mnimos cuadrados sern menores que los errores estndar
verdaderos. En otras palabras, los estimadores de regresin sern insesgados
pero el error estndar de la regresin ser sesgado haca abajo.15 Esto puede
conducir a la conclusin de que los estimados de parmetros son ms precisos
de lo que son en realidad. Habr una tendencia a rechazar la hiptesis nula
cuando, de hecho, no debera ser rechazada. No demostraremos estos resultados, pero se puede obtener una sensacin intuitiva de por qu son verdaderos al
examinar la figura 6.1a) y b).
Ambas grficas ilustran la presencia de correlacin serial positiva en un
modelo con una sola variable explicativa. En la figura 6.1a) por fortuna, el trmino del error asociado con la primera observacin es positivo. Esto conduce a
una serie de trminos del error, de los cuales los primeros cuatro son positivos y
los ltimos dos son negativos. En la figura 6.1b) ha ocurrido el caso opuesto, con
los primeros cuatro errores siendo negativos y los ltimos dos siendo positivos.
En el primer caso la pendiente de la regresin estimada es inferior que la

13

El caso ms general puede manejarse con el uso de estimacin de mnimos cuadrados generalizados, como se detalla en el apndice.6.1, y con las tcnicas de series de tiempo que se exponen en
la parte
cuatro del libro.
14
Si el modelo incluye una variable dependiente rezagada, los problemas son mucho ms graves.
15
Esto se sostiene a condicin de que las X no estn correlacionadas en forma serial negativa.

166

P
PARTE
DOS: Mod
delos de regresin
n de una sola ecua
acin

Figura 6.1

Correlaci
n serial
positiva.

pendiente verdadera,
v
mientras que en
n el segundo caso es supeerior. Dado quue
ambos casoss tienen igual probabilidad
d de ocurrir, loos estimados de
d pendiente de
mnimos cuaadrados sernn correctos en promedio; ess decir, sern insesgados. Sin
S
embargo, enn ambos casos las lneas de regresin
r
de m
mnimos cuad
drados se ajusttan
a los puntoss de los datoos observadoss, en forma ms
m estrecha que la lnea de
regresin veerdadera; estoo conduce a una R2 que da un panoraama demasiaddo
optimista deel xito de la regresin de mnimos
m
cuaddrados. Sin em
mbargo, es ms
m
importante notar que loos mnimos cuadrados
c
prooducirn un estimado de la
varianza dell error que ess ms pequea que la variaanza del errorr verdadera.

6.2.1

C
Correccion
es para la correlacin
n serial

Asumimos que cada unoo de los trmiinos del errorr en un modeelo de regresin
lineal es exxtrado de una poblacin normal
n
con vvalor esperad
do 0 y variannza
constante pero que los errores
e
no soon independieentes a lo larrgo del tiemppo.
Dado que laa correlacin sserial, por lo general,
g
est ppresente en loss datos de seriies
de tiempo, usamos
u
un suubndice de t (en
( lugar de i)) y asumimoss que el nmeero
total de obseervaciones ess T. El modeloo es:
(6.11)
(6.112)
donde vi estt distribuida como N(0, 2v) y es indepeendiente de ottros errores a lo
largo del tieempo y t est distribuida como
c
N(0, 2 ) pero no es in
ndependiente de
otros errores a lo largo ddel tiempo. Ell proceso de eerror como see describe en la
ecuacin (6..12) se generaa por una reglla que dice quue el error en el
e periodo t esst
determinado
o por la dism
minucin en el
e valor del error en el periodo
p
anteriior
(multiplican
ndo por ) y luuego agreganndo el efecto de
d una variab
ble aleatoria con
valor esperaddo 0. Este proceeso autorregreesivo de primerr orden, denotaado AR( 1), es el
e

CAPTULO 6: Correlacin seria


al y rteterocedastic
ckJad

167

proceso de error autorregresivvo ms elemenntal que se exxpone en la paarte cuatro de


estee libro.
Es fcil veriificar que el efecto de un error en cuaalquier period
do dado, se
siennte en todos loos periodos fuuturos, con un
na magnitud qque disminuyee a lo largo
del tiempo. Tan slo calculam
mos las covaarianzas de t con todos loos periodos
prevvios:

Ressolviendo,

(6.13)

Una frmula till para el coefi


ficiente de corrrelacin seriaal de primer orden
o
p es:

en vista
v
de que 2= Var (t) = Var (t - 1)). Por tanto, mide el coeeficiente de
corrrelacin entree errores en ell periodo t y los
l errores en el periodo t - 1. Cuando
es igual a 0, no
n est preseente ninguna correlacin serial de prim
mer orden,
mieentras que un valor grande de implica la existencia de correlacin serial de
prim
mer orden.16
Si se conociera p, sera fcil ajustar el procedimient
p
o de regresinn de mnimos cuadrados ordinarios
o
paraa obtener estim
mados de parmetros eficieentes. Este

16
El trmino deel error para el prrimer periodo es una
u funcin de loos errores en el peeriodo anterior
paraa el que no se disspone de datos. La ecuacin (6.13)) sugiere que 1 esst distribuido enn forma normal
2
2
conn media cero y varianza
v
v /(1 - ).

168

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

procedimiennto implica el uso


u de diferen
nciacin generralizada para alterar
a
el modeelo
lineal en un
no en el que llos errores son
n independienntes. Para desscribir este prrocedimiento,, usamos el hecho
h
de que el modelo linneal en la ecuuacin (6.11) se
mantiene pa
ara todos los peeriodos. En paarticular,
(6.118)
Al multiplicar la ecuacin (6.18) porr y restndoolo de la ecuaacin (6.11), se
s
obtiene la trransformacin deseada:

son diferenciias generalizaddas de Yt, X2t, ,


Xkt y t. La ecuacin transsformada tiene un
proceso de error, por connstruccin, quue est distribbuido en forma independiennte
con media 0 y varianza cconstante. Porr tanto la regrresin de mnnimos cuadraddos
ordinarios aplicada
a
a la eccuacin (6.19) produce estiimados eficienntes de todos los
l
parmetros de regresinn. Por supuestto, el interceppto del modello original deebe
calcularse a partir del inttercepto estim
mado asociadoo con la ecuacin (6.19).17
Se ha reestringido la eexposicin dee la correlacin serial al casso en el que es
estrictamennte menor quee 1. Sin embaargo, el caso en el que es
e idnticamennte
igual a 1 ess de particulaar inters debiido a que connduce a un prrocedimiento de
estimacin que se usa comnmente.188 El proceso de solucin, conocido com
mo
primera dife
ferenciacin, see aplica si estimamos la ecuuacin transfoormada (por annaloga con ell procedimiennto de diferennciacin generralizada):

17
La ecu
uacin transformaada slo se definee para el periodo 2, 3, ..., t. La elim
minacin del periodo
inicial del proocedimiento de reegresin da como
o resultado la prdida de informaacin. Una soluccin
mejor tomaraa en cuenta las obbservaciones del primer periodo ccomo sigue:

Por construcciin,
18
Sin em
mbargo, observe qque conforme p se aproxima a 1,, la varianza del error
e
en la ecuaccin
original se vueelve infinitamentte grande, de moodo que el anlisis anterior no es lgico.

CAPTULO 6:
6 Correlacin seria
al y heterocedasticcidad

169

Nttese que la prrimera diferennciacin elimina la necesiddad de un trm


mino constantte en la ecuacin transform
mada. El inteercepto de la ecuacin oriiginal debe
calccularse por laa ecuacin oriiginal cuandoo las variabless son medidass alrededor
de sus medias reespectivas.19 S
Si se incluyerra un trminoo constante, recogera
r
el
efeccto de cualquuier tendenciaa de tiempo prresente en el modelo iniciaal.
El procedim
miento de diferrenciacin gen
neralizada sera muy til si el valor de
fu
uera conocido a priori. Debbido a que, porr lo general, ste
no es el caaso, examinam
mos algunos procedimienttos para estim
mar , cada uuno de los cuuales tiene
cierrtas ventajas y desventajas de clculo. Estos proceddimientos prooducen parm
metros estimaddos con las proopiedades desseadas cuandoo el tamao dee la muestra
es grande, sin embargo, see sabe poco sobre sus prropiedades de
d muestra
peq
quea.20
El procedim
miento de Coochrane-Orcu
utt21 Este proocedimiento im
mplica una
seriie de iteracionnes, cada una de
d las cuales produce
p
un esttimado mejorr de que la
anteerior. Es deccir, usa la noocin de que es un coeeficiente de correlacin
c
asociado con errrores de perioodos adyacenttes. En el prim
mer paso, de este procedim
miento, se usaan los mnim
mos cuadradoss ordinarios ppara estimar el modelo
origginal [ecuacin (6.11)]. Enntonces los ressiduales de estta ecuacin see usan para
reallizar la regressin,
(6.21)
El valor
v
estimaddo de se utiliza para reallizar el processo de transforrmacin de
difeerenciacin geeneralizada, y ejecutar unaa regresin nuueva. La ecuaacin transform
mada es:

La ecuacin estiimada transfoormada produuce valores dee parmetros para el interccepto originall 1 y todos loos parmetros de pendientee 2,...,k. Estos esti19

En el modelo de dos variables, por ejemplo, Yt* = Xt*. Para obteener el estimado del
d intercepto,

estim
mamos y luegoo sustituimos parra obtener = Y - X
.
20
Una alternatiiva atractiva quee es considerableemente ms difcil desde el punto
o de vista del
clculo es la estimaccin por mximaa verosimilitud co
ompleta, en la quue , , y 2v se
s eligen para
maxximizar la funcinn de log-verosim
militud:

Paraa mayores detalles, vase J. Kmentta, Elements of Econometrics (Nueeva York: Macmiillan, 1986),
secccin 8-3.
21
D. Cochranee y G.H. Orcutt,, "Application o f Least-Squares Rcgressions to Relationships
Containing Autocorreelated Error Term
ms", Journal of th
he American Statiistical Associationn, vol. 44, pp.
32-6
61, 1949.

170

PARTE DOS: Mo
odelos de regresin
n de una sola ecua
acin

mados de parmetros
p
revisados son sustituidos
s
en la ecuacin original
o
y se obo
tienen nuevvos residualess de la regresiin. Los nuevos residuales estimados sonn:

Si ejecutam
mos la regresiin,

estos residduales de seggunda vuelta pueden usarsse para obten


ner un estimaado
nuevo de .
Este procesoo iterativo pu
uede realizarsee para los passos que se dessee.
El procedim
miento estnddar es detenerr las iteracionnes cuando loss estimados nuen
vos de diffieren de los aanteriores por menos de 0.01 o 0.005, o despus
d
de quee se
han obteniido 10 o 20 estimados de . La eleccin especfiica que se haaga
depende dee los costos dde clculo impplicados. Por desgracia, no
o hay garantaa de
que el estim
mado final de minimizar la suma de reesiduales cuaadrados, debiddo a
que la tcn
nica iterativa puede conduucir a un mnnimo local enn lugar de a uno
u
global.
El proocedimiento de
d Hildreth-L
Lu22 En este procedimiento
p
o se especificaa un
conjunto dee valores en retcula para .
stos, por loo general, sonn valores espacciados que sirrven como suuposiciones para
p
el valor de . Si sabeemos que esttaba
presente la correlacin sserial positivaa, podramos eelegir valoress en retcula de
d p
iguales a 0,
0 .1, .2, .3, .44, .5, .6, .7, .8, .9, 1.0. Paraa cada valor de
d se estimaa la
ecuacin trransformada:

El procedim
miento seleccciona la ecuaccin con la m
menor suma dee residuales cuac
drados com
mo la mejor ecuacin. Esste procedimiento puede continuarse ccon
nuevos valores en retcuula elegidos enn la vecindadd del valor p que
q se seleccioona
primero haasta que se alccanza la preciisin deseadaa. Al usar el procedimiento
p
o de
Hildreth-Luu, podemos ellegir cualesquuier lmites y cualquier
c
arreeglo de espaciaado
para los vaalores de retcula. La tcnicca es prctica y, si se usa con
c cuidado suuficiente, har posible que se aproxime al
a estimador de
d mxima veerosimilitud de
d .
Debe tenerrse cuidado enn la eleccin de los valorees de retcula, de modo quee la
suma de cuuadrados mnnima obtenidaa sea global en
e lugar de lo
ocal.

6.2.2

Pruebas para la corre


elacin seriial

Prueba dee Durbin-Waatson Ahora considerarem


c
os una prueba de la hipteesis
nula de quee no est preseente la correlaacin serial ( = 0). La hipttesis alternativva

22
G. Hildreth y J.Y. Lu, "Demand
"
Relation
ns with Autocorr elated Disturbancces", Michigan Sttate
University Agrricultural Experim
ment Station Techniical Bulletin 276, noviembre
n
de 1960.

CAPTULO
O 6: Correlacin se
erial y heterocedasticidad

171

puede ser que no es cero o, en el casoo de unilaterallidad, que es


e positiva (o
n
negativa).
Porr mucho la pprueba ms popular para la
l correlacinn serial es laa
prrueba de Durbbin-Watson P

La prueba de Durbin-W
Watson implicaa el clculo dee una estadstiica de pruebaa
basada
b
en los residuales deel procedimiennto de regresiin de mnim
mos cuadrados
ordinarios.
o
La estadstica see define comoo:

Ntese que el numerador noo puede inclu


N
uir una diferenncia para la prrimera obser-v
vacin
en la muestra,
m
en vissta de que no se dispone dee una observaacin anterior.
C
Cuando
los vaalores sucesivvos de ^t estnn cerca entre s, la estadsttica DW ser
b
baja,
indicanddo la presenciia de correlaccin serial poositiva. La esttadstica DW
W
caer en el raango de 0 a 4,
4 con un vallor cercano a 2 indicando
o que no hayy
correlacin serrial de primerr orden.24 Al hacer
h
varias aaproximacionees, es posiblee
m
mostrar
que DW
W = 2(1 - ). Por tanto, cuaando no hay ccorrelacin serrial ( = 0), laa
estadstica DW
W estar cerca de 2. La coorrelacin serrial positiva se
s asocia conn
v
valores
DW po
or debajo de 22, y la correlaccin serial neggativa se asociia con valoress
D por encim
DW
ma de 2.
La interprretacin exactta de la estad
dstica DW ees difcil, deb
bido a que laa
seecuencia de lo
os trminos del error no slo depende dee la secuenciaa de los sinoo
taambin de la secuencia
s
de todos
t
los valoores X. Por estta razn, la mayor
m
parte dee
lo
os cuadros inccluyen estadsticas de prueeba que varaan con el nm
mero de variables
b independiientes y el nmero de obseervaciones.25 Se dan dos lmites, por loo
general,
g
denom
minados d1 y du. Si uno est investigandoo la posibilidaad de correla-cin serial posiitiva, un valorr para DW porr debajo de d1 lle permite a un
no rechazar laa
hiptesis
h
nula de que no hhay correlaci
n serial. Si DW es mayo
or que du, laa
hiptesis
h
nula se conserva. El rango entrre d1 y du noss deja con ressultados pocoo
concluyentes. Para la correllacin serial negativa
n
tan slo
s
se ven lass cosas desdee
el punto extreemo de 4 en lugar
l
de desd
de el punto exxtremo de 0. La hiptesis
nula
n se rechazaa si la estadsttica DW es mayor que 4 - d1 y la hiptesiis se acepta sii
DW
D es menor que 4 - du. Dentro del ranggo entre 4 - du y 4 - d1 la prrueba es pocoo
concluyeme. (Vase el ccuadro 6.1 para
p
un ressumen de laa prueba dee
Durbin-Watso
D
n.)

23
J. Durbin y G.S. Watson, "Testing for Seerial Correlation
n in Least-Squarres Regression",
Biometrika,
B
vol. 38
8, pp. 159-177, 1951. Esta pruebaa no es aplicable een forma directa si
s la regresin no
co
ontiene un trmino constante.
24
La estadsttica DW no pued
de usarse si la ecuacin de regressin contiene unaa variable depen-diente rezagada.
25
Algunos prrogramas para co
omputadora calcu
ulan la significan
ncia estadstica exacta
e
de la esta-dstica de Durbin-Watson.

172

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaccin

CUADRO 6.1
C
RANGO DE LA ESTADSTICA D
DE DURBIN-WAT
TSON

La regin
n de indeterm
minacin de laa prueba estadstica se deb
be al hecho de
d
que la secuenncia de residuaales es influidda por el movvimiento de la variable indeependiente en la ecuacin dde regresin. En
E esta reginn, es posible que
q la correlaacin aparentee de los errores se deba a la correlacin serial de la varriable indepenndiente, no a la correlacin serial de lo
os trminos ddel error.26 Su
upngase, poor
ejemplo, que las X siguen un proceso au
utorregresivoo de primer orrden, es decir,,
xt = rxt -1 + w t

(6.233)

donde 0 r < 1 y wt es unn trmino del error aleatoriio (no correlaacionado).


Despus de ciertas opeeraciones aritm
mticas adicioonales, no es difcil mostraar
que
(6.24)
Si el parmeetro de pendiiente estimad
do es idnticaamente iguall al parmetro
verdadero, enntonces la preesencia de corrrelacin seriaal en la variab
ble X es irreleevante para ell clculo de lla estadstica DW. A pesarr del hecho de
d que es un
u
estimador inssesgado de ,, habr error de muestreo implicado en
n el proceso de
d
estimacin, y as no ser idnticameente igual a . Deber qu
uedar claro de
d
inmediato a partir
p
de la ecuuacin (6.24) que, siendo iiguales otras cosas,
c
un valoor
superior de conducir a un valor infeerior de la estadstica DW. De hecho, un
u
valor de p cerrcano a 1 puedde empujar a la estadstica DW cerca de 0, aun cuanddo
los trminos del error pueedan no estar correlacionaddos en s mism
mos. Ahora la
l
razn para loos lmites supperior e inferrior asociadoss con la pruebba DW quedda
clara. El lmiite d1 es el appropiado paraa aplicarse, sii = 1. Cualqquier cosa poor
debajo de d1 indica correllacin serial positiva.
p
Por contraste, si p = -1 deberr
usarse el lmiite du. Cualquuier cosa por encima de du indica que laa correlacin

26
Para mayo
ores comentarios de la confiabilidaad de la prueba dee Durbin-Watson. vase R. Bartels y
J. Goodhew, "Thee Robustness of tthe Durbin-Watsonn Test", Review of
o Economics andd Statistics, vol. 633,
pp. 136-139, febrrero de 1981.

CAPITULO
O 6: Correlacin se
erial y heterocedas
sticidad

173

serrial positiva no
n puede acepptarse. Al trab
bajar con seriees de tiempo, es probable
qu
ue las X estnn autocorrelaccionadas positivamente, dde modo que el lmite d1
pu
uede ser el ms preciso de los dos.

EJEMPLO 6.5
5

Ca
arbn bituminos
so

27

See hizo un intennto de explicaar la demandaa de carbn bituminoso (COAL) como


un
na funcin dell ndice del Coonsejo de la Reserva
R
Federaal de producciin de hierro
y acero (FIS), el ndice del Consejo de la Reserva F
Federal de prooduccin de
serrvicios pbliccos elctricos (FEU), el nd
dice de precioos al mayoreoo para el carbn (PCOAL) y el ndice dee precios al mayoreo
m
para eel gas natural (PGAS). La
caantidad demanndada de carbbn bituminosso se ajust esstacionalmentte, y la serie
aju
ustada se us para realizarr una regresin lineal en llas variables explicativas
ennumeradas anntes. Las seriees de tiempo corren
c
en forrma mensual desde enero
dee 1965 a dicieembre de 19722.
La producccin de la reggresin original es la siguieente (con la estadstica
e
t
enntre parntesis):

Auunque todas las


l estadsticaas t son muy significativass, la estadstica DW baja
indica que es probable
p
que est presente la correlacin serial en loos residuales
estimados. Paraa la correccin de la pressencia de corrrelacin seriaal de primer
orrden positiva,, se aplic el procedimien
nto de Hildretth-Lu. Se ejecutaron una
serie de regresiiones, cada unna con un valoor elegido differente de . La
L bsqueda
dee retcula se describe
d
en el cuadro siguiente:

27

zaccin.

Este ejemploo fue construido por


p Dynamics Associates, Cambriddge, Mass., y se usa
u con autori-

174

P
PARTE
DOS: Mod
delos de regresin
n de una sola ecua
acin

El valorr final de eleegido fue 0.6, que es el vaalor asociado con la suma de
d
residuales cuuadrados ms pequea de las
l ejecucionees de la regressin. Cuando se
asign al vallor de 0.6 a , se realiz la transformaci
t
n autorregressiva y se ejecuut
la regresin final, los resuultados fuero
on:

Ntese que la estadsticaa DW es conssiderablementte mayor que en la regresin


original y que
q todos los coeficientes de regresin estimados coontinan sienddo
significativo
os en el nivel ddel 5%.

EJEMPLO
O 6.6

Tasas de inters

En este ejem
mplo, reconsidderamos el inttento (vase eel ejemplo 4.2
2) de estimar un
u
modelo de una
u sola ecuaccin que expliique el movim
miento de la taasa de bonos de
tesorera Rt como una funncin de la prroduccin inddustrial (IPt), la
l tasa de creccimiento del suministro
s
dee dinero (GM22t) y la tasa dde inflacin (G
GPWt). Recurdese que la ecuacin estiimada (con laa estadstica t entre parnttesis) era:

La estad
dstica DW baaja de 0.18 suugiere la preseencia de correelacin serial de
primer orden
n positiva. La correlacin seerial tambin puede verse en
e forma grfica
notando enn la figura 6.2 que los residuales de regresin estn muuy
correlacionaados. Cuando un residual es
e positivo (negativo) duraante un perioddo,
es probable que permaneezca positivo
o (negativo) ddurante el sig
guiente. Esto es
notorio, espeecialmente, all final de la dcada
d
de 1970 y principioss de la de 19880,
un periodo de
d tasas de intters nominalles altas. A meenos que se hagan
h
correcciiones para la presencia dee correlacin serial, no slo se estimaarn de maneera
ineficiente lo
os parmetross, sino que es posible que los
l pronstico
os subestimen la
serie de tasaas de inters reales
r
en form
ma considerabble.

CAPITULO
O 6: Correlacin serial y heteroceda
asticidad

175

Para mejorrar el modelo estimamos dee nuevo la ecuuacin de la taasa de inters


ussando el proceedimiento de Cochrane-Orc
C
cutt. Los resulltados son los siguientes:

Esta ecuacin se ajusta muccho mejor quee la ecuacin no corregida.. Las estadsE
ticas t son algoo menores, peero son las esttadsticas corrrectas, estimadas en forma
efficiente. (Reccurdese que lla estadstica OLS originall era sesgada..) Ntese por
lltimo que la estadstica
e
DW
W de 1.64 esst considerabblemente por debajo de 2.
E sugiere que
Esto
q podran esstar presentess formas ms complejas dee correlacin
enntre los residuuales. Verem
mos esta posibbilidad en la parte
p
cuatro.

6.2.3
6

Pru
ueba de corrrelacin se
erial cuando
o hay
una variable de
ependiente rezagada

Cuando estn presentes


C
p
unaa o ms variabbles endgenaas rezagadas, la estadstica
D a menudoo, estar cercaa de 2 aun cuan
DW,
ndo los errorees estn correlacionados en
fo
orma serial. Por
P supuestoo, uno podraa tan slo veer que la estaadstica DW
prroporciona unn indicador dee correlacin serial
s
cuando la estadstica DW es baja,
peero este enfoque es fuerteemente sesgaddo contra el hallazgo
h
de laa correlacin
seerial.28 Por suuerte, una pruueba alternativva relativameente fcil propporcionada
28
Los resultaados bsicos son derivados en J. Durbin, "Testingg for Serial Correelation in LeastSqquares Regressionn When Some off the Regressors Are
A Lagged Depeendent Variables"", Econometrica,
vo
ol. 38, pp. 410-4221, 1970.

176

PA
ARTE DOS: Mode
e los de regresin de una sola ecua cin

por Durbin es
e estrictameente vlida paara las muesttras grandes de datos perro
puede usarse tambin paraa muestras peq
queas. Para vver cmo se applica la pruebaa,
supngase qu
ue hemos estiimado la ecuacin (6.25) uusando mnim
mos cuadradoos
ordinarios:
(6.255)
La estadsticca de prueba que se usa es
e la estadstiica h de Durbbin, la cual sse
define como:
(6.266)
donde Var ( ) se estima como
c
el cuaddrado del errorr estndar dell coeficiente de
d
la variable en
ndgena rezaggada, T es el nmero de obbservaciones y es el coefficiente de correlacin serial de primerr orden estim
mado, puedee estimarse en
e
forma directaa a partir de laa estadstica DW
W, dado que D
DW = 2(1 - ). Resolvienddo
para y sustituyendo, enncontramos que:
q

(6.277)
En vista de que Durbin ha
h mostrado que la estaddstica h est distribuida en
e
forma aproxiimadamente nnormal con varianza
v
unitaaria, la pruebaa para la correelacin serial de primer ordden puede haccerse en form
ma directa usan
ndo la tabla de
d
distribucin normal.
Es imporrtante sealaar que la prueeba h de Durrbin no es vlida cuando T
Var ( ) es mayor
m
que 1. (No podemo
os tomar la raaz cuadrada de un nmerro
negativo.) Enn este caso D
Durbin propon
ne una pruebaa alternativa que
q slo es un
u
poco ms com
mplicada. Prim
mero se obtien
ne la variable residual ^t de la regresin dde
mnimos cuaadrados ordinarios y tambiin creamos laa variable ressidual rezagadda
^ t-1 . Para siimplificar lass cosas, la primera
p
obseervacin debeer eliminarse.
Estimamos la ecuacin (66.28):
(6.288)
Luego hacem
mos una pruebba t de la hiptesis nula dee que * no ess significativaamente difereente de 0. Si rechazamos esta hiptesiis nula, conccluimos que lla
correlacin serial
s
de prim
mer orden est presente.
Cuando hay
h una correelacin serial significativa
s
een la presenciaa de una variaable dependieente rezagadaa, la estimacin del parm
metro se vuelv
ve ms difciil,
ya que la esttimacin de m
mnimos cuaddrados ordinarrios produce resultados
r
sessgados.

CAPTULO
O 6: Correlacin se
erial y heterocedasticidad

EJEMPLO 6.7

177

Co
onsumo agrega
ado

Estimamos unaa versin simpple y dinmica de una funcin de consum


E
mo agregado,
en
n la cual el consumo acttual C es un
na funcin deel consumo rezagado un
trrimestre C-1 y el ingreso diisponible actu
ual YD.29 La eecuacin de mnimos
m
cuadrrados estimada (usando ddatos trimestrrales del prim
mer trimestree de 1959 al
teercer trimestrre de 1995) ees la siguientee (los erroress estndar apparecen entre
paarntesis):

Para probaar la correlacin serial usam


mos la pruebaa h de Durbin.. Dado que el
errror estndar del
d coeficientee de la variablee dependiente rezagada es 0.0304,
0
DW =
1..569 y T = 14
47, calculamoss que:

En vista de quee 2.79 es mayyor que el valo


E
or crtico de laa distribucin normal en el
niivel del 5% (11.645 para unna prueba unillateral), rechazzamos la hiptesis nula de
no
o correlacinn serial. Com
mo resultado, es importantte corregir laa correlacin
seerial, para haccer la estimacin de una fun
ncin de conssumo agregaddo dinmica.

A
APNDICE
6
6.1
Es
stimacin de mnimos
m
cuadra
ados generaliza
ados

En el apndicee 4.3 expusim


E
mos la generallizacin matriicial del modelo de regresiin mltiple. Entre las supoosiciones del modelo lineaal clsico estaaba la suposiciin de que el trmino del error no estabba autocorrelacionado y teena varianza
coonstante. En notacin
n
matrricial escribim
mos:
E(') = 2I
do
onde I es unaa matriz de iddentidad N x N.
En este appndice generralizamos el modelo
m
lineall para aplicarllo a casos en
loos que la correelacin seriall y la heteroceedasticidad esstn presentess. Logramos

29
Usamos lass variables Citibasse GC y GYD, las cuales miden ell gaslo real y el in
ngreso en dlares
dee 1982.

178

PA
ARTE DOS: Modelos de regresin de
d una sola ecuaccin

esto
e alterandoo nuestra supposicin respeecto a la matrriz varianza-ccovarianza dee
los
l trminos del
d error. Asuumimos que:
E(') = 2

(A6.1)

2 es desconoocida, pero es
e una matriz N x N conociida. Esto es eq
quivalente a laa
suposicin
s
dee que los elem
mentos de son conociddos hasta un escalar multiiplicativo.
p
La nica suposiccin que neceesitamos haceer acerca de la
l matriz es
que
q es positivva definida.30
La formaa ms generall del caso de heterocedastiicidad ocurre cuando la est
tructura
del error
e
es:

La heteroceddasticidad difiiere del modeelo clsico slo en el hecho de que laas


L
v
varianzas
del error difierenn entre observvaciones. Toddas las covariaanzas del erroor
se suponen igguales a 0. Siin embargo, en
e el ejemploo de la correlaacin serial de
d
p
primer
orden,, ninguno de llos elementos de es iguaal a 0. En este caso la matriz
v
varianza-cova
arianza es:

El objetivvo de la estim
macin de mn
nimos cuadraddos generalizaados es enconntrar estimadoss de parmetrro para el vecttor en la maanera ms efiiciente posiblee,
explicando laa informacin proporcionad
da por el conoocimiento de la matriz . Al
A
suponer que todas
t
las hiptesis de mniimos cuadraddos se sostieneen, obtenemoos
mejores estim
mados de parrmetro insessgado lineal si
s transformam
mos los datoos
originales de modo que la matriz de varrianza-covariaanza de los errrores transforrmados es iguual a 2I. Unaa vez que se hace esto, laa aplicacin del
d teorema dde
Gauss-Markoov nos dar eel resultado deseado. La suuposicin de que es unna
matriz definid
da positiva ess suficiente para garantizarr que tal estraategia siemprre
tendr xito. Usamos un teeorema bsico de lgebra m
matricial quee establece quue
existe una matriz
m
N x N no singular H tal que:
HH
H' = I

(A6.22)

30
Una matrriz A es positiva definida
d
si y slo si x'Ax es mayorr que 0, para todass las x no iguales a
0, donde x es unn vector N x 1.

CAPTULO 6: Correlacin serial


s
y heteroceda
asticidad

179

E
Encontraremo
os til replanteear la ecuaci
n (A6.2) en la
l forma,
(A6.3)
d lo cual resuulta que:
de
(A6.4)
U
Usamos
la maatriz H para trransformar el modelo origiinal como siggue:
(A6.5))
o

(A6.6))

d
donde
E trmino dell error es coonsistente, yaa que, a partirr de la ecuaci
El
n (A6.2),

En vista de quue la ecuacinn (A6.6) obeddece las supossiciones clsiccas, sabemos


E
q el estimad
que
dor
(A6.7))
seer insesgadoo y eficiente.
En funcinn de nuestross datos originaales, el estimador de mnim
mos cuadra
d generalizaados es
dos

(A6.8)
L matriz variianza-covariaanza del vectoor del parmetro estimado es:
La
(A6.9)
Para
P
ver que los resultados de los mnim
mos cuadradoos generalizaddos coinciden
co
on los mnim
mos cuadradoss ordinarios cu
uando = I, sustituimos para
p en las
eccuaciones (A66.8) y (A6.9) y resolvemoss.
Para aplicar los mnimoos cuadrados generalizadoos (GLS), neccesitamos un
estimado de ,
y a fin de reealizar pruebaas estadsticas, necesitamoss estimar 2.

180

PA
ARTE DOS: Modelos de regresin de
d una sola ecuaci n

Cuando
C
ess conocido, ppodemos estim
mar 2 de los residuales de la regresinn
2
GLS.
G
Un estimado insesgaado de est dado por:

donde
d
u es ell vector de loos residuos GLS en este caaso. Sustituyeendo nos da:

de modo que un estimadoo insesgado dee E[( - )( -)'] est dado


o por:
(A6.100)

Si es normall, est distriibuida en form


ma normal y ppueden aplicarrse las pruebaas
estadsticas.
Nuestro problema
p
finaal es encontrarr un estimado consistente de
d . Debido a
que es una matriz N x N con N(N + 1 )/2
) elementoss, es imposiblee estimar todoos
los elementoos de slo a partir de N observaciones. Las su
uposiciones dde
heterocedastiicidad y correelacin serial de primer orrden proporciionan dos forrmas tiles dee parametrizarr el modelo, aunque
a
se disppone de numeerosas alternaativas.
Una vez que se ha usaado un estimaador consistennte de , nuestro estimadoor
p
perder
la proopiedad de serr un estimado
or insesgado ppero retendr una propiedad
de muestra grrande apropiaada (algo cercana a la consistencia). Si se estima de
d
m
manera
conssistente por uuna matriz V,
V el estimaador GLS y su matriz dde
v
varianza-cova
arianza son:
(A6.lll)

(A6.122)
donde ^ son los residualees de los mn
nimos cuadraddos ordinario
os y u son loos
residuales dee los mnimoss cuadrados generalizados..
Para com
mpletar este appndice, ser til
describir la matriz de transformacin
t
n
H en los casoos de heteroceedasticidad y correlacin
c
seerial de primer orden. En ell

CAPTULO
O 6: Correlacin se
erial y heterocedas
sticidad

181

primero es basstante fcil ellegir H de modo


m
que H'H
H = -1. El leector deber
co
omprobar paraa ver que

es la eleccin correcta.
c
Trannsformar los datos de acuuerdo con la matriz H es
eqquivalente al procedimiento
p
o de mnimoss cuadrados pponderados deescrito en el
texxto.
La derivacin de H en ell caso de la co
orrelacin seriaal de primer orden
o
es algo
ms difcil. En este caso:

Ell hecho de quee H es la elecccin correcta puede comproobarse evaluaando (H'H) -1


= . La aplicaccin de la traansformacin H a los datoss es equivalennte a usar el
proceso de diferenciacin geeneralizada y luego aplicar mnimos cuaadrados ordinaarios. En este sentido, las coorrecciones paara la correlaccin serial imp
plican el uso
dee estimacin de mnimos cuadrados poonderados iguual que en ell caso de la
heeterocedasticiddad.
Qu pasa si se usa la estimacin de
d mnimos ccuadrados ord
dinarios aun
cu
uando es aproppiada la GLS?? Primero sabeemos que si see conoce , lo
os estimados
dee parmetro OLS y GLS serrn insesgadoss pero los estiimados de parrmetro OLS
tenndrn una varrianza mayor que sus contrrapartes GLS. Sin embargo
o, tambin es
veerdad que el estimado
e
OLS
S de la matrizz de varianza--covarianza ser sesgada.
Paara ver esto, recurdese quee la matriz dee varianza-covvarianza OLS
S es:
(A6.13)
Si el modelo GLS de hecho fuera correcto
o, la matriz dee varianza-covarianza del
veector del parmetro = (X
X'X)-1X'Ysera

182

PARTE DOS: Mode


e los de regresin de una sola ecua cin

dado que
(A6.144)
La matriz dee varianza-covvarianza repoortada en la eccuacin (A6.113) puede prooducir un estim
mado bastantte pobre de laa matriz de vaarianza-covarrianza correctta
para los estim
mados de parrmetro de mnimos
m
cuadrrados ordinarrios como estt
dado por la ecuacin
e
(A6..14).
EJERCICIO
OS
6.1 Explique de
d manera intuuitiva por qu loos mnimos cuaadrados ponderrados producenn
estimadores dee parmetro ms eficientes qu
ue los mnimoss cuadrados orddinarios cuandoo
se sabe que ell trmino del errror es heteroccedstico.
6.2 Usted estt estimando uuna regresin de
d corte transvversal de una muestra de 1000
ciudades en Esstados Unidos en la que esperra explicar los gastos en educcacin como unna
funcin del in
ngreso medianoo en la comunid
dad, el nmeroo de nios en edad
e
escolar y el
nivel de subsid
dios estatales y federales recibbidos con propsitos educativ
vos. Usted espeerara que la heeterocedasticiddad fuera un problema en este caso? De seer as, usara la
l
prueba de Golldfeld-Quandt?? Por qu?
6.3 Al estimarr la relacin enntre las ventas y los gastos enn publicidad de una empresa en
e
una industria. Se le hace evvidente que laa mitad de las empresas en la
l industria soon
grandes en rellacin con la otra
o mitad, y est preocupadoo por la tcnicca de estimacin
apropiada en una
u situacin as.
a Suponga que
q las varianzzas del error associadas con laas
empresas gran
ndes son el dooble de las variianzas del erroor asociadas co
on las empresaas
pequeas.
a) Si us mnimos cuaddrados ordinariios para estimaar la regresin de las ventas en
e
la publicidad (suponniendo que la publicidad
p
es uuna variable independiente, nno
correlaacionada con el
e trmino del error), usted estimara quee los parmetroos
son inssesgados? Connsistentes? Efficientes?
b) Cmoo podra revisaar el procedimiiento de estimaacin para elim
minar o resolveer
sus difficultades?
c) Puedee probar si es vlida
v
la suposicin de variannza del error orriginal?
6.4 Por qu es improbablee que los errorees en los estuddios de corte trransversal estn
correlacionadoos serialmente?? Puede dar un
u ejemplo en el
e que estar prresente la correelacin serial?
6.5 Puede tomar un valorr absoluto que sea
s mayor que 1? Qu le dicee esto respectoo a
la estabilidad del modelo quue se est estuddiando?
6.6 Usando loos datos de rennta del cuadro 2.1,
2 en el ejerccicio 5.2 estim
mamos el modello
RENT PER = 1 + 2(SEX) + 3(ROOM PE
ER) + 4 (DIST
T) + . Usando una
u prueba F,
pruebe la hiptesis de que:
Vaarianza (hombre) > Varianza (mujcr)
Sugerencia: Ejeecute regresionees separadas de RENT
R
PER = 1 + 3(ROOM PER)
P
+ 4(DIST
T)
+ para homb
bres y mujeres. (Por qu eliiminara la variiable SEX paraa estas regresioones?)

CUADRO 6.2
CONJUNTO DE DATOS DE GASTOS
E, N, S, W = variable ficticia igual a 1 si el estado est en la regin este, norte, sur u oeste, respectivamente; 0 de lo contrario
EXP = gastos totales del gobierno estatal y local, millones de dlares
PCEXP = gastos per cpita del gobierno estatal y local, en dlares
PCAID = ayuda federal per cpita, en dlares
POP = poblacin del estado, en miles
DEN = densidad de poblacin, en miles por milla cuadrada
DPOP = porcentaje de cambio en la poblacin de 1960 a 1970
URB = porcentaje de la poblacin que vive en reas metropolitanas (SMSA)
PCINC = ingreso personal per cpita, en dlares
PS = poblacin que asiste a escuelas primarias o secundarias pblicas, en miles
E

DEN

DPOP

Maine

Estado

704

686.16

186

1026

.033182

2.5

21.6

3 664

251

N.H.
Vt.
Mass.
R.l.
Conn.
N.Y.
N.J.
Pa.
Ohio
Ind.
III.
Mich.
Wisc.
Minn.
lowa
Mo.
N. Dak.
S. Dak.
Neb.

1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1

0
0
0
0
0
0
0
0
0
0.
0
0
0
0
0
0
0
0
0

0
0
0

526
411
5166
699
2 546
22 750
5911
8 840
6 67
3 457
8 935
7 799
3 757
3 528
2108
3156
475
521
1052

679.59
893.48
891.30
721.36
826.62
1 238.60
804.33
742,55
640.46
653.99
794.65
865.31
830.09
909.98
730.93
664.84
749.21
766.18
688.48

123
235
190
184
145
240
141
136
112
103
156
147
116
163
113
151
201
195
134

774
460
5 796
969
3 080
18 367
7 349
11905
10 722
5 286
11244
9013
4 526
3 877
2 884
4 747
634
680
1528

.085743
.049639
.74061
.92374
.63348
.38400
.97713
.26476
.26167
.14644
.20169
.15863
.083101
.048897
.051554
.068802
.009152
.008953
.019978

21.5
14.1
10.5
10.5
19.6
8.7
18.2
4.2
9,7
11.4
10.2
13.4
11.8
11.5
2.4
8.3
-2.3
-2.1
5.1

27.3
0.0
84.7
84.7
82.6
86.5
76.9
79.4
77.7
61.9
80.1
76.7
57.6
56.9
35.6
64.1
11.9
14.3
42.8

4279
3 703
4 825
4 513
5 414
5 275
5 379
4 545
4 $72
4 364
5162
4 982
4 279
4343
4 316
4 307
4128
3 766
4 451

168
107
1203
190
665
3 524
1513
2 362
2 422
1221
2 349
2197
995
910
647
1030
142
162
330

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

EXP

PCEXP

PCAID

POP

URB

PCINC

PS

CUADRO 6.2
CONJUNTODE DATOS DE GASTOS (continuacin)

Fuente: U.S. Bureau of the Census, Census of Governments and Census of Population, 1970.

CAPTULO 6:
6 Correlacin serial y heterocedastic
cidad

185

6.7 Usando el con


njunto de datoss de gastos dell cuadro 6.2, esstime el modello

usanndo mnimos cuadrados


c
ordinnarios. Luego use
u una pruebaa de Goldfeld-Q
Quandt para
ver si V() ~ POP
P2. Si rechaza laa hiptesis nulaa, vuelva a esttimar la ecuacin en forma
eficiente.
6.8 Usando los reesiduales de la estimacin OL
LS de EXP = 1 + 2 (POP) + 3 (AID) +
4(IINC) + , realicce una prueba dde White y unaa prueba de Breeusch-Pagan paara heterocedasticidad, asum
miendo que la varianza
v
del errror es proporciional a POP.

CAPTULO

VARIABLES INSTRUMENTALES
Y ESPECIFICACIN DEL MODELO

En el captulo 6, nos enfocamos en la falla posible de dos suposiciones del modelo de regresin bsico: homocedasticidad y no correlacin serial. En este
captulo nos centraremos en otros problemas potenciales con el modelo.
Comenzaremos con la suposicin de que cada una de las variables
independientes no est correlacionada con el trmino del error. Cuando esta
suposicin no se mantiene, la regresin de mnimos cuadrados ordinarios ya no
produce estimadores de parmetro insesgados y consistentes. Una fuente de
falla es el error de medicin en una o ms de las variables independientes. Otra
fuente, es cuando una variable independiente es determinada en parte por la
variable dependiente, sta se expondr en el captulo 12. En la segunda seccin
de este captulo mostraremos que cuando hay error de medicin se pueden
obtener estimadores consistentes, si variables nuevas llamadas instrumentos
remplazan a las variables que fueron medidas con error. La nueva tcnica de
estimacin de "variables instrumentales" sirve como un remplazo para los
mnimos cuadrados ordinarios.
En la tercera seccin consideraremos el problema del error de especificacin, es decir, de lo que sucede cuando el modelo es invlido, al excluir una
variable apropiada, incluir variables irrelevantes o tener la forma funcional
errnea. Esto sirve como una base para el tratamiento breve de los trueques
implicados en la construccin de modelos economtricos. La cuarta seccin
ampla an ms el anlisis. Se describe una serie de herramientas diagnsticas
que pueden ser tiles para determinar si uno o ms puntos de datos tienen una
influencia inusualmente fuerte en la lnea de regresin estimada. Por ltimo, en
la ltima seccin describimos diversas pruebas estadsticas formales que ayudan
a evaluar si un modelo est especificado en forma correcta.
186

CAPIT
TULO 7: Variables instrumentales y e
especificacin del modelo

7.1

187

CORRELACI
N ENTRE UNA VARIA
ABLE INDEP
PENDIENTE Y
EL TRMINO DEL
D
ERROR
R

Laas dificultades que surgen cuando las vaariables indeppendientes y el


e error estn
coorrelacionadoss pueden obseervarse con deetenimiento een el modelo de
d dos variablles, con ambas variables m
medidas en form
ma de desviacciones. El esttimador de la
peendiente de mnimos
m
cuadrrados es:

Suustituyendo y expandiendoo trminos, obbtenemos:


(7.1)
See demuestra, por tanto, quue el estimad
dor , es un eestimador nssesgado de
cuuando se supoone que las obbservaciones de la variablle X son fijas en muestras
reepetidas. La prrueba dependee en gran med
dida del hechoo de que el vaalor esperado
deel segundo trrmino del laddo derecho dee la ecuacin (7.1) es iguaal a 0. Ahora
su
uponga que cambiamos
c
nnuestra hipteesis inicial aasumiendo quue las X son
esstocsticas (variables aleattorias). Si asu
umimos adem
ms que E(xxii) = 0, los
reesultados del teorema
t
de Gaauss-Markov se debilitan aalgo. Ahora ess cierto que P
ess un estimadoor insesgado, condicional en X; es deccir, dados los valores particculares de X, . Sin embarrgo, en muchas situaciones, nos interesarn las propiiedades de E(() = independiente de los valores dee X. Adems, podemos no
deesear hacer laa suposicin de
d que X y no
n estn correelacionados. En
E este escenaario general cambiamos
c
nuuestro enfoque; en lugar dee concentrarnnos en la preseencia o ausenccia de sesgo, estudiamos laas propiedades de muestra grande de .
De manera especfica, buscaamos las suposiciones que sson necesarias para garantizzar que serr un estimaddor consistentte.
Generalmeente, no hay ggaranta de qu
ue X y no esttn correlacioonados y por
coonsiguiente no
o hay garantaa de que seer un estimador consistennte de . Para
veer esto, considdrese el caso en el que se sabe
s
que X y estn correlacionados en
fo
orma positiva sin tomar en consideracinn el tamao dde la muestra.. Un examen
rpido de la ecuuacin (7.1) hhace evidentee que el trmiino del lado derecho
d
de la
eccuacin ser positivo
p
y quee sobrestimaar el valor dee parmetro verdadero
v
sin
im
mportar cul sea
s el tamaoo de la muesttra. Por tanto, la correlacin entre una
vaariable indepeendiente y el trmino del error
e
conducee, en general, a estimados
dee parmetro de
d mnimos cuuadrados ordinarios inconsistentes. El ejemplo
e
particcular que se accaba de usar sse describe en
n forma grfica en la figura 7.1. La lnea
slida represennta la lnea de regresin verrdadera, mienntras que la ln
nea punteada
reepresenta la lnea de regressin de mnim
mos cuadradoos ordinarios. Al lograr su
ob
bjetivo de minnimizar la sum
ma de cuadrad
dos de los resiiduales estimaados, los

188

PA
ARTE DOS: Mode
elos de regresin de una sola ecua cin

Figura 7.1

Correlacin
n entre X y e.

mnimos cuaadrados ordinnarios produccen estimadoss sesgados e inconsistentees


del parmetrro de la pendiiente de la reegresin verdadera. En estte caso la penndiente se ha sobrestimadoo. (El estimaddor del interceepto ser un estimador sessgado e inconnsistente del intercepto veerdadero, mieentras que el error estndaar
estimado de la
l regresin y los errores estndar
e
de loss coeficientes tambin sern
sesgados e innconsistentes.)

7.2

ERRORES EN
E LAS VAR
RIABLES
Hemos supueesto que todaas las variablees usadas en eel procedimieento de clcullo
de la regresi
n fueron meddidas sin errorr. En la prctiica, es probabble que ocurraan
errores de medicin (al iggual que errorres creados all especificar mal
m el modeloo)
y, como vereemos, estos errrores pueden
n alterar consiiderablementee las propiedaades de los esstimadores dee los parmetros de la regrresin. Nos abriremos
a
passo
poco a poco a travs del problema dell error de meedicin considderando varioos
casos cada veez ms compllejos.

7.2.1

Caso
C
I: Y ess medida co
on error

Supngase qu
ue el modelo de regresin verdadero
v
(escrito en formaa de desviacioones) es:
yi = xxi + i

(7.22)

donde i reprresenta los errrores asociados con la esppecificacin del


d modelo (loos
efectos de vaariables omitiddas, etc.). Ad
dems supongga que se obtieene la variablle
y*, en lugar de
d y, en el prooceso de med
dicin:
yi* = yi+ui

donde Cov (u
( i,xi) = 0

CAPTU
ULO 7: Variables instrumentales y especificacin del modelo
m

189

El modelo de reegresin es esstimado con y*


y como la vaariable indepeendiente, sin
tom
mar en cuentaa el hecho de qque y* no es una
u medida prrecisa de y. Agregando
A
el
trrmino del erroor de medicinn ui a cada laddo de la ecuacin (7.2), vem
mos que esto
es equivalente a ejecutar la regresin
r
sigu
uiente:
(7.3)

Ob
bserve que si ui no tiene m
media 0, nuesstra regresinn estimada neecesitara un
trrmino de inteercepto. En ccualquier caso, mientras ui y xi no esstn correlacio
onadas, no haay problema asociado conn ejecutar la regresin deescrita en la
ecuuacin (7.3). El estimadorr de la pendieente ser insessgado [dado que
q E( ui xi)
= 0]
0 y consistennte. El nico efecto de la presencia dell error de meedicin en la
varriable depend
diente es incrrementar la vaarianza del errror. Sin embbargo, la variaanza del error incrementadaa ser explicaada en el estim
mado de s2, ess decir, en la
varrianza residuaal estimada, y se aplicarnn todas las pruuebas estadstticas. (Como
reggla general, es
e imposible sseparar los effectos de los errores asociiados con el
moodelo de regrresin y el errror de mediccin, y no see hace ningnn intento de
connseguirlo.) Siin embargo, lla situacin no es tan propicia cuando la variable X
se mide con error.

7.2.2

Caso
o II: X es medida
m
con
n error

Su
upngase que xi* = xi+ vi, donde xi es el
e valor verdaadero y xi* es el valor obserrvado. El mod
delo de regresin verdaderra es:

miientras la ejeccucin de la regresin


r
reall es:
(7.4)
Au
un si suponem
mos que el eerror de mediicin en X esst distribuiddo en forma
noormal con med
dia 0, no tienne correlacinn serial y es inndependiente del error en
la ecuacin verdadera, surgeen problemas al usar mnim
mos cuadradoos ordinarios
coomo una tcnicca de regresinn. Esto puede verse con ms facilidad nootando que el
errror * y la varriable x* en laa ecuacin (7.4) estn correelacionados (o
o tienen una
co
ovarianza no cero).
c
En partticular,

Poor tanto, los esstimadores dee mnimos cuaadrados de loss parmetros de regresin
sern sesgados e inconsistenntes, con el grrado de sesgoo e inconsistenncia estando
rellacionado conn la varianza del error de medicin.
m

190

PARTE DOS: Modelos de regresin de una sola ecua


acin

7.2.3

Ca
aso III: X y Y son med
didas con e
error

Este caso noo contiene connclusiones nueevas comparaddo con el caso


o anterior, perro
ser til examinarlo con ccierto detalle. Las suposiciones son las siguientes:

ui y vi no estn correlacionnadas entre s al


a igual que coon xi, y cada proceso
p
de erroor
no implica enn s mismo unna correlacin serial. La ecuuacin de regrresin estimadda
ser de la fo
orma:

Ahora considrese el estiimador de mn


nimos cuadraados ordinarioos :

Dado que xi, ui y vi son toodas estocsticas, no es fccil evaluar el sesgo de . La


L
razn para essto es que el vvalor esperadoo de la razn de
d dos variables aleatorias no
n
es igual a laa razn del vaalor esperado de las variabbles. Sin embbargo, podemoos
evaluar la co
onsistencia de evaluandoo la expresin para en el lmite conform
me
el tamao dee la muestra sse hace ms grande.
g
Este cclculo se dennota plim . En
E
vista de que ui y vi no esttn correlacioonadas entre ss al igual quee con xi, resullta
que:1
(7.5)

Esto sugiere que la presenncia del error de medicin ddel tipo menccionado, conduucir a una suubestimacin del parmetrro de regresin verdadero si se usan tcnicas de mnnimos cuadraddos ordinarioos.

7.2.4

Esstimacin de
e variables instrumentales

El problemaa de los errorees en la mediccin de variabbles de regresiin es muy im


mportante, perro los econom
metristas no tiienen mucho que ofrecer en
e la forma dee
1
Hemos utilizado
u
un resulttado que para varriables aleatorias Z1 y Z2, plim (Z1/Z
/ 2) = plim Z1/plim
Z2. En este caso
o particular dividdimos el numerad
dor y el denominnador entre N y usamos
u
el hecho de
que plim x 2i / N = Var(x) y pplim v 2i /N = 2v .

CAPT
TULO 7: Variables instrumentales y e
especificacin del modelo

191

so
oluciones tiles. Generalmente, tendemoos a pasar porr alto el probleema del errorr
dee medicin, esperando
e
quee los errores sean
s
lo bastannte pequeos como
c
para noo
deestruir la validez del proceedimiento de estimacin.
e
U
Una tcnica quue est disponiible y puede solucionar
s
el problema dell error de meddicin es la tcnica de esti-macin
m
de variiables instrum
mentales. Expliicaremos en fforma breve el concepto dee
variables instruumentales, enn parte debidoo a que es proobable que sea til con los
errrores de meedicin y porrque es impo
ortante cuanddo uno est tratando
t
conn
modelos
m
que consisten
c
en ssistemas de ecuaciones sim
multneas.
El mtodoo de variables instrumentales implica la bsqueda de una variable
nu
ueva Z, que est
e altamentee correlacionadda con la variiable independdiente .Y y al
mismo
m
tiempo no est correelacionada con
n el trmino ddel error en laa ecuacin (al
ig
gual que con los
l errores dee medicin dee ambas variaables). En la prctica,
p
estamos
m interesadoos en la consiistencia de los estimados dde parmetro y, por consiguuiente, nos concentramos
c
s en la relaciin entre la variable
v
Z y las restantes
variables del modelo
m
cuanddo el tamao de la muestraa se hace mss grande. Defiinimos la variiable aleatoriaa Z como un instrumento sii:
1. Las corrrelaciones enntre Z y , u y v, respectivaamente, en laa ecuacin se
approximan a cero
c
conformee el tamao de
d la muestra se hace ms grande.2
2. La corrrelacin entre Z y X es no cero
c
conform
me el tamao de
d la muestra
see hace ms grrande.
Si somos lo bastante afortunados
a
p
para
ser capacces de elegir entre varios
innstrumentos, tan slo selecccionaremos el instrumentto (o combinaacin de instrrumentos) quue tiene la corrrelacin mss alta con la vvariable X.
Por el mom
mento, suponnemos que pu
uede encontrarr dicha variabble y que po-d
demos
alterar el
e procedimieento de regressin de mnim
mos cuadradoss para obtenerr
parmetros esttimados que ssean consisten
ntes. Por desggracia, no hayy garanta dee
q el procesoo de estimaccin producir estimadoress insesgados de los par-que
m
metros.
Para sim
mplificar las ccosas, considrrese el caso II, en el que yi = xi + i y sloo
x se mide con error (como xx* = x + v). El
E estimador de
d variables in
nstrumentaless
co
orrecto de la pendiente
p
de rregresin en el
e modelo de ddos variables es:

La eleccin de esta frmulla de pendien


L
nte particularr se hace de modo
m
que el
estimador resuultante sea connsistente. Paraa ver esto, poddemos derivaar la relacin

2
Tcnicamen
nte hablando, neccesitamos referirn
nos a las propieddades de estimadoores en el lmite en
e
prrobabilidad.

192

PA
ARTE DOS: Modelos de regresin de
d una sola ecuaccin

entre
e
el estim
mador de variaables instrumeentales y el parmetro de pendiente
p
verdadero
d
de un modo similaar a la derivaccin en la ecuuacin (7.1):

Es
E claro que la eleccin de Z como un insstrumento garrantiza que * se aproximar
a conforme el tamao de la muestra se hace ms grannde [Cov(z, *) se aproxim
ma
a 0] y, por connsiguiente, es un estimador consistente dee . No podraamos preguntaar
por
p qu la varriable xi* no ffue remplazad
da por zi en el denominador del estimadoor
de
d variabless instrumenttales. El leector deber comprobarr, usando el
e
procedimient
p
o anterior, quue el estimaddor yiZi /z 2i no produce un estimadoor
consistente
c
dee (vase el eejercicio 7.2)..
La tcnicca de variables instrumenntales parece proporcionar una solucinn
simple para un
u problema ddifcil. Hemoss definido unaa tcnica de estimacin
e
que
produce
p
estim
madores conssistentes si poodemos enconntrar un instrrumento aproopiado.
p
Sin em
mbargo, es probable que esto sea difccil cuando esstn presentes
errores
e
de meedicin.
Concluyeendo con lo annterior, algunoos comentarioss pueden ser tiles.

Primeroo,
la
l tcnica de estimacin
e
dee mnimos cuaadrados en reaalidad es un caaso especial de
d
variables
v
instrrumentales. E
Esto resulta po
orque en el moodelo de regreesin clsico X
no
n est correllacionada conn el trmino del
d error y poorque X est correlacionad
c
da
perfectamente
p
e consigo mism
ma. Segundo, si generalizam
mos el problem
ma del error de
d
medicin
m
a errores
e
en m
ms de una variable
v
indeppendiente, es necesario unn
instrumento
i
p remplazarr cada una de las variables independientees designadass.
para
Por
P ltimo, repetimos quee la estimacin de variablees instrumenttales garantiza
la
l estimacinn consistente ppero no garan
ntiza la estimaacin insesgadda.

7.3

ERROR DE ESPECIFIC
CACIN
Nuestra expoosicin de la eeconometra se
N
s ha basado,, en gran med
dida, en la suup
posicin
de quue el modelo qque se va a esttimar est esppecificado en forma
f
correctaa.
U vez que se asume la especificacinn correcta dell modelo, la estimacin
Una
e
deel
m
modelo
y la prueba
p
del moodelo se vuelvven relativameente sencillas.. Sin embargoo,
en realidad, nunca
n
podem
mos estar seguuros de que unn modelo detterminado estt
especificado en forma corrrecta. De heecho, los inveestigadores, por
p lo generall,
examinan ms de una possible especificcacin, intenttando encontrrar la especifiicacin que deescriba mejorr el proceso bajo estudio. Intentamos daar al lector unna
sensacin de los peligros iimplicados en
n la bsquedaa de un modelo exponiendo
los costos aso
ociados con lla mala especificacin del modelo. Noss preocupamoos
con dos tiposs de mala esppecificacin, la
l primera quue ocurre cuanndo se omitenn
v
variables
releevantes de la regresin linneal y la seguunda que ocuurre cuando se
agregan variaables irrelevaantes a la ecuuacin. Por lltimo, haremos una pausaa

CAPTU
ULO 7: Variables instrumentales
i
y especificacin
e
del modelo
m

193

breeve para comentar el error en la especifficacin asociaado con la eleeccin incorreecta de la form
ma funcional..

7.3.1

Varriables omittidas

Coonsidrese priimero el caso en el que unaa variable se omite


o
sin darsse cuenta de
unna especificaciin de modeloo "verdadera"" o correcta. S
Supngase quue el modelo
verrdadero est dado
d
por la ecuacin (7.7)),
(7.7)
miientras que ell modelo de reegresin est dado por:3
(7.8)
See postula que to
odas las supossiciones del mo
odelo lineal clsico se mantiienen para la
ecuuacin (7.7).
Como se deeriv en el caaptulo 1, el parmetro de ppendiente estiimado es:
(7.9)

Suustituyendo yi, definida com


mo en la ecuaccin (7.7), en la ecuacin (77.9) y resolvieendo, obtenem
mos:

Daado que X2 ess fija y E(i) = 0, el ltimo


o trmino tiene valor esperaado cero, de
moodo que,
(7.10)

3
Trabajaremoss con los datos enn forma de desviaaciones y supondrremos que = 0 para
p simplificar
lass derivaciones. Laa mayor parte de los resultados, peero no todos, se mantienen
m
para el intercepto de la
ecuuacin. Dado quue el efecto del error
e
en la especificacin del moodelo sobre el inttercepto, por lo
gen
neral, no es de im
mportancia extrem
ma, dejamos los detalles al lectorr (vase el ejerciccio 7.3).

194

P ARTE DOS: Mode


e los de regresin de una sola ecua
acin

En virtud de que
q no hay gaaranta de que el segundo trrmino ser 0, el estimador de
d
la pendiente por mnimoos cuadrados de la ecuacin (7.9) ser un estimadoor
sesgado del parmetro dee pendiente verdadero
v
2. Este sesgo no
n desaparecerr
conforme creezca el tamaoo de la muesttra, de modo que
q la omisin
n de la variabble
del modelo taambin produce un estimad
dor inconsistennte. El nico caso
c en el que el
sesgo (e inco
onsistencia) deesaparecer po
or completo es
e cuando Covv(x2, x3) = 0, es
e
decir, cuanddo x2 y x3 noo se correlaciionan en la m
muestra.4 Estte resultado sse
generaliza sii hay numerosas variables independienttes. Slo cuanndo la variable
omitida no est
e correlacioonada con toddas las variablles independiientes incluidaas
desaparece el
e sesgo, pero esto es extreemadamente improbable.
i
La frmuula en la ecuaacin (7.10) es
e til debido a que nos dicce que el signno
del sesgo deppende de la coorrelacin entrre la variable omitida y tod
das las variablees
incluidas al igual que dependiendo
d
del signo deel coeficientee de pendiennte
verdadero 3. En la medida en que x2 y x3 estn altamente
a
corrrelacionadas, el
coeficiente de x2 incluir eel efecto de la variable x3 y ser sesgado. Cuando x2 y x3
no estn corrrelacionadas, x2 no recoge nada del efecto de x3 y no
n existe sesggo.
Como una cuuestin prcticca, lo importaante es la extennsin del sesg
go de la especcificacin. Estto sugiere quue un investiggador cuidaddoso no slo considerar la
cuestin de las
l variables faltantes sinoo tambin su posible correelacin con laas
variables dell modelo incluuidas.
Para com
mpletar, conssideraremos el
e efecto de laa omisin dee variable en la
varianza del estimador dee la pendiente. Primero, verremos el casoo en el que x2 y
^
x3 no estn correlacionad
c
dos. Entonces,, *2 ser un eestimador inssesgado de 2 y
^
tendr una vaarianza idnticca con 2. La nica

dificultaad con la malaa especificacin


^
del modelo surge debido a que el esttimador usuall de la variannza de 2* seer
sesgado.5 Sinn embargo, geeneralmente, cuando x2 y x3 estn correelacionados, loos
dos estimadoores no tendrn varianzas id
dnticas. En el
e modelo de dos
d variables, la
^
^
varianza reall de 2* ser menor
m
que la varianza
v
real de 2, aun cuaando el modeelo
est mal espeecificado.6

7.3.2

P
Presencia
d una varia
de
able irrelevvante

Ahora considdrese el casoo en el que unna variable irrrelevante se haa agregado a la


ecuacin. Assuma que el m
modelo verdadero est daddo por:
(7.111)
y que el moddelo de regressin est dadoo por:
(7.12)
4
Una variaanza alta para x2 disminuir la canntidad de sesgo, ppero el sesgo nunnca llegar a cero ,
en vista de que hemos asumido una varianza finnita para todas laas x de la muestrra.
5
6

1971).

Es pesad o pero no difcil mostrar que la varianza


v
estimad a de *
ba.
2 ser sessgada hacia arrib
Esto se muestra
m
en P. Raoo y R.L. Miller, Applied
A
Economettrics (Belmont, Calif.:
C
Wadsworthh,

CAPTU
ULO 7: Variables in
nstrumentales y esspecificacin del modelo
m

195

La presencia dee la variable iirrelevante x3 implica que no estamos tomando


t
en
cueenta la restriccin del parm
metro verdadero 3* = 0. E
Esperaramoss que, no tomaar en cuenta to
oda la inform
macin disponnible respecto al modelo, conducira
c
a
unaa prdida de grados
g
de liberrtad y, por connsiguiente, a una
u prdida dee eficiencia,
perro no a una prdida de conssistencia y dee sesgo. Para ver
v la ltima, calculamos
el coeficiente estimado
e
de la variable x2 en la ecuaacin (7.12). Usando la
derrivacin descrrita en el captulo 4 [ecuaccin (4.4)], enncontramos que:
q

Sustituyendo paara yi a partir de la ecuaci


n (7.11) y resolviendo, obbtenemos:

de lo cual resultta que (tomanndo valores essperados con x2 y x3 fijos)

Porr tanto, la incclusin de una variable irrrelevante no sesga


s
los estim
madores de
la pendiente dee ninguna dee las variablees que apareccen en el mo
odelo "verdaddero". No es difcil
d
mostrarr que el interccepto de la eccuacin tambin es insesgaddo y que el estimado
e
del coeficiente de
d x3 tendr un
u valor espeerado de 0.
Dejjamos ambas pruebas al lecctor (vase loss ejercicios 7..5 y 7.6). (Lass pruebas de
connsistencia son
n parecidas; tan slo neceesita usar lm
mites de probabilidad en
luggar de valoress esperados.)
La inclusinn de variabless irrelevantes afecta la eficciencia del esstimador de
mnnimos cuadraados, dado quue la varianzaa del coeficiente de la penndiente estimaado 2* en genneral, ser m
mayor que la varianza
v
del coeficiente
c
2. (El nico
casso en el que no
n ocurrir unna prdida de eficiencia ess el caso especial cuando
x2 y x3, no estnn correlacionaados, de nuevvo una posibilidad improbbable.) Esta
prrdida de eficieencia hace ms difcil rechaazar la hipteesis nula de unn parmetro
de pendiente cerro. Sin embarrgo, la variannza estimada de
d *2 ser unn estimador
inseesgado de la varianza
v
verddadera de 2. Por
P tanto, la pprdida de efiiciencia ser
tom
mada en cuennta cuando se calcule el errror estndar dde la regresin.

7.3
3.3

No linealidade
l
s

Otrro error de esspecificacin puede ocurrirr cuando el innvestigador ellige estimar


un modelo de reegresin lineall que es lineal en las variablles explicativaas cuando el
mo
odelo de regreesin verdaderro no es lineal. Un ejemploo simple ocurrre cuando el
mo
odelo verdadeero es de la foorma polinm
mica:
(7.13)

196

P ARTE DOS: Mod


delos de regresin
n de una sola ecu acin

mientras quue el modelo eestimado es:


(7.114)
Dado quue el modelo en la ecuacin (7.14) es uun caso especcial de variablles
omitidas, la especificacin de un mod
delo lineal cuaando el modello verdadero no
n
es lineal pu
uede conducirr a estimadorres sesgados e inconsistenntes. La mism
ma
conclusin se mantiene ccuando se usaa una aproxim
macin polinmica para una
u
ecuacin innherentementee no lineal (vvase la secciin 10.1). Poor esta razn,, a
menudo estiimamos ecuacciones polinm
micas tales coomo la ecuaciin (7.13) com
mo
una prueba para la no linnealidad en laas variables inndependientees.

7.3.4

Eficiencia co
ontra sesgo
o en la
co
onstruccin
n del modelo

Si no estam
mos seguros dee cules variaables explicatiivas deberann aparecer en un
modelo, enffrentamos variios trueques. El anlisis muuestra que el costo de excluuir
una variablee que deberaa aparecer en
n el modelo ees sesgo e incconsistencia. El
costo de agrregar una o m
ms variables irrelevantes ees prdida de eficiencia. Si el
nmero de observacionees es grande, parece razonnable optar por
p el riesgo de
agregar variiables irrelevvantes, debido
o a que es im
mprobable que la prdida de
grados de libertad sea graave. Sin embaargo, si el nm
mero de obseervaciones no es
grande, la prdida de eficciencia se vueelve grave.
En geneeral, la eleccin de la form
ma del modeloo debe hacersee en funcin del
d
trueque sesggo-eficiencia, con el resultaado dependiennte del objetivvo. Si la meta es
el pronstico preciso, miinimizar el errror cuadrticoo medio es un
n objetivo razzonable, en viista de que tooma en cuentta tanto el sessgo como la eficiencia.7 Por
P
tanto, podramos estimarr cada uno dee varios moddelos alternatiivos durante un
periodo deteerminado y comparar
c
los errores
e
cuadrrticos medioss asociados con
c
cada uno.
En trm
minos de estaadstica clsicca, no es difccil probar si estn presenttes
variables irrrelevantes. Enn vista de quee, los coeficienntes de variab
bles irrelevanttes
tienen valores esperados de 0, aplicam
mos pruebas t estndar si deeseamos evaluuar
la relevancia de variablees individuales y aplicamos una pruebaa F si deseam
mos
probar la reelevancia de uun grupo de variables.
v
Estta prueba fallla por compleeto
cuando no estamos
e
segurros de cules variables debberan apareceer en el modelo.
Como resulltado, debemoos basarnos en
e el uso de tcnicas de simulacin
s
paara
hacer dichass comparacionnes.8
7
8

Recurddese del captulo 2 que el error cuaadrtico medio = varianza + sesgoo2.


La econometra bayesianna proporciona una
u estructura addecuada en la quee pueden verse laas
limitaciones dee los mtodos clssicos de construcccin de modelos y la prueba de moodelos. Vase, poor

ejemplo, A. Zellnner, An Introductioon to Bayesian Infe


ference in Economeetrics (Nueva Yorkk: Wiley, 1971), y E.
Leamer, Specificcation Searches inn Econometrics (Nu
ueva York: Wiley, 1979).

CAPTU
ULO 7: Variables instrumentales y especificacin
e
del modelo

EJEMPLO 7.1

197

De
emanda de din
nero

En
n un estudio de
d la demandda de dinero a largo y a corrto plazos, Grregory Chow
esstim la siguiiente ecuacinn de demanda (los erroress estndar esttn entre parntesis y todos los datos soon trimestrales):9

d
donde
M = log
garitmo naturral de la reservva total de diinero
Yp = log
garitmo naturral del ingreso permanentee
Y = loggaritmo naturaal del ingreso
o actual
R = loggaritmo naturral de la tasa de
d inters
En
n vista de quee Chow ve la ecuacin estim
mada como una
u ecuacin a largo plazo
paara la demandda de dinero, concluye quee el ingreso permanente ess ms importan
nte que el dinnero actual coomo la restriccin a largo pplazo sobre bienes individuuales. (La varriable Y es inssignificante, mientras
m
que la
l palabra Yp es altamente
siggnificativa.) Sin
S embargo, uno puede afirmar
a
que laa ecuacin esttimada es de
heecho una malaa especificacin de la ecuaccin correcta ppara la demannda de dinero
a largo
l
plazo. Taylor
T
y Newhhouse afirman
n que la especiificacin correecta es:10
(7.15)
Sii la ecuacin (7.15) es corrrecta, esperarramos que los coeficientess de la ecuaci
n estimada de Chow fueeran sesgadoss. Podemos approximar la extensin
e
de
esste sesgo usan
ndo nuestros resultados
r
en los efectos ddel error de esspecificacin
dee la variable omitida.
o
Considrese el cooeficiente de ingreso perm
manente estim
mado,
dado quee es importantte para la concclusin de poltica a la que se
s lleg. Si el
m
modelo
correctto hubiera siddo,

en
ntonces, a parrtir de la ecuaacin (7.10), podramos
p
cooncluir que ell sesgo en el
co
oeficiente estimado ^2 de laa ecuacin Mt = 1 + 2Ypt sera:

9
G.C. Chow, "On
" the Long-Runn and Short-Run Demand
D
for Moneyy", Journal of Polltical Economy,
vo
ol. 74, pp. 111-131, abril de 1966.
10
L.D. Tayloor y J.P. Newhouuse, "On the Lonng-Run and Sho rt-Run Demand for Money: A
Coomment", Journall of Poltical Econnomy, vol. 77, pp. 851-856, 1969.

198

PARTE DOS: Mode


elos de regresin de
d una sola ecuaccin

Aunque no lo hemos hecho as enn el texto, es pposible extennder la frmulla


para el sesgoo de la especcificacin, parra aplicarla a ecuaciones con
c numerosaas
variables expplicativas. En nuestro caso el sesgo en el
e trmino de ingreso
i
permaanente es estim
mado por:

donde d2 es el
e coeficiente dde Ypt en la reggresin auxiliaar de Mt -1 sobree Ypt, Yt y Rt , es
e
decir,

Si la variablee Mt -1 no est disponible, tendremos


t
quue especular acerca
a
de la exxtensin de cuualquier sesgoo de especificcacin que estt presente. Sin embargo, en
e
este ejemplo particular Mt -1 est disponiible, en vista de que implicca un rezago de
d
un periodo de
d una variablle presente en
n la ecuacin mal especificcada. Dado quue
se sabe que Mt -1 y Ypt estnn altamente coorrelacionadoss y esperamos que el signo de
d
Mt -1 ser possitivo cuando se ejecute la ecuacin especificada en forma
f
correctta,
predeciramoos que el sessgo es positivvo y considerrable. En otraas palabras, la
extensin dee la importanccia del ingresoo permanente es exagerada debido al erroor
de especificaacin. Esta suposicin
s
se corrobora cuuando se estiima el modello
especificadoo en forma corrrecta. Los resultados son los
l siguientess:

El coeficientte Mt -1 es possitivo y signifficativo, mienttras que el cooeficiente Ypt es


e
positivo peroo es insignificaante en el niveel del 5%. Porr tanto, la concclusin original
debera revissarse para establecer que el
e ingreso actuual es ms imp
portante que el
ingreso perm
manente para explicar la demanda
d
de dinero a largo plazo.

7.4

11
DIAGNSTTICO DE REG
GRESIN

El modelo de
d regresin llineal bsico es propenso a diversos errores posiblees
distintos a laa inclusin dee variables irrrelevantes o la omisin de variables relevantes. Vimoos en el capttulo 6 que la correlacin seerial o la heteerocedasticidaad
pueden cond
ducir a estimaddores ineficienntes. De hechho, cualquier patrn
p
residuaal
11
El materrial en esta seccin se basa en grran medida en D..A. Belsley, E. Kuh
K y R.E. Welscch,
Regression Diagn
nostics, Identifyingg Influential Data and
a Sources of Coottinearity (Nueva York: Wiley, 1980).
Vase tambin W.S.
W Krasker, E. K
Kuh y R.E. Welsch
h, "Estimation forr Dirty Data and Flavved
F
Models", en
Z. Griliches y M.D.
M
Intriligator ((eds.), Handbook of Econometrics,, vol. I (Amsterdam: North-Hollannd,
1983), captulo 11, y A.R. Pagann y A.D. Hall, "D
Diagnostics Tests as Residual Anallysis", Econometrric
Reviews, vol. 2, pp. 159-218, 19833.

CAPT
TULO 7: Variabless instrumentales y especificacin del modelo

199

innusual, incluy
yendo la correelacin serial, debera ser una preocupaacin, ya que
su
ugiere que unna o ms variables se han omitido en foorma inaproppiada del modeelo de regresiin.
En esta seeccin ampliaamos nuestro anlisis del modelo
m
de reegresin para
coonsiderar divversos diagnsticos de regrresin tiles. Estos diagn
sticos no se
deerivan de la teora estadsttica; en consecuencia, no proporcionan
p
pruebas
p
estadsticas. Ms bien,
b
nos perm
miten ver si uno
u o ms punntos o una o ms
m variables
inndependientess tienen una iinfluencia inu
usitadamente grande en loos parmetros
dee regresin estimados. Unn punto o variiable con unaa influencia in
nusual puede
reeflejar un erroor en los datoos: podran teener un error en la codificaacin o en la
trranscripcin de
d los datos. En este caso obviamente se necesitaraa una correcciin. Sin embaargo, en la mayyor parte de loos casos, las correcciones en
e los datos (o
laa omisin de puntos)
p
no sonn necesarias. Una influenciia inusual pueede sealar la
faalla del mod
delo de regreesin para explicar
e
un eevento particcular en una
ub
bicacin o periodo particcular, o tan slo puede reflejar el hech
ho de que el
trmino de perrturbacin tieene una varian
nza grande.
La detecciin y evaluacin de puntoss influyentes y variables innfluyentes es
coompleja. Paraa conocer porqqu, examnesse la figura 7..2. El modeloo de regresin
veerdadero tienne una pendieente positiva y est dado por
p Yi = + Xi + i. Sin
em
mbargo, se coometi un errror de codificcacin en el sptimo
s
puntoo de datos, el
ms
m grande. Es
E evidente quue este punto
o es muy influuyente, en vista de que la
lnea de regressin estimadaa, mostrada por
p la lnea ddiscontinua ^ + Xi, tiene
unna pendiente negativa. Pero este puntoo no se muesttra como un punto
p
atpico
debido a que, con la funcin de prdida cuadrtica implcita en los mnimos
cuuadrados, la lnea estimaada es forzad
da a quedar cerca del puunto. En las
su
ubsecciones que
q siguen suugerimos variias tcnicas dde diagnstico
o que pueden
seer tiles para detectar datoos influyentess y variables iinfluyentes.
7
7.4.1

Res
siduales stu
udentizados
s

Los
L residuales relativamentte grandes pueeden ser tilees como un diiagnstico de
reegresin. Pued
den advertirnos que observvaciones partiiculares puedeen ser influFigura 7.2
Un punto influyente.

200

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaccin

yyentes. O, cuuando son exaaminados com


mo un grupo, ppueden usarse para evaluaar
la suposicin de que la disttribucin del error
e
subyacennte es normal. Sin embargoo,
el valor de loos residuales ccomo un dispositivo diagnstico es limiitado, debido a
que un punto de datos influuyente puedee estar asociaddo con un resiidual pequeoo.
Por esta raznn es til consiiderar el resid
dual que se obbtiene para caada observacin
cuando la lneaa de regresin es
e estimada conn esa observaciin particular omitida.
o

Por tantoo, para nuestrro modelo de dos variables, supongamoos que (i) reepresenta la pendiente
p
de regresin esttimada cuanddo se ha omittido la sim
ma
observacin. Enfocaremoss nuestra aten
ncin en el reesidual (i) =yyi - (i)xi. Siin
embargo, los residuales son interpretadoos con mayor facilidad cuaando se escalaan
para tener una varianza unnitaria (por suppuesto, tambiin tienen med
dia cero). Parra
muestras granndes, esperaramos que aquuellos residuaales normalizados siguieraan
una distribucin normal. S
Si no lo hacenn, como lo evvidencia el heecho de que de
d
manera consiiderable ms del
d 5% de los residuales normalizados esstn a ms de 2
desviaciones estndar de cero, proporcciona evidenccia de que la suposicin de
d
normalidad es
e invlida.
Para norrmalizar los residuales,
r
dividimos
d
el residual
r
(i) entre el erroor
estndar estim
mado de la reegresin, si(i)), en la que laa isima obseervacin se ha
h
omitido. El reesidual studenntizado est daado, por tanto,, por:
(7.166)

Los residualees studentizaddos que son mayores


m
que 1.96
1
en valor absoluto (o de
d
manera ms general
g
mayoores que el vallor crtico aprropiado de la distribucin t)
t
pueden consiiderarse comoo puntos atpiicos y deberaan recibir atenncin especiaal.
Sin embargo
o, slo cuandoo hay un porrcentaje mayoor que el esperado de talees
residuales deebera cuestioonarse la supoosicin de norrmalidad.

7.4.2

DF
FBETAS

Con frecuenccia, uno est innteresado en el valor de unn parmetro particular


p
de un
u
modelo de reegresin. En este
e caso, la cuestin centraal se vuelve, alguna obserrvacin tiene una influenccia inusitadam
mente grandee en el valor del parmetrro
estimado?
La respueesta es proporrcionada observando los DF
FBETAS paraa cada observaacin y cada variable.
v
DFBE
ETAS mide laa diferencia escalada entre el estimado de
d
mnimos cuaadrados y la eestimacin co
orrespondientee que se obtieene estimanddo
con una obseervacin particcular omitida.. La escala ess determinadaa por la desviaacin estndarr estimada dee (i). Para el modelo de doos variables
(7.177)

CAPIT ULO 7: Variables instrumentales y e


especificacin del modelo
m

201

Un valor de
d DFBETAS mayor que 1.96
1
en su vaalor absoluto demuestra
d
la
prresencia de unna observacin influyente con respecto a este valor. Suponiendo
quue no hay erroores de transccripcin de datos,
d
cualesquuiera de las conclusiones
c
quue se basen en
n el valor estiimado del parrmetro de peendiente partiicular, deberaan ser calificaadas. Es verdaad como una regla
r
general que la posibiilidad de que
cu
ualquier obserrvacin particcular que afecctar al parm
metro estimado de manera
co
onsiderable deeclinar confo
forme se hagaa ms grande el tamao dee la muestra.
Po
or consiguientte, una mejor regla emprica es buscar unna observacin cuyo valor
crtico disminuuye conformee se hace mss grande el tam
mao de la muestra.
m
Una
poosibilidad es preocuparse cuando
c
el vaalor de DFBE
ETAS es mayyor en valor
abbsoluto que 2/N
N . 5.

EJEMPLO 7..2

El efecto de la contaminacin
c
n del aire y el crimen
c
en el va
alor de la prop
piedad

Enn un estudio de valores dde la propiedad, Harrison y Rubinfeld


d usaron una
muuestra de 5066 zonas censaales en la ciuddad de Bostonn para evaluaar la relacin
en
ntre la calidad
d de vida en los vecindariios y los valoores de la proopiedad.12 El
modelo de regrresin lineal relacionaba el
e logaritmo ddel valor meddiano de los
hoogares ocupad
dos por su prropietario (LM
MV) con diveersas variables (14, incluyeendo el trminno constante) que describen
n la calidad dde los hogares en el vecindaario, la accesibbilidad del vecindario a loss centros laborrales cercanoss y la calidad
dee vida en los vecindarios. En este ejem
mplo, usado enn el estudio de
d HarrisonRu
ubinfeld, repo
ortamos los reesultados de un
u anlisis realizado por Beelsley, Kuh y
Welsch
W
de dos variables partticulares del vecindario:
v
el nivel cuadraddo de xidos
dee nitrgeno, NOXSQ,
N
y el nndice de crm
menes per cpitta, CRIM.
La porcin relevante de la
l ecuacin dee regresin esttimada (con laa estadstica t
enntre parntesiis) es:

Debido a que
q hay 506 oobservaciones, requerira deemasiado esppacio enumeraar todas las observaciones
o
s para las que los residuaales studentizzados fueron
m
mayores
que 1.96 o los DFB
BETAS fueronn mayores en valor absolutto que 2/N . 5.
Poor consiguientte, hemos enuumerado en ell cuadro 7.1 loos valores dell diagnstico
dee regresin paara las 28 zonnas censales que
q excedieronn en magnitud uno de los
sigguientes valorres de corte riiguroso:

12
Vase D. Harrison
H
y D.L. Ruubinfeld, "Hedoniic Housing Pricess and the Demandd for Clean Air",
Jou
urnal of Environm
mental Economics and Management,
t, vol. 5, pp. 81-1002, 1978.

202

PARTE DOS: Mode


elos de regresin de una sola ecuaccin

De los 18 residuales que son mayoores que 2.5 een valor absooluto, las zonaas
372 y 373 so
on las ms alltas, con valorres t de 4.51 y 4.16, respeectivamente. El
E
hecho de quee 18/506, o m
ms del 3% dee los residuales tengan vallores t mayorees
que 2.5 sugieere que la supoosicin de loss errores norm
males puede noo ser apropiadda.
Si los erroress estuvieron distribuidos
d
en
n forma normal, slo 1.24%
% de los errorees
sera mayor que 2.5 desviiaciones de laa media.
Ahora coonsideremos llos DFBETAS. La zona 3881 tiene un DFBETAS
D
muuy
grande para la variable CR
RIM; la elimiinacin de estta sola zona del
d total de 5006
disminuira el
e coeficiente en CRIM en 1.59 desviaciiones estndarr. Una verificacin de los datos
d
mostr qque no haba errores
e
de trannscripcin, peero los datos de
d
crmenes dell FBI son nottoriamente im
mprecisos, as que no es so
orprendente enncontrar que el
e coeficientee en CRIM sea sensible a ppuntos de datoos particularees.
Sin embargoo, en el estuddio de valor de
d la propiedad original, Harrison
H
y Ruubinfeld estaban interesadoss en especial en
e el coeficiennte de NOXSQ
Q. La zona 3881
no presenta problemas
p
paarticulares parra el coeficiennte NOXSQ, y aunque hayy

CAPTU
ULO 7: Variables in
nstrumentales y esspecificacin del modelo
m

203

varrios puntos dee datos que tiienen DFBET


TAS que exceeden el punto de corte, el
maayor (-0.38 para la zona 4413) no es tan
n considerablle como paraa causar una
preeocupacin innusual.
En general,, el diagnsticco de regresin sugiere quue los erroress pueden no
esttar distribuidoos en forma nnormal, as quue es probablle que la signnificancia de
coeeficientes parrticulares sea exagerada. Hay
H varios puuntos de datoss particularmeente influyen
ntes que haceen peligroso basarse demaasiado en el coeficiente
CR
RIM. Sin embbargo, el coefficiente en NO
OXSQ es muccho menos seensible a los
puntos de datos individuales y por consigu
uiente es el ms
m confiable de los dos.

7.5

PRUEBAS
R
DE ESPECIFIC
CACIN
Accabamos de ver
v que las consecuencias
c
s de los errorres de especiificacin en
ecoonometra pueeden ser muy graves. La faalla en incluir una variable relevante
r
en
un modelo de reegresin puedde conducir a estimadores
e
sesgados e incconsistentes,
miientras que laa inclusin dde variables inapropiadas
i
lleva a una prdida de
efiiciencia. Es obbvio que es im
mportante podder probar si unn modelo eleggido implica
errrores de especcificacin. En esta seccin exponemos
e
e ilustramos var
arias pruebas
que son aplicaables a errores de especiificacin. Coomenzamos con
c
algunas
pruuebas que im
mplican variabbles omitidass y que se uutilizan en el modelo de
reg
gresin lineall bsico. Lueggo considerarremos una pruueba para errror de medici
n que puedee usarse cuanndo se piensaa que el trmiino del error est correlaccionado con una
u o ms varriables indepeendientes, o cuuando otras suposiciones
s
dell modelo bsiico pueden faallar.

7.5.1

Prueba para ver si las va


ariables
deberan omitirse en el modelo
m
de re
egresin lin
neal

Annteriormente se
s han expueesto las pruebas para los errrores de especificacin.
Ahhora, supongaa que creemoss que el modeelo apropiadoo est dado po
or:
(7.18)
Si estamos convvencidos de quue la variablee x1 debera esstar en el moddelo pero no
esttamos seguross respecto a x2 y x3, entoncces, una pruebba apropiada es
e la prueba
F que
q implica pruebas
p
conjunntas de varios coeficientes (comentada en
e la seccin
5.33). La prueba F evala la hipptesis nula dee que 2 = 3 = 0 contra la allternativa de
que cualquiera o ambas no ssean cero preg
guntando si lla suma de cu
uadrados del
errror asociada con
c el modelo restringido (een el que se sostiene la hip
ptesis nula)
es significativam
mente mayor que la suma de cuadradoss del error asoociada con el
mo
odelo no restriingido que se muestra en laa ecuacin (7..18). Del mism
mo modo, si
x3 fuera la nicaa variable inciierta, una prueeba t de la hipptesis

204

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

nula de que 3 = 0 podra hacerse enn forma direccta usando la produccin de


d
regresin cuuando se estim
ma la ecuacinn (7.18).
El mtoddo ms generral para hacerr las mismas pruebas
p
que no
n utiliza mnnimos cuadraddos y no se basa en la norm
malidad del ttrmino del errror (cuando el
tamao de la muestra es grande) es la pruueba de razn de verosimilittud. Esta pruebba
se expondr en el captuloo 10.13
En la maayor parte dee las situacionnes, en especiial en aquellaas que implicaan
tamaos de muestra granndes, las pru
uebas F y lass pruebas de proporcin de
d
probabilidadd generan resuultados muy parecidos.
p
Deependiendo deel software quue
se est usand
do, la prueba dde proporcinn de verosimillitud puede seer ms difcil dde
aplicar, peroo es ms atracttiva cuando esstn implicadaas muestras grrandes debidoo a
144
que no se requiere una suuposicin de normalidad.
n

7.5.2

Prrueba para la presenciia o ausenccia


de
e errores de
e medicin

Supngase que
q estamos interesados
i
en estimar el m
modelo de reegresin de doos
variables:
yi = x
i + i
pero estamos preocupadoss por la posibilidad de que x podra meddirse con errorr.15
Si xi = xi* - vi, entonces la regresin de
d mnimos cuuadrados reall sera:
(7.19)
donde,
13
Supngaase que el valor de
d la funcin de log-verosimilitud
l
d asociada con el modelo no restriin gido est dado por
p L(1, 2 , 3), mientras que el valor
v
(menor) deel modelo restring
gido est dado poor
L(1). Entonces, para muestras grandes, resultaa que:

donde el subnd
dice 2 se refiere al nmero de resstricciones que sson impuestas (2 = 0 y 3 = 0).
La pruebaa de razn de verrosimilitud puedee aplicarse en forrma general. Cuaalesquiera que seean
las restriccioness en los parmetroos del modelo (reestricciones de quue las o la variaanza del error tom
man
valores particullares), se cumplee que:

donde14r es el nmero de restriccciones implicadaas.


Para unna comparacin ggeneral de pruebbas F (un caso eespecial de una prueba
p
Wald), laas
pruebas de propporcin de verosiimilitud y una terrcera prueba de m
multiplicadores dee Lagrange, vasse
Robert F. Englee, "Wald, Likelihhood Ratio, and Lagrange
L
Multipplier Tests in Ecoonometrics", en Z.
Z
Griliches y M.D
D. Intriligator (eds.), Handbook off Econometrics, vool. II (Amsterdam
m: Elsevier Science
Publishers,
198
84), captulo 13.
15
El mism
mo enfoque se apllica si estamos prreocupados porquue x podra estar correlacionada con
el trmino del error
e
debido a sim
multaneidad. Parra detalles, vasee el captulo 12.

CAPTULO 7: Variables
s instrumentales y especificacin de
el modelo

205
5

Si x se miide con errorr, hemos vistto que se pueede obtener un


u estimadorr
co
onsistente de usando un iinstrumento z que se correllacione con x*
x pero que noo
see correlacione con y v. Suppngase que laa relacin entrre z y x* est dada
d
por:
(7.20))
Cuando se estiima usando m
mnimos cuadrrados, esta reelacin se vueelve

o
(7.21))
doonde i son loos residuales dde la regresinn. La sustituciin de la ecuaccin (7.21) enn
laa ecuacin (7.19) produce lo siguiente:
(7.22))

Haya un error de meedicin o noo, el coeficieente de x^ i* ser estimadoo


coonsistentemen
nte por los m
mnimos cuadrrados ordinarrios, dado quee

De hecho, el esstimador de mnimos


D
m
cuadrrados del coefficiente de x^ *i en la ecuaciin (7.22) es idnticamente
i
e igual al estim
mador de varriables instrum
mentales,16 lo
cuual est dado [a partir de laa ecuacin (7..8)] por = yizi / xi*zi.
Paara consideraar el coeficiennte de la variaable i, ntesee que:

Cuando no hayy error de meedicin, 2v = 0, de modo qque los OLS aplicados


a
a laa
eccuacin (7.22
2) generarn uun estimadorr consistente del coeficiennte de i. Sinn
em
mbargo, cuanndo hay un error
e
de meddicin, el coeeficiente ser estimado enn
foorma inconsisstente.
Esto sugierre una pruebaa del error de medicin
m
relattivamente fccil. Supngasee
quue represeenta el coefiiciente de laa variable i en la ecuaacin (7.22)..
Su
ustituyendo x^ *i = xi* - i, obbtenemos;
(7.23)

16

La prueba implica un desarrrollo considerablle de lgebra y see omite aqu.

206

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaccin

Sin error de medicin, = , de mod


do que el coefficiente de i sera igual a
cero. Sin emb
bargo, con error de medicin, , y el ccoeficiente seer (en generall)
diferente de cero. Podem
mos probar el error de meedicin hacienndo un proceedimiento sim
mple de dos etaapas. Primera, hacemos la regresin
r
de x*
x sobre z parra
obtener los residuales
r
. Luego, haceemos la regreesin de y soobre x* y y
realizamos unna prueba t een el coeficien
nte de la variable . Si esttamos preocuupados con el error
e
de mediccin en ms de
d una variablee de un modello de regresinn
mltiple, pod
dra aplicarse una prueba F equivalentee.
La pruebba que se acabba de describiir es un caso especial de un
na prueba ms
general para el error de esspecificacin propuesta poor Hausman.177 La prueba de
d
especificacin de Hausmaan se basa en el hecho de qque bajo la hiptesis nula el
e
estimador dee mnimos cuuadrados ordinnarios de los parmetros de
d la ecuacin
(7.19) originaal es consistennte y (para muestras
m
granddes) eficiente, pero es inconnsistente si la hiptesis altternativa es verdadera.
v
Sinn embargo, ell estimador de
d
variables insstrumentales [[el estimadorr de mnimoss cuadrados de
d la ecuacin
(7.22)] es co
onsistente, sea verdadera la
l hiptesis nnula o no, auunque es inefi
ficiente si la nula
n
no es vllida. Expondrremos la apliccacin generaal de la pruebba
Hausman cuaando veamoss el uso de vaariables instruumentales en el contexto de
d
ecuaciones siimultneas enn el captulo 12.

EJEMPLO
O 7.3

Prueba para error


e
de mediciin en un mod elo de gasto p
pblico

Los gastos dee los gobiernos estatales y loocales de Estaados Unidos (E


EXP) varan en
e
forma considderable por esstado y por reggin. Entre laas variables im
mportantes quue
explican difeerencias en los niveles de gasto
g
son los subsidios parra ayuda (AID
D)
federales, el ingreso de loos estados (IN
NC) y la poblaacin de los estados
e
(POP).
Cuando se esstim un moddelo que relaciiona la variabble dependientte EXP con laas
variables inddependientes AID,
A
INC y POP
P
por mnnimos cuadraddos ordinarioss,
usando datoss censales parra los 50 estad
dos (vase el cuadro 6.2 paara los detallees
relativos al conjunto
c
de datos),
d
se obtuuvieron los siiguientes resu
ultados (con la
l
estadstica t entre parnteesis):

Hay unaa posible e im


mportante fuente de error de medicin en la variablle
AID. Los proogramas de asistencia
a
estaatal implican sumas fijas de
d dinero y poor
consiguiente los fondos implicados soon fciles de medir aun anntes de que se
s
establezcan los
l presupuesstos estatales y locales. Sinn embargo, ottros programaas
son abiertos, con la suma real
r que recibbe un estado o localidad sieendo una fun17
Vase J.A.
J
Hausman, ""Specification Teests in Economettrics", Econometrrica, vol. 46, ppp.
1251-1271, noviiembre de 1978.

CAPTU
ULO 7: Variables in
nstrumentales y esspecificacin del modelo
m

207

cin de los nivelles de gasto reeales de esos gobiernos. Coomo resultado


o, este compon
nente de la vaariable AID ppuede estar suujeta a un errror de medici
n considerab
ble.
Podemos haacer la prueba de especificaccin Hausmann para probar la
l presencia
de error de meddicin. Para reealizar la prueeba, usamos lla poblacin de
d nios de
esccuelas primariias y secundarrias (PS) com
mo un instrumeento. (El gastto escolar es
el componente mayor de loos gastos pbblicos estatales y locales, y muchos
pro
ogramas escolares son abieertos.) La pru
ueba procede en dos etapass. En la primeera etapa se hace
h
la regressin de AID sobre
s
PS, y la variable ressidual i se
callcula como siggue:

En la segunnda etapa i see aade a la reegresin origiinal para corregir el error


de medicin. Laa ecuacin ressultante es:

Un
na prueba t biilateral de la hiptesis
h
nulaa de que no hhay error de medicin
m
se
aceeptara en el nivel
n
del 5%, ya que 1.73 < 1.96. Sin em
mbargo, el errror de medici
n sera consiiderado impoortante si estu
uviramos usando ya sea una prueba
uniilateral o una bilateral en uun nivel de significancia del 10%. Nteese, en cualquiier caso, que corregir la posibilidad dell error de meedicin ha dissminuido en
forrma consideraable el coeficiiente en la varriable AID, loo que sugiere que el error
de medicin cauusa que el efeecto de AID en el gasto pbblico sea exaggerado.

AP
PNDICE 7..1
Esttimacin de va
ariables instrum
mentales en fo rma de matriciial

La tcnica de variables instruumentales pu


uede usarse paara obtener esstimaciones
connsistentes de cuando se sabe que lass variables dee la derecha estn
e
correlaccionadas con el trmino ddel error com
mo un resultaddo de los errrores en las
varriables o en ell sesgo de la eecuacin simuultnea. Si nueestro modelo original
o
es:
(A7.1)
la correlacin
c
d una o ms X y el trminno del error se resume co
de
omo

(A7.2)

208

PARTE DOS: Mod


delos de regresin
n de una sola ecuacin

La expresin "plim" (proobability limit)) se refiere al lmite en pro


obabilidad com
mo
se defini en
e el captulo 2. Para ver laa dificultad que
q surge cuanndo la ecuacin
(A7.2) se soostiene, premuultipliquemoss la ecuacin (A7.1) por laa matriz X' paara
obtener:

Si plim [(1/N
/N)X'] = 0, el ltimo trmin
no va a 0 en eel lmite de pro
obabilidad y
(A77.3)
es un estimaador consistennte de . Sin em
mbargo, cuanddo el lmite en probabilidad no
es cero, la estimacin
e
de mnimos cuaadrados ordinaarios se vuelvve inconsistentte.
Estimacciones consisttentes de puueden obtenerrse por medio
o del uso de una
u
matriz N x k de instrum
mentos Z = (Z1, Z2, . .., Zk), donde cada instrumento Zi
tiene N obseervaciones. Z satisface
s
las condiciones neecesarias para ser denominaada
una matriz de instrumenntos si se man
ntienen las sigguientes condiciones:18
(A77.4)
(A77.5)
(A77.6)
La primera condicin gaarantiza que cada instrum
mento no est correlacionaado
con el trmino del error,, mientras quee la segunda ggarantiza unaa correlacin no
cero entre las
l Z y las X al igual quee el hecho dee que todas las
l Z deben ser
s
linealmentee independienttes. Por tanto,, no hay raznn por la que no
o puedan usarrse
algunas de las X originaales como insttrumentos en el proceso dee estimacin de
variables innstrumentales..
Dados los
l instrumenntos apropiaddos, premultipplicamos la ecuacin
e
(A7..1)
por Z' para obtener:

de lo cual see deriva que:


(A77.7)
18
Con errrores en las variaables, Z tampocoo debe estar relaccionado en el lm
mite en probabiliddad
con el error dee medicin.

CAPITU
ULO 7: Variables instrumentales y eespecificacin del modelo
m

209 ser
s

un estim
mador consisteente de . * ser
s consistennte debido a que:
q

Para encontrar laa distribucin apropiada dee *, necesitam


mos derivar V,
V la matriz
de varianza-cova
v
arianza asinttica para *. Para lograr esto, usamos el
e hecho de
quee:

de lo
l cual resultaa, usando las ecuaciones (A
A7.5) y (A7.66), que

En la prctica, la matriz de varianza-cova


v
arianza verdaddera puede esstimarse de
mannera consistennte por:
(A7.9)
donnde s2 es un esstimado consistente de 2:

Nttese que s2 se calcula a parttir de los residduales de la eccuacin originnal, no de la


ecuuacin en la que
q los instruumentos remplazan a las variables originales de la
derecha.

210

PARTE DOS: Mo
odelos de regresin de una sola ecu
uacin

EJERCICIO
OS
7.1 Expliquue, brevemente, por qu el errror de medicinn en las variables de la derechha
conducen a estimadores
e
incconsistentes y sesgados mienntras que el erroor de medicin en
las variabless de la izquierdda no.
7.2 Muestree en el modelo dde dos variablees que = yizi //z 2 (donde z es
e un instrumenni
to) no produ
ucir un estimador consistennte del parmeetro de pendiennte. Hay alguuna
condicin bajo la cual el estimador
e
de vaariables instrum
mentales descrrito producir uun
estimador coonsistente de ?
7.3 Demuesstre que la omisin de una vaariable de un m
modelo de regreesin "verdaderro"
conducir a un estimador ssesgado del inteercepto de la reegresin. Bajoo qu condicionnes
especiales laa tendencia se vvolver cero?
7.4 Suponga que el modello de regresin
n verdadero es de la forma

Si se ejecutaa la regresin yi = *2 x2i + *i , qu puede decir acerca de


d la direccin del
sesgo del cooeficiente de peendiente?
7.5 Demuesstre que el coefficiente de unaa variable irreleevante tendr un
u valor esperaddo
de 0. Sugereencia: Usando el anlogo de la
l ecuacin (7..12), resuelva para
p el parmettro
estimado *3 y luego tom
me valores espeerados.
7.6 Demuesstre que la incluusin de una varriable irrelevannte no hace sesg
gado el estimaddor
de intercepto
o.
7.7 Supongaa que cree que el
e modelo verddadero est dadoo por Y = 2X2 + 3X3+ + kXk
+ . Qu se
s gana o se piierde al ejecuttar la regresinn en el modelo
o Y = 1 + 2X2 +
3X3 + + kXk + ?
7.8 Expliquue por qu las obbservaciones qu
ue caen lejos dee la media de unna variable tiennen
ms probabiilidad de tener influencia inussual que aquellaas que se encueentran cerca dee la
media.
7.9 Considerre el modelo de regresin yi = 1 + 2X2 + 3X3i + i. Suponga que est preocuu
pado de que tanto x2 como x3 son medidas con
c error, y quee z2 y z3 son con
nsiderados comoo
instrumento
os posibles paraa x2 y x3, respeectivamente. C
Cmo realizara una prueba de
d
especificacin Hausman ppara evaluar la presencia o auusencia de erro
or de medicin??

CAPTULO

PRONSTICO CON UN MODELO


DE REGRESIN DE UNA SOLA ECUACIN

El principal objetivo para construir modelos de regresin de una sola ecuacin


es pronosticar. Un pronstico es un estimado cuantitativo (o conjunto de estimados ) acerca de la verosimilitud de eventos futuros, que se elabora con base en
informacin pasada y actual. Esta informacin est expresada en la forma de un
modelo: un modelo estructural de una sola ecuacin o, como expondremos en
las partes tres y cuatro de este libro, un modelo de ecuacin mltiple o un
modelo de series de tiempo. Al extrapolar nuestros modelos ms all del periodo
durante el cual fueron estimados, podemos hacer pronsticos sobre eventos
futuros. En este captulo mostraremos cmo el modelo de regresin de una sola
ecuacin puede usarse como una herramienta de pronstico.
Con frecuencia se piensa que el trmino pronstico slo se aplica a problemas
en los que predecimos el futuro. Seremos consistentes con esta idea al orientar
nuestra notacin y exposicin hacia el pronstico de series de tiempo. Sin embargo, enfatizamos, que la mayor parte del anlisis se aplica igual de bien a
modelos de corte transversal.
Pueden ser tiles dos tipos de pronstico. Los pronsticos de punto predicen un
solo nmero en cada periodo pronosticado, mientras que los pronsticos de intervalo indican un intervalo en el que esperamos que se encontrar el valor futuro.
Comenzamos por examinar los pronsticos puntuales, despus de lo cual consideraremos cmo los intervalos de confianza (pronsticos de intervalo) pueden
usarse para proporcionar un margen de error alrededor de los pronsticos puntuales.
La informacin proporcionada por el proceso de pronstico puede usarse en
varias formas. Los pronsticos, a menudo, son usados como guas para polticas
pblicas y privadas. Un pronstico de una tasa alta de inflacin que se basa en
211

212

PARTE DOS: Mod


delos de regresin
n de una sola ecu acin

la suposicin de un dfi
ficit presupueestal grande ppuede conduccir a alterar llos
planes presuupustales dee los que haccen las poltiicas, o un prronstico de un
u
incremento en la demannda mundial de petrleo ccrudo puede conducir a los
l
constructorees de buques a invertir en barcos
b
petroleeros nuevos. Los
L pronsticcos
tambin son
n tiles comoo lineamientoos para la coonstruccin de
d modelos. Un
U
pronstico que
q se encuenntra muy desvviado de su obbjetivo, cuanddo se dispone de
datos, realees, proporcionna informacin que puedee conducir a la revisin del
d
modelo que proporcion el pronsticoo.
Es til distinguir
d
entrre el pronstico ex post y el
e ex ante. En
n funcin de los
l
modelos de series de tiem
mpo, ambos producen vallores de una variable
v
depeendiente ms all
a del perioodo usado parra estimar el m
modelo. En un
u pronstico ex
post, las obsservaciones enn las variabless endgenas y en las variabbles explicativvas
exgenas yaa se conocen con certeza durante el peeriodo pronossticado. De esste
modo, los pronsticos
p
exx post pueden
n verificarse ccontra los daatos existentess y
proporcionaan un medio ppara evaluar un
u modelo de pronstico. Un
U pronstico ex
ante tambinn predice valoores de la varriable dependiente ms all del periodo de
estimacin original, peroo usa variablles explicativvas que pueden conocersee o
pueden no conocerse
c
ann con certeza. La distincinn entre el pronnstico ex posst y
ex ante puedde verse en laa figura 8.1.
Tambin
n puede hacerrse una distin
ncin entre proonstico conddicional e incoondicional. Enn un pronstiico incondicioonal, los valoores para todas las variablles
explicativas en la ecuacin de pronstiico se conocenn con certeza. Cualquier prronstico ex po
ost es, por suppuesto, un pronstico inconndicional, peroo los pronsticcos
ex ante tam
mbin puedeen ser inconddicionales. S
Supngase quue para alguuna
industria, poor ejemplo, laas ventas mennsuales S(t) esstn relacionaadas linealmennte
con dos variiables X1 y X2, pero con rezzagos de 3 y 4 meses, respeectivamente.
(88.1)
Si esta ecuaacin fuera esstimada, podra usarse paraa producir proonsticos incoondicionales de
d S(t) 1, 2 y 3 meses en el futuro. Poor ejemplo, para producir un
pronstico a tres meses dde S(t), usaram
mos el valor aactual de X1 y el valor del mes
m
anterior de X2, los cuales son conocidoos.
En un pronstico
p
conndicional, los valores para una o ms vaariables expliccativas no se conocen, as que se debeen usar supossiciones (o prronsticos) paara
producir un pronstico dee la variable dependiente.
d
S
Si deseamos usar
u la ecuacin

Figura 8.1
1

Tipos de pronstico.

CAPTULO 8: Pronstico
P
con un modelo
m
de regresi
n de una sola ecuacin

213

(8.1) para pronoosticar S(t) cuuatro meses en


e el futuro, tambin tenddramos que
proonosticar Xt(t)) un mes en el
e futuro, hacciendo nuestroo pronstico de
d S(t) condiccional a nuesstro pronstico de Xt(t). Po
or supuesto, si el lado deerecho de la
ecuuacin de pronstico no coontena rezago
os, por ejemplo, si fuera de la siguiente
forrma:
(8.2)

cadda pronstico
o ex ante gennerado por laa ecuacin serra un pronsstico condicioonal.
En este capptulo, algo muuy importantee es el probleema de evaluaar la naturalezza del error dee pronstico uusando las pruebas estadsticcas apropiadass. Definimos
el mejor
m
pronsttico como aquuel que producce el error de ppronstico conn la varianza
mnima. En el modelo
m
de reggresin de unna sola ecuaciin, la estimaacin de mnim
mos cuadradoos ordinarios pproduce el meejor pronsticco entre todoss los estimadores insesgadoos lineales. E
Extenderemos nuestra nociin del mejorr pronstico
en captulos posteriores
p
cuuando consid
deremos los pronsticos con error
cuaadr-tico meedio mnimo que se basaan en ecuaciones no linneales y en
proocedimientos de estimacin que no garaantizan estimadores insesggados de los
parrmetros.
El error aso
ociado con unn procedimieento de pronstico puede provenir de
unna combinaci
n de cuatro fuentes distintas. Primeraa, la naturaleza aleatoria
dell proceso de error
e
aditivo en un modeloo de regresinn lineal garanntiza que los
pro
onsticos se desviarn
d
de llos valores veerdaderos aun si el modelo es especificaddo en forma correcta
c
y suss valores de parmetro
p
sonn conocidos. Segunda, el
pro
oceso de estim
mar los parm
metros de regrresin introduuce error debiddo a que los
valores de parmetro estimaados son variaables aleatoriias que puedeen desviarse
de los valores de
d parmetro verdaderos. Tercera, en el
e caso de unn pronstico
conndicional, loss errores son introducidos cuando se haacen pronsticcos para los
vallores de las vaariables expliccativas para el
e periodo en qque se hace ell pronstico.
Cuuarta, los erro
ores pueden sser introduciddos debido a que
q la especificacin del
moodelo puede no
n ser una reppresentacin precisa
p
del m
modelo "verdaadero".
Continuarem
mos con la exxposicin del mejor
m
pronsttico y las proppiedades del
errror de pronsttico encontradas en tres caasos diferentees. Abordarem
mos primero
loss pronsticos incondicionaales generadoss por un modeelo de regresiin lineal en
el que el processo de error obbedece a las suuposiciones del
d modelo lin
neal clsico.
Deespus, se trattar el problem
ma del pronsstico incondiccional cuando se sabe que
el proceso de errror est correelacionado en forma serial. Por ltimo, considerarec
moos la dimensi
n agregada de
d dificultad que
q surge cuaando se intentta el pronstico condicionall.

8.1

PRONSTIC
CO INCONDICIONAL
Paara producir un
u pronstico incondicionaal a partir de un modelo de
d regresin,
lass variables expplicativas debben conocerse con certeza ppara el periodo
o entero del

214

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

pronstico. Una
U forma enn que puede ocurrir
o
esto ess haciendo quue las variables
explicativas aparezcan coon rezagos de tiempo. Aunn si las variablles explicativvas
no aparecen con rezagos, podemos serr capaces de ppronosticarlas perfectamentte,
generando de
d este modo pronsticos incondicionaales para la variable
v
depenndiente, si ressultan ser varriables estacioonales o variaables demogrficas o econnmicas que cambian en foorma lenta y predecible. Por
P ejemplo, los
l pronsticoos
mensuales a lo largo de unn horizonte dee 1 ao los cuaales utilizan laa poblacin y el
mes del ao
o como dos vvariables explicativas sernn incondicionnales, ya que el
crecimiento de la poblaccin durante este
e periodo corto puede predecirse coon
precisin y en
e vista de quue se conoce con
c certeza el mes del ao
o.

8.1.1

E error de pronstico
El
o

Comenzarem
mos el anlisiss del pronstiico incondicioonal consideraando el modeelo
de regresin
n simple de doos variables:
(8..3)

Planteamos el
e problema ddel pronstico como sigue: ddado un valorr conocido XT++1 ,
cul es el mejor
m
pronsttico que puedde hacerse parra Y en el periodo T + 1? Al
A
solucionar ell problema, assumimos que y son connocidos. Si sste es el caso, el
pronstico appropiado paraa XT+1 est daddo por:
(8.44)
Para ver por qu, considereemos el error de pronsticoo
(8.55)
Este error dee pronstico ttiene dos prop
piedades deseeables:
es insesgado
o.
2. La vaarianza del errror de pronsstico

de moddo que el pronstico de XT+1

es la variannza mnima eentre todos lo


os pronsticos posibles quue se basan en
e
ecuaciones liineales.1

, la raaz cuadrada de la vvarianza del error de pronstico, es llamada


l
error est
ndar del pronstiico.

CAPTULO 8: Pronstico con un modelo


m
de regresi
n de una sola ecu
uacin

215

Dado que ell error de pronnstico est distribuido


d
en forma normall con media
0 y varianza 2, podemos
p
realiizar pruebas dee significanciaa en el valor pronosticado
de Y calculando el error norm
malizado
(8.6)

Daado que est distribuida enn forma norm


mal con media 0 y desviaci
n estndar
1, determinamoos un intervaloo de confianzza del 95% ussando el hechho de que:
(8.7)

donnde .05 se obttiene de una taabla de la distrribucin norm


mal (usando unna prueba de
sig
gnificancia del 5%). Escribbimos el intervvalo de confiaanza como:
(8.8)

El intervalo de confianza
c
del 95% para un modelo
m
de reggresin de dos variables
tpico se muestrra en la figuraa 8.2.
Los intervallos de confiannza proporcion
nan una pruebba simple de la confiabilidaad del modeloo de regresinn. Cuando se obtiene el vallor real de XT+1
T , podemos
com
mpararlo conn el valor proonosticado coon anterioridaad. Si YT+l see encuentra
denntro del intervvalo de confiaanza del 95%
%, el modelo ees satisfactorio
o, pero si el
vallor se encuenttra fuera del iintervalo, el modelo
m
no se est
e desempeando bien.
Al conocer que este desempeo deficientte se debe a un
u evento exttraordinario
quee no es expliccado por el m
modelo, es prob
bable que espperemos un seegundo pronsstico antes dee concluir quue el modelo es poco connfiable, pero como regla
genneral tomamoos el pronstiico deficientee como evideencia de la neecesidad de
revvisar la estructura del modeelo bsico.

Figura 8.2
Pronstico en el
e que se
conocen los parmetros
de la ecuacin.

216

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

El uso del
d pronsticoo como un meedio para evalluar la confiaabilidad del mom
delo es bastaante distinto ddel uso de las estadsticas t, F y R2 clsiccas descritas con
anterioridadd en este libroo. Un modelo de regresin de una sola ecuacin puede
tener una esstadstica t siggnificativa y una
u R2 alta y aun
a as pronoosticar en form
ma
muy deficiennte. Esto puedde resultar dee un cambio estructural quee ocurre durannte
el periodo de
d pronstico que no es exxplicado por eel modelo. Por otra parte, llos
buenos pronnsticos pueden venir de modelos
m
de reegresin que tienen
t
R2 relaativamente bajas y uno o m
ms coeficientees de regresin insignifican
ntes. Esto pueede
suceder cuaando hay muyy poca variaccin en la varriable dependdiente, de moddo
que aunque no est siendoo explicada biien por el moddelo, es fcil de
d pronosticarr.
Por lo general,
g
los paarmetros del modelo de reegresin son variables
v
aleattorias que se han
h estimado. Con frecuenccia tampoco ssabemos la vaarianza del errror
2, de modoo que sta taambin es unaa variable aleeatoria estimada. Por consiguiente, se nos
n permite rreconsiderar el
e problema ddel pronstico bajo la suposicin ms reaalista, de que tanto los parmetros de regresin comoo la varianza del
d
error deben estimarse. El mejor pronsstico para YT+ 1 es determinado, entoncess, a
partir de unn procedimiennto de dos etaapas simple:
1. Estim
mamos la ecuaacin (8.3) ussando mnimoos cuadrados ordinarios.
2. Elegiimos
El error de pronstico
p
es entonces;
(8.9))
Hay doss fuentes de error implicad
das en la ecuaccin (8.9), la primera
p
se deebe a la
presencia del
d trmino de error additivo T+1 y la segundaa, a la natuuraleza
aleatoria dee los parmettros de regreesin estimaddos. Mientrass la primera fuente
de error see debe a la varianza
v
en la
l variable Y,
Y la ltima fuente de errror es
sensible al proceso de estimacin
e
y, por consiguuiente, al nm
mero de graddos de
libertad. Veeremos esto mientras exaaminamos la distribucin
n del error dde pronstico.
Para comenzar, el errror de pronsstico se distribbuye en form
ma normal, daado
que es una funcin lineaal de ^ , y T+1
s cuales estn
n distribuidos en
T , todos los
forma norm
mal. Segundo, tiene media 0, ya que:
(8.110)
^

(Recurdesee que ^ y sson estimadorres insesgadoss y que XT+ 1 se


s conoce.) Poor
ltimo, podeemos determiinar la varianzza de T+1:

CAPTULO 8: Prronstico con un modelo


m
de regresi
n de una sola ecu
uacin

217

Ob
bserve que tod
dos los trminnos de producctos cruzados qque implican parmetros
estiimados y T+1 se vuelven 00, cuando se to
oman los valoores esperadoss, dado que
^ -
y - dependen de 1, . . ., T, todoos los cuales son indepenndientes de
T+11. Recurdesee que derivam
mos con anterrioridad (captulo 3) las vaarianzas de
^
y al igual que su covariaanza:
(8.13)
(8.14)
(8.15)
donnde las sumattorias corren de 1 a T y X es la media muestral de X para las
prim
meras T obseervaciones. Suustituyendo las
l ecuacionees (8.13) a (88.15) en la
ecuacin (8.12) y manipulanddo trminos, obtenemos:
o

La ecuacin (8.19) nos dicce que el erroor de pronsticco es sensiblee al tamao


de laa muestra usaada en el prooceso de estim
macin al iguaal que la variaanza en X y
la diistancia entre XT+1 y X.2 Enttonces, siendo
o iguales otras cosas, entre mayor sea
el taamao de la muestra y m
mayor la variianza en X, sser menor el
e error de
pronnstico. Adem
ms, el error dee pronstico es ms pequeo cuando XT+ll resulta ser
iguaal a la media muestral
m
de X
X, dado que ell ltimo trmiino entre corcchetes en la
ecuaacin (8.19) see vuelve 0. Essto sugiere quee los mejores pronsticos reespecto a Y
puedden hacerse para
p valores dee X alrededor de los cuales se dispone dee
2
La ecuacin (8.19)
(
muestra ell error para un pronstico
p
puntuual. Si pronosticaamos el valor
esperrado del resultadoo, la ecuacin es modificada omittiendo el 1 en la expresin entre corchetes.
c
Ese
trmiino se aade al valor
v
esperado de la varianza del error
e
de pronsticco asociada con laa seleccin de
un soolo pronstico dee la distribucin dde pronsticos poosibles.

218

PARTE DOS: Mo
odelos de regresi
n de una sola ecu
uacin

ms informacin muestraal. Esto no es sorprendente:


s
conforme el nuevo
n
valor de
d X
se aleja de la media, see sale del ranngo de experiencia usado para estimarr el
modelo y geenera pronstticos menos coonfiables. En general, es peeligroso extennder
un modelo mucho
m
ms alll de su rangoo de estimacin. Cuando loos pronsticoss de
series de tieempo implicaan valores de XT+1 que son considerablem
mente diferenntes
de X, el errror de pronsttico resultantte puede ser ggrande.
Si 2 fuera
f
conocidda, podramoss calcular 2 y luego proceder a constrruir
intervalos de
d confianza como antes, basndonos
b
e el conocim
en
miento de que::
(8.20)

Sin embarggo, generalmeente 2 no see conoce, as que por cuesstiones prctiicas


usamos s2 como
c
un estim
mador insesgaado y consisteente de 2:
(8..21)
Como vimoos en el captuulo 3, esto no
os permite callcular intervalos de confiannza
usando la distribucin
d
t. Al escribir laa varianza del error de pronnstico estimaado:
(8.222)
sabemos quue el error normalizado:

tendr una distribucin t con T- 2 grrados de liberrtad. Por tantoo, el intervaloo de


confianza del
d 95% paraa T+1 est dado por:
(8..23)

Un ejemplo
o del intervallo de confianzza del 95% see muestra en la figura 8.3.
Los priincipios que se acaban de exponer tam
mbin se aplican al modeloo de
regresin mltiple.
m
Los intervalos de confianza paara pronsticoos generados por
un modelo de regresinn mltiple tenndrn la mism
ma forma quee los de la figgura
8.3. Sin em
mbargo, cuanddo estn preseentes dos o ms
m variables explicativas, las
derivacionees algebraicass de la distribuucin del erroor de pronstiico y el intervvalo
de confianzza del pronsstico se vuelveen ms compplejas. Relegarremos la expoosicin formaal del modelo de regresin mltiple al aapndice 8.1.

CAPTULO 8: P
Pronstico con un modelo de regresiin de una sola eccuacin

219

Figura 8.3

Intervalos de confianza
c
del pronstico
o.

8.1.2 Evalua
acin de pro
onsticos
Deespus de quee estimamos uun modelo de regresin y loo usamos paraa pronosticar
la variable depeendiente, cm
mo podemos evaluar este pronstico? Una
U estadsticca importante es la varianzaa del error de pronstico quue acabamos de derivar y
el intervalo de confianza
c
dell 95% asociad
do. Este intervvalo de confiaanza proporcio
ona una buenna medida de la precisin del
d pronsticoo.
Adems, po
odemos simullar el modeloo resolvindoolo a lo largo del tiempo,
usando valores reales para llas variables explicativas. (Si la ecuaciin contena
un
na variable deppendiente rezaagada, usaram
mos el valor ppronosticado de
d esa variablee, actualiznddolo periodo ppor periodo, para crear unna simulacin
n dinmica.)
Duurante el periodo para el qque tenemos datos,
d
podram
mos comparaar, entonces,
lass series pronossticadas con laas series realess. El objetivo ees ver qu tan cerca est la
vaariable pronossticada de su serie de datoss correspondiiente.
Pueden usaarse varias esttadsticas dife
ferentes para m
medir en form
ma cuantitativva qu tan cerrca est la varriable pronostticada de los datos reales. Una medida
quue se usa a mennudo es la razz cuadrtica media
m
(rms, rooot-mean-squa
are) del error
de pronstico. La
L rms del errror para la varriable Yt se deffine como:
(8.24)
doonde Yts = valo
or pronosticaddo de Yt
Yta = valoor real
T = nm
mero de perioddos

220

PARTE DOS: Mod


delos de regresin de una sola ecuacin

La rms del
d error es unna medida de la
l desviacin de
d la variable simulada de su
curso en el tiiempo. Por suupuesto, la maagnitud de estte error slo puede
p
evaluarse
comparndoola con el tam
mao promediio de la variaable en cuesti
n.
Otra estaadstica til ess el coeficientee de desigualddad de Theil, el
e cual se definne
como:

Ntese que el numeradorr de U es justto la rms del error de pronnstico, pero la


escala del deenominador ess tal que U sieempre caer enntre 0 y 1. Si 17 = 0, Yts = Yta
para toda t y hay un ajustte perfecto; sii U = 1, el deesempeo quee pronostica del
d
modelo es taan malo comoo podra ser. Por
P tanto, el ccoeficiente de desigualdad de
Theil mide la
l rms del errror en trmino
os relativos.
El coeficciente de desiigualdad de Theil
T
puede deescomponersee de una maneera
til. Puede demostrarse
d
een forma algeebraica que:
(8.226)
donde Ys, Ya, s y a son las medias y desviacioness estndar de las series Yts y
Yta, respectiivamente y es su coeficiente .de correlacin; es decir, =
(1/saT)(Yts - Ys)(Yta - Y a). Podemoss definir entoonces las prop
porciones de la
desigualdad como:
c

(8.227)
(8.228)
y

(8.229)
Las proporciiones UM, Us y Uc son llam
madas las prooporciones de sesgo, variannza

y covarianzaa de U, respecctivamente. Son


S tiles com
mo medios parra descomponner
el error de simulacin
s
en sus fuentes caractersticas
c
s. (Ntese quee UM + Us + Uc
= 1.)

CAPTULO 8: Pronstico con un


n modelo de regressin de una sola ec
cuacin

221

La proporcin de sesgo UM es un indiccio de error sisttemtico, dadoo que mide la


exxtensin en laa que los valoores promedioo de la serie simulada
s
y reaal se desvan
enntre s. Cualquuiera que sea el valor del coeficiente
c
de desigualdad U, esperaramos
m que UM esstara cerca dee cero. Un vaalor grande dee UM (arriba de
d 0.1 o 0.2)
sig
gnificara quee est presentte un sesgo sistemtico, as que es necesaria la revisi
n del modeloo.
La proporccin de varianzza U s indica la
l capacidad ddel modelo paara replicar el
grrado de variabbilidad en la vvariable de innters. Si U s es
e grande, siggnifica que la
seerie real ha fluuctuado en forrma consideraable mientras la serie simuulada muestra
pooca fluctuacin, o viceverrsa; esto indiccara de nuevvo que el moodelo debera
reevisarse. Por ltimo, la prooporcin de covarianza
c
UC mide el error que no es
sistemtico; es decir, represeenta el error reestante despus de que se han
h explicado
laas desviacionees de los valorres promedio.. Dado que noo es razonablee esperar que
laas prediccionees se correlaciionen a la perrfeccin con los resultadoss reales, este
co
omponente deel error es meenos inquietaante que los otros
o
dos. En efecto, para
cu
ualquier valorr de U > 0, laa distribucinn ideal de la ddesigualdad sobre
s
las tres
fuuentes es UM = Us = 0 y UC = 1.
EJEMPLO 8..1

Prronstico de prromedios de ca
alificaciones

Reconsidrese el ejemplo deel promedio de


R
d calificacionnes expuesto en
e los captuloos 1 y 3. En ese
e ejemplo estimamos
e
un
na relacin linneal entre el promedio
p
de
caalificaciones (Y) y el ingreso familiar (X) para un ccorte transverrsal de ocho
inndividuos. Ahoora estamos een posicin dee pronosticar el
e promedio de
d calificacionees de individuuos que no estn en la muuestra originaal, dada slo informacin
soobre sus ingreesos familiarees. En funcin
n de la notacin usada en el
e captulo 1,
laa informacin relevante es como sigue:
Lnea de regreesin estimadda = i = 1.3375 + .12Xi
V
Varianza
del error
e
estimadda = s2 = .109
9
X
= 13.5

(Xi - X
) = 162

CU
UADRO 8.1
C
LCULOS DEL PRONSTICO
P
D
DEL PROMEDIO
O DE
CA
ALIFICACIONES
S

N=8

222

P
PARTE
DOS: Modelos de regresin de una sola ecua
acin

Figura 8.4

Bandas de confianza
cuando se estiman
la pendiente y el
intercepto.

Vamos a supponer que vaarios individuuos que no estn en la mu


uestra original
reportan su inngreso familiar. Deseamoss predecir el promedio
p
de calificaciones
c
y
calcular interrvalos de conffianza. Los clculos relevanntes se resumeen en el cuadrro
8.1, mientrass que las banddas de confian
nza del 95% sse muestran en
e la figura 8.44.
En el cuadro
o 8.1, vemos en la primeraa columna quue el error ms pequeo del
d
pronstico see asocia con el ingreso famiiliar de 13 5000 dlares, el ingreso familiaar
medio de la muestra origginal. Para esste individuo podemos esttar, razonableemente, confiaados de que eel promedio de calificacionnes final caer en el rango de
d
2.1 a 3.9. El hecho
h
de que el
e intervalo de prediccin deel 95% sea tan
n grande, aun en
e
el punto de error de proonstico mniimo, sugiere la naturalezaa limitante del
modelo de prromedio de caalificaciones. Es
E probable que
q un modeloo ms complejjo
(con variablees explicativas adicionales)) y ms obserrvaciones mustrales conduuciran a un inntervalo de prronstico men
nor. Tambinn debemos nottar que el erroor
de pronsticco crece en foorma no lineal conforme los valores para
p
el ingresso
familiar se in
ncrementan m
ms all de la media. De heecho, el interv
valo de pronstico para el ltimo

individduo (con ingreeso familiar de 27 500 dlaares) no slo es


e
grande sino tambin
t
irreaal, dado que el promedio dee calificacionnes de 4.675 no
n
est dentro de
d la experienncia de la muestra originall.

EJEMPLO
O 8.2

Pronstico de tasas de inter


s

En este ejem
mplo usamos un
u modelo de regresin sim
mple para pronnosticar la tassa
de inters enn bonos de tesorera a tres meses.
m
Usarem
mos el modelo elaborado en
e
el ejemplo 4..2. Recuerde qque este modeelo relaciona la tasa mensuual de bonos de
d
tesorera a tres meses (R) con el ndicee de produccin industrial (IP), la tasa de
d
crecimiento del
d suministroo de dinero deefinido en form
ma amplia M22 (GM2t = (M
M2t
- M2t-1) / M2 t-1), y la tasa rezagada
r
de in
nflacin de preecios al mayorreo, GPWt =

CAPTULO 8: Pronstico con un


u modelo de regre
esin de una sola ecuacin
e

223
3

Figura 8.5
Pronstico d e la tasa
de bonos a trres meses.

(PWt PWt-1)/PW
)
e PW es el nndice de preciios al producttor para todass
t-1, donde
laas mercancas. En el ejem
mplo 4.2 estim
mamos esta eccuacin usanddo datos men-suales
s
durante el periodo dee enero de 196
60 a agosto dee 1995. Los esstimados OLS
S
(con la estadsstica t entre pparntesis) fuueron

Ahora usaaremos esta ecuacin parra generar unn pronstico de la tasa dee
bonos
b
de tesorrera para el periodo
p
de ennero de 1995 a febrero de 1996.
1
(Obsr-vese
v
que este pronstico se extiende 6 meses ms aall del perioddo de estima-cin.)
c
La trayyectoria pronoosticada para la tasa de intters (lnea punteada)
p
y laa
serie
s
original (lnea slida) se muestran en la figura 88.5. Ntese quue la ecuacinn
predice
p
en forrma consideraablemente exagerada la tassa de inters a lo largo dell
periodo
p
prono
osticado.
Tambin calculamos
c
laa rms del erro
or de pronstiico y el coeficciente de des-igualdad de Theil
T
junto coon sus compon
nentes para eeste pronstico. Estas esta-d
dsticas,
las cu
uales son tilees para evaluaar el pronsticco, son como la siguiente:
Evaluacin
E
del pronstico
p
de lla tasa de interrs
Raz
R
cuadrtica media
m
del error
Coeficiente de de
C
esigualdad de Th
heil
Proporcin de
d sesgo
Proporcin de
d varianza
Proporcin de
d covarianza

2.504093
0.187605
0.973300
0.000043
0.026657

Obsrvese quee la proporcin de sesgo deel coeficiente de desigualdaad de Theil ess


O
m grande (aalrededor del 97%). Esto taan slo signiffica que un seesgo sistemamuy

224

PA
ARTE DOS: Modelos de regresin de una sola ecuaciin

ttico grande esst presente (ccomo podemo


os observar enn la figura 8.5), as que noo
e probable quue el modelo sea confiablee para pronossticar.
es
Ntese qu
ue la estadstiica de Durbin
n-Watson para la ecuacinn de regresinn
fue
f 0.18, lo que
q indica quue los residuaales estn altaamente correllacionados enn
forma
f
serial. Esto
E sugiere qque el desemppeo dbil paara pronosticaar de este mo-delo
d de tasa de inters podrra mejorarse tomando en cuenta
c
la correelacin serial.
Exploraremos
E
s esta posibilidad en la siguuiente seccinn.

8.2

PRONSTIC
CO CON ER
RRORES CO
ORRELACIONADOS
EN FORMA SERIAL
S
Cuando
C
el prooceso de errorr est correlacionado serialm
mente en mod
delos de seriess
de
d tiempo, ell problema de determinar el mejor proonstico y suu distribucinn
apropiada
a
se vuelve
v
un pocco ms difcil. Considerem
mos el modelo de dos varia-bles
b en el quee los errores eestn correlacionados seriaalmente en primer orden:

En la seccin anterior nuesstro mejor pro


E
onstico para YT+1 fue deteerminado asig-n
nndole
a T+11 el valor 0 paara el periodo
o pronosticadoo. Esto fue raazonable, dadoo
q los errorees tenan meddia 0 y eran inndependientess a lo largo deel tiempo. Sinn
que
e
embargo,
en el
e caso correlaacionado seriaalmente, usareemos nuestro conocimientoo
d los errores en periodoos previos al periodo de ppronstico paara modificarr
de
n
nuestra
predicccin del erroor en el perio
odo T + 1.
Para proseguir con estaa materia, suppngase que los parmetross de regresinn
,
y se coonocen. Proceedemos eligieendo el valor pronosticado de YT+1 de laa
siguiente
s
mannera:
(8.30)
^
En lugar de establecer
E
e
T+1 = 0, como en la seccinn anterior, caalculamos ^T+11
a partir del trmino del errror previo. Dado
D
que T+11 = T + vT, elegimos ^T+11
= ^
T (ya quee vt tiene mediia 0 y no est correlacionaada a lo largo del tiempo).3
P consiguiennte,
Por

(8.31))
Si, en el futurro, continuam
S
mos con el proonstico, la innformacin proporcionada
p
a
p la correlaacin serial see vuelve cada vez menos til, dado que
por
3

Dado que y son conociidas, no hay estim


macin implicadaa, de modo que

T = T.

CAPTULO 8: Pronstico
P
con un modelo de regresin de una sola eccuacin

225

y s se aproxim
ma a cero confo
forme s crece.
Observe quue la prediccin idntica de YT+l se obtienne cuando escribimos el
mo
odelo en form
ma de diferenccia generalizaada:
(8.32)
do
onde
Enntonces el proonstico aproppiado es:
(8.33)

doonde La equivvalencia de lass ecuaciones (8.33) y (8.311) se vuelve ev


vidente al
escribir:

la cual es idnttica a la ecuaccin (8.31).


Si , y se conocen, eel error de proonstico est dado por:

Poor tanto, el error de pronsstico est disttribuido en foorma normal con


c media 0
y tiene una varrianza:

226

PARTE DOS: Mode


elos de regresin de una sola ecua cin

Ntese que este


e error de ppronstico es menor,
m
por unn factor de 1 - 2, que lo quue
sera en el caaso contrario si no tomram
mos en cuentta la correlaciin serial.
Por lo geeneral, en la prctica los trees parmetros , y no see conocen, perro
pueden estim
marse usando cualquiera de las tcnicass de estimacin descritas en
e
el captulo 6.
6 Para produccir el mejor pronstico,
p
unno tan slo usa
u la ecuacin
estimada en forma de differencia geneeralizada. En otras palabraas, calculamoos
T + 1 a partir de
(8.344)

Puede demostrarse quue la media del


d error de ppronstico see aproximar a
cero conform
me se haga m
ms grande el tamao
t
de la muestra. Es un poco difccil
determinar una
u expresinn explcita para la variannza del error de pronsticco
cuando los tres
t
parmetroos , y se han estimaddo, dado quee el proceso de
d
estimacin garantiza
g
que los parmetro
os de pendiennte e interceptto estimados se
s
correlacionarrn con los reesiduales de la
l regresin. E
En la prcticaa, para calculaar
la varianza del
d error de proonstico (y po
or tanto calcullar un intervallo de confianzza
en el pronsttico mismo), asumimos quue se ha estiimado exactaamente. En estte
caso la varian
nza del pronstico de la ecuacin (8.19)) se aplica a nu
uestra ecuacin
estimada en forma
f
de diferrencia generaliizada (con un .trmino del error
e
vt en lugaar
de t). Una vez
v ms el errror de pronsttico para T + 1 tendr una varianza
v
menoor
(y de este moodo las bandaas de confianza del 95% serrn ms estrecchas) de la quue
sera en el caso
c
si la correlacin serrial no fuera tomada en cuenta.
c
Esto lo
l
examinaremo
os en el conteexto del moddelo de regressin mltiple en el apndicce
8.1. Ahora analizaremos
a
un ejemplo de pronsticco en presen
ncia de errorees
correlacionad
dos serialmennte.

EJEMPLO
O 8.3

Pronstico de
e tasas de interrs

Regresemos al pronstico de la tasa de inters del ejeemplo 8.2. El desempeo ddel


pronstico de nuestra ecuuacin de regrresin en ese eejemplo fue deficiente,
d
perro
la estadsticaa de Durbin-W
Watson baja suugiere que parrte del problem
ma podra ser la
correlacin serial
s
en el trrmino del erro
or. En el ejem
mplo 6.6 volv
vimos a estimar
nuestra ecuaacin de tasa de inters orriginal a parttir del ejempllo 4.2 con unna
correccin para
p
la correlacin serial de
d primer ordden. La nuev
va ecuacin de
d
regresin (dee nuevo estim
mada durante el periodo dee enero de 19960 a agosto de
d
1995) fue:

Observe que el valorr estimado de , el coeficieente de correelacin serial, est


cerca de 1. El coeficientte para la tasa de crecimiento del sum
ministro de diinero
ahora es negaativa (lo cual es ms consisstente con la tteora econm
mica) y es muyy

CAPTULO 8: Pronstico con un modelo de regressin de una sola eccuacin

227

Figura 8.6
Pronstico de
e la tasa
de bonos a tre
es meses
(tomando en cuenta
c
la correlacin serial).

significativo. El
E error estnddar de la regresin ahora ees mucho mennor y la estadstica de Durbbin-Watson ess 1.64.
Usamos essta nueva ecuuacin de reg
gresin para generar una vez ms un
prronstico de la
l tasa de inters para el periodo
p
de ennero de 1995 a febrero de
19996. Las series pronosticadaa y real se muuestran en la fiigura 8.6. Obsrvese que la
seerie pronosticaada ahora est mucho mss cerca de la sserie real y quue ya no hay
niinguna tendenncia sistemtica a sobrepreedecir o subprredecir los dattos reales. El
deesempeo meejorado del prronstico tam
mbin es evideente a partir de
d la rms del
errror de pronsstico y los coomponentes del
d coeficientee de desigualddad de Theil
qu
ue se muestraan a continuacin.
Evaluacin del pronstico
p
de la
a tasa de Inter
s
Raz cuadrtica media
m
del error
Co
oeficiente de dessigualdad de The
eil
Proporcin de sesgo
Proporcin de
d varianza
Proporcin de
d covarianza

EJEMPLO 8.4

Prronstico de la
a demanda de c
carbn

0.309388
0.028608
0.038771
0.060426
0.900803

En
n este ejempllo construimoos y usamos un
u modelo de pronstico para
p
predecir,
enn una base mensual, la dem
manda de carrbn bituminooso. Comenzaamos por espeecificar una eccuacin lineall que relacione la demanda de carbn (C
COAL) con el
nndice de produuccin de aceero y hierro de
d la Federal R
Reserve Boarrd (FIS) con
4

Este ejemploo se coment prim


mero en el ejempplo 6.5.

228

PA
ARTE DOS: Mode
elos de regresin de una sola ecuaccin

el ndice del Consejo


C
de laa Reserva Federal de producccin de serviicios elctricoos
(FEU), el nddice de precioos al mayoreoo para el carbn (PCOAL) y el ndice de
d
precios al maayoreo para el gas natural (P
PGAS). Usam
mos datos mennsuales durantte
el periodo dee enero de 19965 a diciemb
bre de 1972 y una serie ajuustada estacioonalmente parra la demandda de carbn.. Comenzamoos por estimaar la ecuacin
usando mnim
mos cuadradoos ordinarios. Los resultadoos de la regreesin se muesstran a continu
uacin, con la estadstica t entre parnttesis:

El ajuste de esta ecuaccin es bastannte acertado, ccomo puede veerse a partir de


d
la estadsticaa y en la figuura 8.7, la cuaal compara laa demanda dee carbn real y
ajustada duraante un perioodo de tres aos. Sin embaargo, un probblema con estte
modelo es la estadstica D
DW baja, que indica correlaacin serial siignificativa.
Para mejorar nuestro ppronstico, esstimamos de nnuevo la ecuaacin usando el
e
procedimientto de regresin de Hildreth
h-Lu. En estee procedimiennto la ecuacin
es transformaada usando diferencias
d
gen
neralizadas:

Dado que no se conoce , Hildreth-Lu realiza regressiones OLS enn esta ecuacin
usando varios valores difeerentes de . Cada
C
vez que se realiza unaa regresin, see

Figura 8.7
Demanda de
d carbn,
ajustada co
ontra real.
Lmites de tiempo:
enero de 1970 a
diciembre de 1972.

CAPTULO 8: Pronstico con un


n modelo de regre
esin de una sola ecuacin
e

229
9

caalcula la sumaa de residualess al cuadrado (ESS)


(
y el vallor de que prroporciona la
ESS menor see usa en el rresultado finaal. Los resultados de la regresin
r
de
Hildreth-Lu
H
paara nuestra eccuacin de deemanda de caarbn son:

Ntese
N
que la estadstica
e
DW
W est ms ceerca de 2.0 y que el error estndar
e
de la
eccuacin es meenor (998 conntra 1 200 de antes). Todass las variabless explicativas
coontinan sienndo significatiivas. El ajustee de la ecuaciin puede verrse en forma
grrfica en la figura
f
8.8, la cual comparra las series real
r
y ajustadda durante el
peeriodo de tress aos. Una coomparacin dee la figura 8.88 con la figuraa 8.7 muestra
ell mejor ajustee proporcionaddo por el proccedimiento dee Hildreth-Luu.
Ahora geneeraremos pronnsticos ex poost durante el periodo de ennero de 1973
a diciembre dee 1973 y comppararemos esttos pronsticoos con la dem
manda real de
caarbn durantee ese periodo. Primero usam
mos la ecuacin (8.35) que no explica la
co
orrelacin serrial. Estos ressultados del pronstico,
p
juunto con la baanda de confianza del 95%
% y la serie real
r
para la demanda
d
de ccarbn, se mu
uestran en la
figura 8.9. Loss resultados soon bastante bu
uenos; la seriie real siemprre permanece
deentro de la baanda de confiianza del 95%
% y de hecho usualmente est
e bastante
ceerca de la seriie pronosticadda.

Figura 8.8
Demanda de carbn,
ajustada conttra real
con la correcccin de la
correlacin se
erial
Lmites de tiempo: enero
de 1970 a dicciembre de
1972.

230

PARTE DOS: Mode


elos de regresin de una sola ecua cin

Figura 8.9

Pronstico de la
demanda de
d carbn
usando regrresin OLS.
Lmites de tiempo:
t
enero de 19
973 a
diciembre de
d 1973.

Sin embargo, se puedden generar aun


a mejores ppronsticos ussando la ecuaacin (8.36) enn su forma de diferencia gen
neralizada, es decir, aplican
ndo la ecuacin
(8.33) o (8.344). Estos resuultados, de nuuevo junto conn la banda dee confianza deel
95% y la serrie real, se m
muestran en laa figura 8.10. Observe qu
ue la banda de
d
confianza del 95% es ms estrecha
e
cuanndo se toma enn cuenta la corrrelacin seriaal;
ya sea que nuuestros pronssticos sean exx ante o ex posst, tendremos una confianzza
mayor en elloos si hemos aajustado nuesstra ecuacin para corregir la correlacin
serial en los trminos
t
del error.
e
Como esperaramos,
e
una comparaccin de las doos
figuras muesstra que la seerie pronosticcada est ms cerca de laa serie real (ees
decir, los erroores de pronstico resultanntes en efecto son menores) cuando se ha
h
explicado la correlacin
c
seerial.

Figura 8.10
0
Pronstico de la
demanda de
d carbn
usando la correccin
c
de la correlacin serial.
Lmites de tiempo:
enero de 1973 a
diciembre de
d 1973.

CAPTULO 8: Pronstico con un modelo


m
de regresi
n de una sola ecu
uacin

8.3

231

PRONSTICO
O CONDICIO
ONAL
En el anlisis an
nterior se asum
mi que las vaariables expliccativas son coonocidas sin
erroor. sta puedde ser una supposicin irreall durante un pronstico
p
exx ante, dado
quee algunas variiables explicaativas tengan que ser predecidas en el futuro.
f
Uno
poddra esperar que
q la naturaleeza estocsticca del valor ppronosticado de
d dichas X
connducir a pronnsticos de Y que son meno
os confiables de lo que sonn en el caso
de las
l X fijas. Veeremos que, enn efecto, los in
ntervalos de cconfianza del 95%
9
para el
erro
or de pronsstico se increementan en tamao cuanddo las X missmas deben
preedecirse. Sin embargo,
e
debiido a que es muy
m difcil derrivar una frm
mula para el
erroor de pronstico en un esccenario generaal, abordarem
mos aqu un caaso especial
quee ser instructtivo.5
Considerem
mos el siguientte modelo:

donnde ^ y son los estimaados OLS dee y .


El modelo asume
a
que XTT+1 es pronostticada con unn error de proonstico con
media 0 y variannza constante. Adems, se supone
s
que el proceso de errror asociado
conn el pronstico
o de XT+1 es inndependiente del proceso dde error asociaado con cada
unaa de las Y en el
e modelo. Auun cuando soon de naturaleeza estocstica, todava se
asuume que las X no estn corrrelacionadas con el trminno de error de la ecuacin.
La restrictividadd de este modeelo queda clarra cuando connsideramos los medios por
los que podran obtenerse
o
los valores pronoosticados de XT+1. Un proceedimiento es
exttrapolar los vaalores mustrrales de X. Peero la probabiilidad de que la variable X
se autocorrelacioone en un m
modelo de seriies de tiempoo sugiere quee el error de
proonstico asocciado con el procedimien
nto de extrapolacin en s
s mismo es
proobable que estt correlacionnado serialmente.
El valor proonosticado dee Y en el perio
odo T + I est definido poor:
(8.38)
El error de pronstico es:
(8.39)
5
Este caso se describe
d
en M. Feeldstein, "The Errror of Forecast in Econometric Moodels When the
Foreecast-Period Exoggenous Variables A
Are Stochastic", Econometrica,
E
vol. 39, pp. 55-60, enero
e
de 1971.

232

PARTE DOS: Mod


delos de regresin
n de una sola ecu
uacin

Es fcil ver que este erroor tiene mediaa 0:

dado que y uT+1 no estn correlacionados.


La variaanza del errorr de pronsticco es un pocoo ms difcil de
d derivar:

Observe, quue al llegar a la ecuacin (8.43) sacam


mos ventaja deel hecho de qque
uT+1 = XT+1 - XT+l, de que uT+1
n correlacionaadas y, por ltiimo, de que 2 =
T y no est
2
+ Var ( ). A continuaccin, podemoss usar la ecuaccin (8.42) parra simplificar el
ltimo trm
mino en la ecuuacin (8.41):

(El primer trmino


t
de laa derecha es cero
c
por supoosicin.) Ahorra, combinanndo
trminos, enncontramos que:
q

Cuando pon
nemos esto enn funcin de nuestros
n
estim
madores de mnimos cuadraados, la frm
mula para la vvarianza del errror de pronstico se vuelvve:

CAPTULO 8: Pronstico con un modelo


m
de regresi
n de una sola ecu
uacin

233

Un
na comparaci
n de la ecuaccin (8.46) co
on la ecuacinn (8.19) de la seccin 8.1
dejja claro que pronosticar X iincrementa el error de pronnstico. Hay dos
d trminos
no negativos adiicionales impplicados, los cuales slo sonn minimizadoos cuando el
proonstico de XT + 1 es exactoo. Por desgraccia, es difcil ddescribir los inntervalos de
con
nfianza ms grandes
g
para eel error de proonstico condiicional, dado que T+1 no
estt distribuida en
e forma norm
mal. (Esto invvolucra la sum
ma de producttos de variablees aleatorias distribuidas
d
nnormalmente.)) Aunque loss intervalos de confianza
no pueden ser derivados
d
en fforma analticca, un estimaddo tosco del intervalo
i
de
connfianza podra obtenerse de
d la siguientee forma:
1. Se calcullan los intervaalos de confiaanza del 95% asociados conn el pronstico
o que se obteendra si selecccionramos que XT+1 estuuviera 2 desviiaciones estnndar arriba o abajo,
a
es decirr, los intervaloos de confianzza asociados con
c Y *T + 1=
^
^
**
+ (XT+1 + 2u) y Y T + 1= + (XT+1 - 2u).
2. La predicccin del inteervalo final see toma como lla unin de loos dos intervallos de confian
nza; es decir, contiene toddos los valores de T+1 com
munes a amboss intervalos de
d confianza.
Estte proceso se describe en la
l figura 8.11.
Los resultaddos de esta seeccin ayudann a elucidar allgunas de las dificultades
imp
mplicadas en el proceso de pronstico.
p
A si el modeelo de regresiin tiene un
Aun
bueen ajuste con parmetros significativos desde
d
el punto de vista estaadstico, los
proonsticos inco
ondicionales ppueden no seer muy precisos. Pronosticar variables
expplicativas intrroduce error dde pronstico adicional. Unn buen modelo de regresin en funcinn del pronsticco incondicioonal puede deesempearse mal
m cuando
se intenta un pronstico conndicional. Po
or tanto, uno no debera rechazar
r
un
moodelo con un error
e
de pronstico alto si el
e componentee primario de ese error se
debbe a un error en la predicciin implicadaa con las variaables explicatiivas. El

Figura 8.11
Aproximacin al
intervalo de pre
ediccin
para un pronsstico
condicional.

234

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

problema ess an ms diffcil en el pronstico macrooeconmico debido


d
a que un
pronstico condicional
c
prreciso inicial puede
p
conduccir a un cambio
o en la polticaa y
por tanto a un
u pronsticoo impreciso!

APNDICE 8.1
Pronstico con
c el modelo de
d regresin mltiple
m

En este apndice usamos notacin matricial


m
para ggeneralizar laa exposicin del
d
problema deel pronstico al caso multiivariado. Com
menzamos esccribiendo el mom
delo lineal general
g
en forma matriciall. El modelo ccontiene una variable depeendiente y k variables
v
indeependientes (iincluyendo ell trmino con
nstante) y es ese
timado sobrre un total de T observacio
ones:
(A88.1)
Recuerde quue Y es un veector de T x 1 columna de observacionees de la variabble
dependientee, X es una maatriz T x k de observaciones
o
s de la variable independiennte,
es un vecttor de k x 1 ccolumna de paarmetros descconocidos y es un vector de
T x 1 colum
mna de trminoos de error. Enntonces el estiimado de mnnimos cuadraddos
ordinarios de
d estar daado por:
(A88.2)
Ahora examinaremo
e
os las caracterrsticas de un pronstico reealizado, el cuual
usa esta eccuacin estim
mada. Supng
gase que teneemos un conj
njunto nuevo de
observacionnes (o incluso pronsticos o suposicionees) para las vaariables indepeendientes paraa el periodo T + 1. Entoncces, el pronstico para la variable depeendiente en ell periodo T + 1 estar daddo por:
(A88.3)
Ntese que XT+1 es un vecctor con 1 x k filas, as que T+1 es un esccalar. Del mism
mo
modo, si deseamos un proonstico paraa el periodo T + 2, ste estarra dado por:
(A88.4)
Si todas lass variables inndependientess aparecieran con rezagos mayores quee o
iguales a doss periodos, tann slo podram
mos observar XT+2, pero si alggunas o todas las
variables inndependientess no estn rezagadas, XT+2 misma tendr que ser
pronosticada y el pronsttico de YT+2 ser condicionaal al pronstico
o de XT+2.

CAPTULO 8: Pronstico
P
con un modelo de regresin de una sola ec
cuacin

235

Dado que las


l ecuaciones (A8.3) y (A
A8.4) se aplicaan para cualquuier periodo,
elliminamos el subndice de tiempo y repllanteamos nuestra ecuacinn de pronsticco como:
A8.5)
(A

doonde es unn pronstico de Y, para algn


a
periodoo y X es un conjunto de
obbservaciones en las variabbles independ
dientes para ese periodo. Por ltimo,
deenotamos el vaalor real de Y ccon . Entoncees, el error de ppronstico estt dado por:
(A8.6)
D
Dado
que el vaalor real de Y puede escrribirse como:
(A8.7)
doonde es el valor
v
real del ttrmino del errror aditivo enn el periodo pronosticado,
p
poodemos escrib
bir el error dee pronstico como:
c
(A8.8)
Suustituyendo laa ecuacin (A
A8.1) en la ecu
uacin (A8.8)), tenemos:

La varianza del error de pronnstico es:

Esstamos suponniendo que loos trminos del


d error adittivos no estnn autocorrelaacionados, y por
p consiguiennte E[] = 0. Tambin esttamos suponieendo que los
trminos del errror son homoocedsticos, de
d modo que::

Poor tanto podemos escribir la varianza del


d error de prronstico com
mo:

236

PA
ARTE DOS: Mod
delos de regresin de una sola ecuacin

Ahora poodramos pregguntar cul poodra ser la vaarianza del errror de pronsstico ms peqquea posiblee, es decir, cuul valor de X minimizaraa 2. Podemoos
responder estta cuestin ressolviendo un problema
p
de minimizaran
m
restringida en
e
el que usamoos el mtodo de
d los multiplicadores de Lagrange.
L
Parra minimizar 2
debemos minnimizar el prroducto matriicial en el lado derecho de
d la ecuacin
(A8.12); es decir,
d
deseamoos

La restriccinn de que X 1 = 1 se refiere al hecho de qque el primer elemento de X


es el intercepto de la ecuaccin de regresiin. Podemos escribir la lag
grangiana parra
este problem
ma como:
(A8.133)
donde es el multiplicadoor de Lagrang
ge. Al diferennciar la lagranngiana con resspecto a X y estableciendo
e
o la derivada igual
i
a 0 da:

Por tanto X ' es proporcional a la prim


mera columna de X'X:

Las sumatoriias en la ecuaacin (A8.16) son sobre lass T observaciiones. Desde la


l
primera fila de la ecuacin (A8.16), daado que X 1 =1,

CAPTULO 8: P
Pronstico con un modelo de regressin de una sola eccuacin

237

Ahhora podemoss escribir la eccuacin (A8.116) como:

(A8.17)

Peero ntese quee el lado dereccho de la ecuaccin (A8.17) ees el vector dee medias. De
estte modo, com
mo fue el caso en el modelo
o de dos variaables, la variannza del error
dee pronstico es minimizadda cuando toodas las nuevvas observaciiones en las
vaariables independientes sonn iguales a suus valores meddios. Cul ess el valor de
estta varianza deel error de prronstico mnnima? Escribieendo la ecuaccin (A8.17)
coomo:

(A8.18)

y sustituyendo
s
esto en la ecuuacin (A8.122), tenemos

Ahora cm
mo se vern nuestras
n
regio
ones de confiaanza del 95%
%? Sern una
veersin multidiimensional dee la figura 8.33. En el caso dde dos variabbles independientes (adems del trminoo constante), la regin de cconfianza dell 95% estar
coonfinada por dos
d hiperbolooides. El inteervalo de confianza ser menor
m
en los
vaalores medios de X1 y X2.

238

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

EJERCICIO
OS
8.1 Para el modelo
m
de regreesin Yt = + X
t + t :
a) Supon
nga que se conooce . Cul ess el mtodo aprropiado para pronosticar YT+l?
Demuestre qu
ue la varianza ddel error del prronstico est dada por:

b) Suponnga que se conooce . Encuentrre el mtodo appropiado para prronosticar YT+l


y demuestre que
q la varianzaa del error del pronstico
p
ser:

Sugerencia: 1)
1 En el modelo Yt = + t, el
e estimador dee mnimos cuaadrados de esst
dado por ^ = (1 / T)Yi y laa varianza de ^ = 2 /T, dondde 2 = Var(t). 2) En el modeelo
2
Yt = Xt + t, el estimador dee mnimos cuaddrados de est dado por = .XiYi /X i y la
2
2
varianza de = /X i.
8.2 En la figura 8.5 en el eejemplo 8.2, la serie real paara la tasa de inters
i
divergee
de manera connsiderable de laa serie pronosticada en 1995. Sugiera por quu el modelo dee
regresin fall durante este ao.

CAPTULO

ESTIMACIN DE UNA SOLA ECUACIN:


TEMAS AVANZADOS

Los ocho captulos anteriores conforman el desarrollo del ncleo de la econometra, el modelo lineal general. En este captulo, continuaremos el anlisis de la
estimacin de una sola ecuacin con el estudio de cuatro temas ms avanzados.
El primero se relaciona con los modelos de rezago distribuido y su estimacin.
Nos enfocaremos en dos de las estructuras de rezago que con ms frecuencia
son usadas: el rezago geomtrico y el rezago distribuido polinomial.
A continuacin, se mostrar cmo pueden usarse los modelos de rezago
simple para probar la causalidad, es decir, si los cambios en una variable pueden
verse como una causa de los cambios en otra variable. En tercer lugar consideraremos varios medios para resolver el dilema que surge cuando hay observaciones perdidas. La reduccin en eficiencia que resulta cuando las observaciones se
eliminan de la muestra se compara con los riesgos de remplazar observaciones
faltantes con sustitutos adecuados.
Finalmente proporcionaremos una breve introduccin a la estimacin de
modelos de regresin usando una combinacin de datos de corte transversal y de
series de tiempo. Se contemplarn varios esquemas alternativos para la combinacin de datos y, siempre que sea posible, se describirn las tcnicas de
estimacin correspondientes.

9.1

MODELOS DE REZAGO DISTRIBUIDO


En los modelos de series de tiempo puede pasar un periodo considerable entre el
periodo de toma de decisiones econmicas y el impacto de un cambio en una
239

240

P ARTE DOS: Mode


e los de regresin de una sola ecua
acin

variable poltica. Si este pperiodo entre la toma de decisiones y suus respuestas es


suficientemeente largo, vaalores rezagaados de las vvariables expplicativas debben
incluirse en forma explccita en el moddelo. Como uun ejemplo, considrese
c
u
una
funcin de consumo agreggado que se va
v a estimar uusando datos macroeconm
micos trimestraales. Podra esspecificarse ell consumo Ct como una fun
ncin de ingreeso
disponible aggregado rezagaada un trimesttre YT + 1. La eespecificacinn de la estructuura
rezagada de un modelo ess una funcin de las unidaddes de tiempoo de los datos. Si
la misma fu
uncin de coonsumo fueraa especificadda utilizando datos anuales,
podra ser raazonable elim
minar el rezag
go en la variaable de ingreso, dado que el
periodo de medicin
m
es coonsiderablemeente mayor quue el periodo de
d reaccin.
Este ejem
mplo simple supone que el
e efecto enteero de la variaable explicatiiva
ocurre en unn periodo. See podra espeecificar, de m
manera ms general,
g
que los
l
cambios econ
nmicos puedden distribuirsse a lo largo de
d varios periiodos; sta ess la
base del moddelo de rezagoo distribuido, en
e el que una serie de variab
bles explicativvas
rezagadas exxplica el proceeso de ajuste de
d tiempo. El m
modelo de rezzago distribuiddo,
usualmente, puede escribirse

A menos quee se establezca de otra mannera, supondreemos que el trmino del errror
est distribuiido en forma normal, indeependiente dee X, y no est correlacionaado
serialmente ni es heteroccedstico. Au
unque en mucchos ejemploos implican una
u
estructura dee rezago finitaa, permitirem
mos en este caso que el nm
mero de rezaggos
sea infinito. Entonces, la estructura deel rezago es innfinita, la secuencia de pessos
de rezago quue describe el patrn de la respuesta del rezago debe tener una sum
ma
finita o el modelo
m
no tendr una soluccin finita.
Si el nm
mero de trm
minos en el reezago distribuuido es pequeeo, la ecuaciin
puede estimarse usando mnimos cuaadrados ordinnarios. Sin em
mbargo, cuanndo
hay muchos trminos y see sabe poco accerca de la forrma del rezaggo, la estimaciin
directa usa un
u nmero ggrande de graados de liberrtad y es proobable que essto
conduzca a estimados dee parmetro imprecisos
i
deebido a la muulticolinealidaad.
Afortunadam
mente, estas ddificultades pu
ueden resolveerse si especifficamos algunnas
condiciones acerca de la forma del reezago distribuuido. Para prooseguir con este
e
tema a contiinuacin desccribiremos doos de las estruucturas de rezzago planteaddas
con mayor frrecuencia.1

Para el estudio
e
ms avannzado de los moddelos de rezago distribuido
d
se hacce referencia de P.

Dhrymes, Distribbuted Lags: Probllems of Estimationn and Formulationn (San Francisco: Holden-Day, 19711),
Z. Griliches, "Diistributed Lags: A Survey", Econom
metrica, vol. 35, pp.
p 16-49, 1967, y M. Nerlove, "Lags
in Econometric Behavior",
B
Econoometrica, vol. 40, pp. 221-251, 19772.

CAPIT
TULO 9: Estimaci
n de una sola ecu
uacin: temas avanzados

9..1.1

241

Rezzago geomtrico

Ell rezago geom


mtrico determ
mina que los pesos
p
de las vaariables explicativas rezagaadas son todoos positivos y declinan enn forma geom
mtrica con el tiempo. El
modelo es el siguiente:

(9.2)
Ell patrn de paarmetros asoociados con el
e modelo se describe en la
l figura 9.1
(p
para w = 12 ). Aunque
A
los peesos del modeelo de rezago geomtrico nunca
n
llegan
a cero,
c
disminu
uyen, de modoo que ms all de un tiempoo razonable ell efecto de la
vaariable explicaativa se vuelvve insignifican
nte.
Es til desccribir la estrucctura del rezaago de un moddelo de rezagoo distribuido
en
n funcin de su
s rezago meddio y en funccin de la resppuesta a largoo plazo de la
vaariable dependdiente ante unn cambio perm
manente en una
u de las varriables explicaativas. La resppuesta a largo plazo m es el parmetro veces
v
la sumaa de los pesos
rezagados (ws) o /(l - w),, con m midiendo el cambbio en Y asocciado con un
inncremento de 1 unidad en X que perman
nece en efectoo durante todoo el tiempo.2
Poor el contrario
o, el rezago medio
m
se definee como un prromedio de tieempo ponderaado para el rezzago, es decirr:

Enn el modelo de
d rezago geomtrico el rezzago medio es w/( 1 - w), dado
d
que3

Sii w = 21, por ejemplo, el rezaago medio de 1 sugiere que la mitad del im
mpacto de un
caambio en Y see sentir duraante el primerr periodo.
En esta forrma el modello de rezago geomtrico pparece difcill de estimar,
daado que implicca un nmeroo infinito de reegresores. Sinn embargo, la forma
f
para2

Recuerde la suma de una serrie infinita como ws =1/(1- w). Para


P demostrar esto, tenemos que
s
s
S = 0 w = k. Multip
plicando por w im
mplica que
S = 1w = kw. Restando, ocbtenemos 1 = k (1 - w) o k =
1// 1- w).
3
El hecho de que sws = w/(( 1 - w)2 resulta deel desarrollo:

242

PARTE
P
DOS: Mode
elos de regresin de una sola ecuaccin

Figura 9.1
Parmetross de rezago
geomtrico
o.

mtrica de loss pesos de rezaago permite unna simplificaciin considerabble del modeloo.
Para observarr esto, escribirremos de nuev
vo el modelo original
o
[ecuacin (9.2)] con
todas las obsservaciones reezagadas un periodo:
p
(9.33)
Entonces callculamos la exxpresin Yt wY
w t - 1 para obbtener
(9.44)
donde ut = t - wt - 1. Al eescribir de nu
uevo,
(9.5
5)

La ecuacin (9.5) hace un poco ms fccil medir el effecto de un caambio continuuo


de 1 unidad en X en el valor
v
de Y. En
E el primer pperiodo el effecto es . Siin
embargo, en el segundo peeriodo Yt 1 see ha incremenntado por , ass que el efectto
ahora se ha vuelto + w = (l + w).
w Despus dde T periodoos el efecto ees
TS = 10 ws= (l
- wT)/(l - w),4 mientrras que la reespuesta a laargo plazo ees
(l - w).
En ocasioones, es til calcular el rezaago mediano, es decir, el vaalor del tiemppo
T para el que la fraccin de ajuste com
mpletado es igual a 1 . Parra encontrar el
e
2
rezago mediaano resolverem
mos

Resolviendo para T, enconntramos que:

De este modo,
m
una vez m
ms, se presenta laa suma de una seerie geomtrica.

CAPT
TULO 9: Estimacin de una sola ecua
acin: temas avan
nzados

243

La ecuacin
n (9.5) puede estimarse conn ms facilidaad que la ecuacin (9.2),
daddo que slo trres parmetross permanecenn desconocidoos. Sin embarggo, antes de
connsiderar ms la estimacinn, necesitamo
os asegurar qque la especifficacin del
moodelo es aprop
piada.
Moodelo de expeectativas adap
ptable El mod
delo de expecctativas adaptaable postula
quee los cambioss en Y se relaccionan con loss cambios en el nivel "espeerado" de la
varriable explicaativa X. Este modelo
m
se esccribe de la siguiente manerra:
(9.6)
donnde X* repressenta el nivell deseado o essperado de X.
X Por ejemploo, X* puede
rep
presentar el inngreso permannente en el ejemplo de connsumo agregaado descrito
conn anterioridad
d, o un precio esperado en un modelo m
microeconmico. El nivel
espperado de X esst definido por una segundda relacin enn la que se suppone que las
exppectativas soon alteradas en
e cada periiodo como uun ajuste entre el valor
obsservado actuall de X y el vallor esperado previo
p
de X. Laa relacin es la
l siguiente:
(9.7)
Enn ocasiones ess ms til reesscribir la ecuaacin (9.7) coomo:

Estto nos dice quue el nivel espperado de X (ingreso permaanente o preciio esperado)
es un
u promedio ponderado deel nivel presennte de X y el nivel esperaddo previo de
X. Los
L niveles essperados de X se ajustan peeriodo por perriodo, tomand
do en cuenta
los niveles preseentes de X Parra plantear el modelo de exxpectativas addaptable, de
tal forma que esto permita la estimacin ecconomtrica, reescribimos la ecuacin
(9.88) rezagando el modelo peeriodo por peeriodo, y al m
mismo tiempo multiplicamo
os por (1 - )s, donde s es el
e nmero de periodos impplicados en el proceso de
rezago:
(9.9)
Ah
hora sustituim
mos la ecuacin (9.9) en la ecuacin (9.88) y combinam
mos trmi-

ress presentes y previos deX,


X, dado que lo
os pesos sumaan la unidad [(1 )s
= 1].
1 Al sustituiir la ecuacinn (9.10) en la ecuacin (9.66), obtenemoss:
(9.11)

244

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

La equivaleencia de este modelo con el modelo dee rezago geom


mtrico originnal
[ecuacin (99.2)] puede verse
v
si sustituuimos

De este moddo, la estimaccin de la espeecificacin associada con ell modelo de eexpectativas adaptable
a
es idntica
i
al pro
oblema de esstimar el rezaago geomtricco,
con la ecuaccin (9.5) connvirtindose ahora
a
en:

Modelo de ajuste de accciones El moddelo de ajuste de


d acopio suppone que el nivvel
deseado de Y depende deel nivel actuaal de X, es deccir,
(9.113)
En el ejemp
plo del consuumo Yt* podra representarr un nivel de gasto deseaddo,
mientras quue en el ejemplo de la demaanda puede reppresentar la caantidad deseaada
que se va a suministrar o la superficiee en acres deseada que se va
v a cultivar. En
E
cualquier periodo
p
determ
minado, el valor
v
real dee Y puede no
o ajustarse por
p
completo paara obtener ell nivel o acop
pio deseado. La
L falta de coonocimiento, las
l
restriccionees tcnicas y otros factores pueden serr responsabless de este ajusste
parcial. Pod
demos represeentar el proceso de ajuste ccomo:
(9.114)
La ecuacinn especifica qque el cambioo en Y respondder slo, en forma
f
parciall, a
la diferenciaa entre la reseerva deseada de Y y el valoor pasado de Y,
Y con la tasa de
respuesta siiendo una funncin del coeeficiente de ajuste
a
. Al sustituir
s
para Y*t
en la ecuaciin (9.14) y reesolver para Yt se produce:
(9.115)
Una vez ms el modelo dde ajuste de acopio
a
guardaa una relacinn estrecha conn el
modelo de rezago
r
geomtrico. Los doos son equivaalentes en la forma [vase la
ecuacin (99.5)] si suponeemos que:

Sin embargoo, la equivalenncia de los modelos


m
no es completa, deb
bido a que invvolucra un conjunto difereente de suposiiciones respecto a la estruuctura del erroor.
Para observ
var esto, reesccribimos la ecuacin
e
(9.155), rezagamos el modelo un
periodo y luuego sustituim
mos para Yt -1. Iterando
I
este pprocedimiento
o y recolectanndo
trminos, see obtiene:

CAPT
TULO 9: Estimacin de una sola ecua
acin: temas avan
nzados

245

A diferencia de la especificaccin del errorr original, el pproceso de errror asociado


con
n el modelo de
d ajuste de aacopio es un proceso
p
de errror de promeddio mvil.

9.1
1.2

Estim
macin del rrezago geo
omtrico

Enn esta seccin analizamos en forma brevee algunos de los


l problemass implicados
en la estimacinn del modelo de rezago geoomtrico. Reccuerde que unn modelo as
puede transform
marse en un modelo
m
autorreegresivo de unna sola ecuacin con una
solla variable deependiente rezzagada:
(9.18)

Deependiendo deel modelo elegido, el proceeso de error puede


p
seguir varias
v
suposicciones alternaativas. Considderemos prim
mero el caso een el que el trmino
t
del
errror est distrib
buido en form
ma normal coon varianza coonstante y no
o est correlaccionado en forrma serial. Poor regla generaal la especificcacin del rezago geomtricco introducirr correlacinn serial si ell error originnal especificaado no est
auttocorrelacionnado. Sin embbargo, el procedimiento dde transformaacin puede
eliminar de manera imaginaable cualquierr correlacin serial que see presentara
oriiginalmente.5 Por tanto, la ppresencia de una
u variable deependiente rezzagada en el
mo
odelo causa que
q las estimaaciones de loos parmetros por mnimoss cuadrados
ord
dinarios sean sesgadas, auunque permannezcan consisttentes.
Ahora analiccemos el probblema de estimacin cuanndo el trmin
no del error
siguue el patrn suugerido por ell Rezago geom
mtrico y porr los modelos de expectativas adaptable: ut = t wt -11. En este casso las estimacciones por mnimos cuadrad
dos ordinarios se vuelven inconsistentees y sesgadas. La dificultaad surge debido
o a que ut y Yt -1 estn corrrelacionados y esta correlaacin no desap
parece conform
me aumenta el
e tamao de la muestra (een el lmite en
e probabilid
dad). Disponem
mos de varios procedimient
p
os de estimaccin que impliican el uso de una tcnica
de variables insstrumentales o mxima verosimilitudd, pero son demasiado
com
mplejas para presentarlas
p
enn detalle aqu.6 Quiz el prrocedimiento ms simple
seraa usar la estim
macin' de varriables instrum
mentales con Xt -1 sirvienddo como un

5
Si t = wt -1+ ut, el proceso dde transformacinn producir el prooceso de error ut, el cual no est
auto
ocorrelacionado.
6
Vase, por ejeemplo, J. Kmentaa, Elements of Eco
onometrics (Nuev a York: Macmillaan, 1986), seccinn 11-4.

246

PARTE DOS: Mod


delos de regresin
n de una sola ecuacin

instrumento para Yt -1. Essto producira estimadores consistentes pero


p
no es prrobable que seean ineficienttes.
Por ltim
mo, consideraaremos una teercera especifi
ficacin del errror que impliica
correlacin serial de prim
mer orden, es decir,

Sin embarggo, una vez m


ms, las estim
maciones de llos parmetro
os por mnim
mos
cuadrados ordinarios
o
sern inconsistenntes y sesgadaas, con la direeccin del sesgo
de muestra grande relacionado en forma directa ccon el signo de .7 Tanto la
estimacin de variables iinstrumentalees como la estimacin de mxima
m
verosimilitud son
n alternativas disponibles. El proceso de estimaci
n de variablles
instrumentaales produce eestimadores co
onsistentes, ppero tienden a ser ineficienttes
dada la pressencia conocidda de correlaccin serial. Ell instrumento para remplazzar
Yt -1 puede obtenerse de una regresin de primeraa etapa en laa que Yt -1 es la
variable deppendiente y unna serie de vaalores rezagaddos de X form
ma las variablles
explicativass. La eficienciia de este estiimador puedee mejorarse sii se usan las eestimaciones del interceptoo y la pendieente, para obttener un estim
mado del coeficiente de coorrelacin seriial . Hacemoos esto calculaando los residduales asociaddos
con la estim
macin del intercepto y la pendientte. Una regr esin de u t en
e
ut -1 producee una estimaciin del coeficiiente de correelacin serial. Una vez que se
estima p, el proceso de ddiferenciacin
n generalizadaa puede usarsee para reestim
mar
los parmettros de la ecuaacin originaal (vase el caaptulo 6).

9.1.3

R
Rezago
distrribuido pollinomial

La formulaccin del rezaggo geomtrico


o es limitada ddebido a que plantea la hipptesis de un conjunto de pesos de rezzago declinanntes.8 Una foormulacin ms
m
general es ell modelo de rrezago distribu
uido polinomiaal. Este modeelo establece qque
los pesos deel rezago puedden ser especificados por unna funcin continua, la cuaal a
su vez puede ser aproxximada al evaaluar una funncin polinom
mial en punttos
discretos apropiados en eel tiempo. Por ejemplo, poddramos determ
minar, que wi =
c0 + c1i + c2i2 para i = 0, 1, 2, 3, .. ., 6 y wi = 0 para i menor que 0 y mayor quee 6.
Esto especiffica pesos de rrezago que siguen un polinnomio de segu
undo grado paara
los primeross seis valores rezagados y son
s 0 de otra m
manera. Los pesos
p
de rezago
podran apaarecer como sse muestra en la figura 9.2.
Cuando
o se especificaa un modelo de
d rezago distrribuido polinmico, debem
mos
asegurarnoss de que el graado del polinoomio es menoor que el nmero de trminnos
en el rezagoo distribuido menos
m
1 o no habr reduccin en el nm
mero de pa7
Vase Z.
Z Griliches, "A N
Note on the Seriall Correlation Biass in Estimates of Distributed Lagss",
Econometrica, vol.
v 29, pp. 65-73, 1971.
8
Es posibble, por supuesto,, permitir que los primeros trminnos de rezago seann estimados libree
mente e impon
ner la suposicin de rezago geomtrico en valores rrezagados de la variable
v
explicativva
ms all de loss primeros trminnos.

CAPT
TULO 9: Estimacin
n de una sola ecuaccin: temas avanza
ados

247

Figura 9.2

Pesos de rezag
go
distribuido
polinominal.

rm
metros de rezaago que se esttimarn.9 Sin embargo, la eleccin de reestricciones
de puntos extreemos es opcional. Si no deseamos
d
lim
mitar a que loos pesos de
rezzago sean 0 fuuera del intervvalo de rezagoo, una o ambaas restriccionees de puntos
exttremos puedeen eliminarse..
Para comprender cmo se
s estima el modelo
m
de rezzago distribu
uido polinomiaal, considrese el caso de uun polinomio de
d tercer grado con un rezaago de cinco
perriodos (sin resstricciones de puntos extrem
mos). La especificacin dell rezago es:

Suppngase que:

Al sustituir y reeescribir, se obbtiene;

Combinando loss trminos, teenemos:

9
Adems, el n
mero de observaaciones disponible debe ser mayorr o igual al grado del polinomio
mss 2. Las dos observaciones extra son necesarias si
s los puntos extrremos del rezago
o son fijos por
suposicin.

248

PARTE DOS: Modelos de regresin de una sola ecuacin

La ecuacin (9.22) se puede estimar por mnimos cuadrados ordinarios. Si el


trmino del error obedece las suposiciones clsicas de la econometra, las c estimadas sern mejores estimados lineales insesgados.10 (Una vez que se conocen
las c, el clculo de los pesos de rezago originales, las w, es un procedimiento
simple.) Los errores estndar para cada uno de los pesos de rezago pueden
obtenerse de la matriz varianza-covarianza de las c, pero los clculos son demasiado complicados para ser incluidos aqu. Las pruebas estadsticas que se
realizan, en general, deben hacerse por medio de la ecuacin estimada [ecuacin (9.22)] y no en forma directa por medio de la ecuacin especificada
[ecuacin (9.21 )].11

9.1.4

Eleccin del nmero de rezagos

Cundo especificamos un modelo de rezago distribuido (polinomial o de otra


clase), cmo debe decidirse cuntos rezagos incluir? sta es una pregunta de
especificacin del modelo y, como tal, no tiene una respuesta clara o simple.
Con frecuencia el nmero de rezagos a incluir en el lado derecho de una ecuacin puede determinarse, al menos en forma aproximada, a partir de la teora.
Por ejemplo, podramos esperar que la demanda de un producto fuera dependiente de los precios rezagados al igual que del precio actual del producto,
pero que slo los precios rezagados que se remontan hasta seis meses afecten la
demanda.
Sin embargo, en muchos casos, no queda claro con base slo en la teora
cuntos rezagos incluir en una ecuacin. Entonces, debemos observar los datos
para determinar el nmero "correcto" de rezagos. Hay varias formas para establecer esto.
Nos podemos enfocar en el uso de la R2 corregida para determinar cuntos
rezagos agregar. Recuerde que en el captulo 4 se seala que un problema por el
uso de R2 ordinaria como una medida de la bondad del ajuste es que no explica el
nmero de grados de libertad. (Agregar variables adicionales en el lado derecho
de una regresin siempre incrementar la R2.) La R2 corregida mide el pori

_______________________

10
Como se escribi, es imposible estimar en forma directa. Uno tan slo supone que = 1, al
permitir que los pesos de rezago estimados incorporen el efecto del parmetro verdadero . Para
estimar con restricciones en los puntos extremos necesitamos agregar restricciones a la ecuacin
(9.21) antes de hacer la estimacin en la ecuacin (9.22). Por ejemplo, para determinar la cola = 0,
estableceremos ws = 0 en la ecuacin (9-20). Luego sustituimos esta restriccin en la ecuacin (9.21) y
obtendremos una versin nueva de la ecuacin (9.22).
11
Pueden hacerse formulaciones de rezagos ms complejas con el uso de rezagos distribuidos
racionales. Vase A. Pagan, "Rational and Polynomial Lags", Journal of Econometrics, vol. 8, pp. 242-254,
1978. La literatura sobre expectativas racionales en econometra sugiere diversas especificaciones de
rezago posibles todas las cuales tienen la propiedad de que los parmetros de la distribucin rezagada
son endgenos y pueden cambiar con el tiempo. Vase R.J. Barro, "Unanticipated Money Growth and
Unemployment in the United States", American Economic Review, vol. 67, pp. 101-115, 1977.

CAPIT
TULO 9: Estimaccin de una sola eccuacin: temas avaanzados

249

cenntaje de variaanza en la varriable dependiiente (en oposicin a la vaariacin) expliicada por las variables
v
independientes:

Viimos en el capptulo 4 que laa R2 corregidaa se relacionaa con la R2 de la siguiente


maanera:

donde N es el nmero
n
de obsservaciones y k es el nmeero de variablles independieentes. Por connsiguiente, cuuando agregaamos variablees independientes adicionales a una regresin, R
2 puuede incremenntarse o dism
minuir. Por tannto, un mtoddo para selecccionar el nm
mero de rezagoos en un moddelo de rezagoo distribuido
es tan slo agreegar rezagos aadicionales haasta que la R2 corregida deeja de incremeentarse.
Otro proceddimiento es usaar el criterio de
d informacinn Akaike (AIC)):

doonde ^ i2 es laa suma de ressiduales cuadrrados. El AIC difiere de la R2 corregida


en que penalizaa ms fuerte lla adicin de variables en el lado dereccho (lo cual
redduce el nmerro de grados dde libertad). En
E principio, ppodemos seleeccionar una
esttructura de rezago incremeentando el nm
mero de rezaggos hasta el punto
p
en que
el AIC alcanza un
u valor mniimo.
Otra estadsstica que se rellaciona en forrma estrecha ccon el AIC es el
e criterio de
Sch
hwartz:

Essta frmula taambin penalliza la adicin de variablees en el lado derecho en


forrma ms fuerrte que la R2 ccorregida.
Obsrvese que la R2 corrregida, el AIIC ni el SC pproporcionan una prueba
esttadstica claraa para la compparacin de esspecificacionees de modelo alternativas.
Noo obstante, esstas estadsticas proporcionnan informacin que, cuanndo se combin
na con el juiciio, puede ayuudar a determiinar la especifficacin de unna estructura
de rezago.

250

PARTE DOS: Mod


delos de regresin
n de una sola ecu acin

EJEMPLO
O 9.1

Funcin de c onsumo

En el modello de la funcin de consum


mo agregado, es mejor asumir que el coonsumo en el periodo pressente Ct es unna funcin directa del ingrreso disponibble
personal Yt en
e el periodo presente y en
n periodos paasados, y la taasa de inters rt.
Esperaremos que una tasa de inters ms
m alta, sienddo otras cosass iguales, estaar
asociada conn ms ahorross y menos connsumo. Si regrresramos Ct en
e Yt y rt,, resuultara una estadstica DW
W baja, sealaando la presenncia de correllacin serial de
primer orden
n positiva. Poor esta razn, se tom la deecisin de estimar una form
ma
elemental dee la funcin dde consumo aggregado usanddo primero diiferencias y una
u
formulacinn de rezago distribuido
d
po
olinomial. El modelo, estiimado desde el
primer trimeestre de 19500 hasta el prim
mer trimestre de 1995, es:12

donde Ct = gastos de coonsumo persoonal trimestralles (miles de millones


m
de ddlares)
Ct = Ct - Ct - 1
Yt = ingreso
i
personnal disponiblee trimestral (m
miles de millonnes de dlaress)
Yt = Yt - Yt - 1
rt = promedio
p
trim
mestral de las tasas de interrs diarias de bonos de tesoorera
Un primer intento
i
para estimar
e
el mod
delo usando uun polinomio de tercer graddo
de cinco peeriodos sin restricciones dee puntos extremos produjoo los siguienttes
resultados de
d la regresinn (estadsticaa t entre parnntesis):

Los coeeficientes de loos rezagos pu


ueden interprettarse de la sigguiente maneraa.
Un incrremento de m
mil millones de dlares enn el cambio trimestral
t
en el
ingreso dispponible en eel tiempo preesente resultaar en un inccremento en el
cambio en el
e consumo dee 329 milloness en el primerr trimestre, 247 millones enn el
segundo trim
mestre, 181 millones
m
de dlares en el terrcer trimestre, etc. La tasa de
inters est relacionada inversamente
i
con los cam
mbios en el coonsumo, pero el
coeficiente no
n es significcativo desde el
e punto de viista estadstico.
____________
12

Este ejeemplo se basa en las variables GC, GYD y FYGM33 de la base de daatos Citibase.

CAPTULO 9: Estimacin de una sola ecuacin: temas ava


anzados

251

Si creemoss que el efectto de los cam


mbios en el inggreso disponiible personal
so
obre los cambbios en el connsumo no se sentirn
s
despuus de cuatro periodos, es
raazonable estabblecer la colaa de la distribuucin de rezago igual a 0 en
e el periodo
t - 5. Con prop
psitos ilustraativos, hemoss estimado de nuevo el moodelo usando
laa restriccin de
d la, cola ceroo. Los resultaados exhibidos en el siguien
nte resultado
dee regresin muestran
m
que laa restriccin de
d la cola ceroo tiene relativ
vamente poco
effecto, dado quue los pesos dde rezago veciinos ya estn cerca de ceroo. sta es una
coonsecuencia natural
n
del heecho de que las funcioness polinomialees son continuuas.

Po
or ltimo, connsidrese el reesultado de reegresin en el que tanto la cola
c como la
caabeza de la diistribucin dee rezagos se asume
a
igual a 0:

La restriccin del cero een la cabeza de


d la distribucin ha alteraddo un poco el
paatrn de los pesos
p
de los rrezagos. Si see hace una grrfica, los peesos ahora se
ap
proximaran a una estructuura en U invertida. Una vvez ms la restriccin del
ceero y la contiinuidad del poolinomio son determinantees decisivos del
d patrn de
reezago.

EJEMPLO 9.2

In
nversin en inv
ventario

En este ejempllo construimoos un modelo de regresin de una sola ecuacin


e
que
co
ontiene rezaggos distribuidoos polinomialles. El ejempllo estima el cambio
c
mensuual en los inventarios de faabricantes en las industriass de bienes duuraderos IND
(v
valor en libross al final del periodo)
p
como
o una funcinn de los embarrques SHD,

252

PARTE DOS: Mode


e los de regresin de una sola ecua cin

los pedidos no
n despachadoos UNOD y ell ndice de preecios al mayorreo WHD.13 S
Se
han usado loss datos mensuuales de enero de 1983 a maayo de 1987 y se ha llevado a
cabo una regrresin de rezaago distribuiddo polinomial.. En la figura 9.3 se presentta
una grfica de los valorees estimados y reales del cambio en los
l inventarioos
duraderos dee los fabricanntes. A continnuacin se muuestran los reesultados de la
l
estimacin, con
c la estadsstica t entre paarntesis:

Obsrvesse que la form


ma final de laa ecuacin exxpresa la relaacin de invenntarios con em
mbarques com
mo un polinom
mio de tercer grado; el pollinomio definne,
entonces, 25 coeficientes dde embarquess actuales y reezagados. Se incluye
i
el nivvel
rezagado de inventarios, se introduce el ndice de pprecios al maayoreo como el
cambio mensual (promeddiado durante dos meses) y se agregan los pedidos no
n
despachadoss usando el caambio mensuual (promediaado durante seeis meses).

13
Se usaroon las siguientes series de datos Cittibase: inventarios de fabricantes de
d bienes duraderoos
(IVMD), embarrques de bienes duraderos (MD
DS), pedidos no despachados dee bienes duraderoos
(MDU) y el nddice de precios al productor para todos
t
los bienes duraderos
d
(PWM
MD).

CAPT
TULO 9: Estimacin de una sola ecua
acin: temas avan
nzados

253

Figura 9.3

Cambio en los
inventarios del
fabricante en
industrias de
bienes duraderros
(millones de
dlares).

Un examen
n del patrn dde los coeficieentes de rezaago muestra que
q hay una
resspuesta rezagaada de inventaarios de los faabricantes a loos cambios enn los embarquees de bienes duraderos.
d
Loos inventarioss declinan al pprincipio peroo luego son
aum
mentados en forma
f
gradual con el paso del tiempo, allcanzando su mximo 10
meeses despus de
d un increm
mento en los embarques. Luuego, los inveentarios declinnan en formaa continua a lo
l largo de loos 14 meses rrestantes. Obbserve en la
figgura 9.3 que lo
os valores proonosticados dee la regresin son en cierta medida una
verrsin "suavizada" de la serrie real. ste es un patrn tpico cuanddo se usa un
rezzago distribuido largo com
mo parte de la especificacin de un modeelo.

9.2

PRUEBAS
R
PA
ARA CAUSA
ALIDAD
Unn problema coomn en econnoma es determinar si los cambios en una
u variable
son
n una causa dee los cambioss en otra. Por ejemplo,
e
los cambios en el suministro
de dinero causaan cambios enn el PIB, o ell PIB y el suuministro de dinero
d
estn
detterminados am
mbos en form
ma endgena?? Un proceso para resolverr problemas
de este tipo es la
l prueba paraa causalidad introducida
i
por Granger y Sims.14
La idea bsiica es muy sim
mple: si X cau
usa Y, entonces los cambioss en X deben
preeceder a los cambios en Y. En particular,, para decir quue "X causa Y',', deben
14
Vase C.W.J. Granger, "Inv estigating Causal Relations by E
Econometric Mod
dels and CrossSpeectral Methods", Econometrica, vol.
v
37, pp. 424-4
438, 1969, y C.A
A. Sims, "Moneyy, Income, and
Cauusality", American
n Economic Revieew, vol. 62, pp. 540-552, 1972. Paraa un ejemplo de suu relacin con la
literratura de expectaativas racionales, vase T.J. Sargennt, "A Classical Macroeconometric
M
c Model for the
Uniited States", Journnal of Political Ecconomy, vol. 84, pp. 207-238, 1976, y T.J. Sargent,, "Estimation of
Dynnamic Labor Dem
mand Schedules unnder Rational Exppectations", Journal of Political Eco
onomy, vol. 86,
pp. 1009-1044, 19788.

254

PARTE DOS: Mod


P
delos de regresin
n de una sola ecua
acin

cumplirse do
os condicionees. Primera, X debe ayudar a predecir Y; es decir, en una
u
regresin dee Y contra vallores pasadoss de Y, la adiccin de valorees pasados dee X
como variaables indepen
ndientes debeer contribuirr de manera significativa al
poder expliccativo de la rregresin. Seg
gunda, Y no d
debe ayudar a predecir X. La
razn es quee si X ayuda a predecir Y y Y ayuda a pred
decir X, es pro
obable que unaa o
ms variablles distintas, de hecho, esstn "causand
do" los camb
bios observad
dos
tanto en X como
c
en Y.
Para ev
valuar si cadaa una de estaas dos condicciones se cum
mple, deseam
mos
probar la hiiptesis nula de que una variable
v
no ay
yuda a predeccir a la otra. Por
P
ejemplo, paara probar la hiptesis nulla de que "X
X no causa Y"", regresamoss Y
contra valorres rezagados de Y y valorees rezagados d
de X (la regressin "sin restrriccin" ) y lueego ejecutarem
mos la regresin de Y slo ccontra valoress rezagados dee Y
(la regresin
n "restringida"). Una prueb
ba F simple pu
uede usarse paara determinarr si
los valores rezagados
r
de X contribuyen de manera sig
gnificativa al poder
p
explicatiivo
de la primeraa regresin.15 Si lo hacen, po
odemos rechazzar la hiptesiis nula y conclluir
que los dato
os son consisteentes con que X causa Y. La hiptesis nu
ula de que "Y no
causa X" see prueba luego
o de la mismaa manera.
Para prrobar si X caausa Y, procederemos de la
l siguiente forma.
f
Primerro,
probaremoss la hiptesis nula "X no caausa Y" ejecu
utando dos reg
gresiones:
Regresin sin restriccin:
r

(9.23
3a)

Regresin resttringida:

(9.23
3b)

y usamos laa suma de ressiduales cuadrrados de cadaa regresin paara calcular u


una
estadstica F y probar ssi el grupo de
d coeficientess 1, 2, , m son signiificativamentee diferentes dee cero. Si lo son,
s
podemoss rechazar la hiptesis
h
de que
q
"X no causaa Y".
Segund
do, probaremos la hiptesis nula de que ""Y no causa X"
X ejecutando las
mismas regrresiones anterriores, pero co
onmutando X y Y y probando si los valo
ores
rezagados de
d Y son sign
nificativamentte diferentes d
de cero. Paraa concluir quee X
causa Y, debemos rechazzar la hiptesiis "X no causaa Y" y aceptaar la hiptesis "Y
no causa X".
Ntese que el nmerro de rezagoss m en estas rregresiones ess arbitrario y se
reduce a un
n problema dee juicio. Por lo
l general, es mejor ejecuttar las pruebaas
15

Recurrdese del captuloo 4 que la estadsttica F es como siggue:

donde ESSR y ESSUR son las sumas de residuuales al cuadrado en las regresionnes restringida y sin
restriccin, resppectivamente; N es el nmero de observaciones; k es el nmero dee parmetros estim
mados en la regreesin sin restricciin; y q es el nm
mero de restricciiones del parmeetro. Esta estadsttica
est distribuida como F(q, N - k).

CAPT
TULO 9: Estimaci
n de una sola ecu
uacin: temas avan
nzados

255

parra unos cuanttos valores differentes de m y asegurarsee de que los reesultados no


sonn sensibles a la eleccin de
d m. Adems, observe quue una debiliidad de esta
pruueba de causaalidad es que una
u tercera vaariable Z podrra estar causaando Y pero
podra tambin estar correlaccionada conteemporneameente con X Un
na forma de
ocu
uparse de estaa posibilidad es ejecutar reegresiones en las que los valores
v
reza16
gad
dos de Z tambbin aparezcaan en el lado derecho.
d

EJEMPLO 9.3
3

El petrleo y la economa
e

Du
urante las dccadas de 19700 y 1980 el mundo
m
experim
ment cambios abruptos
en el precio del
d petrleo. Debido al papel
p
importante que dessempea el
petrleo en las economas inndustrializadaas, esta "conm
mocin petroolera" puede
tenner implicacciones macrroeconmicass importantees. Considerremos, por
ejeemplo, las reccesiones de 19975 y 1980. Los
L saltos proonunciados enn los precios
del petrleo, qu
ue ocurrieronn en 1974 y 1979-1980, contribuyeron en forma
claara con aqueellas recesionnes, y lo hiccieron en divversas formaas. Primero,
cau
usaron una reduccin enn los ingresos nacionalees reales de los pases
im
mportadores de
d petrleo. S
Segundo, con
ndujeron a "eefectos de aju
uste", inflaci
n y un desceenso mayor en el ingres y produccin reales resultantes de las
rig
gideces que im
mpidieron quue los salarioos y los preciios que no erran de energticos entrarann en equilibriio con rapideez.17
Los precioss del petrleoo haban flucctuado antes del salto quee ocurri en
19
974. En un estudio del imppacto macroeeconmico, Jaames Hamilto
on demostr
qu
ue los datos ap
poyan la hipttesis de que los cambios enn los precios del petrleo
haban sido unaa causa de loos cambios enn el PIB y ottras variabless macroeconmicas clave a lo largo del pperiodo de possguerra.18 Aquu reportamoss sus pruebas
de causalidad reelacionando loos cambios en
e el precio ddel petrleo, P
t , con los
cam
mbios porcenntuales en el PIB real, log(P
PIBt/PIB t -1).
Hamilton ejjecut la regresin OLS:

16
Para un exaamen crtico de llas pruebas de caausalidad Granger-Sims, vase R. L. Jacobi, E.E.
Leaamer y M.P. Ward
d, "The Difficultiees with Testing fo
or Causation", Ecoonomic Inquiry, vool. 17, pp. 401 4133, 1979, y E.L. Feige y D.K. Pearrce, "The Causal Relationship betw
ween Money andd Income: Some
Cavveats for Time Series Analysis", Reeview of Economiics and Statistics, vol. 61, pp. 521-5
533, 1979. Adems, para una expliccacin ms generral y reciente de las
l leyes causaless y su observacinn, vase C.W.J.
Graanger, "Some Reccent Developmentts in a Concept off Causality", Jourrnal of Econometrrics, vol. 39, pp.
1999-211, 1988; A. Zellner, "Causality and Causal Lawss in Economics", JJournal of Econom
metrics, vol. 39,
pp. 7-21, 1988; y J.W
W. Pratt y R. Schllaifer, "On the Intterpretation and O
Observation of Laaws", Journal of
Eco
onometrics, vol. 39, pp. 23-52, 1988.
17
Para una exp
posicin detallad a de estos efectos, vase R.S. Pin dyck y J.J. Roten
nberg, "Energy
Shoocks and the Maccroeconomy", enn A. Alm y R. Weeiner (eds.), Mannaging O Shockss, Cambridge:
Balllinger, 1984.
18
J.D. Hamiltoon, "Oil and the Macroeconomy
M
sinnce World War II ", Journal of Poliitical Economy,
voll. 91, pp. 228-2488, 1983.

256

P
PARTE
DOS: Mod
delos de regresin
n de una sola ecua
acin

primero estaablecemos quee zt = Pt y xt = log(PIBt /P


PIBt -1) y luegoo viceversa. Los
L
resultados para
p dos muesstras previas a 1973 de datoos trimestralees, primero paara
m = 4 y lueg
go para m = 8, se muestraan de la siguieente manera:19

Obsrveese que la hipptesis H2, que los cambioss en el precio del petrleo no
causan los cambios
c
en el
e PIB real, ess rechazada fu
fuertemente en ambos casoos,
mientras quee la hiptesis H1 , que los caambios en el P
PIB real no caausa los cambiios
en el precioo del petrleoo, no puede reechazarse. Estos resultados, junto con los
l
otros que presenta
p
Ham
milton, proporrcionan evideencia de una relacin fuerrte
entre los preecios del petrleo y la econ
noma.

EJEMPL
LO 9.4

Cul fue primero: la gallin


na o el huevo?
?

sta es unaa pregunta que. ha atormen


ntado a los huumanos desdde los das de la
primera torttilla de huevoo. Un estudio de Thurman y Fisher, en el
e cual se usarron
pruebas de causalidad, yya ha arrojadoo por fin algunna luz sobre el
e problema.20
El estuddio hace uso de datos anuaales sobre dos variables: produccin
p
tootal
de huevo enn Estados Unnidos (EGGS
S) de 1930 a 1983 y prod
duccin total de
gallinas en Estados Uniddos (CHICKE
ENS) para el m
mismo perioddo. La prueba es
simple. Se ejecuta
e
la reggresin de EG
GGS sobre EG
GGS rezagadaa y CHICKEN
NS
rezagada; sii los coeficienntes en CHIC
CKENS rezaggada son signnificativos com
mo
grupo, enton
nces las gallinnas causan a los huevos. P
Para concluir, cul de los dos
d
"fue primero
o", es necesarrio encontrar causalidad unnidireccional, es decir, rechhazar la no cauusalidad de unno hacia el ottro y al mismoo tiempo fallaar en rechazarr la
no causaliddad del otro hacia el uno.
Los ressultados de T
Thurman y Fisher
F
fueron dramticos. Si se usan los
l
rezagos quee variaban de 1 a 4 aos, obbtuvieron un rechazo claroo de la hiptesis
de que los huevos
h
no cauusan a las galllinas pero fueeron incapacees de rechazarr la
hiptesis dee que las galliinas no causaan a los huevoos. Por tanto
o, pudieron cooncluir que el huevo fue prrimero!
Thurmaan y Fisher suugieren que esta metodologa podra applicarse tambiin
a otras cuestiones fundamentales. Por
P ejemplo, podran usarrse pruebas de
d
19
La
20

e s t a d s t i c a r e p r e se n t a u n a p r u e b a F d e b 1 b 2 = = b m = 0 .
Este ejeemplo fue extraddo de W. N. Thurm
man y M. E. Fishher, "Chickens, Eg
ggs, and Causalityy,
or Which Carnee First?", Americaan Journal of Agrricultural Ecanom
mics, pp. 237-238,, mayo de 1988.

CAPT
TULO 9: Estimaci
n de una sola ecu
uacin: temas avan
nzados

257

cau
usalidad paraa probar si es verdad que "El
" que re al ltimo re mejor"
m
y para
proobar la multivvariada "El orggullo precedee a la destrucciin, y un espritu altanero
preecede a una cada".
c
Esperaamos reportarr los resultadoos de estas prruebas en la
sig
guiente edicin de este librro.

9.3

OBSERVACIO
B
ONES FALTA
ANTES
Co
on frecuenciaa el trabajo em
mprico se coomplica, por el hecho de que pueden
falltar las observ
vaciones paraa una o ms variables.
v
Daddo que no hayy una mejor
maanera para traatar con el prooblema de las observacionees faltantes, prrocedemos a
exponer algunaas de las cuesstiones relevaantes y sugerrimos algunass soluciones
po
osibles.
Supngase que el modello de regresin est dado por:
p
(9.24)
Si se dispone dee N observaciiones tanto paara X como paara Y, el estim
mador de mnim
mos cuadradoos de la penddiente es:

(9.25)

d
nde X
N y Y
N representan las medias mustrales
m
calcculadas para las primeras
N observacioness. Supngase que se dispon
ne d M obserrvaciones adiccionales para
la variable depeendiente pero que hay M observaciones
o
faltantes paraa la variable
ind
dependiente.211 Una solucin sencilla paara el problem
ma de las obbservaciones
falltantes es sim
mplemente no considerar lass ltimas M oobservacioness de Y. Si las
ob
bservaciones eliminadas
e
soon aleatorias, el estimador d la pendiennte de mnimo
os cuadrados seguir sienddo un estimad
dor insesgadoo y consistentte de 2 Y el
n
nico efecto de eliminar las observacionees es una prddida de eficien
ncia. En general, entre mss cerca estn llas X faltantess d la media m
muestral y enttre menor es
la varianza muuestral de las X faltantes, ser menor la prdida de
d eficiencia
cauusada por elim
minar las observaciones.
Si faltan muchas
m
observvaciones, la prdida de eficciencia potenccial necesita
unna alternativa a slo eliminnar las observvaciones incom
mpletas. Si see dispone de
alg
gn conocimiento a priori, la mejor alterrnativa puede ser asignar valores para
21

En la mayorr parte de los estuddios de corte transsversal la falta dee disponibilidad dee observaciones
de la variable dep
pendiente hace qque sea intil Cualquier
C
inform
macin acerca dee las variables
expplicativas. En el anlisis
a
de series de tiempo, las obbservaciones de la variable depenndiente faltantes
preesenta un problem
ma serio y necessita una solucin.

258

PARTE DOS: Modelos de regresin de una sola ecuacin

las observaciones faltantes. Si no se dispone de informacin a priori, debe encontrarse otra solucin. El procedimiento ms natural es remplazar las observaciones faltantes por la media muestral de las observaciones de X disponibles. Este
enfoque de orden cero es equivalente a hacer la regresin de X en una constante y
asignar, a cada observacin faltante, el coeficiente estimado.
Dentro del modelo de dos variables no es difcil mostrar que la sustitucin
de las medias de las variables por las observaciones faltantes no cambia al estimador de pendiente de mnimos cuadrados o su varianza. Sin embargo, se puede
observar que si generalizramos el modelo a uno que contuviera diversas
variables independientes, slo una de las cuales tuviera observaciones faltantes, el
procedimiento de sustitucin descrito aqu podra producir estimadores de
pendiente diferentes y una mejora en la eficiencia.22
En la prctica, es improbable que sea realista la suposicin de que las observaciones faltantes son aleatorias. Por ejemplo, en un estudio en el que se relacionan los gastos en automviles con el ingreso, puede haber observaciones
faltantes para los individuos de bajos ingresos, quienes tienden a gastar poco en
automviles. Eliminar las observaciones o usar la media muestral de X para
remplazar observaciones faltantes no es un procedimiento correcto, debido a
que no se toma en cuenta la correlacin conocida entre el ingreso y los gastos.
De manera equivalente, al hacer anlisis de series de tiempo, debemos tomar en
cuenta el hecho de que la mayor parte de las variables de series de tiempo
tienden a experimentar tasas de crecimiento relativamente predecibles. Para
hacer esto, debemos buscar variables sustituas que estn altamente correlacionadas con las variables cuyas observaciones faltan.
Una solucin elemental para el problema de las series de tiempo implicara
remplazar las observaciones faltantes con observaciones sustituas obtenidas de
ajustar la regresin de los valores conocidos de la variable independiente sobre el
tiempo y luego remplazar las observaciones faltantes con los valores ajustados de
la regresin. Este procedimiento slo es uno de varios mtodos en los que se
pueden remplazar las observaciones faltantes por medio de la interpolacin de la
variable X. Si la variable de tiempo no est correlacionada con el trmino del error en la
ecuacin original produce estimadores consistentes de los parmetros. Este
proceso es ms til debido a que sugiere un enfoque de primer orden ms general
para el problema de las observaciones faltantes.
Supngase que un conjunto de "instrumentos", Z2, , Zk, est disponible
con respecto a la variable con observaciones faltantes. Se presume que los instrumentos estn altamente correlacionados con la variable X y no estn
correlacionados con el trmino del error . Para poder incrementar la eficiencia
de los estimadores de los parmetros originales mientras mantenemos la consistencia se procede de la siguiente forma:
22
Vase Y. Haitovsky, "Estimation of Regression Equations When a Block of Observations Is
Missing", Proceedings of the American Statistical Association, Business and Economics Statistics Section,
1968; A. A. Afifi y R. M. Elashoff, "Missing Observations in Multivariate Statistics II. Point Estimates in
Simple Linear Regression", Journal of the American Statistical Association, vol. 62, pp. 10-29, 1967; y M.G.
Dagenais, "The Use of Incomplete Observations in Mltiple Regression Analysis", Journal of
Econometrics, vol. 1, pp. 317-328, 1973.

CAPT
TULO 9: Estimaci
n de una sola ecu
uacin: temas avan
nzados

259

Primero, lleevamos a caboo la regresin


n de X sobre eel conjunto dee instrumentoss para todas laas observacioones con inforrmacin comppleta:

Luuego calculam
mos valores ajuustados para las
l observacioones faltantes:23

En
ntonces podem
mos volver a estimar
e
la ecuuacin final coomo sigue:
(9.27)
donnde

(9.28)
En
n tanto los insstrumentos seean elegidos en
e forma corrrecta, la estim
macin de la
ecuuacin (9.27)) producir unn estimador de
d pendiente consistente.
Hay varios problemas
p
asoociados con este procedimiento. Uno de ellos es que
lass varianzas de
d error asociiadas con observaciones faltantes
f
sern mayores
que las varianzaas de error restantes; [de laa ecuacin (99.28)]:

Un
na tcnica ms refinada usaara mnimos cuadrados poonderados parra ajustar la
prrdida de eficiiencia asociadda con heteroccedasticidad. Otro problem
ma es la posibbilidad de quee falten obserrvaciones para ms de unaa variable inddependiente.
Lu
uego debe ejeecutarse una sserie de regreesiones para llenar las observaciones
falltantes. Por desgracia, el oorden de estos procedimieentos puede afectar
a
a los
parrmetros estim
mados. Por lttimo, a menuddo es difcil la eleccin de innstrumentos
aprropiados. Si uno
u o ms insstrumentos esttn correlacioonados con el trmino del
errror, se introduucir el error dde medicin (una
(
forma dee errores en laas variables)
cuaando las obseervaciones faaltantes son remplazadas
r
ppor observacciones de la
varriable sustitua construida.. Para mayorres detalles, el
e lector podrr revisar el
cap
ptulo 12, en el que se exxponen los errrores en las vvariables y laas variables
insstrumentales.
23

En el anlisiss de series de tiem


mpo es improbablee que falte el ltim
mo conjunto de obbservaciones. El
anlisis es bastante general,
g
sin embaargo, debido a quee tan slo necesitaamos reacomodarr la numeracin
de las observacionees de manera aproopiada y todos lo
os resultados se dderivarn.

260

P
PARTE
DOS: Mod
delos de regresin
n de una sola ecua
acin

EJEMPLO
O 9.5

Ayuda a los estados


e

Para entendeer cmo la ayyuda federal a los estados affecta sus decisiones de gastto,
los economiistas de finannzas pblicas a menudo esstiman modelos de regresin
en los que lo
os gastos estaatales (y/o locaales) son deteerminados porr diversas caraactersticas finnancieras y demogrficas importantes dde un estado particular. Una
especificacin bastante simple de ese modelo es:

donde EXP = gastos estattales agregado


os en 1972
POP = poblacin del estado enn 1972
AID = subsidios federales
f
totaales para cada estado en 1972
INC = ingreso peersonal agregaado en el estaado en 1970
Estimamos el modelo dee determinanttes del gasto usando
u
datos para los 50 eestados en Estados Unidoss, obteniendo el siguiente rresultado (esttadstica t enttre
parntesis):

Luego, com
mo una demosstracin de la forma de trattar el problem
ma de las obseervaciones falltantes, asum
mimos que lass cinco ltimaas observacioones en INC no
estaban dispponibles. Por consiguientee, intentaremoos tres proced
dimientos. Enn el
primero, tann slo eliminam
mos las cincoo ltimas obseervaciones dell modelo. Mieentras que en el segundo ccaso, remplazzamos las observaciones faltantes
f
con la
media de IN
NC dentro de lla muestra conocida de 45 observacionees. Para el terccer
ejemplo, se usar el procceso de primeer orden sugerrido para rem
mplazar observvaciones faltanntes llevando a cabo la regrresin de INC
C sobre POP y AID dentro de
la muestra de
d 45 observaaciones. (La reegresin fue IINC = -.7 x 109 + 4.63AID
D+
4 162POP.) Luego pronoosticamos INC
C para las cinnco observacioones restantess y
remplazamoos las observaaciones faltanttes con los vaalores pronosticados. Los rer
sultados de la regresin een cada uno de
d los tres procedimientos de
d correccin se
incluyen jun
nto con los reesultados origginales en el ssiguiente cuaddro.

CAPTULO 9: Estimacin de una sola ecuacin: temas avanzados

261

En este caso en particular (nuestros resultados no siempre se sostienen),


encontramos que el primer procedimiento de omitir las observaciones tuvo relativamente poco efecto en los resultados de regresin. Sin embargo, remplazar
las observaciones faltantes por la media de INC tuvo un impacto considerable,
causando que los resultados estimados difirieran de los originales. Finalmente,
el procedimiento de primer orden produce resultados muy buenos, con el coeficiente en AID volvindose muy cercano al coeficiente asociado con la muestra
completa. Por qu el segundo procedimiento no funcion en este caso? Una
respuesta parcial puede obtenerse comparando los valores usados para remplazar las observaciones faltantes con los datos originales (todos los valores
estn en miles de millones de dlares).

Observacin
46
47
48
49
50

INC

Orden cero

15.7
9.5
103.8
1.7
4.2

17.9
17.9
17.9
17.9
17.9

Primer orden
15.4

9.4
102.1
.5
2.4

Es evidente que, en este caso (con INC variando en forma tan amplia de un
estado a otro), los valores pronosticados de INC estn mucho ms cerca de los
originales que la media de INC, y el procedimiento de primer orden funciona
mejor. Sin embargo, enfatizamos que este ejemplo no se generaliza. Definir cul
de estas tcnicas elementales es ms apropiada depende de la capacidad del
modelo de uno para explicar en primer lugar por qu ocurrieron las observaciones
faltantes. Adems, en todos los procedimientos de correccin se consumi
informacin muestral y, por consiguiente, grados de libertad. Por tanto, en el
segundo y tercer procedimiento se exagera la significacin estadstica de los
resultados debido a que no explican, en forma directa, el hecho de que las
regresiones preliminares fueron ejecutadas para obtener los datos faltantes.

9.4

EL USO DE DATOS DE PANEL


Un conjunto longitudinal, o datos de panel, es el que incluye una muestra de
individuos (hogares, empresas, ciudades, etc.) durante un periodo. Como resultado, este conjunto puede incluir numerosas observaciones sobre cada individuo
en la muestra. Un conjunto de datos de panel puede ser til debido a que le
permite al investigador clasificar efectos econmicos que no pueden distinguirse
slo con el uso de datos de corte transversal o de series de tiempo.

262

PARTE DOS: Modelos de regresin de una sola ecuacin

Como un ejemplo, supngase que estamos modelando la rentabilidad de


empresas en una industria. En una regresin basada en datos de corte transversal
para un solo ao se podran incluir variables explicativas como la calidad de la
administracin, la cantidad de capital fsico, el empleo de mano de obra y el
grado de ventaja financiera. Este modelo de corte transversal como inicio puede
tomar en cuenta cualesquiera economas a escala que la empresa pueda disfrutar.
Sin embargo, el modelo no puede explicar ninguna rentabilidad incrementada
que pueda ocurrir con el tiempo conforme se hacen mejoras tecnolgicas en la
industria. En principio, el uso de datos de panel puede permitir al investigador
separar el impacto de las economas a escala del impacto del cambio tecnolgico.
En efecto, el conjunto de datos de panel nos permite estudiar tanto los cambios
en los beneficios de una sola empresa a lo largo del tiempo como la variacin en
los beneficios de muchas empresas en un punto dado en el tiempo.
El uso de datos de panel tambin puede tener otras ventajas. La primera, es
que los conjuntos de datos de panel, por lo general, proporcionan un nmero
incrementado de puntos de datos, y esto genera grados de libertad adicionales.
En la segunda, la incorporacin de informacin que relaciona a variables de
corte transversal y de series de tiempo puede disminuir de manera considerable
los problemas que surgen cuando hay un problema de variables omitidas.24 Por
ejemplo, tenemos que un investigador est interesado en que las empresas que
disfrutan de mejoras tecnolgicas son capaces de incrementar el uso de capital
fsico en su produccin. Un anlisis de corte transversal, el cual no podra explicar
el progreso tecnolgico, puede estimar en forma imprecisa el efecto del incremento de capital en la rentabilidad de una empresa. Sin embargo, con los
datos de panel, el componente de series de tiempo de los datos puede usarse
para incorporar el efecto de la mejora tecnolgica en la rentabilidad y por tanto
desaparece el problema potencial de las variables omitidas.
El proceso de combinar datos de corte transversal y de series de tiempo para
formar un panel se llama combinacin. De manera caracterstica, los parmetros
de corte transversal pueden cambiar con el tiempo de una manera que no se
refleja en la eleccin de variables explicativas de series de tiempo, o los individuos pueden variar en formas importantes dentro del corte transversal de tal
forma que no se refleja en la eleccin de variables de corte transversal. Como
resultado, el uso de datos de panel aade una dimensin de dificultad nueva al
problema de la especificacin del modelo; con los datos de panel es probable que
el trmino de perturbacin consista en perturbaciones relacionadas con la serie
de tiempo, perturbaciones del corte transversal y una combinacin de ambas.
En las subsecciones siguientes consideramos varias alternativas que han
demostrado ser tiles en el estudio de los datos de panel. La presentacin se
confina a una especificacin de regresin de dos variables para mantener las
cosas lo ms simples posible.

24
Para una exposicin minuciosa de los datos de panel, vase C. Hsiao, Analysis of Panel Data
(Cambridge: Cambridge University Press, 1986).

CAPTU
ULO 9: Estimacin de una sola ecuacin: temas avanzzados

9.4
4.1

263

Estim
macin de m
modelos con
n datos de p
panel

La primera tcnnica para el uso de datos de


d panel tan slo combinaa todos los
dato
os de series dee tiempo y corrte transversall y luego estim
ma el modelo subyacente
utiliizando mnim
mos cuadradoss ordinarios. Un
U segundo pprocedimientoo implica el
recoonocimiento de
d que las varriables omitid
das pueden coonducir a cam
mbios en los
inteerceptos del coorte transverssal y de la seriie de tiempo. Los
L modelos con
c efectos
fijoss agregan varriables indicaadoras para permitir estos interceptos cambiantes.
c
Unaa tercera tcnnica mejora laa eficiencia del
d primer prooceso de estim
macin por
mnnimos cuadraddos explicanddo las perturbbaciones del ccorte transverrsal y de la
serie de tiempo. El modelo dee efectos aleattorios es una variacin del proceso de
estimacin por mnimos
m
cuadrrados generaliizados descritoo en el apndiice 6.1. Por
ltim
mo, consideraaremos tcnicas que explicaan el hecho dee que el trmin
no del error
pueeda estar correelacionado a llo largo del tiempo y a lo largo de las unnidades del
cortte transversall. Una vez ms
m una variaacin de la estimacin
e
po
or mnimos
cuaadrados generaalizados proporciona una solucin
s
til aal problema.
Connsidrese el modelo
m
de doss variables:

don
nde N es el nmero de uniidades del corrte transversaal (individuoss) y T es el
nm
mero de periodos. Si se cum
mplen todas las
l suposicionnes del trminno del error
clssico, podram
mos estimar regresiones de corte transverrsal separadass, con cada
regrresin implicaando N observvaciones. Paraa el periodo t = 1 la regresin de corte
trannsversal sera

Porr tanto, se tiene un total de T de estas ecuaaciones. Del m


mismo modo, podramos
estimar N regresiiones de seriees de tiempo con
c T observaaciones en cad
da una. Sin
emb
bargo, si tantoo como sonn constantes a lo largo del ttiempo y a lo largo
l
de las
unid
dades del corrte transversall, pueden obteenerse estimaadores de los parmetros
p
mss eficientes all combinar toddos los datos de
d modo que se ejecute unna regresin
com
mbinada grandde con NT obbservaciones. En esta tcniica de combinnacin ms
elem
mental habr NT - 2 gradoos de libertadd (dado que laa estimacin de los dos
parmetros usa 2 grados de liibertad).

9.44.2

Modeelo de efectoos fijos

La dificultad con el procedim


miento de com
mbinacin dee mnimos cuuadrados es
quee la suposici
n de interceppto y pendiennte constante ppuede ser no razonable.
La generalizacin obvia es inttroducir variab
bles indicadorras que permittan que el

264

PARTE DOS: Modelos de regresin de una sola ecu


uacin

trmino del intercepto vaare a lo largo del tiempo y a lo largo de las unidades del
d
corte transv
versal. Si las pendientes variaron
v
tambbin, cada reggresin de coorte
transversal separada im
mplicara un modelo
m
distinnto y la com
mbinacin seera
inapropiada.25 Escribimoss el modelo de efectos fijos dde la siguiente forma:
(9.229)
donde

Se ha agreggado (N - 1) + (T - 1) vaariables indicadoras al moodelo y tambiin


hemos omitido las doss restantes, dado que suu adicin ressultara en una
u
colinealidad
d perfecta enttre las variablles explicativaas. Si este moodelo fuera esstimado usand
do mnimos ccuadrados orddinarios, se obbtendran estiimados insesggados y consiistentes de toddos los parm
metros (incluyyendo la penddiente ). Estaara
implicado un
u total de NT
T - 2 - (N - 1) - (T - 1), o NT
N - N - T, graados de libertad.
Los coeficieentes de la vaariable indicad
dora medirann el cambio en
n los intercepptos
del corte traansversal y laa serie de tiem
mpo (con respeecto al primerr individuo enn el
primer periiodo). Para ver esto, podeemos eliminarr las variablees indicadorass y
reescribir ell modelo asocciado con cad
da una de las N
NT observaciiones:

25
La conncesin para la vaariacin aleatoria en parmetros dee pendiente se hacce en la literaturaa del
modelo de coeeficientes aleatoriios. Vase, por ejjemplo, W. H. Greene,
G
Econometric Analysis (Nuueva
York: Macmillan, 1990), seccin 16.4.

CAPT
TULO 9: Estimaci
n de una sola ecu
uacin: ternas avan
nzados

265

El efecto de loss coeficientes 1 y 1 faltan


ntes es explicaado en el parmetro , el
cuual es el interccepto de la priimera ecuacin. Luego, cadda uno de los es medido
lueego en funcin de las desvviaciones de 1 (y los en funcin de desviaciones
d
dee 1) Y por tannto del interceepto "verdadeero" .
La decisinn de agregar variables inddicadoras pueede tomarse con
c base en
pruuebas estadstticas. La pruebba implica unaa comparacinn de la suma de
d cuadrados
deel error asociaada con las doos tcnicas de estimacin. Dado que ell modelo de
mnimos cuadraados ordinariios incluye ms
m restriccionnes de parm
metros que el
moodelo de efecctos fijos (loss interceptos estarn
e
restrinngidos a ser iguales a lo
larrgo del tiempo
o y entre indivviduos), esperraramos que la suma de cu
uadrados del
errror fuera mayyor para el moodelo de mniimos cuadradoos ordinarios.. Si el incremeento en la sum
ma de cuadraddos del error no es significcativo cuandoo se agregan
lass restriccionees, concluimoos que las resstricciones soon apropiadass, y pueden
applicarse los mnimos cuadrrados ordinariios. Si la sum
ma de cuadraddos del error
cam
mbia en form
ma considerablee, optamos po
or el modelo de
d efectos fijos. La prueba
esttadstica aproopiada es:

doonde, ESS1 y ESS


E 2 son la suuma de cuadrrados del erroor en los que se
s utilizan el
mo
odelo de mniimos cuadraddos ordinarios y el modelo de efectos fijos, respectivaamente. En la hiptesis nulla de que las restriccioness de interceptoo igual sean
coorrectas, la estadstica
e
F sigue la di stribucin F con N+T-22 y NT-N-T
graados de liberttad,
Hay varios problemas associados con el uso del moodelo de efecctos fijos. El
priimero, es que el uso de inddicadoras no iddentifica en foorma directa lo
l que causa
qu
ue cambie la ln
nea de regresiin a lo largo del
d tiempo y eentre individuoos. Segundo,
la tcnica de vaariables indicaadoras usa un
na cantidad coonsiderable de
d grados de
libbertad (N + T - 2 en nuuestro modeloo). Por ejempplo, el uso de
d variables
ind
dicadoras parra un estudio de 15 empressas a lo largo de un perioddo de 4 aos
im
mplicara una reduccin
r
de grados de libeertad de 58 a 41, que no ess un nmero
inssignificante. Siendo
S
esto as,
a los investtigadores, conn frecuencia, especifican
mo
odelos que slo incluyen eefectos fijos de
d corte transvversal.

9.4.3

Modelo de efecctos aleatorios

Daado que la inclusin de vaariables indicaadoras representa una faltaa de conocimiiento acerca del
d modelo, ees natural desscribir esta faalta de conociimiento por

266

PARTE DOS: Mod


delos de regresin de una sola ecua
acin

medio del trmino de perrturbacin. Po


or tanto, podrramos desearr elegir un moodelo de corte transversal y serie de tieempo combinnados en el quue los trminoos
del error pueeden correlacionarse a lo largo del tiem
mpo y de las unidades
u
indivviduales. Esto se puede reallizar con el modelo
m
de efecctos aleatorioss (o modelo de
d
componentees del error) de la siguientee manera:26

d
donde

= componente del error del corte transveersal


= componente del error de lla serie de tieempo
= componente del error com
mbinado

Ademss, suponemos que los com


mponentes del error individduales no estn
correlacionaados entre s y no estn autocorrelacio
a
onados (tanto a lo largo ddel
corte transveersal como a lo largo de laas unidades dde la serie de tiempo).
t
La relacin entre el m
modelo de efecctos aleatorioss y el modelo de efectos fijoos
puede verse tratando
t
los trminos del inttercepto en el modelo de efeectos fijos com
mo
dos variablees aleatorias, uuna es la variiable de la serie de tiempoo y la otra es la
variable del corte transversal. Si se suppone que ambbas variables aleatorias
a
estn
distribuidas en forma normal, los graados de libertaad se guardann debido a quue
necesitamos preocuparnoos slo con laa media y la varianza
v
de cada
c
uno de loos
componentees del error.
La form
mulacin de efeectos aleatorioos se obtiene ddel modelo dee efectos fijos al
asumir que el
e efecto mediio de las variaables aleatoriaas de la serie de
d tiempo y del
d
corte transvversal se incluuyen en el trmino del inttercepto, y laas desviaciones
aleatorias alrrededor de laa media son ig
gualadas a loss componentes del error, ut y
vi, respectivvamente. Paraa ver esto conn mayor clariidad, supngaase que no haay
componentee del error en la serie de tieempo. El uso de variables indicadoras no
n
forzar restriicciones en ell patrn de cam
mbio de intercceptos de regrresin, mientrras
que el modelo de efectos aaleatorios asuumira que el patrn
p
sigue una
u distribucin
normal. De manera
m
especcfica, asmasse que los inteerceptos del corte transverssal
tienen mediaa u y varianza 2u. El componente del errror combinad
do tiene mediaa 0
y varianza w2. Estas dos suuposiciones son equivalenttes a la suposiicin de que el
componentee del error tieene varianza 2u + w,2 dadoo que

El efecto dee la media de los intercepto


os distribuidoos en forma normal
n
(u) seer
explicado po
or la inclusinn de un trmino constante en la ecuaci
n de regresin
26
Vase G.
G S. Maddala, "T
The Use of Variannce Components M
Models in Poolingg Cross Section and
a
Time Series Datta", Econometricaa, vol. 39, nm. 2,
2 pp. 341-358, 19971.

CAPTU
ULO 9: Estimacin
n de una sola ecua
acin: temas avan
nzados

267

com
mbinada. Si los intercepttos de la seriie de tiempo tambin hubbieran sido
aleeatorios, distriibuidos en forrma normal con
c media v y varianza 2v, podramos
perrmitir que el efecto
e
medio dde los intercepptos aleatorioos (v) fuera reecogido por
el trmino
t
consttante. Al missmo tiempo el trmino dell error consisttira de tres
com
mponentes y tendra variannza:
(9.31)

La relacin entre el modelo dde efectos aleaatorios y el m


modelo combin
nado en los
quee se usan los mnimos cuaadrados ordinaarios puede vverse en formaa directa en
la ecuacin
e
(9.31). Si tanto 2u como 2v son 0, el trmino del error consiste de una
solla perturbacin combinada y el procedim
miento correctto es aplicar reegresin de
mn
nimos cuadraados ordinarioos a los datoss combinados.
El modelo de efectos alleatorios puedde estimarse como una reegresin de
mnnimos cuadraados generalizzados. La estimacin ponddera a las obsservaciones
invversamente a sus varianzass. Para lograrr la ponderaciin, debe empplearse una
estiimacin en dos
d etapas, daado que las diiversas variannzas del compponente del
erro
or tpicamentte no se conoccen. En la prim
mera etapa see estima la mu
uestra combinnada entera ussando mnimoos cuadrados ordinarios. (T
Tambin podrra usarse el
moodelo de efectos fijos.) Loos residuales de mnimos cuadrados orrdinarios se
usaan para calcullar estimacionnes mustralees de los com
mponentes de la
l varianza.
Esttas varianzas estimadas see usan luego en
e la segundaa etapa, en la que se obtiennen estimacioones de parmetro de mnnimos cuadraados generaliizados.27 Si
uno
o est dispuessto a asumir qque los compoonentes del errror estn disttribuidos en
forrma normal, entonces toddos los parm
metros relevaantes pueden
n estimarse
porr el mtodo de
d mxima vverosimilitud, el cual se ddescribe en deetalle en la
secccin 10.2.
De manera interesante,
i
ell estimador deel parmetro dde la pendientte, obtenido
cuaando el componente del errror combinaddo w,2 es igual a cero, se aprroximar al
estimador obtennido del moddelo de efecttos fijos. Estee resultado no
n nos sorpreende, puesto que
q este modello ignora la po
osibilidad de pperturbacionees conjuntas
dell corte transveersal y de la serie de tiemppo. De manerra alternativaa, cuando el
com
mponente del error combinnado se vuelvee arbitrariamente grande, ell modelo de
efeectos aleatorioos se aproxim
ma al modelo
o de datos combinados
c
d mnimos
de
cuaadrados ordin
narios. Esto sugiere que ell modelo de eefectos aleato
orios puede
verrse como un modelo interrmedio que see encuentra eentre el extrem
mo de cero
com
mponente dell error combiinado y un coomponente coombinado inffinitamente
graande.
Cul deberra preferirse, el modelo dee efectos fijoss o el modelo
o de efectos
aleatorios? Com
mo se mencionn antes, el modelo de efecctos aleatorioss usa menos
graados de liberttad y tiene un
u atractivo conceptual
c
coomo una caraacterizacin
am
mplia de las fuentes de errorr en un conjunnto de datos ggrande con un
na variacin
connsiderable en las series de tiempo y los cortes transveersales. Sin em
mbargo, el
27

Para detalles, vase, por ejempllo, Greene, op. citt., seccin 16.4.3, o Hsiao, op. cit., seccin
s
3.3.2.

268

PARTE DOS: Mod


delos de regresin
n de una sola ecu acin

modelo de efectos
e
fijos tambin tiene ventajas. Perrmite al investtigador analizzar
el grado en el que la variable dependieente para cadaa unidad del corte
c
transverssal
difiere de laa media globaal del corte traansversal. Addems, no reqquiere la suposicin de que los efectos inndividuales quue son incorpoorados en el trmino del errror
no estn corrrelacionados con las variaables explicatiivas en el modelo, una supposicin que puede
p
no ser vlida
v
y por consiguiente
c
ppuede causar que los estim
madores del paarmetro seann inconsistentees.28

EJEMPLO 9.6

Aplicaciones de patentes y gasto en inves


stigacin y des
sarrollo

Las empresaas que estn iinvolucradas en forma actiiva en el desaarrollo de tecnnologa nueva con frecuenccia invierten sumas
s
considderables de dinnero en invesstigacin y dessarrollo (R&D
D). Una medid
da imperfecta de la efectividdad de ese gassto
es el nmero de solicituddes de patentees que hace unna empresa. (Una
(
estadstiica
ms significcativa, el valoor neto presen
nte del torrente de gananciaas que generaa la
R&D, es muucho ms difcil de medir.) La relacin entre
e
el logaritmo del nmeero
de solicitudees de patente (P) y el logarritmo de los gastos
g
en R&D
D (RND) se han
h
evaluado ussando datos dee panel para 45
4 empresas durante
d
un perriodo de 7 aoos.
Los datos de
d R&D estnn rezagados 5 aos para reeflejar el intervalo largo que
q
pasa antes de
d que la inveestigacin se traduzca en una
u solicitud de patente reeal.
(Todas las empresas
e
en lla muestra tuvvieron un nm
mero positivo
o de patentes en
cada ao,)29
El modelo de regresiin bsico estt dado por:

donde i se refiere
r
a las empresas
e
y t se refiere al tiempo.
t
El prrocedimiento de
mnimos cuuadrados ordinnarios en el quue se usa el coonjunto de daatos combinaddos
(con 315 obbservaciones)) gener los siguientes
s
ressultados (conn la estadsticaa t
entre parnttesis):

28
La supo
osicin de que loss errores no estn
n correlacionados con las variables explicativas pued
de
demostrarse co
on la prueba de e specificacin de Hausman para comparar los parmetros estimado
os
usando el modelo de efectos fijos con los parm
metros obtenidos del desarrollo dee los estimados de
mnimos cuadrrados generalizad
dos del modelo de
d efectos aleatorios.
29
Los dato
os de patentes fueeron obtenidos de la Office of Tech
hnology Assessmeent and Forecastin
ng.
Una versin antterior de este estu
udio se report en Bronwyn H. Halll, Zvi Griliches y Jerry
J
A. Hausman
n,
"Patents and R&
&D: Is There a Laag?", Internationa
al Economic Revieew, vol. 27, pp. 26
65-283, 1986. Vaase
tambin Bound y cois., "Who Do
oes Patents and Wh
ho Does R&D?", en Z. Griliches (ed.). R&D, Patentss,
and Productivitty (Nueva York: N
National Bureau of
o Economic Reseearch, 1984).

CAPTU
ULO 9: Estimacin
n de una sola ecua
acin: temas avan
nzados

269

Esta regresiin muestra uuna relacin positiva


p
fuertee entre R&D y las solicituddes de patenttes. En promeedio en la muestra, las soolicitudes de patentes se
inccrementaron en
e 0.845% poor cada increm
mento del 1% en gastos de R&D.
Este compoortamiento dell patentado vaara entre emppresas en form
ma considerab
ble, y es esta variacin la que nos propporciona el rresultado anteerior. No es
sorrprendente, poor consiguiennte, que una reegresin del nmero medioo de patentes
(prromediadas a lo largo del tiempo) en la
l R&D meddia produzca el siguiente
ressultado "entree individuos":

Debido a qu
ue este segunddo modelo noo permite difeerencias en la solicitud de
pattentes especfficas de cada empresa
e
que no
n se deban a diferencias en
e los gastos
en R&D, es basttante posible que
q el modeloo sobres time el impacto dee R&D. Esta
hipptesis es connfirmada cuanndo agregamoos un conjuntoo de indicadooras de corte
traansversal a la especificacinn, es decir, cu
uando se estim
ma un modelo
o de efectos
fijo
os. En el modeelo de efectos fijos el estimaado del impactto de R&D en
n las patentes
es considerablemente menorr:

No
o se han incluiido los coeficiientes de la vaariable indicaddora individuaal asociados
conn cada una de
d las empressas. Sin embaargo, realizam
mos una prueeba F de la
hipptesis nula dee que todos loos coeficientess son iguales a cero en form
ma conjunta.
Coon una estadsstica F de 27.779 con 24 y 26
69 grados de llibertad, rechaazamos esta
hipptesis en un nivel del 5%
%.
Por ltimo, estimamos un modelo de
d efectos aleatorios perm
mitiendo un
com
mponente de error en el corrte transversall y un componnente de error combinado,
conn los siguienttes resultadoss:

Este modello estima un efecto


e
considderablemente mayor que ell modelo de
efeectos fijos. C
Cul debera preferirse? Hicimos
H
una pprueba de esp
pecificacin
de Hausman de la hiptesis nula
n de un moodelo de efectoos aleatorios en
e comparacin con la hiptesis alternativa de un moddelo de efectoos fijos. La esstadstica ji

270

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

cuadrada ressultante de 322.627 con 1 grrado de libertaad es significaativa en un niivel


del 5%. Estoo apoya la conclusin de que,
q de estos ccuatro modeloos, el modeloo de
efectos fijoss caracteriza en forma ms
m precisa laa relacin enntre R&D y las
solicitudes de
d patentes.

9.4.4

M
Modelo
de autocorrela
a
cin de serries de tiem
mpo

La especificcacin de efecctos aleatorioss tiene la proppiedad de quee la correlacin


de perturbacciones a lo larggo del tiempo
o es independiiente de la disttancia temporral
entre los trrminos de peerturbacin. Otra
O especificcacin predeccira una decllinacin en laa correlacin ddel error a lo largo del tiem
mpo. Esto suggiere que debberamos conssiderar la com
mbinacin de los datos de corte
c
transverrsal y series de
d
tiempo bajoo suposicionees de error quue implicarann autocorrelaacin de seriees
de tiempo (oo corte transvversal) al igual que heteroocedasticidad de corte trannsversal (o de series de tiem
mpo). Como un
u ejemplo dee cmo podra lograrse estto,
considrese el siguiente modelo:
m

Las suposiciiones implicaan que aunquee las perturbacciones del corrte transversall no
estn correlaacionadas y ttienen varianzza constante, las perturbacciones de la seerie
de tiempo estn
e
autocorrrelacionadas.. Permitimos que varee de una uniddad
individual a otra, pero fijamos cada esstructura de errror que impllique correlaccin
serial de prim
mer orden. Dee este modo se pueden obteener estimadoores eficientess de
los parmettros usando una variantee de mnimoos cuadradoss generalizaddos.
Estimaremos cada i y luego
l
usarem
mos la ^ i estim
mada como una
u base paraa la
regresin dee mnimos cuuadrados geneeralizados. Paara estimar i, i = 1, 2, ...,, N,
estimamos la muestra combinada completa usando
u
mnimos cuadraddos
ordinarios. Dado que loos estimadorees de los parmetros son consistentes (al
igual que innsesgados), poodemos usarloos para calcullar los residuaales de regressin
^
it . Luego estimamos
e
cadda i de manerra consistentee como sigue:

CAPTU
ULO 9: Estimacin
n de una sola ecua
acin: temas avanzzados

271

Procederemos fo
ormando la forma
fo
de diferrencia generaalizada del modelo
m
originaal:

La forma de difeerencia generaalizada puedee estimarse ahhora aplicand


do mnimos
cuadrados ordinaarios al modello combinado
o. Se usan NT
T - N observacciones en la
estimacin, dadoo que se elimiina una obserrvacin de cada unidad ind
dividual en
el proceso
p
de differenciacin ggeneralizada. Las
L correccionnes para heterrocedasticidad
d o correlacinn de corte traansversal entrre unidades inndividuales procederan
p
en forma similaar a la que see acaba de describir. Si laa heterocedassticidad se
pressentara en el modelo de laa ecuacin (9.32), por ejem
mplo, usaramoos los residuaales del modeelo de la diferrencia generaalizada (combbinada) para estimar
e
las
variianzas del erro
or individual y luego aplicar mnimos cuuadrados ponnderados en
la teercera etapa del
d proceso de estimacin..

EJEMPLO 9.7

Ayuda extranjera

30

Un problema de naturaleza em
mprica importante que ennfrentan los ecconomistas
del desarrollo see refiere al efeecto de la ayu
uda extranjeraa en los gastos de inversin
n de los pasess menos desarrrollados (LDC
C). Algunos ecconomistas haan afirmado
quee la afluencia de
d capital extrranjero a los LDC
L
no conduuce a un increm
mento en la
inveersin, sino que
q en lugar dde ello conduucen a un inccremento en el
e consumo
pbblico y privadoo. Para abordaar este tema, see desarroll unn modelo econ
nmico que
exp
plica Ja interreelacin entre llas decisioness fiscales, de gasto
g
y de sollicitudes de
prsstamo. El moodelo asume qque los funcioonarios locales buscan max
ximizar una
funccin objetivo que es influiida por eleccio
ones de asignnacin entre el
e consumo
privvado, el consuumo "civil" pblico,
p
el connsumo "sociooeconmico" pblico, la
inveersin pblica con propssitos de desaarrollo y los prstamos pblicos de
fuenntes nacionalles. La maximizacin de esta funcinn objetivo suj
ujeta a una
resttriccin presuupuestal produuce una serie de cinco ecuaaciones simulltneas que
deb
ben cumplirsee si se ha de lograr la maxiimizacin. Paara simplificaar las cosas
exaaminaremos dos
d de esas cinnco ecuacionees:

30
Este ejemplo se adapt de P. S. Heller, "A Model
M
of Public F
Fiscal Behavior inn Developing
Counntries: Aid, Investtment, and Taxatiion", American Economic Review, vol. 65, pp. 368--379, junio de
1975.

272

PARTE DOS: Mo
odelos de regresi
n de una sola ecu
uacin

donde Tt = nivel de ingrresos fiscales y no fiscales en el momen


nto t
It = inversin pblica con pro
opsitos de deesarrollo en el momento t
Gc,t = consumo "civvil" pblico (administracin gubernamenntal, servicio de
la deuda, polica, ejrcito
o) en el momeento t
Gs,t = consumo "soocioeconmicoo" pblico (esscuelas, hospittales, carreteraas,
proyectos aggrcolas) en ell momento t
A1t = subsidios al sector pblico en el momeento t
A2t = prstamos al sector pblicco en el momeento t
Yt = producto inteerno bruto enn el momento t
Mt = importacionnes en el mom
mento t
La muestraa de LDC incllua 11 pases africanos: Niigeria, Ghana,, Zambia, Kennia,
Uganda, Taanzania, Malaawi, Liberia, Etiopa,
E
Tnezz y Marruecoss. Se disponaa de
datos de seeries de tiemppo de todas laas variables ppara periodos de aproximaadamente 6 aos. Debido a que el sistem
ma de ecuacionnes es simultneo, se eligi la
tcnica de mnimos cuadrados de dos etapas para estimar cadaa ecuacin. AdeA
ms, se tom
m la decisinn de usar un modelo
m
de efeectos aleatorioos con dos coomponentes de
d error, un trmino del errror de corte transversal y un trmino del
error combiinado, it = ui + wit . Se supusso de manera iimplcita que los
l interceptoss de
la serie de tiempo permaanecieron con
nstantes durannte el periodoo de estudio. Sin
embargo, el
e componentte de error de
d corte transsversal explicca la naturaleza
aleatoria dee los intercepptos del corte transversal.
El procceso de estim
macin proced
di en dos pasos.
p
En el primer
p
paso, las
ecuaciones de forma redducida se estiimaron usando mnimos cu
uadrados ordiinarios. Los vaalores ajustadoos de las variabbles endgenaas de la derechha se calcularoon y
sustituyeroon en las ecuaaciones estruccturales. En laa segunda etappa, luego de este
e
procedimieento de mnim
mos cuadradoss generalizadoos de dos pasos, fue estimaada
usando unaa variante deel procedimieento 2SLS deescrito en el texto.
t
Para caada
ecuacin, se calcul la
l proporcin
n del corte transversal con
c
la variannza
combinadaa : = 2u, / w2, . Las ecuacciones estimaadas (con la estadstica t enntre
parntesis y los trminoos constantes eliminados) son:

La prim
mera ecuacinn verifica el reesultado esperrado de que mayores
m
subsiddios
y prstamos conducen a menores ingrresos recolectaados en formaa nacional (auun-

CAPTULO 9: Estimacin
n de una sola ecua
acin: temas avanzados

273

quee el trmino de
d subsidios ees insignificannte). La inverrsin gubernaamental y el
con
nsumo civil gubernamenta
g
al tienen un efecto
e
positivvo fuerte en los ingresos
fisccales, pero stte es compenssado en ciertaa medida por el
e coeficiente negativo en
el trmino
t
de co
onsumo sociooeconmico pblico.
p
Los resultados
r
de la segunda
ecu
uacin indicann que la ayudaa extranjera tuuvo un efectoo positivo en la inversin,
perro siendo el vaalor menor quue 1 indica qu
ue parte de estta ayuda se prooporciona a
otrras reas de gasto.
g
Concluuimos que laas ecuacioness estimadas verifican
v
la
inteerdependenciia fiscal asociiada con los presupuestos
p
actual y de capital.
c
Los
prstamos extrannjeros puedenn afectar y afeectan al consuumo pblico y a la inversinn.

AP
PNDICE 9..1
Esttimacin de inttervalos de con
nfianza para ellasticidades a largo plazo

Suppngase que hemos


h
estimaado un modelo de rezago distribuido
d
conn un rezago
geoomtrico, espeecificado com
mo:

donnde Q es canttidad, P es prrecio y Y es in


ngreso. Para eesta ecuacin las elasticidaddes de precioo e ingreso a corto plazo son
s 2 Y 3 reespectivamennte, pero las
elaasticidades a largo plazo son::31

El problema
p
es esstimar los erroores estndar (y
( por tanto loss intervalos de confianza)

parra estos estim


mados de elastticidad.
El procedim
miento es el siguiente. Suppngase que ddeseamos obttener un intervalo de confiianza del 90%
% para el estiimador de elaasticidad dado
o por el cocieente 2/(l - 4), donde
d
2 y 4 sonn los valores esstimados de 2 y 4. Entonces formamos
la combinacin
c
lineal:

31
Si la ecuacinn (A9.1) estuvieraa en forma lineal en lugar de logarrtmica, las elasticcidades estaran
daddas por:

donnde una barra ind


dica el valor meddio.

274

PARTE DOS: Mod


delos de regresin de una sola ecuaccin

donde z toddava est porr determinarsse. Ahora nttese que la varianza


v
de essta
combinacin
n lineal es:

Si z es laa proporcin vverdadera 2/(ll - 4), entoncees tendr unaa media de cerro.
Si el nmerro de gradoss de libertad es muy grannde, la distribbucin de es
aproximadaamente normaal, de modo que
q la probabbilidad es del 90% de que el
valor muestrral de est ddentro ms o menos
m
1.645 veces
v
su desv
viacin estndar,
donde 1.6455 se obtiene dde la tabla no
ormal. Por tannto,

con probabiilidad 0.90. A


Ahora, para ob
btener el interrvalo de conffianza, tratam
mos
la ecuacin (A9.4)
(
como una
u igualdad, es
e decir, como una ecuacin cuadrtica enn z.
En otras palaabras, sustituyaa los estimadoss 2, 4, Var (2), Var (4) y Cov
C (2, 4) en la
ecuacin (A
A9.4) y resuelvva la ecuacinn cuadrtica resultante paraa z. El resultaddo
ser de la foorma:

donde ess el valor esp erado de la elasticidad


e
[yy no necesariiamente igua l a
2 /(l - 4 ),] y u es el inttervalo de connfianza del 900%.

EJERCICIO
OS
9.1 Supongaa que la ecuacin que se va a estimar es:

Al investigaddor le faltan las ltimas cinco


o observacionees para X4, peroo tiene disponibble
una variable Z que se sabe est altamentee correlacionadaa con X4. Qu debera hacerr el
investigador y cules supossiciones deben mantenerse paara que ste seea un buen proccedimiento?
9.2 Considerremos los modeelos Yt = + X
Xt + t y Zt = + Yt + ut.
a) Suponga que est trratando de esttimar y perro falta la ltim
ma observacin
(Tsim
ma) en Xt . Quu debera haceer?
b) Supon
nga ahora que est interesado
o en pronosticarr Zt y conoce ,, y Xt para t T
y Yt para
p t T - 1. Qu debera hacer?
h
9.3 Demuesttre que al rempplazar la obserrvacin X faltaante en el modeelo descrito enn la
parte a) del ejercicio
e
9.2 ussando el tiempoo t como un innstrumento prodducir un estim
mador de pendiente consistentte. Qu suced
der si el trminno del error estt correlacionaado
serialmente?

CAPT
TULO 9: Estimaccin de una sola eccuacin: temas avaanzados

275

9.4
4 Considere el siguiente
s
modeelo:

Sup
ponga que se sabe
s
que los in
nterceptos de laa serie de tiem
mpo son constaantes. Cmo
harra la prueba parra ver si se debe usar el modello de efectos fijos para tomar en
e cuenta que
los interceptos deel corte transveersal varan?
9.5
5 Cmo estim
mara un modelo
o combinado dee serie de tiemp
po y corte transsversal cuando se sabe que ell componente de error del co
orte transversaal es heteroced
dstico? Un
mtodo similar fu
uncionara cuan
ndo es el compo
onente de la serrie de tiempo el
e que se sabe
quee es heterocedstico?
9.6
6 Usted est esstimando un modelo
m
con dos variables exp
plicativas, cad
da una de las
cuaales tiene un reezago geomtrico. Derive un
na ecuacin parra estimarse cu
uando ambos
rezzagos tienen pesos idnticos.
9.7
7 Considere el siguiente modeelo:

Mu
uestre cmo esttimar el modelo
o con el uso deel modelo de rezzago distribuid
do polinomial
y un
u polinomio de
d segundo grad
do si
a) No hay reestricciones de puntos extremo
os.
b) Se asume que la cola y la cabeza de la diistribucin son iiguales a 0 (w-11 = w4 = 0).
9.8 Deseamos ex
xaminar varias alternativas paara estimar una ecuacin en prresencia de
dattos faltantes. El modelo que d
deseamos estim
mar es:
EXP = 1 + 2POP + 3AID
A + 4INC +
don
nde se sabe (vase el captulo 6) que VAR() = C(POP2).
a) Transform
me cada variable, dividiendo entre
e
POP. Deffina:

Usanddo todos los datos,


d
encuentree estimados efficientes de 1, 2, 3 y 4
regresandoo PCEXP en PO
OP1, PCAID y PCINC (con uun trmino consstante incluido). Estos estimados son nuestro conjunnto de referenciaa para el resto del
d problema.
A
A
A
A
Determneelos por 1 , 2 , 3 , 4 .
Para el
e resto de estee problema asum
mimos que falttan las ltimas cinco observaciones en
e INC.
b) Usando s
lo las primerass 45 observacio
ones y los datos transformado
os, estime el
B B B B
modelo. Denomine
D
los eestimados 1 , 2 , 3 , 4 .
c) Usando laas observacionees 1 a 45, encu
uentre el promedio de INC; llmelo INC.
Defina PC
CINCC por:

276

PARTE DOS: Modelos de regresin de una sola ecua cin

Ejecutte la regresin de
d PCEXP sobree POP1, AID y PCINCC. Denoomine los estimaados C1 , C2 , C3 , C4 .
d) Lleve a cabo la regressin de INC sobbre POP y AID usando
u
las obseervaciones 1 a 45.
4
Usanddo lo anterior, pprediga INCt paara t = 46 a 50. D
Denomine los valores
v
predichhos
INCt. Defina:

y efecte la regresinn de PCEXP sobbre POP1, PCA


AID y PCINCD. Denomine a loos
D D D
coeficcientes estimaddos D
1 , 2 , 3 , 4 .
e) Usando las primeras 445 observacionnes, encuentre el
e promedio de PCINC. Denotte
esto con
c PCINC. Deefina:

Realicce la regresinn de PCEXP soobre POP, PCA


AID y PCINCE
E. Denomine los
l

estim
mados E1 , E2 , E3 , E4 , E5 .

f) Usandoo las observaciiones 1 a 45, ajjuste el modeloo de regresin de PCINC sobbre


POP1 y PCAID. Ussando lo anteriior, prediga PC
CINCt para t 46. Llame a los
l
valorees pronosticadoos PCINCt. Deffina:

Lleve a cabo la regressin de PCEXP


P sobre POP1, P
PCAID y PCINC
CF y denomine a
F

los cooeficientes estim


mados 1 , 2 , 3 y 4 .
g) Coompare y contrraste los resulttados de los pprocedimientos a) a f). Culles
pareceen ser los mtoodos ms razonnables para trattar las observaaciones faltantees?
Por qu?
q

CAPTULO

10

ESTIMACIN NO LINEAL
Y DE MXIMA VEROSIMILITUD

Los avances tecnolgicos en las capacidades de las computadoras han permitido a


los econometristas elaborar y utilizar tcnicas cada vez ms complejas para la
estimacin de modelos economtricos. Hace varias dcadas la estimacin de un
modelo inherentemente no lineal poda ser costoso en forma prohibitiva, pero
en la actualidad esto puede lograrse con facilidad. Como resultado, ahora los
econometristas tienen acceso a un conjunto mucho mayor de herramientas
estadsticas. Sin embargo, la eleccin de la tcnica ms apropiada an es una
preocupacin.
En este captulo nos enfocaremos en tres tcnicas avanzadas de estimacin.
Comenzaremos con una introduccin a la estimacin no lineal y expondremos
algunas tcnicas alternativas para estimar ecuaciones no lineales en los parmetros. Adems se mostrar cmo se pueden usar estas ecuaciones para el pronstico. En la segunda parte del captulo se describe la tcnica de estimacin de
mxima verosimilitud, una alternativa til a los mnimos cuadrados. En la tercera parte mostraremos cmo se pueden emplear los mtodos de estimacin no
lineal para estimar modelos en los que la varianza del error depende de la volatilidad de errores pasados (modelos Arch) y modelos en los que el patrn de
varianzas de errores pasados sigue un rezago distribuido (modelos Garch). El
apndice 10.1 contiene una introduccin breve a un mtodo generalizado de
estimacin de momentos, una tcnica muy general que incluye como casos especiales la estimacin de variables instrumentales no lineales y estimacin de
mnimos cuadrados generalizados no lineales.

277

278

10.1

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

ESTIMA
ACIN NO LIINEAL
Todos los modelos
m
de reggresin de unna sola ecuacin que hemoss estudiado haasta
este punto, han sido lineeales en sus coeficientes, y por tanto po
odran usarse los
mnimos cu
uadrados ordinnarios o las variaciones en los mnimos cuadrados orrdinarios paraa estimarlos. E
En esta seccin examinareemos el probllema de estim
mar
ecuaciones que son no linneales en sus coeficientes.
c
A
Aunque estoss procedimienntos
para la estiimacin no liineal pueden ser costosos desde el punnto de vista del
clculo, inccrementan enn gran medidaa el alcance dde las estructturas de modeelo
que pueden
n usarse para ajustar los daatos.
Nos enffocaremos haacia las ecuaciiones que sonn inherentemen
nte no linealees.
Por ejemploo, las siguienttes ecuacionees

no pueden transformarse
t
e en ecuacion
nes lineales y por tanto no se prestan a lla
regresin lineal. De mannera especficaa, considerareemos ecuacionnes de la form
ma
(100.1)
donde f es una
u funcin nno lineal de lass k variables iindependientees X1, ..., Xk y los
p coeficienttes 1, .... p. El criterio usado para deteerminar los vaalores estimaddos
para los coeeficientes es eel mismo que se usa en unaa regresin lin
neal; es decir,, la
minimizacin de la suma de cuadrados del error. Si ttenemos T obsservaciones enn Y,
X1, ..., Xk , podemos
p
escriibir la suma de
d cuadrados del error com
mo:
(100.2)
Llamamos 1,..., p a las estimaciones de mnimos cuadrados
c
no lineales
l
de 1, ....
p; es decirr, los valores de 1, .... p que minimizaan la suma de
d cuadrados del
d
error S.
En el caso
c
de una reegresin lineaal es sencilloo, desde el puunto de vista del
clculo, obttener las estim
maciones de mnimos
m
cuaddrados. Sin em
mbargo, para una
u
ecuacin noo lineal, hay m
mtodos de clculo
c
alternaativos para enncontrar estim
maciones de coeficiente quee minimicen la suma de cuuadrados del error
e
en la ecuuacin (10.2)..

10.1.1

Mtodos de clculo para la estimacin no


o lineal

Hay tres ennfoques generrales para la solucin del problema de laa estimacin no
n
lineal. La mayor
m
parte dee los mtodos numricos
n
de estimacin in
nvolucran a unno

CAP
PTULO 10: Estima
acin no lineal y de
e mxima verosim
militud

279

o un
na combinacin de dos dee estos enfoqu
ues. Como veeremos, la eleeccin del
enfooque dependee del tipo de eecuacin que se est estim
mando.
Primero, puedde usarse una bsqueda direecta; en este caso
c
se evalaa la funcin
de la suma de cuuadrados del error para coonjuntos alterrnativos de valores
v
del
coefficiente. Aqueellos valores que den com
mo resultado uun mnimo son
n elegidos
com
mo las estimacciones. Este m
mtodo puede ser efectivo si slo debenn estimarse
uno o dos coeficieentes. Sin em
mbargo, si estn
n implicados ms de dos cooeficientes
(lo cual sucede con frecuenccia), debe haacerse un nmero extrem
madamente
grannde de clculoos, y por tantoo el mtodo see vuelve muyy costoso desdde el punto
de vista
v
del clcuulo. Por ejem
mplo, si deben
n estimarse ccuatro coeficientes y se
conssideraran 20 valores
v
alternaativos para caada coeficiente, la suma de cuadrados
del error
e
debe callcularse (20)4 = 160 000 veces!
v
Por connsiguiente, esste mtodo
casi no se usa, y no lo comenttaremos ms.
Un segundo enfoque impllica la optimiizacin directta. Las estimaaciones de
parmetro se obtiienen diferencciando la funccin de sumaa de cuadrados del error
con respecto a caada coeficientte, establecien
ndo las derivaadas iguales a cero (definieendo de este modo un mnimo)
m
y ressolviendo el conjunto resu
ultante de
ecuaaciones no linneales (las cuaales son llamaadas ecuaciones normales). Tomando
las derivadas
d
de la ecuacin ((10.2) con resspecto a 1, ..., p y estableecindolas
iguaales a cero, enncontramos quue las ecuacio
ones normalees son:

Estaas ecuaciones no lineales ddeben resolveerse en formaa simultnea para


p
1, ...,
p, dado
d
que cadaa ecuacin pueede contener todos
t
los p cooeficientes. Coomo podra
espeerarse, este enfoque puedee presentar dificultades
d
dde clculo y por
p consiguieente rara vez se aplica en forma directaa. Una variacin de este enfoque, el
cual hace factible realizar
r
el clcuulo, es el mtod
do de descensoo de pendiente mxima.
m
El
mto
odo funciona movindose dde un conjunto
o de pruebas dde valores de coeficiente
c
paraa 1, ..., p a un
u nuevo conjjunto de tal foorma que las derivadas - S//

1, ...,
- S
S//p son tan grandes com
mo es posible, dando comoo resultado unn progreso
rpiddo para los valores
v
de 1, ..., p que miinimizan S (yy para los cuaales las derivaddas son cero).
El tercer enfo
oque para sollucionar problemas de estiimacin no lin
neal es un
mtoodo iterativo de
d linealizacin en el que la ecuacin no llineal es lineallizada alrededo
or de algn co
onjunto iniciaal de valores de
d los coeficieentes. Luego se
s realizan
los mnimos
m
cuaddrados ordinaarios en esta ecuacin lineeal, generand
do un conjunto
o nuevo de vaalores de los coeficientes.
c
L ecuacin nno lineal es rellinealizada
La
alred
dedor de estoos nuevos valoores de los cooeficientes, see vuelven a reealizar los
mniimos cuadradoos ordinarios ppara generar nuevos
n
valores de los coeficcientes y la
ecuaacin es relinnealizada alreddedor de estoos valores. Esste proceso itterativo se
repitte hasta que see alcanza la cconvergencia; es decir, hastta que los valo
ores de los
coefficientes no caambian, de manera
m
consideerable, despus de cada nuueva regresinn de mnimos cuadrados orrdinarios.

280

PARTE DOS: Mo
odelos de regresin
n de una sola ecua
acin

Este en
nfoque tiene cciertas ventajaas, la primera es la eficienccia de clculo. Si
la ecuacin
n que se va a esstimar es apro
oximada en foorma cercana por
p una ecuaccin
lineal, pued
den ser necesaarias muy poccas iteracioness. Una segundda ventaja es que
q
proporcion
na un lineamiiento claro paara hacer pruuebas estadstticas que, porr lo
general, slo se aplican a la regresinn lineal. Dadoo que se realizza una regresin
lineal en cada iteraccin, puedenn usarse pruuebas estadsticas estnndar
(R2, estadsstica t, etc.) para
p
evaluar el ajuste de la ecuacin linealizada
l
finnal.
Debido a qu
ue este enfoquue se ha usadoo en programaas de cmputoo para modelaado
economtriico, a continuuacin se exam
minar con ms
m detalle.
Usamoos el hecho dee que cualquieer funcin no lineal puede expresarse
e
coomo
una expanssin de series Taylor. Podeemos escribir,, especficameente, la ecuaccin
(10.1) en una
u expansinn alrededor de
d un conjuntoo de valores iniciales 1,0, ...,
p,0 para lo
os coeficientees 1, ..., p (En
(
este puntto no es importante cmoo se
obtuvieron estos valoress iniciales; suppongamos, enntonces, que representan
r
conjeturas de los
l valores veerdaderos.) Laa ecuacin exxpandida seraa:

Aqu el sub
bndice 0 en las derivadass parciales denota que estaas derivadas son
s
evaluadas enn 1 = 1,0, ..., p = p,0.
Una ap
proximacin llineal a nuesttra funcin noo lineal es proporcionada por
los dos prim
meros trminos en la expaansin de seriees Taylor. Al eliminar los trt
minos de segundo
s
ordenn y de orden superior y reeescribir la eccuacin, obteenemos:

Obsrvese que la ecuaccin (10.3) tieene la forma dde una ecuacin de regressin
lineal. En el
e lado izquieerdo hay una variable depeendiente consstruida y la paarte
derecha co
onsiste (adems del trminno del error additivo) en un conjunto de coeficientes desconocidos
d
(1, ..., p) quue multiplicann al conjunto de variables independienttes construidaas. De este moodo, los coefiicientes puedeen estimarse ejee
cutando unna regresin dde mnimos cuadrados
c
orddinarios.
Los vaalores de los coeficientes
c
esstimados paraa 1, ..., p, loss cuales se deenominan 1,1, ..., p,1, se usan como un conjunto
c
nuevvo de estimaciiones iniciales, y
la ecuacinn no lineal es reelinealizada allrededor de esstos valores. Ell resultado es una
u
ecuacin de
d regresin liineal nueva

CAP
PTULO 10: Estimacin no lineal y de
e mxima verosimilitud

281

A esta
e ecuacin,, se le aplicann los mnimoss Cuadrados oordinarios obbtenindose
un nuevo
n
conjuntto de estimaciiones de los coeficientes
c
1,2, ..., p,2. El proceso de
relinealizacin se
s repite hastaa que ocurre la
l convergenccia; es decir, hasta
h
que

don
nde es un nmero
n
pequeeo cuya elecccin dependde en parte deel costo de
clcculo.
No obstante,, no tenemos garanta de que
q este proceeso iterativo converger
c
en la
l estimacinn de mxima vverosimilitudd de los coeficcientes. Pero puede, por
ejem
mplo, converg
ger en un mnnimo local, en oposicin a uuno global, dee la funcin
de suma
s
de cuaddrados de los errores. Unaa forma de veer si ha ocurrido esto es
repeetir la estimaccin, comenzzando con un conjunto difeerente de conj
njeturas inicialles para los cooeficientes.
El hecho de que el processo iterativo pu
uede no conveerger en absolluto es muy
imp
portante. Las estimaciones subsecuentess de los coeficcientes puedeen diferir, y
el lado izquierdo de la ecuaccin (10.4) puede
p
hacersee ms grandee con cada
nueeva iteracin (es
( decir, el prroceso puede divergir). Si ocurre diverg
gencia, uno
pueede comenzarr el proceso ootra vez, usanndo un conjunnto nuevo de conjeturas
inicciales para los coeficientes. Si el proceso an no conveerge, puede seer necesario
inteentar un mtoodo de estimaacin diferentte.
Un mtodo alternativo
a
im
mplica una varriacin en el m
mtodo de linnealizacin
iteraativo. En lugaar de usar lass estimacioness sucesivas reesultantes de cada linealizaacin, las estim
maciones sonn calculadas a partir de:

donnde i , j+ 1 es laa estimacin dee mnimos cuaadrados de la (j + 1 )sima itteracin y a


es un
u factor de amortiguamie
a
ento (0 < < 1). El factorr de amortiguuamiento
pueede elegirse para
p
evitar rebbasar los lm
mites del mniimo de la funncin de la
sum
ma de cuadrad
dos de los erroores.1
Hay otros mtodos
m
de esttimacin no lineal que estn disponibles y pueden
propporcionar esttimaciones coonvergentes cuando
c
fallann los mtodos descritos
antees.2 Sin embaargo, en realiddad no hay un
u mtodo meejor, dado quee, mientras
unoo puede convverger con ms facilidad otro
o
puede im
mplicar menoos costo de
clcculo. A menudo se usan m
mtodos alternaativos como uuna forma de comprobar
quee se ha alcanzado el mnim
mo global de laa funcin de lla suma de cuuadrados de
los errores.
1
El factor de am
mortiguamiento taambin puede usaarse para cambiar
ar el paso
i , j+ 1 - i , j de modo
que sus valores se encuentren
e
en algn
a
lugar interrmedio que sera indicado por el
e mtodo de
lineaalizacin y que sera
s
indicado por el mtodo de descenso
d
de penddiente mxima. sta
es la base
paraa el mtodo de Maarquardt. Vase D.
D W. Marquardt, "An Algorithm for
f Least Squaress Estimation of

Nonllinear Parameters", Journal of the Soociety of Industrial and Applied Mathhematics, vol. 2, p. 431, 1963.
2
Para un anlis is de varios mtoodos de estimaciin alternativos y sus propiedades estadsticas,
vase T. Amemiya, "N
Nonlinear Regresssion Models", enn Z. Griliches y M
M. Intriligator (ed
ds.), Handbook
of Ecconometrics, vol. 1 (Amsterdam: North-Holland,
N
19
991), captulo 5.

282

PARTE DOS: Mo
odelos de regresi
n de una sola ecu
uacin

10.1.2

Evaluacin de ecuac
ciones de re
egresin no
o lineal

Las pruebaas estadsticass usadas para evaluar el ajuuste de una eccuacin de reggresin lineal no son apliccables en form
ma directa a una regresin no lineal. Por
ejemplo, unna estadsticaa F no puede usarse para ej
ejecutar una prueba
p
de signnificancia en el ajuste genneral de una regresin no lineal, ni puueden usarse las
estadsticass t de la manerra usual. Una razn para essto es que no podemos
p
obteener
una estimacin insesgadda de 2, la varianza verdaddera del trminno del error ,, de
los residuaales de la reggresin. Aun si est distrribuido en foorma normal con
c
media 0, loos residuales t dados por:
(100.5)
no estarnn distribuidoss en forma noormal (ni tenndrn media 0). Por tantoo, la
suma de reesiduales cuaddrados no seguuir una distrribucin ji cuaadrada, los cooeficientes estimados no esstarn distribu
uidos en form
ma normal y las
l pruebas t y F
estndares no podrn applicarse.
Sin em
mbargo, las pruuebas t y F se pueden realizzar en la regresin lineal quue se
aplica a la liinealizacin finnal del proceso
o iterativo. Espperaremos que esta linealizaccin
proporcion
nar una aproxximacin razo
onable a la ecuuacin no lineeal y que ajusttar
los datos. Si
S no ajusta llos datos (com
mo lo indicann las estadstiicas), habr dduda
en el ajuste de la ecuuacin no linneal en su coonjunto. Sienndo esto as, los
programas de computaddora que reaalizan estimaccin no lineaal por medio del
enfoque dee linealizacinn por lo generaal calculan esttadsticas t y errores
e
estndaares
asociados para
p
la ltimaa linealizacin. (Estos erroores estndarees son estimaados
en forma consistente.
c
)
A diferrencia de las ppruebas t y F, la R2 puede aplicarse
a
en su
u sentido convvencional a unna regresin nno lineal. Reccurdese que la R2 se calcu
ula a partir dee:

(donde yt se
s mide en forrma de desviaaciones) y reprresenta la fracccin de la vaariacin en yt que es "expliicada" por la regresin. Laa R2 retendr este significado
cuando la ecuacin es no
n lineal, si los
l residuales son calculaddos a partir dee la
ecuacin (110.5).

10.1.3

Pronstico
o con una ecuacin d
de regresin no lineal

Una vez quue se ha estim


mado una ecuaacin de regreesin no lineaal, puede usarrse
para obtener pronsticoos. Un pronsstico de Yt est dado por:

CA
APTULO 10: Estim
macin no lineal y d
de mxima verosim
militud

283

Enn el captulo 8 se observ qque para una regresin linneal un pronstico as es


inssesgado y tienne el error cuuadrtico medio mnimo. Sin embargoo, no puede
haccerse esta afirrmacin paraa un pronsticco generado a partir de unna regresin
no lineal, como en la ecuacin (10.6). La razn para esto es que loss errores de
pro
onstico no estarn
e
distribbuidos en form
ma normal coon media 0 como
c
fue el
casso para una eccuacin lineall. En tal caso no podemos determinar sii el error de
proonstico es menor
m
que el errror generado
o por un conjuunto diferentee de estimacioones de los coeficientes.
Adems, lass frmulas paara el error esttndar de pronstico (es deecir, la desviaacin estndaar del error dee pronstico) y los corresppondientes in
ntervalos de
con
nfianza que see derivaron enn el captulo 8 para el casoo lineal no se aplican a la
ecuuacin (10.6). De hecho no hay ningunna frmula annaltica que pu
ueda usarse
parra calcular enn forma direccta intervaloss de confianzza de pronsttico para la
ecuuacin no lineeal general. U
Una solucin involucra la ggeneracin dee intervalos
de confianza porr medio del usso de pronstiico Monte Carrlo, el cual se describe en
el captulo
c
14. ste,

sin embaargo, requiere que los coeficcientes estn distribuidos


en forma normaal (lo cual no es el caso) y que se disponnga de estimaaciones para
loss errores estnndares de los ccoeficientes y el error estnndar de la ecuuacin en s
(lo cual tampocco es el caso)). Por tanto, las
l tcnicas Monte
M
Carlo (simulacin
(
esttocstica) no son
s aplicablees aqu en form
ma directa.
Se sugiere el
e siguiente enfoque. Se realliza un pronsstico Monte Carlo usando
errrores distribuiidos en formaa normal para los coeficienttes y el trminno del error
adiitivo, pero conn los resultadoos de la regressin lineal de la ltima iteraacin con el
fin de proporccionar estimaaciones para los errores estndares. Como una
ilustracin, conssidrese la sigguiente ecuaccin de regressin no lineall:

Deespus de que se ha estimaddo la ecuacinn y se ha calcuulado un pron


nstico T+1,
se calcula el error estndar dee pronstico como
c
sigue:
1. Se reescrribe la ecuacin como:

don
nde se estableece que 0, 1, 2 y t son varriables aleatorrias distribuid
das en forma
norrmal con meddia 0 y desvviaciones estn
ndar iguales a los errores estndares
calcculados a partirr de la regresin lineal corresppondiente a la ltima iteracin
n del proceso

de estimacin.
2. Se generran nmeros aleatorios (dee las distribucciones normaales apropia
dass) para 0, 1, 2 y T+l paara usarlos paara el pronstico T+1. Se calcula
c
este
proonstico comoo correspondee.
3. Reptasee el paso 2 unnas 100 o 200 veces. Usee la desviacin estndar
mu
uestral de la distribucin
d
reesultante de valores
v
para T+1 como el error estndarr del pronstico. Entonces, este error estndar aprooximado del pronstico
pueede usarse paara calcular inntervalos de confianza.
c

284

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

No hay
y garanta de que este mtoodo proporcioonar incluso
o una aproxim
macin cercanna al error estndar de pron
nstico verdaddero. Sin emb
bargo, al mennos
proporcionaa alguna meddida de la connfianza del proonstico.

EJEMPL
LO 10.1

Funcin de consumo
c

En este ejem
mplo se estim
ma una funcin
n de consumo que es no linneal en los coeeficientes. El objetivo
o
es reelacionar el coonsumo real aagregado (dlar constante)) C
con el ingreeso disponiblee real agregaddo YD en Estaados Unidos, usando datos de
series de tieempo trimestrrales. Tambin
n nos gustaraa probar la hip
ptesis de quee la
propensin marginal
m
a connsumir (MPC, marginal prop
opensity to con
nsume), la cuall se

define comoo:

declina connforme se incrrementa el ing


greso disponibble. Esta hiptesis es fcil de
apoyar conn el uso de ddatos de cortee transversal (ejecutando la
l regresin del
d
consumo co
ontra el ingreeso para grupoos con niveless diferentes de
d ingreso), peero
no usando datos de seriees de tiempo..
De mannera tpica, sse estima la siguiente funccin de consuumo, la cual es
lineal en loss coeficientess:
C = 0 + 1YD
Y + 2YD2 +
Esperaram
mos que 1 sea positiva. Si se
s estima la eccuacin usanddo datos de coorte
transversal,, por lo geneeral, resultar un valor siggnificativo y negativo de 2,
mientras quue si se usan llos datos de series de tiemppo, la estimaccin de 2 pueede
ser positivaa.
Como alternativa,
a
estimamos la siguiente
s
funccin de consu
umo no lineall:
(100.7)
Los datos de
d series de tieempo trimestraales que se esttn usando abbarcan el perioodo
1947-1 a 19995-3. La estiimacin se reaaliza mediantte el proceso de
d linealiza-ciin
iterativa. Usaremos
U
el valor 1.0 coomo una connjetura iniciaal para los ttres
coeficientess (esperaramos que 1 y 2 estn cerca de
d este valor, pero
p no tenem
mos
expectativa respecto al vaalor de 0).
La connvergencia ocurre despus de 22 iteraciiones. La ecu
uacin no lineeal
estimada ess:
(100.8)

CA
APTULO 10: Estim
macin no lineal y de mxima verosimilitud

285

Lo
os errores estndares para 0, 1 y 2 son 16.71, 0.02211 y 0.0126, respectivameente. Como reesultado, cadaa una de las esstimaciones dee coeficiente es
e altamente
siggnificativa en el nivel del 55%. Adems, R2 es igual a 00.999.
Por comparracin, tambin se estim la
l siguiente reegresin lineaal (los erroress estndares estn
e
entre paarntesis):
C = -14.9255 + .918 YD
D
(7.031)

R2 = .998

(10.9)

(.0030)

s = 39..23

Ntese que la MPC


M para esta ecuacin lineal es una consstante, 0.918. Para
P nuestra
ecuuacin no linneal, sin embaargo, la MPC es:

El valor medio de
d YD es 21655 y en este valoor MPC es 0.9917. Obsrvesee que MPC
declina conform
me se incremeenta YD; para YD igual a 6600, MPC es 0.805.
0

10.2

ESTIMACI
N POR M
XIMA VERO
OSIMILITUD
D
El enfoque de mxima
m
verossimilitud se describe en forrma breve en el apndice
2.22. En esta secccin mostrarremos, en form
ma amplia, cmo puede applicarse este
priincipio bsicoo a la estimaciin de modeloos economtrricos. En los captulos
c
6y
7 se observ que
q la estimaacin de mnnimos cuadraados ordinariios produce
esttimadores que en ocasionees son ineficiientes o inconnsistentes. Aqqu veremos
qu
ue una gran veentaja de la estimacin de mxima veroosimilitud es que bajo un
conjunto amplioo de condicioones los estim
madores de los parmetros son consistenntes y (para muestras
m
granndes) asintticcamente eficientes. A conttinuacin se
describe la apliccacin del ennfoque de mx
xima verosim
militud a modeelos lineales
y luego
l
a modelos no linealees.

10
0.2.1

El enfoque de mxima verosimilitu


v
ud

Coomenzamos el
e anlisis conn el modelo dee regresin linneal

286

PARTE DOS: Mod


delos de regresin de una sola ecuacin

Sabemos quue cada Yi esst distribuidaa en forma normal con media


m
+ X
Xi y
varianza 2. La distribuciin de probabbilidad puede escribirse en forma explcita
como:

La funcin de verosimilitud es el prooducto de las probabilidad


des individualles
tomando toddas las N obseervaciones. Enn este caso la funcin de veerosimilitud ess:

Con la estim
macin de mxima verosiimilitud, ahorra nuestra meeta es encontrrar
los valores de
d los parmettros , y 2 que
q tienen mayyor probabilidaad de generar las
observacionnes mustraless Y1, ..., YN. Esto
E
se logra maximizandoo la funcin de
verosimilituud dada antes con respecto a cada uno de
d los parmeetros. Para haccer
esto es ms conveniente ttrabajar con el
e logaritmo dee la funcin de
d verosimilituud.
LA funcin lo
og-verosimilittud est dada por:
p

Maximizar log L es equiivalente a maaximizar L debbido a que la transformaciin


logartmica es montonaa y creciente [para dos vallores cualesqu
uiera de la fuuncin, c1 y c2, si c1 > c2, entonces log
g(c1) > log(c2))]. Para enconntrar el mxim
mo
diferenciareemos la funcin log-verosim
militud con reespecto a cadaa uno de los trres
parmetros desconocidoss, luego iguallaremos las derivadas
d
a ceero y resolverremos.
Diferen
nciando parciaalmente la ecuuacin (10.10), con respectto a , y 2 y
estableciend
do las derivaddas igual a cerro se obtiene::
(10.111)

(10.112)

(10.113)

CAP
PTULO 10: Estima
acin no lineal y de
e mxima verosim
militud

287

Laa solucin a laas ecuaciones (10.11) a (10.13) produce los


l siguientes estimadores
de mxima veroosimilitud:

Ess evidente quee los estimadorres de mxim


ma verosimilituud de y sonn idnticos a
loss estimadores de mnimos cuadrados.
c
Poor consiguientte, da como reesultado que
' y ' son mej
ejores estimaddores insesgaados lineales. Sin embargoo, 2' es un
esttimador sesggado (aunquee consistente) de 2. Para obtener unn estimador
inssesgado, neceesitamos diviidir el numerrador entre N - 2, ajustan
ndo para los
graados de libertaad, como se eexpuso en el captulo 3. La aplicacin dell enfoque de
mxima verosim
militud a la esstimacin de modelos
m
no liineales se muuestra a continnuacin:
Supngase que un modeelo general esst dado por

do
onde est disstribuido en foorma normal y satisface toddas las otras suposiciones
s
del modelo dee regresin liineal bsico. Entonces, ppara cada un
na de las N
ob
bservaciones en
e Y y las X coorrespondienttes, podemos escribir la disstribucin de
proobabilidad dee Y, dadas las X y , como:

do
onde exp repreesenta la funccin exponenncial. Entoncees, la funcin log- verosimiilitud para tod
das las N obseervaciones esst dada por:

(T
Todas las sum
matorias son calculadas
c
sob
bre las observvaciones i = 1, 2, ..., N.)
Al diferencciar la ecuacin (10.14) coon respecto a cada una dee las y 2,
igu
ualando a 0 y resolviendo, obtendremo
os un sistemaa de p + 1 ecu
uaciones no
lin
neales con p + 1 incgnitas.. Si estas ecuaaciones son linneales, como en
e el modelo
de regresin bsico, ser fciil calcular lass soluciones; ees decir, las estimaciones
e
de mxima veroosimilitud parra cada uno de
d los parmeetros. Sin embbargo, si las
ecu
uaciones no son
s lineales, el proceso de solucin
s
es m
ms complejo y deberemos
usaar un procediimiento numrico similar al
a de la seccin 10.1.1.

288

PARTE DOS: Mod


delos de regresin de una sola ecua
acin

Cualquiiera que sea el procedimiennto numrico que se utilicee para encontrrar


la solucin, el estimador de mxima verosimilitud
v
tiene varias propiedades
p
d
deseables:
1. El esstimador es coonsistente.
2. El esstimador es assintticamentte eficiente.
3. Las estimaciones
e
de las variannzas (asintticcas) de los esstimadores puueden determiinarse como uun subproduccto del processo de estimaciin.
Las estimacciones de la vvarianza de la
l estimacin de cada parmetro i esttn
dadas por:

el cual es ell valor esperaado de la seguunda derivadaa de la funcin log-verosim


militud con resspecto a i. Las
L estimacionnes de covariaanza entre esttimaciones dee i
y j se obtieenen del mism
mo modo diferrenciando la ffuncin log-veerosimilitud con
c
respecto a i y luego con rrespecto a j.
La funcin I(), la cuaal describe loss componentess de la matriz de informacin,
proporcionaa una medida de la curvatuura de la funccin log-verosimilitud. Enttre
mayor sea esta
e curvaturaa las varianzaas estimadas ssern mayores.

10.2.2

L prueba de razn de
La
d verosimiilitud

Supngase que
q se est usando la estim
macin de mxima verosim
militud y deseeamos probar si ciertas resstricciones dee parmetro estn apoyadaas por los datoos.
Por ejemplo
o, si queremoos probar la hiptesis
h
nula de que algunnas de las son
iguales a 0, tenemos una pprueba til y muy
m convenieente, llamada prueba
p
de razzn
de verosimillitud. Para apllicar esta prueeba, suponga qque L(UR) reppresenta el vaalor
mximo de la funcin loog-verosimilitu
ud cuando noo se aplican laas restriccionees,
mientras quee L(R) repressenta el valor mximo
m
cuanddo se aplican las
l restricciones.
La razn de verosim
militud est daada por:

El denoominador se bbasa en un modelo


m
sin restricciones; como
c
resultaddo,
debe ser al menos tan ggrande como el numeradoor. Por consigguiente, deebe
encontrarse entre 0 y 1. S
Si la hiptesis nula es verdaadera, esperarremos que est
cerca de 1; si no es verdadera, esperarremos que est cerca de 0. Por lo tannto,
podramos rechazar
r
la hiiptesis nula cuando es ssuficientemen
nte pequea.
La prueeba de razn de verosimillitud que pueede aplicarse para evaluar la
hiptesis nu
ula se basa enn el hecho dee que para muuestras de tam
mao grande..

CA
APTULO 10: Estim
macin no lineal y de mxima verosimilitud

289

don
nde m es el n
mero de restrricciones. Paraa hacer la prueeba tan slo comparamos
el valor
v
calculad
do de m2 anterrior con el valor crtico en, por ejemplo, un nivel de
sig
gnificancia del 5%. Si m2 ees mayor que el valor crtiico, podemos rechazar la
hip
ptesis nula dee que las restriicciones no see aplican, es decir, que las no son 0.
Supngase el caso de (co
omo en la secccin 7.5) quee estamos esttimando el
mo
odelo
(10.15)
y deseamos
d
prob
bar las restriccciones de que 2 = 0 y 3 = 0.
0 Entonces, el
e modelo
resstringido est dado por:
(10.16)
El valor de L(UR) se obtiene maximizando
m
la funcin de verosimilitud
d consistente
con
n la ecuacin (10.15), mien
ntras que el vaalor de L(R) est dado maxiimizando la
fun
ncin de verosimilitud asocciada con la ecuacin
e
(10.16).
En la mayo
or parte de laas situaciones que implican modelos lineales, en
esp
pecial aquello
os que implican muestras de
d tamao grrande, las pru
uebas F ms
tradicionales (ex
xpuestas en el captulo 5) y las pruebas -d
de razn de veerosimilitud
deb
beran generaar resultados muy parecid
dos. Dependieendo del pro
ograma para
com
mputadora qu
ue se utilice, lla prueba de razn de vero
osimilitud pueede ser ms
diffcil de aplicaar, pero es m
ms atractiva cuando estn
n involucradaas muestras
graandes, en parte debido a qu
ue no requieren
n d una supo
osicin de norrmalidad.3

10
0.2.3

Un
na aplicaci
n: el mode
elo de Box--Cox

Un
n modelo no lineal
l
interesaante, atribuid
do a G.E.P. Box y D.R. Co
ox, para el
mo
odelo de dos variables
v
est dado por la siguiente
s
ecuaacin:4

3
Para una com
mparacin generall de las pruebas F (un caso especiial de una pruebaa de Wald ms
genneral), las pruebas de razn de verrosimilitud y las pruebas del multtiplicador de Lag
grange, vase
Robben F. Engle, "W
Wald, Likelihood Ratio, and Lagraange Multiplier Tests
T
in Economeetrics", en Z.
Grilliches y M.D. Inttriligator (eds.), Randbook
R
of Econnometrics, vol. II (Amsterdam: Elssevier Science
Pub
blishers, 1984), caaptulo 13.
4
Vase G. E. P. Box y D. R. Coxx, "An Analysis off Transformationss", Journal of the Royal
R
Statistical
Socciety, Serie B, vol. 26, pp. 211-243, 1964.

290

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

Cuando = 1, esto se redu


duce a:

el cual es el modelo de regresin lineall bsico (con variable


v
depeendiente Y- 1 y
variable inddependiente X - 1).

Sin embbargo, cuandoo = 0, el an


nlisis es ms complejo poorque (Yi - 1))/
parece indeterminada. Noo obstante, ob
bsrvese que ppodemos usarr una expansin

en series de Taylor
T
para exxpresar Yi co
omo:

Resulta que::

Y, para = 0,
0

Por tanto
o, en el caso eespecial en ell que = 0, laa transformaciin de Box-Coox
produce el modelo
m
log-linneal
log Yi = + log Xi + i
El modeelo de Box-Coox es una espeecificacin noo lineal generaalizada, y com
mo
tal tiene variios usos. Prim
mero, uno puede hacer estim
macin de mxima verosim
militud para en
ncontrar los pparmetros dee un modelo no
n lineal en ell que las poteencias de cadaa una de las vvariables sonn estimadas enn lugar de seer especificaddas
arbitrariameente. De hechho, en un moddelo ms geneeral, puede peermitirse que el
parmetro vare de una vvariable a otra. Segundo, uuno puede usaar estimacin de
mxima verrosimilitud paara probar si el modelo liineal o el moodelo log-lineeal
proporciona una mejor esspecificacin del modelo. E
En cualquier caso,
c
la funcin
log-verosim
militud apropiaada est dada por:5

5
El primeer trmino surge ddebido a que hay
y un cambio de vaariables al moverrse de la funcin de
-1
distribucin de a la funcin de distribucin de Y.
Y De manera esppecfica, d/dY = Yi , de modo que
q
log(d/dY) = ( - l)log Y.

CAPTULO 10: Estimacin no lineal y d


de mxima verosim
militud

291

Unna comparaci
n de los valorres de L cuanddo = 0 y = 1 nos permite elegir el
mo
odelo que se ajuste
a
mejor a los datos.
Supngase que no se diispone de un programa dee mxima veerosimilitud
com
mpleto y que slo
s estamos interesados en
n elegir entre los modelos lineal
l
y loglineeal. En este caso
c
particularr, puede usarrse un enfoque de mnimoss cuadrados
parra solucionar el problema. Para hacerloo renormalizam
mos las obserrvaciones Y
origginales por laa media geom
mtrica de Y, Yg. Entonces,, se define Yg de manera
imp
plcita por la siguiente ecuuacin:

Lass variables Y normalizadas


n
se vuelven ahhora:

As podemos coomparar el meejor ajuste dee los siguientees modelos liineal y loglineeal en forma directa (asum
miendo que loos errores estn distribuidoos en forma
norrmal):
Lin
neal:

Y* = ' + 'X* + '

Logg-lineal:

log Y* = + log
l X* +

La comparacin
n directa es poosible debido a que:

De este modo ell primer trmiino en la funccin log-verossimilitud asocciada con la


esp
pecificacin dee Box-Cox es igual a 0 paraa la versin log-lineal del modelo.
m
Pero
el primer
p
trminno tambin es 0 para la verrsin lineal, dado que en esste caso =
1. Como
C
resultad
do, la estimaccin de mxim
ma verosimilittud y mnimoss cuadrados
proodujeron resulltados idnticos cuando loss datos son noormalizados. (Lo mismo
dem
mostr ser cieerto en el apndice 2.2 cuaando se comppararon la esttimacin de
mn
nimos cuadraados y la de m
mxima verossimilitud.) Laa ecuacin coon la menor
sum
ma de cuadrad
dos del error o, de maneraa equivalente, con la mayorr R2 dar la
mejjor especificaccin.6

6
Las tcnicas de mnimos cuaadrados como laas que se describben aqu generann estimaciones
sesggadas de los erro
ores estndares. V
Vase John J. Sp
pitzer, "Variancee Estimates in Models
M
with the
Box
x-Cox Transform
maton: Implicationns for Estimationn and Hypothesis Testing", Review
w of Economics
andd Statistics, vol. 666, pp. 645-652, nooviembre de 1984
4.

292

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

EJEMPLO
O 10.2

Energa, clim
ma y el valor de
e la vivienda re
esidencial

El valor de las residenciaas unifamiliarres es determiinado en partee por los costtos


de producciin de viviennda y por el suministro
s
y demanda
d
de atributos
a
de las
l
mismas casaas, o el vecinddario local, y de
d la regin enn la que se loccalizan las casaas.
Como parte de un estudioo ms amplio de
d la relacin entre los costoos de energa, el
clima y la demanda
d
de vivienda, J. M. Quigley y D.
D L. Rubinfelld estimaron un
u
modelo de valor
v
de la vivvienda usando
o la especificaacin de Box--Cox.7
El modeelo relaciona el
e valor en el mercado de un
u hogar unifaamiliar V con un
conjunto de atributos de tamao y callidad h1, un coonjunto de atrributos de callefaccin, airee acondicionado y atributoss estructuraless relacionadoss h2 y un par de
medidas clim
mticas W dee la siguiente manera:

El modelo fue
f estimado uusando una muestra
m
de 5 900
9 casas (co
on un valor prromedio de 788 000 dlaress) localizadas en 25 reas m
metropolitanaas en 1980. L
Los
coeficientess y las corresppondientes razzones t generaadas por el mtodo
m
de mxxima verosim
militud para loss atributos im
mportantes se dan en el cuaadro que siguee:

Estimaciones
s de mxima verrosimilitud
Variable

Coeficiente
Razn t

Tamao y atrib
butos de calidad
d
Ao de con
nstruccin
Nmero de
e baos
Nmero de
e habitaciones

Cochera (11 s, 0 no)


Plagas presentes (1 s, 0 no)
Vecindario (4 = excelente)
Atributos de ca
alefaccin y aire acondicionado
Stano (1 s,
s 0 no)
Aire acondicionado central (1 s, 0 no)
Estufa cale
entadora de aire (1 s, 0 no)
Calefactor de vapor (1 s, 0 no)
Atributos de clima
Clima clido (nm. das gra
ados)
Clima fro (nm.
(
das grado
os)
Intercepto

R = .48

.115
.124
.194
.047
.028
.058

2.61
2.36
2.71
2.11
1.90
2.27

.027

2.21

.059
.045
.084

2.25
1.77
2.06

.048

1.42

.042
6.007
-.10

1.52
6.14
2.62

7
John M. Quigley y Danniel L. Rubinfeldd, "Unobservablees in Consumer Choice:
C
Residenttial
Energy and the Demand for Com
mfort", Review of Economics and SStatistics, vol. 71, pp. 416-425, agoosto
de 1989.

CAPTULO 10: Estimacin no lineal y de mxima verosimilitud

293

La mayor parte de los atributos de vivienda individuales son estadsticamente significativos y tienen el signo que se esperara. Las habitaciones adicionales, en particular baos, aumentan de manera considerable el valor de la casa.
Un sistema de calefaccin central (aire caliente o calor por vapor) es bastante
valioso, al igual que el aire acondicionado central. Por ltimo, las casas que se
encuentran en climas ms moderados son considerablemente ms costosas que
las que estn en climas muy clidos o muy fros.
El valor estimado del parmetro de Box-Cox es bastante pequeo, -0.1,
pero es, en forma significativa, diferente de 0. Esto sugiere que una especificacin log-lineal proporcionara una aproximacin razonablemente cercana al
modelo no lineal de mejor ajuste.

10.2.4

Prueba del multiplicador de Lagrange

Se han analizado dos procedimientos para probar hiptesis: la prueba F o la


prueba de Wald (captulo 5) y la prueba de razn de verosimilitud. Recurdese
que la prueba de Wald comienza con un modelo no restringido y pregunta si la
imposicin de un conjunto de restricciones (por ejemplo, que un grupo de parmetros de regresin es igual a cero) disminuye de manera significativa el poder
explicativo del modelo de regresin. Desde la perspectiva de la prueba de Wald,
la hiptesis nula la aport el modelo restringido y la hiptesis alternativa est
dada por el modelo sin restriccin. En la estructura de la regresin lineal, la
significancia se evala usando una prueba F. La prueba de razn de verosimilitud
tambin proporciona una prueba de la hiptesis nula dada por el modelo
restringido pero lo hace usando una prueba que depende de la distribucin ji
cuadrada. La prueba de razn de verosimilitud (LR, likelihoodratio) es atractiva
porque depende del principio de mxima verosimilitud.
El anlisis de la prueba del multiplicador de Lagrange (LM, Lagrange multiplier) comienza con la hiptesis nula que es proporcionada por el modelo restringido. Esta prueba examina si un movimiento en la direccin de la hiptesis
alternativa puede mejorar en forma significativa el poder explicativo del modelo
restringido. La prueba LM se basa en la tcnica de maximizacin restringida, en
la que se usa un multiplicador de Lagrange para proporcionar una estimacin
del grado en el que la imposicin de una restriccin altera las estimaciones de
mxima verosimilitud de un conjunt de parmetros. Consideremos que UR es el
estimador de mxima verosimilitud de los parmetros del modelo sin restriccin
y supongamos que R representa los parmetros asociados con el modelo
restringido. Entonces nuestro objetivo es maximizar ln L(UR) sujeto a la restriccin
de que UR = R. Esto equivale a maximizar
ln L(UR) (UR R)
donde es el multiplicador de Lagrange. De manera intuitiva, el valor mximo
de esta funcin se lograr cuando la restriccin se cumpla en forma exacta. El

294

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

multiplicadoor de Lagrangge mide la "vaaluacin" marrginal asociadda con la restriiccin: entre mayor
m
es , seer mayor la reduccin
r
en eel valor mxim
mo de ln L(UUR)
a medida quue la restricciin se cumplaa.
Para observar esto dee manera form
mal, ntese quue una de las condiciones
c
dde
primer ordeen para la maxximizacin ess:

de modo quue es la penndiente de la funcin de vverosimilitud.. Si la hiptesis


nula de quee las restriccioones son vliddas no se rechhaza, los parmetros restriingidos estarnn cerca de los parmetros siin restricciones y el valor dee ser pequeo.
Sin embarggo, si las resttricciones se cumplen significativamennte, el costo de
imponer la restriccin,
r
el cual est dad
do por , ser ggrande. La pru
ueba LM, quee se
basa en la magnitud
m
de ,, en ocasioness es llamada pprueba de punntuaciones.8
La prueeba del multipplicador de Lagrange
L
puede aplicarse con
c facilidadd al
caso especiaal en el que se considera laa posibilidad de agregar vaariables expliccativas adicioonales a un m
modelo de reggresin.9 Supponga que se ha estimado el
modelo resttringido:
(10.117)
y se consideera la posibiliddad de agregaar algunas o toodas las q variables adicionaales
que estn coontenidas en el modelo sinn restriccionees:
(10.118)
La prueeba del multipplicador de Laagrange de la hiptesis de que
q cada una de
las q variablles adicionalees tiene un coeeficiente de 0 se realiza calcculando primeero
los residuales del modeloo restringido dado por la eecuacin (10.17). De maneera
especfica.

Ahora conssideraremos la regresin de


d estos residuuales en todaas las variablees
explicativass en el modeloo sin restricciiones:

En geneeral, la estadsticaa de prueba para la prueba LM estt dada por:

donde e I( ), la matriz de infoormacin, se calcuulan por diferencciacin de la funccin de log-veros imilitud.


9
Vase, por
p ejemplo, R. Raamanathan, Statistical Methods in E
Econometrics (Sann Diego: Academ
mic
Press, 1993), pp.
p 276-277.

C
CAPTULO
10: Estiimacin no lineal y de mxima verosim
militud

295

Si to
odas las variaables adicionnales fueran "irrelevantes",, los coeficien
ntes seran
ceroo en las variab
bles k q que se agregan cuuando se pasaa del modelo restringido
r
al modelo
m
sin resstricciones. Sinn embargo, sii algunas o todas las variab
bles adicionalees en el modelo sin restriccciones son detterminantes siignificativas de
d Y, esperam
mos que sus cooeficientes seaan estadsticam
mente significcativos y, porr tanto, que
la ecuacin (10.119) se estimaar con un bueen ajuste.
La prueba del
d multiplicaador de Lagraange se deterrmina con baase en una
prueeba de significancia de la regresin
r
en la ecuacin (10.19). Especficamente,
la estadstica de la prueba LM
M, la cual est dada por:
(10.20)
sigu
ue una distribu
ucin ji cuadrrada con q (el nmero de rrestricciones)) grados de
2
libertad. N es el tamao
t
de la m
muestra, R0 ess la R2 asociadda con la regrresin en la
10
ecuaacin (10.19).
Si la estadsstica de pruebba calculada es mayor quue el valor crtico de la
distrribucin ji cuuadrada, se reechaza la hip
tesis nula dee que el modeelo restringido
o es vlido. Al
A hacerlo, hayy que concluirr que algunas de las variab
bles adicionalees deberan haberse
h
incluiido en el moddelo de regreesin. Un exaamen de la
estaadstica t asocciada con la eecuacin (10.19) puede daar un indicio de cules
variiables podran
n elegirse, perro no hay unn acuerdo conn la eleccin de
d la regla
empprica que debbera usarse.
La prueba deel multiplicaddor de Lagrange se usa coon frecuenciaa como un
meddio para probaar la heteroceedasticidad; que
q est dada por la pruebaa de White
en la seccin 6.1.. Para generallizar un poco a partir de esaa exposicin, supngase
que uno ha estim
mado una regreesin lineal y que nos interresa saber si la
l varianza
del error es una funcin
f
de cuualquiera de dos
d variables exgenas,
e
X o Z. White
sugiiere que se esppecifique la hheterocedasticiidad como la siguiente funcin de las
variianzas del erro
or:

La hiptesis
h
nulaa de no heteroocedasticidad est dada porr 1 = 2 = 3 = 4 = 5
= 0 en la ecuacin (10.21). Paara realizar la prueba
p
de Whhite usamos el
e cuadrado
de los
l residuales de la ecuacin original coomo estimaciiones de 2. De
D acuerdo
con la prueba dell multiplicadorr de Lagrangee, calculamos NR2 a partir de
d la regresin
n asociada con
n la ecuacin (10.21). staa seguir una distribucin ji cuadrada
con 5 grados de libertad, el nmero de restricciones asoociadas con laa hiptesis
nulaa.

10

Para una deriv


vacin de esta pruueba, vase Engle, op. cit.

296

PARTE DOS: Mo
odelos de regresi
n de una sola ecu
uacin

10.2.5

Comparaccin de las pruebas de


e Wald, de razn de
verosimilittud y del multiplicadorr de Lagrange

En su form
ma ms generral la prueba de
d Wald guarda una relacin estrecha taanto
con la prueeba de razn de
d verosimilittud como con la prueba dell multiplicadoor de
Lagrange,, dado que taambin se bassa en la diferrencia entre las
l estimacioones
de parmeetro restringidas y sin restriiccin.11 En el
e caso especial del modeloo de
regresin lineal,
l
la prueeba de Wald, como se desccribi en el caaptulo 5, se sims
plifica en una
u prueba F
F:

donde R2URR es R2 para el modelo sin reestricciones y dde manera corrrespondiente ppara
R2R. En el caso especiaal en el que el
e modelo sin restricciones es el modeloo de
regresin lineal
l
de dos variables y q = 1, la prueba de Wald se
s simplifica ms
a:

En el casoo equivalente,, la prueba LM


M est dada por:
p

donde R0 se
s calcula a paartir de la regresin de los residuales dee una regresinn de
Y sobre unna constante (las
( desviacio
ones en Y) y soobre la variabble independiente
X.
Por lltimo, la prueeba de razn de verosimillitud en este caso simple est
dada por:
LR = N ln (1 R 2 UR )
Es imp
portante seaalar que las trres pruebas qque se acaban
n de describir son
todas asinttticamente eequivalentes; es
e decir, darnn resultados de
d prueba iguuales
si se permiite que el tam
mao de la mueestra se increm
mente sin lm
mite. Sin embaargo,
como reglaa general, difi
fieren dentro de
d las muestraas y pueden geenerar pruebaas de
significanccia diferentes y en ocasionees conflictivass.12 En la meddida en que eestas
pruebas diifieren para uuna muestra determinada
d
y el modelo es
e lineal, la
11
La prrueba de Wald esst dada por W = (UR R)2 I(UR), donde I( ) es la matriz
m
de informaacin.
La estadsticaa de prueba siguee una distribucin ji cuadrada conn grados de liberrtad iguales al nmero
de restriccionnes.
12
Son equivalentes
e
cuanndo la funcin loog-verosimilitud ees cuadrtica, com
mo por ejemplo, en el
caso de errorres distribuidos een forma normall.

CAP
PTULO 10: Estima
acin no lineal y de
e mxima verosim
militud

297

prueeba de Wald siempre dar la estadsticca de prueba mayor y la prueba


p
LM
siem
mpre dar la menor.
m
Por coonsiguiente, siempre
s
que laa prueba LM rechaza la
hiptesis nula de que el modelo restringidoo es vlido, tam
mbin lo harn las otras
prueebas.13
Cuando estn implicadoss modelos linneales, es fccil aplicar la prueba de
Walld debido a quue es ms sim
mple estimar los
l modelos rrestringido y sin restriccionnes. Sin embaargo, cuando eestn implicaddos modelos m
ms generaless, la prueba
del multiplicadoor de Lagrangge puede prooporcionar unna alternativaa atractiva,
dado que dependde en forma directa
d
slo dee la estimacin del modeloo restringido. Adems, debbido a que se construye sobbre los residuuales del modeelo restringidoo, puede usarrse como un m
medio para verificar
v
la ro bustez del modelo
m
ante
una variedad de alternativas.
a
S
Se ha observaado cmo pueede usarse la prueba
p
LM
com
mo una pruebaa de especificcacin que im
mplique variaables omitidass. Tambin
puede usarse com
mo una pruebba para la heteerocedasticidaad, sesgo de ecuaciones
e
simuultneas o la presencia de no linealidades, como lo illustra el siguiiente ejemplo.

EJEMPLO 10.3
3

Prue
eba de la linea
alidad de una fu
uncin de cons
sumo

En el
e ejemplo 100.1 se muestraa cmo se usan los mnimos cuadrados no
n lineales
paraa estimar unaa funcin de cconsumo no lineal
l
de la foorma

Con
nsidrese que deseamos proobar la hiptessis nula de que la funcin de
d consumo
es liineal; es decirr, que 2 = 1.
La prueba dee Wald se apllica con bastante facilidad; en este caso la prueba
de Wald
W
es equiv
valente a unaa prueba t en la que el valoor t est dadoo por:

donnde el error esstndar se calcula a partir de la ltima iiteracin lineaalizada del


proccedimiento de estimacin de mnimos cuadrados noo lineales. Daado que es
mayyor que el vallor crtico de la distribucin t, 1.96 paraa una prueba de
d muestra
grannde bilateral con
c un nivel dde significanciia del 5%, se rrechaza la hipptesis nula
de una
u funcin de
d consumo llineal a favorr de la especiificacin no lineal.
l
Esta
prueeba de Wald, en particular, es un caso esspecial de unaa prueba ji cuaadrada ms
general; se calccula que la estadstica ji cuadrada ees 202.83, lo
l cual es
aprooximadamente igual al cuaadrado de 14,,25. Como enn el caso de laa prueba t,
rechhazamos la hipptesis nula de un modelo lineal
l
con un nivel
n
de signifficancia del
5%.
13
Vase Engle, op. cit., quien seeala las complejidades involucraddas al decidir cul de las tres
prueebas es la ms appropiada.

298

PARTE DOS: Mod


delos de regresin de una sola ecua cin

Para prrobar la lineaalidad usando


o una prueba de razn dee verosimilituud,
estimaremoos las formas lineal y no liineal de la fuuncin de connsumo haciendo
uso de un prrocedimiento de mxima veerosimilitud. La
L prueba LR
R est dada poor:

la cual, aun
nque menor qque la estadsstica ji cuadrrada asociadaa con la prueba
de Wald, sig
gue siendo alttamente signifficativa con ell nivel del 5%
% con 1 grado de
libertad, de acuerdo con la tabla de laa distribucinn ji cuadrada.
Por ltim
mo, se realizaa una prueba LM
L de la supoosicin de linealidad. En esste
caso, se obttiene una estaadstica ji cuad
drada de 194.6, la cual tam
mbin es signiificativa.

10.3

MODELO
OS ARCH Y GARCH
En el captu
ulo 6 se expuuso el problema de la heterocedasticid
dad y se mosttr
cmo las coorrecciones paara las perturbbaciones del error heteroceedstico puedden
conducir a estimaciones
e
de parmetroo ms eficientees. Aqu nos enfocaremos en
gran medidda a situacionees en las que la varianza del
d trmino deel error vara en
forma direccta con una o ms variabbles independdientes. Por ejemplo, en la
siguiente eccuacin de reggresin:
(10.222)
la varianza de t puede ser
s proporcionnal a X22t. En este caso pod
dramos usar un
procedimiennto de mnimoos cuadrados ponderados een el que dividdimos las varriables de la izzquierda y dee la derecha en
ntre X2t y lueggo estimamoss la ecuacin de
regresin trransformada

con mnimo
os cuadrados oordinarios. El trmino
t
del err
rror transformaado *t = t /X2t es
homocedsttico y, por tannto, los mnim
mos cuadradoos ordinarios producirn
p
esstimaciones de parmetro eeficientes.
En alguunas aplicacioones puede haaber razones para
p creer quee la varianza del
d
trmino dell error no es una funcin de una variaable independdiente sino que
q
vara con ell tiempo de tall forma que depende
d
de lo grande que fu
ueron los errorres
en el pasado
o. Como ejem
mplos de esto se
s incluyen loos modelos dee inflacin, tassas
de inters y rendimientoos en el merccado de valorres. Con frecuencia en esttas
aplicaciones hay evidenccia de un "agruupamiento" dee errores granndes y pequeoos.
En el modeelado de tasas de inters, po
or ejemplo, ess probable quue se encuentrren
periodos dee volatilidad aalta (y erroress grandes) segguidos por peeriodos de

CA
APTULO 10: Estim
macin no lineal y d
de mxima verosim
militud

299

vollatilidad baja (y errores meenores). En ottras palabras, hay una classe particular
de heterocedastiicidad presennte en la que la
l varianza deel error de reegresin depennde de la volaatilidad de loss errores en el
e pasado recieente.
Un modelo que se usa enn forma extennsa, para esa forma de hetterocedasticiddad fue elaboraado por Roberrt Engle,14 quiien sugiri quue el uso de unn modelo de
hetterocedasticid
dad condicionnal autorregreesiva (Arch) conducira a un incremeento de la eficciencia. El moodelo funcion
na de la siguieente manera:
Comenzarem
mos con la eccuacin (10.222) relacionanndo una variaable dependieente con (en este
e caso) dos variables inddependientes. Luego escrib
biremos una
seg
gunda ecuaci
n relacionanddo la varianzaa del trmino del error con la cantidad
de volatilidad
v
ob
bservada en peeriodos recienntes. La ms simple de estas ecuaciones
serra:
(10.23)
La ecuacin (100.23) dice quee la varianza de
d t , t2 , tienne dos componentes: una
connstante y las noticias
n
respeecto a la volaatilidad del lltimo periodoo, lo cual es
moodelado como
o el residual cuadrado deel ltimo periiodo (el trm
mino Arch).
Obbsrvese que enn este modelo t es heteroced
dstico, condiccional en t -1. Tomando
T
en
cueenta esta infoormacin acerrca de la heteerocedasticidaad condicionaal de t , se
pueeden obtener estimaciones ms eficientees de los parmetros 1, 2 Y 3.
La estimaciin de las ecuuaciones (10.2
22) y (10.23)) con frecuenncia se hace
conn mxima verrosimilitud. D
Dado el bajo costo
c
del poder de clculo, esto no es
muuy difcil. Porr consiguientee, los paquetees de program
mas de econom
metra para
com
mputadora ms usados haccen posible estimar modeloos Arch de estta clase con
muucha facilidad
d.
Dado que la
l varianza dde t en la eccuacin (10.223) slo deppende de la
vollatilidad del ltimo

periodoo, nos referirem


mos a este moodelo como Arch(
A
1). De
maanera ms geeneral, la varrianza podra depender dee cualquier cantidad
c
de
vollatilidades rezzagadas. Escriibiremos el modelo
m
Arch() como:
(10.24)
N
tese que en este
e caso los parmetros p + 1 del prooceso de variaanza deben
estimarse junto con los parmetros 1, 2 y 3 de la regresin, unna vez ms
usaando estimaciin de mxim
ma verosimilittud.
A menudo hay razn para
p
esperar que
q la variannza de t deppender de
vollatilidades paasadas que se remontan a una
u gran canttidad de perioodos. (Esto
succede en particcular en apliccaciones de fiinanzas que implican
i
el usso de datos
diaarios o semanaales.) El probblema en este caso es que ddeben estimarse una gran
canntidad de parmetros, y estto puede ser difcil de haccer con algunaa precisin.
Sin
n embargo, si reconocemos que" la ecuaacin (10.24) tan
t slo es unn modelo de
rezzago distribuiddo para t2, vem
mos que podem
mos remplazaar muchos de estos
e
valo14
R. Engle, "A
Autoregressive Coonditional Heterooskedasticity withh Estimales of thee Variance of
U.K
K. Inflation", Econnometrica, vol. 500, pp. 987-1008, 1982.

300

PARTE DOS: Mode


elos de regresin de
d una sola ecuaccin

res rezagadoos de t2 con sslo uno o doos valores rezzagados de t2. (Recurdesee el
anlisis del modelo
m
de rezago geomtrrico en el capptulo 9.) Estoo nos conducee al
modelo de heterocedastici
h
idad condicioonal autorregreesiva generaliizado (Garch)), el
cual tambinn puede estim
marse por mxima verosimiilitud.15 El moodelo Garch ms
m
simple es el modelo Garcch(l,l):

Ahora la varrianza del trm


mino del errorr tiene tres com
mponentes: unna constante, la
volatilidad del
d ltimo periodo (el trmino Arch)), y la variannza del ltim
mo
periodo (el trmino
t
Garch). Recuerde que, en el m
modelo de rezaago distribuiddo
geomtrico, mientras 1 sea menor que 1, podem
mos reescribbir la ecuacin
(10.25) comoo:

En otras palaabras, la variaanza de hoy depende de toddas las volatiliidades pasadaas,


pero con ponnderaciones qque declinan en forma geoomtrica.
En geneeral, se puede tener cualquier nmero de trminos Arch y cualquiier
nmero de trminos Garcch. El modelo Garch (p,q) se
s refiere a la siguiente ecuuacin para t2:

Por ltim
mo, la ecuacin (10.27) puede
p
generalizarse an ms
m incluyenddo
una o ms vaariables exgeenas o predeteerminadas com
mo determinanntes adicionalles
de la variannza del error. Por ejemploo, si X3t fueraa una variablee exgena, ppodramos inclluirla como pparte del siguuiente modeloo Garch(l,l):
(10.228)
Sin embargo
o, la adicin de
d variables exgenas
e
o prredeterminadaas a la ecuacin
para t2 debee hacerse conn cuidado. Sii X3t toma vaalores negativvos, esto puedde
causar que la varianza sea negativa paara algunas obbservaciones..
Del mism
mo modo com
mo se puede introducir varriables exgeenas o predeteerminadas en el lado derecho de la ecuaacin que describe t2, podeemos incluir t2
(o, de maneera alternativaa, la desviacin estndar t) en el ladoo derecho de la
ecuacin de regresin [eccuacin (10.22
2)]. En este caaso, se puede hacer esto si el
propsito dee la regresinn es explicar los rendimienntos de acciones financierras
como valores o bonos. La razn para essto es que uno esperara quee el rendimiennto
sobre una acccin financiiera fuera prooporcional al riesgo de la accin.
a
Por
15
Este mo
odelo fue introduucido por Tim Bo
ollerslev, "Generaalized Autoregre ssive Conditionaal
Heteroscedasticiity", Journal of Ecconometrics, vol. 31, pp. 307-327. 1986.

CA
APTULO 10: Estimacin no lineal y de mxima veros
similitud

301

ejeemplo, se puuede modelarr el rendimien


nto nominal en un ndice de valores,
coomo el ndice S&P 500 (RET
TURNt), com
mo dependientee de un trmin
no constante,
la tasa de inflaccin, y la variianza condiciional:
(10.29)
Enntonces, se puuede describir lla varianza t2 como un procceso Garch (pp,q), como en
la ecuacin (100.27). Un moodelo de este tipo (en el que
q el riesgo esperado es
su
ustituido por la
l varianza coondicional) see llama modeelo Arch-M (A
Arch en mediaa).16

EJEMPLO 10
0.4

Ta
asas de interss a largo plazo

Enn este ejemploo modelamoss el comportam


miento de la ttasa del bonoo corporativo
AA
AA relacionndola con vallores actualess y pasados dee una tasa de inters libre
dee riesgo a cortto plazo (la taasa de bonos de tesorera a tres meses) al igual que
coon el ndice de
d Produccin Industrial y la tasa dee inflacin dee precios al
maayoreo. La figgura 10.1 muestra la tasa del
d bono corpporativo AAA
A y la tasa de
bo
onos de tesoreera a tres messes desde 196
60 hasta princcipios de 19966. Obsrvese
qu
ue la tasa del bono,
b
por lo general,
g
es maayor que la tassa de bonos de
d tesorera y
tam
mbin tiende a suavizar las fluctuacionees a corto plaazo en la tasa de bonos de
tessorera. La tasa del bono rrefleja expectativas de valoores futuros de
d la tasa de
bo
onos de tesoreera (y por tantto, debera ser menos volttil que esa tasa) y tambin
inccluye una peequea primaa de riesgo que
q refleja la probabilidadd de incumpliimiento.
Figura 10.1
Tasa de bonos
s de
tesorera a tres
s meses
y tasa del bon
no
corporativo AA
AA.

16
Ha habido muchas
m
aplicacionnes de los modeloos Arch y Garch een las finanzas. Paara un panorama
y esbozo
e
de estas applicaciones, vasee Tim Bollerslev,, Ray Chou y Kennneth Kroner, "A
Arch Modeling in
Finnance: A Review of the Theory and Empirical Evdence", Journal off Econometrics, vool. 52, pp. 5-59,
1992.

302

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaciin

Ejecutareemos la regressin de la tasaa del bono AA


AA (RAAA) contra valorees
actuales
a
y rezzagados de la tasa
t de tesorera (R3), valores actuales y rezagados deel
ndice

de Prodduccin Indusstrial (IP), la tasa


t
de crecim
miento del nddice de Precioos
al
a Productor para
p
todas lass mercancas [GPW = (PW
W PW-1)/PW
W-1] y el valoor
rezagado
r
de la tasa del bono AAA. (L
La inclusin de la variablle dependientte
rezagada
r
imppone una estrructura de rezzago que decllina geomtriicamente, esta
estructura
e
suaaviza las flucttuaciones a coorto plazo en las otras variiables explicaativas.)
t
Despus de algunoss ensayos se eligi
e
la siguieente ecuacin, estimada conn
mnimos
m
cuadrados ordinaarios (las estaadsticas t esttn entre parntesis):

La figuraa 10.2 muestraa los residuales de esta reggresin. Obsrrvese el "agruupamiento" dee la volatilidadd; hay periodoos extendidoss en los que laa volatilidad es
e
bastante bajaa (por ejemploo, de 1962 a 1967) y perioddos en los quee la volatilidaad
es bastante allta (por ejempplo, de 1980 a 1988). Estoo sugiere que el trmino deel
error es cond
dicionalmentee heterocedsttico y, por tannto, puede ser representaddo
por un modello Arch o Garrch.
Para expplorar esta posibilidad, se reestim la eecuacin (10.330) usando uun
modelo Garcch(l,l) simplee para represeentar la variaanza del trm
mino del errorr.
Los resultadoos se muestraan a continuaccin:

Figura 10.2
2
Residualess de la
regresin de
d la tasa
del bono AAA.
A

CA
APTULO 10: Esttimacin no lineal y de mxima verossimilitud

303

Obsrvese que al incluiir esta represeentacin Garcch de la variannza del error


tuuvo muy pocoo impacto en cualquiera dee las estimaciiones de coefiiciente. Adem slo uno de los coeficiientes en la eccuacin Garcch es estadsticamente sigms,
niificativo. Nteese tambin qque el error esstndar de la rregresin se ha
h incrementaado (de 0.0011830 a 0.0018836). Esto noo significa quue el modelo no explique
taambin la tasaa de inters. Tan slo reflejaa el hecho de que cuando se
s estima una
eccuacin con errores
e
heteroccedasticos con
n mnimos cuuadrados ordinnarios (OLS,
orrdinary least squares), loss errores estnndares estimaados sern sessgados. (Este
puunto se analizz en el capttulo 6.)
Para exploorar el patrn de heteroceddasticidad mss a fondo, agrregamos una
vaariable exgenna a la ecuaciin Garch. Reetuvimos la estructura Garcch (1,1) pero
taambin incluim
mos en esta ecuacin el cambio en el vaalor rezagado de la tasa de
boonos de tesorrera a tres meses. Los resuultados de esstimar este moodelo fueron
loos siguientes:

El cambio rezzagado en la tasa de bono


os de tesorera a tres meses se aade,
siignificativameente, a la expplicacin de los cambios een la varianzaa del trmino
deel error de la regresin.
r
Addems, los coeeficientes en los
l trminos Arch
A
y Garch
ah
hora son altam
mente significativos desde el
e punto de vissta estadsticoo. Por ltimo,
haay un cambiio pequeo ppero notorio en la magnnitud de alguunos de los
co
oeficientes enn la ecuacin de regresin
n, y muchas dde las estadsticas t se han
inncrementado.

304

PA
ARTE DOS: Modelo
os de regresin de
e una sola ecuaci
n

EJEMPLO 10.5

Rendimiento
R
de
e acciones

Como
C
un seg
gundo ejemploo estudiaremos el rendimiiento mensuaal en el ndicee
de
d valores S&
&P 500. Prim
mero calculareemos este renndimiento usaando datos dee
Citibase
C
en ell ndice S&P 5500 (FSPCOM
M) y el divideendo produciddo en el ndicee
S&P
S 500 (FSD
DXP). Entoncces, el rendim
miento mensuaal se calcula como:
c

Comenzaremo
C
os por ejecutar una regressin OLS sim
mple del rendim
miento contraa
una
u constantee y dos variablles que en teoora tenderan a reducir el reendimiento: eel
cambio
c
en la tasa
t
de interss de bonos dee tesorera a trres meses, R
R3t (los precios
de
d acciones deberan
d
refleejar el valor presente desscontado de las gananciass
futuras
f
esperaadas y, por taanto, un increemento en la tasa de descuuento, en estee
caso
c
la tasa de inters dee los bonos de
d tesorera, debera reduucir este valor
presente)
p
y laa tasa de infllacin de preecios al mayooreo, GPWt (la cual puedee
reducir
r
los renndimientos de acciones orrdinarias desppus de impueestos y que enn
diversos
d
estuddios se ha dem
mostrado quee se correlacioona en formaa negativa conn
los
l rendimienntos de las acciones). La ecu
uacin de regrresin (con las estadsticas t
entre
e
parntesis) es:
RETURN
NSPt = .0120 - .8270R3t - .8551GPWt
(6.83)

R2 = .0549

s = .00329

(-2.70)

DW = 1.52

(10.366)

(-3.64)

log - vverosimilitud = 867.1

Obsrvese quue la R2 de esta regresin es baja; los rendimientoss de accioness,


O
i
incluso
los reendimientos en
e un ndice de acciones, son muy volltiles, y muyy
p
poca
de la varrianza de estoos rendimientoos puede expllicarse con vaariables econm
micas
(o de otra ndole). N
No obstante, loos coeficientess de R3 y GPW
G
tienen los
s
signos
esperaados y son estadsticamentee significativoos.
La figura 10.3 muestraa los residualees de esta regrresin. Una veez ms hay unn
"
"agrupamient
to" de la volatilidad. (Quiz el ejempllo ms conoccido de dichoo
a
agrupamiento
o es la volatiliddad incrementtada asociada con la quiebrra del mercadoo
d valores enn octubre de 1987.)
de
A continuuacin reestim
mamos este modelo
m
con ell uso de una especificacin
e
n
G
Garch(l,l)
para la varianzaa del error:

CAPTULO 10: Estimacin


E
no linea
al y de mxima verrosimilitud

305

Figura 10.3
Residuales de
d la
regresin de
el
rendimiento de S&P
500.

Ntese
N
que lo
os coeficientess Arch y Garrch y los coefficientes en laa ecuacin dee
regresin
r
son estadsticameente significaativos, estos coeficientes
c
en la ecuacinn
de
d regresin han
h cambiadoo notablemennte, pero una vez ms tiennen los signoss
negativos
n
espeerados. La R2 dde la regresinn ha disminuido, y el error estndar
e
se haa
in
ncrementado. Dado que lla estimacin
n OLS maxim
miza la R2, corrigiendo
c
laa
heterocedastic
h
cidad (y obtenniendo por co
onsiguiente eestimaciones de parmetroo
diferentes)
d
puede causar quue R2 disminuuya. (ste es un
u ejemplo de
d la forma enn
2
que
q la R puedde tener slo uun valor limittado en la evaaluacin de un
na regresin.))
Como
C
para el incremento een el error esstndar, recurdese que, coon los erroress
heterocedstic
h
cos, los errorees estndaress estimados bajo OLS son sesgados. Ell
valor
v
de la funncin log-verrosimilitud see ha incremenntado.
El rendim
miento esperaado por poseer acciones puede com
mpensar a loss
inversionistass por el riesggo que tienen stas accionnes. Por consiguiente, unaa
v
variable
expliccativa lgica para agregar a la ecuacinn de regresin
n es la desvia-c
cin
estndar o varianza deel trmino dell error mismoo. Por tanto esstimaremos ell
s
siguiente
moddelo Garch en meda; el cuaal incluye la deesviacin estndar, t, en laa
e
ecuacin
d reegresin:
RETUR
RNSPt = -.00017 - .9935R
R3t (-.23))

(- 3.23))

8796GPWt + .48855t (10.39)

(- 4.97
7)

(1.90
0)

t2 = .000145 + .11821 t2-1 + .66929 t2-1


(2. 28)

R2 = .0507

s = .00332

(44. 32)

DW = 1.49

(10.40))

(88. 07)

log - vverosimilitud = 886.6

Obsrvese
O
quue el coeficiennte de la desv
viacin estnddar condicion
nal t tiene ell
signo
s
correctoo, aunque sllo es marginaalmente significativo desd
de el punto dee
vista
v
estadsticco.

306

PA
ARTE DOS: Modelos de regresin de
e una sola ecuaci
n

Por ltim
mo, considerareemos una estrructura Garchh ms compliccada. Despuss
dde algunos ennsayos se estim
m el siguientee modelo Garcch (4,2), una vez
v ms con laa
d
desviacin
esstndar condiccional incluidda en la ecuaccin de regressin:

Obsrvese
O
que el coeficient
nte sobre la desviacin estnndar condicionnal en la ecuaacin
c
de regresin es ligeraamente menorr en magnitudd pero ahora es
e estadsticaamente
m
significcativo. De estee modo, tambin son signifficativos dos de
d los trminos
Arch
A
y ambos trminos Gaarch. Aunque no es probabble que este modelo
m
sea tiil
como
c
un pronnosticador de los rendimienntos de las accciones, demueestra que estos
rendimientos
r
en efecto ddependen del riesgo al iggual que deppenden de los
cambios
c
en laas tasas de innters y en la inflacin en uuna forma qu
ue es pronosticada
c
por la teeora.

A
APNDICE
E 10.1
Estimacin po
or el mtodo dee momentos geeneralizado

Los adelantos tecnolgicoos recientes enn las computaadoras y en sus


L
s programas
h ayudado a popularizarr un estimado
han
or no lineal quue asegura estimaciones dee
p
parmetro
coonsistentes baj
ajo una amplia variedad dee condicioness y que no reequiere la supo
osicin de norrmalidad. En esta seccin ddaremos un bosquejo
b
brevee
de este mtoddo de momenttos generalizaado (GMM).177
Comenzaaremos con el estimador dell mtodo de momentos
m
ms bsico, el estiim
mador
de la media de una variable aleeatoria X. Nuuestro objetivoo es elegir unn
estimador X que es consisstente. Una co
ondicin necessaria para la consistencia
c
es
que:
E(X i X ) = 0

17
La estim
macin GMM fuee originada por Hansen
H
y Singleeton. Vase L. P.
P Hansen, "Larg
ge
Sample Propertiees of Generalizeed Method of Moments
M
Estimattors", Econometrrica, vol. 60, pp
p.
1029-1054, 1992
2, y L. P. Hansen y K..J. Singleton
n, "Generalized In
nstrumental Variaable Estimation of
o
N
Nonlinear
Ration
nal Expectations M
Models, Economettrica, vol. 56, pp. 1269-1286, 1988
8. Vase tambin J.
J
D Hamilton, Tim
D.
me Series Analysiss (Princeton: Prin
nceton University
y Press, 1994).

CAPTULO 10: Estimacin no lineaal y de mxima vero


osimilitud

307

El equivalente muestral de esta condici


n necesaria ees:

Reesolviendo, encontramos
e
que X = (l/N
N) Xi = X, el
e estimador de la media
muestral
m
que exxpusimos prim
mero en el capptulo 2. X ess un estimador del mtodo
dee momentos debido a quee se deriva de
d la condicin necesaria para la consisstencia asociaada con el priimer momento de la distribbucin de proobabilidad de
X. En este casoo, no es necessaria ninguna otra informaccin acerca de la distribucin de probabiilidad (por ejem
mplo, momenntos superioress o la forma fuuncional de la
diistribucin dee probabilidadd) para obten
ner estimacionnes de la meddia.
Tambin se
s puede usarr el enfoque del
d mtodo dee momentos para
p
obtener
esstimadores coonsistentes paara el modelo de regresinn mltiple. Suupngase que
deeseamos estim
mar el modeloo de regresinn de variable k

Para que cada uno de los parmetros


p
j, j = 1, 2, ..., k, sea estimaado en forma
co
onsistente, see requieren lass siguientes condiciones
c
(X
X1i =1):

E anlogo muuestral de estaas ecuaciones tericas es:


El

Estas ecuacionnes pueden paarecer familiarres. Recurdeese que cuanddo derivamos


E
ell estimador dee mnimos cuuadrados ordin
narios (apnddices 1.2, 4.1 y 4.3) resolviimos una seriie de "ecuacioones normalees" de la siguiiente forma:

paara obtener cada


c
una de las estimacionnes de parm
metro de penddiente individu
uales 1, ..., k. Una vezz ms, debido a que estaas condicionees normales
innvolucran la esperanza
e
o prrimer momen
nto de una varriable aleatoriia, el estimadoor resultante, en este caso mnimos cuaadrados ordinnarios, tambin es un estim
mador
GMM.
Los estim
madores de variables instrrumentales ttambin son estimadores
G
GMM.
Para veer por qu, coonsidrese quee deseamos esstimar el mod
delo de regresiin mltiple de
d la variablee k, pero nos preocupa (deebido a la sim
multaneidad o
errror de mediccin) que las X puedan estar correlacioonadas con ell trmino del
errror. Tambin supngase que estamoss conscientess de un instruumento para
caada Xj, designnado Zj. Esto asciende
a
a unn total de k insstrumentos, cada uno de

308

PARTE DOS: Mod


delos de regresin
n de una sola ecuaccin

los cuales esst correlacionnado al menos con una Xj, pero no est correlacionaddo
con el trminno del error. L
Las condicionees necesarias para
p que j seea un estimadoor
consistente para
p cada j soon las siguienntes:

El anlogo muestral
m
de esstas k ecuacioones est dadoo por:

stas son lass "ecuaciones normales" associadas con el


e procedimieento de estimaacin
de variables instrumentalles.
Como hemos
h
mencioonado, la mayyor parte de los estimadoores que se haan
analizado en
n este libro soon estimadores GMM. Por ejemplo, los estimadores de
d
mxima vero
osimilitud son estimadores del mtodo de momento
os, ya que stoos
involucran la solucin dee las ecuacion
nes

para la funciin de verosim


militud L = f
(Y, X1, X2, ..., Xk , l, 2, ..., k). Esttas
ecuaciones pueden
p
verse como anloggos mustralees de las ecuaaciones de moomento subyaacentes

Por ltimo, todos


t
los estim
madores de mnimos
m
cuadrrados generallizados tambin
son estimadores del mtoodo de momeentos dado quue pueden derrivarse como la
solucin a una
u serie de eccuaciones norrmales en las que las X esttn ponderadas
por el inversso de la matriz de varianzaa-covarianza de
d los errores (apndice 6.11).
En todos lo
os casos quee se acaban de describir, el nmero de ecuaciones
normales es exactamente igual al nmeero de parmeetros que se vaan a estimar; es
decir, las eccuaciones sonn identificadass exactamentee. Sin embarg
go, como reggla
general, cuaando los modeelos son no liineales, puedee haber ms ecuaciones
e
noormales que paarmetros, en cuyo caso el modelo est sobreidentificcado. El estim
mador GMM proporciona
p
uun estimador consistente qque usa toda la informacin
disponible de una manera que explica mejor
m
las restrricciones que estn
e
implcitas
en un conjunnto sobreidenntificado de ecuaciones.

CA
APTULO 10: Estim
macin no lineal y de mxima verosim
militud

309

Para ver cm
mo puede usaarse el estimaddor GMM, enn forma globaal, para estimaar una sola ecu
uacin,18 supngase que se desea estimarr un modelo no lineal con
k variables expliicativas:

Suppngase que para


p cualquiera de las razoones posibles (por ejemplo,, no linealidadd, error de meedicin o simuultaneidad) nos preocupa qque algunas de
d las variablees explicativaas originales puedan estarr correlacionaadas con el trmino
t
del
erro
or. Consideree, por ltimo, que se tiene la opcin de k + 1 instrum
mentos posiblees (algunos dee los cuales poodran incluirr las variabless explicativas originales).
Enttonces, en unn mundo ideall, estos k + 1 instrumentos se usaran coomo la base
de las "ecuacionnes normales""

don
nde fj represennta f ( )/Xj, es decir, las j.
Debido a qu
ue este sistem
ma de ecuaciones est sobreidentificado (hay k + 1
ecu
uaciones en k desconociddos), no todass las igualdaades pueden mantenerse
m
exaactamente. Su
upongamos quue uji represen
nta el "error" asociado
a
con cada
c
una de
las ecuaciones normales:
n

Porr tanto, un ennfoque de estiimacin posib


ble, consistennte con los mnimos cuadraados ordinarioos, es elegir llas que min
nimicen la suuma de los cuuadrados de
estos errores, coon la suma suustituyendo toodas las obserrvaciones (i) y todas las
varriables (j).
Del mismo modo en que tos mnimos cuadrados geeneralizados son
s preferiblees a los mnim
mos cuadradoss ordinarios, porque
p
pondeeran las observvaciones en
prooporcin inversa a las variaanzas de los errores
e
asociaados, el estim
mador GMM
pon
ndera los erroores u por suss varianzas esstimadas. Si ssuponemos quue wji represennta la matriz de
d varianzas y covarianzass estimadas asociadas con ui y uj, el
2

estiimador GMM
M minimiza uu i j / wji.
Debe sealaarse que, a parrtir de la deriv
vacin dada aantes, el estim
mador GMM
es un
u estimadorr de variables instrumentalles no linealees. Cuando el nmero de
insstrumentos ess igual al nm
mero de parm
metros que se va a estimar, la suma de
erroores ponderaados ser idnnticamente iggual a cero (ddado que cad
da ecuacin
norrmal se man
ntendr exacttamente). Sinn embargo, cuando la ecuacin es
sob
breidentificadda, la suma seer positiva. Podemos
P
proobar las restricciones sobreeidentificadoras, con el heccho de que el trmino
t
minim
mizado por ell estimador
18
El estimador GMM tambin tiiene una aplicabillidad amplia com
mo un estimador dee un sistema de
ecuuaciones simultnneas.

310

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

GMM siguee una distribuucin ji cuadrrada con el nmero de graados de liberttad


igual al nm
mero de restriccciones sobreiddentificadas. (
sta es la prueba J de HanseenSingleton.)

La eleccin de pondderaciones cuando el modeelo est sobreeidentificado es


ms un arte que una cienncia. Una razn para esto ees que las ponnderaciones que
q
se van a uttilizar con GM
MM dependeen de las estiimaciones de parmetro, las
l
cuales a su vez dependenn de las pondderaciones eleegidas. Un prrocedimiento es
iniciar el moodelo con ponnderaciones igguales y luegoo usar la estim
macin resultannte
de los parm
metros para calcular
c
una matriz
m
ponderrada actualizaada.

EJERCICIO
OS
10.1 Expand
da la funcin de consumo
C = a1 + a2 YD

a3

en una expannsin de serie dee Taylor alrededdor de alguna coonjetura inicial para a1, a2 y a3.
Establezca laa ecuacin de reegresin lineal. Explique cmoo sera relinealizzada la ecuacin
alrededor de las estimacionnes OLS a partiir de la primeraa regresin.
10.2 Escribaa la funcin de suma de cuadrrados de los errrores S para la funcin de connsumo no lineeal
C = a0 + a1 YD

a2

Tome las derrivadas de S coon respecto a a0, a1 y a2 para obtener


o
las ecuaaciones normalles.
Describa cm
mo podran resoolverse estas eccuaciones norm
males para prodducir estimacionnes
de a0, a1 y a2.
10.3 En el ejjemplo 10.4 se especific
e
que la
l tasa del bonoo AAA (RAAA
A) era una funcin
de los valorees actuales y reezagados de la tasa de bonos de tesorera (R
R3), el ndice de
d
Produccin Industrial
I
(IP), la tasa de creecimiento del ndice de Preciios al Productoor
(GPW) y el valor rezagadoo de la tasa dell bono AAA. Una
U especificaacin alternativva
omitira la vaariable que refleja la tasa de bonos de tesorerra (K3). Usanddo a) una pruebba
de Wald, b) una
u prueba de rrazn de verosimilitud y c) unna prueba del multiplicador
m
d
de
Lagrange, deetermine si es aapropiado omittir esta variablee del modelo.
10.4 Recuerrde que el moddelo Garch(l,l) est dado por:

Muestre quee esto es equivvalente a un modelo


m
Arch de orden infinitto con pesos que
q
declinan geo
omtricamente en las volatiliddades pasadas.
10.5 Recuerd
de que en el ejjemplo 10.4 esstimamos ecuaciones de regresin para la tasa
del bono corrporativo AAA
A que incluan una representtacin Garch de
d la varianza del
error. Una versin
v
del modelo tena unaa estructura Gaarch(l,l) pero taambin incluaa el
cambio en ell valor rezagado de la tasa de bonos de tesorrera a tres messes en la ecuacin
para la variannza del error.
a) Pued
de mejorar estee modelo especiificando una esstructura Garchh ms complicaada,
como Garch((2,2)? (Use loss datos proporccionados en el ddisquete de dattos que viene con
c
este libro.) Trate
T
adems dee incluir valorees adicionales de
d la tasa de boonos de tesorerra

CAPTULO 10: Estimacin no lineal y de mxima verosimilitud

311

rezagada en la ecuacin para la varianza del error. Puede mejorar el ajuste general y el
desempeo pronosticador del modelo? Por qu s o por qu no?
b) Si la tasa del bono corporativo AAA refleja el riesgo de poseer bonos corporativos
y, en particular, la volatilidad de los precios de los bonos, la ecuacin de regresin en s
misma puede mejorarse incluyendo la varianza rezagada. Reestimamos este modelo
usando una especificacin Garch en media, la cual incluye ya sea la desviacin estndar
2
t o la varianza t 1 en el lado defecto de la ecuacin de regresin. Son estadsticamente
significativas la desviacin estndar o la varianza? Mejora el ajuste de la ecuacin?

CAPTULO

11

MODELOS DE ELECCIN
CUALITATIVA

En este captulo se construirn modelos en los que la variable dependiente implica dos o ms elecciones cualitativas. Estos modelos son valiosos en el anlisis
de datos de encuestas. En la mayor parte de las encuestas las respuestas
conductuales son cualitativas: por ejemplo, uno vota s o no en una eleccin; usa
el tren subterrneo, el autobs o el automvil; es parte de la fuerza de trabajo o
est desempleado, etctera.
Expondremos en un principio la especificacin y estimacin de tres modelos
de eleccin binaria: el modelo lineal de probabilidad, el modelo probit y el
modelo logit. Luego dirigiremos nuestra atencin a extensiones de los modelos
probit y logit que implican elecciones mltiples, en lugar de binarias. Tambin
se analizar el modelo de regresin censurada.

11.1

MODELOS DE ELECCIN BINARIA


Cuando una o ms de las variables explicativas en un modelo de regresin son
binarias, podemos representarlas como variables indicadoras y proceder como
en el captulo 5. Sin embargo, es ms compleja la aplicacin del modelo de
regresin lineal cuando la variable dependiente es binaria. Los modelos de eleccin
binaria asumen que los individuos1 se enfrentan con una eleccin entre dos
alternativas y que la eleccin depende de caractersticas identificables. Supngase, por ejemplo, que deseamos hacer predicciones acerca de cmo votarn los
1

312

Hogares, ciudades y empresas son considerados individuos en la exposicin que sigue.

CAPITULO 11: Modelos de eleccin cualitativa

313

individuos en una eleccin local. Se podra determinar que el ingreso del individuo sea un determinante primario de la eleccin del voto y que (siendo iguales
otras cosas) los individuos con ingresos altos tienen mayor probabilidad de votar
s en una cuestin de bonos gubernamentales que los individuos con ingresos
bajos. Mientras que esperar una relacin directa entre el ingreso y el comportamiento del voto es razonable, no podemos estar seguros de la forma en
qu votarn todos y cada uno de los individuos. Un objetivo ms plausible es
predecir la probabilidad de que un individuo con un ingreso determinado votar
que s.
Por tanto, el propsito de un modelo de eleccin cualitativa es determinar la
probabilidad de que un individuo con un conjunto determinado de atributos
har una eleccin en lugar de la alternativa. Un modelo adecuado es uno que
nos permita hacer afirmaciones del siguiente tipo: "La probabilidad de que un
individuo con un ingreso de 15 mil dlares votar que s en el prximo sufragio
acerca de bonos gubernamentales es de 0.6." De manera ms general, deseamos
encontrar una relacin entre un conjunto de atributos que describen a un individuo y la probabilidad de que el individuo har una eleccin determinada.2
Para simplificar el anlisis, sealaremos que la probabilidad de que un individuo haga una eleccin determinada es una funcin lineal de los atributos
individuales. Surgen especificaciones alternativas del modelo debido a que es
posible hacer varias suposiciones acerca de la naturaleza probabilstica del proceso de decisin. Iniciaremos con la especificacin ms elemental de un modelo
de eleccin binaria: el modelo lineal de probabilidad.

11.1.1

Modelo lineal de probabilidad

Comenzaremos por examinar el modelo lineal de probabilidad. La forma de regresin del modelo es:
Yi = + Xi + i

(11.1)

donde Xi = valor del atributo, por ejemplo, ingreso, para el isimo individuo

Yi

l si se elige la primera opcin (comprar un automvil, votar s)


0 si se elige la segunda opcin (no comprar, votar no)

i = variable aleatoria distribuida independientemente con media 0


2
El problema de la estimacin del modelo y su relacin con la teora de la eleccin se describe en
forma minuciosa en D. McFadden, "Conditional Logit Analysis of Qualitative Choice Behavior", en
P. Zarembka (ed.), Frontiers in Econometrics (Nueva York: Academic Press, 1973), y T. Domencich y D.
McFadden, Urban Travel Demand: A Behavioral Analysis (Amsterdam: North-Holland, 1975).

314

PARTE DOS: Mo
odelos de regresi
n de una sola ecuacin

Para interpretar la ecuaccin (11.1) tom


maremos el vaalor esperado de cada obseervacin de la
l variable deppendiente Yi:
E(Y i ) = + Xi

(111.2)

Dado que Yi slo puede tomar dos vaalores, 1 y 0, ppodemos desccribir la distriibucin de proobabilidad de Y suponiendoo que Pi = Proob (Y = 1) y 1 Pi = Prob (Yi
= 0). Enton
nces,

En el ejemplo
e
la eccuacin de reggresin descriibe la probabilidad de quee un
individuo votar
v
s, dadaa la informaciin acerca de su ingreso. Laa pendiente de la
recta mide el efecto de un cambio unnitario en el iingreso en la probabilidadd de
votar s. El
E modelo linneal de probaabilidad a meenudo se escrribe en la forrma
siguiente, lo cual perm
mite que la vaariable dependdiente sea intterpretada coomo
una probabbilidad:

La disttribucin de pprobabilidad del


d trmino deel error en el modelo es deeterminada por la sustitucin de los vallores de Yi (11 y 0) en la ecuacin (11.1),
exhibidos en
e el cuadro 11.1. Podemoos ver la relaccin entre la probabilidad
p
Pi y
Xi suponienndo que el errror tiene meddia 0. Por connsiguiente:

Resolvienddo para Pi , enncontramos quue

CUADRO 11.1
DISTRIBUCI
N DE PROBAB
BILIDAD DE

CAPTULO 11: Modelo


os de eleccin cua
alitativa

315

Ahhora puede caalcularse la vaarianza del trmino del errror:

Essto demuestraa que el trmiino del error es heterocedstico. Las ob


bservaciones
paara las que Pi est cerca de
d 0 o cerca de 1 tendrnn varianzas reelativamente
baajas, mientrass que las obseervaciones coon Pi ms cercca de 12 tendrn varianzas
m
mayores.
La heterocedasticiidad deriva en
e una prdidda de eficienccia, pero los
m
mnimos
cuadrrados permannecen consisteentes e insesggados.
Una formaa obvia de corrregir la heterrocedasticidadd es estimar las
l varianzas
dee cada valor de
d Yi y luego aplicar la estiimacin de m
mnimos cuadrrados ponderaados. Para haccer esto realizzamos mnim
mos cuadradoss ordinarios en
e el modelo
orriginal y estim
mamos cada uuna de las varrianzas del errror como sigu
ue:
(11.3)
Laa dificultad co
on los mnimoos cuadrados ponderados ees que no hay garanta de
quue el valor prronosticado i se encontrrar en el inttervalo (0, 1). Si algunos
vaalores de t se encuentrann afuera del rango
r
(0, 1), las observacciones deben
eliminarse del modelo o debben estableceerse de manerra arbitraria iguales a nmeros
m
como 0.0
01 y 0.99. En cualquier casso el procedim
miento de mniimos cuadradoos ponderado
os no ser eficiente para muestras
m
finitas. Dado quee el procedimiento
m
de mnnimos cuadraados ponderad
dos tambin es sensible a errores de
:
esspecificacin, no aconsejam
mos su uso.
Supngasee que deseamoos usar el moddelo lineal de probabilidad para prediccin. Una desv
ventaja seria del
d modelo su
urge cuando el
e valor pronosticado cae
fuuera del rango
o (0, 1). Esta posibilidad
p
see describe en la figura 11.11. Incluso si

Figura 11.1
Prediccin co
on el
modelo lineal de
probabilidad.

316

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaccin

el modelo linneal de probaabilidad es coorrecto, es posible que un valor muestraal


dado de X se precipite fuerra del intervallo (-2, 2). El vvalor ajustadoo de Y asociaddo
con esta obseervacin en X ser mayor que
q 1 o menorr que 0. La co
orreccin obviia
para este pro
oblema es estaablecer prediccciones extrem
mas iguales a 1 o 0, restrinngiendo, de este
e
modo, quue las probab
bilidades pronnosticadas esstn dentro deel
intervalo (0, 1). Sin embarrgo, esto no es
e muy satisfaactorio, debidoo a que podraamos predecirr una ocurrenncia con una probabilidad
p
de 1 cuando es posible quue
pueda no ocuurrir, o podram
mos predecir una ocurrenciia con una proobabilidad de 0
cuando en veerdad podra ocurrir. Aunqque el proceddimiento de estimacin bieen
puede produccir estimacionnes insesgadaas, las prediccciones obteniddas del processo
de estimacin estn sesgaadas en formaa clara.
Un mtodo alternativoo es reestimarr los parmetrros y sujettos a la restricccin de que 0 i 1. Daado que no haay garanta dee que las estim
maciones sern
insesgadas,3 parece ms aapropiado usaar la versin dde mnimos cuadrados orddinarios del moodelo lineal dde probabilidaad.
Al final surge
s
un probllema serio deb
bido a que pueeden extraersee observacionees
en forma exccesiva de los atributos cuyos valores son extremos. Supngase,
S
poor
ejemplo, que varias observvaciones estnn fuera del inteervalo (-2, 2) mostrado en la
figura 11.1. Esta
E posibilidaad se describee en la figura 111.2. En este caso,
c
el modello
de regresin verdadera asocia una probbabilidad de 1 con valoress de X mayorees
que 2 y unna probabiliddad de 0 coon valores dde X menorees que -2. La
L
muestra conttiene varios vvalores de X mayores que 2 para los cuales
c
se eligii
la primera oppcin y varioss valores de X menores quee -2 para los cuales
c
se eligii
la segunda oppcin. La estiimacin de la pendiente dee mnimos cuaadrados ordinaarios resultannte ser sesgaada, dado quee subestimar la pendientee de regresinn

Figura 11.2
2

Pendiente subestimada.
s

Vase Do
omencich y McFaadden, op. cit., cap
ptulo 5.

CAPIT
TULO 11: Modelos
s de eleccin cualitativa

317

Figura 11.3

Pendiente
sobrestimada.

veerdadera. Sin embargo, si llos datos de atributo


a
son aagrupados en forma algo
diferente, la peendiente puedde ser sobrestiimada, como se muestra enn la figura
111.3.

EJEMPLO 11
1.1

Prrediccin de incumplimiento de bonos

Unn medio til para


p
predecir el incumplim
miento de bonnos es analizaando los factorres que se coorrelacionan altamente
a
conn los incumpliimientos de bonos
b
verdadeeros.4 Si vemoos la decisin de incumplir y la decisin de
d no incumpplir como dos
oppciones para los gobiernos locales, se puuede estimar lla probabilidaad de incumplimiento usando el modeloo lineal de proobabilidad. E
En una muestrra de 35 comuunidades de Massachusett
M
ts, varias de las
l cuales en verdad incum
mplieron, se
utiiliz un estudiio de corte trannsversal con datos
d
de 1930.5 El objetivo era
e encontrar
unn conjunto dee caractersticcas de comunnidades que nos permitierran predecir
mejor la probabbilidad de inccumplimiento. El modelo ees:

doonde P = 0 si la municipaliidad incumplli y 1 en casoo contrario


TAX = prom
medio de tasass fiscales de 1929,
1
1930 y 1931
INT = porccentaje del presupuesto asiignado al paggo de interesees (1930)
AV = porcentaje de creccimiento en ell valor de la prropiedad valuuada (192519300)
DAV = razn de la deuda total entre la
l valuacin eevaluada total (1930)
WELF = porccentaje del preesupuesto de 1930 asignaddo a beneficenncia, pensiones y beneficios de los soldados
4
Ocurre un inncumplimiento enn bonos cuando hay
h una demora en
e el pago ya seaa del principal o
de los intereses en un bono. Algunnos tenedores de bonos son comppensados por la prdida parcial
o total
t
de intereses y pagos, pero slo, despus de trranscurrido algnn tiempo.
5
Vase D.L. Rubinfeld,
R
"An Econometric
E
Anallysis of the Markket for General Obligation
O
Municip
pal Bonds", diserrtacin doctoral ssin publicar, M.I..T., junio de 19722.

318

PARTE DOS: Modelos de regresin de una sola ecuacin

Los resultados de la regresin fueron los siguientes (los errores estndares estn
entre parntesis):
P = 1.96 - .029TAX - 4.86INT + .063AV + .007DAV - .48WELF
(.29)

(.009)

(2.13)

(.028)

(.003)

(.88)

R 2 = .36
La R2 de 0.36 sugiere que una buena cantidad de varianza en el modelo an no
est explicada. No obstante, uno puede usar todava los resultados del modelo
para estudiar varios factores econmicos que se correlacionan altamente con los
incumplimientos. El coeficiente de la variable de la tasa fiscal es negativo y
significativo, lo que implica que, ceteris paribus, un incremento en la tasa fiscal de
un dlar por mil aumentar la probabilidad de incumplimiento por 0.029. El
porcentaje del presupuesto asignado a los pagos de intereses tambin parece ser
un buen pronosticador de incumplimientos, con la participacin presupuestal
de intereses mayores estando correlacionada positivamente con la probabilidad
de incumplimiento. El porcentaje de presupuesto actual asignado a beneficencia
guarda la misma relacin con la probabilidad de incumplimiento que la participacin presupuestal de intereses pero no es significativa. La tasa de crecimiento
de valuacin real evaluada es significativa y se relaciona inversamente con la
probabilidad de incumplimiento. Una base fiscal creciente implica una probabilidad baja de incumplimiento, al menos a corto plazo. Por ltimo, la razn de la
deuda con la valuacin estimada est relacionada inversamente con la probabilidad de incumplimiento. Este resultado contrario a lo intuitivo sugiere que la
poltica, no slo la economa/es un pronosticador importante de los incumplimientos de bonos.

11.1.2

Modelo probit

Dadas las dificultades asociadas con el modelo lineal de probabilidad, es natural


transformar el modelo original de tal forma que las predicciones caigan en el
intervalo (0, 1) para todas las X. El requerimiento de un proceso as es que
traslada los valores del atributo X, los cuales pueden variar sobre toda la lnea
real, a una probabilidad que vara de 0 a 1. Tambin nos gustara que la transformacin mantenga la propiedad de que los incrementos en X estn asociados
con los incrementos (o decrementos) en la variable dependiente para todos los
valores de X. Estos requerimientos sugieren el uso de la funcin de probabilidad
acumulativa, F.6 La distribucin de probabilidad resultante podra representarse
como:
6
Recurdese que una funcin de probabilidad acumulativa se define como el valor que tiene la
probabilidad de que un valor observado de una variable X (para cada X) ser menor o igual a una X
particular. El rango de la funcin de probabilidad acumulativa es el intervalo (0, 1), dado que todas las
probabilidades se encuentran entre 0 y 1.

CA
APTULO 11: Mode
elos de eleccin cu
ualitativa

Pi = F( + X
i) = F(Zi)

319
9

(11.4))

Bajo la su
uposicin de q
que transform
mamos el mod
delo usando una
u funcin dee
probabilidad acumulativa
p
a
u
uniforme, obteenemos la verssin restringid
da del modelo
o
lineal de probaabilidad Pi = + Xi (vasse el ejercicio 11.3). Aunqu
ue son posibless
v
varias
alternattivas de funciones de probaabilidad acum
mulativas, slo
o considerare-m dos: la no
mos
ormal y la logs
stica.
El modelo
o de probabilid
dad probit se asocia
a
con la funcin
f
de pro
obabilidad normal
m acumulattiva. Para enttender este modelo,
m
supn
ngase que exiiste un ndicee
continuo
c
teriico Zi, el cual est determin
nado por una variable expllicativa X. Porr
tanto,
t
podemo
os escribir:
Z i = + Xi

(11.5))

Las
L observaciiones en Zi no
o estn dispon
nibles. En su
u lugar, se tien
nen datos quee
slo
s
distingueen si las obserrvaciones indiividuales estn
n en una cateegora (valoress
altos
a
de Zi) o en una segun
nda categora (valores bajo
os de Zi). El anlisis
a
probitt
resuelve
r
el prroblema de c
mo obtener estimaciones
e
para los parmetros y ,
mientras
m
que al mismo tiem
mpo se obtien
ne informacin
n respecto al ndice subya-cente
c
Z.
Para enfo
ocarnos en estte problema consideraremo
c
os un anlisiss del compor-tamiento
t
del votante
v
en un
na eleccin. Se
S supone quee el individuo
o vota s o no
o
cuando
c
se enffrenta con la eleccin de uno
u o dos can
ndidatos para un cargo. En
n
este
e caso, el n
ndice Zi repressentar la fuerzza del sentimiento del indiv
viduo i hacia el
primer
p
candid
dato para el cargo.
c
Supn
ngase que sab
bemos que ell ndice de laa
fuerza
f
del sen
ntimiento es u
una funcin lineal del ingreeso X. Entoncces, el modelo
o
probit
p
proporcciona un med
dio adecuado para estimarr los parmetrros de la pen-diente
d
y el inttercepto de laa relacin entrre el ndice y el ingreso.
Supongam
mos que Y rep
presenta una variable indiccadora, la cuaal es igual a 1
c
cuando
es selleccionado ell primer cand
didato y 0 cu
uando se elig
ge al segundo
o
c
candidato.
Luego supongam
mos que, para cada votante individual, Zi* representa el
v
valor
de corte crtico que traaduce el ndice subyacente een una decisi
n de voto. Dee
m
manera
especfica,

El modello probit asum


me que Zi* ess una variablle aleatoria distribuida
d
en
n
forma
f
normal, de modo qu
ue la probabiliidad de que Zi* sea menor que
q (o igual a))
Zi puede calcu
ularse a partir de la funcin de probabilid
dad normal acu
umulativa. Laa
funcin
f
normal acumulativ
va estandarizaada se escribee:

(11.7))

320

PARTE DOS: Modelos de regresin de una sola ecuacin

donde s es una variable aleatoria que est distribuida en forma normal con
media cero y varianza unitaria. Por construccin, la variable Pi se encontrar en
el intervalo (0, 1). Pi representa la probabilidad de que ocurra un evento, en este
caso la probabilidad de que el individuo vote por el primer candidato. Dado que
esta probabilidad se mide por el rea bajo la curva normal estndar desde
hasta Zi, entre ms grande sea el valor del ndice Zi ser ms probable que el
evento ocurra.
El cuadro 11.2 describe la relacin en la ecuacin (11.7) para valores particulares de Z. La funcin normal acumulativa se muestra en forma grfica en la
figura 11.4, en la cual se comparan los modelos probit y lineal de probabilidad.
Para obtener una estimacin del ndice Zi aplicamos el inverso de la funcin
normal acumulativa a la ecuacin (11.7):
(11.8)
Podemos interpretar la probabilidad Pi resultante del modelo probit como una
estimacin de la probabilidad condicional de que un individuo votar s (o un
individuo asistir a la universidad), dado que el ingreso del individuo es Xi. Esto es
equivalente a la probabilidad de que una variable normal estndar ser menor o
igual a + Xi.
La pendiente de la funcin probit como se muestra en la figura 11.4 es
mayor que la pendiente de la funcin lineal de probabilidad en el rango medio
pero menor en los extremos del intervalo (-2, 2). Fuera del intervalo (-2, 2) el
modelo lineal de probabilidad tiene una pendiente de 0. La grfica sugiere algunas de las dificultades asociadas con un modelo lineal de probabilidad mal especificado. En dado caso que la especificacin probit sea correcta, la estimacin
del modelo lineal de probabilidad conducir a la inferencia falsa de que la pendiente es constante cuando de hecho el cambio en la probabilidad asociado con
un cambio en X depende del valor de X seleccionado.
Aunque el modelo probit es ms atractivo que el modelo lineal de probabilidad, por lo general, implica estimacin de mxima verosimilitud no lineal.

CUADRO 11.2

F(Z)

-3.0
-2.5
-2.0
-1.5
-1.0
- .5
.0

.001
.006
.023
.067
.159
.309
.500

1.0
1.5
2.0
2.5
3.0
3.5

.5

F(Z)
.691
.841
.933
.977
.994
.999
,999

CA
APTULO 11: Mod
delos de eleccin cualitativa
c

321
1

Figura 11.4
Pendiente Prrobit.

Adems, la ju
A
ustificacin teerica para em
mplear ejempplo probit es un
u poco limi-tada. Despuss de revisar las limitacionnes en un ejem
mplo, consideeraremos unaa
e
especificacin
n de modelo unn poco ms attractiva, el moodelo logit.

EJEMPLO 11.2

C
Comportamien
nto de la votacin

En un estudioo de la votaciin en la elecccin presideencial de 19772 en Estadoss


E
U
Unidos,
se us
un modelo probit
p
para exxplicar la probbabilidad de que
q un ciuda-7
d
dano
votara por
p George McGovern.
M
Loos autores dee este estudio suponen quee
h un ndice Zi subyacentte, la "propennsin" a votarr por McGoveern, la cual ess
hay
u funcin lin
una
neal de las poosturas polticas que los vottantes apoyan
n. El problemaa
e transformarr la relacin lineal entre el
es
e ndice Zi y la informaccin sobre lass
p
posturas
poltiicas para obteener probabilidades pronosticadas de la votacin paraa
M
McGovern.
Se obtuvieron resultados probit
p
por meedio de una serie
s
de datoss
e
extrados
de laa encuesta de 1972 del Cenntro para Estuddios Polticos de la Univer-s
sidad
de Mich
higan. Los reesultados de la estimacinn probit y dee la regresinn
c
comparable
d modelo linneal de probaabilidad se muuestran en ell cuadro 11.3.
del
C
Cada
una de laas variables exxplicativas ess una represenntacin a escalla de la propiaa
o
opinin
del individuo respeecto a lo que senta
s
sobre una
u cuestin particular.
Los coeficcientes de reggresin nos in
ndican la relaacin lineal entre
e
el ndicee
e
estimado
Zi y las variables de la postu
ura. (La raznn del coeficieente estimadoo
e
entre
el error estndar estiimado se aprroximar a laa distribucinn normal paraa
m
muestras
granndes, as que pueden
p
aplicaarse las pruebaas normal o t usuales.) Loss
r
resultados
sug
gieren que la opinin de uh
u votante sobbre temas, talles como em-p
pleos
federales, impuestos y Vietnam, as como la deesignacin liberal o conser-v
vadora
autoiddentificada, sirve
s
mejor para
p
explicar por qu el votante
v
puedee
h
haber
elegido votar por MccGovern o no.
Estos resuultados no sonn muy diferenntes de los reesultados del modelo
m
lineall
de
d probabilidaad, excepto poor la importanncia de la cuestin del transsporte pbli7
J. Aldrich y C.F. Cnudde, "Probing the Bo unds of Conventtional Wisdom: A Comparison o f
Regression, Probiit, and Discriminnant Analysis", American Journal of Political Scieence, vol. 19, ppp.
R
5
571-608,
3 de agoosto de 1975.

322

PA
ARTE DOS: Modelos de regresin de
e una sola ecuaci
n

CUADRO 11.3
C
C
COMPARACIN
DE PREDICCIO
ONES DE MODE
ELO LINEAL DE PROBABILIDAD
DY
P
PROBIT:
PROBA
ABILIDAD DE VO
OTAR POR MCG
GOVERN, 1972

Escala de siete
e puntos

Modelo

M
Modelo lineal

probit Zi

de
e probabilidad

Coeficiente

SE

Coefficiente

SE
E

Empleos federalles
Impuestos
Vietnam
Mariguana
Transporte pbliico
Derechos de lass mujeres
Derechos de loss acusados
Ayuda a las min
noras
Liberal o conserrvador
Constante

-.37 5
-.25 7
-.59 3
-.075
- .205
-.038
-.04 6
-.13 6
-.639
- .713

.082
.066
.092
.058
.083
.046
.068
.072
.113

- .087
- .050
- .145
- .019
- .067
- .010
- .011
- .030
- .168
.303

.018
8
.01
14
.020
0
.014
4
.019
9
.011
1
.015
5
.017
7
.025
5

N = 1 130

R = .530

R =

.347

co.
c Sin embarrgo, el modeloo produce resultados difereentes cuando interpretamoss
las
l implicacioones numricaas de los coefficientes estim
mados. Cuandoo observamoss
coeficientes
c
inndividuales, lo que importaa es su magniitud relativa, no su tamaoo
absoluto.
a
Por ejemplo, cuaando se estim
m el modelo lineal de proobabilidad, ell
coeficiente
c
libberal-conservvador fue 3.4 veces el tamaao del coefiiciente de im-puestos,
p
mienntras que la razzn slo fue de
d 2.5 cuandoo se us estimacin probit.

1
11.1.3

M
Modelo
log
git

El modelo loggit se basa en la


E
l funcin- de probabilidad logstica acum
mulativa y se
e
especifica
com
mo:

En esta notaciin, e represennta la base dee logaritmos nnaturales, la cual es aproxi-E


m
madamente
iggual a 2.718. Pi es la probbabilidad de qque un indiviiduo har unaa
d
determinada
e
eleccin,
dadoo Xi. Para teneer una impressin de la funncin logsticaa
a
acumulativa,
examnese ell cuadro 11.4.. El cuadro m
muestra que laas formulacio-n logit y proobit son bastaante parecidass; la nica differencia es quue la logsticaa
nes
t
tiene
colas un
n poco ms grruesas.8 Debiddo a que es sim
milar a la fun
ncin normal
8
E.A. Hanush
hek y J.E. Jacksoon, Statistical Metthods for Social Scientists
S
(Nueva York: Academic,
11977), p. 189, seala que la distribbucin logstica se parece en form
ma estrecha a la distribucin
d
t conn
7 grados de liberttad.

CAP
PTULO 11: Modelos de eleccin cua
alitativa

323

CUADRO 11.4

accumulativa peero ms fcil dde usar desde el


e punto de vista del clculoo, el modelo
lo
ogit se usa a menudo
m
comoo un sustitutoo del probit.
Para mostrrar cmo puedde estimarse el modelo esppecificado enn la ecuacin
(111.9), primeroo multiplicamoos ambos ladoos de la ecuaccin por 1 + e - zi para obteener:
z

(1 + e i ) P i =1
Dividiendo
D
enttre Pi y luegoo restndole 1 nos conducee a

Siin embargo, por


p definicin, e - zi = l/ e zii, de modo quue,

A
Ahora,
tomanddo el logaritm
mo natural de ambos
a
lados,

o [a partir de la ecuacin (111.9)]


(11.10)

324

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuacin

La variabble dependiennte en esta ecuuacin de regrresin es el lo


ogaritmo de laas
posibilidadess de que se haar una eleccin particular. Una ventaja importante deel
modelo logitt es que transforma el probblema de preddecir probabiilidades dentrro
de un intervaalo (0,1) en unn problema dee predecir las posibilidadess de que ocurrra
un evento deentro del ranngo de la lneea real. La peendiente de la
l distribucin
logstica acum
mulativa es mayor
m
en P = 21. Esto impllica que los cambios
c
en laas
variables inddependientes tendrn
t
su mayor
m
efecto een la probabillidad de elegiir
una opcin determinada
d
een el punto medio
m
de la distribucin. Las
L pendientees
bajas cercanaas a los puntoss extremos im
mplican que soon necesarios cambios granndes en X paraa producir unn cambio pequueo en la proobabilidad.
Si Pi ressulta ser iguall ya sea a 0 o a 1, las posibilidades, Pii/(l - Pi), sern
iguales a 0 o al infinito y el logaritmo de las posibilidades ser indefinido.
i
Poor
tanto, se observa claramente que la applicacin de estimacin de mnimos cuaadrados ordinarios a la ecuuacin (11.10) es inapropiaada. La estim
macin correctta
del modelo loogit puede enntenderse mejoor si se distingguen los estuddios en los quue
las observacciones individduales son laas unidades bsicas
b
de anlisis y en loos
que el anlisis implica el uso de datos agrupados.
Considrrese primero el
e caso en el quue conocemoss la frecuenciaa de ocurrenciia
de un eventto en un subbgrupo deterrminado de lla poblacin pero no haay
conocimientoo acerca del coomportamientto de cada inddividuo en esee subgrupo. De
D
maera especcfica, supnggase que una sola variable explicativa coomo el ingresso
es representaada por G vallores diferentees en la muesstra (por ejem
mplo, 5 mil, 110
mil dlares), con n1 indiviiduos con un ingreso X1, n2 individuos con
c un ingresso
X2 y as en foorma sucesivaa.9 Adems, establezca
e
quee r1 representaa el nmero de
d
veces que se elige la primeera alternativaa por individuuos con ingresso X1 (votar s),
r2 representa el nmero dee veces que laa primera alteernativa es eleegida por inddividuos con inngreso X2, etcc. Entonces, parece
p
lgico utilizar
u
un moodelo logit quue
estime la probbabilidad de ccada eleccin para cada grrupo de indiviiduos idnticoos.
De manera esspecfica, aprroximamos Pi como:

Entonces po
odemos estim
mar el modelo de probabiilidad logit de
d la ecuacinn
(11.10) por:

La ecuaccin (11. 11) ees lineal en loss parmetros y puede estim


marse por mediio
de mnimos cuadrados orddinarios. Paraa muestras peequeas los paarmetros pueeden estar sessgados, pero cconforme se incrementa
i
ell nmero de observaciones
o
s
9

Para detallles, vase D.R. Coox, Analysis of Biinary Data (Londdres: Methuen, 1970).

CAPITULO 11: Modelos de eleccin cualittativa

325

asocciado con cad


da uno de los niveles de X, los resultadoss mejoran. Dee hecho, los
parmetros estim
mados son coonsistentes cuuando cada grrupo se hace grande en
form
ma arbitraria..
Este procediimiento de aggrupamiento taambin puedee usarse con observacioo
nes individualess; dividimos la
l variable inndependiente (o variables)) en forma
arbiitraria en gruppos y calculaamos frecuenccias dentro dee cada grupo.. Por ejemplo,, supngase que
q estamos annalizando el comportamiennto de voto conn base en el
ingrreso (bajo, allto) y el tamaao de la fam
milia (pequea, grande).10 Para cada
disttrito electorall obtenemos datos
d
sobre ell nmero de vvotantes regisstrados que
votaron por un candidato deeterminado asociado con cada una de las cuatro
com
mbinaciones posibles
p
de caaractersticas del
d votante (ffamilia pequea, ingreso
bajoo; familia peqquea, ingreso alto, etc.). Los
L datos poddran ser de la
l siguiente
form
ma:
P1 = fraccin
n de votantes de ingreso baajo y familia pequea
p
que votaron
v
por
el candid
dato
P2 = fraccin
n de votantes dde ingreso bajo y familia grrande que votaaron por el
candidatto
P3 = fraccinn de votantes de ingreso altto y familia peequea que votaron por
el candid
dato
P4 = fraccinn de votantes dde ingreso altto y familia grrande que vottaron por el
candidatto
Dad
do que hay cuatro
c
gruposs, la regresinn de mnimoss cuadrados tendr
t
seis
obsservaciones. Las
L observaciones de la varriable dependdiente sern:

Lass variables inddependientes sern


s
una seriie de variabless indicadoras definiendo
la categora
c
a la que pertenecce cada observvacin. Por taanto, si suponnemos que,
X2 =

X3 =

1 para
p votantes de
d ingreso altto
0 en cualquier ottro caso
1 ppara votantes con familia ggrande
0 en
e cualquier otro
o caso

10
Esto es equivaalente al anlisis logit
l
de tablas de contingencia y se describe en H. Theil,
T
"On the
Estim
mation of Relationnships Involving Qualitative
Q
Variables"', American Joournal of Sociologgy, vol. 76, pp.
103--154, julio de 19770, y L. Goodmaan, "The Multivarriate Analysis off Qualitative Dataa: Interactions
amon
ng Mltiple Classsfications", Journnal of the America
an Statistical Assoociation, vol. 65, nm. 329, pp.
226--256, 1970.

326

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

el modelo loogit ser estim


mado como:
(11.112)
Suponiendo por el m
momento que cada Pi midee con precisi
n la frecuencia
del grupo en
e la poblacin, la interpreetacin del moodelo logit ess sencilla:
Z 1 Z1 = 1 = posibilidaades pronosticcadas de votaccin favorablee para votantees de
ingreso bbajo y familiaa pequea
Z 2 Z2 = 1 + 3 = posibiilidades prono
osticadas de vootacin favoraable para votanntes
de inngreso bajo y familia grannde
Z 3 Z3 = 1 + 2 = posibilidades pronoosticadas de vootacin favoraable para votanntes
de inngreso alto y familia pequuea
Z 4 Z 4 = 1 + 2 + 3 = pposibilidades pronosticadas
p
de votacin faavorable para
votantes de ingreso
i
alto y familia gran
nde
Por tanto, si
s deseamos examinar
e
el im
mpacto que tiiene en la votacin el poseer
una familiaa grande en luggar de una pequea, indepeendientementte del ingresoo, el
efecto es meedido por el cooeficiente 3. Del
D mismo moodo, 2 mide laa diferencia enn el
logaritmo de
d las posibilidades de la vootacin entre familias pequ
ueas de ingreeso
alto y bajo.
Debidoo a que Pi no es
e igual a Pi, hay
h algunos prroblemas con la estimacinn de
mnimos cuuadrados ordinnarios en este caso de datoss agrupados. Si
S asumimos que
q
cada una dee las observaciiones individuuales en un grrupo es indepeendiente (y siggue
una distribu
ucin de probbabilidad binomial), la vaariable dependdiente estimaada,
log [ri/(ni ri)], estaar (para muestras
m
granndes) distribuuida en forrma
aproximadaamente norm
mal con mediaa 0 y varianzaa
(11.133)
Como resulltado, el trm
mino del error en la especifficacin lineaal de la ecuaciin
(11.12) es heterocedstiico. La variannza en cada uno de los su
ubgrupos estar
relacionadoo inversamentte con el nm
mero de obserrvaciones en cada celda ni y
tambin varriar con el nmero de voto
os favorables ri. La correcciin obvia paraa la
heterocedassticidad es uusar mnimos cuadrados pponderados, donde
d
cada obo
servacin es
e multiplicadda por el pesso 1/Vi. Sinn embargo, see han propuesto
otras correccciones, de manera
m
principal para ayuudar con las propiedades de
muestra peq
quea del prooceso de estim
macin.11
11
Un ajusste sugerido por C
Cox, op. cit., y porr Domencich y McFadden, op. cit., es usar la siguiennte
ecuacin:

CAPT
TULO 11: Modelos
s de eleccin cualiitativa

327

Si se desea medir el ajustte asociado co


on el modelo dde regresin agrupado,
a
se
pueede usar la estadstica R2 calculada. No
N obstante, uuna estadstica preferible
obsserva las difeerencias entree las frecuencias reales en cada subgruppo y las frecueencias estimaddas. De manera especfica, supongamos que Pi* es la probabilidad
p
esttimada calcullada para caada observacin a partir de la ecuaccin (11.9).
Enntonces la estad
dstica12

estt distribuida (para muestrras grandes) de


d acuerdo coon la distribucin ji cuadraada donde el nmero de grrados de liberrtad es el nm
mero de subcategoras G
meenos el nmerro de parmeetros estimadoos. Entre mennor es el valoor de s, ser
meejor el ajuste del
d modelo.
La aproxim
macin que connduce a la esppecificacin dde la ecuacinn (11.12) es
razzonable slo cuando
c
ocurreen suficientess repeticioness. De hecho, cuando
c
slo
unaa eleccin estt asociada coon cada conjuunto de variabbles explicatiivas, el lado
izqquierdo de la ecuacin (11.12) es indefiinido, de moddo que la apro
oximacin a
la ecuacin
e
(11..10) no es de utilidad. Unaa regla empriica til para laa aplicacin
de la aproximaciin de mnimos cuadrados es que para caada valor de X,
X ni debera
serr al menos iguual a 5, pero una
u regla mss precisa expllicara el hechho de que la
aprroximacin de mnimos cuuadrados es ms
m deficientee para niveles de X en los
quee la frecuenciia de una elecccin determinnada est cercca de 0 o de 1. Esto puede
verrse en la ecuuacin (11.13)). Cuando ri /n
/ i se aproxim
ma ya sea a 0 o a 1, la
exppresin para Vi se hace aarbitrariamen
nte grande. D
Debemos sealar que la
aprroximacin im
mplcita en laa ecuacin (111.12) no es estrictamentee apropiada
cuaando la variab
ble explicativva es continuaa, dado que laa variable conntinua debe
divvidirse, este proceso
p
introdduce error de medicin en el problema.
Con variablles continuas en modelos con varios aatributos sirviiendo como
varriables expliccativas, puedee ser necesariio estimar unn modelo logiit en el que
sllo una opcinn est asociadda con cada conjunto
c
de vvariables indeependientes.
Afo
fortunadamentte, hay un proocedimiento de
d estimacinn de mxima verosimilitud
d que puede aplicarse
a
al modelo
m
en la ecuacin
e
(11.12). (Vase el apndice
11..1 para hacer un breve bossquejo del proocedimiento y las pruebas estadsticas
asoociadas con l.)
Debido a que es posibble demostrarr que siemprre existe un
mximo nico para
p
el modello logit, la esttimacin de m
mxima verossimilitud es
en particular atraactiva. De heccho, la estimaccin de mxim
ma verosimilittud produce
estimadores de parmetro coonsistentes, y el clculo dee la estadsticaa apropiada
parra muestra graande no es diffcil. Por tantoo, la nica dessventaja de laa estimacin
log
git no lineal es
e su costo. L
Los estudios de
d muestra pequea sugieeren que los
siggnos (y con frrecuencia las magnitudes relativas)
r
de los parmetross estimados
obttenidos de modelos
m
lineaales de probaabilidad y loos estimadorees logit de
mxima verosim
militud, por llo general, so
on iguales. E
Esto respaldaa el uso del
mo
odelo lineal de probabilidaad, al menos como
c
una tcnnica explicatiiva.
12

Vase Theil, op.


o cit., y McFaddden, op. cit., para detalles.
d

328

P
PARTE
DOS: Mod
delos de regresin de una sola ecuaccin

EJEMPLO
O 11.3

Votacin para
a un presupue sto escolar

En una escuuela en Troy, Michigan,


M
en 1973 se us el modelo log
git para estudiiar
las decisionees de votacinn de 425 indiv
viduos en un rreferndum fiiscal local.13 Las
L
respuestas a la encuestaa proporcionaan una lista dde atributos de
d los votantees,
estimaciones de ingreso familiar y el precio de la eeducacin, medidos
m
como el
costo para ell individuo dee apoyar con un
u dlar adicioonal por alumn
no de la escueela
gastado en la
l comunidadd. El modelo adopta la form
ma

donde las Z representan los atributos de la votacin enumerados en el cuaddro


11.5 y Probb (s) represennta la probabilidad de que un votante appoye el referndum fiscal. La ecuacinn estimada aparece
a
a continuacin, con
c los errorres
estndares asintticos
a
(m
muestra grandee) entre parnntesis (* = sig
gnificativo en el
nivel del 5%
%). Dado que las observaciones son de inndividuos y no
n estn agruppadas, ntese que el modello logit se esttim usando un
u procedimiento de estim
macin de mxxima verosimilitud.
-23.15* + .24 SEX + 1.13 MAR + 1.09 OTHE R + .08 A35-49
(3.84)

(.24)

(1.13)

(1.47)

(.30)

+ .61 A50-64
A
+ 1.0
04 A65 + 1.4
44* PUB1 + 1
1.39* PUB2 + 1.30* PUB3
3
(.41)

(.799)

(.34
4)

((.35)

(.42)

+ 2.00** PUB4 + 2.116* PUB5 - .556 PRIV - .022* YEARS


(.58)

(.799)

(.42)

((.01)

+ 3.07*
* SCHOOL + 2.14* (log IN
NC) - 1.21* (log PRICE)
(.84)

(.37)

(.44)

La variaable indicadora de gnero se incluy paara permitir laa posibilidad de


que debido a que las muujeres tiendeen a tener unaa participacin mayor en la
responsabiliidad del cuidaado de los hijjos, podran valorar
v
los ben
neficios asociiados con el sistema
s
educattivo ms alto que los hombbres. El coeficciente fue insiignificante aqqu, pero fue ssignificativo, como se espeeraba, en una eleccin postterior.
Cuando los nios esttn en edad esscolar, hay m
mayor probabillidad de que las
l
familias estn conscientes de los costoos y beneficios asociados con un voto paara
impuestos escolares ms altos. Se espeeraba la presenncia de al men
nos un hijo enn la
escuela pbllica y tuvo unn impacto posiitivo significaativo en la proobabilidad de un
u
voto favorab
ble. La presenncia de hijos en edad escoolar adicionalees no incre-

11
D.L. Ruubinfeld, "Voting inn a Local School Election:
E
A Micro Analysis", Review
w of Economa andd
Statiscs, vol. 59,
5 nm. 1, pp. 300-42, febrero de 1977.
1

CAPTULO 11: Modelos de eleccin cualitativa

329

CUADRO 11.5
DEFINICIN DE VARIABLES

1
SEX
MAR
OTRO
A35-49
A50-64
A65
PUB1
PUB2
PUB3
PUB4
PUB5
PRIV
SCHOOL

Si es mujer
Si est casado con cnyuge presente
Si est separado, divorciado o es viudo
Si su edad est entre 35 y 49 aos
Si su edad est entre 50 y 64 aos
Si su edad es de 65 aos o mayor
Si tiene 1 hijo en escuela pblica
Si tiene 2 hijos en escuela pblica
Si tiene 3 hijos en escuela pblica
Si tiene 4 hijos en escuela pblica
Si tiene 5 o ms hijos en escuela pblica
Si la familia tiene 1o ms hijos en escuela privada
Si el individuo est empleado como maestro
(pblico o privado)

0
Si es hombre
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso
En cualquier otro cas
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso
En cualquier otro caso

YEARS = nmero de aos viviendo en la comunidad de Troy


Log INC = logaritmo natural del ingreso familiar anual, en dlares
Log PRICE = logaritmo natural del precio de la educacin pblica, en dlares

ment la probabilidad de un voto con s hasta que, como se esperaba, ms all


del quinto hijo, la ganancia marginal de reasignar el presupuesto familiar hacia
gastos privados sobrepas la ganancia de los gastos pblicos y la probabilidad de
un voto favorable declin. Sin embargo, la presencia de un hijo en una escuela
privada tuvo un efecto negativo fuerte. Es probable que las familias que envan a
sus hijos a escuelas privadas perciban poco beneficio del sistema de educacin
pblica mientras enfrentan una carga fiscal considerable asociada con l.
El nmero de aos de residencia tambin se incluy como una variable
explicativa en el modelo logit. Los resultados sugieren que conforme se incrementa el tiempo de residencia, los votantes tienden a votar que no, ya sea como
crtica al sistema educativo o posiblemente en oposicin a la carga creciente de
impuestos locales.
La variable indicadora escolar altamente significativa se incluy para explicar el hecho de que la muestra de los que respondieron estaba representada en
exceso por maestros de escuela y sus cnyuges. Como se esperaba, es ms probable que los maestros voten que s en la eleccin en relacin con individuos con
atributos similares.
Con la suposicin de que la educacin de escuelas locales es un bien normal,
esperbamos, quedando iguales otros aspectos, que el ingreso y la demanda de
escuelas pblicas estaran correlacionados en forma positiva. En las ecuaciones
estimadas la variable de ingreso fue positiva y significativa, consistente con una
elasticidad de ingreso positiva de la demanda de educacin.
Conforme se elev el precio de la educacin, siendo iguales otras cosas,
esperbamos que la cantidad de gastos educativos por alumno demandada dis-

330

P
PARTE
DOS: Mod
delos de regresin
n de una sola ecua
acin

minuira, all igual que laa probabilidad


d de votar s en la elecci
n. A pesar del
d
hecho de qu
ue los pagos d
de impuestos prediales esttn correlacio
onados en form
ma
positiva con
n el ingreso, eencontramos que
q el coeficiente de la varriable del preccio
de la educaacin fue neg
gativo y signiificativo, de acuerdo con una elasticid
dad
negativa en el precio de la demanda de
d educacin.

EJEMPL
LO 11.4

Prediccin del
d comportam iento de asiste
encia a la unive
ersidad

En un estudiio de eleccin
n de universidaad14 se constru
uy un modelo
o para predecirr si
los estudian
ntes que asistaan a la univerrsidad elegiraan vivir en el campus
c
o viajjar,
esta elecci
n est condiicionada por la informaciin respecto a los atributtos
individualess y de la univeersidad particu
ular. El modeelo es

donde Pi = probabilidad
p
de que el estu
udiante elegirr vivir en el campus
c
Y = logaritmo
l
(baase 10) del ing
greso familiarr
X = distancia
d
del hogar al cam
mpus
I1 = (100
(
- X)(5 - Y)/500
I2 =X
X(5-Y)/500
I3 = (100 - X)Y//500
I4 = X Y / 5 0 0
D = porcentaje dee estudiantes en
e la universid
dad que viven
n en el campu
us
S = 1 si es mujer y 0 de lo con
ntrario
R = 1 si el estudiiante dijo qu
ue prefera viv
vir en el cam
mpus y 0 de l o
contrario
El modelo logit
l
se estim
m usando la rutina
r
de estim
macin de mxima verosim
militud y una muestra de 1
10 600 estudiaantes que en realidad asisttan a la universidad. Los resultados
r
de la estimacin
n (con los errrores estndarres entre parntesis) son:15

14
M.G. Kohn,
K
C.F. Mansski y D.S. Munddel, "An Empiriical Investigation
n of Factors Whhich
Influence Colleg
ge Going Behavioor", Rand Corporaation Report R14770-NSF, Santa M
nica, CA, septiem
mbre
de 1974.
15
Omitim
mos el "sombreroo" sobre el valor pronosticado
p
paraa simplificar la presentacin
p
y conntinuaremos haciindolo as a lo laargo del resto dell libro.

CAPT
TULO 11: Modeloss de eleccin cualitativa

331

Figura 11.5

Probabilidad de
d vivir
en el campus (para
hombres, que asisten
a
a una universidad
con capacidad
d de
dormitorios de
el 50%,
que prefieren vivir en
el campus).

Laas variables de
d la interacciin entre disttancia e ingreeso son algo difciles de
intterpretar por s
s solas. Sin embargo, la figgura 11.5 muuestra que la probabilidad
p
de vivir en el caampus se incrrementa con la
l distancia deel campus y es
e mayor en
tod
das las distanccias para estuudiantes con in
ngresos familliares superiores. La probabbilidad de ressidencia en ell campus se incrementa
i
coon el porcentaje de estudiaantes que viv
ven en el cam
mpus sin limittaciones monnetarias. Por ltimo,

hay
una probabilidaad ligeramentee mayor, pero
o insignificantte, de vivir enn el campus
parra los hombrees que para laas mujeres.
Para interprretar el efectoo de un cambiio en D sobree la probabilid
dad de residenncia en el cam
mpus, necesitaamos resolver el cambio enn la probabilid
dad P de la
sig
guiente manerra:

Parra simplificarr, utilizamos eel hecho de quue para cualquuier variable continua
c
x,
log
l x = x/x y el hecho de qque log (x/y) = log x - log yy. Entonces,

Daado que hemoos elegido D = 1, resulta que


q

Si Pi fuera igual
i
a 0.5, por ejemplo, P
i sera iguall a 0.076. Qu
uiz el nico
vallor ms til dee Pi para elegiir esta interpreetacin es la media,
m
pero unn examen de
lass respuestas en
e la eleccinn del campuss para numeroosos puntos de
d la distribucin de probaabilidad puedde ser esclareccedor.

332

PARTE DOS: Modelos de regresin de una sola ecuacin

El modelo de eleccin del campus puede usarse con facilidad para hacer
predicciones. Supngase, por ejemplo, que deseamos predecir la probabilidad de
que un estudiante varn cuyo ingreso familiar es de 6 mil dlares y quien ha
manifestado su preferencia para vivir en el campus en lugar de en su hogar, en
efecto vivir en el campus. Supondremos que el estudiante asiste a una universidad cercana a su hogar en la que el 50% de los estudiantes viven en el campus.
Para predecir las posibilidades de vivir en el campus, evaluamos el lado derecho
de la ecuacin estimada cuando
I1 = .2(5 - log10 6 000) = .2444
I3 = .2(log10 6 000) = .7556

D = 50
S=0

I2 = I 4 = 0

R= 1

El logaritmo (base e) de las posibilidades es -2.10. Tomando los antilogaritmos y


resolviendo, encontramos que Pi = 0.108. Por tanto, predecimos que el estudiante vivir en el campus con una probabilidad de 0.108. Para observar cmo la
probabilidad de que el estudiante viva en el campus cambia conforme se
incrementa la distancia entre la universidad y el hogar, calculamos Pi para diferentes valores de distancia X:
Distancia
Probabilidad de vivir
en el campus

10

20

30

40

50

60

70

.108

.258

.500

.742

.892

.960

.986

.995

Ntese que una vez que el hogar del estudiante se encuentra a ms de 50


millas del campus, es casi seguro que elegir vivir en el campus.

11.1.4

Pronstico: bondad de ajuste

Como una regla general, los modelos desarrollados en este captulo pueden
aplicarse en forma directa para el pronstico de la probabilidad (o las posibilidades) de que se har una eleccin determinada. Por ejemplo, en el caso de la
votacin asumimos que la probabilidad pronosticada asociada con una observacin nueva es 0.8. Se puede interpretar 0.8 como la medicin de nuestro mejor
pronstico de la probabilidad de que un individuo con un ingreso determinado
votar que s en una eleccin.16 Por supuesto, si estamos pronosticando el comSupngase que nuestro objetivo es minimizar la varianza del error de pronstico. Sea P el
valor de pronstico de la probabilidad de que se har una eleccin determinada. Entonces, el error de
pronstico ser 1 P si ocurre el evento y 0 - P , en cualquier otro caso. La varianza del error de
2
2
pronstico es E = P( l - P )2 +(1 - P)(- P )2. Minimizando E con respecto a P produce P = P.
16

CAP
PTULO 11: Mode
elos de eleccin cu
ualitativa

333
3

poortamiento exxplcito de un solo individuuo, un pronsttico de 0.8 nunnca puede serr


coorrecto ex posst. Si deseamoos pronosticar elecciones inddividuales, es probable quee
prredigamos unn resultado de 1 (votar s) si
s la probabiliddad pronosticcada es mayorr
quue 0.5 y un reesultado de 0 si la probabiilidad pronostticada es men
nor que 0.5.
Esto sugieere un problem
ma con el uso de R2 como uuna medida dee ajuste. En ell
modelo
m
de reg
gresin clsicoo R2 puede vaariar en valorr entre 0 y 1, con un valorr
ceercano a 1 que
q indica unn buen ajuste. Sin embarggo, no es proobable que ell
modelo
m
de varriable dependiiente binario produzca unaa R2 cercana a 1.17 Si esta-bleciramos, por
p ejemplo, qque las probaabilidades verrdaderas de que
q ocurra unn
evvento estabann distribuidass de manera uniforme
u
a loo largo de un intervalo de-teerminado, sera posible mosstrar un lmitee superior paraa R2 de 1/3. Po
or tanto, no ess
so
orprendente que
q al estimar un modelo liineal de probaabilidad es pro
obable que see
ob
btenga18 una R2 baja.
Una altern
nativa adecuadda para R2 com
mo una medidda de bondad de
d ajuste es ell
nndice de raznn de verosimilittud. En el anllisis de la secciin 10.2 el nddice se basa enn
foorma directa en la estimaccin de mxiima verosimillitud. Supnggase que L(0)
reepresenta el valor
v
de la funncin log-veroosimilitud cuaando todos loos parmetros
so
on iguales a 0 y supngase que L(*) representa ell valor cuanddo la funcinn
lo
og-verosimilittud ha sido maximizadaa. Entonces, el ndice de
d razn dee
verosimilitud se define coomo:

Por construccin, si el proceeso de maxim


P
mizacin sugieere que no haay ganancia all
cambiar cualqquiera de los parmetros estimados
e
desde cero, enttonces ser
iggual a 0 tambin. Sin embaargo, si somoss afortunados de estimar un
na funcin dee
v
verosimilitud
que predice cada eleccinn en la muesstra en formaa correcta, laa
fu
uncin de verrosimilitud esstimada sera 1 y el ndice log-verosimiilitud sera 0.
C L(*) = 0,, resulta que = 1.
Con
De este modo,
m
el rangoo del ndice lo
og-verosimilittud vara de 0 a 1, de iguall
fo
orma que R2. Tambin com
mo R2, es impprobable estaar cerca de 1 cuando estnn
im
mplicadas eleecciones binarrias; del mism
mo modo, cuallquier valor numrico
n
par-tiicular de ess difcil de innterpretar. Noo obstante, ell valor de nos
n da algnn
inndicio de cunto puede gaanarse con la adicin de vvariables nuevvas a un mode 19
delo.

17
Este probllema se expone een D.G. Morrison
n, "Upper Boundss for Correlationss between Binaryy
Outcomes and Prob
O
babilistic Predictioons", Journal of th
he American Statiistical Association
n, vol. 67, 1972.
18
Hay medid
das alternativas de bondad de ajuuste para dichos modelos. Una medida
m
til es laa
en
ntropa condicional promedio descrita por H. Theil en Economics annd Informational Theory
T
(Chicago:
R
Rand
McNally, 19967; Amsterdam: North-Holland, 1967).
19
Para comeentarios adicionaales sobre la mediicin de la bondaad de ajuste, vas e Kenneth Train,
Q
Qualitative
Choice Analysis (Cambriidge, Mass.: M.I.T
T. Press, 1986), o G.S. Maddala, Limited-Dependentt
annd Qualitative Va
ariables in Econom
metrics (Cambridg
ge, UK: Cambridgge University Presss, 1983).

334

11,2

PA
ARTE DOS: Modellos de regresin de
e una sola ecuaci
n

MODELOS
S DE ELECC
CIN MLTIPLE
Ahora considderaremos la ggeneralizacin
A
n de los resultaados de la secccin anterior a
casos en los que los indivviduos hacen elecciones enntre tres o ms alternativaas
m
mutuamente
excluyentes. Hay varias formas
fo
en las que se puedee analizar estte
p
problema;
no
os enfocaremoos aqu en el caso en el quue las alternaativas no estnn
categorizadass.

11.2.1

Modelo line
eal de prob
babilidad

Primero, consideraremos lla extensin del


d modelo linneal de probabbilidad al casoo
de eleccioness mltiples. Si
S hay tres opcciones j = 1, 22, 3, escribim
mos

Pji es la probaabilidad de quue el individuo


o i elegir la jjsima opcinn, mientras quue
Xi es el valorr de X para ell isimo indiv
viduo. Para estimar
e
cada una
u de las trees
ecuaciones
e
en
n el modelo por mnimoss cuadrados oordinarios, noo es necesario
ejecutar
e
las trres regresionees lineales de probabilidad. Dado que laas probabilidaades
d estimadas estn restringidas para sumar
s
1, los interceptos estimados
e
parra
sumar
s
1 y loos parmetros de pendiennte para sumaar 0. Para deemostrar estoo,
usamos
u
el heccho de que caada observaciin es asignadda a un grupoo y slo a unoo.
Entonces,
E
P1i + P2i + P3i = 1. Despus de
d promediar todas
t
las obserrvaciones en el
e
grupo,
g
resulta que P 1 + P 2 + P 3 = 1 y p1i1 + p2i + p3i = 0 (pji = Pji P j).
Primero examinamos
e
la suma de las estimacionees de pendientte de mnimoss
cuadrados:

Por contrastee, los intercepptos suman 1, dado que

De este modoo, slo necesiitaremos ejecuutar dos de laas tres regresiiones de mniimos cuadraddos. Una soluucin para los parmetross de la tercerra ecuacin se
deriva de las primeras doss.

CAPTULO 11: Modelo


os de eleccin cua
alitativa

335

Si las variables X en caada ecuacin no son idntticas, el anlissis se vuelve


ms
m difcil. Es decir, las proobabilidades suman
s
1 y loss mnimos cuaadrados ordinaarios ya no so
on la tcnica ms adecuad
da. Un mtodoo til para solucionar este
prroblema es prroporcionado por Zellner y Lee, quienees proponen que
q se use un
prrocedimiento de estimacinn de mnimoss cuadrados ggeneralizados para explicar
laa correlacin entre los trm
minos del errror asociadoss con cada eccuacin en el
modelo
m
de elecccin mltiple.20

11.2.2

M
Modelo
logit

El ampliar el modelo
m
logitt en una man
nera anloga a la del modelo lineal de
prrobabilidad es
e bastante prromisorio.21 Por
P ejemplo, para extendeer el modelo
lo
ogit de eleccin binaria al ccaso de tres elecciones, por ejemplo, esccribimos
(11.15)
Ell subndice i, que designa las observaciiones individuuales, se ha eliminado por
sim
mplicidad. Enn este caso Pj, j = 1, 2, 3 inndica la probaabilidad de quue se haga la
jsima eleccin
n. Cada ecuaccin asume qu
ue el logaritm
mo de las possibilidades de
un
na eleccin reelativa a la segunda eleccin es una funncin lineal deel atributo X.
Esstas posibiliddades dependeen de las posibilidades asoociadas con las
l dos ecuaciones restantes slo en el ssentido de que el sistema ddebe restringiirse de modo
qu
ue la suma de las probabiliddades individduales sea iguaal a 1. Como en el modelo
linneal de probaabilidad, es innnecesario esstimar cada una
u de las tres ecuaciones
po
or separado. Podemos
P
simpplificar esto ex
xplicando el hecho
h
de que la
l eleccin de
la forma logit fuerza las limitaciones del
d modelo quue reducen el
e nmero de
paarmetros a estimarse de sseis a cuatro. Para ver por qu, ntese que,
q

Esto crea doos restriccionnes de parmeetro adicionalees:

20

Vase A.. Zellner y T.H. L


Lee, "Joint Estimaation of Relationsships Involving Discrete
D
Random
V ariables",
Econom
metrica, vol. 33, pp.
p 382-394, abriil de 1965.
21
Vase McFadden,
M
op. cit..; H. Theil, "A Multinomial
M
Extennsin of the Lineaar Logit Model",
Innternational Econo
omic Review, vol. 10, pp. 251-259, 1969; H. Theil, "O
On the Extensin of
o Relationships
Innvolving Qualitatiive Variables", Am
merican Journal of
o Sociology, vol. 76, pp. 103-154, 1970.

336

PA
A RTE DOS: Mode
elos de regresin de
d una sola ecuaccin

Es un poco ms fcil vver la forma del


d modelo loggit si redefinimos todos loss
parmetros desconocidos
d
ccomo:
(11.166)

Entonces, el sistema del modelo


m
de la ecuacin
e
(11.15) puede reeescribirse

(11.177)

Dado que loss parmetros de la tercera ecuacin pueeden calcularsse una vez quue
conocemos los
l parmetroos de las prim
meras dos ecuaaciones, la terrcera ecuacin
no necesita estimarse.
e
Supngaase que se disspone de suficientes repetiiciones; enton
nces, podemoos
usar la aproxximacin de m
mnimos cuaddrados ordinaarios para el procedimient
p
to
de estimacin correcto. Estimamos las siguientes doos ecuacioness (i se refiere a
cada uno de los k niveles de X para loss que se dispoone de repeticciones, no a laas
observacionees individualees):

(11.188)

Los parmettros estimadoos determinarn el efecto de los cambiios en X en eel


logaritmo dee las razones de las probabbilidades. Si sse necesitan las
l magnitudees
reales, debe tenerse
t
en cueenta la restricccin de que llas probabilidaades estimadaas
suman 1. Estto puede haceerse renormallizando los vaalores de los parmetros
p
esstimados desp
pus de que se ha ejecutaado la regresin de mnim
mos cuadradoos
inicial. Sin em
mbargo, es proobable que loss errores sean hheterocedsticcos. Adems, lla
correlacin del
d error de la ecuacin cruzada debbera ser expplicada usanddo
mnimos cuaadrados generralizados.
Si los coostos del clcuulo no son unn problema y no
n se disponee de suficientees
repeticiones deber usarsee una versin generalizada del procedim
miento de mxima verosimillitud, debido a que garantizza estimacionees de parmetrro consistentees
y estadsticass de muestra grande correcctas.

CAP
PTULO 11: Modelo
os de eleccin cua
alitativa

EJEMPLO 11
1.5

337

Lo
ogro ocupacion
nal

See construy un
u modelo lo git mltiple para
p
analizar el logro ocuupacional de
individuos,22 Ell objeto era predecir la proobabilidad rel ativa de que un
u individuo
es t en cada unna de las cincco categoras ocupacionalees: profesionaal, oficinista,
arttesano, obreroo o servicio domstico,
d
co n base en la raza,
r
gnero, educacin y
exxperiencia en el
e mercado labboral del indivviduo; se usaroon 1 000 obse rvaciones de
19970, cada una pertenecient e a un miemb ro de la fuerzza de trabajo que
q laboraba
tieempo completto. Se estim el siguiente modelo:

doonde subndicce 1 = ocupaciin de serviciio domstico


subndicce 2 = ocupaccin de obreroo
subndicce 3 = ocupaccin artesanall
subndicce 4 = ocupaccin de oficinnista
subndicce 5 = ocupaccin profesionnal
Ei = aos de
d escolaridadd del individuuo i
Xi = aos dde experienciaa laboral del i ndividuo i (e dad - E - 5)
Ri = raza deel individuo i (1 si es blannco, 0 si no ess blanco)
Si = gneroo del individuuo i (1 si es hhombre, 0 si es
e mujer)
Loos coeficientees estimados se
s dan en el cuadro.11.6.
c
Los resultaados demuestrran que mienttras ms educcacin se tengga, hace ms
prrobable que coloque
c
en unna ocupacinn de numerac in alta. Pro bablemente,
esto es lo que see espera; la edducacin nos permite
p
ascendder en la escalla laboral. La
nnica excepcinn es que entree ms educaci n hace menoos probable paara uno estar
enn una posicinn de obrero quue en una posiccin de serviccio domstico . Los efectos
dee la experienciia en el mercaado laboral so n mucho mennos fuertes a loo largo de las
occupaciones e indica
i
que loss obreros tiennden a tener ppoca experienccia mientras
quue los profesiionistas tiendden a tener muucha ms expperiencia.

22
P. Schmidtt y R.P. Strauss, "The Predictionn of Occupation Using Mltiple Logit Models",
Intternational Econo
omic Review, vol. 16, nm. 2, pp. 471-486, 1975.

338

PARTE DOS: Modelos de regresin de una sola ecua


acin

CUADRO 11.6
COEFICIENTES
S ESTIMADOS

* Significativo en el
e nivel del 5%.

Los resultados para ell gnero son evidentes.


e
Si ordenamos
o
lass ocupacioness de
la siguiente manera:
m
Oficinista
Servicio domstico
Profesion
nal Obrero
Artesano
o
entonces, maanteniendo coonstantes otros aspectos, ser mujer (ho
ombre) causaa
mayor probabbilidad de colocarse en cuaalquier grupo oocupacional in
nferior (superrior)
en la lista enn relacin conn cualquier otrro grupo ocuppacional. Porr ltimo, si
ordenamos laas ocupaciones de la siguiente forma:
Servicio domstico
Obrero
Profesion
nal
Artesanoo
Oficinista
entonces, no ser blanco (ser blanco) hace ms probaable estar en cualquier
c
gruppo
inferior (superior) en la liista en relaci
n con cualquuier otro gruppo. En esenciia
estos resultad
dos demuestrran que no serr blanco hacee ms probablle estar en unno
de los gruposs menos deseables desde el
e punto de vista econmico: servicio doomstico u obrrero. Ademss, se encuentraa la peor discrriminacin enn las posicionees
de oficinista y no como aalgunos podran haber esperado, en las posiciones dde
artesano.

CAPTULO
C
11: Mod
delos de eleccin cu
ualitativa

11.2.3

339

Modelo prob
bit ordenad
do

Una
U extensin interesante ddel modelo proobit se aplica a modelos enn los que hay
unn ordenamiennto en las caategoras asoociadas con lla variable deependiente.23
Su
upngase, po
or ejemplo, quue estamos esstudiando un proceso de vootacin en el
quue tres partidoos ofrecen caandidatos paraa un cargo. Ell primer cand
didato es conseervador, el seggundo es liberral y el terceroo es un socialista. Supngasse que hay un
n
ndice subyaceente Z para cada votante individual
i
que mide la exttensin en la
quue cada canddidato siente qque deberam
mos basarnos een el sistemaa de mercado
co
ompetitivo. La
L variable deppendiente obsservada se miide como Yi = 3 si es conseervador, 2 si es
e liberal y 1 si
s es socialistaa. El modelo pprobit ordenaddo asume que
haay puntos de corte Z* y Z*** que definen
n la relacin entre las variiables dependiientes observaadas y no obsservadas. De manera
m
especfica, Zi = + Xi , y

Como en el
e modelo proobit de dos categoras, loss parmetros y los errores
esstndar asintticos son estiimados usand
do el mtodo de mxima verosimilitud.
v
L pruebas noormales estnndares puedenn aplicarse paara probar la significancia
Las
dee coeficientess individuales.

EJEMPLO 11.6

Vo
oto del Congre
eso sobre Med
dicare

McKelvey y Zavoina
M
Z
usaroon un modelo probit ordennado para anallizar la votaciin del Congreeso sobre el prroyecto de leyy de Medicare en 1965.24 An
ntes de que el
prroyecto de leey fuera anunnciado por ell comit, se rrechaz una mocin para
vo
olverlo a som
meter a una coomisin y por tanto debilitaar el proyecto. Los autores
deel modelo anaalizaron los vvotos en estas dos ocasionees separadas para
p determinaar un ndice de
d la posicinn de cada dipu
utado sobre M
Medicare. Huubo tres combiinaciones de votacin:
v
la pposicin de mayor
m
apoyo fuue adoptada por
p diputados
quue votaron co
ontra volverlo a someter a una
u comisin y a favor de la
l aprobacin
deel proyecto; la segunda pposicin interrmedia fue addoptada por aquellos
a
que
vo
otaron a favo
or de la reconsideracin y a favor de la aprobacin; y la posicin
m dbil fue adoptada
ms
a
por aquellos que votaron a favvor de la reconnsideracin y
enn contra de la
l aprobacinn. Las variabbles explicativvas usadas fu
ueron las sigu
uientes:
Partido =

23

si es reepublicano

si es ddemcrata

Regin =

si es del surr

0 en cualquierr otro caso

Esta tcniica se expone en R.D.


R McKelvey y W. Zavoina, "A Statistical Modell for the Analysis
off Ordinal
Level
D
ependent
Variable
es", Journal of'M
Mathematical Socioology, vol. 4, pp. 103-120,
1
1975.
24
McKelveyy y Zavoina, op. ciit.

340

PA
ARTE DOS: Mode
elos de regresin de
d una sola ecuaccin

CUADRO
C
11.7
COMPARACIN
C
N DEL ANLISIS
S DE REGRESI
N Y PROBIT

Emplleo = % de deesempleo en el distrito eleectoral


Ancianiddad = % mayoor de 65 aos
Poblacin = densidadd de poblacin, miles por milla cuadraada
El cuadro
o 11.7 muestraa los resultadoos de estimar el modelo pro
obit. Como unn
medio
m
de com
mparacin loss datos tambin se usaron ppara estimar un modelo dee
regresin
r
lineeal en el que lla variable deependiente eraa VOTE = 2 si era fuerte a
favor
f
de Mediicare como see describi anntes, 1 si era dbil
d
a favor y 0 si estaba enn
contra.
c
Para comparar
c
los coeficientes resultantes ccon el modelo
o probit, cadaa
variable
v
fue normalizada
n
ppara tener meedia cero y vaarianza unitarria. Obsrvesee
que
q la importaancia y signifiicancia relativvas de cada varriable vara cuuando se usa eel
modelo
m
probiit estandarizaado, en opossicin al uso del modelo de regresinn
estandarizado
e
o. En el anlissis de regresin, el partido y la regin so
on con muchoo
los
l pronosticadores ms importantes
i
d la postura sobre Mediccare, mientras
de
que
q en el anllisis probit el empleo y en especial
e
la pobblacin se vollvieron muchoo
ms
m importan
ntes.
Cul tcnnica analtica es la ms adeccuada? La estaadstica R2 callculada para eel
modelo
m
probitt mide la porccin de la varriacin en la eescala subyaceente explicadaa
por
p el modello y por tantoo es ms o menos
m
compaarable a su contraparte
c
dee
regresin
r
lineeal. Sin embarrgo, dado que el modelo dee regresin lin
neal aqu tienee
en
e esencia los mismos deffectos que el modelo lineaal de probabiilidad descritoo
antes,
a
es prefferible probit. En efecto, sii se fueran a comparar loss modelos conn
base
b
en la bon
ndad de ajustte (R2), probitt dominara een forma clara.

11.3

MODELOS
S DE REGRE
ESIN CENS
SURADA
Todos
T
los probblemas de eleeccin cualitattiva que hemoos analizado enn este captuloo
tratan
t
de variiables dependdientes que soon discretas, ggeneralmentee tomando

CA
APTULO 11: Modellos de eleccin cua
alitativa

341

sllo dos o tres valores.


v
Sin em
mbargo, hay ocasiones
o
en llas que la variiable dependieente se ha connstruido con base en una variable conttinua subyaceente para la
quee hay una varriedad de obsservaciones soobre las que nno tenemos in
nformacin.
Suupngase, porr ejemplo, quue estamos esstudiando los salarios de las
l mujeres.
Coonocemos los salarios reales de aquellas mujeres que estn
e
trabajan
ndo, pero no
connocemos el "salario de resserva" (el sallario mnimo por el que trrabajara un
inddividuo) para aquellas que no trabajan. El
E ltimo gruupo tan slo es
e registrado
com
mo que no est trabajando. O tambin podramos
p
esttudiar el comp
portamiento
de compra de au
utomviles usando una enncuesta aleatoria de la pobllacin. Para
loss que comprarron un automvil podemoss registrar su gasto,
g
pero paara aquellos
quee no han com
mprado no tennemos medidaa de la cantiddad mxima que
q estaran
disspuestos a pag
gar en el mom
mento de la encuesta.
e
En ambos ejemplos
e
que se acaban dee describir, laa variable deppendiente es
cennsurada: faltaa la informacin para la varriable dependiiente, pero la informacin
i
corrrespondientee para las variaables indepenndientes est presente.
p
(Si faltan
fa
ambas
claases de datos, describimos a la variable dependiente ccomo truncadda.) En esta
secccin mostrarremos que la estimacin de
d mnimos ccuadrados orddinarios del
moodelo de regreesin censuraada generar estimaciones
e
de parmetroo sesgadas e
incconsistentes. Entonces,
E
sealaremos un
n estimador dde mxima veerosimilitud
connsistente com
mo una alternaativa preferible adecuada.
Supngase que la versin continua suubyacente dell modelo est dada por:
(11.19)
Y* podra repressentar el gastto en compraas de automvviles para loss individuos
quee compran unn automvil o el gasto de reserva para aquuellos que no compran, y
X* podra repreesentar el ingrreso familiar. Para las perrsonas que no
o han compraado un autom
mvil, Y* no puuede medirse y se establecce igual a 0. Como
C
resultad
do, la variablee dependientee observada est dada por:
(11.20)

Laa ecuacin esttimada real apparecer entonces de la sigguiente formaa:


Yi = + X
Xi + i

(11.21)

El modelo en
e la ecuacinn (11.21) en ocasiones
o
es lllamado modeelo Tobit, en
recconocimiento de su desarroollo por el ecoonomista Jamees Tobin. Dessafortunadameente, la estimaacin de mnim
mos cuadradoos ordinarios del
d modelo To
obit produce
esttimaciones sessgadas e incoonsistentes de y . Esto ppuede verse coon facilidad
callculando la media
m
de i. Para que los mnimos
m
cuaddrados sean in
nsesgados y
con
nsistentes, estaa media debe ser igual a cerro, pero sabem
mos que Yi 0.. Resulta, en
forrma directa, quue i - - X
Xi. Para cualqquier valor parrticular de Xi , la media de
i puede
p
ser posiitiva, negativaa o cero. El caaso de una meedia positiva se
s

342

PARTE
P
DOS: Mod
delos de regresin
n de una sola ecu acin

Figura 111.6
La funcin
n de densidad
de probab
bilidad de una
variable aleatoria
a
normal.

representa en
e la figura 11.6. Aqu se muestra
m
la funncin de denssidad de probbabilidad del trmino
t
del eerror verdaderro (distribuuida en formaa normal), junnto
con el rea sombreada,
s
laa cual seala toodos los valorres para los qu
ue i - - X
Xi.
A partir de esta figura se
s puede detterminar la fuuncin de deensidad de prrobabilidad deel trmino deel error censurado de la sigguiente maneera:

El denominaador en la exppresin de la derecha


d
tan slo es el rea sombreada
s
enn la
figura. Dividir entre esta rea normaliza la funcin de densidad de modo que el
rea total baajo la funcinn de densidadd de probabiliidad es igual a 1.
Como un
u paso final podemos
p
evalu
uar la media del
d trmino dell error truncaddo.
De manera especfica,
e
(11.222)

donde i = f(
f( + Xi)/F( + Xi), es la
l desviacin estndar
e
del trmino del errror
verdadero i*, f es la funcin de densiddad de probabiilidad de una variable
v
norm
mal
estndar y F es la funcinn de distribuccin acumulattiva corresponndiente.25
i en occasiones se llaama tasa de riesgo. Si tennemos estimaaciones de i, se
puede usar para normaliizar la mediaa de i a cero y por consigguiente obtenner
estimadoress consistentes de y . Jam
mes Heckmann ha diseadoo un proceso de
estimacin de
d dos etapas relativamentee simple que producir
p
estim
maciones conn-

25
J.J. Heck
kman, "Sample Seelection Bias as a Specification Errror", Econometricca, vol. 47, pp. 1553161, enero de 1979, expone la derivacin de estte resultado.

CAPTULO 11: Modelos de eleccin cualitativa

' 343

sistentes de y .26 En la primera etapa estimamos i utilizando el modelo


probit
Pi = F( + Xi) = F(Yi* )

(11.23)

El modelo probit es estimado por el mtodo de estimacin de mxima verosimilitud (vase el apndice 11.1) distinguiendo aquellas observaciones para las que
Yi* 0 de aquellas para las que Yi* 0. (Tambin podra usarse un modelo lineal
de probabilidad con Zi= 1 si Yi* 0 y Zi = 0 si Yi* 0, pero permaneceran todas las
dificultades mencionadas antes en este captulo.) A partir de los parmetros
estimados y del modelo probit, es sencillo calcular i. Usamos una tabla para
la distribucin normal o nos basamos en un paquete estadstico para hacer el
clculo.
La segunda etapa de la estimacin de dos etapas utiliza el siguiente modelo:
Y i = + X i + i + u i

(11.24)

en el que se ha agregado i como una variable explicativa adicional. Debido a que


i se aproxima a i conforme se hace grande el tamao de la muestra y i
normaliza la media de i a cero, la estimacin de mnimos cuadrados ordinarios
de la ecuacin (11.24) produce estimaciones consistentes de y . Lamentablemente, el estimador de dos etapas (como el estimador lineal de probabilidad)
implica errores heterocedsticos (la varianza del error depende de Xi al igual que
de que Y= 0), as que las pruebas t usuales estn sesgadas. Adems, el estimador
no es tan eficiente como el estimador de mxima verosimilitud. Por consiguiente,
por lo general, es mejor usar estimacin de mxima verosimilitud si se dispone
de un programa con facilidad. Sin embargo, el mtodo de estimacin de dos
etapas puede ser til en el proceso de desarrollo del modelo.27

EJEMPLO 11.7

La demanda de escuelas pblicas

En el ejemplo 11.3 se mostr cmo poda usarse el modelo logit para explicar la
decisin de votar que s en una eleccin escolar como una funcin de varias
caractersticas individuales y del hogar. La variable dependiente se basaba en
una variable binaria YESVM, la cual era igual a 1 si el individuo votaba s y a 0 si
el individuo votaba no.
Usando una ecuacin de gasto en escuelas que relaciona el logaritmo de
gasto escolar por alumno con una multitud de variables de demanda, hemos
construido una variable dependiente nueva, LOGEDUC, la cual mide el
logaritmo de cada nivel deseado de gasto escolar por alumno del individuo. Para
simplificar el anlisis que sigue, hemos asumido que el precio (log PRICE) y el
ingreso (log INC) son las nicas dos variables explicativas.
26

27

Ibid.

Para una exposicin ms completa del modelo Tobit, vase T. Amemiya, "Tobit Models: A
Survey", Journal of Econometrics, pp. 3-61, enero/febrero de 1984.

344

PARTE DOS: Modelos de regresin de una sola ecuacin

Si conocemos el valor de gasto deseado de todos los que responden, la demanda de gasto escolar por alumno podra estimarse usando el mtodo de mnimos cuadrados ordinarios. Aprovechando las 95 observaciones del estudio de
Troy, Michigan, del ejemplo 11.3, obtuvimos los siguientes resultados (las estadsticas t estn entre parntesis):
LOGEDUC = 5.89 - .31 log PRICE + .38 log INC
(4.23) (-2.07)

R2 = .11

(3.18)

F = 5.95

Supngase, que la nica informacin de gasto provena de aquellos individuos que en realidad votaron que s en la eleccin escolar. Entonces se construira
la variable dependiente truncada YSTAR como el producto de LOGEDUC y
YESVM. Si se usaran mnimos cuadrados ordinarios para estimar el modelo
truncado, obtendramos los siguientes resultados:
YSTAR = 1.77 - 3.03 log PRICE +
(.17)

(-2.65)

R2 = .11

2.40 log INC


(2.63)

F = 5.60

El estimador de mnimos cuadrados ordinarios sesgado de una etapa, se


desempea en forma bastante deficiente en relacin con el modelo verdadero.
Tanto el trmino de precio como el de ingreso tienen el signo correcto, pero
ambos son considerablemente grandes, y adems el trmino de precio es demasiado grande en relacin con el trmino de ingreso. (Las estadsticas t significativas son engaosas debido a que el estimador es inconsistente.)
Estos resultados no son sorprendentes debido a que las estimaciones del
coeficiente fueron ambas sesgadas e inconsistentes. Para obtener estimaciones
de parmetro consistentes usamos el procedimiento de dos etapas sugerido por
Heckman. En la primera etapa estimaremos el siguiente modelo probit:
Prob (Votar s) = .090 - 2.12 log PRICE + .86 log INC
(.022)

(-2.41)

(2.34)

A partir de estos resultados de regresin calcularemos el ndice de riesgo i.


Luego utilizaremos el ndice de riesgo estimado para calcular la segunda etapa
del proceso de estimacin, con el mtodo mnimos cuadrados ordinarios, se
tienen los siguientes resultados:
YSTAR = 3.26 - .61 log PRICE + .81 log INC + .41i
(1.15)

(-1.32)

R2 = .13

(1.74)

F = 2.74

(.69)

CAPT
TULO 11: Modeloss de eleccin cualita
ativa

345

Nteese que el pro


ocedimiento de
d dos etapass consistente genera coeficientes de
precio e ingreso (stos puedenn interpretarsse como elastticidades) quee tienen el
signoo correcto y la magnitud reelativa correctta. Sin embarggo, ambos son
n mayores
que los coeficienttes verdadeross y son estadsticamente inssignificantes en
e el nivel
del 5%.
5 Por supu
uesto, se obtenndra un conjunto de estim
maciones mss preciso y
ms eficiente si usramos
u
el prrocedimiento de estimacin de mxima verosimilitudd.

AP
NDICE 11..1
Estim
macin de mx
xima verosimilitud de los mo
odelos logit y p
probit

Cuanndo se usan ya
y sea el moddelo probit o el modelo loogit con obseervaciones
indivviduales, la tcnica de estim
macin ms adecuada
a
es laa de mxima verosimilitudd. Supngase que deseamos estimar los parmetros ddel modelo loggit28

Las Pi individuales no son observadas; en su lugar, teneemos informaacin para


cadaa observacin sobre si se seleccion la prrimera o la seggunda opcin. La variable dependiente
d
medida
m
es Yi = 1 si se hace la primera elleccin y 0 si se hace la
segu
unda. Nuestro objetivo es enncontrar estim
madores de paarmetro para y que
hagaan ms probaable que las elecciones enn la muestra hubieran occurrido. Si
asum
mimos que la primera alternnativa es eleg
gida n1 veces y la segunda es elegida
n2 veeces (n1 + n2 = N) y si orddenamos los datos de moddo que las prrimeras n1
obseervaciones esttn asociadas con la primeera alternativaa, la funcin de verosimilittud tiene la foorma
(A11.2)
Ahoora, tomando en cuenta el hecho de quue la probabillidad de que se elija la
seguunda alternativva es igual a 1 menos la proobabilidad de qque se elija laa primera y
usanndo para reepresentar el producto de varios factorees, la funcinn de verosimiilitud se reducce a:

28

La estimacinn de mxima veroosimilitud del moodelo probit es parecida a la del modelo


m
logit,
exceppto que Pi represeenta las probabiliddades asociadas con
c la funcin noormal acumulativ
va en lugar de
con laa funcin logsticca acumulativa.

346

PARTE DOS: Mo
odelos de regresin de una sola ecuacin

La ltima expresin
e
resuulta porque Yi = 1 para las prrimeras n1 obsservaciones y 0
para las lttimas n2 obserrvaciones.
Maxim
mizamos el loggaritmo de L sustituyndol
s
o para la funccin de probabbilidad logsttica de la ecuacin (A11.1). Ntese prim
mero que

Para obtener los estimaddores y diiferenciamos log L con resspecto a y ,


establecem
mos los resultaados igual a cero
c
y resolveemos:

El proccedimiento de estimacin de mxima vverosimilitud tiene varias prop


piedades estadsticas
e
deeseables. Tod
dos los estimaadores de loss parmetros son
consistentees y eficientess asintticameente. Adems, se sabe que todos los estimadores de loos parmetros son (asintticamente) noormales, de modo
m
que puuede
aplicarse ell anlogo de laa prueba t de regresin.
r
Si se
s desea probaar la significanncia
de todos o un subconjunnto de los coeeficientes en el
e modelo loggit o en el moddelo
probit cuanndo se usa mxxima verosim
militud, entoncees puede apliccarse la pruebaa de
razn de veerosimilitud dde la seccin 10.2.
Para obtener
o
una m
medida de bon
ndad de ajustte anloga a R2, son posibbles
varias opciiones. Una ess calcular 1 - Lo/Lmx, dondde Lo es el valor
v
inicial dee la
funcin dee verosimilituud y Lmx es el
e valor ms alto. Una segunda opcinn es
calcular los residuales i = Yi Pi. Todos
T
estos reesiduales sern positivos para
p
aquellos quue hagan la pprimera elecccin y negativvos en cualquuier otro casoo, al
igual que sern
s
correspoondientementte ms pequeos en valor absoluto confforme el mod
delo explique cada vez mejjor las eleccioones que se haacen. A partirr de
estos residduales es fcil calcular un anlogo
a
de R2. Se tiene quee:

CAPTULO 11: Modelo


os de eleccin cua
alitativa

347

EJ
JERCICIOS
11.1 Al corregir el modelo lineeal de probabiliddad para la heteerocedasticidadd, por qu no
puueden usarse enn forma directaa los residualess de mnimos cuadrados
c
paraa calcular una
esttimacin de la varianza del errror i2 en lugarr de usar la frrmula de la ecuuacin (11.3)?
11.2 Qu les suucedera a los cooeficientes del modelo lineal de
d probabilidadd si la variable
deependiente bin
naria fuera reppresentada por una variable (0, 2) en lugaar de por una
vaariable (0, 1)? Qu

le sugierre esto acerca de la interprettacin de los parmetros


p
de
mnimos cuadraddos estimados??
11.3 Demuestre que la transforrmacin del modelo
m
de probaabilidad descritto en la ecuacin (11.4) usand
do una funcinn de probabilid
dad uniforme acumulativa
a
prroduce la versi
n restringida del
d modelo lineeal de probabillidad.
11.4 Considere el ejemplo de incumplimien
nto de bonos m
municipales (ejjemplo 11.1).
Exxplique cmo podra
p
reinterppretar el problema del incum
mplimiento de los bonos en
funncin de un moodelo probit. Cules son alggunas de las veentajas y desvenntajas de usar
la especificacin
n probit en lugaar de la especifficacin lineal de
d probabilidadd?
11.5 El modelo logit de la ecuuacin (11.9) es lineal en los parmetros y, sin embargo,
deebe (por lo gen
neral) estimarse usando un paquete de estim
macin no lineeal. Explique
estta inconsistenccia aparente.
11.6 Usando loss siguientes seis puntos de daatos, estime un modelo lineal de probabilidaad con el uso dee mnimos cuaadrados ordinarrios:

X
Y

-1
0

-2 0
0 0

1
1

1
1

1
1

Caalcule R2 para el
e modelo. Lueggo use el modeelo estimado paara clasificar a los
l individuos
en
n dos categoraas. Calcule el nnmero de classificaciones coorrectas usandoo la siguiente
reg
gla de clasificaccin:

Diiscuta las ventaj


ajas y desventajas de usar R2 o el porcentaje dde clasificacion
nes correctas
como una medidda de la bondadd del ajuste en el modelo lineeal de probabilidad.
11.7 Refirase all conjunto de ddatos en el .cuaadro 11.8.
a) Utilizandoo procedimientoos OLS, probit y logit, estime los
l parmetros en
e el modelo
Prob (YESVM
(
= 1) = F

(PUB1&2, PUB3&4, PUB5, PRIV,


YEAR
RS, SCHOOL, loog INC, PTCON
N)

C
Cmo se compaaran los resultaados?
b) Usando laas estimacionees OLS, pronosstique YESVM
M para cada casso. Cuntos
casos resultan en
n realidad en prredicciones fueera del rango de 0 a 1? Haga un
u anlisis.

348

PARTE DOS: Mod


delos de regresin
n de una sola ecua
acin

CUADRO 11.8
CONJUNTO DE
E DATOS DE VO
OTACIN
Variables como
o en el cuadro 11
1.5 con adicin de
d PTCON = log
garitmo natural de
d impuestos
prediales pagad
dos por ao, en dlares; YESVM
M = variable indiccadora igual a 1 si el individuo
vot s en la ele
eccin v 0 si el individuo vot no
o.

CAP
PITULO 11: Mode
elos de eleccin cu
ualitativa

CU
UADRO 11.8
CO
ONJUNTO DE DA
ATOS DE VOTA
ACIN (Continua
acin)

349
9

PARTE

TRES
MODELOS DE ECUACIONES
MLTIPLES

En los siguientes tres captulos tratamos los modelos que constan de ms de una
ecuacin. En un modelo de regresin de una sola ecuacin la variable dependiente se relaciona con un conjunto de variables explicativas; por ejemplo, una
tasa de inters puede relacionarse con el PIB, la tasa de inflacin y el suministro
monetario. Sin embargo, los modelos de una sola ecuacin no explican las
interdependencias que pueden existir entre las variables explicativas, o mostrar
cmo estas variables explicativas se relacionan con otras variables. Adems, los
modelos de una sola ecuacin explican la causalidad en una sola direccin; es
decir, las variables explicativas determinan una variable dependiente, pero no
hay relacin de retroalimentacin entre esta variable y las variables explicativas.
Los modelos de simulacin de ecuacin mltiple nos permiten explicar las
interrelaciones dentro de un conjunto de variables. Con frecuencia estos modelos
estn formados por un conjunto de ecuaciones de regresin que, despus de ser
estimadas, son resueltas de manera simultnea en una computadora. Sin
embargo, los modelos de simulacin tambin pueden incluir ecuaciones que no
son estimadas, como las identidades de contabilidad y las reglas empricas conductuales.
En el captulo 12 describiremos algunos de los problemas de estimacin
implicados en los modelos de ecuacin mltiple al igual que el problema de la
identificacin del modelo. Tambin examinaremos algunas tcnicas de estimacin que se han elaborado para modelos de ecuacin mltiple, incluyendo mnimos cuadrados de dos y tres etapas.
En los captulos 13 y 14 expondremos algunos problemas generales implicados en la construccin, evaluacin y uso de modelos de simulacin. En el cap-

351

352

PARTE TRES: Modelos de ecuaciones mltiples

tulo 13, describiremos cmo se lleva a cabo en realidad la simulacin de un


modelo, cmo puede evaluarse un modelo de simulacin y cmo el mtodo de
estimacin particular usado para un modelo afecta su desempeo en la simulacin. Tambin analizaremos las autorregresiones vectoriales: modelos no estructurales en los que un conjunto de variables se relaciona con valores rezagados. En
el captulo 14 examinaremos el comportamiento dinmico de los modelos de
simulacin, mtodos de ajuste de modelos de simulacin y el uso de simulacin
estocstica para determinar intervalos de confianza para pronsticos con
modelos.

CAPTULO

12

ESTIMACIN DE ECUACIONES
SIMULTNEAS

En las dos primeras partes de este libro nuestro principal inters eran los modelos
de una sola ecuacin. Encontramos que en muchos casos la estimacin de
mnimos cuadrados ordinarios es el procedimiento de estimacin ms apropiado. En este captulo dirigiremos nuestra atencin a los modelos consistentes de
varias ecuaciones, en los que el comportamiento de las variables se determina en
forma conjunta. Quiz el ejemplo ms simple de un modelo de ecuacin
simultnea es el modelo de dos ecuaciones de la demanda y la oferta del mercado, donde tanto el precio como la cantidad son variables endgenas. Los ejemplos ms complejos incluyen modelos econmicos industriales, regionales y
nacionales. Todos estos ejemplos se parecen en que cada modelo incluye diversas
variables endgenas que son determinadas en forma simultnea por una serie
interrelacionada de ecuaciones.
La presencia de dos o ms variables endgenas necesita alguna construccin
de modelo y herramientas de estimacin adicionales. Por ejemplo, la simultaneidad puede causar que los estimadores de los parmetros por mnimos cuadrados ordinarios sean inconsistentes, de modo que debe usarse un mtodo de
estimacin alternativo. Desarrollaremos dichas herramientas trabajando con
ejemplos simples de tal forma que sea lo ms comprensible posible. Los apndices 12.1 a 12.3 contienen un desarrollo matemtico ms completo de muchas de
las tcnicas descritas en el texto.
Este captulo comienza con una explicacin de la inconsistencia de los mnimos cuadrados ordinarios, cuando se utilizan para estimar una ecuacin que
es parte de un sistema de (dos) ecuaciones determinadas de manera simultnea. La segunda seccin expone el problema de identificacin, siendo el principal problema la determinacin de las condiciones bajo las cuales pueden esti353

354

PA
ARTE TRES: Modelos de ecuacione
es mltiples

marse de man
m
nera consistennte los parm
metros estructuurales de una ecuacin. Coon
estos anteced
dentes describbiremos los mnimos
m
cuadrrados de dos etapas,
e
un tippo
de estimador de variables instrumentales usado conn frecuencia. Luego
L
mostraar
remos
cmo estimar
e
modeelos de ecuacioones simultnneas con correelacin serial y
u variable dependiente
una
d
r
rezagada.
Porr ltimo, analiizaremos los problemas
p
quue
implican sisteemas de ecuaaciones. Descrribiremos loss mtodos porr los que todaas
las ecuacionees en un sistem
ma del modeelo son estimaadas de maneera simultneaa,
p
proporcionan
ndo, por consiiguiente, una mejora en laa eficiencia.

12.1

INTRODU
UCCIN A LO
OS MODELOS DE ECU
UACIONES S
SIMULTNE
EAS
Con frecuenccia en el modeelado de negoocios y econm
mico, el proceeso o procesoos
b
bajo
estudio pueden repreesentarse mejo
or con una seerie de ecuaciones simultneas interdeppendientes. Loos ejemplos ms
m comunes de tales ecuaaciones son loos
modelos de oferta
o
y demaanda, en los que
q el precio de un produccto es determiinado de mannera simultneea por la inteeraccin de prroductores y consumidorees
en un mercad
do, y los modelos de deteerminacin del
d ingreso macroeconmi
m
ico, en los quee el consumo agregado y el
e ingreso dispponible agreggado son deterrminados en forma
f
simultnea. Usarem
mos estos moddelos para iluustrar el hechho
de que la estim
macin de mnnimos cuadraddos ordinarioss de ecuacionees individualees
en un modello de ecuacioones simultn
neas puede cconducir a estimadores de
d
p
parmetro
seesgados e incoonsistentes. Luego
L
exponddremos los procedimiento
p
os
alternativos de
d estimacinn de una solaa ecuacin quue producen estimadores
e
d
de
p
parmetro
coonsistentes.

12.1.1

Sistemas
S
de
e ecuacione
es simultneas

Desde este puunto en adelaante pensarem


mos en los moodelos como consistentes
c