Está en la página 1de 246

ECONOMETRA PRCTICA

CON RATS 4.3

SERGIO ZUIGA Universidad Catlica del Norte Julio, 2001

Revisado, junio 2009

PRESENTACION
Es sabido que el estudio de la econometra requiere, en apoyo al estudio de los aspectos conceptuales, la estimacin emprica de los modelos economtricos para anlisis, contrastacin y prediccin. Para esto el estudiante debe estar familiarizado con un buen programa de ordenador, de los cuales existen en el mercado muchas alternativas, como por ejemplo E-Views, Limdep, Gauss, Stata o SAS, cada uno de ellos con caractersticas especiales. Este libro se ocupa de introducir al lector en el programa RATS (Regresion Analysis of Time Series). Si bien RATS es actualmente utilizado principalmente por investigadores de primer nivel de todo el mundo, a travs de este libro intentamos poner el programa al alcance de los estudiantes, y mostrar como ste posee la suficiente capacidad y flexibilidad para resolver la casi totalidad de los problemas economtricos. En efecto, RATS es un programa del tipo avanzado y est especializado en el anlisis de series de tiempo, pero como se ver, tiene implementadas las instrucciones requeridas como para ser utilizado en los cursos de econometra a nivel de licenciatura en administracin y economa. Adems, RATS tiene una estructura de programacin sencilla, la cual es necesaria para facilitar el trabajo repetitivo, especialmente en investigaciones formales. En adicin existe una importante cantidad de rutinas especializadas (procedures) que estn disponibles gratuitamente en el sitio web de los proveedores del programa: www.estima.com. El objetivo principal de este libro es servir como texto de apoyo en los laboratorios computacionales de econometra, es decir un objetivo netamente prctico, por lo cual hemos intentado presentar y resolver gran nmero de ejemplos numricos, a costa de centrarnos solo en los aspectos fundamentales de la teora subyacente, la que asumimos ser estudiada en alguno de los numerosos libros de texto introductorio existentes, tales como Introduccin a la Econometra de Maddala, Anlisis Economtrico de Green, Introduction to the Theory and Practice of Econometrics de Judge et al., y Econometra de Gujarati. Respecto al uso avanzado de RATS, como siempre el RATS Users Manual es de gran ayuda, al igual que el libro RATS Handbook for Econometric Time Series de Enders. Respecto a las series de datos utilizadas en los distintos ejemplos a travs del libro, stas se encuentran listadas en el apndice del libro, y tambin pueden ser bajadas libremente en la direccin de Internet www.eic.cl/szuniga/. Debe tenerse en cuenta que tales series son mucho ms cortas que las normalmente utilizadas en los estudios reales, y que tambin muchas de ellas son ficticias, por lo que los resultados pueden carecer de sentido econmico, un costo que se estar dispuesto a asumir si el objetivo fundamental es el de ilustrar los procedimientos de estimacin economtrica en RATS, con la posibilidad que el estudiante verifique los resultados y experimente con otras opciones. El libro est organizado como sigue: En el primer captulo entregamos una introduccin al uso del programa, lo que incluye el uso del editor de RATS, los diferentes tipos de datos y la instruccin COMPUTE, la forma de ingresar y visualizar datos, y el trabajo con series de datos, lo que involucra la instruccin SET. El captulo 2 desarrolla la estimacin de regresiones simples en RATS a travs de la instruccin LINREG. El captulo 3 implementa mnimos cuadrados restringidos, los que permiten evaluar distintas hiptesis a travs de las pruebas de Wald, de la Razn de Verosimilitud y del Multiplicador de Lagrange. El captulo 4 discute los problemas relacionados con la heterocedasticidad, autocorrelacin y multicolinealidad, incluyendo los procedimientos de deteccin y correccin implementados en RATS. El captulo 5 introduce una serie de tpicos relacionados con el modelo de regresin lineal mltiple: prediccin, variables dummy, error en las variables a travs del uso de variables instrumentales, y datos del tipo panel. El captulo 6 implementamos la estimacin de modelos no lineales a travs de la instruccin FIND y NLLS, incluyendo el procedimiento de mxima verosimilitud a travs de la instruccin MAXIMIZE. En el captulo 7 implementamos sistemas de ecuaciones lineales y no lineales, e introducimos la estimacin de sistemas de ecuaciones simultneas a travs de mnimos cuadrados en 2 y 3 etapas. En el captulo 8 analizamos los conceptos de estacionariedad a travs de correlogramas y pruebas de races unitarias, y el concepto de cointegracin a travs de la prueba de Engle-Granger. Finalmente, el captulo 9 est dedicado al anlisis de series de tiempo, lo que incluye procesos ARIMA a travs de la metodologa de Box y Jenkins, y los modelos de vectores autorregresivos (VAR).

INDICE

b............................................................................................................................ 40 2.3.3. LA MATRIZ DE COVARIANZAS DE LOS ERRORES ................................................................................ 41 2.3.4. UNA MEDIDA DEL XITO DE AJUSTE.................................................................................................... 43 2.4. CARACTERISTICAS ADICIONALES DE LINREG ....................................................................................... 44 2.4.1 SALIDAS OPCIONALES DE LINREG ........................................................................................................ 44 2.4.2. OPCIONES DE LINREG ............................................................................................................................. 45

2.5. INTERPRETACION DE LOS COEFICIENTES DE REGRESION .................................................................. 47 2.5.1. INTRODUCCION ........................................................................................................................................ 47 2.5.2. FORMA DOBLE LOGARITMICA ............................................................................................................... 48 2.5.3 MODELO LOGARTMICO LINEAL (DE CRECIMIENTO CONSTANTE) ................................................ 49 2.5.4. OTRA VISION DE LOS COEFICIENTES DE PENDIENTE....................................................................... 49 2.6 RESUMEN: UNA CRTICA AL MODELO....................................................................................................... 51 CAPITULO 3 ................................................................................................................................................................... 53 MINIMOS CUADRADOS RESTRINGIDOS .............................................................................................................. 53 3.1. MCO CON ERRORES NORMALES ................................................................................................................. 53 3.2. DISTRIBUCIONES DE PROBABILIDAD ....................................................................................................... 54 3.3. POTENCIA DE UN TEST Y SIGNIFICANCIA ................................................................................................ 55 3.3.1. APLICACIN: SELECCIN ENTRE TESTS ALTERNATIVOS ................................................................. 55 3.3.2. EL NIVEL DE SIGNIFICANCIA MARGINAL: CDF O P-VALUE.............................................................. 56 3.4. PRUEBAS SOBRE UN COEFICIENTE ............................................................................................................ 57 3.5. TRES TESTS EQUIVALENTES........................................................................................................................ 58 3.5.1. TEST DE RAZON DE VEROSIMILITUD (LR) ................................................................................................ 58 3.5.2. LR BAJO ESPECIFICACION LINEAL-LINEAL ............................................................................................. 59 3.5.3. TEST DE WALD ............................................................................................................................................... 60 3.5.4. WALD BAJO ESPECIFICACION LINEAL-LINEAL ....................................................................................... 61 3.5.5. TEST DEL MULTIPLICADOR DE LAGRANGE ............................................................................................. 62 3.5.6. EQUIVALENCIA BAJO ESPECIFICACION LINEAL-LINEAL.................................................................. 62 3.6. EJERCICIOS MATRICIALES DEL TEST DE WALD ..................................................................................... 62 3.6.1. USANDO LA PRUEBA t .............................................................................................................................. 63 3.6.2. USANDO LA PRUEBA F............................................................................................................................. 63 3.6.3. LA PRUEBA F PARA DOS O MS COMBINACIONES LINEALES DEL VECTOR BETA ....................... 64 3.7. PRUEBA DE SIGNIFICANCIA GLOBAL ........................................................................................................ 65 3.8. PRUEBA DE EXCLUSION DE VARIABLES .................................................................................................. 66 3.9. CAUSALIDAD (GRANGER, 1969) .................................................................................................................. 67 3.10. TEST DE ESTABILIDAD (CAMBIO ESTRUCTURAL) .............................................................................. 69 3.11. ESTIMANDO REGRESIONES RESTRINGIDAS ........................................................................................ 71 ANEXO AL CAPITULO 3 ............................................................................................................................................ 72 PARSIMONIA ............................................................................................................................................................ 72 RESTRICCIONES NO LINEALES SOBRE LOS COEFICIENTES ............................................................................ 72 NORMALIDAD: TEST DE BERA-JARQUE .............................................................................................................. 74 CAPITULO 4 ................................................................................................................................................................... 81 VIOLACION DE ALGUNOS DE LOS SUPUESTOS ................................................................................................. 81 4.1. MNIMOS CUADRADOS GENERALIZADOS ............................................................................................... 81 4.2. HETEROCEDASTICIDAD ............................................................................................................................... 82 4.2.1. CORRECCION CON MCG ( CONOCIDA) ............................................................................................. 84 4.2.2. DETECCION DE LA HETEROCEDASTICIDAD ....................................................................................... 85 4.2.3. CORRIGIENDO POR HETEROCEDASTICIDAD EN RATS ...................................................................... 87 4.3. CORRELACIN SERIAL.................................................................................................................................. 90 4.3.1. CORRECCION CON MCG ( CONOCIDA) ............................................................................................. 91 4.3.2. DETECCION DE AR(1): DURBIN-WATSON (1951) ................................................................................. 92 4.3.3. DETECCION EN MODELOS CON Y REZAGADA: Test h de Durbin ....................................................... 94 4.3.4. DETECCION DE LA AUTOCORRELACION DE ORDEN SUPERIOR ..................................................... 95 4.3.4. CORRIGIENDO LA AUTOCORRELACION EN RATS: PRIMERAS DIFERENCIAS ................................ 98 4.4. ESTIMACION ROBUSTA .............................................................................................................................. 101 4.4.1. CORRECCION DE WHITE (1980) ........................................................................................................... 102 4.4.2. CORRECCION DE NEWEY Y WEST (1987) ............................................................................................ 103 4.5. MULTICOLINEALIDAD ................................................................................................................................ 106 4.5.1. MULTICOLINEALIDAD PERFECTA ....................................................................................................... 106 4.5.2. MULTICOLINEALIDAD MUY ALTA........................................................................................................ 107

4.5.3.

SOLUCIONES A LA MULTICOLINEALIDAD ......................................................................................... 108

CAPITULO 5 ................................................................................................................................................................. 109 TOPICOS EN EL MODELO LINEAL GENERAL .................................................................................................. 109 5.1. INTRODUCCION A LA PREDICCION EN RATS ......................................................................................... 109 5.1.1. EL ERROR DE PREDICCION .................................................................................................................. 109 5.1.2. PREDICCION ESTATICA: INSTRUCCIN PRJ...................................................................................... 110 5.1.3. CASO PRACTICO ..................................................................................................................................... 113 5.2. VARIABLES DUMMY (BINARIAS).............................................................................................................. 120 5.2.1. DIFERENCIAS ENTRE INTERCEPTOS Y PENDIENTES ............................ Error! Bookmark not defined. 5.2.2. VARIABLES DUMMIES EN EL CALCULO DE MEDIAS ........................................................................ 126 5.3. ERROR EN LAS VARIABLES: INSTRUMENTOS ....................................................................................... 130 5.3.1. VARIABLES INSTRUMENTALES.................................................................................................................. 130 5.3.2. ESTIMACION CON INSTRUMENTOS EN RATS ..................................................................................... 131 5.3.3. EL ESTIMADOR DE VARIABLES INSTRUMENTALES........................................................................... 132 CAPITULO 6 ................................................................................................................................................................. 134 MODELOS NO LINEALES ........................................................................................................................................ 134 6.1. INTRODUCCION A LOS METODOS ITERATIVOS: LA INSTRUCCION FIND ....................................... 134 6.2. MINIMIZACION DE LA SUMA CUADRADOS DE ERRORES ................................................................... 137 6.3. MINIMOS CUADRADOS NO LINEALES ..................................................................................................... 138 6.3.1. LA ESTIMACION POR MINIMOS CUADRADOS NO LINEALES........................................................... 138 6.3.2. PROPIEDADES DE LOS ESTIMADORES DE MC NO LINEALES ......................................................... 140 6.3.3. MINIMOS CUADRADOS NO LINEALES EN RATS ................................................................................. 141 6.4. ESTIMACION POR MAXIMA VEROSIMILITUD ........................................................................................ 145 6.4.1. MAXIMA VEROSIMILITUD EN RATS ..................................................................................................... 145 6.4.2. APLICACION: MODELOS GARCH ......................................................................................................... 146 6.5. RESUMEN........................................................................................................................................................ 150 CAPITULO 7 ................................................................................................................................................................. 152 SISTEMAS DE ECUACIONES ................................................................................................................................... 152 7.0.1. ECUACIONES ESTRUCTURALES Y REDUCIDAS ...................................... Error! Bookmark not defined. 7.0.2. EL PROBLEMA DE LA IDENTIFICACION ............................................................................................. 153 7.1. ESTIMACION DE ECUACIONES SIMULTNEAS ..................................................................................... 154 7.4.1. MINIMOS CUADRADOS INDIRECTOS................................................................................................... 155 7.4.2. MNIMOS CUADRADOS EN 2 ETAPAS .................................................................................................. 155 7.4.3. MNIMOS CUADRADOS EN 3 ETAPAS .................................................................................................. 156 7.2. SISTEMAS: SIMULACION Y PREDICCION ................................................................................................ 158 7.1. SEEMINGLY UNRELATED REGRESSIONS, SUR ...................................................................................... 159 7.1.1. LA INSTRUCCION SUR ............................................................................................................................ 162 7.1.2. SUR CON RESTRICCIONES (Equate) ...................................................................................................... 162 7.1.3. SUR CON RESTRICIONES LINEALES GENERALES (Restrict) .............................................................. 164 5.4. DATOS DE PANEL.......................................................................................................................................... 166 5.4.1. INGRESO DE DATOS DE PANEL ............................................................................................................ 170 5.4.2. ESTIMACION DE EFECTOS FIJOS......................................................................................................... 172 5.4.3. ESTIMACION DE EFECTOS ALEATORIOS ............................................................................................ 174 5.4.4. CASO DE ESTUDIO: FUNCION TRANSLOGARITMICA ....................................................................... 176 7.7. SISTEMAS DE ECUACIONES NO-LINEALES ............................................................................................ 179 7.7.1. LA INSTRUCCIN NLSYSTEM ................................................................................................................ 179 CAPITULO 8 ................................................................................................................................................................. 181 ESTACIONARIEDAD Y COINTEGRACION .......................................................................................................... 181 8.1. INTRODUCCION ............................................................................................................................................ 181 8.2. ESTACIONARIEDAD ..................................................................................................................................... 181

8.2.1. DEFINICION ................................................................................................................................................. 181 8.2.2. PRUEBAS DE ESTACIONARIEDAD: CORRELOGRAMA ...................................................................... 183 8.2.3. PRUEBAS DE ESTACIONARIEDAD: RAICES UNITARIAS .................................................................... 185 8.2.4. DIFERENCIACION DE SERIES I(1) ........................................................................................................ 188 8.3. COINTEGRACION: PRUEBA DE ENGLE-GRANGER ................................................................................ 191 8.3.1. INTRODUCCION ...................................................................................................................................... 191 8.3.2. PRUEBA DE ENGLE-GRANGER (1987).................................................................................................. 191 CAPITULO 9 ................................................................................................................................................................. 193 MODELOS ARIMA Y VAR ........................................................................................................................................ 193 9.1. AUTOCORRELACIONES SIMPLES Y PARCIALES ................................................................................... 193 9.2. PROCESOS AUTORREGRESIVOS (AR)....................................................................................................... 195 9.2.1. SIMULACION DE PROCESOS AR(1) ...................................................................................................... 195 9.2.2. ESTIMACION DE UN PROCESO AUTOREGRESIVO ............................................................................ 198 9.3. PROCESOS DE MEDIAS MOVILES .............................................................................................................. 199 9.3.1. SIMULACION DE PROCESOS MA(1) ..................................................................................................... 199 9.3.2. ESTIMACION DE UN PROCESO DE MEDIAS MOVILES ...................................................................... 202 9.3. PROCESOS ARIMA ........................................................................................................................................ 202 9.4. EL ENFOQUE DE BOX Y JENKINS............................................................................................................... 204 9.4.1. PASO 1: IDENTIFICACIN ..................................................................................................................... 204 9.4.2. PASO 2: ESTIMACIN ............................................................................................................................. 205 9.4.3. PASO 3: VERIFICACIN / DIAGNSTICO ............................................................................................ 208 9.4.4. PASO 4: PREDICCIN ............................................................................................................................. 209 9.5. MODELOS VAR .............................................................................................................................................. 211 9.5.1. ESTIMACION DE UN MODELO VAR...................................................................................................... 212 9.5.2. PRUEBAS PARA LA LONGITUD DE LOS REZAGOS ............................................................................. 214 9.5.3 PREDICCION ............................................................................................................................................ 217 9.5.4. CAUSALIDAD A LO GRANGER ............................................................................................................... 219 9.5.5. ANALISIS DE IMPULSO RESPUESTA..................................................................................................... 219 REFERENCIAS ............................................................................................................................................................ 223 ANEXO: DATOS UTILIZADOS EN EL LIBRO ....................................................................................................... 225

CAPITULO 1 EL PROGRAMA RATS

1.1. INTRODUCCIN
RATS (Regresion Analysis of Time Series) es un software economtrico y un lenguaje de programacin especialmente diseado para trabajar con series de tiempo (tambin permite el anlisis de cross-section y panel data) por lo que es muy apropiado para el estudio de series financieras y prediccin1. En adicin, posee una sintaxis de programacin de mucha claridad. Algunas de las cosas que se pueden hacer con RATS son: Estimar varios tipos de modelos de regresin: simple, mltiple, mnimos cuadrados generalizados, regresiones aparentemente no relacionadas (SUR), mnimos cuadrados no lineales, sistemas no lineales, mtodos generalizados de momentos, y mxima verosimilitud (incluyendo ARCH, GARCH Y modelos relacionados). Ejecutar prcticamente cualquier tcnica de series de tiempo, incluyendo modelos ARIMA, funciones de transferencia y modelos de intervencin, vector autorregresivo (VAR), y anlisis espectral. Hacer predicciones y ejecutar simulaciones.

En RATS existen una serie de subprogramas (procedures) especializados que vienen en los archivos del programa, otros estn disponibles para ser bajados libremente desde el sitio Web de Estima, donde muchos economistas comparten los procedures que han desarrollado. Existe una lista de discusin bastante activa en Internet (RATS-L) en que participan usuarios y gurus de Estima respondiendo rpidamente las dudas. Para utilizar RATS debe ubicar el archivo ejecutable de acuerdo a la versin que usted utilice, sin confundirlo con otros archivos ejecutables que pueden estar incluidos en su versin, como por ejemplo archivos de datos comprimidos, algn programa editor de grficos, una versin anterior en DOS o algn administrador de datos como el programa Rats Data.

1.1.1 CORRIENDO EL PROGRAMA: EL EDITOR DE RATS


RATS puede operar en modo Batch o en modo Interactivo. En modo Batch, RATS ejecuta las instrucciones y guarda los resultados en otro archivo. En cambio en modo Interactivo, es posible ejecutar directamente porciones o el total del programa y entregar los resultados en el mismo archivo, lo que facilita la revisin rpida de stos. Debido a esta gran ventaja aqu estamos interesados slo en el modo Interactivo, el cul se encuentra generalmente ya seleccionado al ingresar a RATS.

Para mayor informacin de versiones y caractersticas, la direccin del sitio Web de los proveedores (ESTIMA) es: www.estima.com.

Al ingresar a RATS aparecer el editor de texto que permite escribir y ejecutar las instrucciones, ver las salidas, grabar archivos, imprimir resultados y grficos, etctera, tal como se muestra en la Ilustracin. Generalmente la primera ventana o archivo que RATS crea es NONAME00.PRG{io} o con extensin TXT, dependiendo de la versin que se utilice. En la Ilustracin lo mostramos dentro de valo rojo.

a) Archivos {io} RATS identifica las ventanas / archivos de entrada (instrucciones) y salida (resultados) con la siguiente notacin: {i} identifica una ventana para entrada en modo batch, {o} identifica una ventana para salida en modo batch, {io} indica que es una ventana de entrada y salida para modo interactivo, y que las salidas sern enviadas a la misma ventana de entrada. En modo Interactivo, tal como trabajaremos en este libro, se utiliza una sola ventana con la notacin {io}, por lo que debe verificarse que sta aparezca. Si esto no ocurriera automticamente al abrir un archivo, entonces se lograr haciendo click en el men Window Use for input, y nuevamente en Window Use for output. b) Modos Run/Local Otra caracterstica importante son los modos Run y Local haciendo click en el icono o presionando <Ctrl>+L. Dentro del men, el icono nos permite cambiar entre ambos modos.

(el icono con el Para ejecutar las instrucciones se debe estar en modo Run hombrecito caminando se ve claramente). El modo Run permite, dentro de una ventana {io}, ejecutar las instrucciones a travs de cualquiera de las siguientes formas:

1. Terminada de escribir una lnea, presionar <Enter>. 2. Si la lnea ya se encuentra escrita previamente, ubicar el cursor en cualquier lugar sobre la lnea, y entonces <Enter>. 3. Si se quiere ejecutar un grupo de lneas, stas deben ser seleccionadas (ya sea con el Mouse o con <Shift>+<flecha abajo>), y entonces <Enter>. As, si bien la tecla <Enter> es la ms usada para ejecutar instrucciones, alternativamente es posible hacerlo presionando .

Si uno desea ingresar texto sin ejecutar inmediatamente las lneas, entonces se debe cambiar del (el icono con el hombrecito caminando no se ve o se ve borroso), modo "Run" al modo "Local" y aqu el editor de RATS se convierte en un editor de textos comn con formato plano (ascii). Este modo es til para escribir varias lneas de instrucciones, y ejecutarlas posteriormente cambiando al modo Run.

1.1.2. LNEAS Y BLOQUES DE COMENTARIOS


Aquellas lneas en que aparezca un asterisco '*' como primer carcter en la lnea son interpretadas como comentarios y son ignoradas por el programa. En la Ilustracin 1.2 mostramos un ejemplo. Cuando las lneas de instruccin son demasiado largas, el smbolo '$' indica que la instruccin contina en la siguiente lnea. En la Ilustracin 1.2 ingresamos un vector de labels llamado PAISES que contiene los nombres de varios pases. Puesto que la lista de pases puede ser muy larga, puede ser dividida en dos o ms lneas con el smbolo $. Tambin puede usarse una misma lnea para establecer varias instrucciones usando un punto y coma ';'. A menudo se usa para agregar comentarios a una fila que ya contiene una instruccin. En la siguiente Ilustracin mostramos lo almacenado anteriormente en el vector PAISES, y agregamos un comentario en la misma lnea.

1.1.3. SINTAXIS DE LAS INSTRUCCIONES DE RATS


El lenguaje de RATS no es sensitivo a las maysculas. Adems todas las instrucciones pueden ser reconocidas solo por las tres primeras letras. Ejemplo: La instruccin GRAPH, para hacer grficos, puede escribirse GRAPH, Graph, graph, GRA o Gra.

La forma general de todas las instrucciones en Rats es la siguiente: Nombre_de_la_instruccin(opcin1, opcin2,...) parmetros # cartas suplementarias Las opciones de cada instruccin van entre parntesis (no hay que dejar un espacio entre el nombre de la instruccin y el primer parntesis) y separadas por comas. Es posible que algunas instrucciones no tengan opciones, o que no necesitemos cambiar los valores predispuestos de sta2. Los parmetros normalmente identifican el nombre de las series y los rangos muestrales a las cuales debe aplicarse la instruccin, o el nmero de series con las que la instruccin operar. Cartas suplementarias (supplementary cards): Algunas instrucciones requieren debajo de stas una cantidad de cartas suplementarias. Estas comienzan con un signo # y despus de un espacio, la informacin requerida, que puede ser de muy diverso tipo segn sea la instruccin. La instruccin para correr una regresin lineal de la serie Y, sobre las series X1, X2, ms un trmino constante es LINREG(ROBUST,LAGS=1) SerieY # CONSTANT SerieX1 SerieX2 ;* donde LINREG es la instruccin, ROBUST es la opcin 1, LAGS es la opcin 2, SerieY es un parmetro, CONSTANT, SerieX1, SerieX2, son las cartas adicionales. Ejemplo: La instruccin para calcular la matriz de correlacin de las series Y, X1, X2 y X3 es CMOM(CORR, PRINT) # Y X1 X2 X3 ;* donde CMOM es la instruccin, CORR es la opcin 1, PRINT es la opcin 2, no hay parmetros, e Y, X1, X2, X3 son las cartas adicionales.

Ejemplo:

Todas las opciones vienen con opciones predefinidas, por lo tanto si a la opcin no se le especifica se asume que se aceptan esos valores. Por ejemplo, en el men de ayuda (Help) cuando aparece la opcin Unit=[data]/input, lo predispuesto es data, porque se encuentra entre parntesis, es decir, seleccionado. Para ver las opciones que tiene cada instruccin ver ayuda de RATS.

1.2. TIPOS DE DATOS


RATS trabaja con varios tipos de datos los que son almacenados en la memoria del programa para su uso posterior en variables. La primera clasificacin corresponde a aquellos datos Simples y a los datos Compuestos.

1.2.1. TIPO SIMPLE (BSICOS)


Estos datos son los que almacenan en una sola variable, tales como nmeros enteros, reales, complejos, labels y strings de hasta 255 caracteres. Veamos ejemplos de cada caso: a) Enteros (INTEGER), Reales (REAL) y Complejos (COMPLEX) Una variable de enteros es aquella que se definir para todas las operaciones como nmero entero, mientras que una variable de reales es aquella que se definir para todas las operaciones como nmero real. Lo mismo es para el caso de los nmeros complejos, sin embargo este tipo de dato slo es de inters al trabajar con series complejas, por lo que no lo analizaremos aqu. Ejemplo: A1=5; A3=3.5; A2= -320 A4=1/2 ;* corresponden a variables enteras ;* corresponden a variables reales

b) Labels y Strings La variable de Label es un texto de hasta 16 caracteres (contando los espacios) y que puede contener nmeros y letras, la que generalmente se utiliza para nombres de series. Los strings son segmentos de textos sin uso especfico como el caso de los labels, pero que pueden contener hasta 255 caracteres. Ejemplo: A5 = Santiago, A6= La Serena, A7= Temuco ;* A5, A6 y A7 son labels A8 = esto es un string ;* A8 es un string A9 = el nmero 1 es el 3ro de la serie x ;* A9 es un string

c) Ecuaciones (EQUATION) y Modelos (MODEL) Las ecuaciones son descripciones de una relacin lineal en una regresin, que pueden incluir especificaciones del tipo autorregresivo. Por otra parte, los modelos son grupos de frmulas (relaciones no lineales), pero que al ser agrupadas en un modelo, son tratadas como un dato del tipo simple. Los modelos son utilizados para simulacin y prediccin en sistemas de ecuaciones simultneas, las cuales se vern ms adelante. Ejemplo:

Yt = 0 + 1Yt 1 + 2 X t + t

;* es una ecuacin, donde Yt y Xt representan

series de datos, los coeficientes, y t el error.

1.2.2. TIPO COMPUESTO (AGREGADOS)


Estos tipos de datos estn compuestos por varios datos del tipo simple. Los datos agregados en Rats son los arreglos, series y frmulas. Un dato agregado no puede tener elementos reales y enteros al mismo tiempo.

a) Frmulas (FRML) Son similares a las ecuaciones, pero describen una relacin posiblemente no-lineal en los parmetros. Son usadas para mnimos cuadrados no lineales y simulaciones de modelos generales. Ejemplo:

Yt = 0 + 1Yt 1 + 22 X t + et

;*es una frmula en Rats. Representa un

relacin no lineal puesto que el coeficiente de X est al cuadrado.

b) Arreglos Como arreglos se identifican los vectores (arreglos de una sola dimensin) y las matrices (arreglos de 2 o ms dimensiones). Las Matrices pueden ser Rectangulares (RECTANGULAR) que son el tipo general de cualquier dimensin, y las Simtricas3 (SYMMETRIC).

Ejemplo:

V1=

1 2 , 3

V2=(a, b, c)

;* V1 y V2 son Vectores

Ejemplo:

M1=

1 0 0 4 ,

M2=

2 3 4 3 1 5 4 5 3

;* M1 y M2 son Arreglos simtricos.

Ejemplo:

M3=

4 8 2 6 8 10 ,

M4=

2 1 8 4 3 6

;* M3 y M4 son Arreglos Rectangulares

c) Series Son probablemente la forma ms importante de datos en Rats, y contienen la informacin experimental recopilada por el investigacin para su estudio. Son esencialmente arreglos de elementos de una dimensin, como los vectores, pero tienen una estructura mucho ms compleja, puesto que, por ejemplo, pueden tener elementos definidos y no definidos. Por ejemplo, en una serie Consumo Nacional Anual es posible que no dispongamos del dato de un ao en particular, pero an as podemos construir la serie. Las series de datos pueden ser de 3 tipos: corte transversal (cross section), series de tiempo (time series) y del tipo panel o combinadas (panel data). tiempo. Las series de Corte transversal son observaciones de determinadas variables en un momento del

Ejemplo:

Las series Capital y Reservas (en millones de pesos) de los bancos nacionales, en enero de 1990, constituyen una serie de corte transversal.

Una matriz A (n*n) es simtrica si AT = A. Es decir, debe tener el mismo nmero de filas y de columnas, y los nmeros de arriba de la diagonal sern los mismos que los de abajo de la diagonal.

Banco 1 2 3 4 5 6 7

Capital y Reservas 3.661 5.590 3.047 9.296 6.604 6.908 8.122

Las series de tiempo estn constituidas por observaciones de un nmero de variables a travs del tiempo (diarias, mensuales, anuales, etc.). Ejemplo: La serie Producto Interno Bruto anual de Chile en $ reales de 1986 entre 1972 y 1976 es una serie de tiempo. AO 1972 1973 1974 1975 1976 PIB ($ reales 1986) 2.659.800 2.544.814 1.864.085 2.341.477 2.329.343

tiempo.

Los datos de panel estn constituidos por combinaciones de datos de corte transversal y series de

Ejemplo:

La siguiente tabla muestra 3 series de colocaciones de 3 bancos entre enero y julio de 1990, por lo que se trata de un panel de datos. Fecha 90.01 90.02 90.03 90.04 90.05 90.06 90.07 Colocaciones Colocaciones Colocaciones Banco 1 Banco 2 Banco 3 5132 2525 507 4704 3223 518 4941 2200 517 4806 3012 527 4943 2553 535 4566 3101 541 4167 3176 550

1.3. LA INSTRUCCIN COMPUTE


La instruccin COMPUTE es una de las ms importantes y poderosas en Rats, pues permite evaluar expresiones y almacenar el resultado trabajando con escalares, arreglos (matrices) y elementos de una serie. La estructura de la instruccin es la siguiente: COMPUTE variable, arreglo, elemento de un arreglo o elemento de una serie = expresin

Opcionalmente uno puede indicar el tipo de variable / dato entre [ ] antes del nombre de la variable, arreglo o elemento. Nota 1: Los operadores estndar en Rats son +, -, *, / y ** para la exponenciacin. Nota 2: Cuando se ha asignado a una variable un tipo de dato, no es posible cambiar esta definicin a menos que a se borren los datos de la memoria. Para esto puede usarse en el men FileClear Program, como se muestra en la siguiente ilustracin:

Esta operacin borrar tambin los datos de las series que se hubieren ingresado previamente, lo que implicar que deba ejecutarse nuevamente tales instrucciones. En cambio, tiene la ventaja que no se borra ningn texto de la pantalla, adems no se cierra ninguna de las ventanas ni archivos que se encuentren abiertos.

1.3.1. COMPUTE PARA EL CASO DE ENTEROS Y REALES


Veamos esto a travs de los siguientes ejemplo: Ejemplo: ;* RATS determinar que START es una variable en que se almacenarn solamente nmeros enteros. COM [INTEGER] H=2 ;* indicando entre parntesis cuadrado antes de la variable se precisa que la variable H ser utilizada solamente para nmeros enteros. COM VAR2=15. ;* escribiendo el nmero con decimales o slo el punto decimal se indica que la variable VAR2 almacenar solamente nmeros reales. COMPUTE [REAL] VAR1=20 ;* indicando entre parntesis cuadrado antes de la variable se precisa que VAR1 solamente servir para almacenar nmeros reales. COMPUTE START=5

Ntese que una variable X definida de un modo, no podr definirse nuevamente de un modo diferente. Ejemplo: COM N = 10 ;* define la variable N como entero. Supongamos que deseamos ahora que N sea multiplicada por un real y el resultado almacenado en la misma variable N, como sigue: ;* Rats entregar el siguiente mensaje:

COM N = N*1.2

## SX22. Expected Type INTEGER, Got REAL Instead

>>>>COM N = N*1.2

;<<<<

;* Rats no acepta esta orden debido a que el resultado de la multiplicacin es un real, y N se defini previamente como entero.

Ntese tambin que al realizar una operacin matemtica y almacenar el resultado de una variable o arreglo nuevo, no definido previamente, RATS determinar automticamente el tipo de variable correspondiente de acuerdo al resultado, es decir, si el resultado es un nmero real, la variable se definir como real. Ejemplo: El resultado de una multiplicacin entre una variable definida como real y otra como entero, quedar determinado como real. COM X = 20.0 COM Y = 3 COM Z = X * Y DIS Z ;* Para visualizar el resultado usamos la instruccin DISPLAY (veremos ms adelante) 60.00000 ;* apreciamos que se trata de un nmero real, es decir admite decimales.

1.3.2. COMPUTE PARA LABELS Y STRINGS


La instruccin Compute permite definir labels y strings tal como mostramos en los siguientes ejemplos: Ejemplo: COM [VECTOR[LABEL]] PAIS= ||USA, CANADA, JAPAN, MEXICO|| ;* aqu se define un vector de cuatro labels llamado PAIS, el que contiene los nombres de 4 pases. DIS PAIS(3) ;* para visualizar el label nmero 3 del vector PAIS usamos la instruccin DISPLAY, y el resultado ser JAPAN

Ejemplo:

COM resultado = El resultado de los clculos es:... ;* la variable RESULTADO contiene un string. Al igual que en el caso de Labels, para ver el contenido de este string usamos el comando DISPLAY.

1.3.3. COMPUTE PARA ARREGLOS


Con Compute tambin es posible ingresar arreglos, aunque tal como veremos ms adelante, pueden existir formas ms rpidas cuando se trata de matrices y vectores de grandes dimensiones. Para escribir una matriz usando COMPUTE se debe encerrar los elementos del arreglo en pares de barras verticales ( || ), y separe cada elemento con una coma, y separa las filas con una sola barra ( | ). A continuacin mostramos algunos ejemplos del uso de Compute para el caso de arreglos: Ejemplo: ;* se define un vector V1 de nmeros enteros y de 1 fila por 3 columnas. COM [VECTOR[REAL]] V = ||1.0, 0.0|| ;* permite definir un vector V de nmeros reales. COM [SYMM] ABCD=||1.,2.|2.,1.|| ;* se define una matriz ABCD simtrica de nmeros reales. COM V1=||2,3,7||

COM AA = ||1.0 , 2.0| 3.0,5.0|| ;* se define una matriz AA cuadrada, de nmeros reales. WRITE AA ;* La instruccin WRITE permite ver el contenido de la matriz AA Ntese que con COMPUTE no es necesario definir previamente el tamao de los arreglos. Tambin, que COMPUTE no permite crear series, frmulas, ecuaciones o modelos, pues existen instrucciones especializadas para cada caso. Sin embargo COMPUTE permite trabajar con elementos especficos de una serie, tratados como escalar. La instruccin especializada para trabajar con series completas (o segmentos de series) es SET, la que veremos ms adelante.

1.3.4. COMPUTE PARA SERIES


Ejemplo: COM SERIE1(56) = -99.0 ;* para modificar la observacin 56 de la SERIE1, la que tomar el valor -99.0 10.00 ;* para modificar el dato con fecha enero de 1990 de la SERIE 2, el que tomar el valor de 10.00

COM SERIE2(1990:01) =

10

1.4. INGRESO Y VISUALIZACIN DE DATOS SIMPLES Y ARREGLOS


1.4.1. INGRESO DE DATOS: INSTRUCCIONES READ E INPUT
Existen bsicamente 3 instrucciones para el ingreso de datos en Rats (INPUT, READ y DATA) ya sea desde pantalla o desde un archivo de datos, segn la opcin UNIT que se utilice. En el caso de leer matrices, requiere que estas sean previamente dimensionadas con DECLARE. INPUT se usa para leer arreglos, escalares o strings solo desde pantalla, y al no tener opciones, es til para un ingreso rpido de datos. READ se usa para leer arreglos4, escalares o strings, desde pantalla o desde un archivo, con varias opciones de formato. READ slo puede leer desde archivo datos sin formato o en formato libre, las versiones vigentes no permiten leer datos en formato xls. DATA se usa solamente para leer series de datos, y requiere generalmente ser usada con otras instrucciones (ALLOCATE y CALENDAR), por lo que ser visto ms adelante (permite leer en formato xls). Las instrucciones READ y DATA tienen la opcin UNIT para la entrada de datos:
Instruccin READ Significado de la opcin (UNIT=INPUT) : Indica que los datos se leern desde pantalla (UNIT=DATA) : Indica que los datos se leern desde un archivo Instruccin Previa

READ

Previo a la instruccin READ se debe indicar donde se encuentra el archivo con OPEN DATA C:\xxx.xx

Recuerde que las matrices tambin pueden ser ledas por pantalla y asignadas a variables con el comando COMPUTE.

11

a) Lectura de datos por pantalla (INPUT y READ) Debe digitarse los elementos de esta matriz por pantalla, sin embargo cuando la dimensin de la matriz en alta, es decir son muchos los elementos de sta, resulta ms conveniente digitar los datos en una planilla de clculo como Excel, y luego copiar stos desde Excel, y luego pegarlos al editor de RATS.

Ejemplo:

Si los datos son ingresados a Excel como sigue:

la forma de ingresarlos a RATS por pantalla usando las instrucciones INPUT y READ es como sigue:

DECLARE RECT MAT3(3,2) INPUT MAT3 1.5 3.2 2.3 5.6 6.5 7.4 WRI MAT3 1.5000 2.3000 6.5000

;* Se declara la matriz MAT3. La instruccin DECLARE se explica ms adelante ;* Usando INPUT, es decir ingreando por pantalla

;* para ver el contenido de MAT3 3.2000 5.6000 7.4000

Ejemplo:

DECLARE RECT M4(3,2) READ(UNIT=INPUT) M4 1.5 3.2 2.3 5.6 6.5 7.4 WRI M4 1.5000 2.3000 6.5000

;* usando READ, por pantalla, es equivalente a INPUT

;* para ver el contenido 3.2000 5.6000 7.4000

12

b) Lectura de datos desde Archivos tipo .txt o .prn (READ) Ejemplo: Para leer una matriz desde un archivo llamado file1.txt, el que ha sido creado, por ejemplo, con el block de notas o con cualquier editor sin formato (de texto plano).

DEC RECT DATAVEC(2,3) OPEN DATA C:\file1.txt READ(UNIT=DATA) DATAVEC wri datavec 1.0000 4.6000

;* el archivo de origen es identificado ;* los datos son leidos y almacenados en DATAVEC

;* para verificar el contenido de DATAVEC 2.0000 5.9000 3.5000 6.2000

Anteriormente sealamos que la instruccin DATA se usa solamente para leer series de datos y requiere generalmente ser usada con otras instrucciones (ALLOCATE y CALENDAR), por lo que ser vista ms adelante.

13

1.4.2. VISUALIZACIN DE DATOS: INSTRUCCIN WRITE Y DISPLAY


Para la visualizacin de datos del tipo arreglos, escalares o strings existen tres instrucciones: DISPLAY, WRITE y COPY. DISPLAY es usado para visualizar resultados de clculos siempre y cuando estos sean expresiones escalares, esto es, nmeros y mensajes de texto de una lnea (strings). Pueden mostrarse en pantalla o guardarse en un archivo. WRITE es usado para matrices en general, y pueden mostrarse en pantalla o guardarse en un archivo. COPY es usado para series de datos, ya sea en pantalla o para guardar en archivos. PRINT es usado para series de datos, con la restriccin de visualizacin solamente por pantalla. Puesto que COPY y PRINT se refieren a series, sern vistas ms adelante. El siguiente es el esquema de funcionamiento de la opcin UNIT en estas instrucciones:
Significado de la opcin UNIT=COPY : Indica que los datos de guardaran en un archivo UNIT= OUTPUT: Indica que los datos Hacia pantalla Instruccin Previa Para grabar datos a un archivo, previamente debe indicarse donde se encontrar el archivo: OPEN COPY C:\yyy.yy

Anteriormente, en el ingreso de datos, hemos mostrado la forma en que operan las instrucciones WRITE y DISPLAY para mostrar datos en pantalla. Veamos ahora como operan al guardar datos en archivos: Ejemplo: OPEN COPY c:\salida01.txt DISPLAY(UNIT=COPY) 'Este texto aparecer en el archivo salida02.txt END ;* con END se escriben los resultados al archivo al salir de RATS.

La salida es mostrada en el archivo.

sigue:

Recuerde que no es posible escribir matrices con DISPLAY. Para esto puede usarse WRITE como

Ejemplo:

DECLARE RECT M4(3,2) READ(UNIT=INPUT) M4 1.5 3.2 2.3 5.6 6.5 7.4 OPEN COPY c:\salida02.txt WRITE(UNIT=COPY) M4 END

14

;* el archivo de salida es entonces:

Ntese que pueden agregarse datos al mismo archivo de salida cada vez que se ejecuta la instruccin WRITE(UNIT=COPY) en RATS. Tambin, que simultneamente pueden guardarse datos a diferentes archivos.

15

1.4.3 DECLARE Y DIMENSION


La instruccin DECLARE permite crear y definir cualquier tipo de variable (no solamente arreglos), reservando espacio para ella. Siempre debe usarse DIMENSION en el caso de los arreglos (ya sean VECTORS, RECTANGULAR o SYMMETRIC) y en los datos ledos con INPUT y READ. La excepcin es que cuando se ingresan arreglos con COMPUTE no es necesario usar DIMENSION. La definicin puede hacerse simultneamente con la lectura o previamente usando DECLARE. Ejemplo: DECLARE RECT B DECLARE VECTOR A DIM A(5) B(10,10) ;* puede usarse la instruccin DIMENSION (poco usada) INPUT Q 1.0000 0.9654 0.0184 0.9654 1.0000 -0.0418 0.0184 -0.0418 1.0000 DECLARE RECTANG Q(3,3) INPUT Q 1.0000 0.9654 0.0184 0.9654 1.0000 -0.0418 0.0184 -0.0418 1.0000 ;* Los arreglos pueden dimensionarse en la misma instruccin DECLARE.

Ejemplo:

Ejemplo:

COM A1 = ||100|106|107|| COM[VECTOR[INTEGER]] V2 = ||1,2,3,4||

;* la forma ms directa es en una misma instruccin declarar, dimensionar e ingresar los datos. COMPUTE [RECT[REAL]] V3 = || 1.0, 0.0 | 0.0, 1.0 ||

Note tambin que si no se declara una matriz (con DECLARE), entonces al asignarle valores enteros (sin decimales) no los reconoce como nmeros y en consecuencia no se pueden efectuar operaciones aritmticas sobre estas. Ejemplo: DEC RECT A1 ;* declaramos solamente A1 COM A1 = ||100|106|107|| COM A2 = ||100|106|107|| WRI A1 100.0000 106.0000 107.0000 WRI A2 100 106 107 COM A3 = a2+A1 ## SX27. Illegal Combination of Data Types for Operation >>>>COM A3 = a2+A1<<<<

16

;* A2 es reconocido como un vector de labels, y no pueden hacerse operaciones matemticas con l

Por este problema se recomienda siempre declarar los arreglos a usar. Este problema no existe cuando se trata de crear nuevas matrices como resultados de clculos matriciales (no es necesario usar DECLARE), puesto que RATS ya sabe las caractersticas del resultado de la operacin al momento de crear la matriz xx. Ejemplo: COM XX = A1+A1 WRI XX 200.0000 212.0000 214.0000 ;* siguiendo con el ejemplo anterior creamos XX como resultado aritmtico de dos matrices previamente declaradas. ;* el resultado son nmeros reales, es decir lo que se deseaba.

1.4.4 OPERACIONES ARITMETICAS: EJEMPLOS


Ejemplo: COM A=1, B=2.1 DIS A+B 3.10000 ;* Con la instruccin compute definimos A y B ;* Display muestra automticamente el resultado a pantalla

Ejemplo:

COM C=A+2*B DIS 'EL RESULTADO ES: ' C EL RESULTADO ES: 5.20000

Ntese que RATS respeta la precedencia de las operaciones aritmticas, es decir primero multiplicar 2*2.1, y luego ese resultado ser sumado a 1.0, es decir un resultado de 5.2 Ejemplo: Definimos dos matrices A y B COM [RECT[REAL]] A = ||-3,1|2,5|4,2|| COM [RECT[REAL]] B = ||2|4|| WRI A -3.0000 2.0000 4.0000 WRI B 2.0000 4.0000 COM C=A*B WRI C -2.0000 24.0000 16.0000 ;* multiplicamos A por B ;* visualizamos el resultado ;* para visualizar los datos 1.0000 5.0000 2.0000

Ejemplo:

Leer dos matrices X e Y por pantalla

17

DEC RECT X(9,3) Y(9,1) INPUT X 1 100 100 1 104 99 1 106 110 1 111 126 1 111 113 1 115 103 1 $ 120 102 1 124 103 1 126 98 INPUT Y 100 106 107 120 110 116 123 133 137 ;* calculamos ahora (XX)-1 XY, paso por paso, donde ( ) indica transpuesta, y ( )1 significa inversa. COM BETA = INV(TR(X)*X)*(TR(X)*Y) WRI BETA -49.3413 1.3642 0.1139 El lector notar que hemos hecho uso de las funciones INV() para calcular la inversa, y de TR() para calcular las traspuestas. Vase el Anexo para un listado de algunas de las principales funciones disponibles en RATS. ;* guardamos en la matriz BETA el resultado ;* visualizamos el resultado

18

1.5. SERIES DE DATOS: INSTRUCCIONES BSICAS


Anteriormente hemos sealado que las Series son los datos ms importantes en RATS, as como en cualquier investigacin, de modo que hemos diferido la discusin de stas, incluyendo las instrucciones de ingreso y salida de series para este captulo. Comenzaremos justamente por especificar la forma en que las series deben ingresarse a RATS como paso previo a su utilizacin.

1.5.1. ANTES DE INGRESAR DATOS: ALLOCATE Y CALENDAR


El nmero mximo de observaciones (un nmero entero) a usar en el estudio est definido por la instruccin ALLOCATE, sin considerar los ttulos o nombres de las series que pudieran venir en un mismo archivo. Ejemplo: ALLOCATE 150000

Por tratarse de un programa profesional, el nmero de observaciones que RATS permite trabajar es extremadamente alto. Si consideramos que una planilla Excel puede contener a lo ms 65.000 filas u observaciones, RATS puede trabajar con archivos mucho ms extensos, lo que ocurre por ejemplo en las series de rendimientos de instrumentos de renta fija que se transan diariamente en la diferentes Bolsas de Valores, en que cada transaccin sera una fila. Tambin hemos sealado que los datos economtricos pueden ser de 3 tipos: corte transversal, series de tiempo y datos de panel. Estos ltimos sern tratados en un captulo ms adelante, por lo que nos referiremos aqu solamente a los dos primeros. El ingreso de series de datos de corte transversal a RATS es muy sencillo, pues basta la instruccin ALLOCATE. Sin embargo para series de tiempo debe especificarse la frecuencia de las observaciones, fecha de inicio, fecha de trmino con la instruccin CALENDAR, esto, pues las series de tiempo contienen una frecuencia calendaria anual, trimestral, mensual, semanal o diaria (por ejemplo) CALENDAR permite definir la periodicidad de las observaciones, de modo que cada observacin ser identificada por un periodo calendario. Esto tiene por ventaja que todas las instrucciones posteriores se podrn referir a fechas calendario en cuanto a los rangos que se desee trabajar, incluyendo regresiones, predicciones, grficos, etctera. En series de tiempo cada observacin o rango de observaciones de una serie es especificada por fechas calendario (ejemplo 1990:06 1995:12), mientras que para series de corte transversal se usar el nmero de cada observacin (ejemplo 5 20, que indica desde la observacin nmero de 5 hasta la nmero 20, inclusive). La instruccin CALENDAR es bastante flexible5 y su estructura es como sigue: CALENDAR n1 n2 n3 donde el primer ao es n1, el primer periodo en ese ao es n2, y el nmero de periodos / ao es n3 CALENDAR n1 n2 n3 n4 donde n1 es el primer ao, n2 es el primer mes, n3 es el primer da y n4 es el periodo. n4=1 para 7 das por semana, n4=7 para datos semanales, n4=14 para datos quincenales. Ejemplo: CALENDAR 1985 2 4 ;* indica que la primera fila de datos corresponde al segundo trimestre de 1985. ALLOCATE 1443 calendar 1995 6 1 7 ;* establece que existe un mximo de 1443 observaciones semanales y que la primera de ellas ocurre el 1/junio/1995.

Ejemplo:

La instruccin calendar tiene opciones ms especficas que se pueden revisar en la ayuda de RATS.

19

1.6.2. INGRESO Y VISUALIZACION DE SERIES: DATA Y COPY


Hemos sealado anteriormente que la instruccin DATA es la apropiada para leer series de datos, ya sea desde un archivo o desde pantalla, y que la instruccin COPY es la que escribe series de datos, generalmente a un archivo, ya que para examinar series en pantalla sin formato es ms conveniente usar PRINT. Estas instrucciones son usadas exclusivamente con series, y tienen la siguiente estructura respectivamente: DATA(opciones) comienzo trmino serie1 serie2 ...

COPY(opciones) comienzo trmino serie1 serie2 ... < text cards > lneas que sern reproducidas como comentarios (slo con la opcin HEADER)

Para leer series desde pantalla, la opcin a usar con DATA es Unit=input, acompaada con la opcin ORG=obs, la que permite leer las observaciones de datos por columnas, como es tradicional. La lectura por pantalla es recomendada cuando el nmero de series y de observaciones es muy pequeo. Respecto a los parmetros de DATA, debe indicarse el comienzo y el fin de los datos a ser ledos, de modo que no es necesario leer todas las observaciones de cada serie. A pesar de esto, lo ms simple es leerlas por completo, desde la primera a la ltima. En este caso puede usarse el smbolo / para indicar esto. Los parmetros que siguen en la instruccin DATA son las series a ser ledas. Cuando se leen por pantalla debe indicarse aqu los nombres que se les asignar a cada serie. Ejemplo: ALL 4 ;* se indica que se leern 4 observaciones de cada serie. DATA(UNIT=INPUT,ORG=OBS) / y x2 x3 ;* se indica que se leern por pantalla todas las observaciones y que el nombre de cada una es Y, X2 y X3 respectivamente. Puesto que no aparece la instruccin CALENDAR se entiende que se trata de series de corte transversal. 100 10 100 106 14 99 107 16 110 120 11 126 Print ;* para ver las series por pantalla 100.00000000000 99.00000000000 110.00000000000 126.00000000000

ENTRY Y X2 X3 1 100.00000000000 10.000000000000 2 106.00000000000 14.000000000000 3 107.00000000000 16.000000000000 4 120.00000000000 11.000000000000

En el caso que las series estn contenidas en archivos de datos, analizaremos dos casos: que el archivo sea del tipo plano (txt) o del tipo Excel. En cualquier caso ntese que requerimos previamente la instruccin OPEN DATA. Ejemplo: Supongamos un archivo de datos plano conteniendo la informacin de 3 series como sigue:

20

all 4 Open data c:\series01.txt DATA(UNIT=data,ORG=OBS) / yy xx2 xx3 Print ENTRY 1 2 3 4

;* note que la opcin es unit=data

;* para ver las series por pantalla YY 100.00000000000 106.00000000000 107.00000000000 120.00000000000 XX2 XX3 10.000000000000 100.00000000000 14.000000000000 99.00000000000 16.000000000000 110.00000000000 11.000000000000 126.00000000000

Veamos ahora el caso en que los datos vienen en una planilla Excel. Debe tenerse presente que esta planilla deber estar guardada como hoja de clculo de Excel, y no como libro de Excel. Ejemplo: Si el archivo de las series es el siguiente:

all 4 Open data c:\hoja1.xls

;* el archivo contiene el nombre de cada serie en la primera fila. Adems el archivo est guardado como hoja de clculo (y no como libro de hojas mltiples). DATA(UNIT=data,ORG=OBS,format=xls) / ;* note que no indicamos el nombre de las series. Al visualizar las series con PRINT se apreciar que el nombre aparece asignado.

Antes de seguir considere las siguientes notas: Nota 1: RATS reconoce puntos decimales y no comas, por lo que puede ser necesario modificar la configuracin de los nmeros en el Panel de Control (si est usando Windows), y all Configuracin

21

Regional. Para que estos cambios tengan efecto deben hacerse cuando el programa Excel este cerrado, de modo que al ejecutarlo lo haga con esta nueva especificacin. Nota 2: La estructura tpica del archivo de datos en Excel contiene en la primera fila el nombre de las series (variables) sin que stas contengan espacios intercalados (no es aceptado por ejemplo 'tasa interes' sino tasa_interes). Nota 3: Si no estn disponibles algunas observaciones, compltelas con 'na' (no available). Veamos ahora el ingreso de las series de tiempo con la instruccin CALENDAR en adicin a ALLOCATE, DATA y OPEN DATA. Ejemplo: Supongamos que se tiene informacin de Produccin, Precios y Consumo. Asumamos que los datos son mensuales.

;* para leer datos desde un archivo Excel ;* se indica que los datos son mensuales comenzando en enero del ao 1970 ALLOCATE 16 ;* se trata de 16 observaciones OPEN DATA C:\DEPASO.XLS DATA(unit=DATA,ORG=OBS,FORMAT=XLS) / PRINT / ;* para ver la informacin ingresada CAL 1970 1 12

22

ENTRY 1970:01 1970:02 1970:03 1970:04 1970:05 1970:06 1970:07 1970:08 1970:09 1970:10 1970:11 1970:12 1971:01 1971:02 1971:03 1971:04

PRODUCCION 77.00000000000 86.00000000000 87.00000000000 92.00000000000 84.00000000000 93.00000000000 92.00000000000 100.00000000000 102.00000000000 113.00000000000 101.00000000000 116.00000000000 118.00000000000 88.00000000000 110.00000000000 117.00000000000

PRECIOS 52.00000000000 56.00000000000 60.00000000000 91.00000000000 117.00000000000 105.00000000000 102.00000000000 100.00000000000 105.00000000000 116.00000000000 125.00000000000 134.00000000000 121.00000000000 127.00000000000 138.00000000000 120.00000000000

CONSUMO 7275.0000000000 7409.0000000000 7726.0000000000 7972.0000000000 7826.0000000000 7926.0000000000 8272.0000000000 8551.0000000000 8808.0000000000 8904.0000000000 8784.0000000000 8798.0000000000 8825.0000000000 9148.0000000000 9462.0000000000 9682.0000000000

;* ntese que la primera columna de la izquierda contiene las fechas en el formato de RATS.

Para la salida de series de datos, las instrucciones pueden ser COPY y PRINT. La instruccin PRINT muestra las series por pantalla, y en el ejemplo anterior mostramos su uso. Para el caso de COPY, sta permite mostrar las series en pantalla o guardarlas en un archivo. Ambos casos son ilustrados a continuacin: Ejemplo: COPY(UNIT=OUTPUT, ORG=OBS) / X1 X2 X3 X4 X5 ;* muestra las 5 series por pantalla.

Ejemplo:

OPEN COPY c:\DATA.WKS COPY(FORMAT=WKS,ORG=OBS) / x1 x2 x3 ;* enva datos en formato de observaciones hacia el archivo data.wks las series x1 x2 y x3 en su rango completo.

Ntese que COPY con la opcin (UNIT=output) muestra datos por pantalla con ms flexibilidad que PRINT, sin embargo el uso de PRINT en ms rpido cuando no nos interesa el formato de la salida.

1.6.3. EXAMINANDO LOS DATOS


El siguiente paso, luego de leer los datos, es obtener estadsticas para asegurarse de que stos han sido ledos correctamente. Las instrucciones ms usadas para este fin son las siguientes6: TABLE calcula varias estadsticas bsicas de un grupo de series. STATISTICS entrega estadsticas detalladas de solamente una serie. PRINT permite examinar los datos en detalle, con la precaucin de que siempre debe drsele un rango para las series (o un /). EXTREMUM calcula los valores extremos de una serie, sin embargo las funciones: %maxvalue(A) y %minvalue(A) son ms directas, donde A puede ser una serie o un vector.

Otras instrucciones estadsticas de RATS son: CROSS (correlaciones cruzadas), MVFRACTILE (fractiles mviles), MVSTATS (estadsticas mviles), PSTATS (hace anlisis de varianza para datos panel), THEIL (medidas de calidad de prediccin), VCV (la matriz de covarianza), CMOM (con la opcin CORR calcula la matriz de correlacin de una lista de series).

23

La estructura bsica de stas instrucciones es: Nombre_de_la_Instruccin(opciones) Ejemplo: comienzo trmino variables

Para los ejemplos siguientes continuemos con los datos de produccin, precios y consumo: TABLE Series PRODUCCION PRECIOS CONSUMO STAT produccion Statistics on Series PRODUCCION Monthly Data From 1970:01 To 1971:04 Observations 16 Sample Mean 98.5000000000 Standard Error 13.1097927774 t-Statistic 30.05387 Skewness 0.18270 Kurtosis -1.23355 EXTREMUM produccion Extreme Monthly Minimum Maximum Values of Series PRODUCCION Data From 1970:01 To 1971:04 Value is 77.00000000000 at 1970:01 Value is 118.00000000000 at 1971:01 Obs Mean 16 98.50000000 16 104.31250000 16 8460.50000000 Std Error Minimum Maximum 13.10979278 77.00000000 118.00000000 27.10158359 52.00000000 138.00000000 714.50570327 7275.00000000 9682.00000000

Variance SE of Sample Signif Level Signif Level Signif Level

171.866667 Mean 3.277448 (Mean=0) 0.00000000 (Sk=0) 0.78698875 (Ku=0) 0.42503499

Entry 1 Entry 13

Para calcular las correlaciones entre dos o ms series, existen 3 instrucciones en RATS: VCV, CMOM y MCOV. Sin embargo la usual es VCV, mientras las otras son ms generales pues calculan los momentos cruzados (CMOM) y matriz de covariogramas (MCOV). Ejemplo: En el ejemplo anterior de produccin, precios y consumo: vcv(centered) ;* entrega la matriz de covarianza y de correlacin (elementos sobre la diagonal). # produccion precios consumo Covariance\Correlation Matrix PRODUCCION PRECIOS CONSUMO PRODUCCION 161.1250000 0.6855314086 0.7979839875 PRECIOS 228.3437500 688.5898437 0.8269901945 CONSUMO 7007.5625000 15013.1562500 478611.0000000 ;* verificamos que la correlacin entre produccin y consumo es 0.7979839875, mientras que la covarianza entre ambas series es 7007.5625000. Tambin la varianza de la serie Precios es 688.5898437

24

cmom(print,centered,corr) # produccion precios consumo Correlation Matrix Monthly Data From 1970:01 PRODUCCION PRODUCCION 1.000000000000 PRECIOS 0.685531408621 CONSUMO 0.797983987469

To 1971:04 PRECIOS CONSUMO 0.685531408621 0.797983987469 1.000000000000 0.826990194470 0.826990194470 1.000000000000

;* cmom con la opcin corr entrega la matriz de correlacin. Sin la opcin corr entrega solamente

(X

X )(Yi Y ) ,

es decir sin dividir por el nmero de

grados de libertad.

1.6.4. GRAFICOS
Otra forma til de examinar los datos es a travs de grficos. Las principales instrucciones para construir grficos en RATS son GRAPH y SCATTER. a) GRAPH Produce grficos de series, histogramas, grficos de barras y grficos de doble escala. La estructura bsica de la instruccin es: GRAPH nmero de series # series start end

Ejemplo:

Graph(patterns, key=loright, Header='Produccion vs. Precios') 2 ;* se graficarn 2 series respecto al tiempo, la clave se ubicar a la derecha-abajo, y el ttulo ser Produccion vs. Precios. # produccion # precios

Produccion vs. Precios


140

130

120

110

100

90

80

70

60
PRODUCCION PRECIOS

50 J F M A M J 1970 J A S O N D J F M A

25

Nota: Es posible que, segn la configuracin de RATS, los grficos aparezcan en otra ventana, siendo necesario ir al men, Windows para visualizarlos, tal como se muestra en la siguiente ilustracin:

Ejemplo:

Graph(patterns, key=upleft, STYLE=BARGRAPH, min=20, max=180) 2 # produccion # precios ;* produce un grfico de estilo barras para 2 series con rango definido por un mximo y un mnimo.

180

PRODUCCION PRECIOS

160

140

120

100

80

60

40

20 J F M A M J 1970 J A S O N D J F M A

b) SCATTER Este es un tipo de grfico en el cual una de las series es ubicada en el eje X, por este motivo son conocidos como grficos X-Y (scatter plots). La estructura bsica de la instruccin es:

26

SCATTER pares de series # x-series y-series start end Ejemplo: scatter(style=lines, patterns, key=loright) 2 # consumo produccion # consumo precios ;* produce un grfico de 2 pares de series en su rango completo
140

130

120

110

100

90

80

70

60
PRODUCCION PRECIOS

50 7000 7500 8000 8500 9000 9500 10000

Grficos ms complejos pueden generarse con la instruccin SPGRAPH (special purpose graph) tales como mltiples grficos en una pgina, reas sombreadas dentro del grfico o agregar texto a los grficos con GRTEXT. Todos los grficos obtenidos en RATS pueden ser copiados y pegados a otra aplicacin en Windows, tal como WORD, sin embargo a veces resulta ms conveniente grabar el archivo desde RATS con la extensin .WMF y luego insertarlo como imagen en cualquier otra aplicacin. Si el grfico obtenido en RATS no es exactamente el que queremos, entonces podemos grabar un archivo simple desde RATS y luego incorporar / insertar textos y otras imgenes similares desde cualquier editor de imgenes. Opcionalmente Ud. puede hacer doble click desde WORD para modificarlo. Finalmente, si ninguna de estas alternativas le permite obtener el grfico deseado, uno puede exportar los datos y generar el grfico en otra aplicacin tal como Excel.

1.6. TRANSFORMACIONES DE SERIES


1.6.1. INSTRUCCIN SET
La ms importante instruccin para trabajar con series es SET, la que permite generar nuevas series o revisar las actuales. Con SET se define una frmula que ser aplicada a cada observacin de la serie o a segmentos de sta. La estructura general de la instruccin es: SET series start end = function(T)

27

donde se asigna las entradas / elementos de la serie igual a los valores de la expresin evaluada haciendo T igual al nmero de la entrada / elemento. La expresin del lado derecho del signo igual puede ser cualquier combinacin de series existentes, escalares o funciones. Ejemplos: SET LOGX = LOG(X) ;* calcula el logaritmo de la serie X y lo almacena en la serie LOGX SET TOT = X1*X2 ;* multiplica las series X! y X2 y guarda el resultado en la serie TOT SET serie1 = (%beta(4) * term01{1}**(2*%beta(3)))**.5 ;* efecta un clculo relativamente complejo, donde term01 es una serie rezagada en 1 periodo, %beta son valores de coeficientes constantes, y ** corresponde al exponenciador. SET serie2 1980:1 1988:4 = 0.5 ;* asigna a todos los elementos de la serie2 entre 1980:1 y 1988:4 el valor 0.5

Existen varias instrucciones matemticas para transformar series, las que no requieren el comando SET (por ejemplo EXP, LOG, ABS, EXP, LOG , SQRT, COS, SIN, TAN y otras como DIFF. (vase Anexo de este captulo), sin embargo puede resultar ms fcil usar siempre el comando SET, pero recordando que algunas instrucciones poseen opciones para requerimientos especficos ms avanzados, como por ejemplo DIFF. Ejemplo: LOG x2 / s1 SET s1 = log(x2) ;* ambas instrucciones son equivalentes, y consisten en calcular el log de la serie x2 en su rango completo y almacenar a esta nueva serie en s1. DIFFERENCE / xx1 ;* calcula la primera diferencia7 de la serie xx1 y la almacena en X2 SET xx1 = x2-x2{1} ;* es igual a la instruccin DIFFERENCE anterior. X2

Ejemplo:

La letra T denota en RATS el nmero de observaciones, de modo que es posible crear series con tendencia fcilmente como sigue: Ejemplo: Ejemplo: SET trend = T ;* crea una tendencia lineal ;* crea una tendencia logartmica.

SET logtr = log(T)

;* ms claramente: ALL 5 DATA(UNIT=INPUT,ORG=OBS) / Y X1 X2 X3 120 132 145 198 154 168 182 192 187 109 186 164 111 155 154 188 176 198 165 162 SET TREND = T COPY(UNIT=OUTPUT) / TREND 1.000000 2.000000 3.000000 4.000000 5.000000

SET LOGTR = LOG(T) COPY(UNIT=OUTPUT) / LOGTR 0.000000 0.693147 1.098612 1.386294 1.609438

La primera diferencia de una serie corresponde a los elementos de la serie original menos el primer rezago de sta serie. Los rezagos en RATS se identifican con {1} para el primero, {2} para el segundo, etctera.

28

1.6.2. CREANDO SERIES A PARTIR DE OTRAS CON %IF


La funcin %IF es de mucha utilidad pues permite definir series ms complejas en base al cumplimento de condiciones lgicas complejas. La estructura de funcin es la siguiente: %IF(X,Y,Z) si X es distinto de cero (es decir verdadero) entrega Y, y entrega Z si X es cero. (X,Y, y Z pueden ser del tipo REAL o ENTERO) Ejemplo: SET ALZAS = %IF( PRECIO. GT. PRECIO{1}, PRECIO - PRECIO{1}, 0) ;* define la nueva serie ALZAS como el monto en que la serie PRECIO aument respecto al valor inmediatamente anterior, o cero en cualquier otro caso. Note que si las cadas desean ser excluidas en la serie ALZAS, puede escribirse %NA en lugar de cero. Note que hacemos uso del operador lgico GT8. ALL 3 DATA(UNIT=INPUT) / bdos 100. 105. 110. stat(noprint) bdos set mean = %mean ;* almacena el promedio de la serie bdos en la serie mean clear bdos2 ;* crea la serie bdos2 set bdos2 = %if(bdos<mean, bdos+100., %if(bdos==mean,bdos+200, $ bdos+500)) ;* es un ejemplo de dos funciones %if anidadas. Asigna a la serie bdos2=bdos+100 si bdos<mean, bdos2=bdos+200 si bdos=mean y bdos2=bdos+500 si bdos>mean.

Ejemplo:

1.6.3. CREANDO VARIABLES DUMMIES


Las variables Dummies sern tratadas en trminos aplicados en un captulo posterior. Digamos que las variables dummies son aquellas que toman el valor 0 1, por lo que sirven para identificar la presencia o ausencia de una determinada caracterstica entre las series. Nos referimos aqu a los aspectos referidos a su construccin. El camino largo para crear una variable dummy es con dos o ms instrucciones: Ejemplo: SET Dum 1970:1 1979:4 = 1 comprendido SET Dum 1980:1 1988:4 = 0 comprendido ;* asigna a la serie Dum el valor 1 para el periodo entre 1970:1 1979:4 ;* asigna a la serie Dum el valor 0 para el periodo entre 1980:1 1988:4

Si la expresin establecida en SET genera una condicin lgica pura, automticamente se crea una variable dummy que toma los valores 0 (FALSO) o 1 (VERDADERO). Luego, la instruccin directa para la creacin de dummies es: Ejemplo: SET D70 = T <= 1979: 4 SET D70 = T <= 55 ;* cuando se usa calendar. ;* cuando no se usa calendar.

Ejemplo:

SET SMALL = POP<2000 ;*ser 1 para cuando todos aquellos elementos de la serie POP sean menores que 2000, y 0 para el resto.

Existen varias instrucciones que permiten trabajar slo con los rangos definidos en variables dummies, y estas instrucciones contienen la opcin SMPL=nombre de la serie dummy:

8 Operadores lgicos incluyen ' == ' .EQ. para la igualdad, .GT. > para mayor que, .GE., >= para mayor o
igual que, .LT. y .LE. para menor y meor o igual que, .NOT. , .AND., .OR.

29

Ejemplo:

SET(scratch) S = SEMANA>=1994.0 .and. SEMANA<1995.0 ;* crea la variable dummy S que tendr valores 1 cuando se cumple la condicin especificada. SAMPLE(smpl=s) semana / xsemana ;* SAMPLE crea una serie nueva 'xsemana' extrayendo las entradas de la serie original 'semana' cuando la variable dummy S es 1, y asignando NA en los otros casos. SAMPLE(smpl=s) term SAMPLE(smpl=s) yield / xterm / xyield ;* igual al anterior pero con la serie term ;* igual al anterior pero con la serie yield

Ejemplo:

SET CAIDAS = T>=1990:6.AND.T<=1991:3.OR.T>=1993:10.AND.T<=1994:7 ;* crea la serie dummy CAIDAS que identifica con el nmero 1 los periodos en que se cumple la condicin. En este caso se trata por ejemplo de periodos ce cada en la actividad econmica. GRAPH(PATTERNS,SHADING=CAIDAS, KEY=UPRIGHT) 2 ;* crea un grfico para las series VAR12M y SPREAD_5 a partir de 1985:5, identificando en oscuro los periodos de cada del producto. # VAR12M 1989:5 * # SPREAD_5 1989:5 *

Ejemplo:

SET SMALL = POP<2000 ;* crea la variable dummy SMALL LINREG(smpl=small) Y ;* la regresin se saltar aquellas observaciones en que SMALL=0, o de otro modo, solo se considerarn en la regresin las observaciones en que SMALL=1.

1.6.4. OTRAS INSTRUCCIONES COMUNES PARA SERIES


En adicin a SET, otras instrucciones para trabajar con series son:
INSTRUCCION CLEAR limpia el contenido de series existentes y tambin crea nuevas series EQV y LABELS en conjunto cambian nombres de series Ejemplos CLEAR X Y Z EQV 1 2 3 X1 X2 X3 LABELS 1 2 3 # 'RESID1' 'RESID2' 'RESID3' ;* las series X1, X2 y X3 se renombrarn por RESID1, etctera. MAKE RRR 48:1 90:12 # X1 X2 ;* crea el arreglo RRR a partir de las series X1 y X2 en el periodo sealado ORDER X2 / X1 ;* X1 ser ordenado en paralelo a X2 SAMPLE(INTERVAL=2) x1 / x4 SEASONAL DECEMB 1948:1 1991:10 12 1948:12 ;* crea la dummy DECEM entre 1948:1 y 1991:10 en que la separacin ser cada 12 meses(habrn '1' cada 12 meses y el resto '0'), comenzando en 1948:12 SMPL 1981:1 1981:4 ;* no siempre es recomendable, pues en casi todas las instrucciones puede definirse el rango sobre el cual operar la instruccin.

MAKE crea un arreglo a partir de series

ORDER ordena series SAMPLE extrae datos con diferente frecuencia SEASONAL crea dummies estacionales

SMPL establece globalmente el rango de trabajo

30

1.7. FACILITANDO EL TRABAJO REPETITIVO


Existen bsicamente 4 instrucciones para hacer ciclos: DO, DOFOR, WHILE y UNTIL. Aqu comentaremos solamente las dos primeras, que son las ms usadas.

1.7.1. LA INSTRUCCIN DO
DO hace ciclos hasta END, mientras se cumpla que index > endvalue (si los incrementos son positivos). DO index = startvalue, endvalue, [increment] Index debe ser un INTEGER instrucciones que sern ejecutadas para cada valor tomado por el ndice(index). END Ejemplo: Para obtener el factorial del nmero 5: COM FA=1 DO K =1,5 COM FA=FA*K END DO K DIS FA 120 Ejemplo: Para correr una serie de regresiones lineales, con un rango inicial constante de 1980:1 hasta un periodo final variable de 1994:1 hasta 1994:12 DO REGEND=1994:1,1994:12 LINREG Y 1980:1 REGEND # CONSTANT X1 X2 DIS %BETA(2) END DO Para obtener el promedio de una columna de la matriz TE2 com length = 3 , sum = 0 do i=1,length compute sum = sum + fix(TE2(i,2)) end do i Com MeanTE = Sum/%Rows(TE2) Dis 'Mean =' MeanTE Mean = 5 Ejemplo: Para definir una variable Dummy SERIE1 A partir de los valores de Y CLEAR SERIE1 DO I=1,435 IF Y(I)>0.0 COM SERIE1(I)=1.0 ELSE COM Y(I)=SERIE1(I)=0.0 END DO I

Ejemplo:

Ejemplo:

Una forma de traspasar las columnas de una matriz a series all 3 comp start = 1 do i=1,3 comp end = start set serie1 start end = TE2(i,1) set serie2 start end = TE2(i,2)

31

comp start = start + 1 end

1.7.2. LA INSTRUCCIN DOFOR


DOFOR hace ciclos hasta END DOFOR para cada uno de los ndices listados, los que no requieren tener ninguna secuencia. El ndice puede ser de cualquier tipo, pero si no es entero debe ser previamente declarado. DOFOR index = list of values Instrucciones que sern ejecutadas para cada valor del ndice END DOFOR

Ejemplo:

DOFOR INDICE = 3 5 7 DIS INDICE END DOFOR 3 5 7

Ejemplo:

Para hacer un loop corriendo regresiones con Y1, Y2 y Y3 como variables independientes. DOFOR S = Y1 Y2 Y3 LINREG S # CONSTANT X1{0 1} X2 dis %beta(2) dis %RSQUARED END DOFOR

32

ANEXO: FUNCIONES
Las funciones permiten hacer clculos, mostrar informacin y para los usuarios avanzados, programar. La sintaxis de todas las funciones en RATS es la siguiente: Nombre(argumento1,argumento2,...) El parntesis izquierdo debe encontrarse inmediatamente despus del nombre de la instruccin, sin espacios entre ambos. Aqu se usa la siguiente convencin: x, y indican nmeros reales o expresiones de valor real m, n indican enteros o expresiones de valor entero A y B indican arreglos Z indica un valor complejo o expresiones de valor complejo. A continuacin mostramos un listado de las principales funciones (omitimos las funciones de programacin y de nmeros complejos): Ejemplos ABS(X) EXP(X) LOG(X) %IF(X,Y,Z) COS(X) SIN(X) TAN(X) %ANNUITY(P,R,N) %BOXCOX(X,Y) %FRAC(X) , %MAX(X,Y), %IMAX(M,N), %MIN(X,Y), %IMIN(M,N), %PAYMENT(A,R,N), Definicin valor absoluto exponencial logaritmo natural Entrega Y si X es distinto de cero (i.e. verdadero), Entrega Z si X es cero (X,Y, y Z pueden ser real o entero) Coseno Seno Tangente valor presente de una anualidad con P(pago), R(inters) y N(perodo) reales (X**y-1)/y,(log(x) para y=0) X- [X] Mximo de 2 reales Mximo de 2 enteros Mnimo de 2 reales Mnimo de 2 enteros Pago requerido para un anualidad con principal A, inters R y perodo N, donde A,R,N son reales Crear serie con 2 labels Entrega como un label el primer caracter N de Label Entrega los caracteres de Label, comenzando con M=1, si N=0 Entrega el string entero comenzando en M Entrega (como un string) el ltimo caracter N de string Entrega el string correspondiente al entero N Entrega el entero correspondiente a la especificacin [(M-1) modulo N]+1, de 1,...N. Entrega el string asociado con el entero T Entrega el da del mes para T Para datos de panel Entrega el nmero de das desde enero 1, 1901 para T Entrega el entero para el nmero de mes T Para datos de panel Entrega el da de la semana que corresponde a T Entrega el ao calendario para T

1. Funciones Numricas

2.- Funciones de String/Label

%CONCAT(FIRST,LAST) %LEFT(LABEL,N) %MID(LABEL,M,N) %RIGHT(LABEL,N) %STRING(N)

3. Funciones de entrada, fechas, y panel

%CAL(YEAR,PERIOD) %DATELABEL(T) %DAY(T) %INDIV(T) %JULIAN(T) %MONTH(T) %PERIOD(T) %WEEKDAY(T) %YEAR(T)

33

4. Funciones de Distribucin y Probabilidad

%RAN(X) %UNIFORM(L,H) %CDF(X) %CHISQR(X,R) %DENSITY(X) %LOGDENSITY(A,B), %FTEST(X,N1,N2) %INVCHISQR(X,R) %INVNORMAL(X) %LNGAMMA(X) %RANGAMMA(X) %MILLS(X) %DMILLS(X) %POISSON(MEAN,K) %TTEST(X,N) %ZTEST(X)

Nmero normal aleatorio con media 0, y varianza X Distribucin uniforme Entrega cdf(X), la funcin de densidad acumulativa de una normal estndar ( ) Entrega la probabilidad de

2 con R grados de libertad

Funcin de densidad normal estndar Entrega -.5*(log|A| + BA-1B), donde A es un arreglo simtrico y B es un vector. Entrega la probabilidad de F(n1, n2) Funcin inversa 2. Entrega Y, tal que X=G(Y), G es cdf de la distribucin

, con R g. de l..0<=X<=1.

Funcin normal inversa. Entrega Y, tal que X=cdf(Y), 0<=X<=1. Entrega el log natural de una funcin Gamma para X Entrega el log de la funcin Gamma para X Entrega (X)/ (X)= la inversa del ratio Mills Entrega la derivada de la inversa del ratio Mills Entrega P(x<=K| = MEAN) para un proceso x Poisson con media dada por MEAN Entrega la probabilidad de t con N g. De l. Entrega la probabilidad de una normal estndar Inversa Traspuesta Descomposicin de Choleski (solo para simtricas) Entrega la matriz diagonal para un vector Entrega el producto Kroneker para A y B Entrega la diagonal de un arreglo A como un rectangular (n*1) Una tcnica de descomposicin Entrega (A * I)B Entrega BAB. A(n*n), B(n*m) Entrega el determinante Entrega la suma de elementos Entrega la traza Entrega el mximo valor en A Entrega el mnimo valor en A Entrega el producto punto Entrega la covarianza de A y B Entrega la correlacin de A y B Entrega BAB. A(n*n), B(n*1) Entrega A(1,1) o A(1) Entrega el nmero de filas en A Entrega el nmero de columnas en A

6. Funciones Matriciales

INV(A) TR(A) %DECOMP(A) %DIAG(A) %KRONEKER(A,B) %XDIAG(A) %LUSOLVE(A,B) %KRONID(A,B) %MQFORM(A,B) %DET(A) %SUM(A) %TRACE(A) %MAXVALUE(A) %MINVALUE(A) %DOT(A,B) %COV(A,B) %CORR(A,B) %QFORM(A,B) %SCALAR(A) %ROWS(A) %COLS(A)

34

CAPITULO 2 EL MODELO DE REGRESION LINEAL

2.1. INTRODUCCION: QUE ES LA ECONOMETRIA?


Diccionarios especializados definen econometra como la aplicacin de tcnicas matemticas y estadsticas a la economa en el estudio de problemas, anlisis de datos, el desarrollo y la prueba de teoras y modelos." En efecto, cuando un economista plantea un determinado modelo en el cual existe una variable dependiente de otras variables explicativas a travs de una determinada especificacin funcional, esta es susceptible de ser estimada con datos de la realidad. En casos simples, el modelo no requiere estar especificado demasiado formalmente, pues en muchos casos es aceptada cierta relacin ente variables, por ejemplo Ventas-Publicidad, Ingreso-Consumo, Nivel de tasas de inters-Inversin, etctera. Esto es en breve lo que se entiende por econometra. As, como iremos viendo a travs de este libro, los tres principales usos de la econometra incluyen: 1) Medicin de Parmetros (estimacin de modelos) 2) Prueba de Hiptesis 3) Prediccin Los modelos economtricos pueden ser lineales o no lineales en los parmetros. Son lineales cuando la variable explicada (dependiente) puede ser escrita como una combinacin lineal de las variables explicativas (independientes). Por ahora trabajaremos solamente con modelos lineales. Ejemplo:

Yt = 0 + 1Yt 1 + 2 X t + t

;* es un modelo lineal en los parmetros. Los

parmetros a estimar o incgnitas son los coeficientes , mientras que las variables explicativas son X e Y rezagada. La variable explicada o endgena es Y. Ejemplo:

Yt = 0 + 1Yt 1 + 22 X t + t

;* es un modelo no lineal en los parmetros,

pues hay un coeficiente que se encuentra al cuadrado, y no hay forma de eliminar ese exponente sin afectar la linealidad de los restantes parmetros. La segunda clasificacin importante es la de modelos de regresin ser simples o mltiples, de acuerdo al nmero de variables que explican a la variable dependiente. Cuando solamente existe una variable explicativa se llama a ste un modelo de regresin simple y cuando son varias se le llama modelo de regresin mltiple.

35

Ejemplo:

VENTASt = 0 + 1 PUBLICIDADt + t

;* es un modelo de regresin simple:

La relacin lineal entre las ventas (y) y los gastos en publicidad (x) Ejemplo:

CONSUMO t = 0 + 1 INGRESOS t + 2 ACTIVOS t + 3TAMAO t + t

;* es un

modelo de Regresin Mltiple. La relacin lineal entre el gasto en consumo de las familias (y) en funcin del ingreso (x1), los activos financieros de la familia (x2) y del tamao de la familia (x3).

2.2. EL METODO DE MINIMOS CUADRADOS


Supongamos que disponemos de informacin de Ingreso (variable exgena) y de Consumo (variable endgena) de 20 familias en un determinado periodo (ver datos en la Tabla 4 del Anexo al final del libro). Esta informacin es mostrada en el siguiente grfico (scatter).
45

40

35

30

consumo

25

20

15

10

5 6 12 18 24 30 36 42 48

ingreso

Al obtener la informacin real, esta no se ajustar exactamente al modelo (que suponemos en este caso es lineal), pues algunos puntos se ubican sobre y otros por debajo de la recta. Las observaciones parecen una nube de puntos, y nuestro objetivo es determinar el mejor ajuste a la lnea, lo que implica estimar el intercepto y la pendiente de la recta de mejor ajuste a la nube de puntos. Puesto que existe una desviacin o error entre cada valor observado de ), entonces el mejor ajuste ser el que minimice tales errores9.

y cada valor predicho por la recta ( Y

Puesto que habr errores positivos y negativos, una posibilidad es encontrar la recta ptima (es decir el parmetro de intercepto y pendiente) minimizando la suma cuadrara de los errores (SCErr), procedimiento llamado Mnimos Cuadrados Ordinarios. Estos parmetros de intercepto y pendiente son llamados tambin parmetros de posicin.

Se agrega un trmino de Error (e) pues la relacin entre X e Y es estocstica, lo que se puede deber a: - Elementos impredecibles (aleatorios) del comportamiento humano. - Gran nmero de variables omitidas, algunas no cuantificables. - Errores de medicin en y.

36

Es conveniente suponer que Y es una variable aleatoria, es decir las observaciones de Y son sucesos observados en un experimento, y que stos tienen alguna distribucin como se muestra a continuacin:

Variable endgena Y

Valores posibles de Y dado un valor de X Y=a+bX

Variable Exogena X

As, si efectivamente la relacin subyacente es lineal, uno esperara que a travs de repeticiones sucesivas de Y (experimentos repetidos) se obtendra observaciones con frecuencias como las descritas en cada distribucin de la Ilustracin, de modo que el error esperado de cada observacin sea cero. Un supuesto importante en esta parte es que si bien Y y X son observables, X est fijo es decir es una variable completamente definida por el investigador. Por el contrario Y es estocstico, producto que existe el error en el modelo, y este error es estocstico, efecto que se transmite a Y.

2.3. IMPLEMENTACION DE MCO


Hemos dicho que un modelo del tipo lineal simple contiene una sola variable explicativa (X). La especificacin general es un modelo lineal mltiple con muchas variables explicativas. Considerando todas las observaciones (supongamos que se trata de T observaciones disponibles), esta relacin puede escribirse entonces de un modo matricial como sigue:

YTx1 = X TxK Kx1 + Tx1


es decir:

Y1 Y 2 Y = . . YT

1 1 X = . . 1

X X X X
11 21

12 22

. .
T1

. .
T2

. . . . . .

X X

. . . . . . XTk

X X
ik 2k

0 1 = . . k

1 2 = . . T

37

donde Y es el vector de variables explicadas por el modelo, X es una matriz de valores conocidos de variables explicatorias fijas o no estocsticas10, es un vector tal que (X,) es una secuencia de vectores aleatorios independientes11, y es un vector de K parmetros desconocidos. Para efectos de notacin matricial, el primer subndice de X indica el nmero de la observacin y el segundo identifica la variable. El mtodo de mnimos cuadrados (MCO) para encontrar los coeficientes que proporcionan el mejor ajuste consiste en minimizar la suma cuadrada de errores, S. Esta suma cuadrada de errores resulta ms sencillo de expresar en trminos matriciales como sigue: Expresemos el vector de errores como siguiente diferencia:

= ( y X )
luego, la suma cuadrada de errores es:

S = ( y X )' ( y X ) = ( y ' ' X ' )( y X ) = y ' y ' X ' y y ' X + ' X ' X = y ' y 2 ' X ' y + ' X ' X
El objetivo de MCO es encontrar el valor del vector de coeficientes que minimice S, para lo cual debe derivarse S respecto a b (el estimador de MCO), es decir:

S = 2 X ' y + 2 X ' X = 0 X ' Xb = X ' y b = ( X ' X ) 1 X ' y


Luego, el estimador de MCO de es b y viene dado por:

b = ( X ' X ) 1 X ' y
que es un vector aleatorio puesto que, como se ve, es una funcin lineal de Y. Ntese que b tiene dimensin 1xK, de modo que para el caso de un modelo lineal simple, K=2, y el elemento (1,1) de b ser el intercepto, y el elemento (2,1) ser la pendiente.

2.3.1. CORRIENDO REGRESIONES LINEALES EN RATS


Con el resultado anterior hemos mostrado que el estimador de MCO de los coeficientes de regresin (b) viene dado por el producto de la matriz X y del vector Y. Luego, el procedimiento hasta aqu es meramente matemtico, de hecho, en un ejercicio del captulo 1 (seccin 1.4.4) mostramos como puede realizarse este clculo con RATS a travs de operaciones matriciales de vectores y matrices.
Ms adelante veremos que este supuesto de X fijas puede ser levantado. El caso en que X contiene algn tipo de informacin acerca del valor esperado en el error, se produce sesgo e inconsistencia. Otros supuestos relevantes se relacionan con la necesidad de que las varianzas de los errores estn uniformemente acotadas y que la matriz promedio de covarianza de los regresores sea no singular.
11 10

38

Sin embargo resulta ms apropiado ingresar las observaciones de X e Y como series de datos en lugar de vectores, y entonces utilizar las instrucciones de RATS para obtener este resultado (y muchos ms). La instruccin para correr regresiones lineales (simples y mltiples) en RATS es LINREG, la que tiene la siguiente estructura: LINREG variable_dependiente desde hasta residuos coeficientes # lista da variables explicativas en formato de Regresin Los parmetros desde hasta se refieren al rango de datos sobre el cual se correr la regresin. Si se omite se asume que se usar el rango completo. El parmetro residuos (errores) indica que RATS almacenar los errores estimados en le regresin () en una serie con el nombre que all se le indique. La lista de variables explicativas en formato de regresin, se refiere a la estructura usada por RATS, que consiste bsicamente en el smbolo # y luego el trmino CONSTANT para indicar la existencia de intercepto (si se omite se asumir que ste es igual a cero), y luego el nombre de cada una de las variables explicativas. En el caso que el modelo establezca que alguna de las series sean formuladas en trminos de algn rezago o anticipo (en ingls lag lead), se escribir el nombre_serie{lista de rezagos}, por ejemplo SERIE1{0 TO 3} para indicar que se incorporarn, simultneamente a la serie SERIE1 los rezagos 1, 2 y 3. Para el caso de los anticipos (leads) se escriben los rezagos con signo negativo, por ejemplo SERIE1{-2}. Ejemplo: PIB{2} ;* es el segundo rezago de la serie PIB PIB{-1} ;* es el primer anticipo. CONSTANT INGRESO PIB{1} ;* correr una regresin con Constante (intercepto), considerando las series INGRESO y PIB rezagado 1 periodo como variables explicativas. LINREG dy # dg{1 2 4} dm{1 to 4} ;* correr una regresin usando la serie dy como variable dependiente, y como variables explicativas las series dg en sus rezagos 1, 2 y 4, y la serie dm con sus 4 primeros rezagos. Note que si los rezagos/anticipos son contiguos, entonces se puede usar 'to'. Ejemplo: A modo de ilustracin, asumamos que se dispone de la siguiente informacin mensual de actividad econmica en Chile (IMACEC), de desempleo en miles de personas desocupadas, y del ndice de precios al consumidor (Base: Diciembre 1998=100). Ver Tabla 1 en el Anexo al final del libro. all 12 cal 2000 1 1 data(unit=input,org=obs) / FECHA IMACEC DESEMPLEO IPC ... ;* los 3 puntos suspensivos indican que aqu deben insertarse los datos de la tabla correspondiente, las que estn disponibles en el anexo al final del libro. Table ;* La instruccin TABLE permite obtener un resumen de los datos ingresados, lo que sirve para verificar que la informacin ha sido ingresada correctamente. Obs Mean 12 2000.06500000 12 248.40000000 12 539.39166667 12 104.92500000 Std Error Minimum Maximum 0.03605551 2000.01000000 2000.12000000 8.31635847 235.20000000 267.40000000 54.53536731 473.50000000 626.60000000 1.41686915 102.49000000 106.94000000

Series FECHA IMACEC DESEMPLEO IPC

39

Supongamos que buscamos explicar el desempleo (variable Y) a travs de una relacin lineal respecto de la actividad econmica (variable X1) y la inflacin (variable X2). Para regresionar linealmente Y respecto de X1 y X2 considerando un intercepto, la instruccin en RATS ser: linreg desempleo # constant imacec ipc ;* la variable dependiente es desempleo ;* las variable independientes son imacec e ipc

Dependent Variable DESEMPLEO - Estimation by Least Squares Monthly Data From 2000:01 To 2000:12 Usable Observations 12 Degrees of Freedom 9 Centered R**2 0.440137 R Bar **2 0.315723 Uncentered R**2 0.994803 T x R**2 11.938 Mean of Dependent Variable 539.39166667 Std Error of Dependent Variable 54.53536731 Standard Error of Estimate 45.11222094 Sum of Squared Residuals 18316.012303 Regression F(2,9) 3.5377 Significance Level of F 0.07351364 Durbin-Watson Statistic 1.286739 Q(3-0) 1.724386 Significance Level of Q 0.63152582 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -489.813301 1134.381514 -0.43179 0.67605439 2. IMACEC -2.967603 1.645773 -1.80317 0.10486361 3. IPC 16.834478 9.659915 1.74271 0.11535790 Por ahora, nos interesa sealar que los tres coeficientes estimados son 489.8133.0 para el intercepto, -2.967603 para el coeficiente del IMACEC, y 16.834478 para el coeficiente del IPC. Ms adelante iremos interpretando los resultados.

2.3.2. LA DISTRIBUCIN DE b
Hemos sealado que b (el estimador de ) es tambin una variable aleatoria, de modo que si se conoce su distribucin seremos capaces de hacer inferencias de stos, tales como intervalos de confianza y pruebas de hiptesis. Veamos entonces la distribucin del estimador b, en cuanto a su valor esperado y su varianza. Puede mostrarse que el valor esperado y la varianza de b vienen dadas respectivamente por12:

E (b) = + ( X ' X ) 1 X ' E ( )


V (b) = E[(b )(b )'] = ( X ' X ) 1 X ' E ( ' ) X ( X ' X ) 1
donde E() corresponde a la matriz de varianzas y covarianzas de los errores. La matriz de varianzas y covarianzas de los coeficientes es cuadrada y simtrica de dimensiones KxK, es decir:

12

Vase ecuacin 5.6.8.a) en pgina 201 de Judge et al. (1988).

40

Cov(b1 , b2 ) Var (b1 ) Cov(b , b ) Var (b2 ) 2 1 E [(b )(b )'] =

Var (bk )

donde los elementos de la diagonal son las varianzas de cada coeficiente, los que se encuentran fuera de la diagonal son las covarianzas. As, b tiene la siguiente distribucin general13:

b + ( X ' X ) 1 X ' E ( ) , ( X ' X ) 1 X ' E ( ' ) X ( X ' X ) 1

Ntese tambin que el comportamiento de los errores (), es decir la matriz de varianzas y covarianzas de los errores, E(), tiene gran importancia en la esperanza y la varianza de b. En efecto, para que b sea un estimador insesgado de (es decir E(b)=) se requiere que XE()=0, es decir que los errores sean independientes de las variables explicativas X, lo que se lograra siempre en el caso que X fuera fija, y tambin en algunos casos cuando X es estocstica (vase regresores estocsticos). Respecto a la varianza de b, cuando E()=2I, lo que significa que los errores estn distribuidos independiente y constantemente, V(b) es mnima, es decir, el estimador b es eficiente (de varianza mnima), y en este caso la varianza de b viene dada por: V(b) = (X'X) X' I X(X'X) Es decir:
-1 2 -1

= (X'X)

-1

b , 2 ( X ' X ) 1

As, bajo condiciones ideales (errores bien comportados) el estimador de MCO es insesgado y eficiente. Esto es resumido por el Teorema de Gauss-Markov, en cuanto a que puede mostrarse14 que b es MELI, es decir, es el mejor estimador insesgado de entre la clase de los estimadores lineales de .

2.3.3. LA MATRIZ DE COVARIANZAS DE LOS ERRORES


La matriz de varianzas y covarianzas de los errores tiene la siguiente forma:

1 1 1 2 E [ '] = E 2 1 ...

Cov( 1 2 ) V ( 1 ) Cov( ) 2 1 = ... ... ... ... ... T T V ( T )

donde los elementos de la diagonal representan la varianza de cada error, y los elementos fuera de la diagonal son las covarianzas respectivas entre errores. Puesto que la covarianza entre el error 4 y el error

Note que no especificamos an, pues no lo requerimos, la distribucin especfica de b, es decir si por ejemplo se trata de una distribucin Normal o no. 14 Vase seccin 5.7 en Judge et al.

13

41

6 es la misma que la covarianza entre el error 6 y el error 4, entonces sta matriz es simtrica y cuadrada de dimensin TxT. Esta matriz no es posible de observar ni estimar completamente con los datos, por la sencilla razn de que existen solamente T observaciones o grados de libertad inicialmente, y E() contiene T(T+1)/2 incgnitas15. Por este motivo deben hacerse supuestos simples acerca de su comportamiento, y el ms sencillo es asumir que los errores estn idealmente bien comportados, lo que quiere decir que stos errores se distribuyen independiente e idnticamente. Veamos esto con algn detalle. Cuando los errores se distribuyen idnticamente significa que tienen igual varianza (sabemos que tienen media cero). En econometra a esta propiedad se le llama homocedasticidad, o inexistencia de heterocedasticidad. Esto significa que la matriz de varianzas y covarianzas de los errores debe tener a lo largo de toda su diagonal el mismo elemento, es decir una constante, reflejando que la varianza del error de cada observacin es el mismo para las T observaciones. Cuando los errores se distribuyen independientemente quiere decir que stos no estn correlacionados entre s. En econometra a esta propiedad se le llama no-autocorrelacin serial, o errores no correlacionados serialmente. En este caso la matriz de varianzas y covarianzas de los errores debe presentar que todos los elementos fuera de la diagonal (es decir las covarianzas) sean cero.

As, en el caso de errores bien comportados, esto se traduce en homocedasticidad y no autocorrelacin, lo que significa que la matriz de varianzas y covarianzas de los errores debe ser igual a:

2 0 E [ '] = ... 0

0 1 0 ... 0 = 2 0 1 = 2I ... ... ... 2 1 0 ...

es decir 2 veces la matriz identidad. De este modo, en adelante, cuando nos referimos a errores bien comportados queremos decir errores con varianzas del tipo escalar-identidad o 2I, donde I es la matriz identidad. Por el contrario, cuando los errores estn mal comportados se dice que su matriz de varianzas y covarianzas tiene la forma de 2, donde es una matriz cuadrada simtrica TxT pero distinta de la matriz identidad. En cualquier caso, si bien no puede estimarse a partir de los datos, s puede obtenerse un estimador de 2, la varianza de los errores ( es conocida el error estndar de la estimacin) que denominamos s2, el que puede mostrarse, viene dado por:

s2 =

SCErr t =1 ' = = T K T K T K

t =T

2 t

Puede apreciarse que s2 proviene de la frmula tradicional de varianza de una serie, es decir la suma cuadrada de las desviaciones de cada observacin respecto a la media (la media de los errores es cero) dividido por el nmero de grados de libertad, en este caso T menos el nmero de parmetros estimados en la regresin previa a la estimacin de s2.

15

Por ejemplo, se tienen 3 observaciones, E() tiene por incgnitas los 3 elementos de la diagonal de sta matriz ms los 3 elementos debajo de la diagonal (pues es una matriz simtrica, los elementos de arriba de la diagonal son iguales), es decir un total de 3+3 = 3*4/2 = 6 incgnitas.

42

2.3.4. UNA MEDIDA DEL XITO DE AJUSTE


La medida usual para evaluar el grado de xito en el ajuste de MCO a los datos observados es el coeficiente R-cuadrado. Este coeficiente tiene un rango de valores posibles entre 0 y 1. Mientras ms cercano a cero indicar un mal ajuste, y mientras ms cercano a 1 indicar un mejor ajuste. La derivacin del R-cuadrado se obtiene descomponiendo la suma cuadrada total en suma de cuadrados explicada y suma de cuadrados no explicada por la regresin (SCErrores): SCT = SCExpl + SCErr

(y
donde

2 2 y) 2 = ( y t y) + ( yt y t )

y i son los valores observados de Y, y es el valor promedio de los y observados, lo que sirve para reescalar apropiadamente los clculos, y por ltimo y i corresponde a los valores de Y predichos por la
regresin ajustada. Un mejor ajuste implicar que la SCExplicada es mayor que la SCErrores. As, dividiendo ambos lados de la igualdad por el trmino de la izquierda se tiene que:

(y 1= (y

t t

y) 2 y) 2

(y + (y

t t

2 y t )

y) 2
suma cuadrada explicada suma cuadrada total

(y = (y

t t

y) 2 y)
2

, o escrito de otro modo,

R2 =

Lamentablemente el R-cuadrado est afectado por el nmero de parmetros usados en el modelo, de modo que en general, siempre se obtendr un R-cuadrado ms alto cuanto mayor sea el nmero de variables explicativas. De otro modo, se esperan bajos R-cuadrados para modelos relativamente simples. Sin embargo la regla de la parsimonia indica que los modelos con demasiados parmetros hacen perder grados de libertad y confianza en las estimaciones, aspecto que el R-cuadrado no considera. Debido a este problema fue desarrollado el coeficiente R-cuadrado ajustado de la siguiente forma:

T 1 2 R 2 =1 (1 R ) T K
el cual presenta una especie de correccin / castigo para los modelos con muchos parmetros, puesto que al aumentar K caer el valor de esta medida. Como desventaja, el R-cuadrado ajustado puede ser negativo.

43

2.4. CARACTERISTICAS ADICIONALES DE LINREG


2.4.1 SALIDAS OPCIONALES DE LINREG
Despus de correr una regresin lineal en RATS, se crean una serie de variables con resultados de la ltima regresin, de modo que est disponibles para ser usadas en clculos posteriores o para se consultadas por pantalla. Estos resultados son almacenados en variables que comienzan con el smbolo %. El listado de resultados es el siguiente: %NDF %NOBS %NREG %RSQUARED %RBARSQ %TRSQ %DURBIN %BETA %XX %RSS : Entrega el nmero de grados de libertad en la regresin (entero) : Entrega el nmero de observaciones tiles disponibles (entero). Si alguna variable usada en la regresin contiene elementos na stos no sern considerados. : Entrega el nmero de regresores o variables explicativas (entero) : Entrega el R-cuadrado (escalar real) : Entrega el R-cuadrado ajustado (escalar real) : Entrega el nmero de observaciones multiplicado por el R-cuadrado (escalar real) : Entrega el estadstico Durbin-Watson (escalar real), til en la deteccin de autocorrelacin de primer orden en los errores. : Entrega el VECTOR de los coeficientes estimados (b). : Entrega con la inversa de (X'X), que es una matriz simtrica. : Entrega la suma cuadrada de residuos (escalar real), es decir

S = t2 = SCErr = '
t =1

t =T

%SEESQ

: Entrega el error estndar de la estimacin al cuadrado (escalar real), es decir 2. Note que si se desea conocer la estimacin de la matriz de varianzas y covarianzas de los coeficientes de la regresin, basta calcular los elementos de la matriz %SEESQ * %XX, es decir

2 ( X ' X ) 1 .

%QSTAT %QSIGNIF %RHO %UZWZU

: Entrega el estadstico Q de Ljung-Box (escalar real), til para la deteccin de autocorrelaciones de orden superior a 1. : Entrega la significancia del estadstico Q (escalar real), es decir el nivel de error con el cual se puede rechazar la hiptesis nula de no correlacin serial de orden mayor a 1. : Entrega el coeficiente de autocorrelacin del primer rezago (escalar real), til para detectar autocorrelacin de 1 orden. : Entrega el resultado de uZWZu, que es de utilidad en el caso del uso de variables instrumentales (escalar real)

Ejemplo:

A modo de ejemplo, trabajemos con la regresin anterior de actividad econmica en Chile (IMACEC), de desempleo, y del ndice de precios al consumidor (Tabla 1 en Anexo al final del libro), y queremos conocer la estimacin la de inversa de (X'X). WRI %XX ;* muestra la inversa de (X'X). Recuerde que previo a esto debe correrse la regresin para que RATS almacene en la variables % los resultados correspondientes. 1.3309e-003 8.6921e-004

632.3097 -0.4218 -5.0269

0.0459

44

;* no se muestran los elementos de arriba de la diagonal, pues esta matriz es simtrica. com var = %SEESQ * %XX ;* calcula la matriz de varianzas y covarianzas de los coeficientes, almacenando el resultado en la matriz var. wri var ;* muestra el contenido de la matriz var. Generalmente interesan solamente los elementos de la diagonal, es decir las varianzas y no las covarianzas. -858.4142 2.7086 1.7689 -10230.3716 1.7689 93.3140

1286821.4188 -858.4142 -10230.3716

com errst2 = (var(2,2))**0.5 ; almacena en errst2 el error estndar (desviacin estndar) del segundo coeficiente. dis errst2 ;* muestra el resultado 1.64577

;* es ilustrativo comparar este resultado con un segmento de lo obtenido en la salida de la regresin anterior en RATS: Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -489.813301 1134.381514 -0.43179 0.67605439 2. IMACEC -2.967603 1.645773 -1.80317 0.10486361 3. IPC 16.834478 9.659915 1.74271 0.11535790 ;* en negrilla aparece el resultado, que corresponde exactamente a lo obtenido anteriormente paso a paso.

2.4.2. OPCIONES DE LINREG


Existe un nmero de opciones tiles en RATS al momento de correr regresiones lineales con LINREG. [PRINT]/NOPRINT : Hace todos los clculos almacenando la informacin relevante en las variables %, pero sin mostrar automticamente la salida estndar de la regresin en pantalla. : Muestra la matriz de varianzas / correlacin de los coeficientes estimados.

VCV/[NOVCV] Ejemplo:

linreg(noprint,vcv) desempleo # constant imacec ipc Covariance\Correlation Matrix of Coefficients Constant IMACEC IPC Constant 1286821.41883 -0.4597988792 -0.9335959599 IMACEC -858.41420 2.70857 0.1112678923 IPC -10230.37158 1.76894 93.31396 ;* la matriz de varianzas / correlacin debe leerse de modo que los elementos sobre la diagonal son la correlacin entre los coeficientes estimados, los

45

elementos en la diagonal son las varianzas, y los elementos bajo la diagonal son las covarianzas.

SMPL

: Define el rango sobre el cual se quiere correr la regresin, usando una variable dummy que contiene el valor 0 para las observaciones que quieren ser omitidas. set dum set dum 2000:01 2000:07 2000:06 = 1 2000:12 = 0

Ejemplo:

;* creamos una variable con 1 y 0 segn el rango establecido

print / imacec dum ENTRY 2000:01 2000:02 2000:03 2000:04 2000:05 2000:06 2000:07 2000:08 2000:09 2000:10 2000:11 2000:12

;* visualizamos la nueva serie junto al IMACEC DUM 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 ;* corre la regresin solamente para el periodo en el cual la variable dum=1.

IMACEC 254.40000000000 243.20000000000 267.40000000000 244.10000000000 249.00000000000 244.30000000000 242.00000000000 243.50000000000 235.20000000000 254.90000000000 252.30000000000 250.50000000000

linreg(smpl=dum) desempleo # constant imacec ipc

;* usted puede verificar que el procedimiento anterior es equivalente a correr la regresin para el subperiodo 2000:01 2000:0616

DFC:

Correccin de Grados de Libertad (degree of freedom correction). Son los grados de libertad perdidos en la variable dependiente en el procesamiento previo, es decir, cuando se regresionan residuos de una primera regresin como variable dependiente de una segunda regresin, los errores estndar de los coeficientes sern subestimados porque la primera regresin extrajo algunos grados de libertad. DFC debe ser igual al nmero de regresores en la 1 regresin, menos el nmero de regresores que son repetidos en la 2 regresin. LINREG Y / errores # CONSTANT X1 X2 X3 ;* el primer modelo requiere estimar 4 parmetros, y los errores del modelo son almacenados en la serie errores. LINREG(dfc=4) errores ;* la segunda regresin requiere usar la serie errores como variable dependiente, sin embargo ya se han perdido 4 grados de libertad al estimar los errores, los que deben ser considerados en la segunda regresin. # CONSTANT X5 X6

Ejemplo:

EQUATION:

Estima ecuaciones que han sido creadas previamente con la instruccin EQUATION.

16

linreg desempleo 2000:01 2000:06 # constant imacec ipc

46

Ejemplo:

EQUATION ecuacion1 desempleo # constant imacec ipc ;* almacena en ecuacion1 la regresin del ejemplo del desempleo, imacec e ipc. linreg(equ=ecuacion1) ;* permite obtener el resultado de una regresin lineal de la ecuacin almacenada en ecuacion1.

DEFINE y FRML: Crean respectivamente una ecuacin y una frmula (ms general que una ecuacin) con la informacin de LINREG para ser usada posteriormente, por ejemplo para prediccin17. UNRAVEL/[NOUNRAVEL]: Junto con ENCODE implementa Mnimos Cuadrados Restringidos para rezagos distribuidos, tales como los polinomiales18. CMOM: Es usada en soluciones a la multicolinealidad, tales como los estimadores de Ridge y Mixtos.

Existen dos grupos adicionales de opciones relacionadas con CREATE y ROBUSTERRORS, las que comentaremos ms adelante, incluyendo las opciones INSTRUMENTS y WMATRIX.

2.5. INTERPRETACION DE LOS COEFICIENTES DE REGRESION


2.5.1. INTRODUCCION
Cuando se plantea un modelo de regresin lineal, como por ejemplo:

Yt = 0 + 1 X 1 + 2 X t + et
los coeficientes de pendientes de sta regresin miden el efecto parcial de X1 sobre Y y de X2 sobre Y, es decir las derivadas parciales de Y respecto a X1 y X2 respectivamente. As, la interpretacin de los coeficientes es a veces confusa, puesto que se debe tener muy claro como son medidas las variables. Vemoslo a travs de un ejemplo: Ejemplo: Se dispone de la empresas durante utilizado (monto usado (en nmero informacin de la produccin mensual (en kilogramos) de 10 el mes pasado, y se cree que la produccin depende del capital de deuda de la empresa, en millones de pesos) y del trabajo de personas contratadas), segn la siguiente tabla de datos:

all 10 data(unit=input, org=obs) / EMPRESA 1 8 23 106 2 9 14 81 3 4 38 72 4 2 97 57 5 6 11 66 6 6 43 98 7 3 93 82 8 6 49 99


17

CAPITAL

TRABAJO PRODUCCION

Mtodos de prediccin implementados en RATS son: univariados (suavizamiento exponencial, Box-Jenkins, tcnicas espectrales) y multivariados (VAR y ecuaciones simultneas). 18 Una instruccin ms comn es RESTRICT, la que impone restricciones despus de estimar un modelo no restringido, tal como en una funcin de Cobb-Douglas.

47

9 10

8 4

36 43

110 118

linreg produccion # constant capital trabajo ... (omitimos parte de la salida) Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 56.200941579 43.703865736 1.28595 0.23936141 2. CAPITAL 4.873711127 4.974703122 0.97970 0.35987273 3. TRABAJO 0.120945774 0.392826007 0.30789 0.76712795 ;* aqu la interpretacin de los coeficientes es: a) Constante: Si no se utiliza capital ni trabajo, la produccin ser de 56.20 kilogramos mensuales. b) CAPITAL: Por cada milln de pesos adicional en deuda, se esperan producir 4.87 kilogramos mensuales. c) TRABAJO: Por cada persona contratada adicionalmente, se espera que la produccin mensual aumente en 0.12 kilogramos.

Existen otras especificaciones similares a la lineal anterior, pero que llevan a una interpretacin distinta de los coeficientes, tal como veremos a continuacin.

2.5.2. FORMA DOBLE LOGARITMICA


Corresponde a una especificacin (lineal) en que tanto la variable dependiente como las variables independientes estn expresadas como logaritmos naturales. Ejemplo:

LN (Yt ) = 0 + 1 LN ( X 1 ) + 2 LN ( X t ) + et

;* es una especificacin doble log

La propiedad ms importante de esta especificacin es que los coeficientes pueden interpretarse como elasticidades. En efecto, la interpretacin de los coeficientes 1 es:

1 =

d ln Y d ln X 1

puesto que, por ejemplo, la elasticidad precio de la demanda puede escribirse como:

dQ Elasticidad = dP

Q P

d ln Q d ln P

donde Q es la funcin de demanda Q(P), y P el precio. Esta especificacin es entonces til para calcular elasticidades precio, elasticidades ingreso, elasticidades cruzadas, etctera, de acuerdo a las variables involucradas en el modelo.

48

2.5.3 MODELO LOGARTMICO LINEAL (DE CRECIMIENTO CONSTANTE)


Cuando se tiene una especificacin Log-Lineal, la interpretacin del coeficiente relevante es la de la tasa de crecimiento constante de la variable asociada. Ejemplo:

ln Y = 0 + 1 X

;* un modelo lineal simple en forma log-lin.

La interpretacin del coeficiente en este caso es:

dY d ln Y = Y 1 = dX dX
El numerador corresponde al cambio porcentual de Y (dado por dY/Y), mientras que el denominador es el cambio (muy pequeo) en X. Si por simplicidad X es una medida de tiempo o tendencia, entonces la interpretacin de es el cambio porcentual en Y ante un pequeo periodo de tiempo. Note que si <0, se tratar de la tasa de disminucin en Y. Ejemplo: En el caso del desempleo, estimemos la tasa de crecimiento (mensual) del desempleo: set tend = T ;* crea una serie de tendencia desde 1 hasta 12, que indicara el tiempo. set logdes = log(desempleo) ;* creamos la serie logdes que ser la nueva variable dependiente. linreg(noprint) logdes # constant tend dis %Beta(2) 0.01518 ;* el crecimiento mensual promedio del desempleo en el periodo fue de 1.518%.

2.5.4. OTRA VISION DE LOS COEFICIENTES DE PENDIENTE


Puede mostrarse que cada coeficiente en una regresin lineal puede calcularse como:

i =

Cov ( X i , Y ) ( X i , Y ) ( X i ) (Y ) ( X i , Y ) (Y ) = = Var ( X i ) Var ( X i ) (Xi )

es decir la covarianza entre Xi e Y dividido por la varianza de la variable Xi, o alternativamente, el coeficiente de correlacin entre Xi e Y, multiplicado por la desviacin estndar de Y y dividido por la desviacin estndar de Xi. La interpretacin de este resultado es que la covarianza (o el coeficiente de correlacin) justamente intentan obtener el efecto neto entre Xi e Y, eliminando el efecto de otras variables sobre Y, puesto que esta efecto ser obtenido en el beta correspondiente a esa variable. El otro aspecto importante es que si la correlacin entre Xi e Y fuera cercana a 1.0, y las desviaciones estndar de Xi y de Y son similares, entonces esperamos una pendiente cercana a 1.0 (i=1.0). Por ltimo, puede notarse que el valor de este coeficiente i estar afectado por las unidades de medida de Xi e Y, lo que se reflejar en sus respectivas desviaciones estndar. Ahora mostraremos a travs de un ejemplo que los coeficientes de una regresin mltiple pueden escribirse como la covarianza dividida por la varianza, en el caso que las variables X1 y X2 no estn correlacionadas, es decir:

49

Y = 0 +

Cov ( X 1 , Y ) Cov ( X 2 , Y ) X1 + X2 + Var ( X 1 ) Var ( X 2 )

Ejemplo:

ALL 10 ;* supongamos 3 series de 10 observaciones. DATA(UNIT=INPUT, ORG=OBS) / y x1 x2 30 8 5.912195121951 27 9 6.365853658537 29 9 8.365853658537 39 8 11.912195121951 35 10 12.819512195122 38 15 8.087804878049 37 12 11.726829268293 40 11 16.273170731707 48 17 8.995121951220 55 16 9.541463414634 vcv(print,center) # y x1 x2 ;* la correlacin (y la covarianza) entre X1 y X2 es cero.

Covariance\Correlation Matrix Y X1 Y 66.9600000 0.7977680349 X1 20.9000000 10.2500000 X2 7.3814634 2.4948932e-013 dis 20.9/10.2500000 2.03902 dis 7.3814634/9.1404878 0.80756 linreg y

X2 0.2983665017 0.0000000000 9.1404878

;* calculamos el primer coeficiente de pendiente

;* calculamos el segundo coeficiente de pendiente

;* verificamos a travs de una regresin mltiple el valor de los coeficientes de pendientes estimados anteriormente.

#constant x1 x2 ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 6.2756511484 8.0772663658 0.77695 0.46262945 2. X1 2.0390243902 0.5061770221 4.02828 0.00500669 3. X2 0.8075568364 0.5360183683 1.50658 0.17564288

50

Otro aspecto importante referido a la interpretacin de los coeficientes de pendientes, y relacionado con lo anterior, es que stos corresponden a la relacin entre cada variable Xi con Y, una vez que se ha eliminado el efecto de las dems series X sobre Xi. Veamos esto a travs de un ejemplo:

Ejemplo:

Se tiene informacin de 30 empresas respecto a una funcin de produccin COBBDOUGLAS simple, en que el producto (Q) es explicado por el capital (K) y el trabajo (L): ALLOCATE 30 DATA(unit=input,ORG=OBS)

/ L K Q

... Ver datos en Tabla 2 del Anexo al final del libro SET LQ = LOG(Q) SET LL = LOG(L) SET LK = LOG(K) ;* calculamos los logaritmos de cada serie

LINREG LQ # CONSTANT LL LK ... ;* omitimos parte de la salida Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 0.4248677184 0.1377981975 3.08326 0.00468027 2. LL 0.7358252943 0.0657905407 11.18436 0.00000000 3. LK 0.9490111531 0.0629012650 15.08731 0.00000000 ;* el coeficiente de LL (1) es 0.7358252943. ;* Verifiquemos que ste coeficiente puede obtenerse con regresiones separadas: LINREG LL / W # CONSTANT LK ;* la variable dependiente es LL y guardamos los residuos en W

W son los residuos de esta regresin, y corresponden a la informacin que queda en LL despus de eliminar lo explicado por LK. De otro modo, W es la parte de LL que esta libre del efecto de LK, es decir el contenido de informacin neto de LL.

LINREG LQ # CONSTANT W ;* la pendiente de esta regresin captura en que medida W (el contenido de informacin neto de LL) explica LQ. ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -1.532676493 0.212991293 -7.19596 0.00000008 2. W 0.735825294 0.178276664 4.12743 0.00029831 Obtenemos el mismo coeficiente 1=0.735825294, con lo cual verificamos que basta solo 1 regresin mltiple para esto, y no es necesario efectuar varias estimaciones para eliminar el ruido, o contenido de LK en LL.

2.6 RESUMEN: UNA CRTICA AL MODELO

51

Para terminar este captulo recordemos que en la implementacin del mtodo de los MCO se ha supuesto: a) Que se trata de un modelo lineal en los parmetros: Este supuesto puede no ser aplicable en muchos modelos, sin embargo en muchos otros es vlido, por lo tanto es una misin del analista determinar si el supuesto es aplicable o no. Cuando no es posible trabajar bajo este supuesto (cuando tampoco es posible linealizar el modelo), entonces seguramente se requerirn mtodos de regresin no lineales, los que veremos ms adelante. b) Que las X son fijas o no estocsticas: El cumplimiento de este supuesto es de importancia extrema en el anlisis de regresin, por cuanto de no cumplirse, y exista relacin entre las series X y los errores, se tendrn estimadores sesgados de los verdaderos coeficientes, lo que es extremadamente grave. Sin embargo en muchos casos es posible que los X no sean fijos (es decir sean estocsticos) y an estn no correlacionados con los errores. Este aspecto lo veremos ms adelante en el tpico regresores estocsticos (variables instrumentales). c) Que X contiene el conjunto correcto de variables explicatorias: En efecto, se supone que el modelo est bien especificado, es decir no faltan ni sobran variables explicativas. En general es ms grave omitir variables que incluir variables en exceso, puesto que si la variable omitida est correlacionada con la variable presente en el modelo, la variable omitida estar reflejada en el error (), de modo que existir correlacin entre el error y la variable presente, implicando sesgo. Esto no ocurrir en el caso de sobreespecificacin, aunque los coeficientes sern en general ineficientes respecto de aquellos estimados bajo una correcta especificacin. d) Que Y es medido sin error: Puesto que en general Y es la variable estocstica del modelo de regresin (adems del error, ), se espera que ste sea una realizacin insesgada de un correcto procedimiento de muestreo, cuestin que debe ser considerada por el analista. No mencionamos preocupacin respecto a las series X, pues se suponen fijas, o controladas por el investigador. e) Que es bien comportado: En efecto, suponemos que stos estn libres de autocorrelacin y heterocedasticidad, lo que asegura estimadores MELI, o MEI en el caso del modelo bajo el supuesto de normalidad. Este supuesto es levantado ms adelante. f) Que los parmetros son fijos (estables): Cuando estimamos un modelo de regresin para un determinado periodo, implcitamente se asumen que los verdaderos parmetros son constantes para todo el periodo, es decir, si se subdivide el periodo total en 2 subperiodos y se efecta nuevamente la estimacin en cada subperiodo, esperamos que los coeficientes de pendientes de ambas regresiones sean bsicamente los mismos, lo que en la prctica puede no ser verdadero. Las pruebas para la estabilidad de los parmetros es mostrada en el siguiente captulo.

52

CAPITULO 3 MINIMOS CUADRADOS RESTRINGIDOS

3.1. MCO CON ERRORES NORMALES


Recordemos que en el captulo anterior sealamos que las condiciones ideales para la implementacin de los estimadores MCO incluyen: las perturbaciones son esfricas, es decir, errores independientes e idnticamente distribuidos con media 0 y varianza 2, de modo que E['] = 2I, lo que implica homocedasticidad y ausencia de autocorrelacin serial, los regresores son fijos (las variables X son no estocsticas), los errores tienen una distribucin desconocida. Cumplindose estas condiciones, puede mostrarse por el teorema de Gauss-Markov que el estimador de MCO, b, es MELI (es decir, el mejor estimador insesgado de entre la clase de los estimadores lineales de ), y que tena una distribucin no precisada (hasta ahora) con una media y varianza que inclua, entre sus componentes, el comportamiento de los errores (). Para efectos de implementar procedimientos de inferencia estadstica acerca de los coeficientes es necesario conocer la distribucin de stos. El caso ms simple es asumir que los errores se comportan de acuerdo a una distribucin normal. En este caso los coeficientes b se distribuirn tambin normalmente, puesto que stos son una combinacin lineal de un error distribuido normalmente (puesto que las variables X estn fijas). Es decir:

b Normal + ( X ' X ) 1 X ' E ( ) , ( X ' X ) 1 X ' E ( ' ) X ( X ' X ) 1

Si en adicin, los errores estn bien comportados, los coeficientes b se distribuyen normalmente:

b Normal , 2 ( X ' X ) 1

As, bajo este resultado es posible implementar un nmero de pruebas de inferencia estadstica, incluyendo pruebas F, y adems se justifica la aplicacin del mtodo de mxima verosimilitud, aunque en este caso si bien b es insesgado, s2 no lo es en pequeas muestras. Como resultado adicional puede mostrarse19 que al incorporar el supuesto de errores normales el estimador b es el ptimo (suficiente), es decir el mejor estimador insesgado (MEI) incluyendo la clase de los estimadores no lineales, de modo que no existe un mejor estimador posible que el de MCO. Este es un resultado ms poderoso que el obtenido bajo ausencia de normalidad (estimadores MELI). Respecto a s2, en este caso tambin es ptimo.

19

Vase seccin 6.1.3e en Judge et al.

53

3.2. DISTRIBUCIONES DE PROBABILIDAD


En econometra, para efectos de inferencia acerca de los coeficientes estimados, es necesario trabajar con un nmero de distribuciones de probabilidad. A continuacin recordamos las ms importantes: la distribucin Normal, Chi-cuadrado, t y F. La siguiente es la funcin de densidad normal para una variable aleatoria X con una distribucin normal con media y varianzas 2:

f (x / , 2 ) =

1 1 SCErrt EXP 2 2 2

donde SCErr representa la suma cuadrada de errores, es decir de desviaciones respecto a la media. Cuando se tienen n variables aleatorias normales Z distribuidas independiente e idnticamente, entonces la distribucin conjunta multivariada con media y matriz de covarianza20 es:

g ( x ) = 2 n / 2

1/ 2

1 EXP ( x )' 1 ( x ) 2

Si Z es una variable aleatoria normal estndar (

Z N (0,1) ), entonces puede mostrarse que:

1)

t (r ) =

2 (r )
r

Es decir, una variable aleatoria normal estndar dividida por la raz cuadrada de una variable aleatoria chi cuadrada con r grados de libertad dividida por r, se distribuye como una t con r grados de libertad (gl).

2 (r1)
2)

F (r1, r 2) =

r1 ( r 2)
2

r2
Es decir, una variable F con r1 gl en el numerador y r2 gl en el denominador corresponde a una chi-cuadrada con r1 gl dividida por r1, dividida por otra chi-cuadrada con r2 gl dividida por r2. 3)

Z2

(1)

Es decir, una variable aleatoria normal estndar al cuadrado se distribuye chi-cuadrado con 1 grado de libertad. 4)

Z 12 + Z 22 + ... + Z n2

( n)

20

No confundir el smbolo de la matriz de covarianza , con el operador de sumatorias.

54

Es decir, la suma de n variables aleatorias normales estndar al cuadrado se distribuye chicuadrado con n grados de libertad. Este resultado puede generalizarse cuando se trata de variables normales no estandarizadas

X N ( , ) :

( X )' 1 ( X ) 2 ( n)

3.3. POTENCIA DE UN TEST Y SIGNIFICANCIA


Hay dos formas en que un test nos puede llevar a cometer un error: Error del tipo I: Rechazar Ho cuando es verdadera, y Error del tipo II: No rechazar Ho cuando es Falsa.

El punto es que en la prctica no es posible hacer ambos errores arbitrariamente pequeos, pues reduciendo la probabilidad de cometer un error aumenta la probabilidad de cometer el otro error. Sin embargo es ms grave el Error del tipo I que el Error del tipo II: es peor condenar a una persona inocente que dejar libre a un culpable, y por este motivo se trata que la magnitud del error del tipo I sea fijado usualmente a un valor pequeo, es decir queda bajo control del analista: Error tipo I : Rechazar Ho cuando es verdadera (gravsimo) Error tipo II: No rechazar Ho cuando es Falsa (grave) P(Error tipo I) = = Tamao del test (size) o nivel de significancia. P(Error tipo II) =

La forma de medir la calidad de un test estadstico es a travs de su potencia. La Potencia (power) de un test es la probabilidad de que correctamente rechacemos Ho cuando es falsa (la probabilidad de detectar que Ho es falsa).

Potencia = 1 = 1 P( Error tipo II )


Un test perfecto tendr una potencia de 1.0, pues siempre llevar a una decisin correcta. Esto puede lograrse, para un nivel dado de significancia, cuando el tamao de la muestra aumenta (a infinito). As, la evaluacin de un buen test debe hacerse en base a su funcin de potencia. En general el procedimiento ptimo es seleccionar con anticipacin el tamao mximo del error del tipo I que podemos aceptar, y despus se intenta construir una prueba que minimice el tamao del error del tipo II. Cuando Ho es falsa, la potencia puede ser calculada asumiendo varios valores crticos para el parmetro desconocido.

3.3.1. APLICACIN: SELECCIN ENTRE TESTS ALTERNATIVOS


En el siguiente ejemplo =1.4 (desviacin estndar), T=25 (nmero de observaciones); y se desea probar la hiptesis Ho:=10 versus H1:>10. Asumiendo que se desea un tamao de error () de hasta 0.06, escogeremos entre 3 distintas regiones crticas a una cola, sabiendo que las medias muestrales son: Prueba A: 10.65, Prueba B: 10.45 y Prueba C: 10.25. Para las diferentes medias muestrales verificamos el cumplimiento del tamao del test requerido: P(Error Tipo I)==Tamao del test A P[z> (10.65-10)/0.2821]=P[z>2.32]=0.0102 B P[z> (10.45-10)/0.28]=P[z>1.61]=0.0537
21

Recuerde que el eror estndar para la media en este caso se 1.4/(25)**0.5=0.28

55

P[z> (10.25-10)/0.28]=P[z>0.89]=0.1867 (no cumple)

Repitiendo para diferentes valores supuestos de calculamos la potencia del test: =10.4 =10.2 =11.0 P(Error Tipo II) con =10.4 Potencia Potencia Potencia A P[z> (10.65-10.4)/0.28]=P[z0.89]=0.8133 0.05 0.89 0.19 0.43 0.98 B P[z> (10.45-10.4)/0.28]=P[z0.18]=0.5714 0.19 Luego: Al aumentar el tamao del error del tipo I de 0.0102 a 0.0537, el error del tipo II disminuye de 0.8133 a 0.5714, y viceversa (no es posible eliminar ambos errores). Puesto que puede tolerarse un error del tipo I de 0.06, entonces la prueba B es mejor que la A, debido a que su potencia es mayor para distintos valores de . El anlisis de potencia permite determinar el tamao muestral apropiado para cumplir ciertos niveles predefinidos de y .

3.3.2. EL NIVEL DE SIGNIFICANCIA MARGINAL: CDF O P-VALUE


Hemos dicho anteriormente que la magnitud del error del tipo I queda bajo el control del analista, quien lo fija en un valor relativamente pequeo, usualmente 5%. As, la probabilidad de cometer un error del tipo I es justamente el Nivel de Significancia Marginal (NSM), lo que es reportado es RATS con la instruccin CDF. Decimos que un resultado es estadsticamente significativo cuando el NSM es menor que el nivel deseado (generalmente 5%), es decir se tiene suficiente evidencia para rechazar Ho. Si es mayor, entonces es estadsticamente no significativo (no podemos rechazar Ho). Es decir, bajos niveles de P llevan a rechazar Ho. La instruccin CDF calcula el nivel de significancia marginal de un estadstico para cualquiera de las siguientes distribuciones de probabilidad: NORMAL, F, T CHI-2, dados los grados de libertad apropiados, es decir, permite evaluar un test. La estructura de la instruccin es la siguiente: CDF distribucin estadstico gl_1 gl_2

donde los parmetros son: Distribucin: que corresponde a FTEST (para el test F), TTEST (para el test t), CHISQ (para el test chi cuadrado), o NORMAL (para el test sobre la distrbucin normal). Estadstico: es el valor calculado del test (un nmero real) gl_1 son los grados de libertad para los test TTEST y CHISQ, o el nmero de grados de libertad en el numerador de un FTEST. Finalmente gl_2 se usa para indicar el nmero de grados de libertad en el denominador de un FTEST. CDF NORMAL 1.5 Normal Statistic = 1.500000 with Significance Level 0.13361440

Ejemplo:

;* indica que es posible rechazar la hiptesis nula si admitimos un error total de 13.36%, es decir 6.681% en cada cola de la distribucin.

CDF TTEST 1.724 20 t(20)= 1.724000 with Significance Level 0.10013205

;* indica que es posible rechazar la hiptesis nula si admitimos un error total de 10.0%, es decir 5% en cada cola de la distribucin t.

56

CDF CHISQ 24.98 15 Chi-Squared(15)= 24.980000 with Significance Level 0.05021268

;* indica que es posible rechazar la hiptesis nula si admitimos un error total de 5%. Note que el anlisis aqu es solamente a 1 cola, la derecha. CDF FTEST 3.1 2 18 F(2,18)= 3.10000 with Significance Level 0.06968098

;* indica que al si admitimos un error de hasta un 5% no es posible rechazar la hiptesis nula. Aqu tambin trabajamos solamente a 1 cola, la derecha. DIS %CDF(1.5) 0.93319 ;* muestra que la probabilidad acumulada hasta 1.5 en una distribucin normal estndar es 0.93319, es decir a la derecha de 1.5 se encuentra una probabilidad de 1-0.93319=0.06681.

3.4. PRUEBAS SOBRE UN COEFICIENTE


Cuando los errores estn bien comportados la prueba de hiptesis para un coeficiente b en un modelo de regresin lineal involucra la prueba t, es decir:

t=

2 ( X ' X ) 1

t (T K )

donde Ho: la restriccin es verdadera. Ntese que el denominador corresponde a la desviacin estndar (error estndar) del coeficiente sobre el cual se est haciendo la prueba. La hiptesis ser rechazada cuando t calculado sea mayor, en valor absoluto, que el t de tabla. En este caso, el t de tabla es t(9) al 0.05 = 2.262. Puesto que para un nmero de grados de libertad mayor a 30 el valor t de tabla al 5% es cercano a 2.0 1.96 para T-K muy grande, en muchos por simplicidad casos se acepta 1.96 como t crtico. Veamos que para el caso en que Ho: i=0, esta prueba es reportada automticamente en RATS.

Ejemplo:

Para el ejemplo anterior del IMACEC, desempleo e IPC (Tabla 1 en Anexo al final del libro), la salida de RATS es: Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -489.813301 1134.381514 -0.43179 0.67605439 2. IMACEC -2.967603 1.645773 -1.80317 0.10486361 3. IPC 16.834478 9.659915 1.74271 0.11535790

57

;* Si se desea probar las siguientes hiptesis: a) Ho: el intercepto (constante) = 0 La prueba estadstica respectiva es una t: t = Abs((489.81-0)/1134.38)=0.43179 < 2.262, y no se rechaza Ho (no hay evidencia suficiente para rechazar Ho). El resultado de esta prueba es mostrado en la salida de la regresin de RATS. La conclusin tambin puede obtenerse con la significancia reportada, pues esta es mayor que 0.05 (es 0.67). b) Ho: El coeficiente de IMACEC = 0 t = Abs((2.9676-0)/1.64577)=1.80317 < 2.262, no se rechaza Ho. c) Ho: El coeficiente de IPC = 0 t = Abs((16.83-0)/9.6599)=1.74 < 2.262, no se rechaza Ho.

3.5. TRES TESTS EQUIVALENTES


Cuando se hacen pruebas que involucran a 2 o ms coeficientes simultneamente, entonces debe usarse otro tipo de pruebas. Los 3 tests que veremos son el test de razn de verosimilitud (Likelihood ratio, LR por Neyman y Pearson en 1928), el test de WALD (W, por A. Wald en 1943) y el test de los multiplicadores de Lagrange (LM, por C. Rao en 1948). Para desarrollarlos en forma simple, a continuacin supongamos que se desea probar un nmero de hiptesis lineales referidas a los coeficientes de un modelo de regresin lineal mltiple. Puede mostrarse que en este caso los 3 tests entregarn un resultado idntico, todos en trminos de una distribucin del tipo F conocida. Cuando se trabaja con modelos no lineales, o con sistemas de ecuaciones, solamente pueden obtenerse resultados asintticos, de modo que los tres tests generalmente entregan resultados diferentes, y en estos casos la distribucin general es una del tipo Chi-cuadrado. En cualquier caso se cumplir que:

W LR LM

3.5.1. TEST DE RAZON DE VEROSIMILITUD22 (LR)


Esta prueba de hiptesis compara el valor de la funcin de verosimilitud del modelo no restringido con el valor de la funcin del modelo restringido, pues Ho puede ser vista como restringiendo el conjunto de posibles valores de los parmetros, lo que a su vez restringe el valor mximo de la funcin de verosimilitud. Al comparar las estimaciones restringida y sin restringir, y si las dos fueran cercanas, se apoya Ho, es decir Ho es verdadera, con lo cual debe ser cercano a 1, es decir:

Max L restringido Max L no restringido

donde Max L restringido es la funcin mxima verosimilitud del modelo restringido, y Max L no restringido es la funcin de mxima verosimilitud del modelo no restringido.

22

Es decir, Likelihood Ratio Test.

58

A efectos de implementacin de la prueba estadstica, puede mostrarse que:

LR = 2 ln 2 ( J )
donde J es el nmero de hiptesis o restricciones. Ntese que para implementar esta prueba se requiere estimar tanto el modelo sin restringir como el modelo restringido. Esto puede ser difcil de hacer por ejemplo en sistemas ecuaciones, a partir de lo cual surgen las alternativas del test de Wald y del Multiplicador de Lagrange.

3.5.2. LR BAJO ESPECIFICACION LINEAL-LINEAL


Cuando tanto las restricciones como el modelo de regresin son lineales (lineal-lineal), entonces la maximizacin de la funcin de verosimilitud entrega los mismos estimadores que la minimizacin de la suma cuadrada de errores, de modo que puede rescribirse como:

SCErr Restringidos SCErr No Restringidos

sin embargo sta no tiene una distribucin exacta conocida, aunque con una modificacin leve se puede llegar a una distribucin que se sabe es F:

(SCErr Restr SCErr no Restr )


F= SCErr no Restr T K

m F(m,T K)

donde Rrss es la suma cuadrada de errores restringida Urss es la suma cuadrada de errores no restringida m es el numero de restricciones

Ejemplo:

Si en el ejemplo del IMACEC, desempleo e IPC queremos probar la hiptesis conjunta que:

Ho : 1 2 = 1.0
Entonces:

2 = 0

;* se trata de 2 restricciones conjuntas

a) Modelo no restringido:

Yt = 0 + 1 X 1 + 2 X t + t ,

correr este modelo y

guardar la SCErrores (no restringido) con los grados de libertad. linreg(noprint) desempleo # constant imacec ipc com scerr_nr = %RSS ;* guardando la suma cuadrada de errores com gl_nr = %ndf ;* guardando los grados de libertad

b) Modelo Restringido : Implica reescribir el modelo asumiendo que la hiptesis se cumple, es decir:

59

Y = 0 + (1 + 2 ) X 1 + 2 X 2 Y = 0 + (1 + 0) X 1 + 0 X 2 Y X1 = 0
se debe correr este modelo y guardar la SCErrores (restringido) con sus grados de libertad. set yx2 = desempleo ipc ;* creando la variable dependiente de la regresin restringida (Y-X1) linreg(noprint) yx2 # constant com scerr_r = %RSS ;* guardando la suma cuadrada de errores restringidos com gl_r = %ndf

;* as, de acuerdo a la expresin F anterior, tenemos que: com m = 2.0 com efe = ((SCErr_r-SCErr_nr)/m) / (SCErr_nr/gl_nr) dis efe 4.95326 cdf ftest efe m gl_nr F(2,9)= ;* calculando la significancia del test.

;* el test F

4.95326 with Significance Level 0.03542733

;* en conclusin la hiptesis puede ser rechazada con un 3.5% de error a travs del LR test.

3.5.3. TEST DE WALD


Este es el test ms popular, pues segn el caso, puede ser el ms simple de calcular. Se basa en una de las relaciones entre variables normales y la Chi cuadrado vista anteriormente, es decir:

(b )' 1 (b ) 2 ( n)
Mientras mayor sea la diferencia entre el valor de los coeficientes estimados b y el valor de los coeficientes poblacionales hipotetizados (), mayor ser el valor calculado de la prueba, lo que incidir en que puede ser rechazada la hiptesis de igualdad con ms fuerza. Para el caso de que las restricciones (hiptesis) sean combinaciones lineales de los coeficientes (sin importar el tipo de modelo subyacente), siempre podrn escribirse como:

R = r
donde R es una matriz mxk con m el nmero de restricciones y k el nmero de parmetros del modelo, es un vector de Kx1, y r es un vector de Qx1 conteniendo los coeficientes de la derecha de las hiptesis. Ejemplo: La hiptesis Ho : 1 escribirse como:

2 = 1.0

2 = 0

en el ejemplo anterior puede

1 1 1 1.0 0 1 = 0.0 , 2

es decir

1 1 R= 0 1

1.0 r= 0.0

60

As, la expresin general para restricciones lineales del test de Wald es:

(r R )' [R X R'](r R ) 2 (n)


donde X es la matriz de varianzas y covarianzas de los coeficientes que ha sido estimada. Ntese que en el caso del test de Wald solo se requiere estimar el modelo no restringido, es decir solamente conocer los coeficientes b. Este aspecto es de gran utilidad prctica por lo que la mayora del los programas computacionales especializados automticamente implementarn un test de Wald para el caso lineal-lineal.

3.5.4. WALD BAJO ESPECIFICACION LINEAL-LINEAL


En el caso particular que tanto el modelo como las restricciones sean lineales, puede mostrarse que el test de Wald se comporta con una distribucin F del siguiente modo:

( b)' R ' [R( X ' X ) 1 R '] R( b) F (m, T K ) m 2


1

La implementacin en RATS del test de WALD es sencilla con la instruccin RESTRICT, cuya estructura es la siguiente: RESTRICT restrictions residuals coeffs # lista de coeficientes (el nmero de los coeficientes involucrados en la hiptesis) # Ponderaciones de cada coeficiente seguidos por el valor del lado derecho de la hiptesis donde: restrictions indica el nmero de restricciones lineales residuals para indicar una serie en la que se almacenaran los nuevos residuos coeffs para una serie de nuevos coeficientes

Ejemplo:

Para probar la hiptesis RESTRICT 2 # 2 3 # 1.0 -1.0 1.0 # 3 # 1.0 0.0 F(2,9)=

Ho : 1 2 = 1.0

2 = 0

simultneamente:

;* se trata de 2 restricciones simultneas ;* las primera hiptesis afecta al 2 y 3 coeficientes ;* 1 vez el 2coef. menos 1 vez el 3 coef. es iguala a 1.0 ;* la segunda hiptesis afecta al 3 coeficiente ; una vez el 3 coeficiente debe ser igual a cero.

4.95326 with Significance Level 0.03542733

;* el resultado del test es el mismo que bajo la razn de verosimilitud visto anteriormente, y en ambos la hiptesis es rechazada con la misma significancia.

Otras pruebas especficas de RATS a travs del test de WALD son TEST, EXCLUDE y MRESTRICT, sin embargo por ahora solo nos interesa RESTRICT.

61

3.5.5. TEST DEL MULTIPLICADOR DE LAGRANGE


Este test, a diferencia de los anteriores, solamente requiere conocer la estimacin del modelo restringido, por lo que es til cuando el modelo original es relativamente complejo y la hiptesis nula es por ejemplo que todos los coeficientes son simultneamente iguales a cero, pues el modelo restringido es sencillo de calcular. El test del multiplicador de Lagrange es til bajo el resultado de Engle (1982) quien muestra que para un tamao de muestra grande, entonces asintticamente:

T R2
donde m es el nmero de restricciones.

2 (m)

Este resultado ser particularmente til ms adelante en varias pruebas de deteccin de heterocedasticidad y autocorrelacin (vase captulo 4).

3.5.6. EQUIVALENCIA BAJO ESPECIFICACION LINEAL-LINEAL


Para terminar, notemos que cuando se trabaja evaluando hiptesis lineales sobre el modelo lineal general, entonces puede mostrarse que los tres son idnticos, es decir:

W = LR = LM

3.6. EJERCICIOS MATRICIALES DEL TEST DE WALD


Veamos el siguiente ejemplo numrico a fin de verificar distintos clculos del test de Wald, lo que ser ilustrativo: Ejemplo: ALL 9 DATA(UNIT=INPUT,ORG=OBS) / y x2 x3 100 100 100 106 104 99 107 106 110 120 111 126 110 111 113 116 115 103 123 120 102 133 124 103 137 126 98 TABLE Series Y X2 X3 linreg y # constant x2 x3 ... Obs Mean 9 116.888888889 9 113.000000000 9 106.000000000 Std Error Minimum Maximum 12.554326390 100.000000000 137.000000000 9.013878189 100.000000000 126.000000000 9.000000000 98.000000000 126.000000000

62

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -49.34133898 24.06088696 -2.05069 0.08616009 2. X2 1.36423789 0.14315290 9.52994 0.00007617 3. X3 0.11388062 0.14337364 0.79429 0.45728186

3.6.1. USANDO LA PRUEBA t


En primer lugar, para probar la hiptesis simple que el segundo coeficiente es cero, del resultado anterior sabemos que t=9.52994. Verifiquemos los clculos: com BETA = %beta ;* se guarda en BETA el vector de coeficientes de la regresin. ;* se declaran las matrices y vectores a usar ;* corresponde a la matriz R ;* corresponde a r ;* corresponde al 2 coeficiente, donde 1.0 se encuentra en el vector R1

dec com com com

rect R1 = CC = RB =

R1 CC VAR ||0,1,0|| ||0|| R1*BETA

wri RB 1.3642

COM VAR = %SEESQ*(R1*%XX*TR(R1)) WRI VAR 0.0205 dis 1.3642/0.0205**0.5 9.52799

;* calculamos la varianza del 2 coeficiente

;* calculamos el test t, que coincide con lo reportado en RATS

3.6.2. USANDO LA PRUEBA F


Si bien no es necesario usar la prueba F para una hiptesis sobre 1 coeficiente (puede hacerse con la t), la prueba F debe llevar al mismo resultado. Verifiqumoslo: wri RB 1.3642 com xx=%xx ;* guardamos en XX la matriz (XX)-1. ; verificamos que RB contiene el 2 coeficiente

COM VAR = %SEESQ*(R1*XX*TR(R1)) ;* calculamos la varianza del 2 coeficiente WRI VAR 0.0205 com EFE = 1.3642**2/0.0205 dis EFE ;* construimos el test F

63

90.78252 RESTRICT 1 # 2 # 1.0 0.0 F(1,6)= ;* verificamos el clculo del test con la instruccin RESTRICT

90.81967 with Significance Level 0.00007617

La conclusin es rechazar la hiptesis nula.

3.6.3. LA PRUEBA F PARA DOS O MS COMBINACIONES LINEALES DEL VECTOR BETA


Si se desea probar ahora 2 hiptesis lineales simultneas, por ejemplo: Ejemplo:

Ho : 1 2 = 1.0

2 = 0.0
;* corresponde a R ;* corresponde a r

dec rect R1 CC F NUMERADOR com R1 = ||0,1,-1|0,0,1|| com CC = ||1.0|0.0|| com RB = R1*BETA wri RB 1.2504 0.1139

;* calculando R

COM NUMERADOR = TR(RB-CC)*INV(R1*XX*TR(R1))*(RB-CC) ;* el numerado de la prueba F WRI NUMERADOR 85.3473

com FACTOR = 1/(%SEESQ*2) DIS FACTOR 0.03869 COM F=NUMERADOR*FACTOR WRI F 3.3020

;* el denominador de la prueba F

;* test F = 85.3473*0.03869 = 3.3020

RESTRICT 2 ;* verificamos con RESTRICT # 2 3 # 1.0 -1.0 1.0 # 3 # 1.0 0.0 F(2,6)= 3.30200 with Significance Level 0.10787701

La hiptesis no es rechazada.

64

3.7. PRUEBA DE SIGNIFICANCIA GLOBAL


Qu ocurre si deseamos probar la hiptesis que todos los coeficientes de pendientes son cero (sin considerar el intercepto)?. Este es justamente el llamado test de significancia global, por cuanto permitir saber si conjuntamente las variables X tienen poder explicativo en conjunto por sobre Y. Es decir:

Y = 0 + 1 X 1 + 2 X 2 + Ho : 1 = 2 = .... = 0
Claramente se trata de una prueba F que es sencillo probar con RESTRICT, donde el nmero de grados de libertad en el numerador es m=nmero de coeficientes (sin considerar intercepto), y el nmero de grados de libertad en el denominador es T-K. Ejemplo: RESTRICT 2 ;* para el ejemplo del desempleo en Chile (Tabla 1 en Anexo al final del libro) # 2 # 1.0 0.0 # 3 # 1.0 0.0 F(2,9)= 3.53768 with Significance Level 0.07351364

;* no debe rechazarse Ho, de modo que sospechamos de una baja explicacin del Imacec y del IPC respecto al desempleo en el periodo de estudio.

Ntese que es tal la importancia de este test, que es reportado en la salida de LINREG, junto a su significancia. En el ejemplo de Desempleo, el resultado de la regresin es: Ejemplo: linreg desempleo # constant imacec ipc Dependent Variable DESEMPLEO - Estimation by Least Squares Monthly Data From 2000:01 To 2000:12 Usable Observations 12 Degrees of Freedom 9 Centered R**2 0.440137 R Bar **2 0.315723 Uncentered R**2 0.994803 T x R**2 11.938 Mean of Dependent Variable 539.39166667 Std Error of Dependent Variable 54.53536731 Standard Error of Estimate 45.11222094 Sum of Squared Residuals 18316.012303 Regression F(2,9) 3.5377 Significance Level of F 0.07351364 Durbin-Watson Statistic 1.286739 Q(3-0) 1.724386 Significance Level of Q 0.63152582 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -489.813301 1134.381514 -0.43179 0.67605439 2. IMACEC -2.967603 1.645773 -1.80317 0.10486361 3. IPC 16.834478 9.659915 1.74271 0.11535790

Adems, puede verificarse tambin que es posible construir esta prueba a travs de:

65

F=

K 1 (1 R ) T K
2

R2

lo que es mucho ms simple que la usual prueba F. Ejemplo: COM EFE = (%RSQUARED/2)/((1-%RSQUARED)/%NDF) DIS EFE 3.53768

3.8. PRUEBA DE EXCLUSION DE VARIABLES


Una prueba tpica de MCR es verificar si una de las variables explicativa es estadsticamente importante en el modelo, es decir, si existe diferencia significativa entre la restriccin no restringida (con todas las variables) y la regresin restringida (eliminando la variable en cuestin). Esta es una prueba F que efectuamos para el ejemplo del desempleo y la hiptesis: Ejemplo:

Ho : 2 = 0
linreg(noprint) desempleo # constant imacec ipc compute Urss = %rss ;* los residuos no restringidos com gl = %ndf linreg(noprint) desempleo # constant imacec compute Rrss = %rss ;* los residuos restringidos compute fstat=((Rrss-Urss)/1.)/(Urss/gl) cdf ftest fstat 1 gl F(1,9)= ;* el test F

3.03706 with Significance Level 0.11535790

Usando la instruccin EXCLUDE de RATS obtenemos el mismo resultado: Ejemplo: linreg(noprint) desempleo # constant imacec ipc compute Urss = %rss EXCLUDE # ipc Null Hypothesis : The Following Coefficients Are Zero IPC F(1,9)= 3.03706 with Significance Level 0.11535790

66

3.9. CAUSALIDAD (GRANGER, 1969)


Se dice que X causa en el sentido de Granger a Y, si Y puede ser predicho mejor usando informacin pasada de Y y X, que usando solamente informacin pasada de Y. Veamos el concepto con un ejemplo23: el retorno accionario de la bolsa de valores de Brasil causa al retorno de Chile (RbrtRcht), por ejemplo, si el retorno de Chile se puede predecir mejor utilizando valores pasados del retorno de Brasil (Rbrt-i) y del retorno de Chile (Rcht-j), que usando solamente valores pasados del retorno de Chile. Formalmente, se dice que Brasil (Rbrt) causa a Chile (Rcht), si existe una diferencia significativa entre las ecuaciones (1) y (2), notando que en esta ltima ecuacin el trmino rezagado del retorno de Brasil no est presente:

Rcht = 0 + i Rbrt i + j Rcht j + 1t


i =1 j =1

(1)

Rcht = 0 + j Rcht j + 1t
j =1

(2)

Aqu 0, i, j, son los coeficientes de la regresin, y 1t son las perturbaciones que se suponen bien comportadas. La ecuacin (1) constituye la regresin no restringida, a partir de la cual puede obtenerse la suma cuadrada de errores no restringidos (SRCnr), y la ecuacin (2) es la regresin restringida (es decir i = 0), de la cual se obtiene la suma de los residuos al cuadrado restringidos (SRCR). Para verificar la significancia que tiene el retorno de Brasil en la regresin usamos la prueba F comparando la suma de los residuos al cuadrado restringidos y no restringidos de las regresiones (1) y (2), es decir una prueba de mnimos cuadrados restringidos para la exclusin de variables (ecuacin 3):

F=

( SRC R SRC NR ) / m ( SRC NR /( n k ))

(3)

donde, m es igual al nmero de trminos rezagados de Rbr (el nmero de restricciones lineales), k es el nmero de parmetros estimados en la regresin no restringida, n el nmero de observaciones, y F sigue una distribucin con m y (nk) grados de libertad. La hiptesis nula es que los trminos rezagados de Rbr no pertenecen a la regresin (H0: i=0). Si el valor F calculado no excede al valor F crtico, no existirn argumentos para rechazar la hiptesis nula (Ho: no existe causalidad), con lo cual los trminos rezagados del retorno de Brasil no ayudan a explicar al retorno de Chile.

Ejemplo: Un test

de causalidad de r2 hacia r1 es el siguiente:

ALL 13 DATA(UNIT=INPUT,ORG=OBS) / p1 p2 p3 100 100 100 106 104 99 107 106 110 120 111 126 110 111 113 116 115 103 123 120 102 133 124 103 137 126 98
23

Vase a Aedo y Ziga (2001) Anlisis de Causalidad entre Bolsas Latinoamericanas, Documento de Trabajo, Escuela de Ingeniera Comercial, U.C.N.

67

100 106 107 120

100 104 106 111

100 99 110 126

set r1 = log(p1/p1{1}) set r2 = log(p2/p2{1}) set r3 = log(p3/p3{1}) linreg(noprint) r1 # constant r1{1 to 2} r2{1 to 2} exclude # r2{1 to 2} Null Hypothesis : The Following Coefficients Are Zero R2 Lag(s) 1 to 2 F(2,5)= 0.96928 with Significance Level 0.44081152 ;* y Exclude no puede rechazar Ho.

com rssf = %RSS linreg(noprint) r1 # constant r1{1 to 2} com rssr = %RSS com F = ((rssr-rssf)/2.)/(rssf/(%NOBS-2.*2.-1.)) dis f 0.96928 cdf ftest f 2 %NOBS-2*2-1 F(2,5)= 0.96928 with Significance Level 0.44081152

;* el test F llega al mismo resultado.

68

3.10. TEST DE ESTABILIDAD (CAMBIO ESTRUCTURAL)


Al estimar una regresin se asume que los coeficientes son estables a travs del tiempo, sin embargo esto puede ser falso. La prueba para cambio estructural es una F implementada por Chow (1960), tal como veremos. Si el periodo total, que contiene T observaciones, puede ser descompuesto en 2 conjuntos independientes de datos con tamaos T1 y T2 (que no tienen por qu sumar T), la ecuacin de regresin es: Para el 1 grupo: Para el 2 grupo:

y = 0 + 11 x1 + 12 x 2 + ... + 1k x k + e y = 1 + 21 x1 + 22 x 2 + ... + 2 k x k + e

Una prueba de estabilidad de los parmetros entre las poblaciones es la siguiente hiptesis simultnea:

Ho : 0 = 1 ; 11 = 21 ; 12 = 22 ;...; 1k = 2 k
Para esto usamos el test de razn de verosimilitud:

(inexistencia de cambio estructural)

(SCErr Restr SCErr no Restr )


F=
haciendo :

SCErr no Restr

m F(m,T K)

T K

SCErr Restr : calculando el modelo para el periodo total SCErr No Restr : calculando por separado el modelo en cada uno de las submuestras y luego sumndolas. m : el nmero de restricciones, es decir el nmero de parmetros (incluyendo el intercepto) T-k : los grados de libertad del denominador son la suma de los grados de libertad de cada una de las regresiones de las submuestras. Ntese que puesto que se estimarn 2 regresiones se requiere una cantidad suficiente de observaciones en cada submuestra.

Ejemplo:

Se tiene la siguiente informacin sobre ahorro e ingreso del Reino Unido 19461963 (millones de libras), y se desea determinar si existe un cambio estructural del periodo 1946-1954 versus 1955-1963. all 18 cal 1946 1 1 data(unit=input, org=obs) / ahorro ingreso ... Ver datos en Tabla 3 del Anexo al final del libro table Series AHORRO INGRESO Obs Mean 18 0.7733333333 18 15.7444444444 Std Error 0.6428063472 5.2277789933 Minimum Maximum 0.0800000000 1.9900000000 8.8000000000 25.2000000000

linreg(NOPRINT) ahorro # constant ingreso compute rss_pool = %rss

69

linreg(NOPRINT) ahorro * 9 # constant ingreso compute rss_antes = %rss, ndf_antes = %ndf linreg(NOPRINT) ahorro 10 * # constant ingreso compute rss_despues = %rss, ndf_despues = %ndf compute rss_unr=rss_antes+rss_despues compute ndf_unr=ndf_antes+ndf_despues compute fstat=((rss_pool-rss_unr)/2)/(rss_unr/ndf_unr)

F=

[0,5722 (0,1396 + 0,1931)]/ 2 = 5,03707 (0,1396 + 0,1931) / (18 4)

cdf ftest fstat 2 ndf_unr F(2,14)= 5.03706 with Significance Level 0.02249279

;* puesto que el nivel de significancia es menor a 5%, rechazamos la hiptesis nula a favor de la existencia de cambio estructural.

70

3.11. ESTIMANDO REGRESIONES RESTRINGIDAS


En muchas ocasiones se requiere efectuar estimaciones de modelos en que deben imponerse restricciones sobre los coeficientes.

Ejemplo:

linreg(noprint) desempleo # constant imacec ipc restrict(create) 2 # 2 # 1 0.0 # 3 # 1 0.0 F(2,9)= ....

;* primero estimar el modelo no restringido.

;* obliga a que los coeficientes 2 y 3 sea 0.0

3.53768 with Significance Level 0.07351364

(omitimos parte de los resultados)

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 539.3917 15.7430 34.26231 0.00000000 2. IMACEC 0.0000 2.3961e-009 0.00000 1.00000000 3. IPC -3.5527e-015 0.0000 0.00000 0.00000000 ;* con esto verificamos que se ha obligado a que los coeficientes de Imacec e Ipc sean cero.

El ejemplo tpico de estimaciones restringidas ocurre en la estimacin de funciones de costo translogaritmicas, la que se puede transcribir de la siguiente manera:

ln C =

o +

i =1

i ln Qi +

j =1

jln Wj +

1 m m ik ln Qi ln Qk + 2 i =1 k =1

1 n n js lnWj ln Ws + 2 j =1 s =1
donde: 0 = intercepto C = costos totales de las instituciones bancarias Qi = productos que entregan los bancos Wj = insumos para producir los productos

i =1 j =1

ij ln Qi ln Wj

La funcin de costos tiene que ser linealmente homognea y cncava en Wj, y creciente en Qi y Wj, por lo tanto, esta ecuacin debe estar sujeta a las siguientes restricciones:

j =1

j = 1 ;

j =1

js = 0 ;

j =1

ij = 0 ; ik = ki ; js = sj

las que pueden ser implementadas simultneamente a travs de RESTRICT(create). Ms adelante, en el captulo 7 veremos que cuando se trabaje con sistemas de ecuaciones (SUR estimations) debe usarse RESTRICT(REPLACE).

71

ANEXO AL CAPITULO 3
PARSIMONIA
En muchas ocasiones se quiere determinar si un modelo contiene el nmero apropiado de variables explicativas o rezagos. Para esto existen los criterios de AKAIKE (AIC, 1973) y el criterio bayesiano de SCHWARTZ (BIC, 1978), los que para el caso uniecuacional son como sigue:

AIC = T log( SCErr ) + 2 K BIC = T log( SCErr ) + K (log T )


donde K es el nmero de regresores y T el nmero de observaciones. La idea es escoger el nmero de regresores tal que el criterio entregue un menor valor de ambos criterios. Es posible que ambos criterios entreguen resultados opuestos. Ejemplo: boxjenk(noprint,ar=1,ma=1) y 3 100 Compute AIC = %nobs*log(%rss) + 2*%nreg Compute SBC = %nobs*log(%rss) + %nreg*log(%nobs) Display 'aic = ' AIC ' sbc = ' SBC

RESTRICCIONES NO LINEALES SOBRE LOS COEFICIENTES


Aqu existen bsicamente dos caminos. Uno, usar el test de Wald como en Judge et al. (1988), ecuacin (12.3.59), lo que implica usar una Chi cuadrado. El otro camino es el de linealizar la restriccin usando la expansin de Taylor alrededor de los coeficientes estimados, lo que a continuacin efectuamos a travs de un ejemplo. Ejemplo: Asumamos la siguiente restriccin: c(2)*c(3)=0.5 La expansin de Taylor es: C(2)*C(3) C(2)Hat*C(3)Hat+||C(3)Hat,C(2)Hat||*||C(2)-C(2)Hat|C(3)-C(3)hat|| donde C(2) y C(3) son los verdaderos valores, y el trmino "Hat" son para los parmetros estimados. Multiplicando y simplificando: C(2)*C(3) C(3)Hat*C(2) + C(2)Hat*C(3) - C(2)Hat*C(3)Hat C(3)Hat*C(2) + C(2)Hat*C(3) X + C(2)Hat*C(3)Hat restrict 1 # 2 3 # 0.11388 1.3642 F(1,6) = 2.99759

(0.11388*1.3642+0.5)

72

SESGO, CURTOSIS Y NORMALIDAD


La curtosis caracteriza la elevacin o el achatamiento relativos de una distribucin, comparada con la distribucin normal. Una curtosis positiva indica una distribucin relativamente elevada, mientras que una curtosis negativa indica una distribucin relativamente plana.

En Excel: =curtosis( ) La prueba estadstica de que la curtosis es cero se basa en una Normal, y es:

Nota: La curtosis para una v.a. normal (0,1) tiene un valor esperado de 3. RATS calcula el exceso de curtosis, es decir el grado en que el cuarto momento alrededor de su media difiere de 3. El Sesgo caracteriza el grado de asimetra de una distribucin con respecto a su media. La asimetra o sesgo positivo indica una distribucin unilateral que se extiende hacia valores ms positivos. La asimetra negativa indica una distribucin unilateral que se extiende hacia valores ms negativos.

En Excel: =coeficiente.asimetria( ) La prueba estadstica de que el sesgo es cero se basa en una Normal, y es:

Nota: En ambos casos, sesgo y curtosis, la hiptesis nula es que estas son cero.

73

NORMALIDAD
Existen 4 formas comunes de estimar la normalidad: 1.2.3.4.Histograma de residuos Normal Probability Plot Anderson-Darling normality test (A2 stat) Jarque-Bera (JB) test of Normality (asinttico)

Por ahora estamos interesados en la prueba de Jarque Bera, la que tiene la siguiente specificacin:

S2 K2 a JB = T + 6 24

2 ( 2)

donde S es el coeficiente de Sesgo y K es el coeficiente de curtosis. Para una variable distribuda normalmente, S=0 y K=3. Luego, el test JB de normalidad es una prueba conjunta de si S=0 y K=3. Si el valor p es suficientemente bajo, se puede rechazar la hiptesis que la variable est normalmente distribuda. Ejemplo: Chi-Squared(2)= 1.061172 with Significance Level 0.58826017, donde Ho: Normalidad. Luego, no podemos rechazar en este caso la hiptesis de normalidad (la conclusin es no rechazar normalidad).

NORMALIDAD: TEST DE BERA-JARQUE


Esta prueba es muy til cuando se desea probar la normalidad de una serie. En particular, para probar la normalidad de los residuos de una regresin. Veamos su clculo a travs del siguiente ejemplo:

Ejemplo:

linreg y / resid # constant x2 x3

;* una regresin lineal guardando los residuos en resid

STATISTICS(noprint) resid ;* se calculan las estadsticas de la serie resid COMPUTE BJ = %NOBS*((%SKEWNESS**2)/6.0+(%KURTOSIS)**2/24.0) ;* calculamos el estadstico de Bera-Jarque y lo guardamos en la variable BJ CDF CHISQR BJ 2 ;* puesto que se distribuye Chi cuadrado con 2 grados de libertad, CDF entrega la significancia del test.

Chi-Squared(2)= 1.061172 with Significance Level 0.58826017 donde Ho: Normalidad. Luego, no podemos rechazar en este caso la hiptesis de normalidad (la conclusin es no rechazar normalidad).

74

Ejemplo: Siguiendo el ejemplo de la serie CAPITAL anterior mostramos el clculo de stas. Los resultados a obtener son los siguientes:
Observaciones Media Muestral Desv estandar Varianza Error est de la media Estadistico t Sesgo Curtosis Jarque Bera 10 5,6 2,319003617 5,377777778 0,733333333 7,636363636 Pruebas de Hipotesis Significancia a 1 cola -0,058802684 -0,064415113 0,948639697 -1,11811742 -0,488540664 0,62516693 0,526673995 0,526673995 0,768482877

Las frmulas usadas en cada caso se muestran a continuacin:

75

1.3. GRAFICOS DE PROBABILIDAD NORMAL


Los grficos de probabilidad normal (normal probability plot) son una tcnica grfica para valorar si los datos son o no aproximadamente normalmente distribuidos. Los datos son graficados contra una distrinucin normal terica de tal forma que los puntos deben formar aproximadamente una lnea recta. Las desviaciones de la lnea recta indican desviaciones de la normalidad. El grfico de probabilidad normal es un caso especial de los grficos de probabilidad. Existen varios tipos de grficos de probabilidad normal24. Aqu nos referimos solamente al tipo ms simple de ellos: Percentiles vs Datos.

Los pasos para construir un grfico de probabilidad normal son: 1. Las observaciones son rankeadas (ordenadas) de la menor a la mayor, x(1), x(2), . . ., x(n). 2. Las observaciones ordenadas x(j) son graficadas contra su frecuencia acumulativa observada, tipicamente; j/(n + 1)) sobre un grfico con el eje Y apropiadamente escalado para la distribucin hipotetizada. 3. Si la distribucin hipotetizada describe adecuadamente los datos, los puntos graficados se ubican aproximadamente sobre una lnea recta. Si los puntos se desvan significativamente de la linearecta, especialmente en las puntas, entonces la distribucin hipotetizada no es apropiada.

24

Vease por ejemplo www.itl.nist.gov/div898/handbook/eda/section3/probplot.htm.

76

4. Para valorar la cercana de los ountos a la lnea recta, la prueba del grosor de un lpiz se usa comunmente. Si todos los puntos se encuentran dentro del lapis imaginario, entonces la distribucin hipotetizada es probablemente la apropiada.

Ejemplo: Los siguientes datos representan el grosor de una hoja plstica, en micrones: 43, 52, 55, 47, 47, 49, 53, 56, 48, 48
Ordered data Rank order Cumulative Frequency (j) ( j/(n + 1)) 43 1 1/11 = .0909 47 2 2/11 = .1818 47 3 3/11 = .2727 48 4 4/11 = .3636 48 5 5/11 = .4545 49 6 6/11 = .5454 52 7 7/11 = .6363 53 8 8/11 = .7272 55 9 9/11 = .8181 56 10 10/11 = .9090

Los datos ordenados son graficados contra su respectiva frecuencia acumulada. Note como el eje Y es escalado tal que una lnea recta resultar para datos normales.

Basados en el grfico, parece que los datos se encuentran normalmente distribudos. Sin embargo se requieren otras pruebas estadsticas para concluir que el supuesto de normlidad es apropiado.

77

En Excel puede obtenerse este grfico en Herramientas / Analisis de Datos / Regresion / y all seleccionando la opcion Grafico de probabilidad normal. Para el caso de la serie 'Capital' del ejemplo que se ha estado analizando, se tiene el siguiente resutado a partir de Excel.

78

1.4. HISTOGRAMA
Un histograma es un grfico para la distribucin de una variable cuantitativa continua que representa frecuencias mediante el volumen de las reas. Un histograma consiste en un conjunto de rectngulos con (a): bases en el eje horizontal, centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase y (b): reas proporcionales a las frecuencias de clase. Si en la distribucin se toman clases de la misma longitud, las frecuencias son proporcionales a las alturas de los rectngulos del histograma ya que el rea se obtiene multiplicando la base por la altura por lo que queda similar a un diagrama de barras, solo que ahora las barras van una junto a otra por tratarse de una variable continua. En Excel, la herramienta para histogramas se encuentra en Herramientas / Anlisis de Datos / Histograma. Antes de ejecutarla se puede (es opcional) definir el 'Rango de Clases', a fin de definir las divisiones para cada rango del histograma. El 'Rango de Clases' son valores lmite que definen rangos de clase, los que debern estar en orden ascendente. Si se omite el rango de clase, Excel crear un conjunto de clases distribuidas uniformemente entre los valores mnimo y mximo de los datos. Ejemplo: En el ejemplo de la serie 'Capital' un histograma es obtenido de la siguiente forma:

Histograma
3,5 120,00%

100,00%

2,5 80,00%

Frecuencia

2 60,00% 1,5 Frecuencia % acumulado

40,00% 1

0,5

20,00%

0 2 4,333333333 Clase 6,666666667 y mayor...

0,00%

79

80

CAPITULO 4 VIOLACION DE ALGUNOS DE LOS SUPUESTOS

Ahora nos concentraremos en el caso en que los errores estn mal comportados, es decir, cuando la matriz de covarianzas de los errores V=E['] ya no es escalar Identidad, sino que E[']=2, con una matriz definida positiva, de modo que pueden ocurrir dos casos simples: - V diagonal, pero con elementos distintos (heterocedasticidad). - V no diagonal (autocorrelacin). Anteriormente mostramos que en cualquiera de estas condiciones el estimador b de MCO es insesgado25, y que para calcular la matriz de varianzas de los coeficientes a travs de MCO ya no puede hacerse la siguiente simplificacin:

E [(b )(b )'] = ( X ' X ) 1 X ' E ( ' ) X ( X ' X ) 1


= ( X ' X ) 1 X ' 2 I X ( X ' X ) 1 = 2 ( X ' X ) 1
sino que tendremos:

E [(b )(b )' X ] = 2 ( X ' X ) 1 X ' X ( X ' X ) 1


de tal modo que si se usa errneamente 2(X'X)-1 se sobrestimar o subestimar la verdadera matriz de varianzas. An as, MCO es til en la mayora de las situaciones, y aun cuando se violen algunos de stos supuestos, la estimacin de los parmetros por este mtodo sigue siendo consistente aunque ya no eficiente, es decir no con el menor error.

4.1. MNIMOS CUADRADOS GENERALIZADOS


En este captulo mostraremos que si se usa el procedimiento de Mnimos Cuadrados Generalizados (MCG)26 se tendrn estimadores que superan el problema de errores mal comportados, los que como sabemos, tienen la propiedad de ser MEI.

25 Suponiendo que se mantiene la independencia de los regresores con el trmino de error, pues si esto no ocurriera, a travs de MCO se generan estimadores inconsistentes. Este problema ser dejado para un anlisis posterior. 26 Puesto que es asumido que la forma de la matriz de covarianza de las perturbaciones es conocida, entonces el procedimiento de solucin consiste en aplicar MCGeneralizados.

81

El procedimiento de Mnimos Cuadrados Generalizados consistente en transformar la ecuacin de regresin con errores mal comportados (E[']=2, conocida) multiplicndola por una determinada matriz P (TxT) a fin de obtener errores con media cero y matriz de covarianzas escalar identidad (errores bien comportados). En este caso el estimador de los coeficientes de regresin es:

b = ( X ' 1 X ) 1 X ' 1Y
con

E [(b )(b )' X ] = 2 ( X ' 1 X ) 1

de modo que b de MCG es MELI para el caso de E['] no esfrica (es decir mal comportada) pero conocida. En caso de usar MCO bajo E['] no esfrica, la verdadera matriz de varianzas y covarianzas, cuando conocemos la naturaleza de E['] debera ser la siguiente:

E[(b )(b )'] = 2 ( X ' X ) 1 X ' X ( X ' X ) 1


Sin embargo, usar MCO entregar errneamente la siguiente matriz:

E[(b )(b )'] = 2 ( X ' X ) 1


que es menor a la anterior, de modo que la existencia de heterocedasticidad / autocorrelacin lleva siempre a una sobreestimacin de los valores t (es decir errores menores a los verdaderos). Entonces se genera un estimador sesgado de la matriz de covarianzas de los coeficientes. Adems se tienen slo resultados asintticos27.

4.2. HETEROCEDASTICIDAD
La heterocedasticidad o varianzas de los errores no constantes no suele presentarse en series de tiempo, sino que en datos de corte transversal. En el modelo lineal general, hemos dicho que la heterocedasticidad ocurre cuando los elementos de la diagonal de la matriz no son todos idnticos:

y = X + e E ( e) = 0 E (ee' ) = =
2

(1)

donde es una matriz cuadrada semidefinida positiva distinta a 2I. En la prctica esto puede ocurrir, por ejemplo, debido a que ingresos familiares menores tienden a gastar a un ritmo ms constante (en primera necesidad), mientras que las rentas ms altas tienden a gastar ms errticamente. Ejemplo: Supongamos que tenemos informacin de consumo e ingreso de 20 familias como sigue; all 20 data(unit=input,org=obs) / familia consumo ingreso ... Ver datos en Tabla 4 del Anexo al final del libro
27

Puesto que el estadstico t ya no es una variable normal dividido por su desviacin estndar aproximada (el estimador b de MCO es ineficiente), y adems el test F tampoco ser vlido (vase Judge 342).

82

order(all) ingreso

;* ordenamos las series en base al ingreso ;* graficamos

scatt(hlabel='ingreso', vlabel='consumo') 1 # ingreso consumo

45

40

35

30

consumo

25

20

15

10

5 6 12 18 24 30 36 42 48

ingreso

;* notamos que efectivamente en mayores rentas existe una mayor volatilidad, es decir evidencia de heterocedasticidad. Lamentablemente cuando se trata de modelos mltiples este tipo de grfico no tendr sentido, aunque un grfico de los residuos de la regresin respecto a la serie Y entregar alguna evidencia: linreg consumo / errores # constant ingreso ;* guardamos los errores

scatt(hlabel='consumo', vlabel='errores') 1 # consumo errores


2.0

1.5

1.0

0.5

0.0

errores

-0.5

-1.0

-1.5

-2.0

-2.5 6 12 18 24 30 36 42

consumo

;* ahora se ve ms claramente la existencia de heterocedasticidad.

83

4.2.1. CORRECCION CON MCG ( CONOCIDA)


Supongamos que la matriz de covarianzas de los errores tiene la siguiente forma:

12 0 0 2 0 2 0 2 E (ee' ) = = 0 0 3 ... ... ... 0 0 0

0 ... 0 2 2 2 2 ... 0 = diag ( 1 , 2 , 3 ,... T ) ... 2 ... T ...

Puede verificarse que la transformacin de MCG apropiada es:

1 / 1 0 P= 0 ... 0

1/ 2 0 0 1/ 3 ... ... 0 0

0 ... 0 1 1 1 1 ... 0 = diag ( 1 , 2 , 3 ,... T ) ... ... 1 / T ...

puesto al multiplicar el modelo heterocedstico en (1), se tiene que as la varianza de los errores resultante es homocedstica (una constante igual a 1). En efecto: Y = X + e /P

PY = PX + Pe Y* = X** + e* La varianza de los errores del modelo anterior es: V(e*) = P2V(e) = I = una constante (homocedaticidad) es decir:

t var( *) = E ( ) = E t
*2 t

=1

El procedimiento de MCG es entonces es dividir cada observacin por la desviacin estndar del error correspondiente a esa observacin, procedimiento que se llama Mnimos Cuadrados Ponderados.

84

4.2.2. DETECCION DE LA HETEROCEDASTICIDAD


El procedimiento inicial de deteccin es el grfico, pero muchas veces el patrn de la heterocedasticidad no puede ser apreciado grficamente, de modo que existe una batera de tests para la hiptesis: Ho: Homocedasticidad entre los cuales destacamos, para el ejemplo anterior, los siguientes: 1.- Test de Goldfeld y Quandt (1972) Es un test F, en que se comparan los residuos de regresiones corridas a dos partes distintas de la muestra, de modo que se requiere un nmero relativamente alto de observaciones. a) Primero ordenamos por X ( por Y sin son varias X). Dividimos T en 2 grupos (a veces se sugiere dejar libre en el medio algunas). b) Se corren regresiones separadas para cada una y se guarda la Suma Cuadrada de Errores y los grados de libertad: Ejemplo: LINREG(NOPRINT) consumo 1 10 # CONSTANT ingreso COMPUTE RSS1=%RSS , NDF1=%NDF LINREG(NOPRINT) consumo 11 20 # CONSTANT ingreso COMPUTE RSS2=%RSS , NDF2=%NDF c) Se calcula el test F y su significancia COMPUTE FSTAT=(RSS2/NDF2)/(RSS1/NDF1) CDF FTEST FSTAT NDF2 NDF1 F(8,8)= 6.63298 with Significance Level 0.00740951

;* concluimos que en este ejemplo tenemos evidencia suficiente para rechazar homocedasticidad.

2.- ARCH TEST DE WHITE (1980): Es una variacin del test de Breush y Pagan (1979), donde se corren los residuos cuadrados contra los regresores, sus cuadrados y en algunos casos sus productos. La hiptesis nula es homocedasticidad. Ejemplo : linreg(NOPRINT) y / ERR # constant x2 x3 SET ERR2 = ERR**2 set X2X2 = X2**2 set X2X3 = X2*X3 set X3X3 = X3**2 linreg(NOPRINT) err2 # constant X2 X3 X2X2 X3X3 compute chistat = %nobs*%rsquared

85

cdf chisq chistat 4 ;* el nmero de grados de libertad en el test chi es aqu el nmero de variables explicativas, es decir el nmero de parmetros menos 1 (menos el intercepto). ;* en nuestro caso: linreg(NOPRINT) consumo / ERR # constant ingreso SET ERR2 = ERR**2 set X2X2 = ingreso**2 linreg(NOPRINT) err2 # constant ingreso X2X2 compute chistat = %nobs*%rsquared cdf chisq chistat 2 Chi-Squared(2)= 17.562277 with Significance Level 0.00015360

;* llegamos a la misma conclusin anterior.

86

3.- ARCH TEST DE ENGLE(1982) : Para el caso de error del tipo ARCH(1), es decir:

u t N (0, 2 (1 + u 2 t 1 ))
el test consiste en regresionar los residuos al cuadrado sobre sus rezagos: Ejemplo: linreg(NOPRINT) consumo / ERR # constant ingreso SET ERR2 = ERR**2 linreg(NOPRINT) err2 # constant err2{1 to 3} ;* una especificacin ARCH(3) por ejemplo compute chistat = %nobs*%rsquared cdf chisq chistat 3 Chi-Squared(3)= 13.136195 with Significance Level 0.00435114

;* llegamos a la misma conclusin anterior.

4.2.3. CORRIGIENDO POR HETEROCEDASTICIDAD EN RATS


Puesto que en general no se conoce exactamente la forma de la heterocedasticidad, la forma ms comn para intentar reducirla es deflactar/ponderar a partir de alguna medida de tamao. Por ejemplo, en el anlisis de los costos de distintos tramos de vas de ferrocarriles:

COSTO Tramoi = 0 + 1 RENTABILIDAD Tramoi + i


puede ser apropiado deflactar por el numero de kilmetros de cada una de las vas, analizando entonces costos por kilmetro en lugar de costos por tramos, lo que puede reducir la heterocedasticidad. Aqu la variable para efectuar la deflactacin sera el nmero de kilmetros de cada va, lo que permitira construir la matriz P para implementar MCG (es decir MC Ponderados). Una alternativa similar es transformar los datos a travs de logaritmos. Para explicar el mtodo de MC Ponderados, supongamos que se tiene el siguiente modelo de regresin lineal simple:

yt = 1 + 2 xt + et
Se desea corregir por heterocedastididad usando la misma variable xt. Para esto debe multiplicarse el modelo original como sigue:

yt xt

1
xt

+ 2

xt xt

et xt

87

y t* =
* x1 t =

yt xt 1 xt xt xt

* x2 t =

De este modo el modelo a estimar (corregido) es el siguiente:


* * * y t* = 1 x1 t + 2 x 2 t + et

Ntese que para estimarlo debe correrse una regresin con 2 variables explicativas y sin intercepto.

La Opcin SPREAD en RATS: Se usa la opcin SPREAD para implementar MC Ponderados, esto es, para corregir por heterocedasticidad de una forma conocida o estimada. Con esta opcin Ud. entrega una serie, la cual se asume (se sabe) que las varianzas de los residuos son proporcionales, lo que permite la correccin del problema de heterocedasticidad, tal como mostramos anteriormente.

Ejemplo:

Si la varianzas son proporcionales a la serie xx3: linreg(spread=xx3) yy # xx2 Es equivalente a multiplicar el sistema lineal original por: set wyy = yy/(xx3)**0.5 set wx2 = xx2/(xx3)**0.5 linreg wyy # wx2

Para nuestro ejemplo, podemos corregir por la misma variable ingreso: Ejemplo: linreg consumo ;* la regresin sin corregir # constant ingreso ... (omitimos parte de los resultados) Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 0.8470516317 0.7033549511 1.20430 0.24407047 2. INGRESO 0.8993246879 0.0253091357 35.53360 0.00000000

linreg(spread=ingreso) consumo # constant ingreso Dependent Variable CONSUMO - Estimation by Weighted Least Squares Usable Observations 20 Degrees of Freedom 18 Centered R**2 0.959598 R Bar **2 0.957353 Uncentered R**2 0.997832 T x R**2 19.957

88

Mean of Dependent Variable Std Error of Dependent Variable Standard Error of Estimate Sum of Squared Residuals Durbin-Watson Statistic

4.5658051537 1.1155277146 0.2303690319 0.9552580356 2.057102

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 0.7093603335 0.4302588385 1.64868 0.11655592 2. INGRESO 0.9047778086 0.0198858976 45.49846 0.00000000 ;* y se tienen ahora estimaciones eficientes de los parmetros, pues como se ve, el error estndar del parmetro de ingreso ha disminuido de 0.0253 a 0.01988.

89

4.3. CORRELACIN SERIAL


La correlacin serial ocurre cuando el trmino de error de un periodo est correlacionado con el de otro periodo. Ocurre principalmente en series de tiempo. Posibles motivos para la aparicin de correlacin serial son el sesgo de especificacin (una forma funcional incorrecta o variables excluidas) y los modelos autorregresivos (donde los errores son intrnsecamente correlacionados), es decir aquellos modelos en que aparece como variable explicativa la variable explicada rezagada (Yt-1). La especificacin siguiente define un modelo lineal general con errores auto correlacionados de 1 orden, AR(1):

y = X +

t = t 1 + v t
E (v ) = 0 E (vv' ) = v I
2

donde es el coeficiente de correlacin entre los errores sucesivos, e es el error auto correlacionado, y v es un error bien comportado. Al igual que en el caso de la heterocedasticidad, en los casos simples es posible detectar esta anomala graficando los residuos, como veremos en el siguiente ejemplo:. Ejemplo: Supongamos que disponemos de informacin anual de inventarios (Y) y de ventas (X) en una determinada regin. all 20 cal 1979 1 1 data(unit=input,org=obs) / inventario ventas ... (ver datos en la Tabla 5 del Anexo al final del libro) linreg inventario / err # constant ventas scat(style=lines, hlabel='inventarios', vlabel='errores') 1 # inventario err

15

10

errores

-5

-10

-15 50 75 100 125 150 175 200

inventarios

90

;* el grfico muestra que efectivamente los errores poseen un patrn cclico, lo que en este caso se traducira en errores auto correlacionados positivamente.

4.3.1. CORRECCION CON MCG ( CONOCIDA)


Puede mostrarse que en el caso de un proceso AR(1)28 de los errores la esperanza y covarianza de stos es respectivamente como sigue:

E ( ) = 0 Var ( ) =

v2 1 2
2 t 1

E ( t t 1 ) = E (

v2 ) + E ( t 1 v t ) = = 1 2
2 e

v2 E ( t t s ) = s e2 = s 1 2

donde la correlacin entre cualquier par de errores es s, y entre errores consecutivos es . Haciendo sustitucin recursiva puede tambin mostrarse que el error auto correlacionado puede escribirse como un proceso autorregresivo:

t = vt + v t 1 + 2 v t 2 + ... = i vt i
i =0

y cuando ||<1 se dice que el proceso autorregresivo es estacionario, es decir la media y varianza de e no cambian a travs del tiempo. En este caso puede mostrase que la matriz de covarianzas de los errores tiene la siguiente forma:

1 2 v = v2 = 1 2 T 1

T 1 T 2
1

T 2

y que la matriz P apropiada para efectos de correccin por MCG es:

1 2 P= 0 ... 0

0 1 ... 0

0 0 1

... ... ...

... ... ...

0 0 0 ... 1

28

El concepto de procesos autorregresivo (AR) y procesos ARIMA son desarrollados en el captulo 8 y 9.

91

En efecto, al multiplicar la matriz Y y la matriz X por P (es decir implementar MCG) se generan las siguientes series nuevas para Y y para (no incluimos la transformacin de X pues es trivial):

1 2 P Y = 0 0

0 1 0

0 0 1

0 Y1 Y1 1 2 0 Y2 Y2 Y1 . 0 . = . . Y 1 T YT YT 1

1 2 P = 0 0

0 1 0

0 0 1

0 1 1 1 2 0 2 2 1 . 0 . = . . 1 T T T 1

Puesto que anteriormente especificamos que

t = t 1 + vt , tal que V estaba bien comportado,

entonces el nuevo error en el modelo transformado (P=*) est efectivamente bien comportado, con lo cual se corrige el problema de errores autocorrelacionados. Ntese que la solucin de la correlacin de 1 orden consiste en calcular primeras diferencias a las series, es decir restar a cada valor de Y su valor anterior, multiplicado por , es decir Yt*=Yt-Yt-1. Este procedimiento particular de MCG es llamado Primeras Diferencias Generalizadas. Note que si =1, se tienen primeras diferencias simples.

4.3.2. DETECCION DE AR(1): DURBIN-WATSON (1951)


Si bien el procedimiento inicial de deteccin es normalmente el grfico (errores versus X, Y29), el procedimiento de Durbin-Watson (DW) es el estndar, el que es reportado en la salida de la regresin en RATS. El test de DW mide solamente la asociacin entre residuos adyacentes (correlacin serial de 1 orden) y requiere un intercepto en la regresin. El test de DW es el siguiente:

d=

T t =2

(e t e t 1 ) 2
T t =1

et2

el que puede mostrarse se encuentra entre 0 y 4, tal que: Si d cercano a 0, existe correlacin de 1 orden en los residuos positiva. Si d cercano a 2, no hay correlacin de 1 orden Si d cercano a 4, la correlacin es perfecta negativa.
29

A diferencia de la deteccin grfica de la heterocedasticidad, aqu los errores al cuadrado normalmente no son de utilidad.

92

Para probar Ho: no existe correlacin, Durbin-Watson tabularon las zonas de indecisin buscadas en la tabla de DW para T observaciones y K parmetros y un error de % es como sigue: dl y du = son los lmites inferior y superior de la zona de indecisin para el caso de sospecha de autocorrelacin positiva. Deben buscarse en una tabla. 4-du y 4-dl = son los lmites inferior y superior de la zona de indecisin para el caso de sospecha de autocorrelacin negativa. En trminos grficos:

Z o n a s d e in d e c is i n

dl

du

4 -d u

4 -d l

A R p o sitiv a

No AR

A R N e g a tiv a

Note que cuando T es grande, al resolver la suma del binomio al cuadrado en el numerador, el primer trmino al cuadrado es igual al segundo trmino al cuadrado, entonces:

d 2 1

ee e
t

t 1

2 t

~ = 2(1 )

donde es el coeficiente de correlacin estimado entre et y et-1. Luego, conocido el valor del test de Durbin-Watson, d, podemos despejar un estimador de , puesto que =1-d/2.

Ejemplo:

En el ejemplo anterior de inventario y ventas: linreg(noprint) inventario # constant ventas dis %durbin 0.69677 ;* sospechamos AR positiva en los errores

;* puesto que T=20, y K=2, buscamos en la tabla de DW al 5%, y dl=1.201 y du=1.411 que constituye el rango de indecisin. Puesto que 0.69677<1.201 tenemos evidencia suficiente para rechazar Ho a cambio de AR positiva.

93

4.3.3. DETECCION EN MODELOS CON Y REZAGADA: Test h de Durbin


El test de DW es sesgado cuando existen variables dependientes rezagadas (yt-1) y en los modelos de tiempo del tipo ARMA. En el primer caso debe usarse el test h de Durbin (1970), que es ms simple y robusto en este tipo de situaciones. En efecto, cuando se tiene un modelo con variables explicativas rezagadas (un modelo AR), entonces esa variable se relaciona con el trmino de error, lo que viola gravemente un supuesto del sistema lineal, entregando estimaciones sesgadas e inconsistentes del coeficiente de yt-1. Tambin el estadstico DW estara sesgado hacia 2, de modo que en muchos casos no detectaramos correlacin aunque existiera. El test h de Durbin para detectar AR (Ho: no autocorrelacin), es el siguiente:

h=

T N (0,1) 1 T V (b1 )

Como se ve, este test es de carcter asinttico (vlido en grandes muestras) y se distribuye normal estndar, de modo que lamentablemente tiene bajo poder para muestras pequeas. Aqu V(b1) es la varianza del coeficiente que contiene la serie Y rezagada. puede ser obtenido a partir del test DW anterior. Note que no est definido para T*V(b1)>0, de modo que en este caso h=0.

Ejemplo:

Una estimacin de demanda por alimentos, con T=50 entrega el siguiente resultado: Log Qt = 0.65 - 0.31 log Pt + 0.45 log Yt + 0.65 log Qt-1 Err st (0.14) (0.05) (0.20) (0.14) R2 = 0.90 y DW = 1.8

La varianza del coeficiente de Qt-1 es 0.14**2 = 0.0196. H = 0.1 * (50/(1-50*0.0196))**0.5 = 5.0 (vs. 2.575) que es significativo al 1% y rechazamos =0. Ejemplo: Un clculo ms general para el test es el siguiente: LINREG Y # CONSTANT Y{1} X1 X2 COM DENOM=1-%NOBS*%SEESQ*%XX(2,2) IF DENOM>0 COM H=%RHO*SQRT(%NOBS/DENOM) ELSE COM H=0.0 END IF CDF NORMAL H Esto es, usando un ciclo que determinar automticamente si el denominador es cero o no, y aplicando en cada caso el test que corresponda.

94

4.3.4. DETECCION DE LA AUTOCORRELACION DE ORDEN SUPERIOR


a) Test de BREUSCH (1978) Y GODFREY (1978) Es una generalizacin del test h de Durbin en base al test LM, y permite probar Ho: inexistencia de correlacin de orden N. Ejemplo: En el ejemplo anterior de inventario y ventas: linreg(noprint) inventario / errores # constant ventas Linreg(noprint) inventario # constant ventas errores{1 to 3} cdf chisq %trsq 3 Chi-Squared(3)= 16.980064 with Significance Level 0.00071345

;* rechazamos Ho: 1=2=3=0, es decir existe AR hasta 3 orden.

95

b) Test Q de Ljung y Box (1978) (Box-Jenkins model identification)30 En un test muy popular para detectar correlacin serial de altos rdenes, aunque sus resultados son tambin asintticos, es decir tiene baja potencia para correlaciones de bajos rdenes.

Q( M ) = T (T + 2)
i =1

ri 2 (T i)

2 (M )

donde ri es el i-simo rezago de autocorrelacin de los residuos. M es el nmero de autocorrelaciones usadas, y la hiptesis es: Ho: todos los coeficientes de correlacin son cero, 1, 2, 3.....M=0 con: Para efectos de calcular la significancia marginal en RATS, el nmero de grados de libertad es M,

T M = min , 3 T 4
excepto para modelos ARIMA, en que el nmero de grados de libertad es M-(nmero de parmetros ARMA). Ejemplo: En el ejemplo anterior: linreg inventario # constant ventas dis %QSTAT 8.53832 dis %QSIGNIF 0.12896 ;* es decir no podemos rechazar que las primeras 5 autocorrelaciones son cero. En efecto: cdf chitest 8.53832 Chi-Squared(5)= 5 8.538320 with Significance Level 0.12895760 ;* corresponde a una Chi(5), pues 5 < 13.41641

Si desea calcularse el test Q para diferente nmero de rezagos, es decir no necesariamente 5 como en el ejemplo anterior, entonces puede usarse la instruccin CORRELATE, tal como mostramos a continuacin.

Ejemplo:

En el ejemplo de inventarios y ventas: Correlate(qstats, number=6, span=1) ee ;* los errores de la regresin han sido guardados en la serie ee. La opcin qstats indica que se requiere el test Q, y la opcin number indica que se requiere el test para los primeros 6 rezagos. La opcin span indica el nmero de intervalos de clculo.

30

Un test previo (ya obsoleto) fue el de Box-Pierce(1970):

Q * (k ) = T ri 2 2 (k )
i =1

96

Correlations of Series EE Annual Data From 1979:01 To 1998:01 Autocorrelations 1: 0.5422625 -0.0230208 -0.1816261 0.0078109 0.1712587 0.0015882 ;* Autocorrelations son las autocorrelaciones entre los residuos31. Ljung-Box Q-Statistics Q(1) = 6.8095. Q(2) = 6.8225. Q(3) = 7.6763. Q(4) = 7.6780. Q(5) = 8.5383. Q(6) = 8.5384.

Significance Significance Significance Significance Significance Significance

Level Level Level Level Level Level

0.00906717 0.03299989 0.05319722 0.10411211 0.12895756 0.20125021

;* ntese que Q(5) entrega el mismo resultado que en el ejemplo anterior. Otro aspecto a notar es que en algunos modelos ms complejos (por ejemplo ARIMA) esta prueba Q requiere un ajuste por grados de libertad. Nota: Cuando se calculan autocorrelaciones para pruebas de correlacin serial y evaluacin de modelos de autocorrelacin, es deseable usar el mismo divisor a cualquier rezago, lo que preserva varias propiedades deseables para varias consideraciones relacionadas con series de tiempo. En consecuencia, se usar:

rt ,t i =

et et i
t =2 T

e
t =1

en lugar de rt ,t i =

e e
t =2 t T T t =2

t i

2 t

et2 et2i
t =2

Si se desea graficar los Autocorrelogramas y parcialcorrelogramas de los residuos puede usarse el procedure bjident.src (lo veremos con detalle en el captulo de series de tiempo): source(noecho) c:\bjident.src @bjident resid1 ;* grafica las correlaciones de los residuos almacenados en resid1

31

97

4.3.4. CORRIGIENDO LA AUTOCORRELACION EN RATS: PRIMERAS DIFERENCIAS


Hemos dicho que la forma de corregir la autocorrelacin de errores de primer orden en RATS es a travs de primeras diferencias generalizadas (PDG), para lo cual es requerido una estimacin del coeficiente de correlacin de los errores (). La forma ms simple es obtener una estimacin de a partir del estadstico DW, sin embargo veremos mtodos ms precisos de estimacin a travs de la instruccin AR1. Veamos la implementacin de PDG a travs de un ejemplo:

Ejemplo:

En el ejemplo de inventarios y ventas linreg(noprint) inventario # constant ventas dis %DURBIN 0.69677 COM RO = 1-%DURBIN/2 dis RO 0.65161 ;* es la estimacin de basada en DW SET YP = inventario-RO*inventario{1} ;* implementando MCG, es decir PDG SET YP 1 1 = (1-RO**2)**0.5*inventario ;* en cada serie la primera observacin debe ajustarse de un modo diferente SET X2P = ventas-RO*ventas{1} SET X2P 1 1 = (1-RO**2)**0.5*ventas SET X1P = 1-RO*1 ;* para el intercepto SET X1P 1 1 = (1-RO**2)**0.5*1 LINREG YP # X1P X2P ;* la regresin corregida por PDG (sin constante) ;* el modelo sin corregir

Dependent Variable YP - Estimation by Least Squares Annual Data From 1979:01 To 1998:01 Usable Observations 20 Degrees of Freedom Centered R**2 0.939470 R Bar **2 0.936107 Uncentered R**2 0.989942 T x R**2 19.799 Mean of Dependent Variable 41.776214428 Std Error of Dependent Variable 19.133036908 Standard Error of Estimate 4.836281026 Sum of Squared Residuals 421.01305500 Durbin-Watson Statistic 1.259994 Q(5-0) 6.623975 Significance Level of Q 0.25014080

18

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. X1P 9.8315102285 5.7974035294 1.69585 0.10714180 2. X2P 1.5602664956 0.0812988275 19.19175 0.00000000 ;* puesto que Durbin-Watson Statistic = 1.259994 y dl=1.201 y du=1.411 se encuentra en la zona de indecisin.

98

LA INSTRUCCIN AR1 La instruccin AR1 efecta PDG al modelo a partir de una estimacin de correlacin serial . AR1 tiene opciones para elegir entre 4 mtodos de estimacin del coeficiente . a) Mtodo iterativos: El principal mtodo es el de Cochrane-Orcutt (1949), que corresponde a la opcin CORC en RATS. El procedimiento consiste en correr el modelo original y guardar los residuos. Luego correr los residuos contra los residuos rezagados (sin intercepto). Implementar PDG, calcular los residuos sobre el modelo original pero con los nuevos coeficientes estimados y estimar nuevos residuos. Correr nuevamente PDG usando la ultima estimacin de . As sucesivamente hasta converger en la estimacin de . Estos mtodos iterativos son ms rpidos, sin embargo no garantizan que se encuentre el ptimo. Si hay variables dependientes rezagadas CORC entrega un resultado sesgado, y debe usarse HILU. b) Mtodo no iterativos: El principal es el de Hidreth-Lu (1960), que corresponde a la opcin HILU en RATS. Consiste en calcular PDG usando diferentes valores de entre -1 y 1. Se escoge aquel que entregue la menor Suma Cuadrada de Residuos. En muestras grandes entrega el mismo resultado de Mxima Verosimilitud. Otros mtodos basados en el criterio de mxima verosimilitud se implementan con la opcin SEARCH y con MAXL. Podemos verificar estos resultados usando la instruccin ar1 con la opcin CORC y MAXL de RATS siguiendo el ejemplo anterior. Ejemplo: La correccin de Cochrane-Orcutt: AR1(METHOD=corc) inventario # CONSTANT ventas Dependent Variable INVENTARIO - Estimation by Cochrane-Orcutt Annual Data From 1980:01 To 1998:01 Usable Observations 19 Degrees of Freedom 16 Centered R**2 0.989581 R Bar **2 0.988278 Uncentered R**2 0.998409 T x R**2 18.970 Mean of Dependent Variable 105.87894737 Std Error of Dependent Variable 46.17620333 Standard Error of Estimate 4.99934157 Sum of Squared Residuals 399.89465850 Durbin-Watson Statistic 1.443620 Q(4-1) 6.140217 Significance Level of Q 0.10498413 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 15.871887522 9.651170285 1.64456 0.11956256 2. VENTAS 1.492261658 0.113915934 13.09967 0.00000000 ******************************************************************************* 3. RHO 0.743057461 0.197925645 3.75423 0.00173224 ;* el coeficiente estimado es 0.743057461

Ejemplo:

La correccin de Hidreth-Lu AR1(METHOD=hilu) inventario # CONSTANT ventas

99

Dependent Variable INVENTARIO - Estimation by Hildreth-Lu Annual Data From 1980:01 To 1998:01 Usable Observations 19 Degrees of Freedom 16 Centered R**2 0.989581 R Bar **2 0.988278 Uncentered R**2 0.998409 T x R**2 18.970 Mean of Dependent Variable 105.87894737 Std Error of Dependent Variable 46.17620333 Standard Error of Estimate 4.99934157 Sum of Squared Residuals 399.89465850 Durbin-Watson Statistic 1.443629 Q(4-1) 6.140247 Significance Level of Q 0.10498272 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 15.872102891 9.651368445 1.64454 0.11956494 2. VENTAS 1.492259063 0.113917491 13.09947 0.00000000 ******************************************************************************* 3. RHO 0.743063504 0.197924711 3.75427 0.00173206 ;* el coeficiente estimado es 0.743063504 Al implementar la correccin AR1 en RATS, por simplicidad no se considera que la primera observacin tiene un tratamiento diferente de las dems, de modo que en realidad lo que se hace es aplicar el procedimiento de PDG a las T observaciones. Verifiquemos entonces a travs del siguiente ejemplo como se implementa el procedimiento de Cochrane-Orcutt.

Ejemplo:

Para los datos del ejemplo de inventario y ventas, ntese que es posible verificar paso a paso el resultado de la estimacin de Cochrane-Orcutt anterior como sigue: COM RO = 0.743057461 ;* definimos como el obtenido en CORC

SET YP = inventario-RO*inventario{1} SET X2P = ventas-RO*ventas{1} SET X1P = 1-RO*1 LINREG YP # X1P X2P ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. X1P 15.871887527 9.363010474 1.69517 0.10828013 2. X2P 1.492261658 0.110514689 13.50284 0.00000000 ;* que corresponde al mismo resultado de CORC.

100

4.4.

ESTIMACION ROBUSTA

Si la forma de la varianza de los errores, E('), es conocida, puede ser posible obtener estimadores eficientes usando alguna forma de Mnimos Cuadrados Generalizados, tal como MCP (con opcin SPREAD en RATS) o a travs de PDG (con la instruccin AR1 en RATS). Sin embargo, si esto no ocurre, es decir, si no se tiene informacin acerca de la forma de E('), White(1980) y Newey y West (1987) mostraron que es posible obtener estimaciones robustas de los coeficientes de regresin ante autocorrelacin y heterocedasticidad, es decir resultados vlidos para grandes muestras (propiedades asintticas). Veamos la mecnica de este procedimiento, llamado estimacin robusta. Sabemos que la varianza de los coeficientes es:

cov( ) = ( X ' X ) 1 X ' E ( ' ) X ( X ' X ) 1


o alternativamente:

cov( ) = ( X ' X ) 1 m cov( X , ) ( X ' X ) 1


donde = son los errores del modelo de regresin X = es la matriz de variables explicatorias El procedimiento de estimacin robusta define la matriz mcov de diferentes modos, como veremos a continuacin, a efectos de corregir la varianza de los errores y por este intermedio la matriz de covarianzas de los coeficientes. Ejemplo: Si se tiene un modelo lineal del tipo observaciones como sigue. ALL 9 DATA(UNIT=INPUT,ORG=OBS) / y x1 x2 100 100 100 106 104 99 107 106 110 120 111 126 110 111 113 116 115 103 123 120 102 133 124 103 137 126 98 linreg y # constant x1 x2 Dependent Variable Y - Estimation by Least Squares Usable Observations 9 Degrees of Freedom Centered R**2 0.938502 R Bar **2 0.918003 Uncentered R**2 0.999376 T x R**2 8.994 Mean of Dependent Variable 116.88888889 Std Error of Dependent Variable 12.55432639 Standard Error of Estimate 3.59493951 Sum of Squared Residuals 77.541540508 Regression F(2,6) 45.7825 Significance Level of F 0.00023258 Durbin-Watson Statistic 1.635298

Yt = 0 + 1 X 1 + 2 X 2 + t

y T=9

101

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -49.34133898 24.06088696 -2.05069 0.08616009 2. X1 1.36423789 0.14315290 9.52994 0.00007617 3. X2 0.11388062 0.14337364 0.79429 0.45728186

;* construimos la variable sigmaid conteniendo el error estndar de la estimacin (E()), y X la matriz conteniendo las variables explicativas (y un vector de unos como intercepto). Podemos calcular la matriz de covarianzas de los coeficientes como sigue: com var =inv((tr(X)*X))*(tr(X)*X *sigmaid)*inv((tr(X)*X)) WRI VAR 578.9263 -2.6911 -2.5792 -2.6911 0.0205 3.5420e-003 -2.5792 3.5420e-003 0.0206

do II=1,3 wri (var(II,II))**0.5 end do ;* las desviaciones estndar de los coeficientes son 24.0609 0.1432 0.1434 ;* que corresponde al resultado del modelo sin corregir.

4.4.1. CORRECCION DE WHITE (1980)


Intenta corregir solamente por heterocedasticidad reemplazando 2 en 2(XX) por una matriz TxT que contiene en su diagonal cada error al cuadrado, es decir pre y postmultiplicar XX por el vector de errores.

m cov = t t X t ' X t k t k
y hacemos ddiag es la matriz diagonal que contiene los errores al cuadrado en la diagonal.

Ejemplo:

En el ejemplo anterior, obtenemos la matriz mcov corregida: com var =inv((tr(X)*X)) WRI VAR 283.2035 -0.8457 -1.8279 *(tr(X)*ddiag*X) -1.8279 -8.9365e-005 0.0177 *inv((tr(X)*X))

-0.8457 7.7754e-003 -8.9365e-005

do II=1,3 wri (var(II,II))**0.5 end do 16.8287 0.0882 0.1332 ;* son los errores estndar de los coeficientes bajo la correccin de White.

102

En RATS la correccin anterior (solamente por heterocedasticidad) implica usar la opcin ROBUSTERRORS (sin LAGS). Ejemplo: linreg(robusterrors) y # constant x1 x2 Dependent Variable Y - Estimation by Least Squares Usable Observations 9 Degrees of Freedom Centered R**2 0.938502 R Bar **2 0.918003 Uncentered R**2 0.999376 T x R**2 8.994 Mean of Dependent Variable 116.88888889 Std Error of Dependent Variable 12.55432639 Standard Error of Estimate 3.59493951 Sum of Squared Residuals 77.541540508 Durbin-Watson Statistic 1.635298

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -49.34133898 16.82865139 -2.93198 0.00336804 2. X1 1.36423789 0.08817821 15.47137 0.00000000 3. X2 0.11388062 0.13317015 0.85515 0.39246742 ;* lo que verifica la correccin (reduccin) en el error estndar de los coeficientes. Ntese que los coeficientes propiamente tales no se ven alterados.

4.4.2. CORRECCION DE NEWEY Y WEST (1987)


Sugieren reemplazar 2 por una suma de matrices TxT, las que son ponderadas de acuerdo a cada rezago (k) considerando que el rezago mximo es L (note que en caso de White la ponderacin es 1).

k L m cov = k = L t et X t ' X t k et k 1 L + 1
donde L indica el grado del error de medias mviles que se desea corregir por autocorrelacin de acuerdo al horizonte de prediccin (por ejemplo si se trata de una prediccin de k=3 periodos, entonces L=3-1=2, y existirn 5 sumandos en mcov). Ejemplo: En el ejemplo anterior con T=9, si L=2, existirn 5 sumandos en mcov, y cada una de ellos ser ponderado por (1-2/3), (1-1/3), (1), (1+1/3), (1+2/3) respectivamente. Definamos x1 a la 1 fila de la matriz X; x2 la 2 fila, etc. y definamos u1 el 1 residuo; u2 el 2 residuo; etc. La matriz mcov ser la suma de: com mcov = xx1+xx2+xx3+xx4+xx5 donde: com xx1 = (u1*tr(x1)*x3*u3 + u2*tr(x2)*x4*u4 + u3*tr(x3)*x5*u5 + $ u4*tr(x4)*x6*u6 + u5*tr(x5)*x7*u7 + u6*tr(x6)*x8*u8 + u7*tr(x7)*x9*u9)*(1-2/3) com xx2 = (u1*tr(x1)*x2*u2 + u2*tr(x2)*x3*u3 + u3*tr(x3)*x4*u4 + $

103

u4*tr(x4)*x5*u5 + u5*tr(x5)*x6*u6 + u6*tr(x6)*x7*u7 + u7*tr(x7)*x8*u8 + $ u8*tr(x8)*x9*u9 )*(1-1/3) com xx3 = (u1*tr(x1)*x1*u1 + u2*tr(x2)*x2*u2 + u3*tr(x3)*x3*u3 + $ u4*tr(x4)*x4*u4 + u5*tr(x5)*x5*u5 + u6*tr(x6)*x6*u6 + u7*tr(x7)*x7*u7 + $ u8*tr(x8)*x8*u8 + u9*tr(x9)*x9*u9)*(1-0/3) com xx4 = (u2*tr(x2)*x1*u1 + u3*tr(x3)*x2*u2 + u4*tr(x4)*x3*u3 + $ u5*tr(x5)*x4*u4 + u6*tr(x6)*x5*u5 + u7*tr(x7)*x6*u6 + u8*tr(x8)*x7*u7 + $ u9*tr(x9)*x8*u8 )*(1-1/3) com xx5 = (u3*tr(x3)*x1*u1 + u4*tr(x4)*x2*u2 + u5*tr(x5)*x3*u3 + $ u6*tr(x6)*x4*u4 + u7*tr(x7)*x5*u5 + u8*tr(x8)*x6*u6 + u9*tr(x9)*x7*u7)*(1-2/3) com mcov = xx1+xx2+xx3+xx4+xx5 com var = inv((tr(X)*X)) * (mcov) * inv((tr(X)*X)) ;* la matriz de covarianzas corregida de los coeficientes do II=1,3 wri (var(II,II))**0.5 end do

;* son los errores estndar corregidos

En RATS este ajuste es ofrecido por la instruccin ROBUSTERRORS pero agregando la opcin LAGS=L (para corregir por autocorrelacin hasta un proceso de medias mviles del grado L) y DAMP=1.0 (para el estimador de Newey-West, aunque pueden obtenerse otros ajustes con otro valor de DAMP, pero son poco usados). Ejemplo: linreg(robusterrors, lags=2, damp=1) y # constant x1 x2 Dependent Variable Y - Estimation by Least Squares Usable Observations 9 Degrees of Freedom Centered R**2 0.938502 R Bar **2 0.918003 Uncentered R**2 0.999376 T x R**2 8.994 Mean of Dependent Variable 116.88888889 Std Error of Dependent Variable 12.55432639 Standard Error of Estimate 3.59493951 Sum of Squared Residuals 77.541540508 Durbin-Watson Statistic 1.635298

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -49.34133898 14.82204895 -3.32891 0.00087185 2. X1 1.36423789 0.09248540 14.75085 0.00000000 3. X2 0.11388062 0.08901050 1.27941 0.20075389

Una de las dificultades para implementar la estimacin robusta puede ser determinar el valor apropiado de L, aunque en muchos casos, ste proviene de la teora, y el conocimiento que la sobre posicin de horizontes de prediccin (overlapping) genera un termino de error tipo MA de orden k-1 (donde k es el horizonte de prediccin). As, por ejemplo errores en predicciones de 6 periodos tendrn un proceso MA de orden 5 (L=5), con lo cual se captura la mayora de la correlacin serial En resumen, en RATS la opcin ROBUSTERRORS calcula los errores estndar de la regresin y la matriz de covarianzas permitiendo heterocedasticidad y correlacin serial de los residuos, y funciona junto a LAGS y DAMP en las instrucciones LINREG, NLLS, NLSYSTEM, y MAXIMIZE. Pueden definirse estructuras ms complicadas usando la instruccin WMATRIX, que es la matriz de ponderaciones usada junto a INSTRUMENTS.

104

105

4.5. MULTICOLINEALIDAD
En el modelo

Yt = 0 + 1 X 1 + 2 X 2 + t

la multicolinealidad (o colinealidad) se presenta

cuando hay correlacin lineal entre las variables explicativas X1 y X2, de modo que ambas variables, en el fondo, estn midiendo el mismo fenmeno. La presencia de alta colinealidad entre las variables explicativas X1 y X2 impide que se pueda estimar con precisin los coeficientes de la regresin, es decir el efecto de cada una de estas variables sobre Y, debido a que MCO no puede "separar" el efecto de X1 sobre Y, y el efecto de X2 sobre Y. As, se esperan relativamente altos errores estndar para los coeficientes.

Ejemplo:

En el modelo

Yt = 0 + 1 X 1 + 2 X 2 + t ,

asumamos que X1 y X2 estn

correlacionadas: ALL 9 DATA(UNIT=INPUT,ORG=OBS) / y x1 100 100 106 104 107 106 120 111 110 111 116 115 123 120 133 124 137 126 set x2 = 2*x1-4 ;* X2 presenta multicolinealidad perfecta con X1, es decir X2 es una combinacin lineal de X1. La correlacin entre ambas series es +1 en este caso.

set x3 = 2*x1-4 + %RAN(2) ;* agregamos un error normal con media cero y desviacin estndar 2.0 para generar una colinealidad muy alta entre X1 y X3 vcv(center) # x1 x2 x3 Covariance\Correlation Matrix X1 X2 X3 X1 72.2222222222 1.0000000000 0.9953696238 X2 144.4444444444 288.8888888889 0.9953696238 X3 149.5741206841 299.1482413682 312.6607054917 ;* en efecto, la correlacin entre X1 y X2 es 1.0, mientras la correlacin entre X1 y X3 es muy alta pero no perfecta, igual a 0.9953696238

4.5.1. MULTICOLINEALIDAD PERFECTA


En este caso MCO simplemente no puede estimar el coeficiente de X2 (no es posible invertir la matriz (XX) para calcular ). Contradictoriamente el estadstico R2 puede ser es bastante alto, y el test F de significancia global indicar que ambos coeficientes de pendientes son estadsticamente distintos de cero!!!, lo cual no tiene sentido en la prctica. Verifiquemos esto con el ejemplo anterior:

106

Ejemplo:

linreg y # constant x1 x2 Dependent Variable Y - Estimation by Least Squares Usable Observations 9 Degrees of Freedom Centered R**2 0.932036 R Bar **2 0.922327 Standard Error of Estimate 3.49887824 Significance Level of F 0.00002448

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -35.05264957 15.55160913 -2.25396 0.05885365 2. X1 1.34461538 0.13723730 9.79774 0.00002448 3. X2 0.00000000 0.00000000 0.00000 0.00000000 ;* en efecto, el coeficiente de X2 y su error estndar no han podido ser estimados y el R2 es 0.932.

4.5.2. MULTICOLINEALIDAD MUY ALTA


En este caso ser posible obtener la estimacin de los coeficientes, pero sta ser muy ruidosa. Ejemplo: linreg y # constant x1 x3 Dependent Variable Y - Estimation by Least Squares Usable Observations 9 Degrees of Freedom Centered R**2 0.936578 R Bar **2 0.915438 Standard Error of Estimate 3.65074795 Significance Level of F 0.00025510

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -38.39564259 17.00912418 -2.25736 0.06478306 2. X1 2.08232199 1.13443331 1.83556 0.11609004 3. X3 -0.36073205 0.55029099 -0.65553 0.53643682 Ninguna de las series tiene una relacin significativa con Y al 95%. An as el R2 es bastante alto, y contradictoriamente con el test F rechazamos la hiptesis que los coeficientes son cero, es decir existe significancia global de la regresin. Podemos concluir que la multicolinealidad aumenta el error en la estimacin de los coeficientes individuales, disminuyendo los test t. Luego, que sospechamos existencia de multicolinealidad cuando los coeficientes individuales tienen bajas significancias, pero el estadstico R2 es alto. Tambin, dado el alto error, los coeficientes estimados son altamente sensibles a cambios en las observaciones, de modo que por ejemplo eliminando un dato, los coeficientes cambiarn importantemente. El ltimo aspecto es las predicciones del modelo con multicolinealidad sern peores (alto error) que aquellas obtenidas considerando solo un pequeo grupo de variables explicativas que no son colineales. Una forma de detectar la colinealidad (alta) es considerar la Regla de Klein (1962) que afirma que "la multicolinealidad es un problema slo si la correlacin simple entre dos variables es mayor que la correlacin entre alguna stas con la variable explicada (Y)".

107

4.5.3. SOLUCIONES A LA MULTICOLINEALIDAD


Existen varios mtodos, algunos relativamente complejos, que intentan solucionar la multicolinealidad, sin embargo la multicolinealidad es un problema de la muestra (de los datos) y poco puede hacerse, a no ser que se disponga de ms informacin del proceso en estudio, de modo que la solucin bsica se encuentra en encontrar ms informacin. Caminos de solucin alternativos son eliminar del modelo una de las series que presentan colinealidad. Sin embargo debe considerarse que esto puede introducir error de especificacin.

108

CAPITULO 5 TOPICOS EN EL MODELO LINEAL GENERAL

En este captulo desarrollaremos una serie de tpicos importantes del anlisis de regresin mltiple, como lo son la prediccin (esttica), las variables dummy, el uso de las variables instrumentales para intentar resolver el problema denominado error en las variables, y finalmente el uso de datos de panel en RATS.

5.1. INTRODUCCION A LA PREDICCION EN RATS


Existen muchas formas de efectuar predicciones en RATS, incluyendo modelos de Vectores Autorregresivos, Sistemas de Ecuaciones Simultneas y Anlisis Espectral, mtodos que utilizan la poderosa instruccin FORECAST de RATS. Sin embargo, por ahora analizaremos la instruccion PRJ, que es la tradicional para la prediccin esttica en un contexto de mnimos cuadrados ordinarios.

5.1.1. EL ERROR DE PREDICCION


Antes de comentar la prediccin propiamente tal, es necesario que consideremos que la desviacin estndar del error de la prediccin individual de Y en MCO viene dada por32:

o ) = (1 + X o ' ( X ' X ) 1 X o ) (eo ) = (Yo Y

es la estimacin de Y, Xo son valores proyectados de X, y donde es el error estndar de la regresin, Y X son los valores originales. El intervalo de confianza para las predicciones en el caso de un gran nmero de observaciones es entonces (usando una distribucin t):

[Y 2.0 (e ) , Y + 2.0 (e )]
0 0

Para el caso de un modelo de regresin simple, la expresin anterior se reduce a:

1 ( Xo X ) 2 (eo ) = (Yo Yo ) = (1 + + i =T T ( X i X )2
i =1

una expresin sencilla de interpretar:


32

Vase un aspecto simplificado de la demostracin en Judge et al., seccin 5.3.3.

109

Puesto que el error estndar de prediccin crece proporcionalmente con cuadrado de la diferencia entre el valor de la variable explicativa deseado y la media observada de sta, mientras ms alejada del valor medio sea la prediccin, sta ser ms que proporcionalmente riesgosa. Por ejemplo, en un caso simple, si se tiene una muestra de 10 aos (la media es 5 aos) la varianza de la estimacin del ao 10 al ao 11 aumenta un 44% (desde 25=(10-5)^2 hasta 36=(115)^2), pero con una muestra de 3 aos como en nuestro caso, la varianza de la prediccin anual desde el ao 3 al ao 4 aumenta un 178% (desde 82.25=(3-1.5)^2 hasta 6.25=(4-1.5)^2). El error de estimacin se reduce al aumentar el nmero de observaciones (T), y al aumentar la dispersin de la variable X, medida por la suma cuadrada de la diferencia de X respecto a su media.

5.1.2. PREDICCION ESTATICA: INSTRUCCIN PRJ


Cuando tenemos una regresin simple como la anterior, los valores predichos pueden ser generados en RATS a travs de la instruccin PRJ (despus de correr la regresin con LINREG). La estructura de esta instruccin es la siguiente: PRJ series start end

donde series indica el nombre de la serie donde ser almacenada la prediccin de la ltima regresin efectuada. Start y End son los rangos sobre los cuales se efectuar la prediccin. Es importante notar que PRJ requiere que se encuentren definidas todas las variables explicativas en el rango de prediccin futura. En el caso ms simple se quiere proyectar una sola serie (Y) a travs del tiempo, y no se tiene un modelo explicativo. En este caso debe generarse una serie de tendencia:

Ejemplo:

Supongamos que deseamos obtener una prediccin de Y a travs del tiempo, sin postular an que sta dependa de X. ALL 15 ;* se podrn leer hasta 15 observaciones cal 1990 1 1 DATA(UNIT=INPUT,ORG=OBS) 1 10 y x ;* se leen las 10 primeras observaciones 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 SET TENDENCIA = T ;* en este caso la regresin es planteada respecto a una tendencia

linreg(noprint) y # constant TENDENCIA CLEAR PREDICC PRJ(STDERR=ERST) PREDICC 1 15 SET UPPER = PREDICC + 2.306*ERST SET LOWER = PREDICC - 2.306*ERST ;* son los limites del intervalo de confianza. Note que puesto que T=10, se tienen 8 grados de libertad para la distribucin t.

110

print / erst predicc lower upper ENTRY 1990:01 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 2000:01 2001:01 2002:01 2003:01 2004:01 ERST 7.5314766477675 7.2549973277662 7.0405163534656 6.8938228428376 6.8192928387727 6.8192928387727 6.8938228428376 7.0405163534656 7.2549973277662 7.5314766477675 7.8634174080570 8.2441230424037 8.6671699366485 9.1266720797172 9.6174055939285 PREDICC 65.18181818182 75.36363636364 85.54545454545 95.72727272727 105.90909090909 116.09090909091 126.27272727273 136.45454545455 146.63636363636 156.81818181818 167.00000000000 177.18181818182 187.36363636364 197.54545454545 207.72727272727 LOWER 47.81423303207 58.63361252581 69.31002383436 79.83011725169 90.18380162288 100.36561980470 110.37557179714 120.21911474345 129.90633979853 139.45059666843 148.86695945702 158.17087044604 167.37714248973 176.49934872963 185.54953542767 UPPER 82.54940333157 92.09366020147 101.78088525655 111.62442820286 121.63438019530 131.81619837712 142.16988274831 152.68997616564 163.36638747419 174.18576696793 185.13304054298 196.19276591760 207.35013023755 218.59156036128 229.90501002687

graph(KEY=LORIGHT, patterns) 4 # Y # PREDICC # UPPER # LOWER


250

225

200

175

150

125

100

75

50

Y PREDICC UPPER LOWER

25 1990 1992 1994 1996 1998 2000 2002 2004

Ejemplo:

Cuando se tiene un modelo de regresin que explica a Y, entonces el procedimiento es el mismo anterior. Recuerde que PRJ efectuar la prediccin a la ltima regresin que se ha efectuado. linreg(noprint) y # constant X dis %seesq 42.15909 CLEAR PREDICC PRJ(STDERR=ERST) PREDICC 1 15 ;* X explica a Y linealmente

111

SET UPPER = PREDICC + 2.306*ERST SET LOWER = PREDICC - 2.306*ERST print / x predicc lower upper ENTRY 1990:01 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 X 80.00000000000 100.00000000000 120.00000000000 140.00000000000 160.00000000000 180.00000000000 200.00000000000 220.00000000000 240.00000000000 260.00000000000 PREDICC 65.18181818182 75.36363636364 85.54545454545 95.72727272727 105.90909090909 116.09090909091 126.27272727273 136.45454545455 146.63636363636 156.81818181818 LOWER 47.81423303207 58.63361252581 69.31002383436 79.83011725169 90.18380162288 100.36561980470 110.37557179714 120.21911474345 129.90633979853 139.45059666843 UPPER 82.54940333157 92.09366020147 101.78088525655 111.62442820286 121.63438019530 131.81619837712 142.16988274831 152.68997616564 163.36638747419 174.18576696793

;* as se tiene por ejemplo, que la prediccin de Y cuando X=100 es 75.36 con un intervalo de confianza entre 58.63 y 92.09. scat(KEY=LORIGHT, STYLE=LINES,patterns, hlabel='serie X', vlabel='serie Y') 4 # X Y # X PREDICC # X UPPER # X LOWER
180

160

140

120

serie Y

100

80

60
Y PREDICC UPPER LOWER

40 80 120 160 200 240 280

serie X

;* en el caso que busquemos una prediccin para valores distintos de X, como por ejemplo X=270, 272, 274, 276 278, entonces puede agregarse estas observaciones y repetir el procedimiento anterior como sigue: DATA(UNIT=INPUT) 11 15 x 270 272 274 276 278 CLEAR PREDICC PRJ(STDERR=ERST) PREDICC 1 15 SET UPPER = PREDICC + 2.306*ERST

112

SET LOWER = PREDICC - 2.306*ERST print / x predicc lower upper ENTRY 1990:01 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 2000:01 2001:01 2002:01 2003:01 2004:01 X 80.00000000000 100.00000000000 120.00000000000 140.00000000000 160.00000000000 180.00000000000 200.00000000000 220.00000000000 240.00000000000 260.00000000000 270.00000000000 272.00000000000 274.00000000000 276.00000000000 278.00000000000 PREDICC 65.18181818182 75.36363636364 85.54545454545 95.72727272727 105.90909090909 116.09090909091 126.27272727273 136.45454545455 146.63636363636 156.81818181818 161.90909090909 162.92727272727 163.94545454545 164.96363636364 165.98181818182 LOWER 47.81423303207 58.63361252581 69.31002383436 79.83011725169 90.18380162288 100.36561980470 110.37557179714 120.21911474345 129.90633979853 139.45059666843 144.17379466125 145.11476808351 146.05455577932 146.99317326646 147.93063601874 UPPER 82.54940333157 92.09366020147 101.78088525655 111.62442820286 121.63438019530 131.81619837712 142.16988274831 152.68997616564 163.36638747419 174.18576696793 179.64438715693 180.73977737103 181.83635331159 182.93409946081 184.03300034490

;* y la prediccin para X=272 es Y=162.927 con lmites entre 145.11 y 180.7.

5.1.3. CASO PRACTICO


Comenzaremos analizando el caso desarrollado por Hall, R., J. Johnston y D. Lilien (1990). Se trata de efectuar una prediccin del ingreso del prximo ao de una cadena de hoteles. El ingreso total viene dado por: INGRESO TOTAL = OCUPACION * INGRESO POR HABITACION * NUMERO DE HABITACIONES La informacin disponible es la siguiente: all 12 cal 1990 1 1 data(unit=input,org=obs) 1990:1 2000:1 CPR GNP OCCUP PGNP ROOMS RRATE UNEMP ... Ver datos en Tabla 6 en el Anexo al final del libro.

Note que ALL ya previ que se iba a hacer una prediccin, y que DATA define el rango de datos existentes solamente. Intentamos proyectar separadamente la tasa de ocupacin (OCCUP, porcentaje de habitaciones usadas por noche), el ingreso por habitacin (RRATE, ingreso promedio por habitacin usada por noche) y el numero de habitaciones (ROOMS, nmero de habitaciones en la cadena de hoteles). a) Ocupacin (OCCUP) Probablemente est relacionada con medidas generales de la economa, tal como la tasa de desempleo o las tasas de inters. Puesto que la ocupacin parece mostrar una tendencia creciente, puede ser necesario considerar una variable de tendencia en el modelo.

113

75.0

72.5

ocupacion

70.0

67.5

65.0 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

set trend = T+10

;*creamos la variable de tendencia que comienza en T=10

linreg occup # constant unemp trend Dependent Variable OCCUP - Estimation by Least Squares Annual Data From 1990:01 To 2000:01 Usable Observations 11 Degrees of Freedom 8 Centered R**2 0.831986 R Bar **2 0.789983 Uncentered R**2 0.999773 T x R**2 10.997 Mean of Dependent Variable 70.009090909 Std Error of Dependent Variable 2.703499416 Standard Error of Estimate 1.238949965 Sum of Squared Residuals 12.279976126 Regression F(2,8) 19.8076 Significance Level of F 0.00079686 Durbin-Watson Statistic 1.556777 Q(2-0) 4.357484 Significance Level of Q 0.11318385 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 69.09285968 2.38288933 28.99541 0.00000000 2. UNEMP -1.85418223 0.38522907 -4.81319 0.00133289 3. TREND 0.78418817 0.13406162 5.84946 0.00038301

Se aprecia una relacin inversa entre desempleo y ocupacin de habitaciones (como se esperara), y la relacin positiva de la entre la tendencia y la ocupacin. En este punto existen 3 posibilidades. Hacer una prediccin del desempleo y usar la regresin anterior para predecir la ocupacin de habitaciones, pero esto sera un error, ya que se estar usando un coeficiente de 1.85 inapropiado. Hacer una prediccin del desempleo y regresionar ste contra la ocupacin. En este caso el coeficiente de pendiente debe ser menor a 1.85 anterior, lo que sera correcto. Utilizar una especificacin que incluya informacin rezagada de las variables para efectos de prediccin (esto es, una especificacin AR). Esto es lo que hacemos ahora, de modo que eliminamos la tendencia, pues en general esto es efectuado cuando se tiene la variable dependiente rezagada como regresor.

114

Incorporamos tambin la tasa de inters de corto plazo (Commercial Paper Rate) en la estimacin: linreg occup # constant occup{1} unemp{1} CPR{1} Dependent Variable OCCUP - Estimation by Least Squares Annual Data From 1991:01 To 2000:01 Usable Observations 10 Degrees of Freedom 6 Centered R**2 0.889881 R Bar **2 0.834822 Uncentered R**2 0.999842 T x R**2 9.998 Mean of Dependent Variable 70.160000000 Std Error of Dependent Variable 2.800476150 Standard Error of Estimate 1.138173393 Sum of Squared Residuals 7.7726320399 Regression F(3,6) 16.1622 Significance Level of F 0.00279761 Durbin-Watson Statistic 2.192634 Q(2-0) 0.204677 Significance Level of Q 0.90272401 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -0.50974687 11.39771250 -0.04472 0.96577892 2. OCCUP{1} 0.99297981 0.15414909 6.44168 0.00066234 3. UNEMP{1} 1.04981185 0.36579000 2.86999 0.02842764 4. CPR{1} -0.72478497 0.20525292 -3.53118 0.01235006 ;* para efectos de prediccin, usamos la instruccin PRJ

CLEAR f_occup PRJ f_occup 1 15 print / f_occup ENTRY 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 2000:01 2001:01 F_OCCUP 67.058108018077 68.907330838226 72.173630332041 68.831708077291 66.036092674233 68.766644370592 71.616023579196 73.480302503615 73.776491989580 70.953667617313 69.034366211144

As, la prediccin de la ocupacin para el ao 2001 es de 69.034. Podemos tambin hacer un grfico. GRAPH(KEY=LORIGHT,patterns) 2 # occup # f_occup

115

75.0

72.5

70.0

67.5

OCCUP F_OCCUP

65.0 1990 1992 1994 1996 1998 2000

b) Ingreso por Habitacin (Room Rate) Puesto que la variable est medida en dlares, existir un impacto por la inflacin, de modo que se requiere el uso de logaritmos. set lrrate = Log(rrate) set lpgnp = log(pgnp)

;* el deflactor del Producto

linreg lrrate # constant lrrate{1} lpgnp{1} Dependent Variable LRRATE - Estimation by Least Squares Annual Data From 1991:01 To 2000:01 Usable Observations 10 Degrees of Freedom 7 Centered R**2 0.991140 R Bar **2 0.988609 Uncentered R**2 0.999935 T x R**2 9.999 Mean of Dependent Variable 3.1164193336 Std Error of Dependent Variable 0.2825740486 Standard Error of Estimate 0.0301587226 Sum of Squared Residuals 0.0063668398 Regression F(2,7) 391.5492 Significance Level of F 0.00000007 Durbin-Watson Statistic 2.657798 Q(2-0) 2.258020 Significance Level of Q 0.32335314 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -1.191833107 0.629334730 -1.89380 0.10011477 2. LRRATE{1} 0.864638285 0.207403632 4.16887 0.00419507 3. LPGNP{1} 0.352800218 0.257697815 1.36905 0.21329312

El coeficiente de la serie LPGNP es muy bajo y tiene un alto error, sin embargo tiene sentido que puesto que los ingresos se mueven con la inflacin, el valor rezagado de sta sea un buen predictor de de los ingresos futuros, de modo que aceptamos esta especificacin.

116

CLEAR f_lrrate PRJ f_lrrate 1 15 set f_lrrate = exp(f_lrrate) print / f_lrrate ENTRY 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 2000:01 2001:01 F_LRRATE 16.021944517727 17.156882296938 17.742081756631 18.794488992671 20.067950149320 23.099273216228 24.789089494294 27.631623379875 31.541435959543 37.290545699729 42.634378537592

GRAPH(KEY=LORIGHT, patterns) 2 # rrate # f_lrrate


45

40

35

30

25

20

RRATE F_LRRATE

15 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001

c) Numero de Habitaciones set lrooms = log(rooms) set lrgnp = log(gnp/pgnp) linreg lrooms # constant lrooms{1} lrgnp{1} Dependent Variable LROOMS - Estimation by Least Squares Annual Data From 1991:01 To 2000:01 Usable Observations 10 Degrees of Freedom 7 Centered R**2 0.985239 R Bar **2 0.981021 Uncentered R**2 0.999998 T x R**2 10.000

117

Mean of Dependent Variable 12.481351862 Std Error of Dependent Variable 0.132777430 Standard Error of Estimate 0.018291881 Sum of Squared Residuals 0.0023421504 Regression F(2,7) 233.6069 Significance Level of F 0.00000039 Durbin-Watson Statistic 1.050706 Q(2-0) 3.512028 Significance Level of Q 0.17273200 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 3.6654439783 0.7203400626 5.08849 0.00141755 2. LROOMS{1} 0.6680886710 0.0818484806 8.16251 0.00008015 3. LRGNP{1} 0.2018336631 0.1374796605 1.46810 0.18552288

CLEAR f_lrooms PRJ f_lrooms 1 15 set f_rooms = exp(f_lrooms) print / f_rooms ENTRY 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 2000:01 2001:01 F_ROOMS 204582.73564693 221853.54243117 239517.58209647 260808.82240341 274511.45380586 279291.78845106 284389.71711207 288083.79274196 296048.94797308 304657.94021712 309571.53376181

GRAPH(KEY=LORIGHT, patterns) 2 # rooms # f_rooms

118

325000

300000

275000

250000

225000

200000

ROOMS F_ROOMS

175000 1990 1992 1994 1996 1998 2000

Ahora, obtenemos la prediccin final para el ao 2000: set revf = (f_occup/100)*(365*f_lrrate/1000000)*f_rooms print / f_occup f_lrrate f_rooms revf

ENTRY 1991:01 1992:01 1993:01 1994:01 1995:01 1996:01 1997:01 1998:01 1999:01 2000:01 2001:01

F_OCCUP 67.058108018077 68.907330838226 72.173630332041 68.831708077291 66.036092674233 68.766644370592 71.616023579196 73.480302503615 73.776491989580 70.953667617313 69.034366211144

F_LRRATE 16.021944517727 17.156882296938 17.742081756631 18.794488992671 20.067950149320 23.099273216228 24.789089494294 27.631623379875 31.541435959543 37.290545699729 42.634378537592

F_ROOMS 204582.73564693 221853.54243117 239517.58209647 260808.82240341 274511.45380586 279291.78845106 284389.71711207 288083.79274196 296048.94797308 304657.94021712 309571.53376181

REVF 802.2844331911 957.3330043111 1119.4723989623 1231.4994198736 1327.8154454047 1619.2994920306 1842.7971527945 2134.9564814594 2514.5243688049 2942.2458158259 3325.6700722267

119

5.2. VARIABLES DUMMY (BINARIAS)


Son variables que slo pueden tomar dos valores, en particular los valores 0 y 1. Son usadas principalmente para indicar ausencia o presencia de un atributo o evento. Ejemplos tpicos son del uso de estas variables son para: Identificar variables cualitativas: hombres versus mujeres, personas sanas versus enfermas, si se habita una casa de ms de 100 metros 2 o menos, etctera. Identificar distintos periodos: periodos de auge versus periodos de recesin, periodos de control del tipo de cambio o no, etctera.

Cuando existan 3 grupos, puede usarse 2 variables dummies para identificarlos. En efecto, si las familias son clasificados en ingresos bajos, medios y altos, D1 = 1 puede identificar el primer grupo y D2 = 1 el segundo grupo, mientras que el tercer grupo ser identificado cuando D1 y D2 sean cero. Es decir, se requieren i-1 variables dummies para identificar i grupos. Anteriormente, en la seccin 1.7.3. mostramos la forma operacional de construir variables dummies en RATS. APLICACIONES Entre los principales usos prcticos de las variables dummies en econometra se encuentran: a) Determinar diferencias de interceptos y pendientes entre regresiones, lo que puede hacerse por separado o simultneamente. En este ltimo caso se trata de una prueba de cambio estructural. b) Clculo de medias, lo que permite estimar, por ejemplo, la existencia de efectos estacionales. Analicemos a continuacin cada uno de stos usos.

120

5.2.1. DIFERENCIAS ENTRE INTERCEPTOS


Ejemplo: Se tiene informacin de remuneraciones, y del sexo y estado civil de los trabajadores: 1.- Sexo 2.- Est. civil (combinaciones vlidas para D1,D2 son: 1,0 ; 0,1 y 0,0 D1 = = D2 = = D3 = = 1 0 1 0 1 0 si masculino otro si casado otro si divorciado otro
DIVORCED=1 si divorciado; 0 si soltero o casado 0 0 1 1 0 0 0 1 1 0

Remuneracion 200 300 180 250 220 210 280 170 270 290

MALE=1 si hombre y 0 si mujer 1 1 1 1 1 0 0 0 0 0

MARRIED=1 si casado; 0 si divorciado o soltero 1 1 0 0 0 1 1 0 0 0

Remuneracin media de: mujeres = 244 hombres = 230

121

a) Si una dummy es la nica variable independente, o alternativamente, X es la misma para ambos grupos (es decir ambos grupos tienen igual pendientes):

ambas ecuaciones pueden ser combinadas en:

OLS estima b1 y b2 tal que: b1 = la media de (salario) para los valores D=0 (mujeres) b1 + b2 = la media de (salario) para los valores de D=1 (hombres) linreg y # constant d1 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 244.0000000 22.0907220 11.04536 0.00000402 2. D1 -14.0000000 31.2409987 -0.44813 0.66594768

Nota: Si X no es igual para ambos grupos, no se verificar el resultado anterior. Aqu implcitamente se est asumiendo que ambas regresiones tienen los mismos coeficientes de pendientes. Si hay ms grupos se debe introducir ms dummies. Por ejemplo para tres grupos se introducen 2 dummies:

122

5.2.2. DIFERENCIAS CONJUTAS: PENDIENTES E INTERCEPTOS

se puede escribir:

Para tres grupos:

123

Ejemplo:

Anteriormente, en la seccin 3.9. (Tabla 3.xls) efectuamos una prueba de cambio estructural en base al test de Chow. Ahora veamos la forma de efectuar esto a travs de variables dummies: set D * 9 = 1.0 set D 10 * = 0.0 print / ENTRY 1946:01 1947:01 1948:01 1949:01 1950:01 1951:01 1952:01 1953:01 1954:01 1955:01 1956:01 1957:01 1958:01 1959:01 1960:01 1961:01 1962:01 1963:01

;* creamos la variable dummy

;* verificamos el resultado AHORRO 0.3600000000000 0.2100000000000 0.0800000000000 0.2000000000000 0.1000000000000 0.1200000000000 0.4100000000000 0.5000000000000 0.4300000000000 0.5900000000000 0.9000000000000 0.9500000000000 0.8200000000000 1.0400000000000 1.5300000000000 1.9400000000000 1.7500000000000 1.9900000000000 INGRESO 8.800000000000 9.400000000000 10.000000000000 10.600000000000 11.000000000000 11.900000000000 12.700000000000 13.500000000000 14.300000000000 15.500000000000 16.700000000000 17.700000000000 18.600000000000 19.700000000000 21.100000000000 22.800000000000 23.900000000000 25.200000000000 D 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 1.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000 0.0000000000000

set DX = ingreso*D

;* creamos la serie que medir el cambio de pendientes

124

linreg ahorro # constant D ingreso DX Dependent Variable AHORRO - Estimation by Least Squares Annual Data From 1946:01 To 1963:01 Usable Observations 18 Degrees of Freedom 14 Centered R**2 0.952626 R Bar **2 0.942475 Uncentered R**2 0.981294 T x R**2 17.663 Mean of Dependent Variable 0.7733333333 Std Error of Dependent Variable 0.6428063472 Standard Error of Estimate 0.1541731575 Sum of Squared Residuals 0.3327710750 Regression F(3,14) 93.8411 Significance Level of F 0.00000000 Durbin-Watson Statistic 1.468099 Q(4-0) 7.115020 Significance Level of Q 0.12993335 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -1.750172085 0.331888275 -5.27338 0.00011773 2. D 1.483922674 0.470362072 3.15485 0.00702357 3. INGRESO 0.150450048 0.016285695 9.23817 0.00000025 4. DX -0.103422214 0.033260387 -3.10947 0.00768641 ;* puesto que todos los coeficientes son significativamente diferentes de cero, entonces, al igual que en el test de Chow, encontramos evidencia de cambio estructural.

125

5.2.3. VARIABLES DUMMIES EN EL CLCULO DE MEDIAS


Si en un modelo de regresin debe clasificarse una serie de observaciones de acuerdo a cierto nmero de caractersticas, y se define una variable para cada una de estas caractersticas, entonces el modelo de regresin sin intercepto dado por:

Yt = 1 D1 + 2 D2 + 3 D3 + ... + k Dk + et
tiene la propiedad que cada coeficiente de pendientes es la media de la serie respecto solamente a las observaciones que contienen el atributo capturado cada variable dummy D. En particular, 1 es la media de la serie en las observaciones en que D1=1, y as respectivamente para cada coeficiente. Ejemplo: Si tenemos datos diarios de los rendimientos de un ndice accionario (por ejemplo el IGPA en Chile), podemos identificar los das de la semana a que corresponden cada uno de ellos con una variable dummy respectivamente:
Rendimiento IGPA lunes 1 2 3 4 Etc. 0.23 0.33 0.12 0.47 0 0 0 0

Obs

Martes 1 0 0 0

mircoles 0 1 0 0

Jueves 0 0 1 0

viernes 0 0 0 0

Es decir el rendimiento 0.23 corresponde al da martes, 0.33 al da mircoles, etctera. Si se corre el modelo de regresin

Yt = 1 D1 + 2 D2 + 3 D3 + 4 D4 + 5 D5 + et

para D1 = lunes, D2=martes, etctera, se tendr en el coeficiente 1 el rendimiento medio de los das lunes, en 2 el rendimiento medio de los das martes, etctera. En un estudio33 usamos el siguiente modelo para analizar los diferentes efectos estacionales:

Ejemplo:

Rit =

kt + it

donde: Rit = retorno real anual del PRBCi (Pagar Reajustable del Banco Central de Chile) en el da t. El rendimiento es asumido estacionario. kt = variable dummy que toma el valor k = 1 si la observacin t pertenece al evento k, y k= 0 en cualquier otro caso. Por ejemplo 1 =1 identifica un da lunes para el efecto da de la semana, y 3 =1 identifica a marzo para el efecto mes del ao, etctera. k = es el coeficiente de la variable dummy, y corresponde al retorno medio de cada evento k it = son los errores, que se asumen independiente e idnticamente distribuidos. LINREG REAL ;* REAL es la serie con rendimientos reales de los PRBC # LUN MAR MIE JUE VIE ;* LUN, MAR, MIE,... son las variables dummy de cada da de la semana.
33 Efectos Estacionales y Relacin Volumen-Rendimiento en los Pagars Reajustables del Banco Central de Chile (2001). Revista Economa Chilena, del Banco Central de Chile. Volumen 4 Nmero 1. abril, 2001.

126

.... (omitimos parte de los resultados)

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. LUN 0.0473724622 0.0002052119 230.84655 0.00000000 2. MAR 0.0549598342 0.0002346503 234.22013 0.00000000 3. MIE 0.0567839668 0.0002498271 227.29308 0.00000000 4. JUE 0.0503303643 0.0002144062 234.74302 0.00000000 5. VIE 0.0389386377 0.0002242214 173.66157 0.00000000 ;* los resultados son altamente significativos. Podemos verificar si efectivamente 0.0389386377 en el rendimiento promedio de los das viernes: SET(scratch) RRAA = VIE==1.0 STAT(SMPL=RRAA) REAL Statistics on Series REAL Observations 20480 (102525 Total - 82045 Skipped/Missing) Sample Mean 0.03893863770 Variance 0.001120 Standard Error 0.03346886012 SE of Sample Mean 0.000234 t-Statistic 166.49638 Signif Level (Mean=0) 0.00000000 Skewness -1.28768 Signif Level (Sk=0) 0.00000000 Kurtosis 4.44570 Signif Level (Ku=0) 0.00000000 ;* luego, el resultado es correcto para el da viernes. Para probar la hiptesis que los rendimientos de los PRBC son iguales a travs de los das de la semana (efecto da de la semana), Ho: lunes = martes = mircoles = jueves = viernes Note que Ho puede escribirse como las siguientes diferencias simultneas del siguiente modo: ;* creamos la serie RRAA que identifica los das viernes

lunes - martes = 0 lunes - mircoles = 0 lunes - jueves = 0 lunes - viernes = 0


de modo que la instruccin RESTRICT para implementar el test de Wald es: RESTR # 1 2 # 1.0 # 1 3 # 1.0 # 1 4 # 1.0 # 1 5 # 1.0 4 -1.0 0.0 -1.0 0.0 -1.0 0.0 -1.0 0.0

F(4,102520)= 931.36287 with Significance Level 0.00000000 ;* luego, la hiptesis es rechazada ampliamente en favor de rendimientos diferentes a travs de los das de la semana.

127

Trminos de Interaccin (Greene, pag 124)

Gujarati:

128

Woodrigde (Introductory econometrics)

129

5.3. ERROR EN LAS VARIABLES: INSTRUMENTOS


Existen muchos casos en que alguna de las variables X no puede ser observada directamente. En este caso se asume que existe un modelo que explica X en funcin de un nmero de otras variables. Si este es el caso, se generan dos tipos de problemas: en primer lugar X ya no es fija, sino que es estocstica (regresores estocsticos), y segundo, X es medida con error (existe error de medicin o error en las variables). Hemos dicho anteriormente que cuando los regresores son estocsticos o existe error de medicin, generalmente se viola el supuesto de independencia de los errores con los regresores del modelo de regresin, lo que genera estimadores sesgados inconsistentes a travs de MCO, por lo que ste no es el mtodo apropiado. Ntese que este problema tambin ocurre en los modelos de series de tiempo tipo AR en que existe como variable explicativa una variable dependiente rezagada (Yt-1). Existen casos en un modelo de regresin mltiple en que el coeficiente de la variable medida con error no es de inters, por lo que uno podra plantearse simplemente el excluirla. Sin embargo es recomendado el uso de variables proxies (aquellas medidas con error) para mantener la especificacin del modelo, pues la omisin de variables relevantes puede introducir sesgos en los estimadores restantes.

5.3.1. VARIABLES INSTRUMENTALES


La metodologa estndar para trabajar con este problema es el uso de variables instrumentales, es decir aquellas que explican a las variables medidas con error, las que deben cumplir con el requisito de no estar correlacionadas con el error, pero estar altamente correlacionadas con las variable exgenas. Bajo estas condiciones, el estimador de variables instrumentales es consistente en el lmite, sin embargo no necesariamente es el ptimo, pues pueden existir otros instrumentos con mejor comportamiento. Note tambin que el uso de muchos instrumentos consume observaciones (grados de libertad). Si el modelo que se desea estimar es

Y = 0 + 1 X +
sin embargo X no es conocida, aunque puede estimarse con error usando las variables Z1 y Z2, es decir:

X * = 0 + 1 Z1 + 2 Z 2 +

(1)

en que X* es una variable proxy de X, y Z es un instrumento. Ahora el modelo original puede ser reescrito como:

Y = + 1 1 Z1 + 2 1 Z 2 +

(2)

As, este problema puede ser reescrito como uno resolucin de las dos ecuaciones (1) y (2) simultneamente. El procedimiento de resolucin es llamado mnimos cuadrados en dos etapas (MC2E)34, que consiste en: Paso 1: estimar (1) y guardar la proyeccin de X. Paso 2: estimar (2) usando la proyeccin de X anterior.

34

Este procedimiento ser utilizado nuevamente en el captulo 7.

130

5.3.2. ESTIMACION CON INSTRUMENTOS EN RATS


Veamos la forma de implementar la estimacin con instrumentos a travs de un ejemplo: Ejemplo: Se tiene Y que depende linealmente de X1 y X2. Para la estimacin se dispone de los instrumentos Z2 y Z3, como sigue: all 15 data(unit=input,org=obs) / z2 z3 x1 y x2 ... Ver datos en Tabla 7 en el Anexo al final del libro

;* primero efectuamos la estimacin paso a paso: linreg(noprint) x1 # constant z2 z3 set x1proj = %beta(1)+%beta(2)*z2+%beta(3)*z3

;* es la proyeccin de X1 con los instrumentos ( ms la constante)

linreg(noprint) x2 # constant z2 z3 set x2proj = %beta(1)+%beta(2)*z2+%beta(3)*z3 linreg y

;* es la proyeccin de X2

;* la estimacin de Y explicada por las proyecciones de X1 y X2.

# constant x1proj x2proj .... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -9.5254068 140.9144517 -0.06760 0.94721962 2. X1PROJ 1.3812338 4.1226353 0.33504 0.74338143 3. X2PROJ 0.1883198 1.4222343 0.13241 0.89685339

;* el procedimiento directo en RATS es: INSTRUMENTS constant z2 z3 linreg(INST) y # constant x1 x2 ;* se definen los instrumentos ;* se incluye la opcin INSTRUMENTS

Dependent Variable Y - Estimation by Instrumental Variables Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant -9.5254037 206.5547325 -0.04612 0.96397664 2. X1 1.3812337 6.0430269 0.22857 0.82305454 3. X2 0.1883197 2.0847346 0.09033 0.92951311 ;* de modo que verificamos los resultados previos.

Veamos otro ejemplo: Ejemplo: Se tiene un modelo de Produccin (PIB) y de Oferta de dinero (M) en EEUU, el siguiente modo: PIB = c(1) + c(2)INV + c(3)G M = d(1) + d(2)PIB

131

donde INV = inversin G = Gasto pblico

all 22 cal 1970 1 1 data(unit=input, org=obs) / PIB OFMONET INVERS GASTO ... Ver datos en Tabla 8 en el Anexo al final del libro

linreg(noprint) PIB # constant INVERS GASTO set PIBPROY / = %beta(1) + %beta(2)*INVERS + %beta(3)*GASTO linreg OFMONET # constant PIBPROY ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 34.579992282 31.575674053 1.09515 0.28646603 2. YY1 0.614403781 0.009369757 65.57307 0.00000000 ;* los errores estndar de los coeficientes deben ser corregidos (no lo hacemos) ;* la estimacin directa usando variables instrumentales es la siguiente: INSTRUMENTS constant INVERS GASTO LINREG(INST) OFMONET # constant PIB

Dependent Variable OFMONET - Estimation by Instrumental Variables Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 34.579992282 30.541557165 1.13223 0.27093139 2. PIB 0.614403781 0.009062894 67.79333 0.00000000 ;* los errores estndar ya salen corregidos.

5.3.3. EL ESTIMADOR DE VARIABLES INSTRUMENTALES


a) En el modelo lineal:

Y = X + e,

E[Z ' e] = 0
1

es decir con instrumentos independientes de los

errores, puede mostrarse que el estimador de V. Instrumentales es el de MC en 2 etapas dado por:

b N X ' ZW 1 Z ' X
donde por default

[(

) (X ' ZW

Z 'Y

, s 2 X ' ZW 1 Z ' X

W 1 = ( Z ' Z ) 1 , aunque esta matriz puede modificarse con la opcin WMATRIX para

generalizar y controlar el procedimiento.

132

Operacionalmente, debe existir a lo menos tantos instrumentos como parmetros a estimar, de lo contrario el modelo puede resultar subidentificado (por ejemplo si se tienen que estimar 3 parmetros con solamente 2 instrumentos). b) En el caso de regresiones no-lineales (por ejemplo modelos AR y Mnimos Cuadrados no lineales):

Y = f ( X , ) + e, E[Z ' e] = 0
1 e 1 2 e 1 b N min (e' ZW Z ' e ) , s ' ZW Z '

133

CAPITULO 6 MODELOS NO LINEALES

6.1. INTRODUCCION A LOS METODOS ITERATIVOS: LA INSTRUCCION FIND


Existen problemas en que no es posible obtener una solucin exacta (cerrada) para el mximo o mnimo de un modelo, sino que esto se debe lograr a travs de un proceso iterativo. Este es el caso, por ejemplo, cuando se desea encontrar los valores de X que permiten la maximizacin / minimizacin de los polinomios en una variable35. Cuando el polinomio es de un grado superior, entonces probablemente se encuentren solamente ptimos locales (no globales). En RATS, encontrar ptimos de funciones de 1 sola variable puede hacerse con la instruccin FIND, la que aplica un algoritmo sofisticado del tipo Simplex, que no requiere calcular derivadas. La estructura de sta instruccin es la siguiente: FIND MAXIMUM/MINIMUM {instrucciones} END FIND expresion

donde MAX o MIN indica si se busca un mximo o mnimo local de la expresin, instrucciones son un listado de operaciones que se desea efectuar mientras se desarrolla la bsqueda (si no se desean resultados intermedios, use dos llaves { } ), y END FIND establece el trmino de la instruccin de bsqueda FIND. Antes de usar FIND debe tenerse en cuenta que se requiere: especificar los parmetros libres, usando la instruccin NONLIN definir el valor inicial para los parmetros libres anteriores, usando COMPUTE (tambin con INPUT). Idealmente el valor que aqu se asigne debe ser cercano al ptimo para facilitar as la bsqueda.

Veamos su funcionamiento a travs de un ejemplo:

Ejemplo:

Encontrar el mnimo de la parbola y = x**2 + x + 3 nonlin x ;* establece que el parmetro libre es x compute x=1.0 ;* define el valor inicial de x=1.0 find min x**2+x+3 ;* se busca un mnimo de la expresin dis 'el valor de x es =' x ;* se desea ver el resultado de x en cada iteracin end find

35

Como una excepcin, cuando se trata de un polinomio de 2 grado, en general es posible encontrar el ptimo global de forma cerrada derivando el polinomio respecto a X e igualando a cero.

134

el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el el

valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor valor

de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de de

x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x

es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es es

= = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =

1.00000 0.90000 0.80000 0.70000 0.50000 0.30000 -0.10000 -0.50000 -1.30000 -0.10000 -0.90000 -0.30000 -0.70000 -0.40000 -0.60000 -0.45000 -0.55000 -0.47500 -0.52500 -0.48750 -0.51250 -0.49375 -0.50625 -0.49688 -0.50313 -0.49844 -0.50156 -0.49922 -0.50078 -0.49961 -0.50039 -0.49980 -0.50020 -0.49990 -0.50000 -0.50010 -0.49990 -0.50005 -0.49995 -0.50002 -0.49998 -0.50001 -0.49999 -0.50001 -0.50000

Estimation by Simplex Variable Coeff ***************************************** 1. X -0.500000000 ;* el resultado del algoritmo de bsqueda arroja un valor x=-0.5. Puesto que se trata de una parbola, puede mostrarse que ste es un mnimo global. Cuando se trata de polinomios de grados mayores a 2, pueden existir varios mnimos o mximos locales, por lo que es difcil encontrar el ptimo global, el que eventualmente puede no existir.

135

Ejemplo:

Encontrar el mnimo del polinomio y = x**4 - 2*x**2 + 2. nonlin x compute x=-10.0 ;* se indica como valor inicial x=-10.0 find min x**4-2*x**2+2 { } end find Estimation by Simplex Variable Coeff ***************************************** 1. X 1.0000000000 ;* sin embargo puede mostrarse a travs de un grfico de la funcin en el rango 2.0<x<+2.0, que existen 2 mnimos locales, uno en 1.0 y otro en +1.0. all 40 ;* hacemos un grafico de 40 puntos set x 1 1 = -2.0 do i=2,100 set x i i = x(i-1)+0.1 ;* creamos la serie x que parte desde 2 con incrementos de 0.1 enddo set y = x**4-2*x**2+2 scat 1 # x y

10

1 -2 -1 0 1 2

;* luego, si bien existen 2 mnimos, FIND encuentra solamente uno de ellos.

As, para las funciones complejas y tienen un gran nmero de ptimos locales, y los algoritmos de iteracin nos arrojan solamente algunos de ellos, dependiendo de los valores iniciales de bsqueda que entreguemos, en circunstancias que puede existir alguno ptimo local superior, posible de encontrar indicando valores de bsqueda distintos.

136

6.2. MINIMIZACION DE LA SUMA CUADRADOS DE ERRORES


En econometra, la bsqueda de los coeficientes estimados de un modelo de regresin generalmente requiere minimizar la suma cuadrada de errores, por lo que sta es la funcin objetivo36. Veamos como esto es posible a travs de la instruccin FIND, para lo cual requerimos que exista solamente 1 incgnita, es decir, la funcin objetivo debe ser funcin de un solo parmetro o incgnita. Ejemplo: Encontrar el valor de beta que ajusta mejor la ecuacin las observaciones que siguen.

Y = X 1 + 2 X 2 +

Sabemos que encontrar el mejor ajuste debemos minimizar la distancia entre los datos de Y observados y los datos de Y predichos por el modelo, es decir minimizar la suma cuadrada de errores:

MIN
{ }

SCErr = X 1t + 2 X 2t Yt
t =1

t =T

ALLOCATE 20 DATA(UNIT=INPUT,ORG=OBS) / y x1 x2 ... Ver datos en tabla 10 en el Anexo al final del libro nonlin B compute B=-3.0 ;* definimos por B el coeficiente a estimar ;* el valor inicial

;* la siguiente es la funcin objetivo, la que debe minimizarse: FIND min (b*x1(1) + b**2*x2(1) - Y(1))**2 + $ (b*x1(2) + b**2*x2(2) - Y(2))**2 + $ (b*x1(3) + b**2*x2(3) - Y(3))**2 + $ (b*x1(4) + b**2*x2(4) - Y(4))**2 + $ (b*x1(5) + b**2*x2(5) - Y(5))**2 + $ (b*x1(6) + b**2*x2(6) - Y(6))**2 + $ (b*x1(7) + b**2*x2(7) - Y(7))**2 + $ (b*x1(8) + b**2*x2(8) - Y(8))**2 + $ (b*x1(9) + b**2*x2(9) - Y(9))**2 + $ (b*x1(10) + b**2*x2(10) - Y(10))**2 + $ (b*x1(11) + b**2*x2(11) - Y(11))**2 + $ (b*x1(12) + b**2*x2(12) - Y(12))**2 + $ (b*x1(13) + b**2*x2(13) - Y(13))**2 + $ (b*x1(14) + b**2*x2(14) - Y(14))**2 + $ (b*x1(15) + b**2*x2(15) - Y(15))**2 + $ (b*x1(16) + b**2*x2(16) - Y(16))**2 + $ (b*x1(17) + b**2*x2(17) - Y(17))**2 + $ (b*x1(18) + b**2*x2(18) - Y(18))**2 + $ (b*x1(19) + b**2*x2(19) - Y(19))**2 + $ (b*x1(20) + b**2*x2(20) - Y(20))**2 { } end find Estimation by Simplex Variable Coeff ***************************************** 1. B -2.029504395

36

Alternativamente, como veremos ms adelante, en algunos casos puede intentar maximizar la funcin de verosimilitud.

137

* el resultado es B=-2.0295, sin embargo al variar el valor de bsqueda inicial de B=-3.0 a B=1.0 se tiene un resultado distinto: Variable Coeff ***************************************** 1. B 1.1612060547 Luego, puesto que se tienen dos soluciones, en principio no sabemos cul es mejor, ni tampoco si existen otras soluciones al intentar con otros valores iniciales. Una estrategia sera reemplazar cada valor estimado de B en la SCErr para analizar cul de ellas logra un menor valor de la funcin objetivo (esto no es necesario, pues como veremos, la instruccin NLLS reportar el resultado buscado). Sin embargo lo que concluimos aqu es que la solucin de este tipo de modelos es generalmente muy sensible a los valores iniciales. Tambin, que excepcionalmente es posible incluso que el algoritmo no encuentre una solucin para determinados valores iniciales, esto es, no converja.

6.3. MINIMOS CUADRADOS NO LINEALES


A continuacin veremos que las estimaciones anteriores pueden hacerse muy fcilmente en RATS a travs de la instruccin NLLS, la que puede implementarse para modelos en los que existen varios parmetros o incgnitas a estimar, es decir sin la limitacin de la instruccin FIND, que solamente puede hacerlo para 1 parmetro.

6.3.1. LA ESTIMACION POR MINIMOS CUADRADOS NO LINEALES


Al igual que para el caso de un modelo lineal, para el ajuste de un modelo de regresin no lineal la funcin objetivo es la suma cuadrada de errores (SCErrores), y se debe encontrar el valor de los parmetros que minimizan esta suma, es decir:

min et2

t =1

donde et = f(yt,Xt,)

Sabemos que el procedimiento de optimizacin clsico consiste en igualar las derivadas a cero y despejar el valor de los coeficientes que cumplen esta igualdad, lo que es complejo y muchas veces imposible, por lo cual resulta conveniente implementar un procedimiento iterativo. En econometra es comn utilizar el algoritmo iterativo de Gauss-Newton37 consistente en linealizar et alrededor de * (una estimacin inicial de ): La expansin de Taylor de f(X,) alrededor de * es:

f ( X , ) f ( X , ) f ( X , *) + ( *) *
sustituyendo en

y = f (X , ) + e

se tiene:

f ( X , ) y f ( X , *) + ( *) + e *
37

Entre muchas otras posibilidades existe tambien el mtodo de Newton-Raphson.

138

reordenando:

f ( X , ) f ( X , ) y f ( X , *) + + e * = * *
es decir, dado un valor inicial para *, para obtener una segunda estimacin, dada por , se requiere correr una regresin lineal sin intercepto en que la variable dependiente es la serie Y menos una serie que contiene el valor de la funcin evaluada en *, ms la derivada de la funcin evaluada en * y multiplicada por *. La variable independiente de esta regresin es la derivada de la funcin evaluada en *. La regresin anterior entrega una segunda estimacin para , en un proceso que contina iterativamente hasta llegar a que la diferencia entre el ltimo y el anterior sea menor que un nmero pequeo.

Ejemplo:

Si tratamos de ajustar el modelo: y = b*x1 + b**2*x2, la derivada es: x1 + 2*b*x2 (ver datos en la Tabla 10 del Anexo al final del libro) ;* supongamos que el valor de bsqueda inicial es b=4.0. La primera iteracin ser sobre las siguientes variables del modelo: ;* la primera iteracin es: set yy = y - (4*x1+4**2*x2) + (x1+2*4*x2)*4 set xx = x1 + 2*4*x2 linreg yy # xx ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. XX 2.0322393822 0.0640188937 31.74437 0.00000000

* la segunda iteracin, usando la estimacin anterior (en lugar de b=4.0) ser: set yy = y - (%beta(1)*x1+%beta(1)**2*x2) + (x1+2*%beta(1)*x2)*%beta(1) set xx = x1 + 2*%beta(1)*x2 linreg yy # xx ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. XX 1.3085620020 0.0922760331 14.18095 0.00000000 * la tercera iteracin: set yy = y - (%beta(1)*x1+%beta(1)**2*x2) + (x1+2*%beta(1)*x2)*%beta(1) set xx = x1 + 2*%beta(1)*x2 linreg yy # xx ...

139

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. XX 1.1696989113 0.1216469642 9.61552 0.00000001 * la cuarta iteracin: set yy = y - (%beta(1)*x1+%beta(1)**2*x2) + (x1+2*%beta(1)*x2)*%beta(1) set xx = x1 + 2*%beta(1)*x2 linreg yy # xx ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. XX 1.1614449723 0.1301061195 8.92691 0.00000003 * la quinta iteracin: set yy = y - (%beta(1)*x1+%beta(1)**2*x2) + (x1+2*%beta(1)*x2)*%beta(1) set xx = x1 + 2*%beta(1)*x2 linreg yy # xx ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. XX 1.1612128729 0.1306503067 8.88795 0.00000003 * la sexta iteracin: set yy = y - (%beta(1)*x1+%beta(1)**2*x2) + (x1+2*%beta(1)*x2)*%beta(1) set xx = x1 + 2*%beta(1)*x2 linreg yy # xx ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. XX 1.1612067917 0.1306656814 8.88685 0.00000003

;* y as sucesivamente, en un proceso iterativo que tiende a converger a un valor cercano a B=1.16

6.3.2. PROPIEDADES DE LOS ESTIMADORES DE MC NO LINEALES


No es posible establecer las propiedades finitas para la gran mayora de estos modelos no lineales. Recordemos que en el caso lineal, las propiedades MELI-MEI provenan del hecho que exista una relacin lineal entre el estimador b y la serie dependiente Y, lo que ahora no ocurre. En conclusin, los estimadores ahora no son MELI-MEI. Sin embargo es posible, bajo ciertas condiciones, encontrar las propiedades asintticas de los estimadores no lineales, lo que permite mostrar que el estimador de NLLS es consistente, y que:

T (b )
lo que se traduce en que

1 X ( )' X ( ) 2 Normal 0, lim T

140

Normal , 2 {X ( )' X ( )}

donde puede reemplazarse consistentemente el verdadero error estndar de la estimacin por

s2 =

SCErr (b) T K

6.3.3. MINIMOS CUADRADOS NO LINEALES EN RATS


Para implementar mnimos cuadrados no lineales en RATS se requieren 4 tipos de instrucciones: NONLIN FRML COMPUTE NLLS : : : : que lista los parmetros libres en el modelo (los parmetros a ser estimados) define la frmula de la funcin f. asigna los valores iniciales de bsqueda para los parmetros libres efecta la estimacin

La instruccin NLLS tiene la siguiente estructura: NLLS depvar start end residuals coeffs donde depvar es la variable dependiente, start y end son el rango de observaciones sobre la cual se efectuar la estimacin, residuals permite almacenar en esta serie los residuos del modelo, y coeffs son las series para los coeficientes. Sea el modelo Y = X 1 + X 2 + estimado anteriormente con la instruccin FIND. La estimacin por MC-no lineales en RATS usando el algoritmo de GaussNewton es:
2

Ejemplo:

ALLOCATE 20 DATA(UNIT=INPUT,ORG=OBS) / y x1 x2 ... NONLIN b FRML yeq y = b*x1 + b**2*x2 COMPUTE b=-3.0 NLLS(FRML=yeq) y Dependent Variable Y - Estimation by Nonlinear Least Squares Iterations Taken 10 Usable Observations 20 Degrees of Freedom 19 Centered R**2 -1.806364 R Bar **2 -1.806364 Uncentered R**2 -0.195977 T x R**2 -3.920 Mean of Dependent Variable 1.1849000000 Std Error of Dependent Variable 1.0476496954 Standard Error of Estimate 1.7550442915 Sum of Squared Residuals 58.523428838 Durbin-Watson Statistic 1.039490 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. B -2.029497786 0.302390984 -6.71150 0.00000205 As, el resultado es el mismo al obtenido anteriormente con FIND, y la ecuacin estimada es: Y = -2.029*X1 + (-2.029**2)*X2. Deben notarse algunos aspectos antes de seguir adelante: Primero, que el

141

coeficiente R cuadrado es negativo en este ejemplo, lo que es posible en el caso de modelos no lineales. Segundo, que el test F de significancia global no es reportado, pues ya no se trata de una hiptesis lineal. Tercero, que el error estndar y el estadstico t son resultados asintticos y no exactos como en el caso de un modelo lineal. Tambin, que es posible utilizar la opcin TRACE para conocer los resultados de cada una de las iteraciones. Finalmente que, en este ejemplo, al cambiar el valor de bsqueda inicial se tiene una solucin distinta, tal como mostramos en el siguiente ejemplo:

Ejemplo:

Para los datos del ltimo ejemplo, cambiemos b=-3.0 por: COMPUTE b=1.0 .... Dependent Variable Y - Estimation by Nonlinear Least Squares Iterations Taken 4 Usable Observations 20 Degrees of Freedom 19 Centered R**2 0.217987 R Bar **2 0.217987 Uncentered R**2 0.666733 T x R**2 13.335 Mean of Dependent Variable 1.1849000000 Std Error of Dependent Variable 1.0476496954 Standard Error of Estimate 0.9264524884 Sum of Squared Residuals 16.307970052 Durbin-Watson Statistic 1.005020 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. B 1.1612066802 0.1306659641 8.88683 0.00000003

Para saber cual de las 2 regresiones es mejor, podemos comparar el valor de la funcin objetivo, es decir la Suma Cuadrada de Residuos, la que es 58.5234 para b= -2.029497786, versus 16.30797 para b=1.1612, de modo que la segunda solucin es mejor. Un anlisis ms preciso mostrar que la funcin objetivo (es decir la SCErr) tiene forma cbica, de modo que tenemos 3 posibles soluciones, en cuanto a puntos de derivada iguala a cero.

Ejemplo:

Para el ejemplo anterior veamos el comportamiento de la funcin objetivo entre 3 y 2.5, con incrementos de 0.5: dofor b=-3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 ;* implementamos un ciclo para diferentes valores de b entre 3 y 2.5 COM SCERR = (b*x1(1) + b**2*x2(1) - Y(1))**2 + $ (b*x1(2) + b**2*x2(2) - Y(2))**2 + $ (b*x1(3) + b**2*x2(3) - Y(3))**2 + $ (b*x1(4) + b**2*x2(4) - Y(4))**2 + $ (b*x1(5) + b**2*x2(5) - Y(5))**2 + $ (b*x1(6) + b**2*x2(6) - Y(6))**2 + $ (b*x1(7) + b**2*x2(7) - Y(7))**2 + $ (b*x1(8) + b**2*x2(8) - Y(8))**2 + $ (b*x1(9) + b**2*x2(9) - Y(9))**2 + $ (b*x1(10) + b**2*x2(10) - Y(10))**2 + $ (b*x1(11) + b**2*x2(11) - Y(11))**2 + $ (b*x1(12) + b**2*x2(12) - Y(12))**2 + $ (b*x1(13) + b**2*x2(13) - Y(13))**2 + $ (b*x1(14) + b**2*x2(14) - Y(14))**2 + $ (b*x1(15) + b**2*x2(15) - Y(15))**2 + $ (b*x1(16) + b**2*x2(16) - Y(16))**2 + $ (b*x1(17) + b**2*x2(17) - Y(17))**2 + $ (b*x1(18) + b**2*x2(18) - Y(18))**2 + $ (b*x1(19) + b**2*x2(19) - Y(19))**2 + $ (b*x1(20) + b**2*x2(20) - Y(20))**2 dis b scerr

142

enddo -3.00000 -2.50000 -2.00000 -1.50000 -1.00000 -0.50000 0.00000 0.50000 1.00000 1.50000 2.00000 2.50000 102.93068 66.14269 58.54386 62.54357 65.93158 61.87807 48.93359 31.02908 17.47588 22.96574 67.57078 176.74353

La columna de la izquierda entrega el valor del coeficiente b, y la columna de la derecha el valor de la funcin objetivo (la suma cuadrada de errores) evaluada en el valor de b respectivo. As, en este rango, las soluciones posibles o mnimos, marcados con (*), son en realidad dos: -2.0 y 1.0 Sin duda, la mejor de ellas es 1.0, lo que conforme al resultado del ejemplo anterior, se sabe que el mnimo ocurre cuando b=1.16. Veamos a travs de otro ejemplo la estimacin de una funcin de produccin COBB-DOUGLAS (JUDGE Pg. 512), en que deben estimarse ahora 3 coeficientes.

Ejemplo:

Se tiene informacin de 30 empresas respecto a los insumos trabajo (L) y capital (K) requeridos para obtener una determinada produccin (Q), de acuerdo a la siguiente relacin:

Q = 0 + 12 L + 22 K +
ALLOCATE 30 DATA(unit=input,ORG=OBS) / L K Q

Q = 0 L

... Ver datos en Tabla 2 del Anexo al final del libro.

NONLIN BETA1 BETA2 BETA3 ;* se deben estimar 3 parmetros FRML PROD Q = BETA1 * L**BETA2 * K**BETA3 COMPUTE BETA1=1.0 , BETA2=0.4 , BETA3=0.6 NLLS(FRML=PROD) Q Dependent Variable Q - Estimation by Nonlinear Least Squares Iterations Taken 7 Usable Observations 30 Degrees of Freedom 27 Centered R**2 0.830117 R Bar **2 0.817533 Uncentered R**2 0.930765 T x R**2 27.923 Mean of Dependent Variable 0.3958244667 Std Error of Dependent Variable 0.3339063144 Standard Error of Estimate 0.1426320343 Sum of Squared Residuals 0.5492852243 Durbin-Watson Statistic 1.797571 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. BETA1 1.3303471333 0.1288803980 10.32234 0.00000000 2. BETA2 0.7228835392 0.1315594774 5.49473 0.00000809 3. BETA3 0.6868843417 0.1148062191 5.98299 0.00000221

143

Luego, obtener una estimacin de modelos no lineales es relativamente sencillo en RATS si se tiene alguna idea como ara definir apropiadamente los valore de bsqueda inicial. En la mayora de los casos esto viene dado por la teora subyacente al modelo en cuestin. Por ltimo, mostramos a travs de un ejemplo como puede replicarse la metodologa de correccin un modelo en que los errores son del tipo AR1 (existe autocorrelacin de 1 orden) usando NLLS. Recurdese que este problema es resuelto en RATS a travs de la instruccin AR1, lo que implica obtener una estimacin del coeficiente de correlacin , para luego implementar primeras diferencias generalizadas.

Ejemplo:

all 25 data(unit=input, org=obs) 1 20 y x1 x2 ... Ver datos en Tabla 11 del Anexo al final del libro ;* el primer paso es estimar el coeficiente de correlacin (RHO) conjuntamente con los coeficientes del modelo de regresin (B1, B2 y B3) en un esquema de primeras diferencias generalizadas, tal que se minimice la suma cuadrada de los errores, siendo AUTO1 la serie que contiene los errores nonlin RHO B1 B2 B3 FRML AUTO1 = RHO*Y{1}+(1-RHO)*B1+B2*(X1-RHO*X1{1})+B3*(X2-RHO*X2{1}) ;* corremos una regresin lineal para obtener una estimacin inicial de los coeficientes de regresin. LINREG(NOPRINT) Y # CONSTANT X1 X2 COM RHO=%RHO, B1=%BETA(1), B2=%BETA(2), B3=%BETA(3) NLLS(FRML=AUTO1) Y Dependent Variable Y - Estimation by Nonlinear Least Squares Iterations Taken 11 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. RHO 0.5855389068 0.2297214831 2.54891 0.02224608 2. B1 1.5445799940 9.4530837567 0.16339 0.87238910 3. B2 1.7685122942 0.4122989577 4.28939 0.00064543 4. B3 0.7665194888 0.1735539049 4.41661 0.00050001 ;* este resultado puede ser obtenido directamente con la instruccin AR1: AR1 Y # CONSTANT X1 X2 Dependent Variable Y - Estimation by Cochrane-Orcutt Usable Observations 19 Degrees of Freedom

15

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 1.5445830010 9.2359459218 0.16724 0.86941804 2. X1 1.7685122590 0.4119256451 4.29328 0.00064040 3. X2 0.7665193983 0.1627652032 4.70936 0.00027952 ******************************************************************************* 4. RHO 0.5855387431 0.2297214629 2.54891 0.02224610

144

6.4. ESTIMACION POR MAXIMA VEROSIMILITUD


Si el error de un modelo economtrico () es una variable aleatoria que es asumido normalmente distribuido, la siguiente es la funcin de densidad normal de sta variable aleatoria:

f ( / , 2 ( )) =

1 SCErr ( ) t 1 EXP 2 ( ) 2 2 ( )

donde la suma cuadrada de errores (SCErr) depender del modelo que se est trabajando, sea este lineal o no lineal. El objetivo del procedimiento es maximizar la funcin de densidad de probabilidad conjunta de la variable aleatoria, que es llamada funcin de verosimilitud, l(), es decir:
T T 1 SCErrt 1 SCErrt 1 2 ( 2) l( ) = EXP EXP = 2 2 2 2 1 2 2

aplicando logaritmos naturales:


T ( 1 ) 1 L = log(l ( )) = log 2 2 2 SCErrt 2 2 1

[(

Luego, para maximizar la probabilidad de ocurrencia del valor de un parmetro, se debe maximizar esta ltima expresin, es decir encontrar los parmetros que maximizan la suma anterior. Ntese que sta suma puede simplificarse a:
T 1 1 1 L = log 2 log 2 SCErrt 2 2 2 1 2

Puesto que el primer trmino de la sumatoria es una constante, es irrelevante en el proceso de maximizacin, de modo que puede ser eliminado, y la funcin objetivo es simplemente:

T 1 1 L = log 2 + 2 SCErrt 1 2

6.4.1. MAXIMA VEROSIMILITUD EN RATS


En el caso de RATS, lo que ste programa hace es maximizar iterativamente la suma anterior para los parmetros libres de la frmula definida en frml a travs de la instruccin MAXIMIZE, que al igual que en la instruccin NLLS, requiere 4 tipos de instrucciones: NONLIN FRML COMPUTE MAXIMIZE : : : : lista los parmetros libres en el modelo (los parmetros a ser estimados) entrega la frmula de la funcin cuya suma (sobre T) ser maximizada Asigna los valores iniciales de bsqueda para los parmetros libres efecta la estimacin

Maximize tiene la siguiente estructura: MAXIMIZE frml start end funcval

145

donde frml es la formula, start y end es el rango de tiempo sobre el cual se har la estimacin, y funcval corresponde a las series para los valores finales de la frml. Respecto a las frmulas, pueden usarse varias simultneamente, sin embargo cuando se trate de mxima verosimilitud se usar a lo menos una instruccin como la siguiente: FRML L = -0.5*(log(var) + E**2/var) donde VAR es el parmetro usado para la varianza de los errores y E es usado para definir el error. Ejemplo: Estimamos a continuacin la funcin de produccin COBB-DOUGLAS, anteriormente estimada por mnimos cuadrados no lineales, ahora por mxima verosimilitud. Recordemos que se tiene informacin de 30 empresas respecto a los insumos trabajo (L) y capital (K) requeridos para obtener una determinada produccin (Q), de acuerdo a la relacin:

Q = 0 + 12 L + 22 K +

Q = 0 L1 K 2 +

NONLIN B1 B2 B3 VAR FRML E = Q - B1*L**B2 * K**B3 ;* definimos la frmula en trminos del error FRML LOK = -.5*(log(var) + E**2/var) ;* es la funcin de verisimilitud COMPUTE B1=1. , B2=0.4 , B3=.6, VAR=0.01 ;* note que E es la nica frmula que ser sumada en MAXIMIZE de modo que E**2 significa la SCErr. maximize(ITER=75) LOK Estimation by BFGS Iterations Taken 21 Usable Observations Function Value ;* se impone un mximo de 75 iteraciones

30

Degrees of Freedom 45.00502229

26

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. B1 1.3303436723 0.1171726887 11.35370 0.00000000 2. B2 0.7228771305 0.1078253705 6.70415 0.00000000 3. B3 0.6868836877 0.0965844184 7.11174 0.00000000 4. VAR 0.0183094617 0.0049498344 3.69900 0.00021645 El resultado es el mismo que en caso de la instruccin NLLS, con la diferencia que ahora se estima la varianza de los errores por separado, como un parmetro ms.

6.4.2. APLICACION: MODELOS GARCH


VOLATILIDAD DE LAS TASAS DE INTERES La necesidad de estimar la volatilidad condicional en lugar de la no condicional, se fundamenta en que esta ltima no logra capturar el comportamiento a travs de los cambios respecto a la media. A modo de ilustracin, considerese dos series temporales de observaciones tal que ambas tengan la misma media, valores mximos y mnimos. Si la autocorrelacin de la primera serie es cercano a +1.0, existir un comportamiento relativamente suave de una observacin a otra, y si la autocorrelacin de la segunda serie es cercana a 0.0 existir un comportamiento ms "ruidoso". Pues bien, ambas series pueden reportar en efecto la misma volatilidad no condicional, aunque claramente la segunda serie es ms voltil, y una estimacin de volatilidad condicional reportar este hecho. Note que una alternativa para que la

146

volatilidad no condicional reefleje esta diferencia es que sea calculada en base a las primeras diferencias de la serie original, pues de esta forma se considera el patron temporal de las series. MODELOS GARCH Los modelos de volatilidad condicional (en ingls GARCH, Modelo Generalizado Autorregresivo de Heterocedasticidad Condicional) son ideales para el estudio de fenmenos donde la varianza condicional no es constante a travs del tiempo. Por ejemplo, los rendimientos de las bolsas de valores accionarios presentan periodo de baja volatilidad y periodos de alta volatilidad, de modo que el supuesto de varianzas constantes (homocedasticidad como en el ejemplo anterior) puede no ser apropiado. Engle (1982) desarroll un modelo que admite que tales varianzas sean no constantes, cual es llamado Modelo de Heterocedasticidad Condicional (ARCH), en donde la varianza de u en el tiempo t depende del tamao del termino de error al cuadrado en el tiempo (t-1). Por ejemplo, si el modelo base a estimar es del tipo autorregresivo de 1 orden, AR(1), entonces:

Yt = 0 + 1Yt 1 + t

t2 = 0 + 1 t21 + t
pero el termino t es definido como un proceso N(0 , 0 + 12t-1), es decir la varianza de t depende del termino de perturbacin en el perodo de tiempo anterior al cuadrado, lo que corresponde a un proceso conocido como ARCH(1). Note que si bien es heterocedstico, es bien comportado. La generalizacin del modelo ARCH es el modelo GARCH desarrollado por Bollerslev (1986). Una especificacin Garch (1,1) est definido, por ejemplo, como:

Yt = 0 + 1Yt 1 + t

= 0 + 1 t21 + 2 t21 + 3Yt 1 + et


2 t

es decir, la varianza del error depende del error anterior al cuadrado (componente AR), de la varianza anterior (componente MA), y eventualmente de otra informacin, como por ejemplo el valor de la serie Y rezagado. En estos casos la funcin de verosimilitud tiene la siguiente forma:
T 1 1 2 log ( ) SCErr ( ) = MAX L t 2 2 ( ) 1 { , }

Ejemplo:

Para estimar un modelo base del tipo AR(1) para la serie DLWPI, cuya varianza de errores es ARCH(4), las instrucciones seran: ;* se estn estimando 4 parmetros, dos para el modelo base y dos para la varianza de los errores. frml e = dlwpi - b0 - b1*dlwpi{1} ;* un proceso AR(1) para el modelo base frml var = a0 + a1*e(t-4)**2 ;* un proceso ARCH(4) para el error ;* puesto que en L aparecern dos frmulas, solamente una de ellas puede ser sumada (E), por lo que es escrita como E(t). frml L = -0.5*(log(var)+e(t)**2/var) nonlin b0 b1 a0 a1

147

boxjenk(noprint,constant,ar=1) dlwpi

;* se ajusta el modelo AR(1) para obtener estimaciones iniciales de los coeficientes38 ;* a0 es estimado inicialmente con la varianza (constante de los errores anteriores, mientras a1 es arbitrario.

compute b0=%beta(1), b1=%beta(2) compute a0=%seesq, a1=.8

maximize(iterations=75) L 10 *

Cuando el modelo base es del tipo ARMA, significa que adems de aparecer Y rezagada como variable explicatoria, aparecer el error anterior del modelo (el componente MA). Puesto que el error previo an no ha sido calculado, computacionalmente este detalle implica la necesidad de incorporar una serie adicional, en este caso u, inicializada en cero.

Ejemplo:

Para modelar la volatilidad de un modelo base del tipo AR(1) y MA(1,4), junto a una varianza condicional dada por un proceso ARCH(4): set u = 0.0 nonlin b0 b1 b2 b3 a0 a1 frml e = dlwpi - b0 - b1*dlwpi{1}-b2*u{1}-b3*u{4} ;* un proceso ARMA(1,||1,4||) frml var = a0 + a1*e(t-4)**2 ;* un proceso ARCH(4) frml L = (u = e), -0.5*(log(var)+e(t)**2/var) boxjenk(noprint,constant,ar=1,ma=||1,4||) dlwpi compute b0=%beta(1), b1=%beta(2), b2 = %beta(3) , b3 = %beta(4) compute a0=%seesq, a1=.8 maximize(iterations=75) L 10 *

A su vez debe notarse que todas las frmulas definidas en un proceso MAXIMIZE (como por ejemplo el error del modelo (e) y la funcin de verosimilitud), no son series sino variables, de modo que los rezagos de stas deben ser escritos como (t-1) y no como {t}. Tambin, para obtener por ejemplo la serie de las varianzas condicionales basta traspasar la informacin de VAR a una serie, por ejemplo: set varcondic = VAR. En el caso que la varianza condicional sea del tipo GARCH, entonces nuevamente se requiere de una serie adicional, en este caso W, tal como se muestra a continuacin: Ejemplo: set w = 0.0 set u = 0.0 nonlin b0 b1 b2 b3 a0 a1 a2 frml e = dlwpi - b0 - b1*dlwpi{1}-b2*u{1}-b3*u{4};* un proceso ARMA(1,||1,4||) frml var = a0 + a1*e{1}**2 + a2*w{1} ;* un proceso GARCH(1,1) frml L = (u = e), (w = var), -.5*(log(var)+e(t)**2/var) ;* (u=e) indica que la variable u corresponde al error e, y que la variable w corresponde a la varianza condicional. boxjenk(noprint,constant,ar=1,ma=||1,4||) dlwpi compute b0=%beta(1), b1=%beta(2), b2 = %beta(3) , b3 = %beta(4) compute a0=%seesq, a1=.3 , a2 = .5 maximize(iterations=75) L 10 *

Es ilustrativo efectuar un grfico que compare la volatilidad observada de la serie junto a la volatilidad ajustada. Para esto debe construir la serie de la varianza condicional en cada punto, y adems es posible construir lmites superiores e inferiores alrededor de esta serie.

38

La instruccin BOXJENK ser vista ms adelante en el captulo de series de tiempo. Note que si el modelo base es lineal, se debe usar LINREG en lugar de BOXJENK.

148

Ejemplo:

En un estudio reciente39 estimamos la volatilidad condicional tipo ARCH de un modelo de dos factores para el cambio semanal en la tasa de menos de 2 aos en Chile como sigue: NONLIN k A0 A1 c0 c1 FRML B1 = (1-exp(-k*1))/k FRML B2 = (1-exp(-k*2))/k FRML teta = a0+a1*(BR_05*5*(B2)-BR_06*6*(B1)) ;* BR_05 y BR_06 son las series que contienen las tasas de inters de 5 y 6 aos, y son usadas como instrumentos. FRML E = BR_02 - BR_02{1} - k*teta + k*BR_02{1} * BR_02 es la tasa de menos de 2 aos FRML VAR FRML LOK = c0+c1*E(t-1)**2 = -0.5*(log(var) + E**2/var)

compute k=0.01, a0=0.001, a1=0.01, c0=0.00001, c1=0.1 NLPAR(SUBITERS=30) maximize(ITER=75) LOK Estimation by BFGS Iterations Taken 55 Weekly Data From 1993:05:17 To 1997:12:29 Usable Observations 240 Degrees of Freedom Total Observations 242 Skipped/Missing Function Value 1195.01873368

235 2

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. K 0.5374863365 0.0574596854 9.35415 0.00000000 2. A0 0.0423960608 0.0065941748 6.42932 0.00000000 3. A1 0.3138944493 0.0642956873 4.88205 0.00000105 4. C0 0.0000158220 0.0000019829 7.97921 0.00000000 5. C1 0.1084788786 0.1035522177 1.04758 0.29483373

El grfico del cambio semanal en la tasa de menos de 2 aos versus la volatilidad ajustada por el modelo ARCH con datos semanales 1993:05:17 - 1997:12:29 es el siguiente:

SET dvst = var**0.5 diff BR_02 / dbr_02 GRAPH(key=loright) 2 # dvst # dBR_02

;* almacenamos en dvst la desviacin estndar ajustada ;* dbr_02 contiene el cambio en la tasa de menos de 2 aos

"Estimando un Modelo de 2 Factores del Tipo "Exponential-Affine" para la Tasa de Inters Chilena" (1999). REVISTA DE ANALISIS ECONOMICO (Ilades/Georgetown University) Vol. 14 N2 pp. 117-133.

39

149

0.020

0.015

0.010

0.005

0.000

-0.005

-0.010

-0.015
DVST DBR_02

-0.020 1993 1994 1995 1996 1997

;* ntese que el ajuste de la volatilidad condicional arroja casi una constante. En adicin, la hiptesis Ho:C(1)=0 no puede ser rechazada, de modo que el modelo puede ser entendido como uno con errores homocedsticos.

6.5. RESUMEN
Existen un nmero de modelos con una estructura distinta de la lineal, es decir Y=X+e, los que no pueden ser estimados a travs de mnimos cuadrados ordinarios a travs del comando LINREG. Estos modelos son llamados no lineales, y en el caso uniecuacional pueden contener una estructura como la siguiente:

a) Caso 1:

Y = f ( X , ) + e , donde f es una expresin posiblemente no lineal entre las series X y los


parmetros . En este caso buscamos minimizar la suma cuadrada de errores, es decir :

min t2

t =1

lo que en RATS se logra con el comando NLLS, es decir una estimacin a travs de Mnimos Cuadrados no Lineales.

b) Caso 2:

f ( yt , X t , ) , que es una expresin general y ms flexible que el caso de mnimos cuadrados


no lineales y apropiada para estimacin a travs de Mxima Verosimilitud. En este caso buscamos maximizar la suma de la funcin f, es decir:

max f ( y t , X t , )

t =1

150

Ambos casos anteriores impiden el uso de las tcnicas exactas de MCO, y en cambio deben usarse procedimientos iterativos de maximizacin / minimizacin, donde la seleccin de los valore de bsqueda inicial son claves para el xito del algoritmo.

151

CAPITULO 7 SISTEMAS DE ECUACIONES

En el caso ms simple, hay un sistema de ecuaciones si se tiene una misma ecuacin a estimar simultneamente para diferentes grupos muestrales. Ms generalmente, puede haber dos o ms ecuaciones distintas, interdependientes (se determinan simultneamente). Un ejemplo tpico el de las ecuaciones de oferta y demanda para una mercadera, en que tanto el precio como la cantidad se determinan simultneamente. Si se intenta estimar el sistema a travs de cada ecuacin individualmente por MCO, se tendr estimadores sesgados e inconsistentes, al existir correlacin entre los errores y las variables explicativas40.

7.1. ECUACIONES ESTRUCTURALES Y REDUCIDAS


Asuma un modelo de varias ecuaciones, en que existen variables endgenas y variables exgenas: Una ecuacin del modelo est en forma estructural o forma primitiva, si las variables endgenas son dependientes de otra variable endgena contempornea (es decir, ambas en el momento t). Una ecuacin est en forma reducida o estandar, si no aparece ninguna variable endgena actual (pueden haber variables endgenas rezagadas). Siguiendo el anlisis de Intrilligator (1991), tomemos el ejemplo siguiente de oferta Qs y demanda Qd, en que se tienen las siguientes ecuaciones estructurales:

Qd = 0 + 1 P + 2 I + u 1 , 1 < 0 Qs = 0 + 1 P + 2 r + u 2 , Qd = Q s
donde I es el ingreso, r es la cantidad de lluvia (ambas exgenas), y el precio (P) es una variable endgena (determinada por el sistema). Puesto que Q y P son ambas variables dependientes mutuamente (endgenas), P estar correlacionada con los trminos de error. Eliminando la tercera condicin se tiene que:

1 > 0

Q = 0 + 1 P + 2 I + u1 , 1 < 0 Q = 0 + 1 P + 2 r + u 2 ,
Ahora expresando el sistema en forma matricial:
40

1 > 0

Existe una excepcin cuales son los modelos recursivos (triangulares).

152

[Q

1 P ] 1

1 + [I 1

2 r 1] 0 0

0 2 = [u 1 0

u2 ]

Las matrices de 2x2 y 3x2 son matrices de coeficientes estructurales. Note que se espera que 1 < 0 para bienes superiores, y que 1 > 0 para el caso de sequa y 1 < 0 para el caso de exceso de lluvias. Para efectos de la estimacin, debe rescribirse el sistema dejando P y Q como variables dependientes, esto es, explicadas solamente por r e I.

0 0 u 2 u1 + 1 1 1 1 1 1 1 1 1 0 1 1 1 2 Q= 2 1 I 1 2 r+ 0 1 + 1 1 1 1 1 1 1 1
P=

r+

A esta ltima especificacin simultnea se llama la forma reducida, pues expresa las variables endgenas como una funcin de las variables exgenas (I y r). Esta forma s la que se emplea comnmente (una excepcin son los modelos VAR etructurales).

7.1.1. EL PROBLEMA DE LA IDENTIFICACION


Asumamos que la estimacin de la forma reducida del sistema ha sido posible a travs de un mtodo apropiado. Pero lo que se desea es conocer el valor de los parmetros de la forma estructural (no los de la reducida), de modo que es necesario despejarlos. En el ejemplo anterior no habra problema, pues se tienen 6 ecuaciones (los coeficientes de la ecuacin reducida) y 6 parmetros (de la ecuacin estructural), es decir existe lo que se llama identificacin exacta, donde hay una relacin 1 a 1 entre los coeficientes de la forma reducida y los coeficientes estructurales. Sin embargo existen otros casos posibles: Subidentificacin (por ejemplo 5 coeficientes estructurales y 4 ecuaciones), en que no es posible regresar a los parmetros estructurales, a menos que se tenga informacin adicional, tpicamente que algunos parmetros son cero. Sobreidentificacin (por ejemplo 7 coeficientes y 8 ecuaciones, es decir exceso de informacin), en que hay ms de un modo de inferir los parmetros estructurales a partir de los parmetros de la forma reducida. El mtodo de MCIndirectos no es apropiado aqu, pudiendo reemplazarse por el de Mnimos Cuadrados en dos Etapas (MC2Etapas). Tambin se han desarrollado algunas reglas de identificacin basadas en el sistema estructural41
41 Sea m = num. ecuaciones simultneas y (K-k) = num. de variables predeterminadas del sistema que excluye una ecuacin determinada. Entonces condicin necesaria (pero no suficiente) es: Si K-k <= m-1 : no identificacin Si K-k = m-1 : identificacin exacta Si K-k >= m-1 : sobreidentificacin Para que el sistema est identificado, ambas ecuaciones deben estarlo.

153

7.2. ESTIMACION DE ECUACIONES SIMULTNEAS


La siguiente Tabla ilustra una serie de mtodos de estimacin de ecuaciones simultneas42:
ESTIMACION UNIECUACIONAL METODOS DE INFORMACION LIMITADA MC Ordinarios y Sistemas Triangulares MC Indirectos para Sist. Exactamente identificados MC en 2 Etapas para Sist. Exactamente sobre identificados Mxima Verosimilitud con Informacin Limitada (LIML) ESTIMACION CONJUNTA (de Sistemas) METODOS CON INFORMACION COMPLETA ----MC en 3 Etapas Mxima Verosimilitud con Informacin Completa (FIML)43

Veamos el ejemplo clsico de KLEIN de 1950 (Klein's Model I) que aparece en la mayora de los textos de econometra. Ejemplo: El modelo es:

C t = 0 + 1 Pt + 2 Pt 1 + 3 (WPt + WGt ) + e1 t I t = 0 + 1 Pt + 2 Pt 1 + 3 K t 1 + e 2 t WPt = 0 + 1 X t + 2 X t 1 + 3 At + e3 t X t = C t + I t + Gt Pt = X t Tt WPt K t = K t 1 + I t


donde C es el consumo, P son las utilidades (profit), WP y WG son las remuneraciones del sector privado y pblico, I es la inversin, K es el capital, X es el producto, A es una tendencia, G son los gastos del gobierno y T los impuestos. Note que las ltimas 3 ecuaciones son identidades.

CAL 1920 1 1 ALLOCATE 0 1941:1 DATA(unit=input,ORG=OBS) / agno num CONSUMPTION $ PROFIT PRIVWAGE INVEST KLAGGED PRODUCTION GOVTWAGE GOVTEXP TAXES ... Ver datos en la Tabla 13 SET WAGEBILL = PRIVWAGE+GOVTWAGE SET TREND = T-1931:1 SET CAPITAL = KLAGGED+INVEST SMPL 1921:1 1941:1

RATS permite la simulacin de grandes sistemas, muy superiores a las 200 ecuaciones, siendo el nico lmite la capacidad de memoria del compuatdor. ver Pyndick y Rubinfeld (1997). 43 Una alternativa relacionada es el Mtodo Generalizado de Momentos.

42

154

7.2.1. MINIMOS CUADRADOS INDIRECTOS


Cuando los sistemas estn exactamente identificados es posible efectuar sin problemas una estimacin de MCIndirectos, la que consiste en los siguientes pasos: Paso 1: Estimar cada ecuacin reducida por separado a travs de MCO. Es permitido ya que las ecuaciones reducidas se basan en variables explicativas exgenas. Paso 2: Con los valores de los coeficientes reducidos, despejar algebraicamente (a travs de un sistema si fuera necesario) el valor de los coeficientes estructurales. Puesto que generalmente estos son funciones no lineales de los coeficientes reducidos, solo pueden obtenerse los errores aproximados para el caso de grandes muestras, y los coeficientes tienen eficiencia y consistencia asinttica (puede existir sesgo para pequeas muestras).

7.2.2. MNIMOS CUADRADOS EN 2 ETAPAS


Cuando los sistemas se encuentren exactamente sobre identificados es posible implementar el mtodo de variables instrumentales, lo que como vimos anteriormente en el captulo............es equivalente a la estimacin de Mnimos Cuadrados en 2 Etapas. Esta consiste simplemente es correr un primer modelo para obtener una prediccin de Y, y posteriormente utilizar esa estimacin para correr el segundo modelo. Recordemos tambin que con la implementacin de variables instrumentales en RATS se estima el 2 modelo con las series del 1 modelo como instrumentos, con la ventaja de que se obtienen los errores de la estimacin corregidos44. (ver pag. 741 Greene, 1999).

Ejemplo:

En primer lugar definimos los instrumentos como sigue: INSTRUMENTS CONSTANT TREND GOVTWAGE TAXES GOVTEXP CAPITAL{1} $ PRODUCTION{1} PROFIT{1} ;* note que son instrumentos todas las series del sistema, tal que no aparecen en el lado izquierdo de ninguna ecuacin. Esto es justamente porque los instrumentos intentan explicar las variables del lado izquierdo. LINREG(INST,FRML=CONSEQ) # CONSTANT PROFIT{0 1} CONSUMPTION WAGEBILL

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 16.554755766 1.467978697 11.27725 0.00000000 2. PROFIT 0.017302212 0.131204584 0.13187 0.89663371 3. PROFIT{1} 0.216234040 0.119221677 1.81371 0.08741342 4. WAGEBILL 0.810182698 0.044735057 18.11069 0.00000000

LINREG(INST,FRML=INVESTEQ) INVEST # CONSTANT PROFIT{0 1} CAPITAL{1}


44

Con mnimos cuadrados en dos etapas el resultado, sin hacer las correcciones a los errores estandares, los pasos seran: linreg(noprint) Y1 # constant X1 X2 set yy1 / = %beta(1)+%beta(2)*x1(t) + %beta(3)*x2(t) linreg Y2 # constant yy1

155

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 20.27820896 8.38324891 2.41890 0.02707053 2. PROFIT 0.15022182 0.19253359 0.78024 0.44597984 3. PROFIT{1} 0.61594358 0.18092585 3.40440 0.00337550 4. CAPITAL{1} -0.15778764 0.04015207 -3.92975 0.00107972

LINREG(INST,FRML=WAGEEQ) PRIVWAGE # CONSTANT PRODUCTION{0 1} TREND Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 1.5002968846 1.2756863717 1.17607 0.25577411 2. PRODUCTION 0.4388590650 0.0396026616 11.08155 0.00000000 3. PRODUCTION{1} 0.1466738217 0.0431639485 3.39806 0.00342209 4. TREND 0.1303956872 0.0323883889 4.02600 0.00087642

7.2.3. MNIMOS CUADRADOS EN 3 ETAPAS


Este procedimiento tiene la ventaja de efectuar una estimacin simultnea del sistema. En este caso el estimador se define utilizando la instruccin SUR con la opcin INSTRUMENTS, o alternativamente con NLSYSTEM. Ntese que tiene la limitante de usar un solo conjunto de instrumentos para todo el sistema, de modo que es til solo para modelos relativamente pequeos.

Ejemplo:

Ntese que las ecuaciones de identidad no son estimadas. Por definicin stas son especificadas como relaciones conocidas, no relaciones que necesiten ser especificadas. EQUATION EQN1 CONSUMPTION # CONSTANT PROFIT{0 1} WAGEBILL EQUATION EQN2 INVEST # CONSTANT PROFIT{0 1}

CAPITAL{1}

EQUATION EQN3 PRIVWAGE # CONSTANT PRODUCTION{0 1} SUR(INST) 3 # eqn1 # eqn2 # eqn3

TREND

Dependent Variable CONSUMPTION - Estimation by System Instrumental Variables Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 16.440790068 1.304548758 12.60266 0.00000000 2. PROFIT 0.124890475 0.108129048 1.15501 0.24808503 3. PROFIT{1} 0.163144093 0.100438193 1.62432 0.10430684 4. WAGEBILL 0.790080936 0.037937905 20.82563 0.00000000

Dependent Variable INVEST - Estimation by System Instrumental Variables

156

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 5. Constant 28.17784692 6.79377018 4.14760 0.00003360 6. PROFIT -0.01307918 0.16189624 -0.08079 0.93561099 7. PROFIT{1} 0.75572396 0.15293313 4.94153 0.00000078 8. CAPITAL{1} -0.19484825 0.03253069 -5.98967 0.00000000

Dependent Variable PRIVWAGE - Estimation by System Instrumental Variables Variable Coeff Std Error T-Stat Signif ******************************************************************************* 9. Constant 1.7972177223 1.1158549811 1.61062 0.10726269 10. PRODUCTION 0.4004918800 0.0318134137 12.58877 0.00000000 11. PRODUCTION{1} 0.1812910149 0.0341587758 5.30730 0.00000011 12. TREND 0.1496741149 0.0279352364 5.35790 0.00000008 Para efectos de comparacin de los resultados anteriores, sugerimos revisar la Tabla 15.6 en Greene (1999).

157

7.3. SISTEMAS: SIMULACION Y PREDICCION


En la mayora de las aplicaciones de sistemas de ecuaciones no se est demasiado interesado en el valor de los coeficientes, sino que lo que se desea es efectuar simulaciones y predicciones de stos sistemas. A continuacin mostramos algunas de las instrucciones utilizadas en RATS, notando que se usa la instruccin FORECAST, la que permite efectuar predicciones para sistemas de ecuaciones.:

Ejemplo:

FRML(IDENTITY) GNPID PRODUCTION = CONSUMPTION+INVEST+GOVTEXP FRML(IDENTITY) PROFID PROFIT = PRODUCTION-TAXES-PRIVWAGE FRML(IDENTITY) CAPID CAPITAL = CAPITAL{1}+INVEST GROUP KLEIN CONSEQ>>F_CONS INVESTEQ>>F_INVEST WAGEEQ>>F_WAGE $ GNPID>>F_GNP PROFID CAPID ;* el modelo es guardado con el nombre de KLEIN. FORECAST(MODEL=KLEIN,PRINT) ;* para predecir.

Para simulaciones, a modo de ilustracin mostramos el siguiente ejemplo disponible en los archivos de ejemplos que vienen en el programa RATS bajo el nombre MONTEARC.PRG:

Ejemplo:

COMPUTE NDRAWS=500,USEOBS=100,ENDOBS=50+USEOBS ALL ENDOBS CLEAR U V Y X SET X 1 ENDOBS = T COMPUTE SIGMA=1.0,ALPHA FRML(VARIANCE=SIGMA**2) FRML(IDENTITY) UDEF U = FRML(IDENTITY) YDEF Y = GROUP ARCHMOD VDEF UDEF =.20 VDEF V = 0.0 V*SQRT(1+ALPHA*U{1}**2) 2.0 + 3.0*X + U YDEF>>Y

SET U 1 1 = 0.0 SET TESTSTAT 1 NDRAWS = 0.0 DO DRAWS=1,NDRAWS SIMULATE(MODEL=ARCHMOD) 2 ENDOBS-1 2 LINREG(NOPRINT) Y 51 ENDOBS RESIDS # CONSTANT X SET USQUARED 51 ENDOBS = RESIDS**2 LINREG(NOPRINT) USQUARED 52 ENDOBS # CONSTANT USQUARED{1} COMPUTE TESTSTAT(DRAWS)=%RSQUARED*%NOBS END DO DRAWS STATS(FRACTILES,NOMOMENTS) TESTSTAT

158

7.4. . SEEM MINGLY Y UNREL LATED REGRE ESSION NS, SUR


Cuando lo os sistemas de ecuacion nes son linea ales y se renen una serie de requisi itos, la meto odologa est ndar de estimacin de stos es la de Regresiones Aparente emente no Re elacionadas (Seem mingly Unrelated Regres ssions, SUR) ) de Zellner (1962). d ejemplo consideremo c a de 3 ecuac ciones lineale es de deman nda en que la A modo de s un sistema dad demand dada (q) dep pende del pre ecio (p) y de el ingreso (y) como sigue e: cantid

Los supue estos son: todos los errores tien nen esperanz za cero la varianz za de los err rores es cons stante a trav vs del tiempo (constant te en cada ecuacion). e Pu uesto que hay 3 ecuaciones s, puede hab ber 3 varianz s, es decir ca ada ecuacin n puede tene er zas distintas diferente varianza (cross sectional heterosce edasticity). 3 existe correlacin con 3. ntempornea, es decir d dos errores de d diferentes s ecuaciones s (pero del mismo m periodo) estn correlacionados45. Es decir, no se impone e estricta exo ogeneidad, solo s exogene eidad ornea. Este e supuesto da d el nombre e a la tcnica a SUR. contempo 4 No existe 4. e autocorrela acin: no existe correlac cin entre los s errores de distintos pe eriodos, estn los errores e en la misma ecuacin o no. n 1. 1 2 2. Note que la variable Y es constan nte a travs de las ecuac ciones. The distinction between b var riables that are a timecons stant is not very v importa ant here; it becomes b mu uch more important en el e estudio de e los datos s de panel. modelo (pues sto que cont tiene todas las observaciones de las N ecuacione es) de un sis stema El superm s aparentemente no rela acionadas, ca ada una con T observaci iones, es: con N ecuaciones

E [u t u t '] = ,

y it = X it i + u it , t = 1,...T ; i = 1,...N u t ' = u1t ,...u Nt

donde el vector Y contiene (N NxT) x1 elem mentos, siendo sus primeros T datos s los corresp pondientes a la prime era ecuacin n, los T+1 ha asta 2T los datos d de la segunda ecua acin, etcte era. El vecto or de errores s tiene una estructura e ig gual. La matriz z X contiene (N*T)x(N*K K) elementos s en la super rdiagonal, co on ceros fuera de ella, siendo rimeros TxK los correspo ondientes a la primera e ecuacin, y as a sucesivam mente. los pr

45

Si no n existe correlacin contem mpornea, el resultado de SUR ser idn ntico al de MC CO Generalizad dos (ver ecuacin 11.2.1 13 en Judge et e al.) cuando se conoce la forma de la sper matriz de covarianzas s.

159

El vector contiene (N*K) x 1 elementos, siendo los primeros K elementos los coeficientes de la primera ecuacin, y as sucesivamente. Zellner ha mostrado que cuando existe este tipo de correlacin contempornea entre los errores, y adems se conoce la forma de , entonces es ms eficiente estimar las ecuaciones conjuntamente, ms que una a una. Adems, la especificacin SUR permite probar hiptesis con restricciones a travs de las ecuaciones, lo que no es posible con OLS. El estimador de SUR, llamado feasible GLS estimator, que es consistente y converge asintticamente a una distribucin normal (Wooldrigde, p. 159), es:

= [X ' ( 1 I )X ] (X ' ( 1 I )y )
1

donde representa el producto de Kronecker. El FGLS estimator se basa upon making sufficient assumptions regarding the form of so that a consistent estimator can be devised. Pueden obtenerse estimadores robustos y no robustos de la varianza asinttica del vector de coeficientes para efectos de pruebas de hiptesis uando FGLS (ver ec. 7.49 y 7.51 de Wooldrigde). Restricciones mltiples pueden implementarse con un test de Wald basado en Chi cuadrado. Tambien Gallant (1987, chap 5) ha encontrado una prueba F con mejores propiedades en muestras finitas (ec. 7.53 Wooldrigde). Adems, en el caso que si estimado es diagonal, entonces OLS y FGLS son idnticos.

160

Ejemplo:

Supongamos un sistema de 3 ecuaciones lineales de demanda (con correlacin contempornea), en que el logaritmo de la cantidad demandada (q) depende del logaritmo del precio (p) y del logaritmo del ingreso (y) como sigue:

log q1 = 0 + 1 log p1 + 2 log y + e1 log q2 = 0 + 1 log p2 + 2 log y + e2 log q3 = 0 + 1 log p3 + 2 log y + e3


Note que aqu we only have one dependent variable we are trying to explain, but we observe it and the explanatory variables over some period. Therefore,en este caso the label system of equations is really a misnomer for panel data applications: the statistical properties of estimators in SUR and panel data models can be analyzed within the same structure (Wooldrigge, p. 146). ALL 30 DATA(UNIT=INPUT,ORG=OBS) / p1 p2 p3 y q1 q2 q3 .... set set set set set set set Ver datos en Tabla 12 del Anexo al final del libro ;* calculamos el logaritmo de cada serie

logp1 = log(p1(t)) logp2 = log(p2(t)) logp3 = log(p3(t)) logq1 = log(q1(t)) logq2 = log(q2(t)) logq3 = log(q3(t)) logy = log(y(t))

EQUATION eqn1 logq1 # CONSTANT logp1 logy EQUATION eqn2 logq2 # CONSTANT logp2 logy EQUATION eqn3 logq3 # CONSTANT logp3 logy

;* definimos las tres ecuaciones

La estimacin de cada ecuacin por separado a travs de MCO: LINREG(EQUATION=eqn1) 1. 2. 3. Constant LOGP1 LOGY ;* es equivalente a la estimacin usual de MCO en RATS -5.169676860 -0.564397364 1.432562296 1.406569617 0.213502125 0.227289840 -3.67538 -2.64352 6.30280 0.00103769 0.01349549 0.00000096

LINREG(EQUATION=eqn2) 1. 2. 3. Constant LOGP2 LOGY -3.643426963 -0.647939679 1.143871546 1.609113344 0.187515184 0.261197248 -2.26425 -3.45540 4.37934 0.03180077 0.00183163 0.00016121

LINREG(EQUATION=eqn3) 1. 2. 3. Constant LOGP3 LOGY 0.274250142 -0.964078637 0.870895271 0.663327020 0.065327050 0.108346217 0.41345 -14.75772 8.03808 0.68254511 0.00000000 0.00000001

161

7.1.1. LA INSTRUCCION SUR


Puesto que bajo los supuesto base (Wooldrigde, p 163), FGLS is asymptotically at least as efficient as system OLS, y la posibilidad de restricciones a travs de las ecuaciones, se prefiere implementar el FGLS. En RATS usamos la instruccin SUR, la que tiene la siguiente estructura: SUR equations start end # equations resids coeffs donde equations indica el nmero de ecuaciones, start y end el intervalo de estimacin. SUR tambin permite utilizar instrumentos, de modo que en ese caso SUR implementar Mnimos Cuadrados en 3 etapas. Veamos como opera esta instruccin en el ejemplo anterior: Ejemplo: SUR 3 # eqn1 # eqn2 # eqn3 1. 2. 3. 4. 5. 6. 7. 8. 9. Constant LOGP1 LOGY Constant LOGP2 LOGY Constant LOGP3 LOGY -4.572948051 -0.906269034 1.451125764 -3.183339393 -0.867143692 1.136685265 0.352027784 -0.998916977 0.869194128 1.306531226 0.129912103 0.215460916 1.503547986 0.125826219 0.247759170 0.618744456 0.034654899 0.102755623 -3.50007 -6.97602 6.73498 -2.11722 -6.89160 4.58786 0.56894 -28.82470 8.45885 0.00046514 0.00000000 0.00000000 0.03424132 0.00000000 0.00000448 0.56939761 0.00000000 0.00000000

Ntese que si bien el valor de los coeficientes estimados con SUR es similar respecto a la estimacin por MCO, se ha ganado en reducir el tamao de los errores en todos los casos.

7.1.2. SUR CON RESTRICCIONES (Equate)


Al implementar regresiones restringidas obligamos a que determinados coeficientes tomen ciertos valores a travs de las ecuaciones. En este caso existen bsicamente dos opciones, siendo la primera de ellas (bastante limitada) agregar la opcin EQUATE como sigue: SUR equations start end # equations resids coeffs Ejemplo: EQUATE list of coeff. positions

Si en el ejemplo anterior imponemos la restriccin que el 2 coeficiente sea igual a travs de las tres ecuaciones: SUR 3 / EQUATE 2 # eqn1 # eqn2 # eqn3

162

2. 1. 3. 4. 1. 5. 6. 1. 7.

Constant LOGP1 LOGY Constant LOGP2 LOGY Constant LOGP3 LOGY

-4.492123807 -0.952574020 1.453640103 -3.004029573 -0.952574020 1.133884557 0.248565739 -0.952574020 0.871457038

1.313193914 0.043378955 0.219426006 1.496692229 0.043378955 0.250029803 0.704133179 0.043378955 0.116744543

-3.42076 -21.95936 6.62474 -2.00711 -21.95936 4.53500 0.35301 -21.95936 7.46465

0.00062446 0.00000000 0.00000000 0.04473769 0.00000000 0.00000576 0.72408128 0.00000000 0.00000000

Covariance\Correlation Matrix of Residuals LOGQ1 LOGQ2 LOGQ3 LOGQ1 0.15501467280 -0.0676469780 -0.6965804566 LOGQ2 -0.01192963775 0.20062493294 -0.5478667056 LOGQ3 -0.04865468645 -0.04353457906 0.03147269819 En efecto, el 2 coeficiente ha sido forzado a ser el mismo entre las ecuaciones. El anlisis de la correlacin entre los errores de las ecuaciones es til: variables no observables pueden tener efecto positivo o negativo en Y de cada ecuacin. Con la regresin restringida puede implementarse directamente el test de razn de verosimilitud, que viene dado en este caso por:

(T c)(log r log nr ) c2
donde r y nr son las matrices de covarianzas de los errores restringida y no restringida, respectivamente, y c es el nmero de restricciones. Esta prueba es implementada automticamente por RATS como veremos a continuacin para un caso de restricciones lineales ms general que las permitidas por el parmetro EQUATE.

163

7.1.3. SUR CON RESTRICIONES LINEALES GENERALES (Restrict)


La implementacin de restricciones generales sobre un sistema SUR es a travs del siguiente procedimiento. Usando datos del ejemplo anterior, supongamos que deseamos probar 6 hiptesis simultneas: que el 2 coeficiente es igual a 0.2, que el 3 coeficiente es igual a 0.3, que el 5 coeficiente es igual a 0.4, que el 6 coeficiente es igual a 0.5, que el 8 coeficiente es igual a 0.6, y que el 9 coeficiente es igual a 0.7:

Ejemplo:

restrict(replace) 6 # 2 # 1 0.2 # 3 # 1 0.3 # 5 # 1 0.4 # 6 # 1 0.5 # 8 # 1 0.6 # 9 # 1 0.7 Chi-Squared(6)= 2534.099637 with Significance Level 0.00000000

* la significancia del test chi cuadrado nos indica que la hiptesis es rechazada ampliamente.

En ocasiones puede ser de inters conocer los resultados de la regresin restringida, como en el caso de la estimacin de funciones de costo translogartmicas. Entonces el procedimiento es el siguiente:

Ejemplo:

Para obtener la salida de la restriccin restringida, despus de la instruccin restrict(replace) usamos: SUR(create) 3 # eqn1 # eqn2 # eqn3 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 0.00615 0.06785 0.09059 0.92781790 2. LOGP1 0.20000 3.74820e-010 5.33590e+008 0.00000000 3. LOGY 0.30000 0.00000 0.00000 0.00000000

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 4. Constant -1.7961 0.0781 -23.01228 0.00000000 5. LOGP2 0.4000 3.2452e-009 1.23259e+008 0.00000000 6. LOGY 0.5000 4.6522e-009 1.07476e+008 0.00000000

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 7. Constant -1.7422 0.0324 -53.82001 0.00000000 8. LOGP3 0.6000 8.1463e-012 7.36532e+010 0.00000000 9. LOGY 0.7000 0.0000 0.00000 0.00000000

164

Covariance\Correlation Matrix of Residuals LOGQ1 LOGQ2 LOGQ3 LOGQ1 0.32184497639 0.0148708634 0.1441913217 LOGQ2 0.00559502085 0.43982945729 -0.0228749566 LOGQ3 0.06868089761 -0.01273725690 0.70493154456

165

5.4. DATOS DE PANEL


Existen muchos modelos en que se dispone de informacin de series de tiempo mezclada con informacin de corte transversal: informacin del tipo Panel (sometimes called longitudinal data). Data over time for the same cross section units is useful for several reasons: It allows us to look at dynamic relationships, something we cannot do with a single cross section. A panel data set also allows us to control for unobserved cross section heterogeneity.

Otras consideraciones de importancia son (Wooldrigde, p. 170): - OLS using pooled data is the leading method of estimation, and the usual inference procedures are available, including corrections for heteroskedasticity. - Serial correlation is not an issue because the samples are independent across time. - Because of the time series dimension, we often allow different time intercepts. - As a general rule, with large N and small T it is a good idea to allow for separate intercepts for each time period. Doing so, allows for aggregate time effects that have the same influence on yit for all i. - Panel data sets are most useful when controlling for time-constant unobserved featuresof people, firms, cities, and so onwhich we think might be correlated with the explanatory variables in our model. One way to remove the unobserved effect is to difference the data in adjacent time periods. Then, a standard OLS analysis on the differences can be used. The pooled OLS estimator or fixed-effects estimator would likely be most appropriate to estimate a model using panel data.

5.4.1. INDEPENDENTLY POOLED CROSS SECTION ACROSS THE TIME


An independently pooled cross section is obtained by sampling randomly from a large population at different points in time (ej. different years): independently sampled observations. Sampling from the population at different points in time likely leads to observations that are not identically distributed (ej. changes over time in most regions). To collect panel data we follow (or attempt to follow) las mismas unidades, across time (data, for the same group of people in different years). Panel data sets are harder to collect than a single cross section, especially for individuals. We must use a survey and keep track of the individual for a follow-up survey. It is often difficult to locate some people for a second survey. For units such as firms, some firms will go bankrupt or merge with other firms. Panel data are much easier to obtain for schools, cities, counties, states, and countries. Motivos para using independently pooled cross sections is to increase the sample size, and get more precise estimators and test statistics with more power. Using pooled cross sections raises only minor statistical complications. Typically, to reflect the fact that the population may have different distributions in different time periods, we allow the intercept to differ across periods, usually years (including dummy variables46). It is also possible that the error variance changes over time, something we discuss later. Chow test (an F test) can be appled to two different time periods. A heteroskedasticity-robust version is also available. It is usually more interesting to allow for an intercept difference and then to test whether certain slope coefficients change over time.

Sometimes, the pattern of coefficients on the year dummy variables is itself of interest. For example, a demographer may be interested in the following question: After controlling for education, has the pattern of fertility among women over age 35 changed between 1972 and 1984? Ver ejemplo en Wooldrigde, Introductory, 13.2.

46

166

Pooled cross sections can be very useful for evaluating the impact of policy. Existen numerosas applications. Un ejemplo con 2 variables dummies en Woodrigde, EXAMPLE13.3 (Effect of a Garbage Incinerators Location on Housing Prices). For an interesting survey on natural experiment methodology and several additional examples, see Meyer (199547).

5.4.2. TWO-PERIOD PANEL DATA ANALYSIS


Using two periods of data results in a cross-sectional regression of the differenced data. The usual inference procedures are asymptotically valid under homoskedasticity; exact inference is available under normality. Is the simplest kind of panel data: for a cross section of individuals, schools, firms, cities, or whatever, we have two years of data; call these t = 1 and t = 2. The file CRIME2.RAW contains data on (among other things) crime and unemployment rates for 46 cities for 1982 and 1987. t = 1 corresponds to 1982, and t = 2 corresponds to 1987. What happens if we use the 1987 cross section and run a simple regression of crmrte on unem? We obtain

It implies that an increase in the unemployment rate lowers the crime rate. This is certainly not what we expect. The coefficient on unem is not statistically significant at standard significance levels: at best, we have found no link between crime and unemployment rates. This simple regression equation likely suffers from omitted variable problems. One possibile solution is to try to control for more factors. An alternative way to use panel data is to view the unobserved factors affecting the dependent variable as consisting of two types: those that are constant and those that vary over time. Letting i denote the cross-sectional unit and t the time period, we can write a model with a single observed explanatory variable as

d2t is a dummy variable that distingue dos periodos. ai captures all unobserved, time-constant factors that affect yit. (ai does not change over time). ai is called an unobserved effect. It is also common ai referred to as a fixed effect (because ai is fixed over time). In applications, you might see ai referred to as unobserved heterogeneity as well (or individual heterogeneity, firm heterogeneity, city heterogeneity, and so on). The error uit is often called the idiosyncratic error or time-varying error, because it represents unobserved factors that change over time and affect yit. These are very much like the errors in a straight time series regression equation.

To estimate the parameter of interest, one possibility is to just pool the two years and use OLS. This method has two drawbacks. - in order for pooled OLS to produce a consistent estimator of 1, we would have to assume that the unobserved effect, ai, is uncorrelated with xit. But even if we assume that, pooled OLS is biased and inconsistent if ai and xit are correlated. The resulting bias in pooled OLS is sometimes called heterogeneity bias, but it is really just bias caused from omitting a time-constant variable. Using pooled OLS does not solve the omitted variables problem. (The standard errors in this equation are incorrect because of the serial correlation noted earlier, but we ignore this since pooled OLS is not the focus here.)
47

Meyer, B. D. (1995), Natural and Quasi-Experiments in Economics Journal of Business and Economic Statistics 13, 151161.

167

- Differencing two years of panel data is a powerful way to control for unobserved effects, it is not without cost. In theory, using a first differenced equation is a good idea, but it does not work very well with most currently available panel data sets. Adding several explanatory variables causes no difficulties: In most applications, the main reason for collecting panel data is to allow for the unobserved effect, ai, to be correlated with the explanatory variables. Panel data can also be used to estimate finite distributed lag models. Even if we specify the equation for only two years, we need to collect more years of data to obtain the lagged explanatory variables.

5.4.3. POLICY ANALYSIS WITH TWO-PERIOD PANEL DATA


Panel data sets are very useful for policy analysis and, in particular, progam evaluation. This is similar to the natural experiment literature discussed earlier, with one important difference: the same cross-sectional units appear in each time period.

We can estimate a panel data version of the difference-in-differences estimator in equation for two pooled cross sections. With panel data, we have a potentially important advantage: we can difference y across time for the same cross-sectional units.

5.4.4. POLICY ANALYSIS WITH MORE THAN TWO TIME PERIODS


We can also use differencing with more than two time periods. Differencing more than two years of panel data is very useful for policy analysis. For more than two time periods, we can use pooled OLS on the differenced data; we lose the first time period because of the differencing. In addition to homoskedasticity, we must assume that the differenced errors are serially uncorrelated in order to apply the usual t and F statistics. (The chapter appendix contains a careful listing of the assumptions.) Naturally, any variable that is constant over time drops out of the analysis. We can correct for the presence of AR(1) serial correlation by quasi-differencing. [We can also use the Prais-Winsten transformation] Unfortunately, standard packages that perform AR(1) corrections for time series regressions will not work. Standard Cochrane-Orcutt or Prais-Winsten methods will treat the observations as if they followed an AR(1) process across i and t; this makes no sense, as we are assuming the observations are independent across i. Corrections to the OLS standard errors that allow arbitrary forms of serial correlation (and heteroskedasticity) can be computed when N is large (and N should be notably larger than T). A detailed treatment of these topics is beyond the scope of this text [see Wooldridge (1999, Chapter 10)], but they are easy to compute in certain regression packages. If there is no serial correlation in the errors, the usual methods for dealing with heteroskedasticity are valid. We can compute robust standard errors. Papke (1994) studied the effect of the Indiana enterprise zone (EZ) program on unemployment claims. She analyzed 22 cities in Indiana over the period from 1980 to 1988. Six enterprise zones were

168

designated in 1984, and four more were assigned in 1985. Twelve of the cities in the sample did not receive an enterprise zone over this period; they served as the control group.

5.4.5. ADVANCED PANEL DATA METHODS


The police variable might be endogenous in the equation because counties may enlarge the police force when they expect crime rates to increase. In this case, the output cannot be interpreted in a causal fashion. We will cover models and estimation methods that can account for this additional form of endogeneity: Instrumental Variables Estimation and Two Stage Least Square and Simultaneous Equations Models.

169

5.4.6. PANEL DATA EN RATS

Ejemplo:

Se tiene informacin de 4 empresas durante 10 meses, y se desea determinar la relacin entre los costos y la produccin. cal 2000 1 12 all 40 data(org=obs,unit=input) / firm time cost output ... Ver datos en Tabla 9 en el Anexo al final del libro ;* para este ejemplo, si no se tiene en cuenta las diferencias entre cada empresa, se correr la regresin global (ingenua) del siguiente tipo:

linreg cost # constant output Dependent Variable COST - Estimation by Least Squares Monthly Data From 2000:01 To 2003:04 Usable Observations 40 Degrees of Freedom 38 Centered R**2 0.714729 R Bar **2 0.707222 Uncentered R**2 0.973699 T x R**2 38.948 Mean of Dependent Variable 39.835500000 Std Error of Dependent Variable 12.856631124 Standard Error of Estimate 6.956595172 Sum of Squared Residuals 1838.9802229 Regression F(1,38) 95.2065 Significance Level of F 0.00000000 Durbin-Watson Statistic 0.871990 Q(10-0) 56.934642 Significance Level of Q 0.00000001 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 7.3851930356 3.5028926276 2.10831 0.04165362 2. OUTPUT 1.1315894222 0.1159726319 9.75738 0.00000000 Sin embargo, como veremos, la regresin anterior es ingenua, pues asume que no existen diferencias entre empresas.

5.4.1. INGRESO DE DATOS DE PANEL


Para considerar en la regresin que deben existir diferencias entre empresas, el procedimiento es ingresar la informacin en RATS bajo la estructura de datos de panel. Para esto debe indicarse que se trata de observaciones en estructura de panel en Calendar y en Allocate. Bajo esta estructura los rangos de trabajo ya no sern del tipo 1970:1 1979:4, como cuando se trataba se series de tiempo, sino del tipo 2//1980:1 4//1988:4, lo que indica que se trabajar en este caso con los grupos 2 al 3 inclusive, dentro de los rangos de tiempo 1980:1 y 1988:4. La instruccin Calendar debe tener ahora la opcin (panel=numero de periodos de tiempo por individuo). La instruccin Allocate indicar el nmero de individuos y el periodo de termino de las

170

observaciones. La organizacin de los datos de panel para la lectura en RATS: individuos en la primera columna de datos, y luego en la siguiente columna por tiempo.

Ejemplo:

Para el caso anterior las instrucciones son: cal(panel=10) 2000 1 12 all 0 4//2000:10 data(org=obs,unit=input) / firm time cost output table Series FIRM TIME COST OUTPUT Obs Mean Std Error 40 2.5000000000 1.1322770341 40 5.5000000000 2.9088723694 40 39.8355000000 12.8566311235 40 28.6767500000 9.6052553424 Minimum Maximum 1.0000000000 4.0000000000 1.0000000000 10.0000000000 4.7400000000 64.2900000000 3.7800000000 47.7000000000

Para efectos de graficar series, en este caso el tipo de grfico apropiado es el scatter, para lo cual puede hacerse lo siguiente: Ejemplo: Graficamos Costo y Producto a travs del tiempo. set xaxis = %period(t) scatter(style=line, patterns, key=loright) 2 # xaxis cost 1//2000:1 1//2000:10 # xaxis output 1//2000:1 1//2000:10
56

48

40

32

24

16

COST OUTPUT

0 0 2 4 6 8 10

;* las series pueden ser visualizadas usando la instruccin Print del siguiente modo:

171

Ejemplo:

print 1//2000:1 1//2000:10 cost output ;* es la informacin de la primera empresa solamente ENTRY 1//2000:01 1//2000:02 1//2000:03 1//2000:04 1//2000:05 1//2000:06 1//2000:07 1//2000:08 1//2000:09 1//2000:10 COST 43.720000000000 45.860000000000 4.740000000000 40.580000000000 25.860000000000 36.050000000000 50.940000000000 42.480000000000 25.600000000000 49.810000000000 OUTPUT 38.460000000000 35.320000000000 3.780000000000 35.340000000000 20.830000000000 36.720000000000 41.670000000000 30.710000000000 23.700000000000 39.530000000000

Para correr la regresin ingenua (global) habiendo ingresado los datos con las estructura de pane, es como sigue:

Ejemplo:

linreg cost 1//2000:1 4//2000:10 # constant output ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 7.3851930356 3.5028926276 2.10831 0.04165362 2. OUTPUT 1.1315894222 0.1159726319 9.75738 0.00000000

Como se ve, la salida es la misma. Sin embargo lo que debera hacerse es permitir una mayor flexibilidad para modelar las diferencias en comportamiento a travs de los grupos. Para eso existen bsicamente la estimaciones de efectos fijos y de efectos aleatorios.

5.4.2. ESTIMACION DE EFECTOS FIJOS


Aqu se quiere probar la hiptesis que los diferentes individuos poseen diferentes interceptos, aunque tienen la misma pendiente. Para esto construimos variables dummy y estimamos como sigue: Ejemplo: set set set set set set set set d1 d2 d3 d4 d1 d2 d3 d4 = 0.0 = 0.0 = 0.0 = 0.0 1//2000:1 2//2000:1 3//2000:1 4//2000:1

1//2000:10 2//2000:10 3//2000:10 4//2000:10

= = = =

1 1 1 1

linreg cost 1//2000:1 4//2000:10 # d1 d2 d3 d4 output Dependent Variable COST - Estimation by Least Squares Panel(10) of Monthly Data From 1//2000:01 To 4//2000:10 Usable Observations 40 Degrees of Freedom 35 Centered R**2 0.923759 R Bar **2 0.915046 Uncentered R**2 0.992971 T x R**2 39.719 Mean of Dependent Variable 39.835500000

172

Std Error of Dependent Variable 12.856631124 Standard Error of Estimate 3.747299853 Sum of Squared Residuals 491.47896660 Regression F(4,35) 106.0183 Significance Level of F 0.00000000 Durbin-Watson Statistic 2.468657 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. D1 2.315009593 2.278082430 1.01621 0.31650317 2. D2 10.109635763 2.230548731 4.53235 0.00006530 3. D3 2.385444975 2.031037012 1.17450 0.24812580 4. D4 16.171492017 2.160927547 7.48359 0.00000001 5. OUTPUT 1.119028635 0.063569861 17.60313 0.00000000 ;* de donde la pendiente comn es de 1.119029.

Ejemplo:

Ahora probamos la hiptesis de igualdad a cero de los coeficientes de las dummy: restr # 1 2 # 1 1 # 2 3 # 1 1 # 3 4 # 1 1 3 0.0 0.0 0.0 10.44323 with Significance Level 0.00004722

F(3,35)=

;* lo que nos lleva a rechazar la hiptesis que los interceptos son iguales (versus F=2.87), de modo que la estimacin ingenua no es apropiada.

La estimacin directa del ejemplo anterior en RATS es la siguiente: Restar las medias individuales de Y y X LINREG usa DFC=4 porque son perdidos 4 grados de libertad al eliminar las medias No se usa intercepto pues se han eliminado las medias.

RATS tiene muchas otras opciones, sin embargo nos limitamos a este caso simple (ver la instruccin PANEL en el men help).

Ejemplo:

PANEL cost / YTWID 1 PANEL output / X1TWID 1 LINREG(DFC=4) YTWID # X1TWID

ENTRY 1.0 INDIV -1.0 ENTRY 1.0 INDIV -1.0

Dependent Variable YTWID - Estimation by Least Squares Panel(10) of Monthly Data From 1//2000:01 To 4//2000:10 Usable Observations 40 Degrees of Freedom 35 Centered R**2 0.898513 R Bar **2 0.898513 Uncentered R**2 0.898513 T x R**2 35.941 Mean of Dependent Variable -0.00000000 Std Error of Dependent Variable 11.76284264 Standard Error of Estimate 3.74729985 Sum of Squared Residuals 491.47896660 Durbin-Watson Statistic 2.468657

173

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. X1TWID 1.1190286351 0.0635698610 17.60313 0.00000000

Note que la instruccin: PANEL cost / YTWID 1 ENTRY 1.0 INDIV -1.0

indica que la nueva serie llamada YTWID comenzar en la entrada 1.0, y all se almacenar la entrada menos la media para ese individuo. Si quisiramos restar 0.4 veces el promedio, escribiramos PANEL cost / YTWID 1 ENTRY 1.0 INDIV 0.4

Otra caracterstica interesante es que es posible corregir por heterocedasticidad a travs de la opcin SPREAD. El procedimiento es: Ejemplo: Linreg Y / u # constant x panel(spread=panels) u ;* calcula una serie apropiada para corregir posteriormente. Esta serie es calculada empricamente igual a la varianza muestral para las entradas de corte transversal. linreg(spread=panels) y / u # constant x

5.4.3. ESTIMACION DE EFECTOS ALEATORIOS


El procedimiento consiste en: 1) Correr una regresin OLS y descomponer los residuos. LINREG(noprint) cost / RESIDS # CONSTANT output PSTATS(EFFECTS=INDIV) RESIDS COMPUTE VETA=%VRANDOM COMPUTE VEPS=%VINDIV COMPUTE THETA = 1.0 - SQRT(VETA/(VETA+5*VEPS)) 2) Restar theta veces la media de los individuos de los regresores. PANEL cost / YTWID 1 PANEL output / X2TWID 1 SET CONSTWID = 1 - THETA ENTRY 1.0 ENTRY 1.0 INDIV INDIV -THETA -THETA

3) Correr el modelo con CONSTWID como CONSTANT. LINREG YTWID # CONSTWID X2TWID

174

Dependent Variable YTWID - Estimation by Least Squares Panel(10) of Monthly Data From 1//2000:01 To 4//2000:10 Usable Observations 40 Degrees of Freedom 38 Centered R**2 0.884329 R Bar **2 0.881285 Uncentered R**2 0.934261 T x R**2 37.370 Mean of Dependent Variable 9.682811273 Std Error of Dependent Variable 11.251787206 Standard Error of Estimate 3.876802974 Sum of Squared Residuals 571.12484927 Regression F(1,38) 290.5188 Significance Level of F 0.00000000 Durbin-Watson Statistic 2.192533 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. CONSTWID 7.7234044639 3.1478560461 2.45354 0.01884373 2. X2TWID 1.1197954976 0.0656979215 17.04461 0.00000000

Comentarios Finales: Cuando aumenta el tamao de la muestra, para un nmero de individuos fijo, ambos estimadores de efectos fijos y aleatorios sern idnticos. En ese caso el estimador de variables dummy (efectos fijos) ser consistente y asintticamente eficiente. En general con T grande y N pequeo habr poca diferencia entre ambos, de modo que lo ms recomendable ser usar el mtodo sencillo (efectos fijos). Con N grande y T pequeo, ambos estimadores pueden diferir de un modo importante, por lo que se deben tener en cuenta otros aspectos. A fin de determinar el modelo apropiado.

175

5.4.4. CASO DE ESTUDIO: FUNCION TRANSLOGARITMICA


Consideremos la estimacin de una funcin de costos translogartmica para la industria bancaria chilena48. cal(panel=120) 1990 01 12 all 0 22//1999:12 open data D:data05.xls data(org=obs,format=xls) / table Series BANCO TAMANO ORIGEN MES C_AP_OPER CTOT C_SIN_INT COLC INVE DEPO P_MO P_CA RIES NSUC set set set set set set set set set set set set set set set set set set set set set set set set set Obs 2640 2640 2640 2640 2640 2640 2640 2640 2640 2640 2640 2640 2640 2640 Mean 11.5000 2.6364 5.6818 94.5650 1734.1981 10139.3947 5596.0068 514211.6064 145901.0667 432407.2508 134.2706 0.0011 0.0230 40.7943 Std Error 6.3455 1.1099 0.4659 2.8730 2537.7311 16159.6098 10881.6758 787260.0135 257776.8048 664555.0458 37.6149 0.0079 0.0190 55.8402 Minimum 1.0000 1.0000 5.0000 90.0100 13.0000 -125887.0000 -132482.0000 0.0000 0.0000 129.0000 85.8700 0.0000 0.0010 1.0000 Maximum 22.0000 4.0000 6.0000 99.1200 34332.0000 246775.0000 225556.0000 4182636.0000 1683975.0000 5250917.0000 198.9900 0.4031 0.2224 248.0000

lnc = log(c_ap_oper) lnc1 = log(ctot) lnc2 = log(c_sin_int) lndep = log(depo) lnlon = log(colc) lninv = log(inve) lnplab = log(p_mo) lnpcap = log(p_ca) lnries = log(ries) lnnsuc = log(nsuc) lndep_ = 0.5*lndep**2 lnlon_ = 0.5*lnlon**2 lninv_ = 0.5*lninv**2 lndep_lon = lndep*lnlon lndep_inv = lndep*lninv lnlon_inv = lnlon*lninv lnplab_ = 0.5*lnplab**2 lnpcap_ = 0.5*lnpcap**2 lnplab_pcap = lnplab*lnpcap lndep_plab = lndep*lnplab lndep_pcap = lndep*lnpcap lnlon_plab = lnlon*lnplab lnlon_pcap = lnlon*lnpcap lninv_plab = lninv*lnplab lninv_pcap = lninv*lnpcap

linreg(NOPRINT) lnc1 / errores # constant lndep lnlon lninv lnplab lnpcap lnries lnnsuc lndep_ $ lnlon_ lninv_ lndep_lon lndep_inv lnlon_inv lnplab_ $ lnpcap_ lnplab_pcap lndep_plab lndep_pcap lnlon_plab $
Vase Dagnino y Ziga (2001) Estimacin de las Economas de Escala y de mbito en la Banca Chilena: 1990 1999. Documentos de Trabajo, Escuela de Ingeniera Comercial, UCN.
48

176

lnlon_pcap lninv_plab lninv_pcap set xaxis = %period(t) scatter(style=line) 1 # xaxis errores 1//1990:01 1//1999:12 scatter(style=line, key=upleft, vmax=2.) 2 # xaxis smallres 1//1990:01 1//1999:12 # xaxis errores 1//1990:01 1//1999:12 com cutoff = 3.0*sqrt(%seesq) set smallres = abs(errores) < cutoff linreg(smpl=smallres,NOPRINT) lnc1 # constant lndep lnlon lninv lnplab lnpcap lnries lnnsuc lndep_ $ lnlon_ lninv_ lndep_lon lndep_inv lnlon_inv lnplab_ $ lnpcap_ lnplab_pcap lndep_plab lndep_pcap lnlon_plab $ lnlon_pcap lninv_plab lninv_pcap restrict(create) 3 # 5 6 # 1. 1. 1. # 15 16 17 # 1. 1. 1. 0.0 # 18 19 20 21 22 23 # 1. 1. 1. 1. 1. 1. 0.0 F(3,2483)= 45.51139 with Significance Level 0.00000000

Dependent Variable LNC1 - Estimation by Restricted Regression Panel(120) of Monthly Data From 1//1990:01 To 22//1999:12 Usable Observations 2506 Degrees of Freedom 2486 Total Observations 2640 Skipped/Missing 134 Centered R**2 0.952111 R Bar **2 0.951745 Uncentered R**2 0.997891 T x R**2 2500.716 Mean of Dependent Variable 8.1031206727 Std Error of Dependent Variable 1.7393536594 Standard Error of Estimate 0.3820845791 Sum of Squared Residuals 362.92772316 Durbin-Watson Statistic 1.038450 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 3.574688592 2.196275444 1.62761 0.10373349 2. LNDEP -3.089354351 0.450601488 -6.85607 0.00000000 3. LNLON 3.141493470 0.379664092 8.27440 0.00000000 4. LNINV 0.747672302 0.215174409 3.47473 0.00052013 5. LNPLAB -0.013286371 0.365282274 -0.03637 0.97098795 6. LNPCAP 1.013286371 0.365282274 2.77398 0.00557884 7. LNRIES 0.060986365 0.012162059 5.01448 0.00000057 8. LNNSUC 0.030712281 0.015955563 1.92486 0.05436042 9. LNDEP_ 0.126844457 0.032116825 3.94947 0.00008050 10. LNLON_ 0.257461756 0.016073424 16.01785 0.00000000 11. LNINV_ 0.183174944 0.009807255 18.67749 0.00000000 12. LNDEP_LON -0.085424647 0.017217800 -4.96141 0.00000075 13. LNDEP_INV -0.103373501 0.015837464 -6.52715 0.00000000 14. LNLON_INV -0.105686743 0.012614087 -8.37847 0.00000000 15. LNPLAB_ -0.083632745 0.017861384 -4.68232 0.00000299 16. LNPCAP_ 0.064599470 0.026518635 2.43600 0.01492037 17. LNPLAB_PCAP 0.019033275 0.043348410 0.43908 0.66064415 18. LNDEP_PLAB 0.741231156 0.073083676 10.14223 0.00000000 19. LNDEP_PCAP -0.033425046 0.033866833 -0.98696 0.32376067 20. LNLON_PLAB -0.743889568 0.059648619 -12.47120 0.00000000

177

21. LNLON_PCAP 22. LNINV_PLAB 23. LNINV_PCAP

-0.008591598 0.033847901 0.010827155

0.028821828 0.037244095 0.017272437

-0.29809 0.90881 0.62685

0.76565674 0.36353719 0.53081785

178

7.7. SISTEMAS DE ECUACIONES NO-LINEALES


Un sistemas de ecuaciones no lineales simultneas puede ser entendido como una generalizacin multivariada de la estimacin de ecuaciones no lineales, lo que recordemos es implementado normalmente en RATS con la instruccin NLLS49. Tambin puede ser interpretada como una especificacin de ecuaciones no lineales aparentemente no relacionadas. De cualquier modo el objetivo es minimizar la suma de cuadrados, pero ahora expresada matricialmente, es decir:

min et' 1 et

t =1

donde e es el vector de errores del sper sistema, y es la matriz de covarianza de los errores del sper sistema. Ntese que si bien lo anterior permitir obtener una estimacin de mnimos cuadrados no lineales multivariados, anlogamente al caso uniecuacional, es tambin posible implementar en RATS una estimacin de Mxima Verosimilitud multivariada, la que solo es de utilidad en estudios economtricos muy especializados, por lo que no ser vista aqu.

7.7.1. LA INSTRUCCIN NLSYSTEM


Para implementar MC no lineales multivariados en RATS se utiliza la instruccin NLSYSTEM, por lo que, en consecuencia, se trata de un procedimiento iterativo. La estructura de esta instruccin es la siguiente: NLSYSTEM start end list of FRMLS donde los parmetros son los usuales. Como siempre, es necesario previamente definir la lista de parmetros libres, definir las frmulas, establecer los valores iniciales de bsqueda de los parmetros, para a continuacin efectuar la estimacin con NLSYSTEM. Ntese que es posible utilizar instrumentos en NLSYSTEM, y en este caso se implementa el mtodo generalizado de momentos (GMM), siendo NLLS en 3 etapas un caso especial de GMM. Veamos el uso de la instruccin a travs del siguiente ejemplo:

Ejemplo:

Supongamos un sistema de demanda en que el gasto (piqi) depende del gasto de subsistencia (pii) ms una proporcin i del ingreso supernumerario. Para el caso de 3 familias las ecuaciones son:

p1q1 = p1 1 + 1 ( y p1 1 p 2 2 p3 3 ) p 2 q 2 = p2 2 + 2 ( y p1 1 p 2 2 p3 3 ) p3 q3 = p3 3 + 3 ( y p1 1 p 2 2 p3 3 )
49

Si bien no mostramos aqu, RATS trabaja tambien con funciones de verosimilitud multivariadas y modelos de Vectores Autorregresivos que son una forma de modelos no lineales simultneos.

179

;* puesto que las ecuaciones son claramente no lineales, en los parmetros, no puede ser estimada por SUR, sino que usamos NLSYSTEM. ALL 30 DATA(UNIT=INPUT,ORG=OBS) / p1 p2 p3 y q1 q2 q3 ... Ver datos en Tabla 12 en Anexo al final del libro NONLIN gama1 gama2 gama3 beta1 beta2 beta3 set yy1 set yy2 set yy3 FRML f1 FRML f2 FRML f3 ;*la lista de parmetros libres

= p1*q1 ;* definimos las formulas = p2*q2 = p3*q3 yy1 = p1*gama1 + beta1*(y-p1*gama1-p2*gama2-p3*gama3) yy2 = p2*gama2 + beta2*(y-p1*gama1-p2*gama2-p3*gama3) yy3 = p3*gama3 + beta3*(y-p1*gama1-p2*gama2-p3*gama3)

COMPUTE gama1=gama2=gama3=beta1=beta2=beta3=0.0 ;* los valores iniciales de los parmetros NLSYSTEM / f1 f2 f3 ;* corremos el sistema

Estimation by Non-linear Least Squares Iterations Taken 10 Function Value 90.00000000 ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. GAMA1 3.0683145372 1.7494958915 1.75383 0.07946002 2. GAMA2 3.8902230645 1.1932530751 3.26018 0.00111340 3. GAMA3 7.6644913062 5.1301210566 1.49402 0.13517101 4. BETA1 0.2061693627 0.0342842263 6.01353 0.00000000 5. BETA2 0.0911716798 0.0271437934 3.35884 0.00078270 6. BETA3 0.7019492634 0.0436240902 16.09086 0.00000000

Tambin es posible obtener la matriz de covarianzas de los residuos, por lo que a travs de estimaciones no restringidas y restringidas del sistema anterior, es posible sin mayor dificultad implementar pruebas de razn de verosimilitud.

180

CAPITULO 8 ESTACIONARIEDAD Y COINTEGRACION

8.1. INTRODUCCION
Los modelos de series de tiempo se caracterizan por utilizar valores pasados de las variables para explicar los valores presentes y/o predecir valores futuros de stas, lo que implica que los valores o miembros del proceso estocstico no son completamente independientes, es decir las covarianzas entre stos no son cero, y adems stas juegan un rol fundamental en caracterizar tales procesos. Para esto, una serie observada (x1, x2,...xT) es entendido como una realizacin de un proceso estocstico. Generalmente nos conformamos con conocer el siguiente conjunto de momentos de un proceso: las T medias (E(x1),E(x2),..E(xT)), las T varianzas (V(x1),V(x2),..V(xT)) y las T(T-1)/2 covarianzas.

Sin embargo existen problemas para inferir todos los valores anteriores, pues se tienen solamente T observaciones y 2T+T(T-1)/2 incgnitas. Por este motivo, es decir para reducir el nmero de incgnitas, se hace normalmente el supuesto de estacionariedad50, el que como veremos es fundamental para la validez del anlisis de regresin, aunque bajo cointegracin, es decir series cointegradas, tambin es posible obtener resultados vlidos en los casos de ausencia de estacionariedad.

8.2. ESTACIONARIEDAD
8.2.1. DEFINICION
La principal definicin de estacionariedad (estacionariedad dbil) implica que la media () y la varianza (2) del proceso son constantes, y las autocovarianzas (k) y autocorrelaciones (k) dependen slo del rezago k (0=V(xt))51. Las principales implicancias de la estacionariedad para nuestros fines son dos:

50 Otro concepto importante, pero que no utilizaremos aqu, es el de ERGODICIDAD, que significa que los momentos muestrales tienden a los momentos poblacionales a medida que la longitud de la realizacin converge a infinito. 51 La Estacionariedad Estricta implica que, adems de lo anterior, el proceso no es afectado por un cambio de origen de tiempo. Bajo normalidad conjunta el set de momentos caracterizan completamente las propiedades del proceso, es decir ambas estacionariedades son equivalentes.

181

a) La existencia de estacionariedad asegura que la varianza del proceso es finita y que una innovacin en el proceso tiene solamente un efecto temporal sobre ste. b) Cuando no exista estacionariedad para dos series X e Y, una regresin entre stas ser espuria, en el sentido que existir un alto R2 debido a la existencia de una tendencia y no debido a una fuerte relacin entre las variables. Un ejemplo de un proceso estocstico estacionario es uno llamado ruido blanco52, que puede ser representado en RATS a travs del la funcin %ran53 como sigue:

Ejemplo:

Un proceso de ruido blanco es por ejemplo el siguiente: all 100 cal 1990 1 12 set err = %ran(1.0) set y 1 1 = 0.0 graph 1 # err

;* una desviacin estndar de 1.0

-1

-2 1990 1991 1992 1993 1994 1995 1996 1997

;* ntese que la media parece ser constante (igual a cero) y que la volatilidad parece tambin constante, por lo que esta serie puede ser estacionaria.

Una serie es no estacionaria cuando presenta alguna tendencia, sea sta determinstica o estocstica. Ejemplos tpicos de series no estacionarias son los ndices de precios accionarios, o los ndices de precios o de actividad econmica.

52

Cuando los errores del modelo de regresin etn bien comportados, es decir son inependiente e idnticamente distrubudos (homocedsticos y no correlacionados) son un ruido blanco. 53 %RAN(X) entrega realizaciones de una distribucin normal con media cero y desviacin estandard deviation X.

182

Ejemplo:

Consideremos el ndice General de Precios de las Acciones (IGPA) de la Bolsa de Comercio de Santiago (Valor Nominal mensual): all 135 cal 1990 1 12 data(unit=input, org=obs) / IGPA ... table Series IGPA graph 1 # igpa Obs Mean Std Error 135 3978.67051852 1526.11906472 Minimum Maximum 802.40000000 6234.64000000 Ver datos en la Tabla 14 en el Anexo al final del libro

6400

5600

4800

4000

3200

2400

1600

800 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

As, puesto que la serie del IGPA parece tener una tendencia, creemos que no es estacionaria. Sin embargo existen pruebas formales de estacionariedad, como veremos a continuacin.

8.2.2. PRUEBAS DE ESTACIONARIEDAD: CORRELOGRAMA54


Una caracterstica de las series no estacionarias es que las autocorrelaciones de las realizaciones comienzan en un valor muy alto (cercano a 1.0) y disminuyen lentamente para grandes rezagos. En cambio para series estacionarias se esperara que la cada de las correlaciones sea muy fuerte, y no gradual. Calculemos el correlograma para la serie IGPA como sigue: Ejemplo: CORRELATE(NUMBER=20, QSTATS) IGPA / ACF ;* guardamos las autocorrelaciones en la serie ACF.

Recordemos que el correlograma, al igual que la prueba de Ljung-Box han sido utilizados anteriormente para detectar la autocorrelacin de los residuos.

54

183

Correlations of Series IGPA Monthly Data From 1990:01 To 2001:03 Autocorrelations 1: 0.97269531 0.93872391 0.90695896 0.87615335 0.84443161 0.81366689 7: 0.78277486 0.74993045 0.71218145 0.67147009 0.63162050 0.59274082 13: 0.55304969 0.51535876 0.48100681 0.45172036 0.42350436 0.39848247 19: 0.37675286 0.35934509 Ljung-Box Q-Statistics Q(20) = 1348.0091.

Significance Level 0.00000000

;* rechazamos la hiptesis que las correlaciones sean cero.

GRAPH(STYLE=STEP, KEY=UPRIGTH) 1 # ACF


1.0
ACF

0.9

0.8

0.7

0.6

0.5

0.4

0.3 J F M A M J J 1990 A S O N D J F M A M J J 1991 A S

En efecto, las autocorrelaciones de la serie IGPA disminuyen gradualmente, como se esperara en el caso de una serie no estacionaria. A efectos de comparacin podemos graficar las correlaciones de un ruido blanco. Ejemplo: all 100 cal 1990 1 12 set err = %ran(1.0) set y 1 1 = 0.0 graph 1 # err

184

CORRELATE(NUMBER=20, QSTATS) err / ACF Correlations of Series ERR Monthly Data From 1990:01 To 1998:04 Autocorrelations 1: -0.0204442 -0.0768758 -0.0104740 0.1167994 -0.1668040 0.0478001 7: 0.0875188 -0.0010813 -0.1032321 0.0746679 0.0555952 0.0038571 13: 0.1918295 0.0821830 -0.0988624 -0.0038604 -0.0425198 -0.0038308 19: -0.1501119 0.0293962

Ljung-Box Q-Statistics Q(20) = 17.8388.

Significance Level 0.59802602

;* ahora la hiptesis que las correlaciones son cero no es rechazada. GRAPH(KEY=UPRIGTH) 1 # ACF
1.0
ACF

0.8

0.6

0.4

0.2

0.0

-0.2 J F M A M J J 1990 A S O N D J F M A M J J 1991 A S

* el grfico muestra que efectivamente las correlaciones caen fuertemente a partir de 1.0. A continuacin veremos otro tipo de pruebas formales, llamadas de races unitarias, que han sido muy populares (y tambin criticadas) en los aos recientes.

8.2.3. PRUEBAS DE ESTACIONARIEDAD: RAICES UNITARIAS


Subyacente en el concepto de una prueba de raz unitaria se encuentra la existencia de una fuerte relacin entre la realizacin de una serie en el momento t y la realizacin de esta misma serie en el momento t-1. Esto es medido a travs de la siguiente regresin:

Yt = Yt 1 + t
donde en un error bien comportado. Si es igual a 1.0, es decir un proceso AR(1), entonces la serie no es estacionaria, y adems se dice que tiene una raz unitaria. La serie con esta caracterstica es llamada un Random-Walk55.
55

La definicin de un random walk o caminata aleatoria es un poco ms amplia, ya que admite la posibilidad de elementos de tendencia. Los random walks tienen dos propiedades importantes: la propiedad de Markov (la nica informacin relevante para el valor futuro de la variable es su valor actual), y la propiedad de martingala (la expectativa condicional de un valor futuro de la variable es su valor actual). En el caso de una martingala, si bien los

185

Luego, la hiptesis de raz unitaria es Ho:=1.0. Sin embargo Dickey y Fuller (1979, 1981) mostraron que, para la hiptesis anterior, la tradicional prueba t no puede se aplicada, pues existe sesgo. En cambio mostraron que los valores correctos son, en el caso de correr la regresin con intercepto: al 90% el coeficiente estimado es menor que 2.58 errores estndar de la unidad al 95% el coeficiente estimado es menor que 2.89 errores estndar de la unidad al 99% el coeficiente estimado es menor que 3.51 errores estndar de la unidad Tambin es posible escribir el modelo como sigue:

Yt Yt 1 = Yt = ( 1)Yt 1 + t
de modo que la hiptesis cambia ahora a Ho:=0.0 Dickey y Fuller proponen una serie de regresiones ms generales para verificar la existencia de races unitarias56: Modelo 1:

Yt = Yt 1 + i Yt i +1 + t
i =2 p

(sin media)

Modelo 2:

Yt = + Yt 1 + i Yt i +1 + t
i =2 p

(con media)

Modelo 3:

Yt = + Yt 1 + t + i Yt i +1 + t
i =2

(con media y tendencia)

pero los valores crticos apropiados para la hiptesis Ho: existencia de raz unitaria, varan con el tipo de modelo utilizado57. Afortunadamente se han implementado en RATS una serie de subrutinas (procedures) para diferentes especificaciones de esta prueba. A continuacin usaremos el procedure URADF.SRC desarrollado por Norman Morin para encontrar el nmero apropiado de rezagos en la estimacin de una raz unitaria de la serie IGPA: Ejemplo: source(noecho) c:\winrats\uradf.src @uradf igpa ;* el procedure debe encontrarse en el directorio que aqu se indique. ;* analizamos la serie IGPA

**************************************************************** * TESTING THE NULL HYPOTHESIS OF A UNIT ROOT IN IGPA * * Using data from 1990:01 to 2001:03 * * Choosing the optimal lag length for the ADF regression * * between 0 and 20 lags. * **************************************************************** Model Selection Criteria Minimum AIC at lag:

cambios en la variable deben ser siempre cero, no necesitan tener varianza constante, ni las innovaciones ser independientes. En el caso de una tendencia positiva se llaman sub-martingalas, y en el caso de tendencias negativas supramartingalas. 56 El conjunto de pruebas anteriores son llamadas de Dickey y Fuller. Existe un nmero importante de otras pruebas de races unitarias especializadas, entre las cuales es usual la de PhillipsPerron. 57 Al 5%: para el modelo 1: T=25 -1.95; T=100 -1.95; para el modelo 2: T=25 -3.00; T=100 -2.89; para el modelo 3: T=25 -3.60; T=100 -3.45.

186

Minimum BIC at lag:

**************************************************************** * Augmented Dickey-Fuller t-test with 2 lags: -1.9919 * * 1% 5% 10% * * -3.46 -2.88 -2.57 * * * * Augmented Dickey-Fuller Z-test with 2 lags: -3.6433 * * 1% 5% 10% * * -20.3 -14.0 -11.2 * * * * Coefficient and T-Statistic on the Constant: * * 115.45061 2.3730 * * * * Joint test of a unit root and no constant: 3.0307 * * 1% 5% 10% * * 6.52 4.63 3.81 * **************************************************************** Este procedure por default estima el modelo 2, sin embargo puede seleccionarse el modelo 1 o el modelo 2. La conclusin es que puesto que 1.99 se encuentra a la derecha de 2.89, no rechazamos Ho, es decir existe raz unitaria. Grficamente:

Ho: Existe Raiz unitaria I(1)

-2.89 Valor Crtico

-1.99 Valor Calculado

El procedure anterior tiene por caracterstica estimar el nmero ptimo de rezagos en base a dos criterios (AIC y BIC)58, que en este caso es de 2. Ahora usamos el procedure URAUTO.SRC desarrollado por Paco Goerlich para obtener las conclusiones finales para las 3 especificaciones del test:

58

Vase Anexo del captulo 3.

187

Ejemplo:

source(noecho) c:\winrats\urauto.src @urauto(lag=2) igpa URAUTO Procedure by Paco Goerlich TESTING SERIES: IGPA SAMPLE 1990:01 TO 2001:03 AUTOREGRESSIVE CORRECTIONS: 2 LAGS WORKING AT 5.0 % SIGNIFICANCE LEVEL ALL TESTS OF UNIT ROOT ARE ONE-SIDED REGRESSIONS WITH CONSTANT,TREND ;* modelo 3

t(rho-1)/tao = -1.41830 with critical value -3.41000 Cannot reject a unit root with t(rho-1)/tao Next is joint test of trend=0 and root=1 psi3 = 1.97291 with critical value 6.25000 PSI3 cannot reject unit root and no linear trend REGRESSIONS WITH CONSTANT,NO TREND ;* modelo 2 t(rho-1)/mu = -1.99193 with critical value -2.86000 Cannot reject a unit root with t(rho-1)/mu Next is joint test of constant=0 and root=1 psi1 = 3.03066 with critical value 4.59000 PSI1 cannot reject constant=0 and root=1 REGRESSIONS WITH NO CONSTANT, NO TREND ;* Modelo 1 t(rho-1) = 0.64456 with critical value -1.95000 Cannot reject a unit root with t(rho-1) CONCLUSION: Series contains a unit root with zero drift

8.2.4. DIFERENCIACION DE SERIES I(1)


Un proceso que contiene una raz unitaria es denotado I(1). En estos casos es posible eliminar la raz unitaria diferenciando la series, esto es, calculando la primera diferencia. En series que contienen dos races unitarias, I(2), se debe diferenciar dos veces para obtener una serie estacionaria, y as sucesivamente. El problema es que en muchas ocasiones la serie resultante de la diferenciacin no es de inters, por lo que debe buscarse un camino de solucin alternativo. Afortunadamente en el caso del IGPA, la diferenciacin nos lleva a obtener una serie de rendimientos, de modo que la recomendacin es usar en las regresiones las series de rendimientos del IGPA en lugar del GPA propiamente tal. Verifiquemos ahora que la serie diferenciada del IGPA, es decir los rendimientos accionarios, es estacionaria.

Ejemplo:

set RIGPA = (IGPA-IGPA{1})/IGPA{1}*100

;* calculamos los rendimientos mensuales del IGPA

graph(key=loright) 1 # RIGPA

188

24

16

-8

RIGPA

-16 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

;* el grfico de la series muestra que sta parece ser estacionaria. Ahora calculamos y graficamos las correlaciones:

CORRELATE(NUMBER=20, QSTATS) RIGPA / ACF_IGPA Correlations of Series RIGPA Monthly Data From 1990:02 To 2001:03 Autocorrelations 1: 0.3852512 0.0131327 0.0467991 0.0451494 0.0508355 0.0803366 7: 0.1334101 0.2058936 0.0720181 -0.0045277 0.0216250 0.0302207 13: 0.0029372 -0.1164852 -0.0758913 0.0400439 -0.0324749 -0.0366234 19: -0.0584787 -0.0621661

Ljung-Box Q-Statistics Q(20) = 36.6115.

Significance Level 0.01302170

;* el test q nos indica que la serie diferenciada an tiene un nmero considerable de correlaciones distintas de cero. GRAPH(KEY=UPRIGTH) 1 # ACF_IGPA
1.0
ACF_IGPA

0.8

0.6

0.4

0.2

0.0

-0.2 J F M A M J J 1990 A S O N D J F M A M J J 1991 A S

;* el grfico parece mostrar una serie estacionaria.

189

Veamos lo que nos dice el test de Dickey-Fuller al respecto: source(noecho) c:\winrats\uradf.src ;* este paso no es necesario si ya fue efectuado previamente, pues el procedure queda cargado en la memoria del computador. @uradf rigpa ... omitimos parte de los resultados

Model Selection Criteria Minimum AIC at lag: Minimum BIC at lag:

1 1

La prueba debe efectuarse con 1 rezago: source(noecho) c:\winrats\urauto.src @urauto(lag=1) rigpa URAUTO Procedure by Paco Goerlich TESTING SERIES: RIGPA SAMPLE 1990:02 TO 2001:03 AUTOREGRESSIVE CORRECTIONS: 1 LAGS WORKING AT 5.0 % SIGNIFICANCE LEVEL ALL TESTS OF UNIT ROOT ARE ONE-SIDED REGRESSIONS WITH CONSTANT,TREND ;* Modelo 3 -3.41000

t(rho-1)/tao = -7.92059 with critical value Unit root rejected with t(rho-1)/tao CONCLUSION: Series has no unit root

As, esta prueba no encuentra una raz unitaria y afirma que la serie diferenciada es estacionaria. El econometrista experimentado notar del grfico de la serie IGPA que existe la posibilidad de un quiebre significativo en 1995, de modo que sugerir otras pruebas de races unitarias que mejor se ajusten a este caso. Cuando la serie diferenciada no sea de inters, puede seguirse el camino tradicional de incorporar una variable de tendencia a la regresin, la que tiene por objeto justamente capturar la tendencia dejando que el coeficiente estimado de la serie I(1) libre del efectos de la tendencia, de modo que la regresin es vlida. Sin embargo actualmente se distingue entre tendencias determinsticas y estocsticas, afirmndose que este ltimo procedimiento (incorporar una tendencia) solo es posible en el caso de una tendencia determinstica. En caso contrario, la nica posibilidad es verificar la existencia de cointegracin, lo que justificara correr regresiones entre variables I(1), sin que el resultado de sta sea espurio. Este tpico ser tratado a continuacin.

190

8.3. COINTEGRACION: PRUEBA DE ENGLE-GRANGER


8.3.1. INTRODUCCION
Si se tiene un modelo de regresin en que tanto la variable dependiente como la independiente son I(1), entonces se tendr una regresin espuria, puesto que la presencia de las tendencias contaminar los resultados. Esto, a menos que ambas series tengan una relacin de equilibrio de largo plazo. Formalmente, se dice que dos series (o ms) estn cointegradas si una combinacin lineal de stas es estacionaria. La intuicin puede obtenerse es el siguiente ejemplo, en que suponemos que tanto el ingreso como el consumo son I(1):

CONSUMOt = 0 + 1 INGRESO + t
Puesto que el consumo y el ingreso son I(1), entonces ambas series representadas en un grfico respecto al tiempo presentaran un comportamiento por ejemplo creciente. Para que exista cointegracin entre ambas, es necesario que exista una relacin entre ambas una vez eliminada la tendencia creciente, es decir:

t = CONSUMOt 0 1 INGRESO
el error, que es una combinacin lineal de las series, debe ser estacionario, I(0).

8.3.2. PRUEBA DE ENGLE-GRANGER (1987)


El procedimiento puede resumirse en los siguientes pasos: Paso 1: Verificar el orden de integracin de las variables. Verificar que ambas son I(1). Paso 2: Estimar la relacin de equilibrio de largo plazo, es decir la regresin:

CONSUMOt = 0 + 1 INGRESO + t
y verificar que los residuos de la regresin anterior son I(0). Si son I(1) concluimos que las variables no estn cointegradas. Si los residuos son I(0) decimos que las variables son cointegradas de orden (1,1). Lamentablemente aqu tampoco pueden usarse los valores crticos de Dickey-Fuller, sino que por ejemplo los de Engle y Yoo (1987). Alternativamente puede usarse el procedure EGCRTVAL.SRC de Stephan Kohns para conocer los valores crticos 'exactos' para el test de Dickey-Fuller y los test de cointegracin de Engle-Granger de acuerdo a MacKinnon (1991). Paso 3: Estimar el modelo de correccin de errores. Esto es, si las series son cointegradas (1,1), a corto plazo puede haber desequilibrios, que son capturados por el trmino de error. Luego, la regresin es:

CONSUMOt = 0 + 1INGRESO + 2 et 1 + ut
donde se espera que el nuevo error, u, est bien comportado. En esta especificacin de correccin de errores el coeficiente 1 captura las perturbaciones de corto plazo la variable

191

INGRESO, mientras que 2 captura las perturbaciones de largo plazo, o el ajuste de largo plazo, indicando qu proporcin del desequilibro en el CONSUMO en un periodo es corregida en el periodo siguiente. Por ltimo debemos notar que an existen importantes problemas en la aplicacin de las tcnicas de regresin requeridas para implementar la prueba de cointegracin de Engle y Granger, especialmente las referidas a los valores crticos de las pruebas para pequeas muestras. Tambin debemos comentar que existe otra tcnica de deteccin de la cointegracin entre series y es la de Johansen (1988) basada en el principio de mxima verosimilitud, la que supera una de las crticas al esquema de Engle-Granger, el que requiere definir a priori cual de las variables ser la dependiente y cual la independiente en la regresin (cuando existen muchas variables es posible que exista cointegracin bajo una especificacin y no en otra) y que ste procedimiento sea un estimador de dos pasos (se requieren dos regresiones). En RATS, algunas pruebas del test de Johansen pueden implementarse con el procedure Johansen.400, y para un desarrollo de detallado de ste con ejemplos numricos, sugerimos el libro de Enders (1996).

192

CAPITULO 9 MODELOS ARIMA Y VAR

Box y Jenkins (1976) propusieron la que hoy en da es una muy popular metodologa para la identificacin, estimacin y prediccin de series de tiempo univariadas estacionarias. Esta metodologa se basa en los llamados modelos ARIMA, es decir modelos que poseen componentes autorregresivos (AR) y de medias mviles (MA), los que nos avocaremos a estimar ahora. La generalizacin de los modelos ARIMA al caso multivariado corresponde a los modelos de vectores autorregresivos (VAR), los que tambin revisaremos en este captulo. Los modelos ARIMA y los modelos VAR son a veces llamados a-tericos, en el sentido que una determinada serie es explicada bsicamente por informacin pasada de la misma serie, sin que necesariamente exista un modelo terico-econmico detrs. A pesar de esto, cuando el objetivo es predictivo se ha encontrado que tales modelos resultan ser exitosos en muchos casos. Puesto que ste es un tema extenso y con un gran desarrollo, especialmente terico, estamos aqu especialmente interesados en los aspectos estimacionales de los mismos.

9.1. AUTOCORRELACIONES SIMPLES Y PARCIALES


Anteriormente hemos calculado las autocorrelaciones simples de una serie usando la instruccin CORRELATE. Sin embargo en el anlisis de los modelos ARIMA es de inters estimar tambin las autocorrelaciones parciales, por lo que comentaremos esta instruccin con mayor detalle. Las autocorrelaciones parciales corresponden a las correlaciones entre observaciones que estn separadas k periodos de tiempo, manteniendo constantes las correlaciones de los rezagos intermedios. En otras palabras, es la correlacin entre Yt y Yt-k despus de eliminar el efecto de todas las observaciones intermedias de Y. Tanto las autocorrelaciones como las autocorrelaciones parciales pueden ser calculadas en RATS a travs de la instruccin CORRELATE, la que tiene la siguiente estructura: CORRELATE series start end save_series donde save_series es la serie donde se almacenarn las autocorrelaciones simples (o covarianzas). Entre las opciones relevantes mencionamos las siguientes: NUMBER= indicar el nmero de correlaciones a calcular, PARTIAL= almacenar las autocorrelaciones parciales en la serie que aqu se designe. QSTATS indicar que se reporte el test Q de Ljung y Box, SPAN=ancho de los intervalos del test Q, permitir reportar los test en los intervalos que aqu se indique.

193

DFC=grados de libertad para la correccin del test Q, lo que es necesario cuando apliquemos el test a los residuos de un modelo ARIMA, siendo DFC el nmero de parmetros estimados del modelo ARIMA. En los modelos sin intercepto, ser igual al nmero de regresores (%NREG).

Luego, si queremos calcular las autocorrelaciones simples y parciales de la serie IGPA, la instruccin ser por ejemplo: Ejemplo: all 135 cal 1990 1 12 data(unit=input, org=obs) / IGPA ... Ver datos en la Tabla 14 en el Anexo al final del libro table Series IGPA Obs Mean Std Error 135 3978.67051852 1526.11906472 Minimum Maximum 802.40000000 6234.64000000

CORRELATE(NUMBER=20, QSTATS, partial=PACF) IGPA / ACF ;* almacenamos en ACF las autocorrelaciones simples, y en PACF las autocorrelaciones parciales. Correlations of Series IGPA Monthly Data From 1990:01 To 2001:03 Autocorrelations 1: 0.97269531 0.93872391 0.90695896 0.87615335 0.84443161 0.81366689 7: 0.78277486 0.74993045 0.71218145 0.67147009 0.63162050 0.59274082 13: 0.55304969 0.51535876 0.48100681 0.45172036 0.42350436 0.39848247 19: 0.37675286 0.35934509 Partial Autocorrelations 1: 0.9726953 -0.1376111 0.0391463 -0.0106615 -0.0345359 0.0066410 7: -0.0262109 -0.0515335 -0.1026892 -0.0614139 -0.0054326 -0.0167350 13: -0.0416523 0.0165446 0.0274507 0.0698186 -0.0041137 0.0536802 19: 0.0337869 0.0578197 Ljung-Box Q-Statistics Q(20) = 1348.0091.

Significance Level 0.00000000

Dentro del programa de RATS viene el procedure BJIDENT.SRC, el que permite graficar ambas autocorrelaciones: source(noecho) c:\winrats\bjident.src ;* debe verificarse que el procedure se encuentre en el subdirectorio que aqu se indique. ;* analizamos la serie IGPA

@bjident IGPA

194

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

Las correlaciones simples muestran el patrn tpico de las series que contienen una raz unitaria (ver captulo anterior), mientras que las primeras 2 autocorrelaciones parciales son cercanas a 1.0, y las siguientes caen fuertemente. A continuacin, con estas ltimas herramientas analizaremos las caractersticas de los procesos AR, MA y ARMA.

9.2. PROCESOS AUTORREGRESIVOS (AR)


Un proceso autorregresivo de orden p, AR(p), es uno que tiene la siguiente forma:

Yt = 1Yt 1 + 2Yt 2 + ... + p Yt p + et


es decir, el valor actual de Y es explicado por una serie de p rezagos de sta serie, ms un error que se asume bien comportado.

9.2.1. SIMULACION DE PROCESOS AR(1)


A modo de ilustracin, analicemos dos procesos AR(1):

Yt = 0.8Yt 1 + et

Yt = 1.05Yt 1 + et

donde et es N(0,1)

La simulacin de estos procesos en RATS puede ser como sigue59:

59

Alternativamente: set e = %ran(sqrt(1.)) set(first=0.) Y = 0.8*y{1} + e graph 1 #y

195

Ejemplo:

all 100 set(first=0.) Y1 = 0.8*y1{1} + %ran(sqrt(1.)) graph 1 # y1 set(first=0.) Y2 = 1.05*y2{1} + %ran(sqrt(1.)) graph 1 # y2

;* para el primer proceso

;* para el segundo caso

;* los grficos se muestran a continuacin:


6

-2

-4

Y1

-6 1990 1991 1992 1993 1994 1995 1996 1997

800

700

600

500

400

300

200

100

Y2

0 1990 1991 1992 1993 1994 1995 1996 1997

Con esto concluimos que en un proceso autorregresivo puro como los graficados, cuando el valor del coeficiente de Yt-1 es menor que 1 se tiene un proceso estable (estacionario), mientras que cuando este coeficiente es mayor a uno (por ejemplo 1.05 como en este ltimo caso), entonces el proceso no es estable (a veces es llamado explosivo)60, de modo que sta es entonces una condicin para la estabilidad del proceso (parte de este resultado ya fue analizado en el captulo anterior de races unitarias).

60

En realidad estas condiciones pueden mostrarse formalmente, para lo cual remitimos al lector a un libro de texto, por ejemplo Hamilton (1994).

196

En el estudio de series de tiempo generalmente solo los procesos estables son de inters, de modo que calculemos ahora las autocorrelaciones del proceso

Yt = 0.8Yt 1 + et :

Ejemplo:

all 100 set(first=0.) Y1 = 0.8*y1{1} + %ran(sqrt(1.)) graph 1 # y1 CORRELATE(NUMBER=20, QSTATS, partial=PACF) Y1 / ACF Correlations of Series Y1 Autocorrelations 1: 0.7882296 0.5740131 0.3693403 7: -0.0195814 -0.0568924 -0.0675701 13: 0.1302877 0.0561430 0.0321961 19: -0.0271839 -0.0384956 Partial 1: 7: 13: 19:

0.2153705 0.0110425 0.0133554

0.1181134 0.0868289 0.0149682

0.0418716 0.1261858 0.0046558

Autocorrelations 0.7882296 -0.1248838 -0.1104673 -0.0121681 -0.0456636 -0.0010480 0.0181562 0.2017768 -0.0184856 -0.1542528 0.1133602 -0.0051634 -0.0218166 0.0408230

0.0200609 -0.0482909 0.0239858 -0.0456540 0.0247556 -0.0330204

Ljung-Box Q-Statistics Q(20) = 125.7266.

Significance Level 0.00000000

source(noecho) c:\winrats\bjident.src @bjident y1

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

Es difcil sacar conclusiones de ste grfico, sin embargo en la literatura se sugiere que en los modelos AR la autocorrelacin simple decrece exponencialmente o sinusoidalmente (cambiando de valores positivos a negativos y viceversa), mientras que la autocorrelacin parcial muestra altos valores el rezago correspondiente al orden del proceso AR, en este caso 1.0 (AR(1)). A efectos de comparacin calculemos las autocorrelaciones de un modelo AR(5) como sigue: set(first=0.) Y1 = 0.8*y1{5} + %ran(sqrt(1.))

197

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

Luego, en efecto, un proceso AR(p) presenta saltos en las autocorrelaciones parciales en cada p rezagos.

9.2.2. ESTIMACION DE UN PROCESO AUTOREGRESIVO


Un proceso AR puro es sencillo de estimar pues es lineal, de modo que en RATS puede hacerse a travs de MCO con la instruccin LINREG (existe una diferencia en el valor del intercepto, o alternativamente a travs de la instruccin BOXJENK, que estima modelos ARIMA generales, incluyendo procesos AR y MA puros. La estructura bsica de esta ltima instruccin es la siguiente: BOXJENK depvar # series start end residuals

donde los parmetros son depvar para identificar la variable dependiente, start y end para definir el rango de estimacin, y resid para la serie de residuos. Las opciones incluyen AR=nmero de parmetros autorregresivos y MA= nmero de parmetros de medias mviles. Veamos su funcionamiento a travs de un ejemplo: Ejemplo: all 12 cal 2000 1 12 data(unit=input,org=obs) / fecha imacec desempleo ipc ... Ver datos en Tabla 1 del Anexo al final del libro table Series FECHA IMACEC DESEMPLEO IPC Obs Mean 12 2000.06500000 12 248.40000000 12 539.39166667 12 104.92500000 Std Error Minimum Maximum 0.03605551 2000.01000000 2000.12000000 8.31635847 235.20000000 267.40000000 54.53536731 473.50000000 626.60000000 1.41686915 102.49000000 106.94000000

198

BOXJENK(AR=||1,3||) DESEMPLEO

;* Y depende de Y{1} y de Y{3}

Dependent Variable DESEMPLEO - Estimation by Box-Jenkins Iterations Taken 2 Monthly Data From 2000:04 To 2000:12 Usable Observations 9 Degrees of Freedom 7 Centered R**2 0.734821 R Bar **2 0.696938 Uncentered R**2 0.998125 T x R**2 8.983 Mean of Dependent Variable 557.98888889 Std Error of Dependent Variable 49.94770877 Standard Error of Estimate 27.49673599 Sum of Squared Residuals 5292.4934326 Durbin-Watson Statistic 0.877079 Q(2-2) 3.848775 Significance Level of Q 0.00000000 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. AR{1} 1.531501948 0.194296334 7.88230 0.00010018 2. AR{3} -0.551202184 0.200659270 -2.74696 0.02862940

Puede verificarse ste resultado a travs de MCO61.

9.3. PROCESOS DE MEDIAS MOVILES


Un proceso de medias mviles de orden q es uno de la siguiente forma:

Yt = 0 et + 1et 1 + 2 et 2 + ... + q et q
es decir, el valor actual de Y es explicado por una serie de q rezagos de los errores de estimacin. El procedimiento de estimacin en RATS pasa por la implementacin del algoritmo de Gauss-Newton con derivadas numricas.

9.3.1. SIMULACION DE PROCESOS MA(1)


Podemos simular un proceso MA(1) sin dificultad, como sigue: Ejemplo: all 100 cal 1990 1 12 set e = %ran(sqrt(2.)) set(first=0.) MA = 0.8*e{1} + e graph(key=loright) 1 # MA

61

LINREG # DESEMPLEO{1} DESEMPLEO{3}

199

4.8

3.6

2.4

1.2

0.0

-1.2

-2.4

MA

-3.6 1990 1991 1992 1993 1994 1995 1996 1997

Sin embargo, el comportamiento grfico de stos procesos no es muy ilustrativo. Para esto se sugiere calcular las autocorrelaciones simples y parciales.

Ejemplo:

CORRELATE(NUMBER=20, QSTATS, partial=PACF) MA / ACF Correlations of Series MA Monthly Data From 1990:01 To 1998:04 Autocorrelations 1: 0.3574948 -0.2417134 -0.1201119 -0.0824065 -0.1839364 -0.1283258 7: 0.0352844 0.0687600 0.0520542 0.1590731 0.1952079 0.0781264 13: -0.0498309 -0.0186524 0.0061665 -0.0969519 -0.1276538 -0.1229254 19: -0.0547254 0.1028566 Partial Autocorrelations 1: 0.3574948 -0.4236608 0.2156996 -0.3170660 -0.0028039 -0.1465397 7: 0.0778507 -0.0933100 0.0979341 0.1083484 0.1016991 0.0768566 13: -0.0072633 0.1529306 -0.0328841 0.0146450 -0.0771404 -0.1554368 19: 0.0151920 -0.0078666 Ljung-Box Q-Statistics Q(20) = 42.9001.

Significance Level 0.00210739

200

source(noecho) c:\winrats\bjident.src @bjident ma

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

Tambin es difcil obtener conclusiones claras en el grfico de correlaciones de los modelos MA. En este caso la literatura seala que el patrn tpico de un proceso MA(q) implica saltos cada q rezagos en las autocorrelaciones simples, y un decaimiento exponencial en las correlaciones parciales. A efectos de comparacin construyamos otra simulacin para un MA(5):

set(first=0.) MA = 0.8*e{5} + e @bjident ma

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

El grfico parece confirmar lo sealado anteriormente en cuanto a que las correlaciones parciales presentan a saltos cada 5 rezagos para el proceso MA anterior.

201

9.3.2. ESTIMACION DE UN PROCESO DE MEDIAS MOVILES


Para el caso del desempleo, la estimacin utilizando la instruccin BOXJENK es, por ejemplo, la siguiente: Ejemplo: BOXJENK(MA=||1,3||) DESEMPLEO Dependent Variable DESEMPLEO - Estimation by Box-Jenkins Iterations Taken 10 Monthly Data From 2000:01 To 2000:12 Usable Observations 12 Degrees of Freedom 10 Centered R**2 -36.821088 R Bar **2 -40.603197 Uncentered R**2 0.648890 T x R**2 7.787 Mean of Dependent Variable 539.39166667 Std Error of Dependent Variable 54.53536731 Standard Error of Estimate 351.75606646 Sum of Squared Residuals 1237323.3029 Durbin-Watson Statistic 0.539739 Q(3-2) 21.914496 Significance Level of Q 0.00000285 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. MA{1} 0.4478948910 0.4672662589 0.95854 0.36039008 2. MA{3} 0.5243038518 0.5721198273 0.91642 0.38101438

9.3. PROCESOS ARIMA


Un proceso ARIMA(p,q) tiene la siguiente forma:

Yt = 1Yt 1 + 2Yt 2 + ... + p Yt p + 0 et + 1et 1 + 2 et 2 + ... + q et q + et


es decir la unin de procesos AR(p) y MA(q). Un proceso ARMA(3,3) puede ser simulado como sigue:

Ejemplo:

all 100 cal 1990 1 12 set e = %ran(sqrt(2.)) set(first=0.) YY = 0.5*YY{3}+0.8*e{3} + e CORRELATE(NUMBER=20, QSTATS, partial=PACF) yy / ACF ... source(noecho) c:\winrats\bjident.src @bjident yy

202

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

Si es difcil sacar conclusiones en los modelos AR y en los modelos MA por separado, ms lo es para el caso de los modelos ARIMA. Nuevamente la literatura sugiere aqu que ambas autocorrelaciones decrecen exponencialmente, lo que parece confirmarse en este ltimo grfico. Finalmente, la estimacin de un modelo ARIMA en RATS es con la instruccin BOXJENK como sigue62:

Ejemplo:

BOXJENK(AR=||3||,MA=||2||) desempleo Dependent Variable DESEMPLEO - Estimation by Box-Jenkins Iterations Taken 10 Monthly Data From 2000:04 To 2000:12 Usable Observations 9 Degrees of Freedom 7 Centered R**2 -0.572325 R Bar **2 -0.796943 Uncentered R**2 0.988880 T x R**2 8.900 Mean of Dependent Variable 557.98888889 Std Error of Dependent Variable 49.94770877 Standard Error of Estimate 66.95495087 Sum of Squared Residuals 31380.758118 Durbin-Watson Statistic 0.387783 Q(2-2) 5.424152 Significance Level of Q 0.00000000 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. AR{3} 0.9825785293 0.0578230093 16.99286 0.00000060 2. MA{2} 1.0416452807 0.6656597453 1.56483 0.16160111

El mismo proceso con una constante ser:

Para especificaciones de modelos ARIMA complejos puede usarse la instruccin EQUATION seguido de la instruccin INITIAL. Por ejemplo: EQUATION(ar=input,ma=input, noconstant) eqs desempleo #3 #23

62

203

Ejemplo:

BOXJENK(constant, AR=||3||,MA=||2||) desempleo Dependent Variable DESEMPLEO - Estimation by Box-Jenkins NO CONVERGENCE IN 20 ITERATIONS LAST CRITERION WAS 0.1534669 Monthly Data From 2000:04 To 2000:12 Usable Observations 9 Degrees of Freedom 6 Centered R**2 0.748319 R Bar **2 0.664425 Uncentered R**2 0.998220 T x R**2 8.984 Mean of Dependent Variable 557.98888889 Std Error of Dependent Variable 49.94770877 Standard Error of Estimate 28.93412632 Sum of Squared Residuals 5023.1019945 Durbin-Watson Statistic 0.314025 Q(2-2) 0.012288 Significance Level of Q 0.00000000 Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. CONSTANT 492.9924859 1.5429219 319.51875 0.00000000 2. AR{3} -0.6715100 0.2070111 -3.24384 0.01760192 3. MA{2} 4.5048722 2.3014910 1.95737 0.09805183

Ntese que el algoritmo no ha alcanzado la convergencia para este ejemplo, probablemente debido al bajo nmero de observaciones. En cualquier caso el resultado obtenido anteriormente no puede considerarse como admisible. Puede intentarse aumentando el numero de iteraciones con ITERATIONS=100. Sin embargo esto tampoco asegura la convergencia.

9.4. EL ENFOQUE DE BOX Y JENKINS


Box y Jenkins han propuesto un procedimiento de 4 pasos que involucra la identificacin, estimacin, diagnstico y prediccin de modelos ARIMA. Veamos a continuacin estos pasos para el ejemplo desarrollado por Enders (1996), pagina 47, para el ndice de precios al consumidor de los Estados Unidos.

9.4.1. PASO 1: IDENTIFICACIN


El objetivo aqu es identificar el tipo de modelo ARIMA apropiado a la serie que se est analizando. Ejemplo: cal 1960 1 4 all 0 1992:2 data(unit=input,org=obs) / WPI ... Ver datos en la Tabla 15 table Series WPI Obs 130 Mean 65.090000000 Std Error 31.366183959 Minimum Maximum 30.500000000 116.200000000 ;* la informacin es trimestral partiendo en el 1 trimestre de 1960.

source(noecho) c:\winrats\bjident.src @bjident wpi

204

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

;* puesto que las correlaciones simples decrecen muy lentamente, asumimos que la serie contiene una raz unitaria, por lo que debe ser diferenciada. set dlwpi = log(wpi) - log(wpi{1}) ;* es la diferenciacin basada en logaritmos @bjident dlwpi ;* calculamos nuevamente las autocorrelaciones

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

;* el grfico no es claro en sugerir una determinada estructura, por lo que se comienza intentando un ajuste ARMA(1,1):

9.4.2. PASO 2: ESTIMACIN


Una vez decidida una especificacin para la serie, procedemos a estimarla verificando si el nmero de rezagos es el apropiado.

205

boxjenk(constant,ar=1,ma=1) dlwpi / resids

;* un modelo ARMA(1,1) con intercepto

... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. CONSTANT 0.010484902 0.004405769 2.37981 0.01883337 2. AR{1} 0.889069641 0.059263358 15.00201 0.00000000 3. MA{1} -0.514522826 0.111683147 -4.60699 0.00000992

cor(partial=pacf,qstats,span=8,dfc=%nreg) resids

;* la correccin por grados de libertad es el nmero de regresores en BOXJENK

Correlations of Series RESIDS Quarterly Data From 1960:03 To 1992:02 Autocorrelations 1: 0.0074000 -0.0485621 -0.0120277 7: -0.0709830 -0.0954604 -0.1005335 13: 0.0116557 0.0424470 -0.0253348 19: 0.0445649 0.1333987 0.0265432 25: -0.1075636 0.1326487 0.0098318 31: -0.0902157 0.1551906

0.1585506 0.0133654 0.0147031 0.0350266 0.0454919

-0.0483299 0.1502811 -0.1225670 -0.0374033 -0.0119804 -0.0822551 -0.0012545 0.0750815 -0.0901244 -0.0275496

Partial Autocorrelations 1: 0.0074000 -0.0486195 -0.0113184 0.1567634 -0.0534576 0.1706623 7: -0.0832060 -0.1059913 -0.0898829 -0.0540433 -0.1009550 -0.0392973 13: 0.0487349 0.0667988 0.0340725 0.0104601 -0.0115962 -0.1276234 19: 0.0045915 0.0816563 0.0384150 0.0976347 -0.0005648 0.1000586 25: -0.1483901 0.0856106 -0.0279169 0.0449157 -0.0325792 -0.0695697 31: 0.0058260 0.1388075 Ljung-Box Q-Statistics Q(8) = 9.0642. Q(16) = 13.2492. Q(24) = 18.5435. Q(32) = 30.7083.

Significance Significance Significance Significance

Level Level Level Level

0.10653191 0.42875481 0.61439740 0.37930107

;* para efectos de comparacin posterior, se calculan las medidas de bondad de ajuste de Schwartz y Akaike respectivamente63: compute sbc = %nobs*log(%rss) + %nreg*log(%nobs) compute aic = %nobs*log(%rss) + 2*%nreg display 'AIC' aic 'SBC' sbc AIC -523.39339 SBC -514.83730

;* analizamos los residuos, esperando que se comporten como ruido blanco, lo que implicara que el modelo ha sido bien ajustado.

63

Anteriormente vimos estas pruebas de parsimonia. El objetivo es minimizar ambos criterios, los que pueden ser negativos.

206

@bjident resids

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

;* aparentemente las correlaciones del 4 residuo son altas en trminos relativos, por lo que puede sospecharse la existencia de un MA(4), debido posiblemente a la estacionalidad. Enders intenta entonces una especificacin ARMA(1,||1,4||): boxjenk(constant,ar=1,ma=||1,4||) dlwpi / resids ... cor(partial=pacf,qstats,span=8,dfc=%nreg) resids Correlations of Series RESIDS Quarterly Data From 1960:03 To 1992:02 Autocorrelations 1: 0.0089624 -0.0328139 0.0703164 -0.0371207 -0.1003303 0.1643790 7: -0.0416431 -0.0704238 -0.0637490 0.0023137 -0.0800136 0.0130417 13: 0.0672441 0.0760727 -0.0200882 -0.0009854 -0.0204687 -0.1018997 19: 0.0413006 0.1192971 0.0407567 0.0259783 0.0031011 0.0614874 25: -0.1015937 0.1397403 0.0185355 -0.0080937 -0.0413297 -0.0409861 31: -0.1119197 0.1516016 Partial 1: 7: 13: 19: 25: 31: Autocorrelations 0.0089624 -0.0328968 0.0709975 -0.0399206 -0.0953807 0.1619230 -0.0503915 -0.0497286 -0.0944232 0.0118146 -0.0505699 -0.0143084 0.0645411 0.0882197 -0.0048105 -0.0319778 -0.0138617 -0.1005960 0.0351777 0.0883233 0.0754616 0.0357150 -0.0111996 0.1115583 -0.1192968 0.1231648 -0.0347506 0.0352566 -0.0425849 -0.0582155 -0.0172188 0.1442226 ;* estimamos el modelo ARMA(1,||1,4||)

Ljung-Box Q-Statistics Q(8) = 6.9692. Q(16) = 10.0318. Q(24) = 15.0892. Q(32) = 26.7146.

Significance Significance Significance Significance

Level Level Level Level

0.13752250 0.61317493 0.77128316 0.53382615

;* se calculan nuevamente las medidas de bondad de ajuste de Schwartz y Akaike:

207

compute sbc = %nobs*log(%rss) + %nreg*log(%nobs) compute aic = %nobs*log(%rss) + 2*%nreg display 'AIC' aic 'SBC' sbc AIC -527.39070 SBC -515.98258

;* ambos criterios sugieren que esta ltima especificacin es ms apropiada. Las autocorrelaciones son: @bjident resids

0 Regular 0 Seasonal
1.00

0.75

0.50

0.25

0.00

-0.25

-0.50

-0.75
CORRS PARTIALS

-1.00 0 5 10 15 20

;* en efecto, los residuos parecen ruido blanco, por lo que aceptamos esta ltima especificacin.

9.4.3. PASO 3: VERIFICACIN / DIAGNSTICO


Enders propone efectuar una prueba F de cambio estructural64. compute rssall = %rss compute nobs = %nobs boxjenk(noprint,constant,ar=1,ma=||1,4||) dlwpi 1960:3 1971:4 resid compute rss1 = %rss boxjenk(noprint,constant,ar=1,ma=||1,4||) dlwpi 1972:1 1992:2 resid compute rss2 = %rss compute F = ((rssall-rss1-rss2)/%nreg)/((rss1+rss2)/(nobs-2*%nreg)) display F 0.53825 cdf ftest F %nreg nobs-2*%nreg F(4,120)= 0.53825 with Significance Level 0.70789873

64

Vase la seccin 3.9.

208

Puesto que la hiptesis nula es inexistencia de cambio estructural, no podemos rechazarla a los niveles usuales de confianza. Este resultado nos permitira usar el modelo anterior para fines predictivos.

9.4.4. PASO 4: PREDICCIN


Se obtienen 8 predicciones para cada modelo, limitando ahora el periodo de estimacin hasta 1990:4 solamente, en lugar de 1992:02 como antes, a fin de dejar un nmero de observaciones finales para una comparacin exsample, es decir con datos reales no usados en la estimacin. smpl 1960:1 1990:4 ;* se efectuarn estimaciones solamente para este subperiodo

boxjenk(noprint,define=eq1,constant,ar=1,ma=||1,4||) dlwpi 60:3 90:4 resids forecast65(print) 1 8 1991:1 # eq1 fore1 ;* las predicciones son almacenadas en la serie fore1 y pueden obtenerse con print 91:01 92:04 fore1 Entry 1991:01 1991:02 1991:03 1991:04 1992:01 1992:02 1992:03 1992:04 DLWPI 0.0188847938078 0.0125375481179 0.0174885621621 0.0225979697375 0.0202683832419 0.0184263689693 0.0169698801945 0.0158182281240

boxjenk(noprint,define=eq2,constant,ar=1,ma=1) dlwpi 60:3 90:4 resids forecast(print) 1 8 1991:1 # eq2 fore2 ;* las predicciones son almacenadas en la serie fore2 Entry 1991:01 1991:02 1991:03 1991:04 1992:01 1992:02 1992:03 1992:04 DLWPI 0.0188094779880 0.0180561216985 0.0173876265082 0.0167944333198 0.0162680598113 0.0158009791435 0.0153865123313 0.0150187327370

Ahora mostramos un resumen de las series originales y de las predicciones de cada modelo.

65

Vase la prediccin de sistemas VAR en la seccin 9.5.3. para una descripcin de esta instruccin.

209

print

1990:01

1992:04 wpi dlwpi fore1 fore2 DLWPI 0.014519311324 -0.001803426999 0.017889564751 0.029696505354 -0.020870322726 -0.009713100646 -0.001776199401 0.001776199401 -0.002665483586 0.010619568827 NA NA FORE1 NA NA NA NA 0.0188847938078 0.0125375481179 0.0174885621621 0.0225979697375 0.0202683832419 0.0184263689693 0.0169698801945 0.0158182281240 FORE2 NA NA NA NA 0.0188094779880 0.0180561216985 0.0173876265082 0.0167944333198 0.0162680598113 0.0158009791435 0.0153865123313 0.0150187327370

ENTRY 1990:01 1990:02 1990:03 1990:04 1991:01 1991:02 1991:03 1991:04 1992:01 1992:02 1992:03 1992:04

WPI 111.00000000000 110.80000000000 112.80000000000 116.20000000000 113.80000000000 112.70000000000 112.50000000000 112.70000000000 112.40000000000 113.60000000000 NA NA

;* a fin de determinar cual modelo habra tenido ms xito en predecir los valores futuros de la serie DLWPI puede calcularse ahora la media de la suma cuadrada de los errores de prediccin (mean squared forecast errors, MSE), y tambin la suma cuadrada de los errores de prediccin. La comparacin ser hecha para el periodo 1991:01 a 1992:02. smpl 91:1 92:2 set error1 91:1 92:2 = (dlwpi - fore1)**2 set error2 91:1 92:2 = (dlwpi - fore2)**2 table / error1 error2 Series ERROR1 ERROR2 Obs Mean Std Error Minimum Maximum 6 0.00057785770 0.00051875480 0.00006094613 0.00158046929 6 0.00055395699 0.00055631156 0.00002684701 0.00157448658

;* el criterio de la MSE muestra que el modelo ARMA(1,1) lo habra hecho un poco mejor que el modelo ARMA(1,||1,4||). set error3 91:1 92:2 = (dlwpi - fore1) set error4 91:1 92:2 = (dlwpi - fore2) table / error3 error4 Series ERROR3 ERROR4 Obs Mean 6 -0.0221388274 6 -0.0209576728 Std Error Minimum Maximum 0.0102604107 -0.0397551165 -0.0078068001 0.0117336922 -0.0396798007 -0.0051814103

;* finalmente el ltimo criterio llega a una conclusin similar.

210

9.5. MODELOS VAR


Un Modelo de Vectores Autorregresivos (VAR) es la generalizacin multivariada de un modelo ARIMA66 a sistemas de ecuaciones. La principal caracterstica de estos modelos es que cada variable posee la capacidad de influir en las dems variables (ya sea en las realizaciones presentes o rezagadas), es decir no distinguen las variables endgenas de las exgenas. Esta caracterstica se basa en Sims (1980) de que generalmente no existe un conocimiento terico slido para la clasificacin de las variables en endgenas y exgenas, lo que da sustento a un modelo VAR de que todas las variables deben ser tratadas sobre la una base de igualdad (sin distincin entre variable endgena y exgena). En el siguiente ejemplo, mostramos un modelo VAR para los rendimientos accionarios de las bolsas de valores de Mxico (Rme), Brasil (Rbr) y Argentina (Rar), en el cual cada ecuacin posee p valores rezagados de cada una de las variables, ms una constante:

Rart = 1 + j Rart j + j Rbrt j + j Rmet j + 1t


j =1 p j =1 p j =1 p

Rbrt = 2 + j Rart j + j Rbrt j + j Rmet j + 2t


j =1 j =1 p j =1 p

Rmet = 3 + j Rart j + j Rbrt j + j Rmet j + 3t


j =1 j =1 j =1

donde: it son trminos de error estocstico o impulsos. i, j, j, j, j, j, j, j, j y j, son los coeficientes del modelo. Rmet, Rbrt y Rart son los retornos de los ndices burstiles de los pases. Como se observa, en cada ecuacin aparece una variable despejada en funcin de todas las otras variables retardadas y de sus propios rezagos. En general, los modelos VAR no estn en forma reducida, por cuanto una variable endgena X depende contemporneamente de otra variable endgena Z, como ocurrira si j=0 en el caso anterior (vase el apartado de ECUACIONES ESTRUCTURALES Y REDUCIDAS). Note que otra manera habitual de expresar el modelo expuesto en las ecuaciones anteriores, es de la forma matricial, como sigue:

p p Rart 1 1 1 1 Rart 1 Rbr = + * Rbr + ... + t 1 1 t 1 p p 2 1 p p Rmet 1 1 1 1 3 Rmet

p Rart p 1t p * Rbrt p + 2t 3t p Rmet p

yt = V + A1 yt 1 + A2 yt 2 + ... + ApYt p + ut (kx1) = (kx1) + (kxk ) * (kx1) + ... + (kxk ) * (kx1) + (kx1) E (ut ) = 0 E (ut ut ' ) = u , no diagonal, en general E (ut u s ' ) = 0, para s t

66

En realidad stos son los llamados modelos VARMA, aunque son poco populares. Los VAR son una generalizacin de procesos con componentes AR solamente.

211

9.5.1. ESTIMACION DE UN MODELO VAR


Los modelos VAR pueden ser estimados en RATS formando un sistema de ecuaciones con la instruccin SYSTEM, y luego usando la instruccin ESTIMATE. Esta estructura de estimacin facilita la realizacin de procedimientos ms avanzados como los de impulso-respuesta y prediccin, lo que veremos ms adelante. La definicin de un proceso VAR en RATS es como sigue: SYSTEM : numero_de_ecuaciones VARIABLES : se indican aqu las variables a ser usadas en el sistema LAGS : numero_de_rezagos DETERMINISTIC : se indican las variables determinsticas, incluyendo CONSTANT si es requerido END(SYSTEM) : para finalizar la construccin del sistema67. ESTIMATE start end residuals coeffs ;* es la instruccin de estimacin del sistema VAR Los parmetros de ESTIMATE son: Residuals: indquese aqu el nmero de la primera serie donde se almacenarn los residuos. coeffs: indquese aqu la primera serie de un grupo de series para los coeficientes. Entre las principales opciones de ESTIMATE se encuentra la posibilidad de ver las pruebas F (FTESTS) sobre grupos de rezagos en el sistema. NOPRINT para no ver la salida de la regresin, y SIGMA entrega la matriz de covarianzas de los residuos. Veamos como operan estas instrucciones para un sistema bivariado de los cambios trimestrales del Producto per cpita desestacionalizado de los EEUU (Y1), y del ingreso disponible (Y2). Los datos son trimestrales comenzando el 2 trimestre de 1951 y terminando el ltimo trimestre de 1969. Ejemplo: cal 1951 2 4 all 1969:4 data(unit=input,org=obs) / yy1 yy2 ... Ver datos en Tabla 16 en el Anexo al final del libro set y1 = yy1 set y2 = yy2 table / Series YY1 YY2 Y1 Y2 Obs 75 75 75 75 Mean 13.213333333 15.640000000 13.213333333 15.640000000 Std Error 20.574382742 21.734665299 20.574382742 21.734665299 Minimum -61.000000000 -35.000000000 -61.000000000 -35.000000000 Maximum 65.000000000 76.000000000 65.000000000 76.000000000 ;* importante es no trabajar con los datos originales, sino con unos transformados

system 1 to 2 ;* existen dos variables Y1 y Y2 vars y1 y2 lags 1 to 4 ;* usando 4 lags. det constant ;* se define intercepto, luego se trata de un total de 18 coeficientes a estimar, 9 por ecuacin (intercepto ms 4 rezagos de Y1 ms 4 rezagos de Y2) end(system) estimate(noftest, sigma, outsigma=VV) * 1968:4 1 ... Variable
67

Coeff

Std Error

T-Stat

Signif

Existen otros subcomandos posibles de SYSTEM se encuentran: SPECIFY (estimacion bayesiana), y KFSET y TVARYING para Kalman filtering.

212

******************************************************************************* 1. Y1{1} -0.068107492 0.151108462 -0.45072 0.65387240 2. Y1{2} 0.153892952 0.165380022 0.93054 0.35594795 3. Y1{3} 0.112649103 0.166895164 0.67497 0.50237723 4. Y1{4} -0.187045533 0.124442742 -1.50307 0.13824801 5. Y2{1} 0.502831942 0.124838353 4.02786 0.00016570 6. Y2{2} -0.029019408 0.148947806 -0.19483 0.84620739 7. Y2{3} -0.160324034 0.149182879 -1.07468 0.28696803 8. Y2{4} 0.069856718 0.127910501 0.54614 0.58706615 9. Constant 8.251011087 3.136996546 2.63023 0.01090910 ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Y1{1} 0.232896343 0.185496288 1.25553 0.21432076 2. Y1{2} -0.047743426 0.203015634 -0.23517 0.81490422 3. Y1{3} 0.036336389 0.204875578 0.17736 0.85984488 4. Y1{4} 0.102391922 0.152762237 0.67027 0.50534591 5. Y2{1} 0.325598426 0.153247877 2.12465 0.03788865 6. Y2{2} -0.110143479 0.182843931 -0.60239 0.54926208 7. Y2{3} 0.013079911 0.183132499 0.07142 0.94330665 8. Y2{4} -0.059481927 0.157019156 -0.37882 0.70620508 9. Constant 8.974221050 3.850884373 2.33043 0.02328317 Obsrvese que el gran nmero de parmetros a estimar consume grados de libertad, lo que en algunos casos puede revestir especial importancia. La salida tambin entrega la matriz de covarianzas de los residuos, puesto que ha sido requerida en ESTIMATE(sigma). Tambin all fue requerido que sta matriz sea almacenada en VV (outsigma=VV) para que pueda ser usada posteriormente. Covariance\Correlation Matrix of Residuals Y1 Y2 Y1 245.7255742198 0.5585723408 Y2 168.4908120575 370.2910667895 wri vv 245.7256 168.4908 370.2911

El lector notar que la especificacin anterior del sistema VAR puede ser alternativamente estimada a travs de SUR (vase captulo 7). En efecto: EQUATION eqn1 Y1 # CONSTANT Y1{1} Y1{2} Y1{3} Y1{4} Y2{1} Y2{2} Y2{3} Y2{4} EQUATION eqn2 Y2 # CONSTANT Y1{1} Y1{2} Y1{3} Y1{4} Y2{1} Y2{2} Y2{3} Y2{4} SUR 2 * 1968:4 # eqn1 # eqn2 ... Variable Coeff Std Error T-Stat Signif ******************************************************************************* 1. Constant 8.251011087 2.918707916 2.82694 0.00469952 2. Y1{1} -0.068107492 0.140593545 -0.48443 0.62808193 3. Y1{2} 0.153892952 0.153872015 1.00014 0.31724466 4. Y1{3} 0.112649103 0.155281726 0.72545 0.46817611

213

5. 6. 7. 8. 9. ...

Y1{4} Y2{1} Y2{2} Y2{3} Y2{4}

-0.187045533 0.502831942 -0.029019408 -0.160324034 0.069856718

0.115783365 0.116151447 0.138583238 0.138801954 0.119009820

-1.61548 4.32911 -0.20940 -1.15506 0.58698

0.10620712 0.00001497 0.83413556 0.24806748 0.55721525

Variable Coeff Std Error T-Stat Signif ******************************************************************************* 10. Constant 8.974221050 3.582919693 2.50472 0.01225474 11. Y1{1} 0.232896343 0.172588486 1.34943 0.17719840 12. Y1{2} -0.047743426 0.188888744 -0.25276 0.80045406 13. Y1{3} 0.036336389 0.190619263 0.19062 0.84882108 14. Y1{4} 0.102391922 0.142132242 0.72040 0.47127938 15. Y2{1} 0.325598426 0.142584088 2.28355 0.02239777 16. Y2{2} -0.110143479 0.170120693 -0.64744 0.51734517 17. Y2{3} 0.013079911 0.170389182 0.07676 0.93881056 18. Y2{4} -0.059481927 0.146092942 -0.40715 0.68389689 Covariance\Correlation Matrix of Residuals Y1 Y2 Y1 245.7255742198 0.5585723408 Y2 168.4908120575 370.2910667895 La instruccin SUR de hecho puede usarse para estimar modelos VAR ms complejos, incluyendo la posibilidad de incluir otras variables explicativas.

9.5.2. PRUEBAS PARA LA LONGITUD DE LOS REZAGOS


Existen bsicamente dos forma de evaluar si el modelo VAR est bien especificado, es decir si contiene el nmero apropiado de rezagos. El primero es una prueba de razn de verosimilitud a travs de la instruccin RATIO. El segundo caso se trata de los criterios de parsimonia multivariados AIC y SBC, los que se definen como:

AIC = T log + 2 N SBC = T log + N log(T )


donde || es el determinante de la matriz de covarianzas de los residuos y N es el nmero total de parmetros estimados en todas las ecuaciones. Por ejemplo, si se tiene un sistema con 4 variables y 5 rezagos cada una, ms 3 determinsticas (1 constante y 2 dummies) y el sistema tiene 4 ecuaciones, entonces se tendrn (4*5+3)*4=92 parmetros. Como ilustracin, supongamos que en el ejemplo anterior calculemos los criterio AIC y SBC para los rezagos K=0, 1, 2, 3, y 4. En este caso N=(2*K+1)*2: Ejemplo: system 1 to 2 vars y1 y2 lags 1 to 4 ;* estimamos primero con 4 rezagos det constant end(system) estimate(noftests,sigma) * 1968:4 1 Covariance\Correlation Matrix of Residuals Y1 Y2 Y1 245.7255742198 0.5585723408 Y2 168.4908120575 370.2910667895

214

dis %logdet 11.04453

;* entrega el logaritmo del determinante de la matriz de covarianzas de los residuos.

com K=4. ;* para el caso en que K=4.0 com N=(2*K+1)*2. dis N 18.00000 com aic = %nobs * %logdet + 2*N com sbc = %nobs * %logdet + N*log(%nobs) dis 'AIC=' aic 'SBC=' sbc AIC= 775.98377 SBC= 815.66823

;* repitiendo para el caso de 3, 2, 1 y 0 rezagos los resultados son:

3 2 1 0

AIC= AIC= AIC= AIC=

779.02830 782.07283 785.11737 788.16190

SBC= SBC= SBC= SBC=

810.10141 804.41390 798.60834 792.68726

Ambas medidas llegan a conclusiones distintas. Supongamos que adoptamos K=1.0 como modelo alternativo. Comparemos ahora K=4 (el modelo no restringido) y K=1 (el modelo restringido) a travs del test de razn de verosimilitud. Esto es implementado a travs de la instruccin RATIO, la cual tiene la siguiente estructura: RATIO start end # < supp. card > list of first set of series # < supp. card > list of second set of series donde en el primer # debe indicarse la lista de los residuos del primer sistema, y en el segundo # la lista de los residuos del segundo sistema. Las opciones ms importantes son: DEGREES para corregir por grados de libertad, e igual al nmero de restricciones aplicadas al sistema, y MCORR igual a una correccin por grados de libertad para pequeas muestras sugerida por Sims (1980), igual al nmero de variables en cada ecuacin del sistema VAR no restringida.

En nuestro ejemplo, DEGREES = 3*2*2=12, puesto que la hiptesis es que existen 3 rezagos = 0 para cada serie (6 rezagos totales) y se trata de 2 ecuaciones. Adems, MCORR= 4*2+1 = 9, puesto que en cada ecuacin del sistema no restringido existen 4 rezagos para cada una de las variables, ms una constante. Ejemplo: system 1 to 2 vars y1 y2 lags 1 to 4 det constant end(system) estimate(noprint,noftests) * 1968:4 1 ;* 1 indica que este ser el nmero que identificar la primera serie de errores y 2 para la segunda serie de errores.

215

system 1 to 2 vars y1 y2 lags 1 det constant end(system) estimate(noprint,noftests) * 1968:4 3 ;* 3 indica que este ser el nmero que identificar la primera serie de errores y 4 para la segunda serie de errores. ratio(degrees=12,mcorr=9) * 1968:4 # 1 2 ;* 1 y 2 son las series de errores del sistema no restringido # 3 4 ;* 3 y 4 son las series de errores del sistema restringido

216

Covariance\Correlation Matrices YY1 YY2 YY1 300.4232708857 0.2388498660 YY2 84.9747019187 421.3041386579 Y1 283.54061 -2774.55617 Y2 -0.0748595817 4844812.67183

Y1 Y2

Log Determinants are 1.168981e+001 2.103515e+001 Chi-Squared(12)= 579.411614 with Significance Level 0.00000000 La conclusin es que rechazamos ampliamente que los rezagos postulados sean cero, de modo que es preferible el modelo con 4 rezagos. Es decir, el modelo de 1 rezago pierde informacin importante. Ahora veremos que a travs de la metodologa de vectores autorregresivos (VAR) es posible efectuar diversos anlisis en el comportamiento de las variables del sistema, entre estos se encuentra la prediccin, pruebas de causalidad y el anlisis de impulso-respuesta (innovation accounting).

9.5.3 PREDICCION
La instruccin apropiada para la prediccin de sistemas de ecuaciones es FORECAST, la que tiene la siguiente estructura bsica: FORECAST num_equations steps start # equation forecasts donde num_equations es el nmero de ecuaciones del sistema VAR, steps es el nmero de periodos de prediccin, y stat es el periodo de inicio de la prediccin. Como instrucciones complementarias deben indicarse en cada # la ecuacin a predecir (equation), y en forecasts la serie donde se almacenar la prediccin de cada serie. Efectuemos ahora predicciones al sistema VAR con 1 rezago. Ejemplo: system 1 to 2 vars y1 y2 lags 1 det constant end(system) estimate(noftests) * 1968:4 1 forecast 2 6 1970:1 # 1 F_Y1 # 2 F_Y2

217

print 1967:04 * y1 y2 f_y1 f_y2 ENTRY 1967:04 1968:01 1968:02 1968:03 1968:04 1969:01 1969:02 1969:03 1969:04 1970:01 1970:02 1970:03 1970:04 1971:01 1971:02 Y1 6.00000000000 54.00000000000 30.00000000000 54.00000000000 8.00000000000 21.00000000000 9.00000000000 9.00000000000 16.00000000000 NA NA NA NA NA NA Y2 17.00000000000 36.00000000000 43.00000000000 -7.00000000000 9.00000000000 -2.00000000000 19.00000000000 47.00000000000 10.00000000000 NA NA NA NA NA NA F_Y1 NA NA NA NA NA NA NA NA NA 11.695887586722 13.544366559504 13.656488193972 13.884495037300 13.965752414782 14.014429694162 F_Y2 NA NA NA NA NA NA NA NA NA 14.081913978675 14.294478147365 14.787298074123 14.959807336929 15.064067869765 15.113937464886

;* el siguiente grfico muestra las predicciones comparadas de cada serie. GRAPH(PATTERNS, KEY=LORIGHT) # Y1 1967:04 * # Y2 1967:04 * # F_Y1 1967:04 * # F_Y2 1967:04 * 4

56

48

40

32

24

16

0
Y1 Y2 F_Y1 F_Y2

-8 1968 1969 1970 1971

218

9.5.4. CAUSALIDAD A LO GRANGER


La prueba de causalidad a lo Granger se implementa fcilmente en RATS con la instruccin ESTIMATE, eliminando la opcin noftests. Estas pruebas F del sistema (bloque) indican si una variable Z ayuda a predecir una variable X un periodo adelante o no (causalidad), lo que individualmente puede ser de inters68. Vemoslo con el ejemplo del sistema VAR con 1 rezago anterior: Ejemplo: system 1 to 2 vars y1 y2 lags 1 det constant end(system) estimate(noprint) * 1968:4 1 F-Tests, Dependent Variable Y1 Variable F-Statistic Y1 0.0051 Y2 19.9878 F-Tests, Dependent Variable Y2 Variable F-Statistic Y1 3.3274 Y2 5.8539

Signif 0.9431688 0.0000308

Signif 0.0725939 0.0182634

En este caso tenemos evidencia que Y1 causa a lo Granger a Y2, y que Y2 no causa a lo Granger a Y1.

9.5.5. ANALISIS DE IMPULSO RESPUESTA


Consiste en la introduccin de un shock artificial de 1 desviacin estndar sobre una variable en el modelo, donde interesa la respuesta de las variables dependientes a este shock artificial69. Como ilustracin, en el caso del sistema de rendimientos accionarios de varios pases, puede ser deseable observar las consecuencias de un shock en el rendimiento del ndice de Estados Unidos y su efecto en los dems pases del modelo, y a su vez, en el mismo pas, dejando las variables restantes en el periodo inicial igualadas a 0. Lo anterior se traduce en una respuesta en diferentes magnitudes por parte de las dems variables del modelo. Para esto se utiliza la instruccin ERRORS, la que tiene la siguiente estructura: ERRORS equations steps VCV_matrix # equation stderrors newstart column

(one card per equation)

donde en equations debe indicarse el nmero de ecuaciones del sistema VAR, en steps el nmero de periodos de prediccin requeridos, y en VCV_matrix la matriz de covarianza de los residuos. La principal opcin de esta instruccin es IMPULSES, la que entrega las respuestas de cada variable a los shocks.
Sin embargo, puesto que Z puede afectar a X a travs de otra ecuacin del sistema, es sugerido implementar otras pruebas, como la de razn de verosimilitud. Vase la seccin 3.8 para ms informacin de la prueba de Causalidad de Granger. 69 Esta innovacin es ortogonalizada usando la descomposicin de Choleski de los residuales de la matriz de varianzacovarianza. La ortogonalizacin se basa en el teorema de invertibilidad, el cual establece que un proceso autorregresivo de orden cualquiera puede ser representado por un proceso de medias mviles con el fin de observar la dinmica del comportamiento de los errores.
68

219

Estimemos entonces las respuestas en el sistema VAR con 1 rezago anterior: Ejemplo: system 1 to 2 vars y1 y2 lags 1 det constant end(system) estimate(noftests,noprint, outsigma=vv) * 1968:4 1 errors(impulses, noprint) 2 4 vv # 1 # 2 Responses to Shock in Y1 Entry Y1 1 16.210470792529 2 4.680537709440 3 3.126526810150 4 1.443816771005

Y2 9.8856800479768 6.7055656577546 3.0805766235811 1.6421534306001

Responses to Shock in Y2 Entry Y1 Y2 1 0.0000000000000 16.590077677984 2 7.6466366169858 4.929966604206 3 2.3308253958931 3.242362317159 4 1.5122965197784 1.505280356460 Esto muestra que un shock de 1 desviacin estndar en Y1 (igual a 16.21 unidades) provoca una reaccin de 9.886 unidades en Y2. En el siguiente periodo Y1 cae a 4.68 y Y2 cae a 6.706, y as sucesivamente, lo que indica que las respuestas tiene a cae a cero. Puesto que stas respuestas no estn estandarizadas, estn afectas por las unidades de medida, lo que dificulta el anlisis y comparacin. Para esto es conveniente construir grficos de shocks estandarizados. Para esto reproducimos el siguiente segmento de programa, en el cual debe cambiarse el valor de algunos parmetros de acuerdo al modelo particular que se est analizando. Ejemplo: system 1 to 2 vars y1 y2 lags 1 det constant end(system) estimate(noftests,noprint, outsigma=vv) * 1968:4 1 COMPUTE NEQN = 2 ;* cambiar aqui de acuerdo al numero de ecuaciones DECLARE RECT[SERIES] IMPBLK(NEQN,NEQN) DECLARE VECT[SERIES] SCALED(NEQN) DECLARE VECT[LABELS] IMPLABEL(NEQN) COMPUTE IMPLABEL=|| 'Y1','Y2'|| LIST IEQN = 1 TO NEQN DO I=1,NEQN impulse(NOPRINT) NEQN 4 I VV ;* cambiar aqui de acuerdo a las variables del sistema

;* cambiar aqui segun nmero de shocks y nombre matriz

CARDS IEQN IMPBLK(IEQN,I) 1 IEQN DISPLAY(STORE=HEADER) 'Plot of Responses To' IMPLABEL(I) DO J=1,NEQN SET SCALED(J) = (IMPBLK(J,I))/SQRT(VV(J,J)) ;* cambiar aqui segun nombre matriz LABELS SCALED(J)

220

# IMPLABEL(J) END DO J GRAPH(HEADER=HEADER,KEY=UPRIGHT,NUMBER=0, patterns) NEQN CARDS SCALED(IEQN) END DO I

Plot of Responses To Y2
0.9
Y1 Y2

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0 0 1 2 3

Plot of Responses To Y1
1.00
Y1 Y2

0.75

0.50

0.25

0.00 0 1 2 3

En efecto, los grficos permiten una comparacin ms clara, aprecindose la forma en que el shock en una variable afecta a la otra y la forma en que este efecto se desvanece a travs del tiempo. Por ejemplo en el caso del sistema VAR para diferentes bolsas accionarias, uno puede estar interesado en apreciar como un determinado pas contagia a los dems, y cuanto dura ese contagio.

221

Para terminar, es importante sealar una crtica a este tipo de anlisis de impulso-respuesta, es que al reversar el orden de las variables en el sistema original (es decir establecer vars y2 y1, por ejemplo) puede generar respuestas distintas, es decir, las respuestas dependen del orden en la construccin del sistema VAR.

222

REFERENCIAS
Akaike, H. (1973). Information Theory and the Extension of the Maximum Likelihood Principle. En 2 International Symposium on Information Theory. B. Petrov y F. Csaki eds., Budapest. Bollerslev, T. (1986). Generalized Autorregressive Conditional Heteroscedasticity. Journal of Econometrics, Vol. 31(1986), pp 307-327. Box, G. y G. Jenkins (1976). Time Series Analysis, Forecasting and Control. Holden Day: San Francisco. Breush, T. (1978). Testing for Autocorrelation in Dynamic Linear Models. Australian Economic Papers, 17, pp. 334-355. Breusch, T. y A. Pagan (1979). A Simple Test for Heteroscedaticity and Random Coefficient Variation. Econometrica, Vol. 47, pp. 1287-1294. Chow, G. (1960). Tests of Equality Between Sets of Coefficients in Two Linear Regressions. Econometrica 28, pp. 591-605. Cochrane, D. y G. Orcutt (1949). Application of Least Squares Regression to Relationships Containing Autocorrelated Error Terms. Journal of the American Statistical Association 44, pp. 32-61. Doan, T. (1995). RATS-Users Manual-versin 4.2. Estima: Evanston Dickey, D. y W. Fuller (1979). "Distribution of the Estimates for Autoregressive Time Series with a Unit Root", Journal of the American Statistical Association, 74, pp. 427-431. Dickey, D. y W. Fuller (1981). "Likelihood ratio Statistics for Autoregressive Time Series with a Unit Root. Econometrica 49, pp. 1057-1072. Durbin, J. y G. Watson (1951). Testing for Serial Correlation in Least Squares Regression-II. Biometrika 38, pp. 159-178. Durbin, J. (1970). Testing for Serial Correlation in Least Squares Regression When Some of the Regressors are Lagged Dependent Variables. Econometrica 38, pp. 410-421. Engle, R. (1982).Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica (50): 987-1008. Engle, R. y C. Granger (1987), "Cointegration and Error Correction: Representation, Estimation and Testing", Econometrica, 55, 251-276. Engle, R. y B. Yoo (1987). Forecasting and Testing in Cointegrated Systems. Journal of Econometrics 35. pp. 143-159. Enders, W. (1995). Applied Econometric Time Series, New York. John Wiley and Sons. Enders, W. (1996). Rats Handbook for Econometric Time Series. John Wiley and Sons. Godfrey, L. (1978). Testing AgainstGeneral Autorregresive and Moving Average Error Models When the Regressors Include Lagged Dependent Variables. Econometrica, 46. pp. 1293-1302. Goldleld, S. y R. Quandt (1972). Nonlinear Methods in Econometrics. Amsterdam: North Holland, cap. 3. Granger, C. (1969). Investigating Causal Relations by Econometric Models and Cross Spectral Models. Econometrica, Vol. 37, pp. 424-438.

223

Greene, W. (1999). Anlisis Economtrico, Prentice Hall Iberia S.R.L. 3a. Edicin, Madrid, Espaa. Gujarati, D. (1997). Econometra. Mc Graw Hill. 3a. Edicin, Santaf de Bogot, Colombia. Hall, R., J. Johnston y D. Lilien (1990). MicroTsp Users Manual v. 7.0. Quantitative Micro Software, Irvine, California. Hamilton, J. (1994). Time Series Analysis. Princeton University Press. Hidreth, C. y J. Lu (1960). Demand Relations with Autocorrelated Disturbances. Technical Bulletin N276, Michigan State University. Agricultural Experiment Station. Intriligator, M. (1991). Modelos Economtricos, Tcnicas y Aplicaciones. Fondo de Cultura Econmica. Mxico. Johansen, S. (1988), "Statistical Analysis of Cointegrated Vectors", Journal of Economics Dynamics and Control, 12, 231-254 Judge, G., Hill C. y Griffihs, W. (1988). Introduction to the theory and Practice of Econometrics. John Wiley Sons. Second Edition. Klein, L. (1950). Economic Fluctuations in the United States 1921-1941. New York: John Wiley and Sons. Klein, L. (1962). An Introduction to Econometrics. Englewood Cliffs: Prentice Hall. Ljung, G. Y G. Box (1978). On a Measure of Lack of Fit in Time Series Models. Biometrica 65, 297-303. Maddala, G. S. (1996). Introduccin a la Econometra. Segunda Edicin. Prentice-Hall. Mackinnon, J. (1991). Critical Values of Cointegration Tests, en Engle y Granger eds. Long Run Economic Relationships: Readings in Cointegration, cap. 13. Oxford University Press. New York. Mills, T. (1993). The Econometric Modelling of Financial Time Series. Cambridge University Press. Newey, W. y K. West (1987). "A Simple Positive-Definite Heteroskedasticity and Autocorrelation Consistent Covariance Matrix". Econometrica (55): 703708. Otero J. M. (1993). Econometra, Series Temporales y Prediccin. Editorial AC. Primera Edicin. Pindyck, R. y D. Rubinfeld (1998). Econometric Models and Economic Forecasts. 4 Edicin. Irwin Mc Graw Hill. Schwartz, G. (1978). Estimating the Dimension of a Model. Annals of Statistics, Vol. 6, pp 461-464. Sims, C. (1980). Macroeconomics and Reality. Econometrica, Vol. 48, pp 1-49. White, H. (1980). A Heteroskedasticity-Consistent Covariance Matrix Estimator and Direct Test for Heteroskedasticity. Econometrica, Vol. 48, pp. 817-838. Zellner, A. (1962). An Efficient Method of Estimating Seemingly Unrelated Regressions and Test of Aggregation Bias. Journal of the American Statistical Association 57, pp. 348-368.

224

ANEXO: DATOS UTILIZADOS EN EL LIBRO


TABLA 1 INFORMACIN MENSUAL DE ACTIVIDAD ECONMICA EN CHILE (IMACEC), DESEMPLEO EN MILES DE PERSONAS DESOCUPADAS, E INDICE DE PRECIOS AL CONSUMIDOR (BASE: DICIEMBRE 1998=100). FECHA 2000.01 2000.02 2000.03 2000.04 2000.05 2000.06 2000.07 2000.08 2000.09 2000.10 2000.11 IMACEC 254.40 243.19 267.40 244.07 248.97 244.34 242.02 243.47 235.21 254.93 252.29 DESEMPLEO 497.40 473.53 479.93 494.66 521.18 546.79 592.45 613.53 626.59 585.37 551.84 IPC 102.49 103.06 103.81 104.31 104.53 104.77 104.91 105.18 105.82 106.46 106.82

2000.12 250.53 489.42 106.94 Fuente: Banco Central de Chile

225

TABLA 2 INFORMACIN DE 30 EMPRESAS RESPECTO A UNA FUNCIN DE PRODUCCIN COBB-DOUGLAS SIMPLE, EN QUE EL PRODUCTO (Q) ES EXPLICADO POR EL CAPITAL (K) Y EL TRABAJO (L) Trabajo (L) 0.228 0.258 0.821 0.767 0.495 0.487 0.678 0.748 0.727 0.695 0.458 0.981 0.002 0.429 0.231 0.664 0.631 0.059 0.811 0.758 0.050 0.823 0.483 0.682 0.116 0.440 0.456 0.342 0.358 Capital (K) 0.802 0.249 0.771 0.511 0.758 0.425 0.452 0.817 0.845 0.958 0.084 0.021 0.295 0.277 0.546 0.129 0.017 0.906 0.223 0.145 0.161 0.006 0.836 0.521 0.930 0.495 0.185 0.092 0.485 Producto (Q) 0.256918 0.183599 1.212883 0.522568 0.847894 0.763379 0.623130 1.031485 0.569948 0.882497 0.108827 0.026437 0.003750 0.461626 0.268474 0.186747 0.020671 0.100159 0.252334 0.103312 0.078945 0.005799 0.723250 0.776468 0.216536 0.541182 0.316320 0.123811 0.386354

Empresa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

0.162 0.934 0.279431 Fuente: Judge et al. Pg. 512

226

TABLA 3 AHORRO E INGRESO DEL REINO UNIDO 1946-1963 (MILLONES DE LIBRAS) Ao 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 Ahorro 0.36 0.21 0.08 0.20 0.10 0.12 0.41 0.50 0.43 0.59 0.90 0.95 0.82 1.04 1.53 1.94 1.75 Ingreso 8.8 9.4 10.0 10.6 11.0 11.9 12.7 13.5 14.3 15.5 16.7 17.7 18.6 19.7 21.1 22.8 23.9

1963 1.99 25.2 Fuente: Gujarati, Pg. 258

227

TABLA 4 CONSUMO E INGRESO DE 20 FAMILIAS (MILES DE DLARES) Familia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Consumo 19.9 31.2 31.8 12.1 40.7 6.1 38.6 25.5 10.3 38.8 8.0 33.1 33.5 13.1 14.8 21.6 29.3 25.0 17.9 Ingreso 22.3 32.3 36.6 12.1 42.3 6.2 44.7 26.1 10.3 40.2 8.1 34.5 38.0 14.1 16.4 24.1 30.1 28.3 18.2

20 19.8 20.1 Fuente: Maddala, Pg. 231

228

TABLA 5 INFORMACIN ANUAL HIPOTETICA DE INVENTARIOS (Y) Y DE VENTAS (X) EN UNA DETERMINADA REGIN. Ao 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 Inventario 52.9 53.8 54.9 58.2 60.0 63.4 68.2 78.0 84.7 90.6 98.2 101.7 102.7 108.3 124.7 157.9 158.2 170.2 180.0 198.0 Ventas 30.3 30.9 30.9 33.4 35.1 37.3 41.0 44.9 46.5 50.3 53.5 52.8 55.9 63.0 73.0 84.8 86.6 98.8 110.8 124.7

229

TABLA 6 INFORMACIN PARA LA PREDICCIN DE VENTAS DE UNA CADENA DE HOTELES. TASA DE INTERS DE CORTO PLAZO (CPR, COMMERCIAL PAPER RATE) PRODUCTO NACIONAL (GNP), OCUPACIN (OCCUP, PORCENTAJE DE HABITACIONES USADAS POR NOCHE), DEFLACTOR DEL PRODUCTO (PGNP), NUMERO DE HABITACIONES (ROOMS, NMERO DE HABITACIONES EN LA CADENA DE HOTELES). INGRESO POR HABITACIN (RRATE, INGRESO PROMEDIO POR HABITACIN USADA POR NOCHE) TASA DE DESEMPLEO (UNEMP) Ao 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 CPR 7.72 5.11 4.69 8.15 9.87 6.33 5.35 5.60 7.99 10.91 12.29 GNP 992.70 1077.60 1185.90 1326.40 1434.20 1549.20 1718.00 1918.00 2156.10 2413.90 2627.40 OCCUP 68.50 67.40 70.70 70.60 68.30 65.40 68.40 71.20 74.30 73.80 PGNP 91.45 96.01 100.00 105.69 114.92 125.56 132.11 139.83 150.05 162.77 ROOMS 179364 200464 221113 246913 267032 274969 278064 278957 286529 296251 RRATE 15.55 16.50 16.87 17.63 18.38 20.86 22.17 24.56 27.81 32.65 36.80 UNEMP 4.90 5.90 5.60 4.90 5.60 8.50 7.70 7.00 6.00 5.80 7.10

71.50 177.45 303578 Fuente: Hall et al. (1990)

230

TABLA 7 DATOS HIPOTETICOS: Y DEPENDE LINEALMENTE DE X1 Y X2. LOS INSTRUMENTOS SON Z2 Y Z3 Z2 1.1 1.5 1.7 1.8 2.0 2.3 2.4 2.7 3.0 3.1 3.4 3.6 3.9 4.0 4.5 Z3 5.0 4.7 4.6 4.4 4.2 4.0 3.7 3.6 3.5 3.2 3.0 2.9 2.6 2.5 X1 30.4 29.8 29.1 29.5 29.8 29.6 28.0 29.1 28.3 26.7 27.3 27.4 27.0 26.6 Y 34.8 35.6 34.1 33.2 33.8 32.1 32.0 32.9 31.9 33.7 31.9 31.0 32.3 30.3 X2 10 12 15 13 12 16 18 19 17 18 20 19 21 22 23

2.2 26.3 32.4 Fuente: Judge et al. Pg. 589.

231

TABLA 8 UN MODELO DE PRODUCCIN Y DE OFERTA DE DINERO EN EEUU (MILES DE MILLONES DE DLARES) Ao 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 PIB 1010.7 1097.2 1207.0 1349.6 1458.6 1585.9 1768.4 1974.1 2232.7 2488.6 2708.0 3030.6 3149.6 3405.0 3777.2 4038.7 4268.6 4539.9 4900.0 5250.8 5522.2 OFMONET 628.1 717.2 805.2 861.0 908.6 1023.3 1163.7 1286.6 1388.7 1496.7 1629.5 1792.9 1951.9 2186.1 2374.3 2569.4 2811.1 2910.8 3071.1 3227.3 3339.0 INVERS 150.3 175.5 205.6 243.1 245.8 226.0 286.4 358.3 434.0 480.2 467.6 558.0 503.4 546.7 718.9 714.5 717.6 749.3 793.6 832.3 799.5 GASTO 208.5 224.3 249.3 270.3 305.6 364.2 392.7 426.4 469.3 520.3 613.1 697.8 770.9 840.0 892.7 969.9 1028.2 1065.6 1109.0 1181.6 1273.6 1332.7

5677.5 3439.8 721.1 Fuente: Gujarati Pg. 675

232

TABLA 9 INFORMACIN DE 4 COSTOS Y PRODUCCION DE 4 EMPRESAS DURANTE 10 MESES Empresa Tiempo Costo Producto 1 1 43.72 38.46 1 2 45.86 35.32 1 3 4.74 3.78 1 4 40.58 35.34 1 5 25.86 20.83 1 6 36.05 36.72 1 7 50.94 41.67 1 8 42.48 30.71 1 9 25.60 23.70 1 10 49.81 39.53 2 1 51.03 32.52 2 2 27.75 18.71 2 3 35.72 27.01 2 4 35.85 18.66 2 5 43.28 25.58 2 6 48.52 39.19 2 7 64.18 47.70 2 8 38.34 27.01 2 9 45.39 33.57 2 10 43.69 27.32 3 1 43.90 32.86 3 2 23.77 18.52 3 3 28.60 22.93 3 4 27.71 25.02 3 5 40.38 35.13 3 6 36.43 27.29 3 7 19.31 16.99 3 8 16.55 12.56 3 9 30.97 26.76 3 10 46.60 41.42 4 1 64.29 41.86 4 2 42.16 28.33 4 3 61.99 34.21 4 4 34.26 15.69 4 5 47.67 29.70 4 6 45.14 23.03 4 7 35.31 14.80 4 8 35.43 21.53 4 9 54.33 32.86 4 10 59.23 42.25 Fuente: Judge Pg. 477

233

TABLA 10 INFORMACIN SIMULADA DE Y(X1,X2) OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Y 3.284 3.149 2.877 -0.467 1.211 1.389 1.145 2.321 0.998 0.379 1.106 0.428 0.011 1.179 1.858 0.388 0.651 0.593 0.046 X1 0.286 0.973 0.384 0.276 0.973 0.543 0.957 0.948 0.543 0.797 0.936 0.889 0.006 0.828 0.399 0.617 0.939 0.784 0.072 X2 0.645 0.585 0.310 0.058 0.455 0.779 0.259 0.202 0.028 0.099 0.142 0.296 0.175 0.180 0.842 0.039 0.103 0.620 0.158

1.152 0.889 0.704 Fuente: Judge et al. Pg. 500

234

TABLA 11 INFORMACIN SIMULADA DE Y(X1,X2) OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Y 42.08376 41.48572 39.05569 45.08922 51.66982 51.18388 54.77771 60.33432 49.75518 55.45921 52.46684 50.67572 51.64282 56.18829 66.21643 63.22733 68.96477 64.25953 63.75415 69.68355 X1 14.53 15.3 15.92 17.41 18.37 18.83 18.84 19.71 20.01 20.26 20.77 21.17 21.34 22.91 22.96 23.69 24.82 25.54 25.63 28.73 X2 16.74 16.81 19.5 22.12 22.34 17.41 20.24 20.37 12.71 22.98 19.33 17.04 16.74 19.81 31.92 26.31 25.93 21.96 24.05 25.66

235

TABLA 12 INFORMACIN DE 3 ECUACIONES DE DEMANDA EN 30 PERIODOS: CANTIDAD DEMANDADA (Q), PRECIO (P) E INGRESO (Y) OBS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 P1 10.763 13.033 9.244 4.605 13.045 7.706 7.405 7.519 8.764 13.511 4.943 8.360 5.721 7.225 6.617 14.219 6.769 7.769 9.804 11.063 6.535 11.063 4.016 4.759 5.483 7.890 8.460 6.195 6.743 11.977 P2 4.474 10.836 5.856 14.010 11.417 8.755 7.317 6.360 4.188 1.996 7.268 5.839 5.160 9.145 5.034 5.926 8.187 7.193 13.315 6.874 15.533 4.477 9.231 5.907 7.077 9.942 7.043 4.142 3.369 P3 6.629 13.774 4.063 3.868 14.922 14.318 4.794 3.768 8.089 2.708 12.901 11.115 11.220 5.810 5.516 3.707 10.125 2.471 8.976 12.883 4.115 4.962 6.294 8.298 9.638 7.122 4.157 10.040 15.459 Y 487.648 364.877 541.037 760.343 421.746 578.214 561.734 301.470 379.636 478.855 433.741 525.702 513.067 408.666 192.061 462.621 312.659 400.848 392.215 377.724 343.552 301.599 294.112 365.032 256.125 184.798 359.084 629.378 306.527 Q1 11.632 12.029 8.916 33.908 4.561 17.594 18.842 11.637 7.645 7.881 9.614 9.067 14.070 14.474 3.041 14.096 4.118 10.489 6.231 6.458 8.736 5.158 16.618 11.342 2.903 3.138 15.315 22.240 10.012 Q2 13.194 2.181 5.586 5.231 10.930 11.854 17.045 2.682 13.008 19.623 6.534 9.397 13.188 3.340 4.716 17.141 4.695 7.639 9.089 10.346 3.901 4.350 7.371 6.507 3.770 1.360 6.497 10.963 10.140 8.637 Q3 45.770 13.393 104.819 137.269 15.914 23.667 62.057 52.262 31.916 123.026 26.255 35.540 32.487 45.838 26.867 43.325 24.330 107.017 23.407 18.254 54.895 45.360 25.318 32.852 22.154 20.575 44.205 44.443 13.251 41.845

4.806 6.172 347.488 3.982 Fuente: Judge et al. Pg. 460

236

TABLA 13 INFORMACION DEL MODELO DE KLEIN AO 1920 1921 1922 1923 1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 NUM CONSUMPTION PROFIT PRIVWAGE INVEST KLAGGED PRODUCTION GOVTWAGE 1 39.8 12.7 28.8 2.7 180.1 44.9 2.2 1 41.9 12.4 25.5 -0.2 182.8 45.6 2.7 1 45.0 16.9 29.3 1.9 182.6 50.1 2.9 1 49.2 18.4 34.1 5.2 184.5 57.2 2.9 1 50.6 19.4 33.9 3.0 189.7 57.1 3.1 1 52.6 20.1 35.4 5.1 192.7 61.0 3.2 1 55.1 19.6 37.4 5.6 197.8 64.0 3.3 1 56.2 19.8 37.9 4.2 203.4 64.4 3.6 1 57.3 21.1 39.2 3.0 207.6 64.5 3.7 1 57.8 21.7 41.3 5.1 210.6 67.0 4.0 1 55.0 15.6 37.9 1.0 215.7 61.2 4.2 1 50.9 11.4 34.5 -3.4 216.7 53.4 4.8 1 45.6 7.0 29.0 -6.2 213.3 44.3 5.3 1 46.5 11.2 28.5 -5.1 207.1 45.1 5.6 1 48.7 12.3 30.6 -3.0 202.0 49.7 6.0 1 51.3 14.0 33.2 -1.3 199.0 54.4 6.1 1 57.7 17.6 36.8 2.1 197.7 62.7 7.4 1 58.7 17.3 41.0 2.0 199.8 65.0 6.7 1 57.5 15.3 38.2 -1.9 201.8 60.9 7.7 1 61.6 19.0 41.6 1.3 199.9 69.5 7.8 1 65.0 21.1 45.0 3.3 201.2 75.7 8.0 1 69.7 23.5 53.3 4.9 204.5 88.4 8.5 Fuente: Disponible en el archivo KLEIN.DAT de RATS GOVTEXP TAXES 2.4 3.4 3.9 7.7 3.2 3.9 2.8 4.7 3.5 3.8 3.3 5.5 3.3 7.0 4.0 6.7 4.2 4.2 4.1 4.0 5.2 7.7 5.9 7.5 4.9 8.3 3.7 5.4 4.0 6.8 4.4 7.2 2.9 8.3 4.3 6.7 5.3 7.4 6.6 8.9 7.4 9.6 13.8 11.6

237

TABLA 14 INDICE GENERAL DE PRECIOS ACCIONARIOS (IGPA) DE LA BOLSA DE COMERCIO DE SANTIAGO DATOS MENSUALES FECHA 1990.01 1990.02 1990.03 1990.04 1990.05 1990.06 1990.07 1990.08 1990.09 1990.10 1990.11 IGPA 802.40 829.68 931.37 901.06 861.06 891.60 857.86 888.76 896.74 858.42 936.18 FECHA IGPA FECHA IGPA FECHA IGPA

1993.01 2939.67 1993.02 3127.27 1993.03 2948.19 1993.04 2787.76 1993.05 2675.69 1993.06 2826.93 1993.07 2949.26 1993.08 3040.29 1993.09 3087.02 1993.10 3208.54 1993.11 3285.49 1993.12 3615.50 1994.01 4311.05 1994.02 4702.80 1994.03 4307.29 1994.04 4102.54 1994.05 4245.29 1994.06 4499.48 1994.07 4318.90 1994.08 4547.97 1994.09 4906.31 1994.10 5471.56 1994.11 5651.67 1994.12 5504.47 1995.01 5409.15 1995.02 5350.15 1995.03 5137.97 1995.04 5363.88 1995.05 5843.19 1995.06 6069.80 1995.07 6234.64 1995.08 6034.46 1995.09 5882.67 1995.10 5902.37 1995.11 5631.62

1996.01 5745.79 1996.02 5625.93 1996.03 5451.65 1996.04 5378.07 1996.05 5517.94 1996.06 5453.43 1996.07 5628.65 1996.08 5407.54 1996.09 5382.00 1996.10 5488.50 1996.11 5232.81 1996.12 4943.34 1997.01 5172.68 1997.02 5331.90 1997.03 5307.08 1997.04 5344.03 1997.05 5415.49 1997.06 5739.46 1997.07 5750.77 1997.08 5620.24 1997.09 5517.77 1997.10 5239.03 1997.11 4976.63 1997.12 4810.56 1998.01 4452.31 1998.02 4368.63 1998.03 4756.54 1998.04 4699.52 1998.05 4431.90 1998.06 4161.43 1998.07 4084.03 1998.08 3764.43 1998.09 3170.57 1998.10 3224.28 1998.11 3774.36

1999.01 3474.93 1999.02 3739.60 1999.03 3970.71 1999.04 4412.83 1999.05 4565.42 1999.06 4648.06 1999.07 4871.82 1999.08 4657.97 1999.09 4739.64 1999.10 4548.55 1999.11 4767.62 1999.12 5057.12 2000.01 5420.91 2000.02 5429.44 2000.03 5214.47 2000.04 5037.26 2000.05 4995.42 2000.06 4928.17 2000.07 4882.20 2000.08 4950.68 2000.09 4912.98 2000.10 4706.87 2000.11 4858.08 2000.12 4868.71 2001.01 5021.37 2001.02 4973.26 2001.03 4945.14

1990.12 1121.75 1991.01 1195.34 1991.02 1435.84 1991.03 1599.07 1991.04 1714.48 1991.05 1697.86 1991.06 1866.50 1991.07 2107.86 1991.08 2320.96 1991.09 2662.28 1991.10 2830.03 1991.11 2489.71 1991.12 2438.45 1992.01 2426.97 1992.02 2546.94 1992.03 2867.28 1992.04 2981.53 1992.05 3008.54 1992.06 2981.96 1992.07 3002.73 1992.08 2922.06 1992.09 2814.80 1992.10 2750.54 1992.11 2751.26 1992.12 2687.12

1995.12 5700.85 1998.12 3653.32 Fuente: Bolsa de Comercio de Santiago

238

TABLA 15 INDICE DE PRECIOS AL CONSUMIDOR DE LOS ESTADOS UNIDOS (WPI) (TRIMESTRAL) TRIM 1960.1 1960.2 1960.3 1960.4 1961.1 1961.2 1961.3 1961.4 1962.1 1962.2 1962.3 1962.4 1963.1 1963.2 1963.3 1963.4 1964.1 1964.2 1964.3 1964.4 1965.1 1965.2 1965.3 1965.4 1966.1 1966.2 1966.3 1966.4 1967.1 1967.2 1967.3 1967.4 1968.1 1968.2 1968.3 1968.4 WPI 30.7 30.8 30.7 30.7 30.8 30.5 30.5 30.6 30.7 30.6 30.7 30.7 30.6 30.5 30.6 30.7 30.7 30.6 30.7 30.7 30.9 31.2 31.4 31.6 32.1 32.2 32.6 32.4 32.3 32.3 32.4 32.5 32.9 33.1 33.3 33.4 TRIM 1969.1 1969.2 1969.3 1969.4 1970.1 1970.2 1970.3 1970.4 1971.1 1971.2 1971.3 1971.4 1972.1 1972.2 1972.3 1972.4 1973.1 1973.2 1973.3 1973.4 1974.1 1974.2 1974.3 1974.4 1975.1 1975.2 1975.3 1975.4 1976.1 1976.2 1976.3 1976.4 1977.1 1977.2 1977.3 WPI 33.9 34.4 34.7 35.0 35.5 35.7 35.9 35.9 36.5 36.9 37.2 37.2 37.9 38.3 38.8 39.2 41.1 43.1 44.9 45.3 48.3 50.0 53.6 55.4 55.4 56.0 57.2 57.8 58.1 59.0 59.7 60.2 61.6 63.0 63.1 TRIM 1978.1 1978.2 1978.3 1978.4 1979.1 1979.2 1979.3 1979.4 1980.1 1980.2 1980.3 1980.4 1981.1 1981.2 1981.3 1981.4 1982.1 1982.2 1982.3 1982.4 1983.1 1983.2 1983.3 1983.4 1984.1 1984.2 1984.3 1984.4 1985.1 1985.2 1985.3 1985.4 1986.1 1986.2 1986.3 WPI 65.4 67.4 68.4 70.0 72.5 75.1 77.4 80.2 83.9 85.6 88.4 90.4 93.1 95.2 95.9 95.8 96.6 96.7 97.1 97.2 97.3 97.6 98.6 99.1 100.2 100.8 100.6 100.3 100.1 100.2 99.5 100.1 98.6 96.8 96.3 TRIM 1987.1 1987.2 1987.3 1987.4 1988.1 1988.2 1988.3 1988.4 1989.1 1989.2 1989.3 1989.4 1990.1 1990.2 1990.3 1990.4 1991.1 1991.2 1991.3 1991.4 1992.1 1992.2 WPI 97.8 99.4 100.5 101.0 101.6 103.2 104.7 105.2 107.5 109.4 109.0 109.4 111.0 110.8 112.8 116.2 113.8 112.7 112.5 112.7 112.4 113.6

1977.4 63.9 1986.4 96.7 Fuente: Enders (1996), Pg. 47

TABLA 16

239

CAMBIOS TRIMESTRALES DESESTACIONALIZADOS EN EL PRODUCTO PER CPITA (Y1) Y EN EL INGRESO DISPONIBLE (Y2) DE LOS EEUU TRIM 1951.2 1951.3 1951.4 1952.1 1952.2 1952.3 1952.4 1953.1 1953.2 1953.3 1953.4 1954.1 1954.2 1954.3 1954.4 1955.1 1955.2 1955.3 1955.4 1956.1 1956.2 1956.3 1956.4 1957.1 1957.2 1957.3 1957.4 1958.1 1958.2 1958.3 1958.4 1959.1 1959.2 1959.3 1959.4 1960.1 1960.2 1960.3 Y1 -61 8 -1 -4 30 -1 45 17 2 -17 -16 -4 8 23 31 31 33 14 26 -7 -6 -4 13 4 -6 5 -6 -37 12 25 16 39 23 9 -5 1 24 Y2 42 -1 -11 -12 16 41 14 17 26 -20 -10 -11 -23 29 36 8 43 31 29 8 9 2 20 -10 5 1 -20 -35 6 45 25 6 32 -30 10 6 6 TRIM 1960.4 1961.1 1961.2 1961.3 1961.4 1962.1 1962.2 1962.3 1962.4 1963.1 1963.2 1963.3 1963.4 1964.1 1964.2 1964.3 1964.4 1965.1 1965.2 1965.3 1965.4 1966.1 1966.2 1966.3 1966.4 1967.1 1967.2 1967.3 1967.4 1968.1 1968.2 1968.3 1968.4 1969.1 1969.2 1969.3 1969.4 Y1 -9 -5 23 -3 37 13 21 10 23 8 15 24 8 39 38 35 -3 46 17 35 65 29 -2 22 0 15 31 7 6 54 30 54 8 21 9 9 16 Y2 -23 13 28 17 38 14 16 3 1 15 17 19 30 47 75 27 23 22 32 76 47 17 6 27 21 38 21 16 17 36 43 -7 9 -2 19 47 10

-19 -12 Fuente: Judge et al. Pg. 760

240

También podría gustarte