Está en la página 1de 372
Pasog) Paso eo 4 ay y ~ SOPMSIY SEUI|GON 9 PARANINFO PROBLEMAS RESUELTOS DE ECONOMETRIA CESAR PEREZ LOPEZ Gerente Editorial Area Universitaria: ‘Andrés Otero reguera Editoras de produccién: Clara M de la Fuente Rojo Consuelo Garcia Asensio (Olga MF Vicente Crespo COPYRIGHT ©2008 Exiciones Paraninfo, S.A. Magallanes, 25; 28015 Madd, ESPANA Teléfono: 902 995 240 Fax: 914 458 218 centes@paranini.e vworw-paraninto.es Impreso en Espatia, Printeain Spain Isa: 849732.76-9 Depésito legal: M-11.281-2006 (o2ar7323) Reservados los derechos para todos los paices de lengua espa fla. De conformidad can lo de puesto en el articulo 270 del Céd- {9 Penal gente, podrn sor cast- {ados con penas de muta yprva ‘on de Wertad quienes reprodu- jeren o plagiaren, en todo © en parte, una obra Werara,atistica 0 enti fada en cuaiquer tipo e soporte sin la preceptva auto: Feacién, Ninguna parte de esta publication, incuido el deero de Fa cubiera, puede ser reproduc da, almacenada o tranemtida de finguna forma, ni por ningun me: tbo, sea ésle electronica, quimica, tmecinico, electro-éptioe, "grabs! On, fotocopia 0 cualquier oro, fn la previa aulorzacion escrta por parte de ls Editorial Disefio de cubierta: Montytexto Impresién: Closas Orcoyen.S.L, Polig. igarsa Naves 21, 22, 23, y 24 Paracuellos de jarama (Madr) PROLOGO El objetivo de este libro es presentar las técnicas econométricas esencialmente en. su faceta préctica, Cada capitulo comienza con una breve exposicién de los conceptos tesricos a utilizar en los problemas con el objetivo de que no sea necesario recurtir a textos extemnos para ‘comprender las herramientas utilizadas en las soluciones. Los ejercicios se refuerzan con aplicaciones informéticas para obtener la solucién, Coneretamente se ha utilizado el software Eviews en su sltima versién. Este paquete econométrico, a partir de su versi6n 5, contempla la posibilidad de trabajar en la mayoria de los temas avanzados en Econometria. El contenido de este libro se dirige a docentes y estudiantes universitarios de todos los niveles que imparten o cursan la materia de Econometrfa o modelos en general. También es ‘itil para los profesionales de la Economfa, Ciencias Sociales y otras ramas cientificas en las ‘que se aplican las técnicas de modelizacién. El libro comienza tratando la estimacién, inferencia y prediccién en el modelo de regresi6n miltiple. A continuacién se analizan los modelos con datos de corte transversal y los problemas més caracteristicos que suelen presentar: Heteroscedasticidad, multicolinealidad, ausencia de normalidad, no linealidad, errores de especificacién y problemas de exogeneidad y regresores estocésticos. Para cada problema se estudian tanto los métodos de deteccién ‘como los métodos de correccién, Posteriormente se abordan los modelos de regresién con datos de series temporales y los problemas més acuciantes en este caso: Autocorrelaci6n, variables ficticias, estabilidad estructural y heteroscedasticidad con series de tiempo. Se vuelven a estudiar los métodos de deteccién y correccién, haciendo hincapié en las aplicaciones del uso de variables ficticias y Jos contrastes de cambio estructural y estabilidad de los parémetros asf como la solucién a estos problemas, A continuaci6n se tratan los modelos dinémicos y el anélisis univariante de series ‘temporales incluyendo los modelos ARIMA y Ia metodologia de Box Jenkins. Asimismo, se presentan los contrastes de rafces unitarias més habituales, las técnicas del anélisis de la cointegracién y los modelos de correccién por el error. También se contemplan las técnicas para el trabajo con los modelos con datos de Panel, las combinaciones de cortes transversales de datos y los modelos de ecuaciones simulténeas, incluyendo sistemas con datos de panel. La Gltima parte del libro desarrolla los modelos de variable dependiente limitada incluyendo los modelos de eleccién discreta binaria y miiltiple (Logit, Probit y Gompit o del valor extremo) y los modelos de datos de recuento (Poisson, Binomial Negativa, Exponencial y Normal), Para finalizar se abordan los modelos censurados, truncados y de seleccién muestra, Se contempla el modelo Tobit con censura en los datos y el modelo Tobit truncado, También se tienen presentes los problemas de correccién de ia seleccién muestral incluyendo el ‘truncamiento incidental y el procedimiento de estimacién bietdpica de Heckman o Heckit. El contenido del libro sigue los textos més completos de Ia actualidad en esta materi como son los casos de los textos de Wooldridge, Green, Gujarati, Johnston, Pulido, Novales, Aznar, Pefia y otros EL AUTOR Madrid, enero de 2006 We MES Pareninte CONTENIDO Capitulo 1 Capitulo 2 Modelo de regresién miltiple: estimacién, inferencia y prediccién... 1.1 Conceptos: Los datos en econometria 1.1.1 Concepto de econometia 1.1.2. Estructuras de datos, Datos de corte transversal © seceién eruzada 1.1.3. Estructuras de datos. Datos de series temporales. 1.1.4 Estructuras de datos. Combinaciones de cortes transversales 1.1.5. Estructuras de datos. Datos de panel o longitudinales 1.2 Modelo de regresién miiltiple con datos de corte transversal Estimacién e inferencia 1.2.1 Modelo de regresién lineal multiple, Hipstesis| 1.2.2 Interpretacién de los coeficientes. 1.23. Estimacién del modelo por minimos cuadrados ordinarios MCO 1.2.4 Estimacién MCO del modelo, contrastes e intervalos de confianza a través del célculo matricial 1.2.5 Consistencia de los estimadores MCO. 1.3. Predieciones 1.4 Anilisis de los Residuos. Problemas. Modelos de regresién multiple con datos de corte transversal sass 2.1 Modelos con datos de corte transversal 2.2 Heteroscedasticidad: Estimacién MCG 2.2.1 El problema de Ia heteroscedasticidad y su deteecisn 22.2 Soluciones para la heteroscedasticidad: Minimos Cuadrados Generalizados MCG y Minimos Cuadrados Ponderados 2.2.3. Soluciones para la heteroscedasticidad: Modelos ARCH y GARCH. 22.4 Soluciones para la heteroscedasticidad: Ajuste de White Reon 12 12 13 4 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Capitulo 3 Vile © res Parnino 23 24 26 Multicotineatidad 2.3.1 El problema de Ia multicolinealidad y su deteccién 23.2 Soluciones para la multicolinealidad. Normatidad de las perturbaciones 2.4.1 El problema de Ia falta de normalidad en los residuos. 24.2. Soluciones para la falta de normalidad en los residuos, No linealidad y errores de especificacién 2.5.1 Error de especificacién en la seleccién de las variables explicativas 2.5.2. Error de especificacién en la forma funcional Exogeneidad y regresores estocésticos 2.6.1 El método de las variables instrumentales 2.62. Elestimador de minimos cuadrados en dos etapas MC2E. 2.63. Elcontraste de Hausman Problemas. Modelos de regresién miltiple con series temporales 34 32 33 34 35 Regresién con series de tiempo Autocorrelacién 3.2.1 El problema de la autocorrelacién y su deteccién 3.2.2. Soluciones para la autocorrelacién. Regresisn con variables cualitativas: variables ficticias 3.3.1 Modelos de regresién con variables cualititativas. 3.3.2. Variables ficticias en el andlisis estacional. 3.3.3. Variables ficticias en la regresi6n por tramos. Estabilidad estructural 3.4.1 Constancia de los parémetros y contraste de prediceién de Chow 3.4.2. Cambio estructural y contraste de Chow 3.4.3. Residuos recursivos: Contrastes basados en la cestimaci6n recursiva, 3.4.4 Contrastes CUSUM y CUSUMQ. Heteroscedasticidad con series de tiempo Problemas. 61 61 2 6 63 107 108 109 109 113 4 4 7 17 18. 118 119 120 121 122 123 Capitulo 4 Capitulo 5 Modelos dinamicos y ARIMA. Rajces unitarias y cointegracién... 4.1. Modelos dinémicos 4.1.1 Modelos con retardos distribuidos finitos 4.1.2 Modelos con retardos distribuidos infinitos 4.2. Andlisis univariante de series temporales 4.2.1 Componentes de una serie temporal 4.2.2. Modelos ARIMA 4.2.3. Series estacionarias 4.2.4 Series estacionales 4.2.5 Metodologia de Box Jenkins para los modelos ARIMA. 3. Elproblema de las regresiones espurias 4.4 Contrastes de rafces unitarias 4.4.1 Contrastes de Dickey-Fuller de las raices unitarias, 4.4.2. Contrastes de Phillips-Perron de las rafces unitarias. 45 Anélisis de la cointegracion 4.5.1 Contraste de Phillips-Oularis para la cointegracién. 4.6 Modelos de correccién por el error MCE. Problemas. Modelos con datos de panel y combinaciones de cortes transversales.... 5.1 Modelos de regresién con datos de panel 5.2. Modelos de panel de coeficientes constantes 5.3, Modelos de panel de efectos fijos 5.4. Modelos de panel de efectos aleatorios 5.5. Modelos con datos de panel dinémicos 5.6 Combinaciones de cortes transversales (poo!) Problemas. CONTENIDO 163 164 164 165 166 166 167 169 172 173, 178 179 179 180 181 181 182 183, © TES Paraninfos IK ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Capitulo 6 Modelos de ecuaciones simulténeas y sistemas. X0@ MTES Parente 107 Sistemas de datos de panel 6.1 Introducci6n a los modelos estructurales de ecuaciones simulténeas 6.2 Identificacién de modelos de ecuaciones simulténeas 63 Estimacién de modelos de ecuaciones simulténeas 6.4 Métodos de estimacién de sistemas 6.5 Modelos de ecuaciones simulténeas con series de mpo 66 Modelos de ecuaciones simulténeas con datos de panel Problemas. ‘Modelos de variable dependiente limitada: Logit, Probit y Recuento. 7.1. Modelos de variable dependiente limitada 7.2. Modelos de eleccién discreta 7.3. Modelos de elecci6n discreta binaria 7.3.1 Modelo lineal de probabilidad. 7.3.2 Modelos Logit y Probit 7.4. Modelos de eleccién miiltiple 7.4.1 Modelo Logit Multinomial 7.4.2 Modelo Logit Condicional 7.43. Modelo Logit Anidado 7.4.4. Modelo Probit Multinomial 7.4.5, Modelo Probit y Logit Ordenados 7.5. Modelos de datos de recuento 7.5.1 Modelo de regresién de Poisson. 7.5.2. Modelo de regresi6n de Binomial Negativa 7.5.3. Modelo de regresién Exponencial 7.5.4 Modelo de regresién Normal. Problemas. 265 266 268 an 215 216 ann 278 299 300 301 301 301 302 306 306 307 308 309 309 310 310 313 313 313 313 CONTENIDO Capitulo 8 Modelos censurados, truncados y de seleecién muestral: Modelos Tobit... 339 8.1 Modelos censurados: El modelo Tobit 340 8.1.1 Interpretacién de los coeficientes en el modelo Tobit. 341 8.1.2 Efectos parciales en el modelo Tobit 341 8.1.3 Modelo Tobit con censura en los datos. 342 8.2. Estimaci6n del modelo Tobit censurado 343 8.2.1 Estimacién maximo verosimil (MV). 343 8.2.2 Estimacién por minimos cuadrados en dos etapas 343 8.3. Seleccién muestral: modelos truncados 344 8.4. Estimacién del modelo Tobit truncado 344 8.4.1 Efectos parciales en el modelo Tobit truncado 345 8.4.2. Estimacién maximo verosimil (MV) 345 8.4.3 Estimacién por el método de Amemiya en dos etapas. 346 8.5. Correccién de la seleccién muestral 346 8.5.1 Truncamiento incidental 346 85.2 Procedimeinto de estimaci6n bietipico de Heckam o Heckit. 347 Problemas. 348 © ITES-Paraninfos XI ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 1.1__CONCEPTOS: LOS DATOS EN ECONOMETRIA 1.1.1 Concepto de econometria Puede considerarse la econometrfa como la integracién de la teorfa econdmica, las matemiticas y las téenicas estadisticas, con el objeto de contrastar hipstesis sobre fenémenos ‘econdmicos, aportar estimaciones numéricas de los coeficientes de las relaciones econémicas y prever o predecir los valores futuros de las variables o fenémenos econémicos, La econometria presupone la existencia de un conjunto de teorfas 0 hipstesis ‘econsmiicas que hay que contrastar. Si las variables que sugiere la teorfa econémica no ofrecen una explicacién satisfactoria, el investigador puede experimentar con formulaciones y variables alternativas sugeridas por las contrastaciones anteriores o por otras teorias. De esta forma, la investigacién econométrica puede dar lugar a la aceptacién, el rechazo o la reformulacién de las teorias econémicas. Las mateméticas se utilizan para expresar las afirmaciones verbales de las teorias econémicas en lenguaje simbélico, expresando relaciones exactas 0 funcionales deterministas entre las variables inmersas en los modelos. El anélisis estadistico aplica las técnicas adecuadas para estimar las elaciones inexactas 0 no experimentales entre variables econémicas, utilizando los datos econémicos relevantes.y evaluando los resultados. La investigacién econométrica implica en general tres etapas. La primera consiste en Ia especificacién del modelo o de las hipdtesis realizadas en forma de una ecuacin explicita estocéstica, junto con las especificaciones tedricas a priori sobre el signo y la magnitud de los parémetros de la funcién. La segunda etapa consiste en la recopilaci6n de los datos sobre las variables del modelo y 1a estimacién de los coeficientes de la funcién con las técnicas econométricas adecuadas. La tercera etapa consiste en la evaluacién de los coeficientes estimados de Ia funcién utilizando criterios econémicos, estadisticos y econométricos, 1.1.2 Estructuras de datos. Datos de corte transversal o seccién cruzada Dentro de las estructuras de datos més importantes, tipicas en el trabajo econométrico aplicado, tenemos los datos de corte transversal 0 datos de seccién cruzada. Un conjunto de datos de corte transversal es una muestra compuesta por individuos, familias, empresas, ciudades, estados, paises u otro tipo de unidades muy variadas recogida en un momento determinado del tiempo. En general podemos suponer que los datos de corte transversal se han obtenido mediante un muestreo aleatorio de la poblacién subyacente. Por ejemplo, si ‘obtenemos informacién sobre los salarios, la educacién, la experiencia y otras caracteristicas escogiendo aleatoriamente a 500 personas de la poblacién empleada, podemos decir que ‘contamos con una muestrea aleatoria de toda la poblacién que tiene un empleo, Los datos de corte transversal se emplean muy frecuentemente en economfa y en otras ciencias sociales. En economfa, el andlisis de datos de corte transversal esta estrechamente relacionado con distintas ramas de la microeconomia aplicada, como la economia del trabajo, Jas finanzas pablicas tanto estatales como locales, la organizaci6n industrial, la economfa urbana, la demografia y la economia de la salud. Los datos sobre individuos, familias, ‘empresas y ciudades en un momento determinado son importantes para contrastar hipstesis microeconémicas y evaluar politicas econdmicas, 260 TES Paraito MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Hay ocasiones en que las muestras de seccién cruzada no son muestras aleatorias de la poblacién, como ocurre cuando tenemos observaciones que no son independientes por correlacién espacial (unidades geogratficas grandes con actividades econémicas correlacionadas), ‘© cuando hay otros disefios de muestra (muestreo estratificado) o seleccién muestral derivada de Ja no respuesta de determinados individuos de la poblacién 1.1.3 Estructuras de datos. Datos de series temporales Un conjunto de datos de series temporales consiste en observaciones sobre una variable 0 distintas variables a lo largo del tiempo. Ejemplos tipicos de datos de series temporales son el producto interior brato, la oferta monetaria, los indices de precios al consumo, las tasas amuales de homicidio o las cifras de venta de automéviles. Dado que los acontecimientos pasados pueden tener influencia sobre acontecimientos futuros, y los efectos retardados en el ‘comportamiento de los individuos son frecuentes en ciencias sociales, el tiempo es un ardmetro importante en los conjuntos de series temporeales. Por oposicién al orden de los datos de corte transversal, la disposicién cronolégica de las observaciones de una serie temporal sf transmite informacién potencialmente importante. Los datos de series temporales suelen utilizarse més en el anélisis macroeconémico, en contraposicién a los datos de corte transversal, que se utilizan sobre todo en anélisis macroeconémico. Las series temporales suelen ser mas dificiles de analizar que los datos de corte transversal debido a que casi nunca podemos suponer que las observaciones econémicas son temporalmente independientes. La mayorfa de las series temporales, ya sean econémicas no, estén relacionadas (a menudo fuertemente relacionadas) con su historia reciente. Por ejemplo, nuestro conocimiento sobre el producto nacional bruto del trimestre pasado nos dice bastante del nivel de PIB que podemos esperar para el trimestre en curso ya que el PIB tiende apermanecer estable de un trimestre a otro. Otra caracteristica importante de los dato de series ‘temporales es la periodicidad con la que se recogen (semanal, mensual, trimestral, etc.) con el hhecho adicional de que muchas series temporales semanales, mensuales 0 trimestrales muestran una caracteristica estacional marcada que puede ser un factor importante en Ia metodologia del anélisis de dichas series 1.1.4 Estructuras de datos. Combinaciones de cortes transversales Una combinacién de cortes transversales o pool de datos es una estructura de datos que tiene ccaracteristicas tanto de datos de corte transversal como de datos de series temporales. Un pool de datos es una fusidn de varios cortes transversales de datos recogidos en diferentes momentos del tiempo en Ia misma poblacién. Por ejemplo, supongamos que se hacen dos encuestas de corte transversal sobre familias en un pafs, una en 1985 y otra en 1990, En 1985, se hace una cencuesta con una muestra aleatoria para obtener variables como el nivel de ingresos, de ahorro, cl tamaiio de las familias, etc. En 1990, se hace un nuevo muestreo aleatorio de las familias y se ‘emplean Jas mismas preguntas que en 1985 para hacer Ia encuesta, Con el objeto de aumentar el tamatio de la muestra, podemos formar un conjunto de datos fusionados de seccién cruzada ‘combinando los datos de dos aftos. La fusién de datos de corte transversal de distintos aiios a menudo resulta wtil para analizar los efectos de nuevas politicas gubernamentales. La idea consiste en recopilar datos de los afios anteriores y posteriores a un cambio politico clave. Generalmente, los datos fusionados de seccién cruzada se analizan de forma muy parecida a los datos de corte transversal convencionales, excepto que a menudo necesitamos tomar en cuenta diferencias de las variables a lo largo del. tiempo. De hecho, ademés de aumentar el tamaito de la muestra, el objetivo de la fusién de datos de seccidn cruzada es menudo observar también c6mo una relacién clave ha cambiado con el tiempo. No obstante, al combinar secciones cruzadas obtenidas por muestreo aleatorio de la misma poblacién en distintos momentos del tiempo, tendremos una muestra de observaciones distribuidas ndependientemente pero no idénticamente. © MES-Parainios 3 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 1.1.5 Estructuras de datos. Datos de panel 0 longitudinales Un conjunto de datos de panel, o datos longitudinales, consiste en una serie temporal para cada unidad de una seccién cruzada (0 conjunto de datos de corte transversal). Como ejemplo, supongamos que tenemos un registro de datos sobre el salario, Ia educacién, y el historial de ‘empleo de un conjunto de individuos seguidos durante un perfodo de diez afios. También odriamos recopilar informacién sobre los datos financieros o de inversién de un mismo conjunto de empresas durante un periodo de cinco afios. Los datos de panel también pueden recopilarse sobre unidades geogréficas. Por ejemplo, podemos recopilar datos sobre flujos de immigraci6n, nivel de imposicin, salarios, gastos del gobierno, etc., en el mismo conjunto de pafses de la Unién Europea para los aiios 1990, 1995 y 2000. La caracteristica clave de los datos de panel que los diferencia de los datos fusionados de seccién cruzada es el hecho de ‘que se recoge informacién de las mismas unidades de seccidn eruzada (individuos, empresas 0 pafses) en los distintos momentos del tiempo, Dado que la recogida de los datos de panel requiere que se repitan las mismas unidades a encuestar a lo largo del tiempo, éstos son més dificiles de obtener que los datos fusionados de seccién cruzada, especialmente cuando se trata de datos sobre individuos, unidades familiares o empresas. No obstante, una ventaja de los datos de panel es que, a menudo, nos permiten estudiar la importancia de retardos en el comportamiento o de retardos en Ja toma de decisiones. Esta informacién puede ser muy significativa dado que se puede esperar de muchas medidas econémicas que no tengan ningtin impacto hasta que no pase cierto tiempo desde su puesta en aplicaci6n, 1.2 MODELO DE REGRESION MULTIPLE: ESTIMACION E INFERENCIA 1.2.1 Modelo de regresién lineal multiple. Hipétesis La regresién miiltiple tiene como objetivo analizar un modelo que pretende explicar el ‘comportamiento de una variable (variable endégena, explicada o dependiente), que designaremos ‘como ¥, utilizando Ia informacién proporcionada por los valores tomados por un conjunto de variables explicativas (exdgenas o independientes), que designaremos por Xi, Xo. Xe EI modelo lineal (modelo econométrico) viene dado de la forma: =f BXi+ BrXrt ut BX € Los coeficientes (parimetros) 8, (3, ... -denotan la magnitud del efecto que las variables explicativas (ex6genas o independientes) X;, Xo, ... Xe tienen sobre la variable explicada (endégena 0 dependiente) ¥. El coeficiente se denomina término constante (0 independiente) del modelo. El término 1 se denomina término de error del modelo. Disponemos de un conjunto de T observaciones para cada una de las variables endégena y ex6genas. Entonces, podremos escribir el modelo de la forma: Ye Bt BXut BpXast wot BXwt & La aparicién (no necesaria) de un término independiente en el modelo puede interpretarse como la presencia de una primera variable Xo cuyo valor sea siempre 1 El problema fundamental que se aborda es el siguiente: suponiendo que la relacién entre la variable Y y el conjunto de variables X;, Xp... , X, es como se ha descrito en el modelo, y que se dispone de un conjunto de T observaciones para cada una de las variables, Ia endégena y las ‘ex6genas, jcémo pueden asignarse valores numéricos a los parametros &, 8, Py . & baséindonos en la informacién muestral? Estos valores se lamarén estimaciones de los parémetros. 460 ITES-Peranino MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Una vez. encontradas las estimaciones de los parémetros del modelo, podremos hacer predieciones acerca del comportamiento futuro de la variable ¥. Formulamos el modelo lineal bajo las siguientes hipstesis clasicas: + Las variables X;, Xp... Xi son deterministas (no son variables aleatorias), ya que su valor es constante proveniente de una muestra tomada, y ademas no estn correlacionadas con el término de error & es decir, E(AX1.Xa,... Xz) = 0 (hipstesis de exogeneidad). + La variable ¢ (témmino de error) es una variable aleatoria con esperanza mula y mattiz de covarianzas constante y diagonal (matriz escalar). Es decir que, para todo 1, la variable & tiene media cero y varianza o” no dependiente de 1, y ademas Cov(, &)=0 para todo i y para todo j distintos entre si. EI hecho de que la varianza de & sea constante para todo t (que no dependa de 0), se denomina hip6tesis de homoscedasticidad y puede también expresarse como V(4X1,X2, .. Xe) = 0 y V(N|XiX2, . Xe) = 0°. El hecho de que Cov(é, 6)=0 para todo i distinto de j se denomina hipétesis de no autocorrelacién * La variable ¥ es aleatoria, ya que depende de Ia variable aleatoria € Ademés, Ia relaci6n entre ¥ y X;, Xo, .., Xces efectivamente lineal (hipstesis de linealidad), ‘+ También se supone la ausencia de errores de especificacién, es decir, que suponemos que todas las variables X que son relevantes para la explicaci6n de la variable Y, estan incluidas en la definicidn del modelo lineal, ‘© Las variables X;, Xz, Xeson linealmente independientes, es decir, no existe relacién lineal exacta entre ellas. Esta hipdtesis se denomina hipétesis de independencia, y cuando no se cumple, decimos que el modelo presenta multicolinealidad. ‘+ También se considera la hipdtesis de normatidad de los residuos, consistente en que las variables & sean normales para todo t 1.2.2 Interpretacién de los coeficientes Supongamos que para una muestra escribimos e1 modelo como (modelo nivel-nivel) + BX BXait ont BXwt & con: ~ E(Y|X,, XX )=B+ BX, + BX +.4BX, ~ V(¥|X,.X, En caso de que todas las variables excepto X) permanezean constantes, tenemos AE(Y|X,.X, 505 X,) = BAX, Entonces podemos interpretar el coeficiente , como el niimero de unidades que varia ‘en media ¥ cuando X; varia en una unidad (permaneciendo el resto de las variables constantes. El término constante se interpreta como el prondstico de ¥ cuando las X; se anulan, © MES-Parainios 5 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Supongamos ahora que para una muestra escribimos el modelo con logaritmos en la/s variable/s exégena/s (modelo nivel-log). Tenemos: Y=A+AmX+e E(e\X)=0> E(Y|X)= 8 +AInX AE(Y|X) _ AE(Y|X) AlnX AX/X Multiplicando y dividiendo por 100 para expresar Ia variacién de X en términos % tenemos: AE(Y X. B1i99~ AEX) 100% AX / X Podemos interpretar entonces que cuando X varfa en un 1%, ¥ varia en media en 1100 unidades de ¥. ‘Supongamos ahora que para una muestra escribimos el modelo con logaritmos en la variable endégena (modelo log-nivel). Tenemos: InY=f+hX+e E(e|X)=0— E(n¥\X) = 8 + BX AE(nY|X) _ E(AY/¥|X) AX AX Si multiplicamos por 100 para expresar la variacién de ¥ en términos % tendremos: E(QOOxAY/Y|X) 100 = ax 7m Podemos interpretar entonces que cuando X varia en una unidad, ¥ varia en media en sun (B.x100) %. ‘Supongamos ahora que para una muestra escribimos el modelo con logaritmos en la variable endégena y en la/s exdgenas (modelo log-log o de doble logaritmo). Tenemos + BInX +e E(E|X) =0—9 EdnY|X) =f, + B1nX ((nY\X) _ BAY /¥\X) AlnX AX/X Podemos interpretar entonces que cuando X varia en un 1%, ¥ varfa en media en un Bi%, es decir, se interpretan los coeficientes en términos de elasticidades. 660 ITES-Peraino MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Supongamos ahora que para una muestra escribimos el modelo con términos cuadriticos en la variable endégena. Tenemos: E(6)X) =O E(Y|X) =f + BX + BX AE(Y|X) AX A+2BX Podemos interpretar entonces que cuando X varia en 1 unidad, ¥ varfa en media en BA+2X unidades. En este caso A y 6; no tienen interpretacién por separado. Dependiendo del signo de f; los efectos marginales serdn crecientes (£:>0) 0 decrecientes (;<0). Existe un punto eritico en el que Ia curva E(Y|X) cambia de pendiente: ¥*=~6,/28, La tabla siguiente resume las interpretaciones anteriores, Variable | Variable 5 Modelo ent | independiene | CTP PCtaciOn de ‘nivel = nivel y x Ay= Aide nivel = log y Tog) | Ay=(B, /100)%Ax tog nivel | log(y) x Tog —log_|_log(y) Tost) 1.2.3. Estimacion del modelo por minimos cuadrados ordinarios MCO Supongamos que queremos ajustar el modelo de regresién lineal méltiple: Ya f+ BXi+ BXo+ ct BXet € Disponemos de un conjunto de T observaciones para cada una de las variables endégena y exdgenas, Entonces, podremos escribir el modelo de la forma: Ye Pot BXut Xa t ot BXut & 121,23, 047 La aparicién (no necesaria) de un término independiente en el modelo puede interpretarse como la presencia de una primera variable Xo cuyo valor sea siempre 1 El ctiterio de minimos cuadrados ordinarios MCO considera que la funcién que mejor se ajusta a los datos es la que minimiza la varianza del error ¢ lo que es equivalente a minimizar: 1 S(Bo. Boor Bed = D6? =P, ~ Bo + Bir + Bake, +2 + Boxe)? Derivando respecto de los parémetros ff... € igualando a cero tenemos: © MES-Paraninios 7 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS aa S10, As, +B ttamned=0 | [S>=mh AIK ATi 8 3, -Br Ant At + ABN) =O So =ASW ALY AD: BF BD Wey tBeerAaness=0) Br Arad rst ADS Estas ecuaciones forman un sistema denominado sistema de ecuaciones normales, que puede resolverse para ff, ..., & mediante cualquier método apropiado para resolver sistemas de ‘ecuaciones lineales. De esta forma se obtiene la estimaci6n del modelo. 1.2.4 Estimacién MCO del modelo, contrastes e intervalos de confianza a través del calculo matricial Ya sabemos que el modelo lineal de regresién miiltiple puede eseribirse de la forma: + BX BX t ot BXut & La expresién anterior puede representarse en forma matricial como sigue: YY (Xu Xa Xa (Bo Hy |_|1Xp Xn Xe | A YJ Xr Xap Xe Abreviadamente podemos poner: Y= X 8+ € EI primer objetivo del anélisis econométrico es el de obtener estimaciones, es decir, valores numéricos de los coeficientes A, i, fy, .... como funcién de 1a informacién ‘muestral. Estas estimaciones pueden ser también por intervalos, es decir, que podremos calcular intervalos de confianza para los pardmetros. Supongamos que disponemos ya de un vector de estimaciones B de los coeficientes. Podrfamos eseribir: io + BAX, + BX a tt BX, Y= Bot BX yt BX a tA BX CHL Book Los residuos son, por definicién, las diferencias entre los verdaderos valores de la variable ¥, y los valores estimados para ¥,. Es decir, é, ~Y, para todo t. De aquf deducimos que Y = ¥ + é = XB + é , con lo que el modelo original es Y = XB+ € y el modelo estimado ser. ¥ = XB + é. Las estimaciones de los pardmetros pueden calcularse por ‘el método de minimos cuadrados, consistente en minimizar la suma de los cuadrados de los residuos, también Hamada suma residual (SR), cuya expresi6n es la siguiente: Ye Le -¥) 860 ITES-Peranino MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION El valor de las estimaciones de los pardmetros (por mfnimos cuadrados o por maxima verosimilitud) viene dado por la expresién B=(X'X)?X'Y; dichas estimaciones son insesgadas, pues E(B)= B. La matriz de covarianzas de 8 resulta sero? (X'X)"! De los resultados anteriores deducimos que el estimader , de uno cualquiera de los ‘coeficientes 8, tiene como esperanza matemitica fi, y como desviacién tipica el valor o%a,, donde a, ‘es el elemento i-ésimo en la diagonal principal de la matriz o (X'X) *. Luego, bajo la hipétesis de normalidad de los residuos, el estadistico N, sigue una distribueién normal (0,0). El estimador (maximo verosimil y de minimos cuadrados) de o7 es cestimador no es insesgado. Un estimador insesgado de la varianza del error es gee T-k-1 Por otra parte, también se demuestra que el estadistico G=ee/o? sigue una distribucién Chi-cuadrado con T-K-1 grados de libertad, lo cual nos va a permitir calcular intervalos de confianza y contrastes de hipotesis para oy para su cuadrado. Las distribuciones de los estadisticos Ni y G nos evan a la conclusién de que el estadistico N, / [GAT-k-1)]'” es una t de Student con T-k-I grados de libertad, lo que permite sigue una distribucién 1 de Student con T-K-I grados éJa, ‘grados de libertad, Jo cual nos va a permitir hallar intervalos de confianza y contrastes de hipétesis para los pardmetros B del modelo. Se podré contrastar la hip6tesis nula H, de que f= 0 para cada i=12,...,T” de la forma habitual utilizando el estadistico T;; es decir, si Tg es el valor de 7; cuando B= 0, se aceptaré Ia hipstesis Ho al nivel a-cuando Tip Star 1 El intervalo de confianza para al nivel ot vendré dado por 8 ttazr-s1 Ga; (taxr-+-1€ el valor de la abscisa de una t de Student ‘con T-K-1 grados de libertad, que deja a su derecha a/2 de érea). Introdueimos ahora los siguientes conceptos: © Suma total st = Py, -¥)' =Y'¥-17? Yy-T¥" © Suma explicada SE=Y, * © Suma residual SR=Y'(¥, ~¥)? = é4 (concepto ya conocido). La swna total es la varianza muestral de la variable endégena (salvo el factor tamafio muestral), y es por tanto una medida del tamaiio de las fluctuaciones experimentadas por dicha variable alrededor de su valor medio. El objeto fundamental de todo modelo econométrico es ‘tratar de explicar dichas fluctuaciones. Lasuma explicada es el grado de fluctuacién de la variable ¥; alrededor del promedio de Y. Por tanto, la suma explicada es el nivel de fluetuacién de la variable Y; que el modelo es ‘capaz de explicar. Es la variaci6n explicada por los regresores. © MES-Parainios 9 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS La suma residual, ya introducida previamente, es un indicador del nivel de error del ‘modelo en su intento de explicar la evolucién temporal de la variable ¥, Ya sabemos que (Y ~ XBY( - XB)=Y'Y -BYX'Y =¥'Y-¥'Y Luego podemos escribir la igualdad Y'Y =¥'Y + é'é ,y si a los dos miembros de esta igualdad les restamos T ¥ ?, tenemos que: wy TY?)=(P'Y -TY7)+ 22,0 sea, ST = SE + SR. Luego se tiene: Suma total = suma explicada + suma residual A estos tres términos se les Hama Suma de euadrados. ‘A cada suma de cuadrados dividida por sus grados de libertad se le Hama cuadrado medio. Bajo la hipstesis de normalidad de los residuos, SE se distribuye segin una Chi-cuadrado con k ‘grados de libertad, SR segdin una Chi-cuadrado con T-K-1 grados de libertad, y ST segéin una Chi- ‘euadrado con n=I grados de libertad. Por tanto el Cuadrado Medio explicado por el modelo ser CM(E) = SEZ, y el Cuadrado Medio residual sera CM(R) = SRAT-k-1). Se define el coeficiente de determinacién (R°) como una medida descriptiva del ajuste ‘global del modelo cuyo valor es el cociente entre la variabilidad explicada (o suma explicada) y la variabilidad total (0 suma total), 0 sea, R° = SE/ST = 1 ~SR/ST. ‘Un modelo sera tanto mejor cuanto mayor sea R’, aunque esta afirmaci6n no sea demasiado severa, ya que este coeficiente depende mucho de mievas variables introducidas en el modelo, aunque éstas no empeoren Ia calidad de la regresién. Este problema se arregla sustituyendo este coeficiente por el coeficiente de determinacién comegido, que para muestras grandes ya no va a 0» , 0 sea, para muestras grandes, (T—I)(T-k-1) —> 1 y no. depende de k, que es el ntimero de variables del modelo. Ademés, T > 2° => R* — R°. Ahora ya podemos considerar a R? como una buena medida de la calidad de la regresién. El modelo sera tanto mejor cuanto mayor sea el coeficiente de determinacién corregido R* De las distribuciones de SE y SR, se deduce que el estadistico: SE/k F = ———— tiene una distribucién F(&,T- k-1) de Fisher Snedecor. SRAT-k-l) Pero como 1-R? = SR/ST, podemos poner F de la forma: 1060 ES-Pacannto MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION R’_(r-k-1) F(k,T ~k-1)= « ER) Por tanto el estadistico F nos permitiré hacer contrastes sobre el coeficiente de correlacién, Para el caso de regresi6n simple (k=1) tenemos una F(I,7-2) que equivale a una 1 de Student con 7-2 grados de libertad. (B- By X'X(B-B) El estadistico sigue una distribuci6n F(k,T-K-1). Este estadistico va a permitir hallar regiones de confianza a un nivel de significacion @ para el conjunto de parémetros B, del modelo. Este estadistico también nos va a permitit ccontrastar la hipétesis nula 6; El cuadro del andlisis de la varianza quedaré como sigue: Fuente de Suma de Grados de | Cuadrados variacin cuadrados Libertad __| medios Modelo SE k (CM()=SER residual SR 1 CM(R)=SRAL-F-1) Touat 5 FA El estadfstico més general: (DB - DBy{DEe"x)*D'y*(DB- DB) Ke T también sigue una distribucién F(k,7—k-1) para una matriz, adecuada D. Este estadistico va a permitir realizar contrastes més generales de diversas clases de hipotesis y construir regiones de confianza para los parémetros del modelo y para las predicciones. Para ello basta tomar las formas adecuadas de Ia matriz D. Para contrastar la hipétesis {= f°, (a= By" ...= B’, tomamos: 0 10 = 0)\(A) (B Olen, epp=|o 1 OA) |B) 7p GBIeXG-By om] 1? 00-1 00 NB) Le Para contrastar un subconjunto de parimetros Ais= But”, Aa= Bar’ vB Bur» tomamos = DA~ BVIDX'XY'D’ ene or pardmetros, que pueden escribirse en general de la siguiente forma: © MTES-Paraninfow 11 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS ayy + aby to + OB, = Bi AyB, + dyaby ++ A,B, = By 4B, + 428, ++ A By = Be tomando: ay (DB = DBy(D(X'X)"D(wB - DB) 16 SFr 1.2.5 Consistencia de los estimadores MCO El teorema de Gauss-Markov asegura que en el contexto del modelo de regresién lineal (bajo los supuestos tipicos) los estimadores MCO de los pardmetros fi, f, .. i son los de menor varianza entre los estimadores lineales ¢ insesgados. Ademés, los estimadores MCO, By B,.By.-.By son estimadores consistentes de Ay fi, Bx... Bi Dicho de otra forma, los estimadores MCO fy, A. Ay... son estimadores consistentes de los pardmetros fi, ffi, -- J porque su sesgo tiende a cero cuando el tamaiio ruestral tiende a infinito. 1.3 PREDICCIONES Una de las finalidades del andlisis de los modelos econométricos es hacer predicciones para la variable dependiente, Si estimamos el modelo ¥=XB y obtenemos el modelo estimado 7 = XB, tenemos que el valor ¥, = Xj es un estimador lineal insesgado Sptimo del pronéstico de ¥, para un valor dado X, de X. Se puede predecir la media, E(Y), 0 el valor puntual, Yo. Los errores de prediccién vendrén cuantificados por las varianzas de los predictores. La varianza para la prediccién en media vale 0? XAX'X)"' Xo Un intervalo de confianza para Ia prediccién en media al nivel c vendré dado por la expresiOn ¥y tty, ,(@/2)6YX 9(X'X) 1X", donde t¢r-4-1,(@2) es el valor de la t de Student ‘con T--1 grados de libertad en el punto a/2. La varianza para la prediccén puntual vale o° (Xo(X'X)" Xo'+1), y un intervalo de confianza para la_prediccién puntual vendré dado por la expresién definida como ¥y tty 4 (@/DGY1+ XXX) 'X,", donde tyr-4.1(@2) es el valor de la de Student con T-K-A grados de libertad en el punto 2. 1260 ES Pacaninto MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION 1.4 __ANALISIS DE LOS RESIDUOS Una vez construido el modelo de regresién, tendremos que contrastar entre otras las hipétesis de linealidad, normalidad, homoscedasticidad, no autocorrelacién e independencia, materia que se ampliaré en sucesivos capftulos de la segunda parte de esta obra, Los residuos van a presentar una primera informacién sobre estas hipstesis. Si el histograma de frecuencias de los residuos no se ajusta al de una normal, pueden existir valores atfpicos. Eliminando los pares (X; ¥)) que producen los valores atipicos, se puede conseguir normalidad en los residuos. Si graficamos los valores de ¢ contra los valores de é, (0 sea, si hacemos la grifica ccuyos puntos son los pares (1, é,) y detectamos una tendencia creciente o decreciente en el grafo, puede existir autocorrelacién o correlacién serial Si graficamos los valores de ¥, contra los valores de é, , 0 sea, si hacemos la grifica cuyos puntos son los pares (¥.,2,) y detectamos una tendencia de cualquier tipo en el grafo, puede existir autocorrelaci6n, ya que habré correlacién entre los residuos. También puede haber en este caso heteroscedasticidad, o también falta de linealidad. Si graficamos los valores de Y, contra los valores de é,7, 0 sea, si se hace la grifica ‘cuyos puntos son los pares (¥, ,2,”) y detectamos una tendencia de cualquier tipo en el grafo, puede existir heteroscedasticidad Si graficamos los valores de X, contra los valores de é,, 0 sea, si se hace la grafica cuyos Puntos son los pares (X,, é,) y detectamos una tendencia ereciente o decreciente en el grafo, puede cexistir autocorrelacidn, ya que los residuos no estardn incorrelados con las variables explicativas ‘También puede haber heteroscedasticidad, o falta de linealidad. sgraficamos los valores de X, contra los valores de é,?, 0 sea, ¢ hace la gréfica ‘cuyos puntos son los pares (X,, é,”) y detectamos cualquier tendencia en el grafo, puede existir heteroscedasticidad o falta de linealidad (habré relacién entre la varianza del término del error y las variables explicativas) Estos andlisis pueden realizarse también utilizando residuos estandarizados 0 residuos cestudentizados, que suelen ser més efectivos para detectar deficiencias en el modelo. Los residuos estudentizados, cuya distribucién es una f de Student con T-k-2 grados de libertad, se usan también para detectar valores atfpicos en los residuos (a normalidad de los residuos o de la mala especificacién del modelo) Un contraste muy importante para detectar la autocorrelacién es el contraste de Durbin-Watson, segiin el cual el estadistico: de-2, nos permite adoptar la regla no demasiado rigurosa de que si d vale 0 hay autocorrelacién perfecta positiva; si d se aproxima a 2 no hay autocorrelacién, y si d se aproxima a 4 hay autocorrelacién perfecta negativa. No obstante, d se encuentra tabulado, y segtin la franja en la que caiga su valor, se acepta 0 rechaza la hipotesis de autocorrelacién © TES Paranintow 18 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Si la matriz X°X tiene determinante cero, no podré calcularse su inversa (ni podrén hacerse Jas estimaciones de los parémetros), en cuyo caso hay multicolinealidad. Este problema suele resolverse sustituyendo las variables del modelo por un conjunto grande de sus componentes principales para hacer de nuevo la regresién, pero esta vez. con las componentes principales como variables independientes del modelo. La multicolinealidad también puede abordarse mediante la matriz. de correlaciones de las variables independientes, ya que las variables con correlacin alta pueden ser candidatas a provocar multicolinealidad, problema que puede ntentar solucionarse eliminando una de las variables fuertemente correlacionadas, siempre que dicha variable no sea relevante. PROBLEMAS 1.1. Una empresa desea estimar la demanda de sus productos D, en funcién del precio de los mismos P,, para lo cual dispone de los datos de ambas variables en los iltimos 120 meses. La ‘empresa utiliza los siguientes modelos: D D= + oP +6, 2) LogD, = By + BlLogh, + 5, 3) Log, = My + MR +0, 4) D.=Yo+ HLogR, +0, Se pide: 1. (Cuil es el signo esperado del coeficiente a; del primer modelo? 2. Interpretar econémica y matematicamente los coeficientes % y a 3. Interpretar el significado econémico de los coeficientes A. i y / 4, {Cémo se pueden obtener las elasticidades precio de 1a demanda en cada modelo a partir de a, A fy 1? SOLUCION 1, Lo légico seria que Ja demanda de productos disminuya al aumentar su precio, con lo que el signo del coeficiente «i del primer modelo debe de ser negativo 2. Enel modelo D, =a) +a,P+¢,, el coeficiente a es Ia derivada parcial de la cantidad demandada respecto al precio: Entonces el coeficiente a} econémicamente mide cuantas unidades variaré Ia cantidad demandada cuando el precio se incrementa en una unidad. El coeficiente 0 medirfa Ia demanda prevista a precio nulo, lo que en este caso carece de significado. 1400 TES Pacaninto MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Para Interpretar 8; en el modelo LogD, = fy + B.LogP, +6, derivamos como sigue: ALogb, _ ALogD, ALogP, ALogP, Podemos entonces interpretar 3; como la elasticidad precio de la demanda, Por lo tanto, cuando Jos precios crecen un 1%, Ia demanda lo haré un £,%. Entonces el coeficiente oj econémicamente mide cuantas unidades variaré la cantidad demandada cuando el precio se inerementa en una unidad Para interpretar /4; en el modelo LogD, = fy + [4,P, + 0, derivamos como sigue AD, @LogD, _ALogD, _D, __AD, 1 OP, AP, AP, D,AP, ‘que es una semielasticidad, Por Io tanto, cuando los precios erecen un 1%, Ja demand lo hard un Hil Para interpretar 44; en el modelo LogD, = Uy + u4,P, + v, derivamos como sigue: AD, ALogD, _ALogb, __D, 1 OP, AP, AP, D,AP, ‘que es una semielasticidad, Por Io tanto, cuando los precios erecen un 1%, Ja demand lo hard un Hil Para interpretar 7, en el modelo D, = ¥y + 7;LogP, + @, derivamos como sigue: ap, AD, , , Pp OLogP, ALogh, AP, AP, * ?, n Por lo tanto, cuando los precios crecen un 1%, la demanda variaré 7 unidades. La elasticidad precio de la funcién de demanda es: Luego tenemos: © TES Paranintow 15 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS aD, atogb, P, ~ dLogD,' OP, D, 1 Wogd, aD, 3) 4) D, Formular y comentar el modelo adecuado cuando se trata de estudiar 1a evolucién de la cantidad demandada de un activo financiero F por un agente a lo largo de 36 meses en funcién de su rendimiento I, del riesgo que conlleva R y de la renta del agente ¥. {Qué modelo seria el adecuado para estudiar Ia variacién de Ia cantidad de demanda del activo financiero por 50 agentes distintos a lo largo de 36 meses en funcidn del rendimiento del activo, el riesgo que conlleva y la renta de cada agente? Formular y comentar el modelo adecuado para estudiar los gastos en publicidad G de las empresas de un determinado sector en funcién del volumen de sus ventas Vy del niimero se sucursales S, sabiendo que se dispone de datos recogidos a 31 de diciembre sobre 100 empresas distintas. SOLUCION: En el primer caso, la variable dependiente es la demanda del activo financiero F, que depende del rendimiento del activo financiero 1, de si riesgo R vy de Ta renta del agente Y. Como la evolucién de la demanda viene recogida a lo largo de 36 meses para un agente, estarfamos ante un caso de modelo de series temporales, cuya modelizacién seria: F =A Pl +R +BY, +8, 2,036 En el segundo caso tenemos datos de la evolucién de la demanda de activos financieros para 50 agentes distintos recogidos a lo largo de 36 meses. El modelo adecuado sera un modelo de datos de panel, que se formularia como sigue: Bit Bal + Bay + BM e+ Ey 112036 7 En el tercer caso estarfamos ante un modelo con datos de seccién cruzada ya que han sido recogidos en un mismo momento del tiempo para las 100 empresas que componen la ‘muestra utilizada para el estudio de los gastos en publicidad. El modelo serfa el siguiente: G,=B,+ BV, + BS, +e, i= 1,100 1660 ITES-Pacaninto MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION En un estudio para aumentar Ia supervivencia (variable y en tanto por ciento) de determinada clase de plantas se utilizan concentraciones de tres productos diferentes (variables xi, % y Xs en gramos), Para distintos valores de las variables x;, x2 y x3 se obtienen los siguientes porcentajes de aumento de la supervivencia: yoy BS_U7s 5301080 312 632 542 9.40 259 622 841 7.20 38.4 1052 463 8,50 184 119 11,60 9,40 267 122 585 9,90 264 410 662 8,00 259 632 872 9.10 32,0 408 442 8,70 25,2 415 7,60 9,20 39,7 1015 483 9,40 35,7 472 312 7,60 265 170 530 8,20 Ajustar los datos a un modelo de regresi6n lineal miltiple que explique el porcentaje de aumento de Ia supervivencia en funcin de las concentraciones de los tres productos que inciden sobre la supervivencia de las plantas. Realizar la estimacién de la varianza. Construir un intervalo de confianza al 95% para la respuesta media cuando x= 3, x= 8 y xs= 9. Construir también un interval de prediccién al 95% para una respuesta individual del porcentaje de supervivencia cuando x\=3, x= 8 y x =9. Realizar el contraste de hipétesis by = -2,5 contra by > -25 para a= 0,05. Caleular el coeficiente de determinacién R’ y realizar también el contraste de significacién conjunta de la regresién y el contraste de significatividad individual parémetro a pardmetro. SOLUCION: Realizaremos el ajuste del modelo Y = XB + u por la via matricial. Para ello ‘comenzamos considerando las matrices 1 174 530 1080) 255 1 632 542 9.40 312 1 622 841 7,20 259 1 1052 463 8,50 384 1 119 11,60 9,40 184 1 122 585 9,90 X=|1 410 662 8,00 1 632 872 910 259 1 408 442 8,70 320 1 415 7,60 9,20 25.2 1 1015 483 9,40 397 1172 312 7,60 357 1 170 530 8,20 265 (© MTES-Paranintow 17 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Los pardmetros estimados serén: 8,0648 = 0,0826 -0,0942 ~0,7905)( 3775 39,1574 A i =0,0826 0,0085 0.0017 _0,0037 || 1877,567]_| 1.0161 B=(x'x)'xX'Y = = =0,0942 00017 0,016 + -0,0021 || 2246,661| | -1,8616 -0,7905 0,037 -0,0021 0.0886 )| 337,78) \-0,3433, Por tanto tenemos: by = 39,1574, 6, =10161, b, 1.8616, b, = -0,3433 Por tanto, el modelo de regresi6n lineal miltiple ajustado seré $=39,1574 + L061x, -18616x, ~ 0.34331, El estimador de la varianza residual vendré dado por la expresién: a (¥-xBy — XB) _'Y -(xByY T-k-1 13-3-1 9 =4,298 No olvidemos que las matrices ¥,X y B son ya con: s Un intervalo de confianza para la respuesta media vendra dado por: Botta; Fyro(X'X) "Xo Para nuestros datos tenemos: So = 39.1574 + 1,061(3) ~1,8616(8) - 0,3433(9) = 24,2232 8,0648 -0,0826 -0,0942 ~0,7905 =0,0826 0,0085 0,017 0,0037 =0,0942 0.0017 0,0166 -0,0021 =0,7905 0,037 -0,0021 0,0886 (XX) =0,1267 3.8 9) Caw ‘Como tons = 2,262 para T-k- = 13-3- So ttg Oy x(X'X) 7X = 24,22+ (2,262)(2,073) 0.1267 = [22,5541 25,8923] Un intervalo de confianza de prediccién para una respuesta individual cuando 21= 3, x2 =8 y.x5=9 vendra dado por: By HtasaGYlt xq(X'X) xy = 24,2232 4 (2,262)(2,073)of1.1267 = [19,2459 29,2005] Se observa que el intervalo de prediccién es bastante més ancho que el intervalo de confianza para el porcentaje de supervivencia media. grados de libertad, tenemos: 1860 ITES-Pacaninto MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Para realizar el contraste de hipotesis by estadistico: 2,5 contra by > -2,5 para or= 0,05 utilizamos el 5) _ -18616-(-2,5) 2,073y/0.0166 04 < 0,05, se rechaza Ia hipstesis b; 2,391 Como el p-valor es P(T? > 2,391) = acepta by > -2,5 al 95% de confianza. Sy se Para calcular el coeficiente de determinacién utilizamos la expresién: 5,-57 SE ZO pyre _expyy-17* _ 80.45 sr ig <> VY-1T¥? YY-TY? — 43813 Yo, -7 9117 Este resultado significa que el 91,17% de la variacién en el porcentaje de supervivencia de las plantas se explica con nuestro modelo de regresi6n lineal. Para contrastar Ia significatividad conjunta de los pardmetros del modelo, es decir, by = b, = b, = b, = 0, utilizamos el estadistico: Elk ke 39. SRIT=k-1) = RT 0,975 Fires ED G-O91T) 3-3-4383 ‘Como el p-valor P(F 39 > 30,975) = conjunta del modelo, ,0001 < 0,005 se concluye la significatividad Para contrastar Ia significatividad individual del modelo (pardmetro a parémetro), es decir, 6, para cada parémetro: Los valores de 7; resultan ser 6,651, 5,323, -6,964 y -0,556. Sus p-valores asociados Ply > T)) resultan ser 0,001, 0,0005, 0,0001 y 0,5916. El tinico coeficiente con problemas de significatividad al 95% es bs, que resulta significativo a partir del 94%. Es préctica habitual presentar los resultados del ajuste comenzando con el cuadro del andlisis de la varianza: Puenie ‘Suma de cuadrados Grados Cuadrados medion F Modelo SE=¥¥ -T¥" XY -TY?* k Residual sR = iri =(y - XBYY -XB)=V'Y-PyY F-k-1 Toral ST=yy-1¥? re © ITES-Paranintow 19 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Que para nuestros datos ha resultado ser el siguiente: Fuente Sumade cuadrados Grados Cuadrados medion _F ___p—valor Modelo SE=SASST 3 CME=TSBISIG oe Scan Residual SR=38.6764 9 CMR = 4.29738 Total ST=43813077 ‘12 RT =09117 EI R’ es muy bueno y el modelo es significativo globalmente ya que el p-valor del ccontraste de la F es menor que 0,05, La presentaci6n habitual de los resultados del ajuste también conlleva un cuadro con Jos valores de los parmetros estimados, el valor de Ia 1 de Student para su significatividad individual y los p-valores asociados, En nuestro caso tenemos: Variable Pardmetro Valor delaT _p-valor Constante 3915735 —-6,651__—_0,0001 x 10161 5323 0.0005, x - 1861649 -6964 0,001 % 0.34326 0.556 0.5916 De esta forma se observan répidamente las estimaciones de los parimetros del modelo y su significatividad individual. El trabajo relativo a este problema puede automatizarse con el software econométrico Eviews introduciendo los datos en un fichero de trabajo (1-3.wk/), cargéndolo en el programa usando File > Open ~ Eviews Workfile...(Figura 1-1) y eligiendo el fichero en la ventana Open (Figura 1-2). Al pulsar Abrir se carga en memoria el fichero. Si queremos ver el contenido del ‘conjunto de datos bastard con seleccionar todas las variables del modo habitual en Windows, hacer clic con el botén derecho del rat6n sobre la seleccién y elegir Open — As Group (Figura 1-3). Se ve asf el contenido de todas las variables del modelo como un grupo (Figura 1-4). Para realizar la regresién, se elige Quick —> Estimate Equation (Figura 1-5), se escribe Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method (para ajustar por minimos ‘cuadrados) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 1-6. tem [Srome ____s] + meh Wace Hibctowi Same lor iSimecst lst slarmross lor, Sona Simi Sor Sweat Swen fac ean pata rn Been fon Sood Pets. tome fT =] x Se feeewcntan al ee teeta ten Figura [-1 Figura 1-2 2068 ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION Sejreiansonelerdsens_|Peloe| pte even = brn oe oan] roy Fee sadpeot_ 7 7]? 2 se a] 3) ie ie oe) so 6 ee [7 | 9 =| 8 | tp a co rL) | oe | tet ao] |e a a [ne Figura 4 Fn) ES [eelenoa fon 13 = ate ‘ty Fe Samii 3 = fas a Been Ba a2 er ces) Ewe nanny fn Sonata ose Eahnrarctcsin ‘eee ny ng erg ‘naFoC noe OF neces enone Ree Neod|Es~ ee See US sl ef © MTES-Paraninfos 21 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS ero Dependent Vana: Nato. Leet Saoxes Sate mor me 1250 Sani 113 Incledeasevaian: 19 [veri Yectoeransoona cre ‘ficient Std. Ener em E easter cw Sarin os) 4 £5573 ci) Da Resquared (911724 Mean dependent var Aavsted Roques 0622200 SO vopendentvar 6005 SE oftegrcsion 2.073012 Akaike ino citeron 4 543512 Sum squared resid SBG7EAD) Schwarzcntenon 4717373, Log tthe’ PSE? Dubin'Watson stat 1587590 Palace oearenas [Some (Wem 1S Figura 1? Observamos que las estimaciones de los pardmetros (Coefficient), los valores del estadistico T (t-Statistic) y los p-valores (Prob) obtenidos a través de Eviews coinciden con los obtenidos realizando los célculos directamente, pero la salida de Eviews es més rica. La columna Std, Error recoge la desviacién tipica estimada de los pardmetros del modelo y puede utilizarse para el célculo de intervalos de confianza de los pardmetros estimados a un nivel (Coefficient * tan res Std. Error). Como el valor de la t de Student tooas = 2,262 para T-k-1 1-3-1 = 9 grados de libertad, tenemos que los intervalos de confianza al 95% para los pardmetros estimados serén: 39,15735 + 2,262(5,887060) 1,016100 + 2,262(0,190895) =1,86164 + 2,262(0,267325) -0,34266 + 2,262(0,617052) EL R? ajustado vale 0,88 (indicativo de un buen ajuste al ser muy alto), el error estindar de la regresidn (S.E. of regresién) es bajo y estima Ia desviaci6n tipica del error (su cuadrado es la varianza residual estimada 6?= 4,29). Los valores bajos de los criterios de informaci6n de Akaike y Schwarz indican que el modelo es bueno. El valor del estadistico de Durbin Watson, no demasiado alejado de 2, indica que los problemas de autocorretacién no son relevantes, La suma de los errores al cuadrado (Sum squared resid) es el valor de la funcién objetivo en el minimo cuando estimamos por mfnimos cuadrados ordinarios, El logaritmo de la funci6n de verosimilitud (Log likelihood) es el valor de 1a funcién objetivo en el maximo cuando se estima por méxima verosimilitud. Las caracteristicas bisicas de la variable dependiente vienen recogias por su media (Mean dependent var) y su cuasi desviacién tipica muestral (S.D. dependent var) La ecuacién del modelo definitivo ajustado es: ¥ = 39,15 +1,016Xi-1,86X2-0,34 Xs 2268 ITES Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION La opeién View —> Representations (Figura 1-8) ofrece la ecuacién del modelo cestimado (Figura 1-9). Pe petro — inaten Egon Figura 1-8 Figura 9 Al interpretar esta salida vemos que un aumento unitario en la concentracién del primer producto produce un aumento de 1,016 unidades de la variable Y, es decir, un aumento de un 1,016% en la variable ¥ por venir esta titima dada en tanto por ciento. De igual forma, un aumento unitario en la concentracién del segundo producto produce un descenso de 1,86 unidades de la variable Y, es decir, un descenso de un 1,86% en a variable Y. Por ultimo, un aumento unitario en la concentracién del tercer producto produce un descenso del 0,34% en la variable ¥. En cuanto a la constante, podria interpretarse diciendo que para valores nulos de las concentraciones de los tres productos, el porcentaje de supervivencia de las plantas es del 39,15%, es decir, las plantas sobreviven casi con un 40% de probabilidad aunque no se le apliquen determinadas concentraciones de los tres productos. La constante juega aqui el papel de una cota fija de supervivencia de las plantas independiente de la aplicacién 0 no de las correspondientes concentraciones de los tres productos. El software Eviews permite calcular directamente la significatividad conjunta de los pardmetros estimados del modelo a través del p-valor del contraste de la F siempre y cuando se introduzca Ia ecuacién que define el modelo (pantalla Equation Estimation) tal y como se a en la Figura 1-10 (en lugar de lo indicado en la Figura 1-6). Al pulsar Aceptar, se obtiene Ja Figura 1-11. Se observa un p-valor de la F muy pequeiio (0.000045), Io que indica Ja aceptacién de la hipstesis de Ia significatividad conjunta de todos los parémetros del modelo (pueden considerarse todos los pardmetros del modelo significativamente distintos de cero simulténeamente con una probabilidad muy alta), La significatividad individual de cada pardmetro se analiza a través de los p-valores de la columna Prob en la Figura 1-11 (0 en Ia Figura 1-7), Se ve que todos los parémetros estimados son fuertemente significativos individualmente (distintos de cero) por tener p- valores muy pequefios, salvo el parimetro de la variable Xs, que presenta una baja significatividad del 41% (p-valor = 0,59). Este hecho podria Ilevarnos a eliminar esta variable del modelo. © MES Paranintos 28 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS unto Eta cee +N aoe Pleo ere nt er ee Eatin teeter eos eS oT sowe Figura 10 Figuea t-11 Eviews también permite contrastar restricciones en los pardmetros a partir del Contraste de Wald mediante View — Coefficient Tests» Wald-Coefficient Restrictions (Figura 1-12), Rellenando la pantalla Wald Test como se indica en la Figura 1-13 se contrasta la significatividad cconjunta de los parémetros estimados por esta via (alternativa al test de la F). En la Figura 1-14 se “observa el rechazo de la mulidad simulténea de los parémetros porque el p-valor es muy pequefio, es decir, se acepta Ia significatividad conjunta de los parémetros del modelo. Por otta parte, si rellenamos la pantalla Wald test como se indica en la Figura 1-14, al pulsar Aceprar se obtiene la Figura 1-16, cuyo p-valor pequefio indica el rechazo de la hipétesis by = 2.5 Bethe ~ Cocfiient oatitions separated bp conmat CFoeceaCIA ajatted Raa Enereples: Heer Ee SE BS | eit tow Figuea 1 2 Figoa es re Ecce Utd = Costicient restrictions separated by commas eat a a ea i Evans Sei tanrse Cor}0, Cra-20H8) Figara 1-14 Figura t-15 24 6.© ITES Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION Fine ens neiarl race eon vets eG van Figure P16 Para caleular predicciones (una en nuestro caso), nos situamos en la pantalla Workfile y elegimos Proc — Siructure/Resize Current Page (Figura 1-17) para ampliar el tamafio de Ta muestra hasta el valor 14 (Figura 1-18). Al pulsar OK se obtiene el aviso de la Figura 1-19 indicativo de la insereién de una nueva observacién en la muestra (que de momento no tiene valores), Si es necesario, con Proc —» Set Sample... se amplfa el tamafo de la muestra a 14, La siguiente tarea es introducir los valores de X;, Xz y Xs para los que se obtendré ta prediccién Para ello seleccionamos como grupo las tres variables eligiendo Open —» as Group en el ment emergente obtenido al hacer clic con el bot6n derecho del ratén sobe las tres variables seleccionadas simulténeamente (Figura 1-20). A continuacién, en la pantalla Group se pulsa en Edit y se introducen los tres valores ee las variables (Figura 1-21). La tarea siguiente es elegir Proc — Forecast en la pantalla Equation (Figura 1-22) y rellenar la pantalla Forecast como se indica en la Figura 1-23 (El vector Y¥f contiene las predicciones y SEf sus errores esténdar). Al pulsar OK aparecen los dos vectores en la pantalla Workfile (Figura 1-24). or oe a te [——— Ce] cea _| Figura 1-17 Figura 1-18 ESI] og 2 nae ST Figura 1-19 Figara 1-20 © MES Paranintow 25 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS fstrslves| pees rate seen exits is 1 T os ae ‘Sener nares Metbos a: — =. ay eel |B Ss Becet a (22 a EB Ee E Feces wee pea et — Tigura FE Tigra -S¥ Al hacer clic sobre yf en la Figura 1-24 se obtiene la Figura 1-25, cuyo tltimo valor es la prediccién de la variable dependiente pedida (24,2311). Si se hace clic sobte sef, se obtiene la Figura 1-26, cuyo tiltimo valor es el error estdndar de la prediccién (2,209586), que se utilizaré para calcular el intervalo de confianza para la prediccién individual (Eviews no calcula el intervalo de confianza para la prediccién en media), | a eae PSOE a =I Ma ainrencn a Figura 1-25 Figura 1-26 Como fos = 2.262 para 7-k- = 13-3-1 = 9 grados de libertad, un intervalo de confianza de prediccién para una respuesta individual cuando 8 y.x5=9 vendrd dado por: Ja thy gOyl + xg XY x, = 24,2231 + (2,262)(2,209586) =[19.2 29,2] 26 © ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION Una vez estimado un modelo es muy convenirte realizar un andlisis de los residues para detectar posibles anomalfas, Para ello, en la pantalla Equation, se utilizan las opeiones de Actual, Fitted, Residual del ment View (Figura 1-27). La subopeién Actual, Fitted, Residual Table ofrece los resultados de la Figura 1-28. Se obtienen los valores de la variable endégena ‘observados Y, y estimados Y, y el valor de los residuos. El gréfico de los residuos presenta dos ineas discontinuas situados a una distancia de +25 de la Iinea central continua, siendo S el error estindar de la regresién (estimador de la desviacidn tipica del error). Estas bandas permiten detectar In presencia de residuos significativamente distintos de cero (atipicos). En iuestro caso los residuos niimeros 5, 11 y 12 se salen de las bandas (aunque no demasiado), lo ‘que puede indicar que son atipicos. La subopeién Actual, Fitted, Residual Graph muestra el ‘gréfico de Ia Figura 1-29 que representa los residuos en el eje de ordenadas de Ia izquierda y los valores de la variable endégena observados y estimados en el eje de ordenadas de Ta derecha. De esta forma, en la parte superior del grifico aparecen las grificas de los valores de Ja variable endégena observados y estimados, que han de coineidir lo més posible. En la parte inferior aparece el grifico de los residuos con las bandas +25, que coincide con el grafico de la Figura 1-28. Este grafico ha de ser lo més aleatorio posible sin comportamiento sistemético de ningéin tipo para evitar In existencia de algiin error de especificacién en el modelo o la presencia de otros problemas como a autocorrelacidn. La opcisn Residual Graph de la Figura 1-27 presenta solamente el grifico de los residuos y la opcin Standardized Residual Graph presenta el grafico de los residuos estandarizados (Figura 1-30). No se observan problemas de ‘comportamiento sistemitico residual por lo que puede suponerse aleatoriedad de los residuos. Los posibles valores atipicos pueden venir originados por la presencia de una variable poco significativa en el modelo (Xs). eer a enone) a erel tec) enna] te] scree be | aes | Fee [Bosal] —— Renae Seenecormee +] tease Zn 2x0 Sateen 7] am 7305 Ae Simm B81 0 ane Lg asam0 sz aa semana mune [3] oxo ose Bom Bos sm 23% Figura 1-27 Figura 1-25 Figura 130 (© MES Paranintow 27 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS > 1.4. Consideramos el modelo y, a+ Bix, + Boss uy los siguientes datos para su ajuste: Estimar el modelo y la varianza residual y calcular Jos coeficientes de determinacién y de determinacién corregido, Realizar también los contrastes de hipstesis: A= (contraste de significatividad conjunta de los parémetros del modelo), £.=(=0, £.=10f,, 2A+28+78=50, (B=10f,, 2f+28+7=50). SOLUCION: Realizaremos este ajuste por la via matricial. Para ello comenzamos considerando las matrices: 28 +8 ITES-Paraninto 11 0 13-1 1400 xi St 17-1 18 0 110 -1 110 2 Los pariimetros estimados serén: 8 48 0)'/ 368 ba(x'x)'xy=|4s 364 5] [270 o s 8) | 35 Por tanto tenemos: 7 n 2887-384 240) 6,47 <1 |-384 64 -40/] 6,588 664 240-40 608 )\0.257 0257 Por tanto, el modelo de regresi6n lineal miltiple ajustado seré 47 + 6,588x, +0,257., El estimador de la varianza residual vendré dado por la expresi6n: MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION (— xBy XB) _ V'Y-(xBYY 1B-3- 9 18,513 No olvidemos que las matrices ¥, X y B son ya cono« Para calcular el coeficiente de determinacién utilizamos la expresin: se LON py rp oxpyy 12 ST PY-TF? 3408 33153024 _ st - Lorw =09728 Este resultado significa que el 97,28% de la variacién en Ia variable dependiente se explica con nuestro modelo de regresisn lineal, El coeficiente de determinacién corregido se calcula como sigue: 0962 Para contrastar la significatividad conjunta de los pardmetros del modelo, es decir, y= B, = B; = 0 ulilizamos el estadistic tk Rik 9728/2 SRT =k=1) 0=R)T=k=1) 0-0.9728)8-2-) Fars 9,411 Como el p-valor PCF 35 > 89.411) = 0,00009 < 0,005 se concluye Ia significatividad conjunta del modelo, También puede observarse en las tablas de la F que F 903,38 = 5.41 < 89.41, lo que nos lleva a la aceptacién de a significatividad conjunta del modelo (rechazo de & } Para contrastar la hipstesis nula aque en este caso es: = 0 usamos la forma adecuada de la matriz D, 1} ya que: La hipstesis nula es a 0 4 }-(): y el estadistico del contraste sera: © MES Paranintow 28 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Saale yo} (4 pb, = DB= OD XDI DB= Or _ ve iv donde V" es el elemento que ocupa la fila i y la columna j en la matriz (X'X)"! Sustituyendo tenemos: esis o2s7) {4 40) "(ssi 2 4664\-40 608} (0,257, Fs e = 89,558 Como F 99525 = 5,79 < 89,558 se rechaza la hipstesis nula al 95%. Para contrastar la hipstesis nula f,-10/;= 0 usamos la forma adecuada de la matriz D, que en este caso es: p=(0 1 -10) ya que: Bo pp=(0 1 -10)) 6, |=#,-199, Bs El estadistico del contraste sera: vt yt pry oy! (-10A,)}(0 1-10] v2 y= ye |] a |] -20, vv ve }l-10 donde V/s el elemento que ocupa la fila y la colunma j en la matriz (XX) Sustituyendo tenemos: (6588-000, 2887-384 240) 0 )]" e}(o 1 -15 =384 64-40] 1 240-40 608 }{-10 0.066 é Como F goss = 13,071 > 0,066 se acepta la hipétesis nula al 95%. Para contrastar la hipstesis nula 2/4 + 2, + 7 = 50 usamos la forma adecuada de Ia matriz, D, que en este €aso es: D=@ 2 7) 90+ © ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION ya que DB=(2 2 1)) B |=28. +28, +78, B: El estadistico del contraste seré: (DB - 50y(D.X'X)"D'T" (Dp - 50) F, “as 7 785 Como F 9951.5 = 13,071 > 2,785 se acepta la hipétesis nula al 95%. B,-10f, =0 rencontre 4 88 Ia matriz, D adecuada es: 0 TG) oF pf? 1-10 b, “lo 20 7 JP lop, +28,+76. El estadistico del contraste sera: (OB - DBY(D(X'Xy" DT (DB - Dpyir Para los datos de nuestro problema tenemos: ata) es) 2887 -384 240\( 0 2)]" le at fPae a 20] 2) oe 240-40 608 /|-10 7 6470 d(° © 2°) esas]-(° 227 so) [> 0.287, 5.038 Como F 90525 = 5.79 < 6,038 se rechaza la hipétesis nula al 95%. Para resolver este problema con Eviews, se carga el fichero de trabajo (1-4.wk7) usando File > Open —» Eviews Workfile... y se elige Quick —» Estimate Equation (Figura 1-31). Se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar (Figura 1-32). Se obtienen los resultados de la Figura 1-33. Se observa {que Ia constante tiene una significatividad inferior al 90% (es distinta de cero al 90% de confianza), el coeficiente de X; es muy significativamente distinto de cero (p-valor muy equefio) y el coeficiente de X» no es significativamente distinto de cero (p-valor muy alto). El R’y el R’ ajustado son 0,973 y 0,962 respectivamente (muy altos). © MES Paraninfo« 31 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS Figura 1-31 patra Figura 1-32 Figura 1-33 Para realizar los contrastes de restricciones sobre los coeficientes se utiliza View—> Coefficient Tests—> Wald-Coefficient Restrictions (Figura 1-34) y se rellenan las pantallas de entrada ‘como se indica en las Figuras 1-35, 1-37, 1-39 y 1-41. El p-valor (Probability) pequefio de la figura 1-36 muestra el rechazo de Ia hipotesis =; = 0. El p-valor muy alto de Ia Figura 1-38 indica la aceptacién de la hipstesis 4-10, = 0. El p-valor de la Figura 1-40 indica que se rechaza la hipétesis 50 al 85% de confianza, El p-valor de la Figura 1-42. muestra que se rechaza la -y 28+ 2B + 78.= 50 simulténeamente al 95% de confianza. Seared + Sy TTT Figura 1-34 9268 ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION Coticint resins sepatated by commas i Examples on-0, caHece aK Loree! Figura 135 Figura 136 Caro a CCoaticient esictons separated by commas poh Percee pee ee ee Examples cmd, cower ea Figura 1 37 Ceatficint esttionssanaated by comenas eciecierrciaeso [restate Veta Pea ac BRT Fee Pee Saas CoO, os-2018) ox Gareel Figura 1-39 Figura 40 fron Confit esticionssapaaled by comenas amples E meen Sats Tie Op, Rec) [Sees smiaee nce Figura (Hi Figura 1-42 El contraste A=.=/5=0 de significatividad conjunta de todos los pardmetros del modelo puede obtenerse directamente si se rellena la pantalla Equation Estimation como se indica en la Figura 1-43 (en lugar de la Figura 1-32). Al pulsar Aceptar se obtiene la Figura 1-44, que presenta ‘un p-valor para la F muy pequeito (Pob(F-statistc) = 0,000119), lo que nos eva a aceptar la hip6tesis de significatividad conjunta de los parémeros del modelo con probabilidad muy alta © MES Paranintos 38 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS Sots piel epnser vale Soe ]] 5s exon = Figura 143 Figura 144 ‘Como Ia variable X, resulta no significativa individualmente en el modelo (p-valor muy alto), la excluiremos utilizando la opeién Proc — Specifi/Estimate (Figura 1-45) y y rellenando la pantalla Equation Estimation sin la variable Xo (Figura 1-46). Al hacer clic en Aceptar se obtiene la estimacién del modelo (Figura 1-47). Ahora la constante es significativa al 98% (p-valor de 0,08) y la variable X; es muy significativa (p-valor muy pequefio). La significatividad conjunta de los parémetros del modelo también es muy alta (p-valor de la F muy pequefio), Se observa que las significatividades y el estadistico de Durbin Watson (més cercano a 2) han mejorado. La opcién View — Representations muestra el modelo estimado (Figura 1-48), Se observa que el aumento de ‘una unidad en X; provoca un aumento de 6,6 unidades en ¥. Secaeeae Posie ee tune) uanenencSaesed ete eet Seer Bie teams pe |lYeemnscara cite’ Stee Sincecawis” £6019 Figura 1-47 Figura 1-48 94 6© ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENCIA Y PREDICCION > La produccién de la mineria espafiola entre los aiios 1969 y 1984 expresada en unidades monetarias constantes de 1984 toma los valores X, de la tabla adjunta, El empleo del factor trabajo ‘en la produccién se expresa mediante la variable W, que cuantifica los millones de horas/hombre trabajadas. Para medir el stock de capital o riqueza se utiliza la variable C, que representa la potencia instalada en miles de caballos de vapor. x WC, 1792 1935 1141 181.0 1828 1241 1831 17171357 1849 16341465 1858 1433. 1562 2208 1404 1742 2388 1416 1954 IAL 1386 2141 242.5 1454 2352 240.7 128, 2399 2485 1264 2557 3121 149.2. 2680 347.3 1459. 2899 366.2 1445 3082 4247 139.7 3062 4049 13183052 Se trata de estimar las elasticidades del trabajo y el capital respecto de Ia produccién de nuestra industria minera en el periodo 1964-84 considerando como modelo la funcién de produccién de Cobb-Douglas SOLUCION: El modelo de Cobb-Douglas seré: X,= kW.°C" Como se trata de un modelo no lineal, aplicamos logaritmos para transformarlo en el modelo lineal siguiente: LogX, = Logk+aLogW+bLogC+ Para resolver este problema con Eviews, se carga el fichero de trabajo (1-5.wk1) usando File > Open — Eviews Workfile... y se elige Quick — Estimate Equation (Figura 1-49). Se escribe Ja ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method (para ajustar por mfnimos euadrados) y se hace clic en Aceptar (Figura 1-50) Se obtienen los resultados de Ia Figura 1-51. Se observa que todos los parémetros estimados (incluida Ia constante) son significativamente distintos de cero (p-valores muy Pequefios que indican una significatividad del 99% para el parimetro de W,, y superior para los demas). El R’ y el R” ajustado son 0,91 y 0,9 respectivamente (muy altos). © MES Paranintow 35 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS [revnaionen rele omer Pines cea] neuro nfs tex] “te a Figura 1-49 “ Sees oatore pn oaa soem Figura 1-50 Figura 1-51 EI modelo estimado es el siguiente: LogX, = -7.2940,94LogWe+ 1,06LogC, ‘que puede escribirse de la forma: 0006817, +c, Como el modelo ha sido estimado con todas las variables en logaritmos, podemos interpretar Jos pardmetros estimados en términos de elasticidades. Asf, Ia elasticidad trabajo- producto se ha estimado en 0,94, lo que indica que si se inerementa el empleo de la minerfa en un 1%, la produccién cae algo menos del 1% (0,94%). Ademés, la elasticidad capital-producto es algo superior a Ia unidad (1,06), lo que indica que incrementos del capital (potencia instalada) del 1% _generan incrementos productivos superiores a ese porcentaje (1,06%). ‘Se observa que el R’ y el R” ajustados son muy altos explicando las variables exgenas mas de ‘un 90% de la variabilidad de Ia variable endégena. La desviacién tipica estimada del error es 0,093797 y los criterios de informacion de Akaike y Schwartz tienen valores pequefios con lo que a capacidad explicativa del modelo es buena. 96 + © ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION El estadistico de Durban Watson tiene un valor demasiado alejado de 2, lo que puede rovocar posibles problemas de autocorrelaci6n. La significatividad individual de los pardmetros ¢es buena porque los p-valores son menores que 0,05. La significatividad mas pequefia es casi del 99% (variable LogW). Para ver la significatividad conjunta, rellenamos la pantalla Equation Estimation como se indica en la Figura 1-52. Al pulsar Aceptar se obtienen los resultados de la Figura 1-53 observéndose un p-valor de la F muy bajo, lo que indica alta significatividad conjunta de los pardmetros del modelo, a as] ‘SSeS ucieaeerc" a eens Saree ete Figura 1-52 Figura 1-53 Para analizar Ja importancia de Ia posible autocorrelacién graficamos Jos. valores observados de la variable dependiente contra los residuos a partir de la opeién Quick —» Graph —» Scatter (Figura 1-54). Se rellena la pantalla Series list con los residuos y la variable dependiente (Figura 1-55). Al pulsar OK se obtiene el grifico de dispersién de la Figura 1-56, que presenta una estructura aleatoria de sus puntos indicando la ausencia de problemas serios de autocorrelacién. fester Figura 1-55 (© MTES-Paraninfos 37 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS > Se trata de analizar la relacién existente entre el grado de estrés de los trabajadores Y, medido a partir del tamaiio de Ia empresa en que trabajan X;, el nimero de afios que levan en el puesto de ‘trabajo actual X, el salatio anual percibido Xs y la edad del trabajador X, Se dispone de las “observaciones siguientes: XX XY 812 15 30 38 101 334-8 20 52 60] 377, «5-20 27 10] 303 10 54 36 27 505 13 52 34 89 401 4 27 45 0 177 6 26 50 16 598 9 52 60 184 412 16 34 44 34] 127-2 28 39 «17 601 8 42 4178 297 11 84 $8 141 205 4 31 51 603 5 38 63 104] 4848 41 30 76) Una vez hallada la relacién pedida entre Jas variables, evaluar la capacidad predictiva del modelo y hallar predicciones del grado de estrés de los trabajadores para los valores siguientes de las, variables independientes SOLUCION: Podemos iniciar el problema realizando un anélisis conjunto de las series con la finalidad de ver las relaciones entre ellas. Para realizar esta tarea con Eviews, se carga el fichero de trabajo (1-6.wk/) usando File —» Open — Eviews Workfile.. y se seleccionan todas las variables del modelo (con Ia tecla Ciri. presionada se eligen todas las variables con el ratén). A continuacién se hace clic con el botén derecho sobre la seleccién y se elige Open —> as Group (Figura 1-57). En la pantalla Group se elige View — Multiple Graphs — Scatter — First series against all... (Figura 1-58) para obtener la Figura 1-59, que permite intuir una relacién lineal positiva entre el grado de estrés y cada una de las variables independientes. Esta relacién es mas fuerte con el tamafio de la ‘empresa X; y el salario actual X3. Podemos cuantificar las relaciones entre las variables mediante su matriz de correlaciones (en el ment View de 1a pantalla Group en la Figura 1-58 se elige Correlations —» Pairwise Simples) de la Figura 1-60. Se observa que el tamaiio de la empresa X; y cel salario actual X3 son las variables que presentan mayor correlacién con el nivel de estrés ¥ y que cexiste una cierta relacién entre el tamaiio de Ia empresa X; y el ntimero de afios en el puesto de trabajo X>. También hay relacién entre esta ultima variable y el salario actual X;. Es légico entonces realizar un ajuste lineal de Ta variable ¥ respecto de las demés variables. 98 + © ITES Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Figure 57 Fiewre 3 ce saat i cer ee ee te el Figwa 59 Figura 1-60 Para realizar el ajuste lineal con Eviews, se elige Quick — Estimate Equation. Se rellena la pantalla Equation Specification de la solapa Specification como se indica en la Figura 1-61), se lige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar (Figura 1-62). Se obtienen los resultados de la Figura 1-63. Se observa que todos los pardmetros estimados (salvo el coeficiente de X2) son significativamente distintos de cero al 95% (p-valores menores que 0,05) y que Ia significatividad conjunta es muy alta (p-valor de la F may pequefio). El R” y el R” ajustado son 0,84 y 0,78 respectivamente (muy altos) con lo que la variabilidad explicada es alta. La desviaci6n tipica estimada del error es 24,03 y los criterios de informacién de Akaike y Schwartz tienen valores pequefios con lo que la capacidad explicativa del modelo es buena. El estadistico de Durban Watson tiene un valor no demasiado alejado de 2, 1o ‘que indica ausencia de posibles problemas de autocorrelacién. Si sobre Ia pantalla Equation celegimos View — Representation se obtiene Ia ecuacién de ajuste del modelo Figura 1-64). Smt ol aa a) ear Piece ate eens Boosie os oa ————3}|| eee) FP a | ee Figura I-61 Figura 1-62 © TES Paraninfos 38 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS ee ag 7 sewer Figuca 63 Figura -O4 Se observa que un aumento en una unidad la variable X; provoca un aumento en ¥ de 0,176 ‘unidades suponiendo constantes el resto de las variables. Un aumento de una unidad en la variable Xs ‘con las dems variables constantes provoca un aumento en ¥ de 1,57 unidades. Para la variable Xl aumento es superior (1,63). La variable Xs debe eliminarse del modelo por no haber resultado significativamente distinta de cero. Para ello utilizamos la opei6n Proc —» Specify/Estimate Figura 1-65) y rellenamos la pantalla Equation Estimation sin la variable X> (Figura 1-66). Al hacer clic en Aceptar se obtiene la estimacién del modelo (Figura 1-67). Ahora todas las variables del modelo han. aumentado su significatividad (p-valores més pequefios) y los valores de R’ son mejores (mas altos). La significatividad conjunta de los pardmetros del modelo también ha mejorado (p-valor de la F mas pequelio). La opcién View —> Representations muestra el nuevo modelo estimado (Figura 1-68). Figura 1-66 fram scar corse cara Preteen On Figura 1-67 Figura 1-68 40+ © ITES Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION Se observa que un aumento en una unidad Ja variable X; provoca un aumento en ¥ de 0,16 ‘unidades suponiendo constantes el resto de las variables. Un aumento de una unidad en la variable Xs ‘con las dems variables constantes provoca un aumento en ¥ de 1,42 unidades. Para la variable Xl aumento es superior (1,75). Se ve que al eliminar del modelo Ia variable Xa, los efectos de las variables independientes sobre la variable dependiente han disminuido levemente. Por lo tanto, la introduccién de Ia variable no significativa en el modelo provocaba una sobreestimacién de los ‘efectos de las restantes variables sobre la variable dependiente Una vez estimado el modelo es muy conveniente realizar un andlisis de los residuos para detectar posibles anomalias. Para ello, en la pantalla Equation, se utilizan las opciones de Actual, Fitted, Residual del ment View (Figura 1-69). La subopeién Actual, Fitted, Residual Table ofrece los resultados de la Figura 1-70. Se obtienen los valores de la variable endégena observados ¥, y estimadosY, y el valor de los residuos. El gréfico de los residuos presenta dos Iineas discontinuas situados a una distancia de #25 de la nea central continua, siendo § el error estndar de la regresién (estimador de la desviaci6n tipica del error). Estas bandas permiten detectar la presencia de residuos significativamente distintos de cero (atipicos). En nuestro caso. sélo el residuo ntimero 8 se sale de Jas bandas (aunque no demasiado). La subopeién Actual, Fitted, Residual Graph muestra el gréfico de la Figura 1-71 que representa los residuos en el eje de ordenadas de la izquierda y los valores de la variable endégena observados y estimados en el eje de ordenadas de la derecha, De esta forma, en la parte superior del grifico aparecen las grificas de los valores de la variable endégena observados y cstimados, que han de coincidir lo més posible. En la parte inferior aparece el grfico de los residuos ‘con las bandas +25, que coincide con el grifico de Ia Figura 1-70. Este grifico ha de ser lo més aleatorio posible sin comportamiento sistemético de ningtin tipo para evitar la existencia de algin «error de especificacién en el modelo o la presencia de otros problemas como la autocortelac ra) ester] antl sl enone fereeloeend eoeenearleesteel timmmowse | an aes eae eruetta a |ESEE os Se Figura 1-70 ~ \ aR a /\ tt x V © MTES-Paraninfow 41 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS La opeién Residual Graph de la Figura 1-69 presenta solamente el grifico de los residuos y la opcidn Standardized Residual Graph presenta el grafico de los residuos estandarizados (Figura 1-72). No se observan problemas de comportamiento sistemético residual por lo que puede suponerse aleatoriedad de los residuos, Para calcular predicciones (tres en nuestro caso), nos situamos en Ia pantalla Workfile y elegimos Proc — Structure/Resize Current Page (Figura 1-73) para ampliar el tamaiio de la muestra hasta el valor 18 (Figura 1-74). Al pulsar OK se obtiene el aviso de ta Figura 1-75 indicativo de la insercién de una nueva observacién en la muestra (que de momento no tiene valores). Si es necesario, con Proc — Set Sample... (Figura 1-73) se amplia el tamaiio de la ‘muestra a 18 rellenado la pantalla Sample como se indica en la Figura 1-76. La siguiente tarea es introducir los valores de Y, X:, Xo, Xs y Xs para los que se obtendré la prediccién. Para ello seleccionamos como grupo las cinco variables eligiendo Open — as Group en el ment emergente obtenido al hacer clie con el botén derecho del ratén sobe las cuatro variables seleccionadas simulténeamente (Figura 1-77). A continuacién, en la pantalla Group se pulsa en :dit y se introducen los valores de las variables (Figura 1-78). La tarea siguiente es elegir Proc ~ Forecast en la pantalla Equation (Figura 1-79) y rellenar la pantalla Forecast como se indica en la Figura 1-80 (El vector Yf contiene las predicciones y SEf sus errores esténdar). Al pulsar OK se obtiene el grafico de Ia Figura 1-81 con los estadisticos de prediccién, Ademés, en la pantalla Workgile apatecen los dos vectores Yf y SEf en la pantalla Workfile (Figura 1-82), AI hacer clic sobre yf en la Figura 1-82 se obtiene la Figura 1-83, cuyos iltimos valores son las predicciones de la variable dependiente pedidas. Ty Fie oe Pantene, =] Ferme feed ‘a ortho satise 7 Cotintonceettan > teen 5 Figura 1-73 Figura 1-74 Snel ange posal tet 20 “a. Rasie vas neta 3cbomvtone i = @ NP Corinne? 1F conden eter | Figura 1-76 4268 ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION eer Bilan Tt G— aera | | rsa = renege (i F irnt ena oleae cbienasine ere eee I Faysateronton Figura 1-80 [oir psc beas/ | hn elena sna See 11a = wae Figura 1-83 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Para evaluar la capacidad predictiva del modelo con Eviews, se utilizan los estadisticos de la Figura 1-81, Siendo n el horizonte de prediccién, estos estadisticos son: Coeficiente de desigualdad de Theil (Theil Inequality Coefficient): CDT Proporcién del sesgo (Bias Proportion): ——“ —")_ VE -¥ ein (S,~ Sp)" Proporcién de la varianza (Variance Proportion); ——*—*~ Le -K en 2a Proporcién de la covarianza (Covariance Proportion): <>!" Le -¥ yn Mientras més proximos estén a cero los valores de los cuatro primeros estadisticos, mejor serd la capacidad predictiva del modelo, lo que permitiré comparar un modelo con otros alternativos, Las tres proporciones varian entre cero y uno y también es conveniente que sean equeias. Los resultados obtenidos para nuestto modelo en la Figura 1-81 muestran un coeficiente de Theil muy cercano a cero, aunque los otros estadisticos no sean demasiado equeiios. La proporcién de la varianza tiene un valor pequeio y la proporcién de la covarianza tiene un valor més 0 menos aceptable, aunque no ocurre lo mismo con la roporcién del sesgo, que tiene un valor algo alto, No olvidemos que s6lo tenemos tres observaciones adicionales para la prediccién, lo que no permite alcanzar una capcidad de prediccién demasiado buena. 4468 ITES Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION 1.7. Se intenta medir el grado de salud en un grupo de personas controlando el consumo de oxigeno (oxigen) en unas pruebas fisicas en funcién de su edad, peso, tiempo empleado en la realizacién de las pruebas, pulsaciones en descanso (pd), pulsaciones en ejercicio (pe) y pulsaciones méximas (pm), Para ello se intenta realizar un ajuste del conjunto de datos de que se dispone para estas variables (I-7.w/l) a un modelo lineal que contenga las variables precisas de modo que la calidad del ajuste sea razonable. Realizar los andlisis gréficos correspondientes para detectar posibles problemas de autocorrelacién, heteroscedasticiad y no linealidad, SOLUCION: Comenzaremos utilizando un modelo que englobe todas las variables definidas en ‘el modelo siendo oxigen la variable dependiente. Para realizar el ajuste lineal con Eviews, ‘cargamos el fichero de trabajo (1-7.wk1) usando File > Open —» Eviews Workfile... y se elige Quick —> Estimate Equation (Figura 1-84). Se rellena la pantalla Equation Specification de la solapa Specification como se indica en la Figura 1-85, se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar (Figura 1-86). Se obtienen los resultados de la Figura 1-87. eo Egat ete cette ceed big eg tia. arene chia Sa Figura 1-84 ee thy EES Sioa = 7 Racket tr 2388 Stine 1G Figura 1-86 Figura t-87 © MES Paranintow 45 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Se observa que todos los pardmetros estimados son significativamente distintos de cero al 95% (p-valores. menores que 0,05) salvo los relativos a las variables pd y peso y que In significatividad conjunta es muy alta (p-valor de la F muy pequefio). El R* y el R? ajustado son 0,84 y 0,81 respectivamente (muy altos) con lo que la variabilidad explicada es alta. La desviacién tipica estimada del error es 2,31 y los crterios de informacién de Akaike y Schwartz tienen valores pequefios con lo que Ia capacidad explicativa del modelo es buena. El estadistico de Durbin ‘Watson tiene un valor no demasiado alejado de 2, lo que indica ausencia de posibles problemas de autocorrelacién, Las variables pd y peso deben eliminarse del modelo por no haber resultado significativamente distinta de cero, Para ello utilizamos la opeién Proc —> Specif\/Estimate (Figura 1-88) y rellenamos la pantalla Equation Estimation como se indica en la Figura 1-89) Al hacer clic ‘en Aceptar se obtiene la estimacién del modelo (Figura 1-90). Ahora todas las variables del modelo son todas significativas al 95% (p-valores més pequefios que 0.05 aproximadamente) y la significatividad conjunta de los pardmetros del modelo es muy buena (p-valor de la F muy pequefio. Laopeién View —» Representations muestra el nuevo modelo estimado (Figura 1-91), [Pestnoscomt oes nem eal — Sees |i Bat Mtoe sos tse aries Bi Miterccun ‘Eerie Rens ewern tT fasta) a Figura 138 Figura 189 eee ee) Bao elses st acm) pan SSnGEN= 6m) + COEERS Fo—yPE car + esEWPO Teo Games St>Ne OM tebe Fabri Onno Figura 1-90 Figura 1-91 Se observa que el grado de salud esti en relacidn inversa con la edad, las pulsaciones en ejercicio y el tiempo empleado en la realizacién de las pruebas, y esté en relacién directa con las, pulsaciones méximas, 46 + © ITES- Parente MODELO DE REGRESION MULTIPLE: ESTIMACION, INFERENOIA Y PREDICCION En la figura 1-90 se observa que el estadistico de Durbin Watson tiene un valor no demasiado alejado de 2 (1,8), lo que indica ausencia de posibles problemas de autocorrelacién, Para comprobar grificamente la ausencia de heteroscedasticiad y no linealidad representamos los residuos contra las variables independientes del modelo. Par ello elegimos Quick —> Graph — Scatter (Figura 1-92) y rellenamos Ia pantalla Series List sucesivamente como se indica en las Figuras 1-93, 1-95, 1-97 y 1-99. Al pulsar OK se obtienen las Figuras 1-94, 1-96, 1-98 y 1-100. Se observa que todos los gréficos muestran una estructura aleatoria de sus puntos, lo que indica ausencia de problemas de heteroscedasticidad y no linealidad. También pueden representarse los residuos contra los valores predichos para analizar la heteroscedasticidad y la autocorrelacién. Para ello se calculan los valores predichos eligiendo Proc —> Forecast en la pantalla Equation (Figura 1-101) y rellenando la pantalla Forecast como se indica en la Figura 1-102 (El vector oxigenf contiene las predicciones). A continuacién se elige Quick — Graph — Scatter y se rellena la pantalla Series List sucesivamente como se indica en las Figuras 1-103. Al pulsar OK se obtiene la Figura 1-104 que también presenta una estructura aleatoria de sus puntos, lo que indica ausencia de problemas de heteroscedasticidad y autocorrelacion. Ltt cine coups and set expan fresco a Cog] seca | Figura 1-93 Figura 1-94 ite eres. andl sn nen jes enbo Loreel_| Figura 1-95 (© MTES-Paraninfow 47 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Us of sees. soups anda sts expen te Figura 197 Litt sets, goups, and sts exper sons fester | Figura 198 Figura 1100 mas UNTITLED Sime 86H Fowasime [oat Se cat ‘Sie | ——| | rome -—_ Foecon erge 1 Peet ir 1 Faecateronaten I Inet cab rut oane en sne err) = | Unt sets, ioupe, arose pesos (es onoent Figura 1-103 48 +© ITES- Parente Figura 1-102 ning EE Pelee) rele) Bal os Bey ct . eule Figura 1-104 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 2.1_MODELOS CON DATOS DE CORTE TRANSVERSAL Ya sabemos que un conjunto de datos de corte transversal (0 datos de seccién eruzada) es una muestra compuesta por individuos, familias, empresas, ciudades, estados, paises u otro tipo de unidades muy variadas recogida en un momento determinado del tiempo. Por lo tanto, la dimensién temporal no existe. En ocasiones, los datos de cada unidad no son ‘exactamente del mismo periodo de tiempo. Por ejemplo, podrian hacerse encuestas a diversas familias durante semanas distintas de un mismo aio. En un anélisis de corte transversal, ignorarfamos cualquier pequefia diferencia en el tiempo de recopilacién de los datos. Aunque ‘un conjunto de familias fuese encuestado en semanas diferentes del mismo afio seguirfamos considerando estos datos como datos de corte transversal. Otra caracteristica importante de los datos de corte transversal es que se supone que se han obtenido mediante un muestreo aleatorio de la poblaci6n subyacente. Este capitulo se centra en el anilisis de datos de corte transversal ya que es el que conlleva menos dificultades de tipo conceptual 0 técnico, al tiempo que permite ilustrar la mayoria de los aspectos principales del anilisis econométrico. Las técnicas utilizadas con este tipo de datos se usan también cuando se traten otros tipos de datos, como los datos de series temporales, Mientras que el andlisis econométrico de series temporales emplea muchas de las, herramientas que se utilizan para el andlisis de corte transversal, el primero es més complicado debido a que muchas series temporales econdmicas suelen tener tendencias, correlaciones, fuerte persistencia, dinémica y estacionalidad. La econometria se emplea en todas las ramas de la economia para contrastar teorias econsmiicas, como fuente de informacién para las personas encargadas de establecer medidas de politica econémica, tanto del émbito privado como a nivel gubernamental. Algunos modelos econométricos derivan de modelos econémicos formales, pero otros se basan en razonamientos econdmicos informales y en la intuicién. El objetivo de cualquier anslisis econométrico es estimar los pardmetros del modelo y contrastar hipétesis sobre estos parémetros; los valores y los signos de los parémetros determinan la validez. de una teorfa econdmica y los efectos de ciertas politicas econémicas. Los datos de corte transversal, de series temporales, de panel y los datos fusionados de seccién cruzada, son los tipos de datos que se emplean mas a menudo en econometria aplicada. Los datos de corte transversal se emplean muy frecuentemente en economia y en otras ciencias sociales, especialmente en ramas de la mieroeconomia aplicada, como la economia del trabajo, las finanzas ptblicas tanto estatales como locales, 1a organizaci6n industrial, Ia economfa urbana, la demografia y la ‘economia de la salud. Suelen ser problemas muy comunes en la econometria con datos de corte transversal Ja presencia de heteroscedasticidad (varianza no constante en los términos de error), ‘multicolinealidad (asociacién lineal entre las variables explicativas), no linealidad en la ‘expresién matemética del modelo, errores de especificaci6n (no incluir las variables adecuadas ni Ia forma funcional 6ptima que define el modelo), endogeneidad y regresores estocdsticos (dependencias entre Ia perturbacién y las variables explicativas y regresores aleatorios). Estos mismos problemas serén también transladables para los modelos con datos de series temporales. No obstante, en el capitulo siguiente se analizarén los problemas especificos de los modelos con datos de series temporales. 50+ © ITES-Paraninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, 2.2__HETEROSCEDASTICIDAD: ESTIMACION MCG 2.2.1 _ El problema de la heteroscedasticidad y su deteccion En el modelo lineal ¥ = XB + u, suponfamos una serie de hipstesis entre las que se encontraban que la variable w (término de error) es una variable aleatoria con esperanza mula (E(u) = 0) y matriz de covarianzas constante y diagonal (Var(u)= 07 J, matriz escalar). Es decir, que para todo 1, la variable u, tiene media cero y varianza 0 no iente de 1, y ademas Cov(u; 1) = 0 para todo i y para todo j distintos entre si, pudiendo escribir Var(u)= 07 Ii. El hecho de que la varianza de u, sea constante para todo 1 (que no dependa de 1), se denomina hip6tesis de homoscedasticidad. Si se relaja esta hipstesis y Ia varianza de u, no es cconstante estamos ante la presencia de heteroscedasticidad. La importancia del incumplimiento de la hipstesis de homoscedasticidad radica, entre otras cosas, en que los estimadores obtenidos por MCO no son de varianza minima aunque sigan siendo insesgados. Ademés, para cada variable del modelo se estimaré una varianza del error. Para analizar la heteroscedasticidad de un modelo suele comenzarse por el anélisis grifico de los residuos, siendo esenciales las gréficas de los residuos (a poder ser estudentizados) respecto de la variable end6gena predicha y respecto de las exdgenas, que deben de presentar una estructura aleatoria libre de tendencia. El grafico de los residuos contra cada variable exdgena permite detectar como variable mds culpable de heteroscedasticidad aquella cuyo gréfico se separa més de la aleatoriedad. También es un instrumento gréfico til Ia grifica de valores observados contra valores predichos, cuyos puntos han de ser lo més ajustados posible a la diagonal del primer cuadrante, Aparte del anélisis grifico es necesario realizar contrastes formales de heteroscedasticidad, entre los que destacan Goldfeld-Quandt, Glesjer, Breush-Pagan, White, GARCH, ARCH y RESET de Ramsey. Contraste de Goldfeld-Quandt Se detecta la variable culpable de heteroscedasticidad X, y se ordenan las observaciones muestrales de todas las variables en funcién de la ondenacién de X,. Se suprimen las ¢ observaciones centrales de modo que sean 1/3 del total y se hacen dos regresiones distintas con lo que queda. Se considera el estadistico F = SCEV/SCE2 que, bajo la hipétesis de homoscedasticidad, es una F de Fisher con (T-e-2kY2 grados de libertad en ambas dimensiones. SCE1 es la suma de cuadrados del error de Ia regresidn relativa a la submuestra de valores bajos de X, y SCE2 es la relativa a la submuestra de los valores altos Contraste de Glesjer Se estiman los residuos del modelo u, por MCO y se realiza la regresi6n: I-10 12 [uj |= dot diZi'+ri, variable culpable, ft Contrastar d=0 en el modelo anterior es equivalente a contrastar la hipétesis de homoscedasticidad en el modelo inicial Contraste W de White Se efectiia una regresién de los cuadrados de los residuos MCO sobre todas las variables independientes del modelo, sus cuadrados y sus productos cruzados de dos en dos. La homoscedasticidad se acepta si la F permite aceptar la nulidad conjunta de todos los ardmetros salvo la constante © MES Paranintos 51 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Contraste RESET de Ramsey En una primera etapa se estiman los residuos u, del modelo inicial y los correspondientes valores ajustados de ¥,, Para cada tse calculan las m primeras potencias de las estimaciones de ¥, En una segunda etapa se realiza la regresin auxiliar de las estimaciones de u, contra todos los regresores del modelo inicial y las m primeras potencias de las estimaciones de Y,. Si no hay significatividad de los coeficientes hay heteroscedasticidad, Contraste de Breush-Pagan Se utiliza cuando la varianza no constante de las perturbaciones puede expresarse como @? = h(Z,’a) siendo h una funcién y Z, un vector con las variables que producen la heteroscedasticidad. Si a = 0 la varianza es constante El contraste se realiza obteniendo los residuos del ajuste del modelo y considerando los cocientes g, entre los cuadrados de cada residuo del modelo original y la media aritmética de dichos cuadrados (o 1a estimacién MV de la varianza del error). Al realizar la regresién centre las variables g, y las variables culpables Z, (p-1 variables) més la constante, la cantidad Q = VER se distribuye segiin una Chi-cuadrado con p-I grados de libertad bajo la hipstesis mula de homoscedasticidad (a = 0). VE es la varianza explicada de la regresi6n anterior. La mejor propiedad de este contraste es que no es necesario explicitar la forma de la funci6n h Contraste ARCH (Autorregresive Conditional Heteroscedasticity) Dado que la varianza del témino del error puede interpretarse como una incertidumbre en Ia relacién econémica especificada en un modelo, una mayor incertidumbe en el pasado podria afectar al comportamiento presente, por lo que Engel (1982) propuso que Ja matriz de varianzas y covarianzas del término del error del modelo ¥ = X B + u depende del ‘cuadrado de los errores observados en el pasado: 7 = V(u) = dotds tha Met dy trp? Evidentemente, si d; =...= d, = 0 no existe efecto ARCH (no hay heteroscedasticidad) En la prictica, para realizar el contraste ARCH(p), se comienza estimando los residuos 1, del modelo inicial y después se realiza la regresin auxiliar uj? = detdy Wut. dy La homoscedasticidad existe sila F acepta la nulidad eonjunta de los parsimetros salvo la constante Un problema habitual en este método es identificar p, para lo cual suele usarse el correlograma estimado de los residuos al cuadrado, tomando p como el retardo a partir del cual Jos coeficientes son no significativos Contraste GARCH (Generalizad Autorregresive Conditional Heteroscedasticity) Boliersiev (1986) amplié Ia estructura ARCH de Engel incluyendo en la especificaci6n de la varianza valores retardados de la misma, de modo que en una estructura GARCH(p.q) tenemos: 0° = Vu) = dotdwnrt.+ dat yptQ@ Our ++ OF rg La identificaci6n de p y q se realiza como en Ios modelos ARIMA a través del correlograma y el correlograma estimado. Actualmente se utilizan otras estructuras GARCH mas amplias, como Jos modelos TARCH, EGARCH, PARCH, CGARCH y GARCH-M. 926© ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Contraste de rangos Se trata de un método no paramétrico que se resume en los siguientes pasos: + Se aplican mfnimos cuadrados al modelo original ‘* Se calculan los rangos de los residuos en valor absoluto y de las observaciones de la variable culpable de la heteroscedasticidad © Se calcula el coeficiente de correlacién por rangos de Sperman r, = 1-6ED/1T*-1)) siendo D, la diferencia entre los rangos de la variable explicativa y Ju © Se contrasta la hipétesis nula Ho: 2, = 0 mediante el estadistico r,(7-2)""/(1-r2)'” que sigue una r de Student con 7-2 grados de libertad, Sise acepta Hohay homoscedasticidad, y si se rechaza, hay heteroscedasticidad, 2.2.2 Soluciones para la heteroscedasticidad: Minimos Cuadrados Generalizados (MCG) y Minimos Cuadrados Ponderados En general, para resolver el problema de heteroscedasticidad es necesario realizar la estimaci6n por MCG (Minimos Cuadrados Generalizados). Pero si la estructura de la varianza de las perturbaciones es conocida, se facilita el eélculo de los estimadores. Si se puede suponer aproximadamente que 07 = f(Z)), siendo Z, un vector de variables que incluye una o varias variables exdgenas de la regresién y /uuna funcién cualquiera, entonces puede reducirse Ia estimacién MCG a MCO (Mimimos Cuadrados Ordinarios) con ponderaciones adecuadas (Minimos Cuadrados Ponderados). Entre las estructuras tipicas de la varianza tenemos 07 = FX, 07 = 0X,', o? = a+bXy y a2 = exp(Z7’a), siendo las dos primeras las mas comunes y la tercera una translacién de la primera. En los dos primeros casos las matrices de varianzas covarianzas resultan ser: xX, 0 0 0 eu] Xe 0 ° 0 0 Re bg En estos casos la regresién MCG coincide con la MCO utilizando como ponderaciones los valores 1/X; y 1/X;", 0 sea los inversos de los elementos de la diagonal de 5. Si la estructura de la varianza es 6?= 0°X;, el modelo se transforma dividiendo sus términos por X;"”, de modo que estimariamos por MCO el modelo: yf, a. ay Ky Ky Ke Ky Ky En general, para resolver el problema de heteroscedasticidad es conveniente tomar logaritmos. También pueden suprimirse las variables més culpables con justificacién estadistica y econémica o introducir variables dummy adecuadas, © MTES-Paranintos 58 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Para detectar Ja mejor forma funcional que sigue la varianza, se ajustan distintos modelos para las distintas formas funcionales del tipo siguiente Se toma como esquema de heteroscedasticidad aquella forma funcional para Ia que Ia regresién correspondiente presenta un R” mas elevado, 2.2.3 Soluciones para la heteroscedasticidad: Modelos ARCH y GARCH Detectada una estructura de heteroscedasticidad autorregresiva condicional ARCH) en un modelo, existen métodos para su estimacién, La estructura del modelo a estimar ser Y=XB+u, 7 = Vu) = dgtdy ty +. dy ey? La estructura anterior puede ampliarse a Ia estimacién de un modelo GARCH(,) con heteroscedasticidad autorregresiva condicional generalizada, EI modelo a estimar en este ¢as0 es: Y=XB+u digtdyt yt. dell OO p14. OyPug La estructura GARCH-M amplia Ia estructura GARCH introduciendo Ia varianza como término de la ecuacién el modelo, El modelo a estimar en este caso serd B+ Ro? +u, dotdstl st. del OO 14. + MP vg y Dos variantes de la estructura GARCH-M consisten en introducir en la ecuacién del modelo el logaritmo de la varianza (en lugar de la varianza) o incluso la desviacién tipica: y Y B+ Alog(o? +, B+ dot La estructura GARCH(p,g) también puede ampliarse con la introduccién de regresores ‘exdgenos en el estructura de la varianza. El modelo a estimar en este caso es: y o Bey , abit dl gh Oot OO? AZ La estructura TARCH(,4,r) denominada Threshold GARCH también es una ampliacién OF = dotdilul 0, sb... dell. Op + O4l0g( Os) +... Oh log O:g)4B, eal Os +--+ Bett Or 94 © ITES-Paraninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, La estructura PARCH(,g7) denominada Power ARCH también es una ampliak modelo GARCH(p,q) El modelo a estimar en este caso es: Y=XBtu; Of = dots insta)”. dig Poti) #040 1. CGO (r>0, [AISI i=1,...,s, B=0 para i>s y s10), donde R? es el R° de la regresi6n auxiliar de la variable explicativa jen funeidn de las demas variables explicativas. Valores propios A de X'X cercanos a cero 0 indice de condicién (Ayéx/Ays)'” mayor que 30. El contraste de Farrar-Glauber basado en el estadistico G = -[T-1-2k+5)/6]L|R. que bajo Ia hipstesis mala de no muticolinealidad es una Chi-cuadrado con k(k-1)/2 grados de libertad. 7 ‘sel tamaiio muestra, k-I el niimero de variables explicativas y Ry su matriz de correlaciones, Soluciones para la multicolinealidad Entre las soluciones més comunes para la multicolinealidad tenemos: Ampliar la muestra o transformar las variables (por ejemplo a ratios o diferencias). Suprimir algunas variables con justificacién estadistica y econémica. (© MES Paranintow 55 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS © Sustitucién de las variables explicativas por sus componentes principales mas significativas (puntuaciones). * Utilizar el modelo en diferencias vigilando la autocorrelaci6n. ‘© Usar la regresién en cadena, que ofrece como estimadores de los pardimetros (X’X+cl)' X’Y siendo ¢ una constante adecuada. La matriz de varianzas covarianzas adopta la forma o'(X'X+cl)X’X(X'X+cl)". En la prictica suele tomarse como un valor entre 0,01 y 0,1 ‘que hace que el ajuste sea bueno en cuanto a R’ y significatividad individual y conjunta, 2.4 NORMALIDAD DE LAS PERTURBACIONES 2.4.1 El problema de la falta de normalidad en los residuos Una de las hiptesis importantes a cumplir en el modelo de regresién miitiple es la normalidad de los residuos. Aunque dicha hipétesis no es necesaria para la obtencién de los estimadores de los parimetros del modelo de regresiGn por el método de los minimos cuadrados ‘ordinarios, s{es estrictamente necesaria para la realizaciGn de la inferencia en el modelo, Para probar la normalidad de los residuos puede utilizarse cualquier contraste de ajuste a ‘una distribucidn normal, por ejemplo el contraste de la Chi-cuadrado 0 el contraste de Kolmogorov-Smimov. No obstante, existen también contrastes especificos para comprobar el ajuste de un conjunto de datos a una distribucién normal, como pot ejemplo Contraste de normalidad de Shapiro y Wilks y los contrastes de normalidad de asimetrfa, curtosis_ Jarque-Bera. Contraste de normalidad de Shapiro y Wilks El contraste de Shapiro y Wilks mide el ajuste de los residuos de la regresién a una recta al dibujarla en un papel probabilistico normal. Se rechaza la normalidad cuando el ajuste es bajo, que corresponde a valores pequefios del estadistico del test. Dicho estadistico toma la expresion: donde ns*=(.x, -¥)’, h es ni2 sin es par y (n-1)/2 sin es impar. Los coeficientes a,, estén tabulados y x,) es el valor ordenado en Ia muestra que ocupa el lugar j. La distribucién de w est tabulada, y se rechaza la normalidad cuando su valor ealculado a partir de la muestra es menor que el correspondiente valor critico dado en las tablas. De todas formas, puede utilizarse el criterio del p-valor, rechazando la hipétesis nula de normalidad de los datos al nivel cuando el p-valor es menor que @ y acepténdola en caso contratio. Contrastes de normalidad de asimetria, curtosis y Jarque-Bera Estos contrastes se basan en los coeficientes de asimetria y curtosis muestrales (la muestra son los residuos del modelo). Si la hipétesis de normalidad es cierta, el estadistico del contraste, que es el coeficiente de asimetria muestral o% = ms /m,"", tiene una distribucién asintéticamente normal de media cero y varianza 6/n, siendo mr y m; los momentos muestrales centrados en la media de drdenes 2 y 3 respectivamente. Tenemos: re) 96 + © ITES-Paraninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Este estadistico a permite contrastar la hipstesis de que los residuos provienen de una distribucién con simetrfa normal (asimetria = 0) y se basa en que si la hipstesis de normalidad es cierta, el coeficiente de asimetrfa estima un parémetro de la poblacién que es cero (el coeficiente de asimetria de una distribucién normal es cero). Para realizar el contraste se halla el valor k tal que P(d% > k) = @ siendo cel nivel de significacién establecido para el contraste. Si el valor del estadistico para los residuos es mayor que k se rechaza la hipétesis nula de simetrfa, y por supuesto la de normalidad. De Ia misma forma, si la hipotesis de normalidad es cierta, el estadistico del contraste, que es el coeficiente de curtosis muestral a= ms/m,*-3, tiene una distribuci6n asint6ticamente normal de media cero y varianza 24/n, siendo mz y my los momentos muestrales centrados en Ia media de 6rdenes 2 y 4 respectivamente aa Be-a-oio | Este estadistico @ permite contrastar Ia hipstesis de que los residuos provienen de una distribueién con curtosis normal (curtosis = 0) y se basa en que si la hipétesis de normalidad es cierta, el coeficiente de curtosis estima un pardmetro de la poblacién que es cero (el coeficiente de curtosis de una distribucién normal es cero). Para realizar el contraste se halla el valor & tal que P(a > k) = @ siendo cel nivel de significacién establecido para el ccontraste, Si el valor del estadistico a para los residuos es mayor que k se rechaza la hipstesis nula de curtosis cero, y por supuesto la de normalidad. Para muestras grandes, el contraste de Jarque-Bera usa los dos estadisticos anteriores mediante la consideracién del estadistico de Bowman-Shelton siguiente: a a ay [f-E)2 Es posible utilizar para estos contrastes (como siempre) el criterio del p-valor, rechazando Ia hipétesis nula de normalidad de los residuos al nivel & cuando el p-valor es menor que cen alguno de ellos, y aceptindola cuando el p-valor es mayor que cen los dos. Como criterio més suave sobre 1a normalidad, suele considerarse normal 1a poblacién ‘cuya muestra presenta coeficientes de asimetria y curtosis comprendidos entre ~2 y 2 2.4.2 Soluciones para la falta de normalidad en los residuos Habitualmente la falta de normalidad en los residuos suele provenir de la presencia de datos atipicos que generan una distribucién mas apuntada o no simétrica. Estos problemas en los. residuos suelen aparecer cuando se omiten variables relevantes en el modelo o cuando existe falta de linealidad en Ia especificacién del mismo. Si se arreglan previamente los problemas citados, suelen solucionarse los problemas de normalidad residual. Cuando los residuos no son normales por Ja presencia de més de una moda, los datos suelen provenir varias poblaciones, lo que puede arreglarse con la introduccién de variables ficticias en el modelo para las diferentes poblaciones, En ‘otras ocasiones, Ia solucién para la falta de normalidad es la transformacién adecuada de las variables para conseguirla, por ejemplo la transformacién de Box Cox y sus derivados. (© MES Paranintos 57 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS 2.5 NO LINEALIDAD Y ERRORES DE ESPECIFICACION La técnica de los minimos cuadrados ordinarios MCO es el caballo de batalla de los econsmetras y se utiliza de modo rutinario en el anélisis de una gran variedad de conjuntos de datos. Bajo los supuestos exigidos al modelo lineal, los estimadores mfnimo cuadréticos oseen las propiedades deseables y, por ello, pueden emplearse con fiabilidad. Sin embargo, nos enfrentamos a una pregunta crucial. {Cémo saber si los supuestos que ocultan los MCO son vilidos para un conjunto determinado de datos? {Cémo conocer las propiedades del ‘término de perturbacién no observable?%,Cémo saber qué variables incluir en la matriz X y en qué forma funcional hacerlo? Cuando alguno de los supuestos subyacentes carece de validez, {qué sucede con los estimadores MCO? {Siguen siendo titiles o resultan confusos? Existen estimadores y procedimientos de inferencia alternativos que resulten mas apropiados bajo supuestos alternativos? En este capitulo y en los siguientes responderemos a estas preguntas El error de especificacién aparece cuando alguno de los supuestos esté equivocado, Ciertos errores de especificacién tienen implicaciones menores; otros, sin embargo, las tienen muy graves. Resulta tremendamente importante estar alertado de posibles errores de especificacién y verificar su presencia. En este capitulo se estudia cémo muchas veces es necesario utilizar y desarrollar especificaciones y procedimientos de inferencia més complejos ‘que los que subyacen en la técnica de los MCO. La especificacién del modelo lineal se centra en el vector de términos de perturbaciones w y en la matriz X. Recordemos que los supuestos esenciales del modelo lineal y= XB-+u relativos a las perturbaciones son: u, son indepedientes idénticamente distribuidas N@.?) i= 1, .... m (perturbaciones normales de ruido blanco), homoscedasticidad E(u’) diaglo,... 2) 0 matriz de varianzas covarianzas residual constante), endogeneidad (E(X;u,) = 0 para todo i = 1... KY $= Ivy M0 incorrelacién entre las perturbaciones y las variables independientes) y ausencia de autocorrelacién (E(u,u,.,)=0 (8 #0) 0 ausencia de comrelaciones centre perturbaciones adyacentes). La heteroscedasticidad (ausencia de homoscedasticidad) es muy frecuente en aplicaciones con datos de corte transversal, aunque puede encontrarse también en aplicaciones con datos de series temporales. En las aplicaciones de series temporales se dan fuertes correlaciones entre perturbaciones adyacentes y, tal vez, correlaciones menores entre perturbaciones més alejadas entre s{ (autocorrelacién). De modo similar, y cuando trabajamos con datos de corte transversal, es posible que ciertas unidades compartan perturbaciones comunes. También existen en el modelo lineal supuestos relativos a la matriz X, entre los que destacan su rango pleno (ausencia de multicolinealidad), la inclusién y no exclusién de variables relevantes en X (ausencia de errores de especificaci6n en la seleccién de las variables explicativas) y problemas de especificacién de una forma funcional incorrecta para el modelo. Otro supuesto comiin es la estacionariedad de las variables del modelo. La mayoria de los procedimientos de inferencia tradicionales suponen que las variables son estacionarias. Cuando no se da este caso nos enfrentamos a procedimientos de inferencia no esténdar y nos introducimos en el campo de las variables integradas, la cointegracién, los modelos de correccién del error, etc., que se tratarén més adelante También pueden existir problemas de especificacién con f. Las especificaciones del modelo lineal asumen de forma implicita que f es un vector constante, tanto en el conjunto de observaciones actuales como en otras observaciones muestrales posibles. Estamos ante a cespecificacién de ausencia de cambio estructural que se tratara en un capitulo posterior. 58 + © ITES-Paaninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Las pricticas econométricas habituales formulan un modelo basado en teorfa o en anteriores descubrimientos econométricos, estiman los pardmetros del modelo mediante los datos muestrales relevantes disponibles, y examinan los estimadores resultantes y estadisticos asociados con el fin de juzgar la validez del modelo especificado. Dicho examen suele centrarse en el ajuste global, en Ia concordancia con los signos de unos coeficientes previamente supuestos, en la significacién estadfstica de los coeficientes y en la comprobacién de la autocorrelacién de las perturbaciones. Si el modelo cumple dichos critetios satisfactoriamente, Ia nueva ecuacién pasaba a engrosar la literatura de la materia y podria utilizarse para realizar predicciones con datos externos a la escala temporal o al rango empirico de Ia muestra. En caso de que el modelo se clasifique de insatisfactorio, el nvestigador seguiré intentando hallar la reformulacién que cumpla los requisitos necesatios, Actualmente existen tendencias basadas en comprobar de todas las formas posibles las especificaciones y que s6lo deberdn utilizarse aquellas que sobrevivan a este proceso de prueba y que correspondan a un modelo econémico razonable. Asi se llega a una auténtica baterfa de pruebas de diagnéstico que no pueden utilizarse ni de forma automética ni rutina ya que requieren una dosis de juicio, intuicién econémica o sentido comin, Algunos de los ccontrastes resaltan un error o errores de especificacién en particular. Otros indican que determinada especificacién no funciona bien sin sefialar explicitamente un problema preciso. Finalmente, puede ocurrir que sobrevivan a este proceso de prueba o que algunas cespecificaciones superen un cierto tipo de pruebas estadisticas pero no otras. 2.5.1 Error de especificacion en la seleccin de las variables explicativas Las especificacién mds importante del modelo lineal relativa a la matriz X es que sea tuna matriz no estocéstica de rango pleno igual a k (ausencia de multicolinealidad). Pero puede haber posibles problemas adicionales con X, entre los que destacan: 1, Exelusi6n de variables relevantes (variables omitidas). La teorfa econsmica ensefia que cel ingreso y los precios afectan conjuntamente a la demanda, por lo tanto, si aislamos el ingreso de la ecuacién de 1a demanda no esperamos obtener un buen estimador para la clasticidad del precio. Sin embargo, y en situaciones més complicadas, no suele ser tan evidente averiguar cudles son Ias variables a incorporar en una relacidn, lo que puede gar a convertirse en un importante problema de especificacién, 2. Inclusién de variables irrelevantes (redundantes). Caso contrario al anterior. Ahora, la hipétesis incluye variables que no deberian estar presentes en la ecuacidn. Este hecho tiene ciertas consecuencias sobre los procedimientos de inferencia aunque, en general, suelen ser menos graves que aquellas relacionadas con la exclusi6n de variables relevantes, Existen contrastes para observar si un modelo adolece de variables omitidas. El test de Ja razén de verosimilitud para variables omitidas permite aiadir un conjunto de variables a una ecuaci6n existente y contrastar si constituyen una contribucién significativa a la explicacién de la variable dependiente. Este contraste tiene como hipétesis mula que el cconjunto regresores adicionales no son conjuntamente significativos. ‘También existen contrastes para detectar si un modelo presenta variables redundantes. El test de la razén de verosimilitud para variables redundantes permite contrastar si_un subconjunto de variables de una ecuacién existente son conjuntamente significativas, © mejor dicho, si los coeficientes de determinadas variables del modelo van a tener valor cero, en cuyo ‘caso esas variables pueden ser eliminadas de la ecuacién del modelo, © MES Paranintos 58 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS El test de Wald para contrastar restricciones en los coeficientes de un modelo también puede utilizarse para detectar cuando una variable es redundante. Basta comprobar cuando puede considerase cero su coeficiente de modo formal a través del test citado. También es posible aplicar métodos de inclusién o exclusién automética de variables en el modelo, Partiendo de un conjunto inicial de k variables, se trata de no incluir nuevas variables irrelevantes en la definicién del modelo ni omitir variables adecuadas. El método més rudimentario serfa efectuar todas las regresiones posibles partiendo del conjunto més amplio de variables candidatas en el modelo y elegir la mejor con las variables que sean significativas. No obstante existen métodos automatizados que realizan esta tarea. El método de seleccién hacia delante (método forward) permite partir de un conjunto minimo de variables en Ia regresidn e ir incluyendo variables adecuadas en el modelo de forma sucesiva ‘comprobando la significatividad del nuevo coeficiente, El método de seleccién hacia atrds (método backward) parte de 1a regresién con todas las variables y va eliminando las no significativas por orden de significatividad hasta encontrar un modelo adecuado con todas sus variables lo suficientemente significativas. El método paso a paso (método stepwise) es un método de selecci6n hacia adelante que comprueba en cada paso, no sélo Ia significatividad del nuevo coeficiente, sino también la de las variables incorporadas en los pasos anteriores. 2.5.2 Error de especificacién en la forma funcional Puede darse el caso de que las variables incluidas en un modelo sean las correctas pero la forma funcional lineal que las relaciona sea incorrecta. A veces, el contexto de modelo lineal es suficiente para manejar el problema, pero en ocasiones no puede sostenerse la linealidad y estamos ante problemas de no linealidad. Una relacién Y = f(X,,X) puede especificarse como Y = 8, + B,X,+B,X,+u 0, como Y=, +f,X,+8,X,+7,X} +y3X}+(X,X,)+u. La segunda ecuacién ‘permite tanto una respuesta cuadritica a los regresores como un efecto de interaccién. El efecto de interaccién se basa en una nueva variable, el producto de los dos regresores. Por lo tanto, el efecto esperado de un cambio unitario en X sera, +2y, + OX, dependiendo pues de fi; y de los niveles de X2 y Xs. Del mismo modo, el efecto esperado de un cambio unitario en Xs dependers tanto del nivel de Xp, como del de Xs. Cuando el error de especificacién consiste en utilizar la primera ‘ecuacién en lugar de la segunda, aquél se corrige fiicilmente aftadiendo los términos X}, X}, y (X,X,). En otros casos, serd necesaria una especificacién intrinsicamente no lineal, Para detectar problemas de especificacién en la forma funcional suelen utilizarse los grificos de los residuos, que, ante la presencia de no linealidades, normalmente presentan tendencias que indican su falta de aleatoriedad. Los altos grados de autocorrelacién también son indicadores de la posible presencia de mala especificacién funcional en el modelo, Asimismo, es ttl realizar la representacidn de los gréficos de los residuos contra las variables explicativas y predichas con la finalidad de comprobar que son aleatorios. La falta de aleatoridad en estos grificos puede indicar la presencia de un problema de no linealidad 0 de mala especificacién funcional del modelo, La solucién para los problemas de mala especificacién del modelo pasa por introducir variables ficticias o por la definicidn alternativa de la ecuacién del modelo baséndose en la tendencia observada en los graficos residuales citados anteriormente. 60+ © ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Los errores de especificacién debidos a la formulacién incorrecta de Ta ecuacién de un modelo de regresi6n lineal pueden contrastarse formalmente a través del contraste RESET de Ramsey. Partiendo de que cualquier funcién puede ser aproximada por polinomios del orden adecuado, se puede introducir en el modelo de regresién términos con las potencias sucesivas y los productos eruzados de las variables explicativas. El contraste de Ramsey realiza un test para ‘comprobar si los coeficientes de las potencias y productos eruzados incluidos en el modelo son ‘cero, en cuyo caso se podrfa aceptar Ia forma funcional lineal del mismo. El contraste RESET de Ramsey sirve para detectar, adems de una forma lineal incorrecta, cualquier error de omisién o Ja presencia de correlaciones entre variables explicativas y la perturbacién. 2.6 _EXOGENEIDAD Y REGRESORES ESTOCASTICOS Un supuesto importante del modelo lineal es que fos regresores no son estocdsticos (no son aleatorios). Esta hipétesis, junto con las relativas al error o perturbacién, implica la cexistencia de independencia entre dicha perturbacién y las variables explicativas. Sin embargo hay modelos en los que la variable endégena depende de ella misma retardada o de variables cuya medicién presenta algiin error. En estos casos aparecen dependencias entre Ia perturbacién y las variables explicativas (regresores ex6genos) que deben analizarse para no invalidar las propiedades que cumplen los estimadores por mfnimos cuadrados ordinatios, El estimador MCO es sesgado en estos casos, pero segtin sea la dependencia puede ser consistente 0 inconsistente. También ocurre lo mismo en los modelos en que se cometen errores de medida ¢en las variables provocados por inobservabilidad, mediciones repetidas, etc. 2.6.1 El método de las variables instrumentales El método de variables instrumentales (VI) permite obtener estimadores consistentes de Jos parémetros en situaciones en que MCO es inconsistente (omisién de variables relevantes, regresores ex6genos, errores de medida o simultaneidad) Supongamos que tenemos un vector Z de variables explicativas aleatorias. Si las variables Z son independientes de la perturbacién u (E(u|Z) = E(u) = 0 y Bluu’\Z = E(uu’)), la estimaciGn del modelo se realiza mediante MCO. Pero si las variables aleatorias Z no son independientes de u se usa el método de las variables instrumentales, consistente en sustituir Jas variables probleméticas de Z por las denominadas instrumentos muy correlacionadas con cllas e incorrelacionadas con uw. Después se aplica MCO, Es necesario ser muy cuidadoso con la eleceién de cada instrumento, ya que no es evidente ver que esti incorrelacionado con el error. Comprobar que el instrumento esta correlacionado con la variable explicativa a la que sustituye (C(Z,X) # 0) puede comprobarse a partir de una muestra, Basta plantear el siguiente modelo en forma reducida: X=atmZty estimarlo por MCO y contrastar: Hya, versus Hm, #0 En el modelo de regresi6n miltiple con variable instrumental Z para Xy Y=A+BX,+BX +e E(e)=0,C(X,,€)=0,C(X,,6)40 C(Z,2)=0 (© MTES-Paraninto« 61 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Ja forma reducida seré: x, Lt MX,+MZ+v Para que Z sea un instrumento vélido sera necesario que 7,40 2.6.2 Elestimador de minimos cuadrados en dos etapas MC2E Consideramos el modelo: Y=a+BX,+BX,+€ C(X,£)40 Supongamos que disponemos de dos posibles variables instrumentales Z; y Z2 que cumplen (la C indica correlacién) C(Z,,£)=0,C(Z,,£)=0 El Estimador de Minimos Cuadrados en 2. Etapas (MC2E) emplea como instrumento una combinacién lineal de Z; y Z2y se obtiene de la siguiente forma: 1° Etapa: Se estima por MCO Ia forma reducida del modelo: x, Mt WL, + ML, + 1X, +0 2° Etapa: Se estiman @ f,, y f, por MCO en la regresion de ¥ sobre X, y Xz 2.6.3 El contraste de Hausman El contraste més usual para estudiar Ia exogeneidad de los regresores es el contraste de exogeneidad de Hausman. Bajo a hipétesis nula se supone que el regresor no es estocéstico, mientras que la alternativa establece lo contrario. El contraste compara los estimadores de los pardmetros del modelo obtenidos por minimos cuadrados ordinarios y por variables instrumentales. Bajo el supuesto de que el regresor no es estocéstico (hipstesis mula), los estimadores obtenidos por ambos métodos son consistentes, mientras que bajo la hipstesis alternativa (regresor estocéstico) sélo el estimador de variables instrumentales mantiene esta propiedad. Cuanto mayor sea la diferencia entre las estimaciones de los parémetros por ambos métodos, mayor evidencia existiré en contra de la hipdtesis mula, es decir, mayor evidencia de presencia de regresores estocésticos, El contraste de Hausman puede realizarse alternativamente mediante regresiones auxiliares. Se parte de un modelo con una sola variable explicativa cuyo cardcter estocéstico estamos estudiando Y = fh + fix + € El contraste de Hausman es equivalente a contrastar la significatividad individual de Ia variable w en Ia regresiOn auxiliar ¥ = A + x + Bute, donde w son los residuos de la regresién de la vatiable x sobre su variable instrumental utilizada z(u = x,-(@, + @z,)). 62+© ITES Parente PROBLEMAS MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, 2.1. Se trata de explicar la cantidad demandada QI del bien 1 en funcidn de su precio PI, del nivel de renta disponible YD y de los precios P2 y P3 de dos bienes alternativos mediante el modelo: Q1=b,PI P2> P3* YD* Se dispone de los siguientes datos: Pl 10000 3915 10526 11335 11233 10293 9877 11133 11201 12083 10818 11203 11465 1744 12485 PR 10000 9787 904s 9420 ous e434 8442 7987 8064 5962 ‘nor 3234 7589 m4 6636 P 10000 9176 10358 10466 10331 11965 10930 Bid 13540 14590 14677 13761 15285 14957 17088 YD 10000 113 11853 13331 13368 16132 16693 18800 13913 20827 21682 211 2113 23425 24216 a 10000 11932 9958 9987 11509 10622 134d 10413 10513, 9427 11199 umd 14097 13353, 9422 PL 10242 ‘9705 10282 11290 ais ommT 11740 11230 10971 9640 10930 11742 9908 11600 12269 P 8464 9483, 11166 9466 3685 7617 8018, 8037 asiL T168 5104 7696 7997 6547 433 P 8585 ‘9983 ‘9807 10010 12901 11830 14591 11038. 13316 15322 14025 13023 14246 16598 18204 YD 10778 11696 R716 13474 1554 164d 18173 13874 19280 20878 21780 22231 23119 24195 25495 ra 9x74 9804 11733 10095 9566 10781 10131 11597 10564 12541 9301 10845 13655 9382 1734 Ajustar de forma razonable el modelo analizando especialmente la heteroscedasticidad. SOLUCION: El primer paso para trabajar con este modelo es linealizarlo aplicando logaritmos, con lo que se transformaré en el modelo: Log(Ql) = Log(b,) + b:*Log(P1) + bs*Log(P2) + by*Log(P3) + bS*Log(¥D) + u Realizaremos en primer lugar el ajuste por minimos cuadrados de nuestro modelo. Esta tarea puede automatizarse con el software econométrico Eviews introduciendo los datos en un fichero de trabajo (2-Lwk1), cargéndolo en el programa usando File —> Open — Eviews Workfil y eligiendo el fichero en la ventana Open. Al pulsar Abrir se carga en memoria el fichero. Si queremos ver el contenido del conjunto de datos bastard con seleccionar todas las variables del modo habitual en Windows, hacer clic con el botn derecho del ratén sobre la seleccién y elegir Open — As Group. Se ve asi el contenido de todas las vatiables del modelo ‘como un grupo (Figura 2-1) Para realizar el ajuste MCO, se elige Quick —» Estimate Equation (Figura 2-1), se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 2-2) y se hace elie en Aceprar. Se obtienen los resultados de la Figura 2-3 Inicialmente el ajuste parece correcto, pues hay significatividad al menos al 93% (p-valores de Ja T menores que 0,07) de todos los parémetros y también hay fuerte significatividad global (p- valor de la F casi Watson se acerca mucho a 2. Quizés el R° sea algo bajo, pero no drésticamente (65,4%). nulo). Por otra parte no hay autocorrelacidn, ya que el estadistico de Durbin- © MES Paranintos 68 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Fieimeclte Pers eeler a Bs es [Rcinecome) tratenitme fee on] st Nason) ner Sacer eal lsc 32. Fae = 3 a ca Figura 2-1 a aunts ess Somes wT =] | Figura 2-2 Figura 2-3 Pueden representarse los residuos contra los valores predichos para analizar la posible heteroscedasticidad, Para ello se calculan los valores predichos eligiendo Proc —» Forecast en la pantalla Equation (Figura 2-4) y rellenando la pantalla Forecast como se indica en la Figura 2-5 (El vector LOGqIf contiene las predicciones de la variable dependiente). A continuacién se elige Quick + Graph — Scatter (Figura 2-6) y se rellena la pantalla Series List como se indica en la Figura 2-7. Al pulsar OK se obtiene la Figura 2-8 que también presenta una estructura poco aleatoria de sus puntos, lo que indica presencia de problemas de heteroscedasticidad. Para detectar qué variables son las responsables de 1a posible heteroscedasticidad realizamos los graficos de residuos contra las cuatro variables explicativas. Para ello elegimos Quick —» Graph — Scatter (Figura 2-6) y rellenamos la pantalla Series List sucesivamente como se indica en las Figuras 2-9, 2-11, 2-13 y 2-15. Al pulsar OK se obtienen las Figuras 2-10, 2-12, 2-14 y 2-16. Se observa que la menos aleatoria es la relativa a YD, ya que aumenta la dispersién del ‘error al ir de izquierda a derecha y presenta un ajuste bueno a una recta paralela al eje X; por tanto no tiene estructura aleatoria, (64 © ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, oui © .06a1 copy SEN bans ee fume) st tet Ger) esa Stee “tis Sa sera Sauer Sites ears Suet ste) tres Ghwet Gee fae oe ee | Detonvit Voiere Frost) Oommnre Figura 2-4 2oees0) Sms O0oTs Sieso amen oom ers Rsquoee en spender AdinelRowaed OSHS SO capenerar 0121897 SEovepesson ODUM Auskerinconoe -21tTs Sim sane id 0157 Senex een” SIRE Loghiaino’ rare Fema Nera Circntasen st LOBIS® Poot) DONTE ae Ubtet seis, rups, anda see expen [LOG teed Figura 2-8 © MTES-Paranintos 65 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS a TT eet ses coups {Losi} resid sor eres exrstiors Ca re Figure 29 Figura 2-10 Series List tot eres coupe ans expessne LOGPA esd 7 Figura 211 Series List Figura 2 13 Unf ses. runs. nde ses expen (LOGO) esd Figura 2-15 Figura 2-16 (66 + © ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, La variable YD es la candidata a provocar los problemas de heteroscedasticidad, pero para estar més seguros utilizaremos un contraste formal, por ejemplo el contraste de Glesjer. Para ello realizamos una regresién miltiple de Abs(RESID) contra Log(¥D) rellenando la pantalla Equation Estimation obtenida con Quick —> Estimate equation) como se indica en la Figura 2-17. Al pulsar Aceptar se obtienen los resultados de la Figura 2-18. Suto tkbenarncatsatiea' Lost ieee Was aon St Figure 217 Figura 2-18 Todos los coeficientes resultan significativos al 94% (p-valores menores que 0.06) y el modelo global tambifién es significativo (p-valor de la F menor que 0,5), Por tanto tenemos que rechazar Ja nulidad de cualquier coeficiente incluida la constante, Como, segin el contraste de Glesjer, la hipstesis de homoscedasticidad es equivalente a la hipétesis de pendiente nula en este modelo, hay heteroscedasticidad seguin YD. Ahora resta Ia tarea de estimar el modelo inicial con heteroscedasticidad. Para ello observamos en Ia figura de YD contra los residuos, que la dispersién residual es ereciente con YD, lo que nos permite suponer como modelo para varianza residual 0? = o *(log(YD))’, lo {que nos permitir estimar el modelo con heteroscedasticidad mediante minimos cuadrados ponderados usando como variable de ponderacién. Vlog(YD). Para ello rellenamos la solapa Specification de 1a pantalla Equation Estimation (obtenida con Quick —> Estimate equation) ‘como se indica en la Figura 2-19. La solapa Options se rellena como se indica en la Figura 2-20 marcando Ia opeién Weighted LS/TLS y situando en el campo Weigth la variable W/log(YD). Al pulsar Aceprar se obtienen los resultados de la Figura 2-21 Cicer" Malian elcome perry Setar ‘Games ‘ana 3 Om least unmecon j=) Figura 2-19 Figura 2-20 (© MTES-Paranintos 67 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS ‘perder Var 3 LOG) Mano: Least Squares Date C6/1405 Te: 01:27 Suge 130 \ielgring sere VLOVO) Varabe sent Se Ewer Stats c emae 2as3 seme D007 Logen Sssieoe G2nzer> 4s0s5 | comma Looe — Osue Ciaces aus | Ooms Coops) © asus Giasist 2oures Coase (ewe branes Gttsera “Garson Weighed Satis Required ‘OSISI0 Mean dependentvar 9254372 fijused Raquored 0520859 SD dependestvar 0.268570 SE ctrgosvon” 0075/29 Akake mio ctenan 2172308 Logkeihned| 372340) Psttste 1207766 DuorWeteon ste! Tosios2 Probate) 1000013 Unwed Sates Require ‘OSSD Mean dependent var 925 Agiudresqunes O72 pean O17 Figura 2-21 Se observa que el ajuste ponderado es bueno y que los parémetros estimados difieren levemente de los obtenidos antes de corregir Ia heteroscedasticidad. Ha mejorado R° y las significatividades de los parémetros estimados también han mejorado. El modelo estimado es cl siguiente Log(Q1) = 8,6887 — 0,8846Log(P1) + 0,5494Log(P2) — 0,3384Log(P3) + 0,7246Log(YD) + u Mediante un estudio con datos de las Comunidades Auténomas espafiolas referentes a 1991, se ‘rata de estimar la relaci6n entre el nivel de empleo (medido por las medias anuales de ocupados en cada comunidad en miles de personas) y el PIB (medido por el valor afiadido bruto al coste de Jos factores en las comunidades). Los datos se encuentran en el archivo 2-2.wfl. Estudiar los problemas posibles de heteroscedasticidad en el modelo y resolverlos de la forma més adecuada SOLUCION: Realizaremos en primer lugar el ajuste por minimos cuadrados de nuestro modelo. Esta tarea puede automatizarse con el software econométrico Eviews utilizando los datos del fichero de trabajo (2-2.wf2), cargéndolo en el programa usando File > Open —> Eviews Workfile... y cligiendo el fichero en la ventana Open. Al pulsar Abrir se carga en memoria. Si queremos ver el contenido del conjunto de datos bastard con seleccionar todas las variables del modo habitual en Windows, hacer clic con el bot6n derecho del rat6n sobre la seleecidn y elegit Open —> As Group. Se ve asf el contenido de todas las variables del modelo como un grupo (Figura 2-22), Para realizar el ajuste MCO, se elige Quick —» Estimate Equation (Figura 2-22), se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 2-23) y se hace elic en Aceptar. Se obtienen los resultados de la Figura 2-24 (68 + © ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Satin trace Figura 2-29 Figura 2-24 Inicialmente el ajuste presenta no significatividad acusada de la constante y una significatividad muy alta tanto conjunta como de la variable empleo. Por otra parte parece que no hay autocorrelacién, ya que el estadistico de Durbin-Watson no se aleja demasiado de 2. El R’ también es muy alto (96%). Probaremos ahora si hay problemas de heteroscedasticidad. Para ello aplicamos el contraste de Goldfed-Quandt, que tequiere la ordenacién previa de forma ascendente de las variables del modelo segtin los valores de la variable que provoca la heteroscedasticidad (en nuestro caso empleo). Para ello utilizamos Proc —» Sort Current page (Figura 2-25) indicando able de ordenaci6n en la pantalla Sort Workfile Series (Figura 2-26). Sort Workfile Series Sort key(s) [ereted Enter ane ot mete eeries names of series exoressions Seat oder ascending Obeseending Figura 2-25 Figura 2-26 (© MTES-Paraninfos 68 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS ‘Ahora se ajusta el modelo con las primeras (1-c)/2 observaciones de la muestra ordenada con ¢ = n/3 = 18/3 = 6 Se tiene que (n-c)?2 = (18-62 = 6, con lo que la primera submuestra cconstaré de las primeras 6 observaciones. El ajuste del modelo con estas 6 observaciones se realiza, ‘con Eviews mediante Quick —» Estimate Equation y rellenando el campo Equation Specification de la solapa Specification como se indica en la Figura 2-27. Se elige Least Squares en el campo ‘Method para ajustar por minimos cuadrados, en el campo Sample se sia el rango muestral 1 6 y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-28. Passel falinelnens Raveena Figura 2-27 Figura 2-28 A continuacién se ajusta el modelo con las iitimas (7-c)/2 observaciones de la muestra ordenada, es decir con la tiltimas (n-c)/2 = (18-6)/2 = 6 observaciones, es decir de la 13 a la 18. El ajuste del modelo con estas 6 observaciones se realiza con Eviews mediante Quick —» Estimate Equation y rellenando el campo Equation Specification de la solapa Specification como se indica en la Figura 2-29, Se elige Least Squares en el campo Method para ajustar por minimos cuadrados, cen el campo Sample se sitéa el rango muestral 13 18 y se hace clic en Aceprar. Se obtienen los resultados de la Figura 2-30. (ex) Figura 2-29 Figura 2-30 Para obtener el valor del estadistico del contraste de Goldfeld-Quandt, se dividen los valores de las sumas de cuadrados residuales de las dos regresiones anteriores =2.92E+12/8,04E+10 usando Ia linea de comandos de Eviews (Figura 2-31). El resultado (36,3184) se obtiene en Ja linea de estado de la parte inferior de la pantalla (Figura 2-31). Ahora hay que calcular el valor de la funcién de distribucién de una F de Fisher Snedokor ((n-c)/2, (n-c)/2-k) en el punto 36,3184. Se escribe en la linea de comandos =@FDIST(36.318444) cuyo valor es 0.002115 (Figura 2-32). Como (0,002115<0,05 se rechaza la hipétesis nula de homoscedasticidad. Hemos detectado asf formalmente Japresencia de heteroscedasticidad, 7000 ITES-Pacaninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, in ican ta ica 39 ona Pesto bar nc iee ers eberisbess el | Figura 2 31 Figura 2 32 Para ajustar correctamente el modelo en presencia de heteroscedasticidad utilizaremos el método de estimacién de White. Para ello rellenamos la solapa Specification de la pantalla Equation Estimation (obtenida con Quick —> Estimate equation) como se indica en la Figura 2- 33. La solapa Options se rellena como se indica en la Figura 2-34 eligiendo la opeién White en el campo Heteroskedasticity consistent coefficient covariance. Al pulsar Aceptar se obtienen los resultados de la Figura 2-35. Se observa que la significatividad de la constante ha mejorado y que el resto de Jos indicadores de ajuste del modelo son buenos: K® muy alto, estadistico de Durbin Watson cereano a 2 y criterios de informacién de Akaike y Swartz con valores bajos. atic tonsa Skevoee ogre, | on a : Sa emer a wan SSE = Bacau Mn ee Di oer ot Gs) eee Figura 233 Figura 2-34 Fe )Prockouec) (nnt INemelrronse) Eematelrorecesstatelecite) Tepe Bat os Ssioseo “eos oom Tem prada SOE Sum squss rend Sima crtenon” — 39.41043 Duforanaoon sat Frobrcsiteie) OAD Figura 2-35 © MES Paraninfos 71 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS >2.3. El conjunto de datos 2-3.wfl contiene informacién agregada relativa al consumo final de las familias residentes (¥) y la renta bruta disponible de las mismas (X) por Comunidades Aut6nomas para el aio 1991. Con vistas a una posible construccién de grandes superficies, un grupo ‘empresarial quiere conocer como se explica el consumo final de las familias en funci6n de su renta bbruta disponible. Analizar e! modelo salvando los posibles problemas de heteroscrdasticidad. SOLUCION: Se trata de ajustar de forma razonable el modelo siguiente: Y= f+ BX+u Realizaremos en primer lugar el ajuste por mfnimos cuadrados ordinarios de nuestro modelo cargando el fichero 2-3.wfl mediante File —> Open — Eviews Workfile... y eligiendo el fichero en la ventana Open. Al pulsar Abrir se carga en memoria el fichero. Para realizar el ajuste MCO, se elige Quick —» Estimate Equation, se escribe la ecuaci6n del modelo a ajustar en el ‘campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 2-36) y se hace clic en Aceprar. Se obtienen los resultados de la Figura 2-37, i ete Fiano ‘aged pes tea 8 ‘ Figura 2-36 Figura 2-37 Inicialmente el ajuste parece correcto, pues hay significatividad al menos al 99% (p-valores de la T menores que 0.01) de todos los pardmetros y también hay fuerte significatividad global (p- valor de la F casi nulo). Por otra parte no hay auiocorrelaci6n, ya que el estadistico de Durbin- ‘Watson se acerca mucho a 2. El R’ es muy alto (superior al 99%), Pero dado que estamos trabajando con datos de corte transversal siempre existe el peligro de la heteroscedasticidad. Para detectar inicialmente Ia posible heteroscedasticidad realizamos el gréfico de residuos contra la tinica variable explicativa, que I6gicamente seria la responsable de la posible heteroscedasticidad. Para ello elegimos Quick > Graph — Scatter (Figura 2-38) y rellenamos la pantalla Series List como se indica en la Figura 2-39. Al pulsar OK se obtiene Ia Figura 2-40, Se observa que la distribucién de los puntos del grifico no es aleatoria. Ello nos lleva a ensayar contrastes formales de heteroscedasticidad. Utilizaremos inicialmente el contraste de White consistente en efectuar una regresién de los cuadrados de los residuos MCO sobre todas las variables independientes del modelo, sus cuadrados y sus productos cruzados de dos en dos, La homoscedasticidad se acepta al 95% silos p-valores de la Fy de los términos eruzados son mayores que 0,05. 7200 ITES-Pacannto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, tf sees coups ander sti expessns fe resio Figura 2-39 Figura 2-40 Eviews permite realizar el contraste de White de heteroscedasticidad desde la. pantalla Equation mediante View — Residual Tests — White Hetereroskedasticity (cross terms) (Figura 2-41). Se obtiene la Figura 2-42 en la que se observa que los p-valores de la Fy de los términos eruzados son _menores que 0,05, lo que nos lleva a aceptar formalmente la presencia de heteroscedasticidad al 95%. Be Ens 13h oars Pr ebayer | Crdopeeich = = espe tay a | ste tence outer) Figura 2-41 Figura 2-42 © MTES-Paranintos 73 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Adicionalmente podemos utilizar el contraste de Breusch-Pagan, que se realiza obteniendo los tesiduos del ajuste del modelo y considerando los cocientes g, entre los cuadrados de cada residuo del modelo original (RESID"2) y la estimacién MV de la varianza del error (suma de los cuadrados de los residuos/n = 1,08E+11/18=6000000000). Al realizar la regresi6n entre las variables g, y las variables culpables Z; (en nuestro caso s6lo la variable X) més la constante, la cantidad Q = SCE/2 se distribuye segtin una Chi-cuadrado con p-1 = 1 grados de libertad bajo la hipstesis nula de homoscedasticidad. SCE es la varianza explicada de la regresi6n anterior (suma de cuadrados explicados), Para realizar esta regresiOn con Eviews, se elige Quick — Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de 1a solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 2-43) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-44, Paste eel exerci) Soe tae 2 arin HE Bema ee woe Survscvred ee 1252627 Schwarz etnce Uubieeen st_“T7ei_ Fan =) Figura 2-43 Figura 2-44 La varianza explicada de la regresiGn anterior se calcula como SCE = SCT ~ SCR = SCRAI-R’) ~ SCR = 19.99527/(1-0,3319) = 19,9527 = 9,933288599 (Figura 2-45). SCE es la suma de ‘cuadrados explicados, SCT es la suma de cuadrados total y SCR es la suma de cuadtrados residual. El cestadistico de Breusch-Pagan es SCEI2 = 496666442995 y el p-valor seré el valor de la funcién de distribucién de una chi-cuadrado con un grado de libertad en el punto 9.933288599, que se calcula con Eviews introduciendo en la linea de comandos =@CHISQ(4. 96666442995, 1) cuyo valor es 0,02584 (Figura 2-46). Como el p-valor es menor que 0.05 se acepta la hipstesis de heteroscedasticidad. a Pe eee | Figura 2-45 7400 ITES-Pacaninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Una vez detectada la presencia de heteroscedasticidad en el modelo es necesatio corregirla en Ia estimacién del mismo. Para ajustar correctamente el modelo en presencia de heteroscedasticidad utilizaremos el método de estimacién de White. Para ello rellenamos la solapa Specification de 1a pantalla Equation Estimation (obtenida con Quick —> Estimate equation) como se indica en la Figura 2-47. La solapa Options se rellena como se indica en la Figura 2-48 eligiendo Ia opeién White en el campo Heteroskedasticity consistent coefficient covariance. Al pulsar Aceptar se obtienen los resultados de Ia Figura 2-49. Se observa que la significatividad de la constante ha mejorado y que el resto de los indicadores de ajuste del modelo son buenos: R” muy alto, estadistico de Durbin Watson cercano a 2 y criterios de informacién de Akaike y Swartz.con valores bajos. a ies) Ss ne ae ou aahoawae =m Pema | Sree Petree 4 Sageteeee | | Sia” sate 118 1 tatcant re ee me oo = Ces) Cen] Figua 7 Figun 8 peerless tele eeecloasheae Dependent Variable: Y Method: Least Squores Date 06/1205 Time: 20.27 Sample 118 Ineluged dosecatons: 18 ‘Whe Hotrockadsstety-Concitent St dard Enore& Covaiance Variable Coaticiet Std Ener 1Slatisie Prob c -asie405 zenes9 3072 on x 1167176 O0t6707 eaeBIG7 cn Reauared o.ee058 Adjusted R-squared 0957974 S032 a2iees, SE ofregresson 8196874 sree Sum squared resid 1.08E+I1 Schwarz enloron 25 65952 Log beebhond 28188 statistic aa7s2u4 Duin Wateon ett 2000527 Probate) 0.000000 Figura 2-49 Finalmente el modelo puede ajustarse como sigue: Y= -85184,05 + 1.167176 X+u AL interpretar los resultados del ajuste podemos decir que el aumento de una unidad en Ja renta disponible de las familias residentes en Espafia en 1991 produce un aumento de 1,167176 unidades en el consumo final de las citadas familias, Ello podsfa llevar al grupo ‘empresarial a tomar la decisi6n de la construccién de grandes superficies. (© MTES-Paranintos 75 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS >2.4, El archivo 2-4.»/1 contiene los datos relativos a la oferta monetaria MI, producto interior Dbruto PIB y tipos de interés R para la economfa canadiense con datos trimestrales desde enero de 1978 a diciembre de 1987. Con esta informacién se trata de explicar la demanda de dinero mediante la ecuaci6n siguiente Ln M1 = fy BilnPIB+ PrLnR+ w Ajustar el modelo teniendo presente los efectos de la posible heteroscesdasticidad condicional en caso de existir. SOLUCION: Si ajustamos el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 2-50 se obtienen los resultados de la Figura 2-51 Depend wii LOX Satie aye or Seok Figura 2 30 Figura 2.51 Inicialmente el ajuste presenta significatividad al menos al 97% (p-valores de la T menores ‘que 0,03) de todos los parimetros y también hay fuerte significatividad global (p-valor de la F casi nulo). Por otra parte puede exist autocorrelacién, ya que el estadistico de Durbin-Watson se aleja mucho de 2. El R” es muy alto (superior al 95%). A continuacién contrastamos la normatidad de los residuos ulilizando View > Residual Tests Histogram — Normality Test desde la pantalla Equation (Figura 2-52). Se obtienen los resultados de la Figura 2-53, Pedra) rete) Essel sales Dealers eNasensiel_C26i857 Probst) OOCtNOD Figura 2-52 Figura 2-53 7600 ITES-Pacaninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, En la Figura 2-53 se ve que los coeficientes de asimetria y curtosis residual estén précticamente en la frontera del intervalo [-2 y 2] para poder aceptar la normalidad con Teparos, circunstancia que también muestra el histograma. El contraste formal de Jarque-Bera acepta formalmente la normalidad de los residuos (p-valor mayor que 0,05). Para contrastar la posible heteroscedasticidad condicional, realizamos previamente el correlograma de los residuos al cuadrado utilizando View — Residual Tests > Correlogran Squared Residuals desde 1a pantalla Equation (Figura 2-54). Se obtiene el correlograma de la Figura 2-55, en el que se observan coeficientes significativos en el primer retardo (p-valor de 0,007 claramente menor que 0,05) y posiblemente en el segundo con p-valor de 0,014 también, ‘menor que 0,05. El tercer retardo ya no se considera porque su p-valor esté cerca de 0,05. eb eles Sane ii Gp oa 27m 609 2-o0re ote 20M Oo fe Sd Ew eae Re ee Tarn : 7 oan ce 7a oor ceo tat | 3 cu aoe ean oo re i] i | date ci aber on [To tq | 5.039.420 ta cos Se ampen 3 iq | 2ce ate mae oom Sescamict 3 ep Vi | Ste Gan Zion oom tpidted” brant Fate Pie tq |ioeu aap rat oor Figura 2-54 Figura 2-55 Ante esta situacién realizamos el contraste formal del multiplicador de Lagrange utilizando dos retardos en la estructura ARCH (p=2), Para ello se uiliza View —» Residual Tests > ARCH LM Test desde la pantalla Equation (Figura 2-56) con 2 retardos. Se obtienen los resultados de la Figura 2-57 donde, tanto el contraste de la F como el test de Engel del multiplicador de Lagrange (N*R?) aceptan la significatividad de los términos ARCH (p-valores menores que 0,05), Jo que muestra Ia existencia de una cierta heteroscedasticidad condicional Sremmnsenedersne ‘| Figura 2-56 (© MTES-Paranintow 7 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS La siguiente tarea es realizar Ia estimaci6n del modelo GARCH(p.q) mas adecuado para nuestros datos con p y q con valores méximos de 2 (derivados de la estructura del correlograma residual de la Figura 2-55. Comenzaremos ajustando un modelo GARCHQ,2) rellenando la solapa Especification de la ventana Equation Estimation con la ecuacién el modelo y eligiendo ARCH-Autoregressive Conditional Heteroskedasticity Figura 2-58). Se obtiene la Figura 2-59 en la que se elige GARCH/TARCH en su campo Model introduciendo los 6rdenes ARCH y GARCH deseados. La solapa Options se rellena segtin se indica en la Figura 2-60. Al pulsar Aceptar se obtiene el ajuste al modelo GARCH,2) de la Figura 2-61 Freon nei pane be ete a Figura 2-59 iecatpenire ae Siiccraiale Nein sence rt Clever eee sgt nee concionsate Ome Figure 2-60 Figure 2-6? Se observa que los coeficientes del GARCH(1) y el GARCH() son negativos (en Variance Equation), luego habré que prescindir de estos términos y ajustar un modelo ARCH(2,0) como estructura mas completa posible. Para ello se rellena la solapa Specification de la pantalla Equation Estimation como se indica en la Figura 2-62. Al pulsar Aceptar se obtiene el ajuste de Ia Figura 2-63 que presenta baja significatividad del coeficiente ARCH). Ello nos Hleva a considerar la estructura ARCH(1) rellenando Ia solapa Specification de la pantalla Equation Estimation como se indica en la Figura 2-63. Al pulsar Aceptar se obtiene el ajuste de la Figura 2-64 que presenta significatividades muy altas para los parémetros de las variables del modelo tanto individual como conjunta. La significatividad del término ARCH es casi el 90%. 7800 ITES-Pacannto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, cee) as ——— “ea aes caer ee eae ‘ant ) mento |_“ee_soret_ttis Seis seni rai ——E enter com Tove = | Figura 2-63 “ee Satya ar ein bast aa vs eee — Sanne = See = aor pin ‘aie aed z ck uses 2 - Ces] Figura 2-64 Figura 2-65 ‘También puede intentarse un ajuste a un modelo EGARCH (1,0) rellenando el campo ‘Model como se indica en la Figura 2-66. En la Figura 2-67 se presenta el ajuste que no resulta demasiado significativo ‘También puede intentarse un ajuste a un modelo PARCH (1,0) rellenando el campo ‘Model como se indica en la Figura 2-68. En la Figura 2-69 se presenta el ajuste que no resulta demasiado significativo, También puede intentarse un ajuste a un modelo CGARCH (1,1) 0 Component ARCH(L1), rellenando el campo Model segén la Figura 2-70. En la Figura 2-71 se presenta el ajuste que presenta significatividad dudosa de los términos ARCH, pero més aceptable que en los casos anteriores. Finalmente consideramos que 1a_heteroscedasticidad condicional se _ajusta adecuadamente considerando un modelo ARCH(1) 0 GARCH(1,0). El ajuste final seré: Ln M1 = -8,604807 + 1.484077LnPIB - 0,043736LnR + = Vu.) = 0,000309 + 0,721916 t.1? © MTES-Paranintos 78 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS. oe ie "Tova ten penn von he poner fats ee | ‘gee last fs ae cone ese Ii Lees) = Figure 2-66 amon Ce none anenn ‘SS aleepen ri ceetain ae vm ral Eee en Se ares Si oem | 7 = io s ae re I ence & Sate te Riieed dan Figura 2-68 Figura 2-69 | Sec Ops ‘Depron Vague LOOM" a Neots, eee ne let Steen sce een isi eto att ‘eed SSB SBE Soc ee SESE | nape mom Teint Guan Ph cua I peo iene ee eee ‘Saaoar ‘arent instore 9 Figura 2-70 Figura 2-71 80+ © ITES-Paraninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Tratamos de explicar las importaciones (IMP) mediante el consumo (CONS) y la inversion (INV) disponiendo de los siguientes datos: IMP PIR CONS INV. IMP PIB CONS. INV. IMP PIB CONS. INV. 159 14931081 42t6#—SIZtS L190 2H 19117551269 HL8S_18OB 1321S 20819073772 227-021-4602 265212456281 -2261 1623.50 216 © (2319-64351 26323901676 = 72580176856 333-2698 1866 3937028841997 3143330482139 46 490 3234 «2238 «7050333682320 125653539 2429S INS + PRINV + « analizando Ajustar de forma razonable el modelo IMP = + APIB + By los posibles problemas. SOLUCION: Si introducimos los datos en el archivo 2-S.nfl y, después de cargarlo en memoria, ajustamos el modelo por MCO rellenando Ia pantalla Equation Estimation de Eviews como se indica en la Figura 2-72 se obtienen los resultados de la Figura 2-73. pate Preks] Flere Eomoranas Pr seve ae Figura 2-72 Figura 2-73 Se observa Ia no significatividad de ninguna variable explicativa y la gran significatividad del modelo en su conjunto (p-valor de la F igual cero). Esto nos leva a sospechar la presencia de multicolinealidad. También se observa posibilidad de autocorrelacién residual (p-valor de Durbin-Watson problemético por estar alejado de 2). Ademés, si ajustamos el modelo sin la sitima observacién para cada variable, se obtienen estimadores muy distintos de los anteriores, lo que confirma la multicolinealidad. Las Figuras 2-74 y 2-75 presentan la pantalla Equation y el resultado de este ajuste. Por otto lado, si calculamos la matriz de correlaciones de las variables explicativas, observamos que presenta ciertos valores demasiado altos, lo que corrobora la presencia de multicolinealidad en el modelo, Para ello, seleccionamos dichas variables en la pantalla Workfile, hacemos clic con el bot6n derecho del ratén y elegimos Open — as Group. Una vez «que las variables son un grupo elegimos View —» Correlations — Common Simple (Figura 2-76) y obtenemos la matriz.de correlaciones de la Figura 2-77. Se observa que Ia correlaci6n entre el PIB y el consumo es muy alta (0,998933), Evidentemente este hecho provoearé problemas de multicolinealidad en el modelo, © MTES-Paraninfos 81 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS be =a raed ange Bae anon fre 27 Moose sam z en epoch ES teins as soo an ficeetie ae Figura 2-74 Figura 2-75 Figura 2-76 Figura 2-77 Para estimar el modelo con multicolinealidad podemos utilizar la Regresién en cadena tomando como valor del pardmetro de cadena c = 0,06 (es el nimero entre 0,001 y 0,1 que mejor ajuste proporciona para el modelo de entre los que estén en Ia parte central del intervalo [0.001, 0,1)). La regresién en cadena ofrece como estimadores de los parametros (X’X+cl)" X’Y siendo ¢ la constante adecuada. La matriz de varianzas covarianzas es 0 (X'X+cl)X'X(X'X+cl)'. En la practica suele tomarse ¢ como un valor més © menos centrado entre 0,01 y 0,1 que hace que el ajuste sea bueno en cuanto a.R° y significatividad individual y conjunta. El resultado para nuestros datos con ¢=0,06 es el siguiente 172.54 B=(ex s00612)' xy | 00120 04143353 0.428728 XO.-’ 5. ¥ . 7: Ra PY-1Y* _ BY —TP* _po4sor Soy a Se obtienen entonces los siguientes resultados para la estimacién del modelo ya sin multicolinealidad: 8268 ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Parémetro CONSTANTE “172,54 PIB 0.09162 CONSUMO 0.14335, INVERSION 0.42872 R-cuadrado = 94,5078 porcentaje R-cuadrado (adaptado para g..) = 93,3309 porcentaje Error estindar de la est. = 23,0059 T =18 es el mimero de observaciones, I es la matriz identidad y las matrices X e ¥ inmersas en los eélculos de este problema son las siguientes: 1493 108142 159 1755 1269 31 191 2021 1460 21 227 2319 1643 SI 216 2698 1866 39 3234 2238 70 1612 1148 41 1808 1321 11 2124 1541 56 2390 1676 7 2884 1997 31 3368 ©2320 12 11S 1232 31 1907 1377 22 2261 1623 50 2580 1768 56 3045 2139 46 3539242945, Para cada una de las 17 Comunidades Aut6nomas el archivo 2-6.w/1 contiene informacién acerea de los ingresos de explotacién INEX, el consumo CONS, los gastos de personal GPER y los gastos de explotacién GEX relativos a un determinado sector de actividad. También se tiene informacién del mimero de ocupados en el sector PEROC. A partir de esta informacién se trata de ajustar el modelo siguiente: INEX= fi + i, CONS + GPER + GEX + Detectar los posibles problemas en el ajuste y resolverlos de la forma més adecuada. SOLUCION: Si cargamos en memoria el archivo 2-5.w/l y ajustamos el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 2-78 se obtienen los resultados de la Figura 2-79, © MTES-Paranintos 88 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS Hy mes nga ae ooo i a AijmsR-camed 19ers $0 unenant Ge Ge) Figuca 278 Se observa significatividad individual problemética de las variables explicativas y una gran significatividad del modelo en su conjunto (p-valor de la F igual cero). Esto nos leva a sospechar Ia presencia de multicolinealidad. No se observan problemas fuertes de autocorrelacién residual (estadistico de Durbin-Watson no demasiado alejado de 2). Por otro lado, si calculamos la matriz de correlaciones de las variables explicativas, observamos que presenta ciertos valores demasiado altos, lo que corrobora la presencia de ‘multicolinealidad en el modelo. Para ello, seleccionamos dichas variables en la pantalla Workfile, hacemos clic con el bot6n derecho del ratén y elegimos Open —» as Group. Una vez ‘que las variables son un grupo elegimos View —» Correlations —* Common Simple (Figura 2-80) y obtenemos la matriz de correlaciones de la Figura 2-81. Se observa que las correlaciones entre Jas variables explicativas son muy altas. Evidentemente este hecho provocaré problemas de multicolineatidad en el modelo. Figura 2-81 Por otto lado, el valor absoluto del determinante la matriz de correlaciones es muy equefio (\Ru| = 0,000033924). Ademés, los autovalores de la matriz Re, son Az = 0,00985, x = 0,001152 y As = 2,98899, con lo que tenemos el siguiente valor para el indice de condicién: Pou _ [298899 _ Ha)= = loose 7509 04 68 ITES Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Como el determinante de la matriz de correlaciones es muy pequefio ya hay sintomas de multicolinealidad fuerte, pero ademés, el indice de condicién es mayor que 30, lo que corrobora la presencia del problema de la multicolinealidad. Adicionalmente podemos calcular los fuctores de inflacién de la varianza FIV. El factor de inflacién relativo a la variable CONS se calcula a partir del R® de la regresién de CONS sobre las restantes variables explicativas GPER y GEX (Figuras 2-82 y 2-83), ee ee TIT os ae eS ied Reqs Setoar fas Figura 2-82 Figura 2-33 Tenemos FIV(CONS) = 1/(1-0,996352) = 274,122, valor muy superior a 10 que indica ‘que esta variable esté inmersa en problemas de colinealidad. El factor de inflacién relativo a la variable GPER se calcula a partir del R? de la regresién de GPER sobre las demas variables explicativas CONS y GEX (Figuras 2-84 y 2-85). Siofom nanan =) Figura 2-84 Figura 2-85 ‘Tenemos FIV(GPER) = 1/(1-0,9922389) = 131,38, valor muy superior a 10 que indica que esta variable esta inmersa en problemas de colinealidad, El factor de inflacién relativo a la variable GEX se calcula a partir del K? de la regresién de GEX sobre las dems variables explicativas CONS y GPER (Figuras 2-86 y 2-87). © MES Paranintos 85 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS Wkecween sia Sas Pes) Figure 2-86 Figura 2.87 ‘Tenemos FIV(GEX) = 1/(1-0,998229) = 564,65, valor muy superior a 10 que indica ‘que esta variable esta inmersa en problemas de colinealidad. Para la deteccién de 1a multicotinealidad podemos utilizar también el contraste de Farrar-Glauber basado en el estadistico G = -{T-1-(2k+5)/6]Ln|Rol que bajo la hipstesis nula de no multicolinealidad es una Chi-cuadrado con k(k-I)/2 grados de libertad. T = 17 e3 el tamaiio muestral, k = 4 el ntimero de variables en el modelo y Rela matriz. de correlaciones de las variables explicativas. Segiin estos datos se observa que G = 142.36 y la Chi-cuadrado tiene 6 grados de libertad. Como el p-valor de este contraste (calculable en Eviews mediante \CHISQ(142.3641, 6)) es casi cero, se acepta la presencia de multicolinealidad Para solucionar ef problema de la multicolinealidad podemos considerar tas variables ratio resultantes de dividir las variables del modelo entre las personas ocupadas en el sector de actividad, para considerar asf el modelo en variables per c4pita. Ajustamos el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 2-88 y se obtienen los resultados de la Figura 2-89. Figura 2-68 Figura 2-89 Se observa un buen ajuste, tanto por la significatividad individual de las variables per eépita del modelo (superior al 99% salvo el consumo, superior al 90%), como por su alta significatividad conjunta. El R* es muy alto y_el estadistico de Durbin Watson es précticamente 2, lo que elimina sospechas de autocorrelacin. Ademés, los riterios de informacién tienen un valor muy bajo. Podemos probar la normatidad de los residuos desde 1a pantalla Equation mediante View — Residual Test — Histogram ~ Normality Test (Figura 2-90). 96 + © ITES-Paranito MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Figura 2.90 Figura 2.91 En la Figura 2-91 se ve que los coeficientes de asimetria y curtosis residual estén précticamente en la frontera del intervalo [-2 y 2] para poder aceptar la normalidad con reparos, citcunstancia que también muestra el histograma. El contraste formal de Jarque-Bera acepta formalmente la normalidad de los residuos (p-valor mayor que 0,05). Solo faltarfa analizar Ia ausencia de heteroscedasticidad en el modelo, Para ello utilizamos el contraste de White desde Ia pantalla Equation mediante View —» Residual Test ~ White Heteroskedasticity (no cross terms) (Figura 2-92). En la Figura 2-93 se observa que las probabilidades relativas a la F y a la Chi-cuadrado son mucho mayores que 0,05, lo que nos eva a aceptar Ia ausencia de heteroscedasticidad. fost SW Ew Vata Ps Soap ett eager tarot eet 2 2 ee Died Papaet 01 Werte ore SE angen 9: a Simsquednst 07000 Sawarateen Logileheo 22085 ease Figura 2-92 Figura 2-93 Se llega a la conclusién de que el modelo correctamente ajustado seré el siguiente: INEX/PEROC: 1,466 - 0,257 CONS/PEROC - 1,22 GPER/PEROC + 1,379 GEX/PEROC + u También suele ser una soluci6n para el problema de la multicolinealiad eliminar del modelo alguna variable no significativa. Por ejemplo, en caso de que no se considerase suficientemente significativa la variable CONS/PEROC (p-valor = 0,0938), puede eliminarse del modelo y realizar el ajuste sin ella (Figuras 2-94 y 2-95). Se observa que el nuevo ajuste es muy significativo individualmente y en su conjunto, (© MTES-Paranintos 87 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS eS ea eater see 7 Sehmecooon ee Figura 2-94 Figura 295 Una multinacional trata de analizar la relacidn existente entre el grado de estrés de los trabajadores ¥, medido a partir del tamafio de la sucursal en que trabajan X;, el ntimero de afios que llevan en el puesto de trabajo actual X>, el salario anual percibido Xs y la edad del trabajador X;. Para ello se Aispone de las observaciones contenidas en el archivo 2-7.¥f1 Se trata de obtener el modelo lineal mejor especificado que explique el grado de estrés de los trabajadores en funcién de las restantes variables y que se juste alos datos dados. SOLUCION: Inicialmente consideraremos €! modelo completo. Para realizar el ajuste lineal con Eviews, se elige Quick —> Estimate Equation. Se rellena la pantalla Equation Specification de la solapa Specification como se indica en la Figura 2-96), se elige Least Squares en el campo Method (para ajustar por mfnimos cuadrados) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-97, — ising reese cae =e Figura 2-96 Figura 297 Se observa que todos los pardmetros estimados (Salvo el coeficiente de X2) son significativamente distintos de cero al 95% (p-valores menores que 0,05) y que la significatividad conjunta es muy alta (p-valor de la F muy pequefio). El R’ y el R” ajustado son 0.84 y 0,78 respectivamente (muy altos) con Io que 1a variabilidad explicada es alta. La desviacién tipica estimada del error es 24,03 y los ctiterios de informacién de Akaike y Schwartz tienen valores pequeiios con lo que la capacidad explicativa del modelo es buena. El estadistico de Durbin Watson tiene un valor no demasiado alejado de 2, lo que indica ausencia de posibles problemas de autocorrelacién, 98 + © ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Dado que la variable X; ha resultado no significativa individualmente, comprobaremos si es una variable redundante a través del ratio de verosimilitud y hay que eliminarla de la especificacién correcta del modelo, Para ello, sobre la pantalla Equation, elegimos View — Coefficient Tests —> Redundant Variables — Likelihood Ratio (Figura 2-98) y situamos la variable Xz en el campo One or more test series de 1a Figura 2-99. Al pulsar OK se obtiene Ia salida de la Figura 2-98, Dado que los p-valores de la F y de la razén de verosimilitud son mayores que 0,05 aceptamos la hipstesis de que la variable X, es redundante, Ademés, la Figura 2-100 presenta el modelo ajustado sin Ia presencia de la variable X 1 esate is 950@ venconantar Tet trast apes ft Ruel ere Shacewen” ee || Srtuanims Srcai Seneerennon Sika ee Bianca Stacia Pease 298 Figuea 2-99 Prete] Poel rar Fen Eve) a Friel Pueemeate) OLD Figura 2-100 En Ia Figura 2-100 se observa que todas las variables del modelo han aumentado su significatividad (p-valores mas pequefios) y los valores de R’ son mejores (més altos) al celiminar la variable X2 del modelo. La significatividad conjunta de los pardmetros del modelo también ha mejorado (p-valor de la F mas pequeiio). Observando los coeficientes estimados se deduce que un aumento en una unidad Ia variable X; provoca un aumento en ¥ de 0,16 unidades suponiendo constantes el resto de las variables. Un aumento de una unidad en la variable X; con las demés variables constantes provoca un aumento en ¥ de 1,42 unidades. Para la variable X, el aumento es superior (1,75). © MTES-Paranintos 88 ECONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS Se ve que al eliminar del modelo la variable Xz, los efectos de las variables independientes sobre la variable dependiente han disminuido levemente. Por lo tanto, la introduccién de la variable redundante en el modelo provocaba una sobreestimacién de los efectos de las restantes variables sobre la variable dependiente. No obstante, para comprobar que el modelo sin la variable X2 esta bien especificado definitivamente, sera necesario comprobar que X> no es una variable omitida a través del ratio de verosimilitud. Para ello, sobre la pantalla Equation, elegimos View — Coefficient Tests > Omitted Variables — Likelihood Ratio (Figura 2-101) y situamos la variable Xz en el campo One or more test series de la Figura 2-102. Al pulsar OK se obtiene la salida de la Figura 2-103, Figura 2-108 SEahepersen 2003103 Sokerio cence SUT75 eelidinas R250 Ewe as Deki ta Deate Feats) GOMER Figura 2-103 Figura 2-104 Las altas probabilidades de la F y del logaritmo del ratio de verosimilitud indican que hay que aceptar la hipétesis de que la variable Xz no es relevante para explicar la variable ‘end6gena. Podemos por tanto omitirla en el modelo. El ajuste final del modelo sera el especificado en Ia Figura 2-100. 190+ © ITES- Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Hubiera sido equivalente el contraste de redundancia (u omisién) de X, a haber contrastado la significatividad del regresor individual X; mediante el test de Wald obtenido mediante View — Coefficient Test > Wald — Coefficient Restrictions (Figura 2-104) y situando 1a nulidad del ppardmetro C(3) de Ta variable Xzen la pantalla Wald Test de la Figura 2-105. Al pulsar OK se obtiene Ja salida de la Figura 2-106. Las altas probabilidades de Ia F y del logaritmo del ratio de verosimilitud indican que hay que aceptar la hipstesis de que la variable X, puede considerarse mula para explicar la variable endégena, Podemos por tanto omitira definitivamente en el modelo. Euston Units Test Sinise vow f_Proabity Fatt Denso? G1) Cases chee Decor aa a ypthesisSuary mated Resi Vaue Sid Stems | Spee tao CO} Coan] Figura 2-105 Figura 2-106 >2.8. El archivo 2-8.fl contiene diferentes partidas del balance de varias empresas referido a un ¢’jercicio determinado (1996-1997). Concretamente contiene el valor afiadido (VA), el inmovilizado neto (IN), el beneficio después de intereses ¢ impuestos (BDID, el activo total (A), las ventas (VIAS), las reservas (RESERVAS), el capital social (CAPSOC), los gastos financieros (GF), las deudas totales (D1), la capacidad de autofinaciacién (CAAU), el activo citculante (ACIRO), las deudas a corto plazo (DCP), el dividendo del afto anterior (DIV96), el dividendo actual (DIV97), el impuesto de sociedades (ISOC), las existencias (EXISTENCIAS) y las tasas de variacién con respecto al ejercicio anterior del activo (7VA), del inmovilizado neto (VIN), de los fondos propos (IVEP)y de las ventas (TVV), Se trata de obtener el modelo lineal mejor especificado que explique el ratio dividendos/(beneficios después de intereses e impuestos) en funcién del ratio ventas/(activo total), de la tasa de variacién del activo total, de la tasa de variacién de los fondos propios, del ratio (deudas totales)/(recursos. propios), del ratio (beneficio antes de intereses e impuestos)/(gastos financieros), del ratio (activo Residual Tests > White Heroskedasticity (no cross terms) segin la Figura 2-116 y obtenemos la salida de la Figura 2-117 en la que se observan valores para la F y la Chi-cuadrado superiores a 0,05, lo que indica ausencia de problemas de heteroscedasticidad. 9468 ITES Parente MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, ke) fore im Ear aT as = foray Eanelonslalire Pm Fea) on Pr ChShusy Ose Acid Rgoent i ‘Gas OSD osm ier et __AM Desa) Cie ams ear Figura 2116 Figura 2 11? Si sobre el modelo final estimado (sin las tres variables redundantes) elegimos View —> Representations (Figura 2-118) obtenemos la salida de la Figura 2-119 en la que se observa la ‘ecuaci6n final del modelo estimado. — ee pase tos sein ‘anes seened en Figura 2-118 Figara 2-119 > 2.9. El archivo 2-9.w/l contiene datos para la economia espaiiola desde 1970 a 1993 sobre los ingresos del sector pilico INGPUB, el PIB, el ahorro privado AHORRO, las importaciones IMPORT y las exportaciones EXPORT. Se trata de encontrar un modelo adecuado que explique los ingresos del sector puilico en funci6n del PIB, el ahorro privado, las importaciones y las exportaciones. SOLUCION: Inicialmente se ajusta el modelo por minimos cuadrados ordinarios usando File > Open —> Eviews Workfile... y eligiendo Quick — Estimate Equation. Se escribe 1a ecuacién del modelo a ajustar en el campo Equation Specification de 1a solapa Specification (Figura 2-120), se elige Least Squares en el campo Method (pata ajustar por minimos cuadrados) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-121. Se observa {que todos los parimetros estimados (incluida la constante) son significativamente distintos de cero (p-valores muy pequefios que indican una significatividad individual muy alta para los parémetros). La significatividad conjunta también es muy alta porque el p-valor de la F es pricticamente nulo, El R’ y el R” ajustado son 0,991 y 0,99 respectivamente (muy altos), © TES Paranintos 95 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS ‘wel Si) Dra Vrs NGPUE ad se ied Ue Sas (Cone at say angen Dae canbor tie 171 Seritarsth rogeeerbated rath Sere 190 Fe por ‘eat oe Breer Ueto le oc = am cael MondRenaet S200 Sbimewaer Got Bt Aatefocten 226m aa Sctmareition” 255051 at Fees sass iia Prbpstaiste) CUD SE censor Si aqures eo ei Debts Figura 2-120 Figura 2-121 Sin embargo, el valor del estadistico de Durbin Watson esté demasiado alejado del valor 2, lo que podrfa provocar problemas de autocorrelacién, Seria interesante también estudiar los posibles problemas de no linealidad. Para ello realizamos el gréfico de residuos contra las variables explicativas, que han de ser aleatorios. Par ello elegimos Quick —> Graph > Scatter (Figura 2-122) y rellenamos la pantalla Series List ‘como se indica en la Figura 2-123 con el objeto de graficar los residuos contra el PIB. Al pulsar OK se obtiene Ia Figuras 2-124. Se observa que la distribucién de los puntos del gréfico no es aleatoria (la nube de puntos podria ser ajustable por una parabola). Ello nos eva a ensayar contrastes formales de especificacién del modelo, pot ejemplo el test RESET de Ramsey. Para ello elegimos View — Stability Tests > Ramsey RESET (Figura 2-125) y tomamos una sola potencia para la variable endégena ajustada (Figura 2-126). Al pulsar OK se obtiene la salida del test RESET de Ramsey de la Figura 2-127. Los p-valores de la F y de la Chi- ‘cuadrado de razén de verosimilitud son menores que 0,05, con lo que rechazamos la hipétesis de linealidad, o més generalmente, de especificacién correcta del modelo. Rew Cee Menara Aged Requed DSI S0.seperdetw GSIEt SEveyeton ENED Alkelnecenan 20 Sim atuaed old 060 Sowurctow” 252031 Gguiaiest” 2m Fate Sore Dubie ti 136 Powis) ON Figara 2-122 Figura 2-123 96 + © ITES-Paraninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, aaa Tasreo Peurtant) tad Figura 2 125 Fensay RESET Tot riates fab ches) Somes USE Seti Nt ato Torn ram aoe rat dome = bse! OnMee 72me Ma aom3 DID 2568 Ome ‘area Dera) “Sae® —ND tomes: series) Sta osm esi Osman cara OBIS Assert cieron 22880 oie core STE? Stneedor 258051 HGrHt} Asie tocrenn oS —— pa bncorn J38i032 Fatoitie ‘es 0013 ib taon a SEHO _Frestste) OOH [ebm weson t_PUssiOt Pro sitete) CUD Figura 2-126 Figura 2-127 ‘Como en la Figura 2-124 se observaba que la nube de puntos de la reprersentacién del PIB respecto de los residuos del modelo podia ajustarse por una parabola, ello nos leva a pensar en introducir el PIB al cuadrado como nueva variable del modelo. EI nuevo modelo se ajusta ahora usando File —» Open —» Eviews Workfile.. y eligiendo Quick —» Estimate Equation, Se escribe la ecuacién del modelo en el campo Equation Specification de 1a solapa Specification (Figura 2-126), se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-127. Se observa que todos los parémetros estimados (incluida la constante) son sighificativamente distintos de cero (p-valores muy pequefios que indican una significatividad individual muy alta para los parimetros). La significatividad conjunta también ‘es muy alta porque el p-valor de la F es préeticamente nulo. EL Ry el R*ajustado son 0,996 y 0.995 respectivamente (muy altos y mejores que en el ‘modelo inicial). Ahora ya no se observan problemas de autocorrelacién ya que el estadistico de Durbin Watson es pricticamente 2 © MTES-Paranintos 97 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS es 5 ooo A a fee SoD GE) Figura 2126 Figum 2127 Para analizar la posible heteroscedasticidad utilizaremos el contraste de White consistente en efectuar una regresién de Jos cuadrados de los residuos MCO sobre todas las variables independientes del modelo, sus cuadrados y sus productos eruzados de dos en dos. La homoscedasticidad se acepta al 95% si los p-valores de la Fy de los términos eruzados son mayores que 0,05. Desde Ia pantalla Equation mediante View —» Residual Tests > White Heteroskedasticity (no cross terms) (Figura 2-128) se obtiene la Figura 2-129 en la que se observa que Jos p-valores de la Fy de los términos eruzados son mayores que 0,05, lo que nos lleva a rechazar formalmente la presencia de heteroscedasticidad al 95%. [racine osu pee fewo came Bhcrnaes Ratan et Erna Eerie Rare smd 3D epee Figura 2-128 Figara 2-129 Podemos probar la normatidad de los residuos desde 1a pantalla Equation mediante View —> Residual Test + Histogram ~ Normality Test (Figura 2-130). En la Figura 2-131 se ve que los coeficientes de asimetria y curtosis residual estan practicamente en la frontera del intervalo [-2 y 2] para poder aceptar la normalidad con reparos, circunstancia que también muestra el histograma, El contraste formal de Jarque-Bera acepta formalmente Ia normalidad de los residuos (p-valor mayor que 0,05). Mediante View —> Representation se obtiene el modelo final ajustado (Figura 2-132). (98 + © ITES-Paraninto MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Sony Ts cag soos sm, Sar ee peer PRM 2 Waerersietatey go centers) Rawr rt a JAdured esqured D995 SD. depmaeriva BIE! Sum squsted esd 391889 Schwarzcrtenon 1 S230 Dest Wotcon tat 20615 ProfFstste) ——_c.0nn00| Figura 2-130 Figura 2-131 sina Canton Figura 2-132 2.10. El archivo 2-10.w/1 contiene datos sobre un modelo de demanda de productos agricolas. El ‘modelo involuera las variables DEMANDA, PRECIO, INGRESOS y PRECIPIT que indican el nivel de demanda y el precio del producto, asi como los ingresos del consumidor y el nivel de precipitaciones respectivamente. Se trata de ajustar a los datos un modelo adecuado que explique la ‘demanda del producto en funcién de su precio y los ingresos del consumidor. SOLUCION: Al tratarse de un modelo de demanda pueden existir problemas de regresores estocisticos, es decir, que los errores de la variable dependiente estén correlacionados con la variable © vatiables independientes. Para probarlo utilizaremos el contraste de Hausman tomando como {nstrumento para los precios un retardo de los mismos y para los ingresos el nivel de precipitaciones recipit. Esté claro que hay correlaciGn entre cada variable y su instrumento (las precipitaciones influyen sobre los ingresos y toda variable esta correlacionada con un desfase de la misma). Para probar la endogeneidad de los precios aplicamos el contraste de Hausman. Para ello, en un primer paso planteamos la regresi6n de Ia variable precios respecto a su instrumento, precios(-1) con el objeto de calcular los residuos resid01. Se elige Quick —» Estimate Equation. Se rellena la pantalla Equation Specification de la solapa Specification como se indica en la Figura 2-133, se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar. Ahora para guardar los residuos en la variable resid0/ elegimos proc—> Make Residual Series (Figura 2-134) y eseribimos el nombre resid01 en la Figura 2-135. Al pulsar OK, la Figura 2-136 muestra la variable resid01 como otra variable del conjunto de datos. © MTES-Paranintos 99 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS A continuacién, en un segundo paso, realizamos la regresién de la variable dependiente del modelo inicial demanda respecto de la variable precios y la variable resid01 Se elige Quick — Estimate Equation. Se rellena la pantalla Equation Specification de 1a solapa Specification como se indica en la Figura 2-137, se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-138 en la que se observa una significatividad muy elevada de la variable resid01. Ello nos lleva ‘ aceptar la endogeneidad del regresor precios segtin el contraste de Hausman, sou oa Pecoor1) OUD ua pose Sass oe sie (ase Po ESTeepnsn Ske olebocneiny $1235 She on Petts) Figura 2-133 feted 2 redone oe ater isalicltet 2 rer ie Page Figura 2134 irate me cele 2 ajo Ragan Figura 2-136 SNE Ome an Siew Soe cote ns | |) Seer sitet Cagreovese Denes Aebrete —_OOUGto Figura 2-137 Figura 2-138 100+© 1TEs-Paranino MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, Para probar la endogeneidad de los ingresos mediante el contraste de Hausman, en un primer paso planteamos la regresi6n de la variable ingresos respecto a su instrumento precipit con el objeto de calcular los residuos resid02. Se elige Quick + Estimate Equation, Se rellena la pantalla Equation Specification de 1a solapa Specification como se indica en la Figura 2-139, se lige Least Squares en el campo Method (para ajustar por mfnimos cuadrados) y se hace clic en Aceptar. Abora para guardar los residuos en la variable resid02 elegimos proc—> Make Residual Series y eseribimos el nombre resid02 en la Figura 2-140, Al pulsar OK, la variable resid02 es ya otra variable del conjunto de datos. A continuacién, en un segundo paso, realizamos la regresién de la variable dependiente del modelo inicial demanda respecto de la variable ingresos y la variable resid02. Se elige Quick — Estimate Equation. Se rellena la pantalla Equation Specification de 1a solapa Specification como se indica en la Figura 2-141, se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 2-142 en la que se observa una significatividad muy elevada de la variable resid02. Ello nos lleva ‘ aceptar la endogeneidad del regresor ingresos segin el contraste de Hausman, Sinn Tones oe oe tse aoe ites ti soe | | Samsun "er ioe ee | tmclomnin (Ese) PA Ga ee) = Figura 2-139 Figura 2-140 eee oth lee core Teo Lioness SOA, ‘Asjused squares O55S2H3 SD. dependant et 2413 ae San Soa Figura 2-141 Figura 2-142 Ahora ajustaremos el modelo utilizando variables instrumentales mediante el método de ménimos cuadrados en dos etapas. Se tendré en cuenta que hay que introducir como instrumentos por lo menos las variables ex6genas y sus instrumentos, (© MTES-Paraninfo 101 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Para realizar el ajuste por mfnimos cuadrados en dos etapas en Eviews se elige Quick > Estimate Equation, Se rellena la pantalla Equation Specification de la solapa Specification ‘como se indica en la Figura 2-143 seleccionando en el campo Method la opcién TSLS ~ Two- Stage Least Squares (TSNLS and ARMA). En el campo Instruments List se introducen como instrumentos las variables ex6genas y sus instrumentos. En el campo Equation Specification se introducen las variables del modelo a ajustar. Al hacer clic en Aceptar se obtienen los resultados de la Figura 2-144, Depend Vel DEMAND Matos Two-Stage eat Sues Dae CHOOT Tee 139, Sue bate 210 Instn eran 9 at adutete Ti enemas can PReco —oueet Deze a _ Sing iS FST Raa Ave awa ied Racuend OCHO 2M SE drawn |S nove Dacian ta nies Gea) en) Figura 2 13 Figura 2 14 La significatividad de las variables es como poco del 90% y Ia significatividad de la cconstante se aproxima al 80%. Tampoco hay problemas de autocorrelacién porque el estadistico de Durbin Watson se aproxima a2. El modelo ajustado tiene la siguiente expresidn: Demanda = -20,46684 + 5,652682 ingresos ~ 0,638641 precio Légicamente la demanda es directamente proporcional a los ingresos (signo positivo del coeficiente estimado) ¢ inversamente proporeional al precio (signo negativo del coeficiente estimado), siendo Ia influencia de los ingresos sobre la demanda del producto bastante superior a la del precio de dicho producto, Para analizar la posible heteroscedasticidad utilizaremos el contraste de White. Para ello, desde a pantalla Equation mediante View — Residual Tests —> White Heteroskedasticity (no cross terms) (Figura 2-145) se obtiene la Figura 2-146 en la que se observa que los p-valores de la Fy de los ‘términos eruzadlos son mayores que 0,05, lo que nos eva a rechazar formalmente Ta presencia de heteroscedasticidad al 95%. Podemos probar la normatidad de los residuos desde 1a pantalla Equation mediante View — Residual Tests > Histogram ~ Normality Test (Figura 2-147). En la Figura 2-148 se ve que los coeficientes de asimetria y curtosis residual estén précticamente en Ia frontera del intervalo [-2 y 2] para poder aceptar la normalidad con reparos, circunstancia que también muestra el histograma. El contraste formal de Jarque-Bera acepta formalmente Ia normalidad de los residuos (p-valor mayor que 0.05), 102+ © 1WES-Paraino MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, ir nae) Fellelnc) efanc t toca pa Etna Oto ane, Si ‘avtatasf Conese | aguemets ot os = ree rata Conte ae — — = Sanyier 9) cnbpanagaet rts a oa Raused Ase space SE cersin Fatuste Pasi) 0 Pau tee) Figura 2-145 Figura 2-146 ERT ZT Cutmvien sia 7 Sr Od soe ee] Cente een le] iter Pece0 PREC ; ee Figura 2-147 Figura 2-148 » 2.11. EI archivo 2-11.wfl contiene datos sobre las variables X e Y. Se quiere ajustar un modelo de regresin que tenga Y como variable dependiente y X como variable independiente, pero resulta ‘que por errores de medicin o inobservabilidad de ia variable X se dispone realmente de sus datos recogidos en la variable XE. Realizar un ajuste adecuado para el modelo. SOLUCION: Al tatarse de un modelo con errores de medicién en Ia variable explicativa, seré necesario utilizar variables instrumentales para ajustar el modelo. Un método para obtener estimadores MCO consistentes de los parémetros consiste en susttuir la variable explicativa sujeta a errores de ‘medici6n por otra variable (denominada variable instrumental) que est muy correlacionada con la variable explicativa original y que es indepediente del término de error. La variable instrumental mas sencilla que se utiliza generalmente en modelos con errores de medicién en las variables suele ser la propia variable explicativa con errores retardada, en nuestro aso XE(-1). Pero, para que XE(-1) sea un ‘buen instrumento de XE, es necesario probar que es independiente del témino de error (endogeneidad de XB), También es necesario probar que XE y XE(-1) estén muy correlacionadas. Para probar la endogeneidad de XE aplicamos el contraste de Hausman. Para ello, en ‘un primer paso planteamos la regresién de la variable XE respecto a su instrumento XE(1) con el objeto de calcular los residuos resid01 © MTES Paraninfow 108 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Se elige Quick — Estimate Equation. Se rellena la pantalla Equation Specification de la solapa Specification como se indica en Ia Figura 2-149, se elige Least Squares en el campo ‘Method (para ajustar por mfnimos cuadrados) y se hace clic en Aceptar. Ahora para guardar los residuos en Ia variable resid01 elegimos proc Make Residual Series (Figura 2-150) y escribimos el nombre resid0/ en la figura 2-151. Al pulsar OK, la variable resid01 como otra variable del conjunto de datos. Ademés, la fuerte significatividad individual del parémetto cestimado de XE(-I) en su regresién con XE indica que ambas variables estén corrrelacionadas A continuacién, en un segundo paso, realizamos la regresién de la variable dependiente del modelo inicial ¥ respecto de la variable XE y la variable resid01. Se elige Quick —> Estimate Equation, Se rellena la pantalla Equation Specification de la solapa Specification como se indica en la Figura 2-152, se elige Least Squares en el campo Method (para ajustar por minimos cuadrados) y se hace clic en Aceprar. Se obtienen los resultados de la Figura 2-153 en la que se observa una significatividad cercana al 80% de la variable resid01. Ello nos eva a aceptar Ia endogeneidad del regresor XE segtin el contraste de Hausman, Una vez que sabemos que XE(-1) es un buen instrumento para XZ, realizamos el ajuste del modelo ¥ = fo+ fiXECI). Se elige Quick — Estimate Equation. Se rellena la pantalla Equation Specification de 1a solapa Specification como se indica en la Figura 2-154, se elige Least Squares en el campo Method y se hace clic en Aceptar. Se obtiene el ajuste de la Figura 2-155. Se observa ‘un alto R? y buena significatividad individual y conjunta de los parémetros estimados. Siena Sree see sam 02 wise Gora ue O00 eos te DE wa a ||lEeee Tar aneieae 7000 Sand Ragan ESTeepmamene Snr fect Ti | |]] SBategeeso ie cmetny S611 || Been Paani) Odio Figura 2-149 Figura 2-150 rvewesie (eR) eater a ina | Figura 2-151 Figura 2152 108 +.© WES-Paraino MODELOS DE REGRESION CON DATOS DE CORTE TRANSVERSAL, ‘Sorte ose SE vrpessen inte eben 15 ater users Pte) Figura 2-153 weak ese) fennel else) ‘Spud esq SE orpetn, FaeKt ei Figura 2-154 El modelo finalmente estimado es Y. Figura 2-135 277928 + 1,STEXE(-1) + u Pero seria més exacto realizar la estimacién mediante el método de los minimos ‘cuadrados en dos etapas, Para ello se elige Quick —» Estimate Equation. Se rellena la pantalla Equation Specification de la solapa Specification como se indica en la Figura 2-156 seleccionando en el campo Method la opcién TSLS — Two-Stage Least Squares (TSNLS and ARMA). En el campo Instrument List se introducen como instrumentos la variable ex6genas y su instrumento. En el campo Equation Specification se introducen las variables del modelo a ajustar. Al hacer clic en Aceptar se obtienen los resultados de la Figura 2-157. Tan aR ee eI Ge Dept ate Sam se (game aque SE sfegeenn Fro oes Lint Snes aw ores 88 Te de Sours Sasnendeed SGT Seowene ss 51673 [eee 00 mime om Figura 2-156 Figura 2-157 © MTES Paraninfo 105 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Si estimamos el modelo por el método de White para evitar Ia heteroscedasticidad (Figura 2-158) se obtiene el ajuste de la Figura 2-159, OMG. Tw 0138 Serge cle 16 oor Seen a Sime Dasomateas, el ‘eevee “ome gi Aisne 30 seer on Figura 2-158 Figura 2-159 Se observa que el ajuste por mfnimos cuadrados en dos etapas puede presentar autocorrelacién y los parémetros estimados son casi iguales que los estimados anteriormente de modo directo por variables instrumentales en la Figura 2-155. Por lo tanto, es légico ‘quedarse con la estimacién de la Figura 2-155. Para analizar la posible heteroscedasticidad en el modelo de variable instrumental de la Figura 2-155 utilizaremos el contraste de White. Para ello, desde la pantalla Equation mediante View —> Residual Tests —> White Heteroskedasticty (no cross terms) (Figura 2-160) se obtiene 1a Figura 2-161 en la que se observa que los p-valores de la Fy de los términos eruzados son mayores que (0.05, lo que nos lleva a rechazar formalmente la presencia de heteroscedasticidad al 95%. crap see Scot. Some Gre Siraqarndneld Gh Wheretostedaty eet) Ggiderest 0c ea Duetsin tt “1aeE2 Poe) Figura 2-161 106 «© 1TES-Paranino ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS 3.1__REGRESION CON SERIES DE TIEMPO En los capitulos anteriores hemos profundizado acerca de e6mo utilizar el modelo de regresin miltiple para aplicaciones con datos de corte transversal. En este capitulo abordaremos el andlisis econométrico con datos de series temporales. Nos basaremos sobre todo en el método de Minimos Cuadrados Ordinarios y la mayoria del trabajo relativo al funcionamiento y a la inferencia es el ya analizado en capftulos anteriores. Sin embargo, los datos de series temporales presentan ciertas caracterfsticas que no tienen los datos de corte transversal, y que requieren una atencisn especial cuando aplicamos MCO. Una caracteristica evidente de los datos de series temporales, que los distinguen de los de corte transversal, es el hecho de que un conjunto de datos de series temporales vienen dados ‘con un determinado orden temporal. A Ia hora de analizar datos de series temporales debemos aceptar el hecho de que el pasado puede afectar al futuro, pero no al revés. Hay otra diferencia, algo mas sutil entre los datos de corte transversal y los de series temporales. Las propiedades cstadisticas de los estimadores MCO se basan en que las muestras eran aleatoriamente escogidas de una determinada poblacién. Entender por qué los datos de corte transversal deben considerarse como resultados aleatorios es bastante sencillo: una muestra diferente de la poblacién produciré, generalmente, valores diferentes para las variables dependientes ¢ independientes (tales como la educacién, la experiencia, el salario, etc.). Por tanto, las estimaciones MCO calculadas a partir de diferentes muestras aleatorias serén, por lo general, diferentes, y ésta es Ia razén por la que consideramos los estimadores MCO como variables aleatorias. {Cémo debemos pensar que funciona Ia aleatoriedad en los datos de series ‘temporales? Intuitivamente, parece cierto que las series temporales econdmicas satisfacen los requisitos de ser el resultado de variables aleatorias. Puesto que el resultado de estas variables es conocido de antemano, éstas deben ser consideradas como variables aleatorias. El tamaio muestral para un conjunto de datos de series temporales es el ntimero de periodos temporales sobre los cuales observamos las variables de interés. Bajo supuestos paralelos a los vistos para el anélisis con datos de corte transversal, las estimaciones por MCO son insesgadas, son ELIO, y los errores estindares, estadisticos 1 y F habituales obtenidos por MCO se pueden utilizar para realizar inferencia estadistica bajo las hipstesis del modelo de regresién miitiple habituales. Sin embargo, debido a la correlacién temporal existente en la mayoria de las series temporales econémicas, debemos hacer supuestos adicionales explicitos acerca del modo en que los errores se relacionan con las. variables explicativas en cada periodo y acerca de la autocorrelacién de los propios errores. Los supuestos del modelo lineal clésico pueden resultar muy restrictivos para las aplicaciones con datos de series temporales, pero constituyen un buen punto de partida y se aplicardn tanto a regresiones estiticas como a modelos de retardos distribuidos finitos. Los logaritmos y las variables ficticias son utilizados frecuentemente en las aplicaciones ‘con series temporales y en estudios de acontecimientos. Las fendencias y la estacionalidad se pueden tratar facilmente en el marco de los modelos de regresién miiltiple incluyendo tendencias y variables ficticias estacionales en las ecuaciones de regresién. También puede plantear problemas Ja uilizacién de las medidas usuales del K® como medida de bondad del ajuste en las series de las que hay tendencia 0 estacionalidad. Cuando las series temporales son altamente persistentes (tienen raices unitarias y no son estacionarias), debemos ser extremadamente cantelosos cuando hhacemos una utilizacién directa de las mismas en los modelos de regresién. Una altermativa a ‘trabajar con niveles es utilizar las primeras diferencias de las variables. 108+ © 11Es-Paranino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Cuando Ios modelos tienen dindmica completa en el sentido de que no necesitan retardos adicionales en la ecuacién para ninguna de sus variables (modelos estéticos), los errores no estarén en general autocorrelacionados. En los modelos con retardos distribuidos (con variables desfasadas en el tiempo), los errores estarén en general autocorrelacionados. No obstante, los modelos estiticos y los modelos de retardos distribuidos finitos resentan con frecuencia errores autocorrelacionados incluso cuando el modelo no esté mal especificado. Por tanto, es importante conocer las consecuencias y soluciones de la autocorrelacién para este tipo de modelos. En cuanto a la heteroscedasticidad, los métodos usados para el caso de datos transversales pueden extenderse al caso de datos de serie temporal. La mecénica es esencialmente la misma, salvo algunas sutilezas asociadas a la correlacién temporal en. “observaciones de series temporales que deben tenerse en cuenta. Un modelo de regresién con series temporales puede presentar simulténeamente heteroscedasticidad _y autocorrelacién. La mayoria de las veces se considera que la autocorrelacién es el problema més importante, porque normalmente tiene un mayor impacto sobre los errores estindares y Ia eficiencia de los estimadores que la heteroscedasticidad. Para tratar Ta autocorrelacién podemos emplear Ia transformacién de Cochrane-Oreutt y, en la ecuacién transformada, podemos incluso contrastar Ia presencia de heteroscedasticidad utilizando los contrastes de Breusch-Pagan 0 White, Alternativamente, podemos analizar la heteroscedasticidad y 1a autocorrelacién y corregir ambas mediante un procedimiento combinado de minimos cuadrados ponderados y correccién por errores AR(I). Otro tema importante en los modelos de regresién con series temporales es el andlisis de Ja estabilidad estructural consistente en la comprobacin de que los coeficientes estimados se mantienen constantes para todo el periodo muestra 3.2__AUTOCORRELACION 3.2.1 El problema de la autocorrelacion y su detec Partimos del modelo lineal: Y\ (1Xy Xa Xu bo) (my Yo |_[1X2 Xn Xr YH | Pe XJ (Xr Xr Xa No) uy que, abreviadamente, podemos representar mediante ¥ = X B + u, suponiendo una serie de hipstesis entre las que se encontraban que la variable u (término de error) es una variable aleatoria con esperanza nula (E(u)=0) y matriz de covarianzas constante y diagonal (Var(u)= @ I, matriz escalar). Es decir, que para todo , la variable u, tiene media cero y varianza 0” no dependiente de 1, y ademas Cov(u,u,)=0 para todo i y para todo j distintos entre sf, pudiendo escribir Var(u) = 0? Ii. El hecho de que Cov(u,,) = 0 para todo i distinto de j se denomina hipétesis de no autocorrelacién. En este apartado estudiaremos el modelo lineal cuando esta hipstesis no se cumple, es decir, cuando existe autocorrelacién 0 correlacién serial. © ITES Paraninfo 109 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Si se relaja Ia hipstesis Var(u) = 0 7f; de modo que Var(u) = V, siendo V cualquier matriz, los pardmetros estimados del modelo lineal resultan ser: B=(XVIXY'XV"Y con EB)=B y LB) =(X'V'X)" No olvidemos que cuando se cumplfan las hip6tesis del modelo lineal: X'X)'X'Y con E(B) = B y YB) = 0° (X'xy" Por tanto, en presencia de autocorrelacién seré necesario estimar los elementos de la matriz de varianzas covarianzas residual V. Esta tarea suele simplificarse suponiendo que las perturbaciones aleatorias del modelo siguen un determinado esquema de comportamiento que reduce el niimero de pardmetros a estimar. Los esquemas més tipicos son: Modelo autorregresivo de orden 1 AR(1) —> uy = pu ptey Modelo autorregresivo de orden 2 AR(Q)—> u,= pit ertpatartes Modelo de medias méviles de orden 1 MA(1) > = e+ e).1 En general, las perturbaciones aleatorias pueden seguir modelos autorregresivos de medias méviles de cualquier orden, pero en el trabajo aplicado suele ser el modelo AR(1) el ‘més utilizado, en euyo caso tenemos: = Purster al-p) Con lo que ya conocemos V para poder estimar el modelo lineal mediante: Becrv2xy'xV"7 con E(B)=B y 2(B)=(eV'Xy! Para analizar la autocorrelacién de un modelo suele comenzarse por el andlisis grafico de los residuos, siendo esencial la gréfica de los residuos (a poder ser estudentizados) respecto del indice tiempo, que debe de presentar una estructura aleatoria libre de tendencia, También, se pueden graficar los residuos u;respecto de un retardo suyo w ,1 y si la mayoria de los puntos ccaen en el primer y tercer cuadrante hay indicios de una autocorrelacién positiva, siendo la autocorrelacién negativa cuando los puntos caen en el segundo y cuarto cuadrante. Aparte del andlisis gréfico es necesario realizar contrastes formales de autocorrelacién, centre los que destacan Durbin Watson, Wallis, h-Durbin, Breusch-Godtrey y Cochrane-Orcutt Estadistico DW de Durbin-Watson Consideramos el estadfstico DW definido como sigue: 110+ WEs-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES DW=2 si p=0 =2d-p)>{DW=20 si p=1 DW24 si p= Se puede adoptar Ia regla no demasiado rigurosa de que si DW vale 0 hay autocorrelacién perfecta positiva; si DW se aproxima a 2 no hay autocorrelacién y si DW se aproxima a 4 hay autocorrelacién perfecta negativa. No obstante DW se encuentra tabulado, y segtin la franja en la que caiga su valor, se acepta 0 rechaza la hipotesis de autocorrelacién. En Ia tabla de DW elegimos la columna relativa a k (niimero de regresores en el modelo) y Ia fila relativa a T (tamaiio muestral), lo que nos da los valores dy, y dv. Se tiene: DW < d, >se rechaza p= 0 y se acepta p>0 DW > 4 d, =se rechaza p= Oy se acepta p <0 dy No) 1-1VB) * Si [AIk1,96 se acepta la hipstesis = 0 frente a #0 * Si|fl>1,96 se rechaza la hipstesis p= 0 (al 95%) Estadistico D, de Wallis (datos trimestrales) Se trata de una variante del estadistico DW de Durbin-Watson para el caso de series temporales de datos trimestrales. Consideramos el estadistico DW definido como sigue: Se, -ay Ye,- i." SCE 2 © MTES-Paraninfo 117 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS En la tabla de D, elegimos la columna relativa a k (niimero de regresores en el modelo) y la fila relativa a 7 (tamaiio muestral), 1o que nos da los valores daz ¥ dey. Tenemos: DW < dy, = se rechaza p = Oy se acepta p>0 DW >4- da = se rechaza p= 0 y se acepta <0 Day < DW <4 day = se acepta p=0 4-day Indeterminado Razén de Von Neumann Consideramos el estadistico v definido como sigue: Yaa. y'r-1 ) = ve r= NO) con a) oye) +e ly * Si f{<1,96 se acepta la hipstesis / = 0 frente a p#0 * Si fflp1,96 se rechaza la hipstesis p= 0 (al 95%) Prueba de Breusch-Godfrey Supongamos que el modelo puede presentar retardos de la variable dependiente, esquemas autorregresivos AR(p) de orden p21 en los residuos (i = PU ot P22 + oot Pp Wap Er 0 ‘esquema de medias méviles MA(g) de orden q en los residuos (u = €;+ 661+ 3612 +..+ Glog) ‘oun esquema ARMA(p,q) en los residuos (t=; uit Prt ia +t Ppt apt Et Beat 612 + + 6,619). El modelo puede tener la forma: ¥s= Bot Bi Xi +... Br Xn + By Yea + oo. + Be Yosh er El contraste de Breusch-Godirey para contrastar la autocorrelacién se realiza mediante los siguientes pasos 1°) Se estima por MCO el modelo original y se obtienen los residuos estimados i, 2) Se estima por MCO la regresién de i, sobre los regresores originales del modelo y p retardos de lo residuos ii,_,,i#,_),---,44,_,, en caso de un esquema AR(p) en los residuos. Se obtiene el R? de esta regresién. 3°) Para tamaiio muestral T' suficientemente grande se cumple que (T-p)R® — x°,, Este seré el estadistico del contraste de Breusch-Godffey. Para valores muestrales de este estadistico mayores que el valor critico de la Chi-cuadrado con p grados de libertad se acepta la presencia de autocorrelacién con retardo de orden p en los residuos (esquema residual AR(P)) EL problema en este método es Ia deteccién del orden autorregresivo p de los residuos. Para identificar adecuadamente p se usan de forma conjunta las funciones de autocorrelacién FAC y autocorrelacién parcial FACP de los residuos, Para residuos AR(p) la FAC decrece exponencialmente, es sinusoidal o con alternancia de signos, mientras que en la FACP slo existen p valores significativamente distintos de cero. Para un esquema residual MA(q) es la FAC la que tiene slo los q primeros valores significativamente distintos de cero, mientras que Ja FACP presenta decrecimiento exponencial, alternancia de signos o es sinusoidal, En un ‘esquema residual ARMA(p,q) se combinan un AR(p) y un MA(q). 11200 ES Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES 3.2.2 Soluciones para la autocorrelaci6n La presencia de autocorrelacién en un modelo suele solventarse mediante el método de Cochrane-Oreutt 0 mediante la introdueci6n de variables dummy adecuadas en el modelo. Existen otros métodos menos utilizados como el método de estimacién de Durbin y el procedimiento de Prais-Winsten. Método de Minimos Cuadrados Generalizados Este método se basa en realizar la estimacién del modelo con autocorrelacién mediante ‘mfnimos cuadrados generalizados MCG con la matriz.V siguiente: 1p phim ph 1 -p 0 o fe tem eel 1 [pa tet 0 ° Ver =o?) 9 1 ptslear@=at- So

X*), Esta regresién se abordara considerando la variable ficticia D que vale 0 para valores de X menores que X* y que vale uno en caso contrario. La ecuacin del modelo a ajustar seré Ia siguiente Y= Qh + OX, + Obs (X,—X*)D, + _fisix, > x" ‘~ \Oenel resto Suponiendo E(u,)=0, se tiene que a + aX, Gy - Os X* +(ay+-a8)X, Se observa que dj es corresponde a la pendiente de Ia recta de regresién en el primer tramo (XX*), © MES Paraninfow 117 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS 3.4__ESTABILIDAD ESTRUCTURAL 3.4.1 Constancia de los parémetros y contraste de prediccién de Chow El ajuste del modelo de regresién Y¥ = Xf + u asume de forma implicita que es un vector constante, tanto en el conjunto de observaciones actuales que se han utilizado para ajustar el modelo como en otras observaciones muestrales posibles, es decir, se asume la constancia de los pardmetros estimados del modelo. En modelos con series temporales existen situaciones en las que es frecuente toparse con coeficientes estimados f que ante cambios en el entorno social o ambiental obligan a comprobar la estabilidad estructural, El Contraste de Prediccién de Chow Cuando el vector f de pardmetros es constante, las predicciones externas a la muestra tendrén probabilidades especfficas de situarse dentro de los Iimites de confianza calculados a pattir de los datos muestrales, Por lo tanto, errores de prediccién “grandes” pondrén en duda la hipotesis de constancia, mientras que con los “pequeiios” se dard el caso contrario. El rocedimiento sugerido no estima la totalidad de observaciones muestrales, sino que divide el conjunto de datos enn; observaciones a estimar y enn, =n — m, observaciones que se utilizarén para el contraste, Cuando se trabaja con series temporales, las primeras m; observaciones suelen ser las utilizadas para la estimaci6n, mientras que las tiltimas n, se dedicarén a la comprobacién. En aplicaciones de corte transversal, Ia base de datos se dividira en dos submuestras de acuerdo con Jos valores de una variable de tamaiio como, por ejemplo, el ingreso del hogar o los beneficios de una empresa, ganancias, empleo, ete. No existen normas répidas ni estrictas que determinen los valores relativos de n; y m2. Lo normal es reservar para la comprobacién el 5, 10 0 15% del total de observaciones disponibles, El contraste de precisién de las predicciones (0 de constancia de los pardémetros estimados del modelo o de estabilidad estructural), conocido como test de Chow en honor a Ia influencia del articulo publicado por Chow en 1960, consiste en lo siguiente: 1, Ajustar el modelo por MCO utilizando las m observaciones designadas como primera muestra, obteniendo la suma de cuadrados residual SCR=e,¢, 2. Ajustar la misma regresi6n a todas las (m; + 12) observaciones y obtener la suma de ‘cuadrados residual restringida SCR = e.e, 3. Sustituir estos resultados en la expresiGn del estadistico F del contraste y rechazar la hipétesis de constancia de parémetros si F excede un valor erftico preseleccionado. (ee. ee) = F(n,,n,-k) 118+ WES Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES 3.4.2 Cambio estructural y contraste de Chow El contraste de prediccién de Chow visto en el pérrafo anterior nos conduce, de forma natural, a contrastes mas generales de cambio estructural. Un cambio estructural o una ruptura estructural se da cuando los parémetros de una relacién difieren entre distintos conjuntos de datos (generalmente diferentes perfodos temporales en modelos con series de tiempo). Naturalmente, existen diversos subconjuntos de datos con Ia posibilidad de diversas rupturas estructurales. De momento, consideraremos solamente dos subconjuntos dem; y my ‘observaciones que dan una muestra total de n = m + m observaciones, Supongamos, por ejemplo, que deseamos investigar si el consumo agregado en un pais difiere en tiempos de paz y en tiempos de guerra, y que poseemos las observaciones de las variables relevantes dem; afios de paz. y m2 afios de guerra. Podriamos realizar un contraste de prediccién de Chow utilizando la funcién estimada de tiempos de paz para predecir el ‘consumo en tiempos de guerra. Sin embargo, también podria utilizarse de forma alternativa la funcidn estimada de tiempos de guerra para predecir el consumo en tiempos de paz. La elecci6n no es evidente y ambos procedimientos proporcionarian respuestas distintas. Siempre que los subconjuntos sean lo suficientemente grandes, serd mejor estimar ambas funciones en cada subconjunto y verificar si los parémetros pueden ser communes. El contraste de cambio estructural de Chow se utiliza para detectar si las estimaciones del modelo son iguales distintas en los dos periodos dados. Este contraste cconsiste en lo siguiente: 1, Ajustar el modelo con todas las (1; + m) observaciones y obtener la suma de ‘cuadrados residual restringida SCR = € € 2, Ajustar el modelo utilizando las m; observaciones designadas como primera muestra, ‘obteniendo la suma de cuadrados residual no restringida SCR1 = ¢,¢, 3. Ajustar el modelo utilizando las m observaciones designadas como segunda muestra, ‘obteniendo la suma de cuadrados residual no restringida SCR2 = €,€, 4. Considerar SCR3 = SCR1 + SCR2 = e,e,. Sustituir estos resultados en la expresién del estadistico F del contraste y rechazar Ia hipétesis de estabilidad paramétrica (no hay cambio estructural) si F excede un valor erftico preseleccionado. SCR -SCR, (¢e —e.e.) &) 5CR > ae on?) (n-2) (n 2k La prueba de Chow exige que los téminos de error en las regresiones de los subperiodos estén normal e independientemente distribuidos con la misma varianza. Ademés cesta prueba dird s6lo si las dos regresiones son diferentes, pero no especificara si la diferencia se debe a las intersecciones, a las pendientes o a ambas. Ademés, la prueba de Chow supone que se conocen los puntos de ruptura estructural. Si no se sabe exactamente el punto del cambio estructural habré que utilizar otros métodos como los residuos recursivos. © MTES Paraninfow 119 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Si el contraste de Chow detecta un cambio estructural habré que realizar dos estimaciones por separado en los dos perfodos, o alternativamente utilizar la variable ficticia dicotémica alternativa a la prueba de Chow D, que vale 0 para el primer perfodo y 1 para el segundo. Para estimar un modelo con variable dependiente ¥, con variable independiente X y con cambio estructural en el punto 1, se puede considerar el modelo con variable ficticia equivalente siguiente Y= ay + De + Bik +a (DX) lsit>t p= [isitee Ocenel resto El parimetro of representa la intersecci6n diferencial y fla pendiente diferencial Por lo tanto si resulta significativo Ia diferencia de los dos modelos en Ios dos periodos se debe a las intersecciones (distintos términos constantes de los modelos). Si fy resulta significativo la diferencia de los dos modelos en los dos perfodos se debe a las pendientes (distintas pendientes de los modelos). Si resultan significativos ambos parémetros a la vez, la diferencia entre los dos modelos se debe tanto a la constante como a la pendiente. 3.4.3 Residuos recursivos: Contrastes basados en estimacién recursiva Cuando no se conoce el punto del cambio estructural pueden utilizarse métodos que permitan contrastar la estabilidad estructural del modelo (constancia de pardmetros). Entre ellos se ‘encuentra el método de los residuos recursivos 0 método de los minimos cuadrados recursivos. Seael modelo y, =x, B+u, t=l.n x =[l x, 0x4] La base de 1a estimacién recursiva es muy sencilla, Ajustamos el modelo a las primeras k observaciones muestrales. A continuacién utilizamos los primeros k + 1 datos y calculamos de nuevo el vector de coeficientes. Seguiremos asf, afladiendo cada vez un nuevo dato, hasta obtener el sltimo vector de coeficientes, basado en Ia totalidad n de datos. El Proceso genera una secuencia de vectores, by, byt ys by , donde los subindices indican el iimero de datos utilizados en la estimaci6n. En general, b, = (X;X,)"X;y, donde X,es la matriz 1 x k de regresores para los primeros 1 datos de la muestra, ¢ y, es el vector de las primeras ¢ observaciones de la variable dependiente. Los errores estandar de los distintos coeficientes se calculan en cada paso del proceso recursivo, exceptuando el primero, ya que la SCR es igual a cero cuando 1 = k. Algunos programas informéticos empiezan los célculos recursivos en cualquier m > k, generando la SeCUENCIA by Pmsi, «nvby. Se realizan los gréficos que muestran Ia evolucién de todos los coeficientes estimados con el valor de + dos veces el respectivo error esténdar, La inspeccién de los gréficos sugeriré, 0 no, la constancia de los pardmetros del modelo. Es posible que a medida que afiadimos més datos los gréficos muestren un movimiento vertical que podré alcanzar un nivel superior a los limites de confianza previamente estimados. Dicho fenémeno suele ser consecuencia del resultado del propio modelo ensayado y sugiere la existencia de un estructural que induce a sospechar la inconstancia de los parémetros. La estimacién recursiva, al proporcionar un orden tinico de los datos, resulta un procedimiento atractivo con las series temporales. El procedimiento, asimismo, es fécilmente aplicable a datos de corte transversal que, en caso necesario, podrén ordenarse segtin una variable de “tamafio” adecuado, 1206 WES-Paranino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Cuando utilizamos todos los datos disponibles ¢ incluimos un periodo 1-1, la prediccién un paso en delante de y, seré x,b,, . El error de predis pues, ¥, = y,—%,b,., y la varianza del error de predicei6n un paso adelante serd 4i6n un paso adelante seré var(y,)=0*h+60X,)"'8] El valor desconocido o” en Ia ecuacién se sustituye por la varianza residual estimada de las primeras observaciones (-1), dado que t-1 > k. La rafz cuadrada nos da la estimacién del error estindar de la regresi6n (EER.). Trazaremos una linea en el valor de dos veces este error esténdar recursivo y otra en el valor de menos dos veces dicho error estandar recursivo. Estas Iineas se trazan en un mismo grifico alrededor de Ia Iinea del valor cero y alrededor de los errores de prediccién actuales (llamados también tesiduos recursivos). Los residuos situados fuera de las bandas sefialadas por los error esténdar suelen sugerir Ia inconstancia de los parémetros. En cada punto, la probabilidad del error observado, bajo la hipétesis nula, se calcula a partir de la correspondiente distribuci6n 1 3.4.4 Contrastes CUSUM Y CUSUMQ Los contrastes CUSUM y CUSUMQ estén basados en Jos residuos recursivos y se utilizan también para contrastar la estabilidad estructural del modelo (constancia de los pardmetros) Los residuos recursivos reescalados se definen como: Y= xb, 1+4,(X,.X).)'x, rek+ Lawn hex (XX Bajo las hipétesis haituales w, = (0,07) y se demuestra, asimismo, que los residuos recursivos reesealados se hallan incorrelacionados dos a dos, Por lo. tanto, w, ~N(,07/,.,). Brown et al., baséndose en estos residuos recursivos reescalados, sugieren los contrastes de constancia de los pardmetros CUSUM Y CUSUMQ El estadistico CUSUM se define mediante la expresién: y% ke ly..n con & a nF SCR, es la suma de cuadrados de los residuos calculada a partir de la regresién de la totalidad de Ia muestra. Cuando los parémetros son constantes, E(W,) = 0, pero cuando no Io sean, W, tendera a ser distinto a dicho valor. La significacién del hecho de diferir de la linea ‘que representa el valor igual a cero para la suma acumulada se obtiene calculando un par de ineas rectas de significacién que pasan pot los puntos (k,tavn—k) y (n,3aVn—k) donde a es un pardmetro que depende del nivel de significacién escogido para el contrast. La correspondencia para ciertos niveles de significacién convencionales es a = 0,01 a = 1,143; a= 0.05 a=0,948; a= 0,10 a= 0,850. Si la poligonal que une los puntos W, corta las rectas de significacién (0 se acerca mucho) hay indicio de inestabilidad en los pardmetros (no constancia). © MTES-Paraninfo 121 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS El estadistico CUSUMQ se basa en Ios sumatorios acumulados de los cuadrados de Jos residuos y tiene la expresi6n: rek+ly on Bajo Ia hip6tesis nula, el cuadrado de las w, son variables independientes distribuidas como una (1). Por lo tanto, el numerador tiene un valor esperado igual a t - k y el denominador, un valor esperado igual an ~ k. Dado el valor esperado aproximado del ico de prueba bajo Ia hipétesis nula, la inea de valor medio es: asyett que va desde cero, cuando ¢ = k, hasta Ja unidad cuando t = n, La significacién de las diserepancias de la linea de valor esperado se calculan trazando un par de lineas paralelas ala linea E(S,) a una distancia, por encima y por debajo, igual a co. Los valores de ¢o estén tabulados para distintos tamafios muestrales y niveles de significacién. Si hay valores obtenidos para S, que se sittian fuera de Ia regién delimitada por las dos lineas paralelas anteriores hay indicio de inestabilidad en los pardmetros (no constancia). 3.5 _HETEROSCEDASTICIDAD CON SERIES DE TIEMPO La heteroscedasticidad puede también presentarse en modelos de regresién de series temporales, y su presencia, a pesar de no provocar sesgo o inconsistencia en los estimadores, invalida los errores estindares y los estadisticos ¢ y F habituales. Ocurre exactamente lo mismo que en el caso de corte transversal. En aplicaciones de regresidn de series temporales, apenas se presta atencién a la heteroscedasticidad: porque el problema de errores autocorrelacionados es habitualmente més acuciante, No obstante, es til tratar brevemente algunos de los aspectos que surgen al aplicar los contrastes y las soluciones a la heteroscedasticidad en regresiones de series temporales. Es necesario contrastar 1a heteroscedasticidad en regresiones de series temporales, especialmente si estamos preocupados por la validez de los estadisticos robustos a la heteroscedasticidad con tamafios de muestra relativamente pequefios. Los contrastes que analizamos en el capitulo anterior para datos de corte transversal se pueden aplicar en este caso directamente, aunque con algunas salvedades. En primer lugar, los errores u, no deben presentar autocorrelacién porque la presencia de autocorrelacién generalmente invalidaré los contrastes de heteroscedasticidad. Asf pues, tiene sentido contrastar primero la autocorrelacién, utilizando un contraste robusto a la heteroscedasticidad si se sospecha de su existencia. Después de solucionar Ja autocorrelacién, podemos contrastar la existencia de heteroscedasticidad. Si detectamos autocorrelacién, podemos emplear la transformacién de Cochrane-Orcutt y, en Ia ecuacién ‘ransformada, utilizar errores estindares y estadisticos de contraste robustos. a la heteroscedasticidad. O podemos incluso contrastar la presencia de heteroscedasticidad en la ecuacién transformada utilizando los contrastes de Breusch-Pagan o White. Alternativamente, podemos modelar Ia heteroscedasticidad y Ia autocorrelacién y corregir ambas mediante un rocedimiento combinado de minimos cuadrados ponderados y correccién por ertores AR(I). 12260 WES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Si se encuentra heteroscedasticidad en los u(y los 1; no presentan autocorrelacién), centonces se pueden usar los estadisticos robustos a la heteroscedasticidad. Una alternativa es usar minimos cuadrados ponderados. La mecénica de los minimos cuadrados ponderados en el caso de las series temporales es idéntica a la del caso de corte transversal PROBLEMAS 3.1. Consideramos el modelo y, = Artix: + w y los siguientes datos para su ajuste: 14 6 16 25 36 49 64 Estimar el modelo por MCO y hallar el coeficiente de determinacién corregido, asi como el estadistieo de Durbin-Watson, {Es conveniente reformular el modelo? En caso de respuesta positiva estimar el modelo alternativo més adecuado SOLUCION: Tenemos que: Porodaaaraaaae 4 12345678 6 31114 6 16 25 36 49 64) Los parimetros estimados seran: paver (O(a) Por lo tanto, el modelo de regresi6n lineal ajustado por MCO seré $=801+446x, +0 Para calcular el coeficiente de determinacisn utilizamos la expresién: Este resultado significa que el 70% de la variacién en la variable dependiente se explica con nuestro modelo de regresién lineal El coeficiente de determinacién corregido se calcula como sigue: Para contrastar la significatividad conjunta de los pardmetros del modelo, es decir, y=, =, utilizamos el estadistico: © MTES Paraninfow 128 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS SEIk Rik o7n SRIT=k=1) = RYT =k=1 G=0.7)12=1-1) Como el p-valor PCF 1:9 > 23,3) = 0,0007 < 0,005 se concluye la significatividad conjunta del modelo (rechazo de y= i = 0). Para analizar Ia significatividad individual de los pardmetros estimados calculamos: 1,-—Poni97 eas Los p-valores asociados a los T,, segdin una distribucién 1 de Student con 10 grados de libertad son P(T'> 1,97) = 0.0766 y P(T > 4,84) = 0,0007 Segtin los p-valores, la constante no es significativamente distinta de cero al 95%, Para asegurar Ia significatividad de los dos parémetros es necesario rebajar el nivel de confianza al 93% como minimo. Como el coeficiente de determinacién ajustado es bajo y hay un parémetro no muy significativo puede ocurrir que existan problemas en el modelo. A continuacién calcularemos el estadistico de Durbin-Watson para analizar la autocorrelacién, Para ello calculamos previamente los residuos estimados @ = Y - XB obteniéndose: Gi = (8,35, 1,89, -2,55, -11,46, -12,92, -15,37, -9,83, -5,29, 1,25, 9,79, 20,34) El estadistico de Durbin-Watson se calcula como sigue: En las tablas de Durbin-Watson para 12 observaciones £=1 (un solo regresor en el modelo) y a= 0,05 se tiene d= 0.971 y dy = 1,331 Esté claro que existe autocorrelaci6n positiva, ya que d = 0,32 < dj = 0,971. Para realizar el ajuste MCO con Eviews, se elige Quick > Estimate Equation, se escribe Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 3-1) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 3-2 que précticamente coinciden con los caleulados manualmente. 124+© WES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Figura 3-1 Para intentar arreglar el problema de la autocorrelacién representamos las variables gréficamente para ver si siguen una fendencia distinta de la lineal. Tenemos la gréfica siguiente: En a grifica se observa que se ajusta mejor una parabola que una recta a la nube de puntos. Por otra parte si representamos los residuos contra los valores de la variable independiente obtenemos también tendencia cuadrética tal como indica el gréfico siguiente: Graco de Resicuos Para estudiar los posibles problemas de no linealidad realizamos el grifico de residuos contra Ia variable explicativa, que ha de ser aleatorio para que no haya problemas de linealidad. Para ello elegimos Quick > Graph —» Scatter (Figura 3-3) y rellenamos la pantalla Series List ‘como se indica en la Figura 3-4 con el objeto de graficar los residuos contra X (Figura 3-5). De forma similar se graficarfa X contra Y¥ Figuras 3-6 y 3-7), © MTES Paraninfow 125 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Peles) boone) snnesheneonel epee Figaca 34 sca Figura 36 Figura 37 ‘También podemos contrastar formalmente la mala especificacién del modelo inicial a través del test RESET de Ramsey. Para ello elegimos View — Stability Tests + Ramsey RESET (Figura 3-8) y tomamos una sola potencia para la variable endégena ajustada. Al pulsar OK se obtiene Ia salida del test RESET de Ramsey de la Figura 3-9. Los p-valores de la Fy de la Chi- ‘cuadrado de raz6n de verosimilitud son menores que 0,05, con lo que rechazamos la hipétesis de linealidad, o més generalmente, de especificacin correcta del modelo Figura 3-8 Figura 3-9 De las Figuras 3-5 y 3-7 se deduce que hemos cometido un error de especificacién en el modelo, siendo més adecuado e! modelo cuadratico. Por lo tanto se propone el modelo: 9, = By + Bx, + Bax? +m, Para estimar este nuevo modelo se elige Quick —» Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 3-10) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 3-11 126+© TES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES fa) Figura 3-10 Figura 11 El nuevo ajuste del modelo es mejor que el anterior ya que los coeficientes de determinacién y el estadistico de Durbin-Watson han mejorado, todas las variables son significativas individualmente a partir de un 96% y en conjunto al 100% (p-valor de la F éptimo). La frontera de rechazo de la autocorrelacién segtin el contraste de Durbin Watson empieza alrededor de 1,5 (dy = 15) estando bastante cereano nuestro valor DW = 1,3. El modelo ajustado es: =1,943662 + 0,979028x, +0,888330x7 + u, > Consideramos el modelo keynesiano del consumo C en funci6n de la renta ¥: Bo+ BY, +4, Dados los datos siguientes: 1955 | 26445 | 28816 |1971 | 53794 | 6061s 1986 | 28092 | 31229 | 1972 | 57725 | 65061 1957 | 28768 | 32273 | 1973 | 61827 | 70050 19ss | 29780 | 32621 | 1974 | 64ag6 | 72818 1959 | 30034 | 31515 | 1975 | 65250 | 73565 1s60 | 28444 | 31173 | 1976 | 67481 | 74931 1g61 | 3127 | 34762 | 1977 | 68359 | 74841 1962 | 33826 | 37736 | 1978 | o8su7 | 75990 1963 | 37338 | 420s9 | 1979 | 68713 | 75517 1964 | 38600 | 43742 | 1980 | o9081 | 74372 1965 | 4084s | a6a1o | 1981 | 67964 | 73751 1966 | 43153 | 49263 | 1982 | 67913 | 73993 1967 | 48197 | 4974 | 1983 | 67861 | 72530 1968 | 47295 | s2140 | 1984 | 66851 | 71539 1969 | sous | $5260 Estimar el modelo con los datos del periodo 1955-1984 y anslizar Ia propensién marginal al consumo (coeficiente de la renta). Analizar la autocorrelacién del modelo, y en caso de existir problemas, considerar el modelo alternativo del consumo de Brown formulado como: C= B+ BY, + BC. +m, Estimar este nuevo modelo analizando también su autocorrelacién y heteroscedasticidad, © MTES-Pareninfow 127 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS SOLUCION: Los parimetros estimados por MCO serin: - os 30 1666005) '/ 15506634 Ba(x'xy x= = 1666005 101384915993) 91762844616 0,3811823844 -0,0000062638)'/ 15506634 )_(-42635)_{f, — 0,0000062638 1127926310)" ) (91762844616) | 0913 ) (A, Por lo tanto, el modelo de regresién lineal ajustado seré C= 42635 40.913Y +u Lasuma de los cuadrados de los residuos viene dada por: a= yy-Px'y=32823077 La estimacién de la varianza residual viene dada por: wa _ 32823077 _Y'Y-(xAyY 30- 28 ee 1722528 Las desviaciones tipicas de los estimadores vienen dadas por: 6(B,) = J11722528(0,3811823844) = 668,556 6(f, )= 41172252,801.1272252,8)10-" = 0,011 Para analizar Ia propensién marginal al consumo comprobamos 1a significatividad individual del parémetro , a partir del estadistico: 0913 _ 45 @@) oot Ademés, el estadistico anterior se distribuye segtin una 1 de Student con 28 grados de libertad cuyo valor eritico al 95 % es f 90528 = 1,701. Entonces, para realizar el contraste: He: = 0 Hy > 0 se observa que 1,701 < 83, por lo que rechazamos Ia hipstesis nula, aceptando que Ia propensién marginal al consumo es positiva También podemos contrastar si la propensién marginal al consumo es unitaria, es decir: He: = 1 Hy <1 12866 WES-Parsnino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Para ello consideramos el estadistico: rye Act At oon Yay 4H) OO Se observa que -7,909 < -1,701, por lo que rechazamos Ia hipstesis nula, aceptando «que Ia propensién marginal al consumo es menor que la unidad, No obstante, todos los célculos anteriores los hemos realizado sin contrastar la validez. del modelo. Vamos atora a analizar si nuestro modelo presenta problemas de autocorrelacién analizando el estadistico de Durbin-Watson d. Para ello sabemos que: d=21-/) demas Yai, 0.8 => d= 2-08) =04 En la tabla del estadistico de Durbin-Watson para T'= 30, k 352 y dy = 1,489. Como d= 0,4 < di, positiva de primer orden. y @=0,05 se tiene que 352 se acepta Ia existencia de autocorrelacién Para realizar el ajuste MCO anterior con Eviews, se elige Quick — Estimate Equation, se escribe 1a ecuaci6n del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos ‘cuadrados (Figura 3-12) y se hace clic en Aceptar, Se obtienen los resultados de la Figura 3-13 ‘que précticamente coineiden con los calculados manualmente. Se observa que la propensién marginal al consumo (parémetro de Y) es significativamente distinto de cero (8, > 0). El modelo tiene buena significatividad conjunta y la constante no es significativa. fa efaed chen Eamaeronstaseon! Senue st ot : wesw Figura 3-12 Figura 3-13 Eviews también permite contrastar restricciones en los pardmetros a patir del Contraste de Wald mediante View —> Coefficient Tests Wald-Coefficient Restrictions (Figura 3-14), Rellenando a pantalla Wald Test como se indica en la Figura 3-15 se contrasta la restriccién f= 1. Al pulsar Aceptar se obtiene la Figura 3-16, cuyo p-valor pequefio indica el rechazo de la hipstesis A= © MTES Paraninfow 129 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS. [sels nelelto sls —— eto CC Ci] Neoae Aten enanan SUNeoascan” loos Askemseenen Figura 3-14 Figura 3-15 que: Ue TeaSote aw Poa Sees ous typi Sunny orate Rec Yaa _ Sat 740 “Zoe BOI Figura 3-16 ‘También se puede contrastar grdficamente la presencia de autocorrelacién graficando los residuos contra el niimero de observacién mediante Quick — Graph —» Scatter (Figura 3-17) y rellenado la pantalla Series List como se indica en la Figura 3-18. Al pulsar OK se obtiene el ‘gréfico de la Figura 3-19 que presenta una distribucién no aleatoria de sus puntos. a sf Figura 3-18 Figura 19 La presencia de autocorrelacién nos Hleva a considerar como alternativa posible a la modelizacién del consumo el modelo Brown. Realizaremos su estimacién como sigue: 130+© TES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES 5237 B=(X'X) X'Y =| 0532 0,413 Por lo tanto tenemos: B, =523,7, B,=0532, B, =0,413 Por lo tanto, el modelo de regresién lineal multiple ajustado sera $523.7 +0,532Y, +0.413C,, +4, El estimador de la varianza vendré dado por Ia expresi6n: yy —(xByy _ 6704709 eet T-k-130-2-1 27 = 24832245 No olvidemos que las matrices ¥,X y B son ya conocidas. Para calcular el coeficiente de determinacién utilizamos la expresién: 0.9991 Este resultado significa que el 99,91% de la variaci6n en Ia variable dependiente se explica con nuestro modelo de regresién lineal El coeficiente de determinacién corregido se calcula como sigue: r-1 T-k-1 1-a- Para contrastar Ia significatividad conjunta de los pardmetros del modelo, es decir, By = 8, = B, =0, wtilizamos el estadistico: Rsk C= RMT k= 00999) /30=2-1 Furs =149865 ‘Como el p-valor P(F 227 > 14986,5) < 0,005 se conctuye Ia significatividad conjunta del modelo, También puede observarse en las tablas de la F que F qos227= 3,36 < 149865, lo que nos eva a la aceptacidn de la significatividad conjunta del modelo (rechazo de A=Ai Para analizar Ia significatividad individual de los parametros estimados calculamos: © MTES-Paraninfo® 131 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Los p-valores asociados a los 7), segtin una distribucién r de Student con 27 grados de libertad son P(T > 1,61) = 0,0197, P(T > 14,37) = 5,07(10) “ y P(T > 10,325) = 3,23(10) "' Todos los p-valores son menores que 0,05, cono lo que todos los pardémetros (incluida Ia propensién marginal al consumo) son significativamente distintos de cero al 95%. Se ‘observa que ahora la propensién marginal al consumo se estima en 0.532. Ademis, como: £1437 > fogs = 1704 se acepta la hipétesis de que la propensién marginal al consumo es positiva (contraste de B= Ocontra £,>0). Por otra parte, como: b Fe se acepta la hipétesis de que la propensién marginal al consumo es menor que la unidad (contraste de B,= 1 contra £,< 1). ~12,64-<~1,708 A continuacién calculamos el estadistico de Durbin-Watson: $a a Se obtiene un valor de d muy préximo a 2, pero como el modelo tiene como regresor el regresando desfasado, no es adecuado utilizar el estadistico de Durbin-Watson para analizar Ja autocorrelaci6n, En su lugar utilizaremos el contraste ht de Durbin, cuyo estadistico se define como: pf —_-pf* -1VB) YI-TEEB YY Tenemos: d=20-p)> Como |-0,292| < 1,96 se acepta Ia hipétesis nula de no autocorrelacién para un nivel de significacién de 0,05. Vemos entonces que el modelo de consumo de Brown esté libre de autocorrelacién, 1926 TES-Parsnino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Para realizar el ajuste MCO anterior con Eviews, se elige Quick — Estimate Equation, se escribe la ecuaci6n del modelo a ajustar en el eampo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 3-20) y se hace clic en Aceptar. Se obtienen los resultados de Ia Figura 3-21 ‘que practicamente coinciden con los calculados manualmente. Se observa que la propensién marginal al consumo (parémetro de Y) es significativamente distinto de cero (8, > 0). El modelo tiene buena significatividad conjunta y la constante es significativa casi al 90%. Para contrastar restricciones en los pardmetros a pastir del Contraste de Wald se utiliza View —> Coefficient Tesis—> Wald-Coefficient Restrictions (Figura 3-14). Rellenando la pantalla Wald Test como se indica en la Figura 3-22 se contrasta Ia restriccién f= 1. Al pulsar Aceptar se “obtiene la Figura 3-23, cuyo p-valor pequeiio indica el rechazo de la hipst ‘También se puede contrastar grdficamente la presencia de autocorrelacién graficando Jos residuos contra el mimero de observacién mediante Quick > Graph — Scatter (Figura 3-17) y rellenado la pantalla Series List como se indica en la Figura 3-24. Al pulsar OK se obtiene el grafico de la Figura 3-25 que presenta una distribuci6n aleatoria de sus puntos. = = ain = lee ca coco (ea eran Race Galles! 2.288 Famine Diderot aat_2ACEOD Pout) Figura 3-22 Figura 3-23 © MTES Paraninfow 133 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Figura 3-25 A continuacién analizaremos la heteroscedasticidad usando el contraste de W de White. Para ello realizamos una regresién MCO de los cuadrados de los residuos sobre todas las variables independientes del modelo, sus cuadrados y sus productos cruzados. Obtenemos: 1 = ~43001,86 ~169,11Y, +208,29C, , +0,0012Y,? ~0,0014C;, -0.002¥,C,.. La homoscedasticidad se aceptaré si el contraste de la F permite aceptar la nulidad conjunta de todos los pardmetros salvo la constante. Rk 0164/2 (-R)AT=k=1) (1=0164)130-2-1) Fire. Puede observarse en las tablas de la F que F oas.227 = 3.36 > 2,648, lo que nos lleva al rechazo de la significatividad conjunta del modelo (aceptaci6n de (=f. =f:=0). Por lo tanto el modelo de Brown esté libre de heteroscedasticidad. Una forma alternativa muy sencilla de realizar el contraste de White es utilizar una Chi-cuadrado en vez del contraste de la F. Para ello, sabemos que bajo la hipétesis nula de homoscedasticidad, el estadistico T(R’) se distribuye segtin una Chi-cuadrado con p(p-1)/2 -1 ¢grados de libertad siendo p el mimero de regresores del modelo original incluyendo el término independiente (en nuestro caso p = 4). Luego tenemos. TR) > x5 En nuestro caso T(R?) = 30(0,164) = 4,92. El valor tabular al 95% para una Chi- cuadrado con 5 grados de libertad es 11,07 > 4,92, con lo que se acepta la hipétesis nula de homoscedasticidad Podemos concluir que el modelo de Brown es un buen modelo para ajustar el ‘consumo en funcidn de la renta disponible para los datos dados. Podemos contrastar Ia ausencia de heteroscedasticidad en el modelo con Eviews. Pata ello utilizamos el contraste de White desde la pantalla Equation mediante View —» Residual Test White Heteroskedasticity (no cross terms) (Figura 3-26). En la Figura 3-27 se observa que las probabilidades relativas a la F y a la Chi-cuadrado son mucho mayores que 0,05, lo que nos Hleva a aceptar la ausencia de heteroscedasticidad. 134+© ES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Figura 3.26 Figura 3-27 Podemos analizar también la normalidad de los residuos con Eviews. Para ello, deste 1a pantalla Equation, utilizamos View —> Residual Tests > Histogram-Normality Test (Figura 3-28). El p-valor del contraste de Jarque-Vera de la Figura 3-29 mayor que 0,05 muestra la normalidad residual Figura 3-29 Consideramos el modelo ¥, =f, + A,X, +u, en el que se conoce que los residuos siguen la siguiente estructura AR(1) u, siguientes datos: Su, +¢, ¢, >No). El modelo se estima para los ¥, [22 26 32 31 40 46 46 50 X,[4 6 10 2 13 16 20 2 ala vista de esta informaci6n realizar una estimacién correcta del modelo. SOLUCION: Estamos ante un modelo con autocorrelacién en el que los residuos siguen un proceso autorregresivo de orden. Como ademas conocemos el valor de = 0,5, podemos intentar la estimacién por el método de minimos cuadrados generalizados MCG. Las estimaciones vienen dadas por Byog =(X'Q™X) "XQ" siendo: 1 -p 0 = 0 =p itp? 0 0 0 =p Ite? 0 © MTES Paraninfow 135 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Segiin los datos de nuestro problema: 1-05 0 0 0 0 0 0 -05 125 -05 0 0 0 0 0 0 -0s 125 -05 0 0 0 0 0 0 -os 125 -05 0 0 0 1-os| 0 0 0 -05 125 -05 0 0 0 0 0 0 -os 125 -05 0 0 0 0 0 0 ~-o5 125 -o5 0 0 0 0 0 0 -os 14 Luego tenemos: Byoo =(X'Q*X) XO" _(1749)_(2, “(9 A, La matt de varianzas covarianzas del estimador es a 12095 -0,0705) sy iecatxy' a ) =0,0705 0.00846 El modelo correctamente estimado seri: y, 719+ 149%, +4, Alternativamente, puede obtenerse el estimador MCG mediante el método de Price Winsten cestimando el modelo transformado: ¥, — pY,, = Ay(1~p)+ By(Xa — PX a.y)+-+ Be(Xu— PKs) para f = 23...P por MCO. Para t = I se realiza 1a transformacién siguiente: I pPY, = Y= PB, + BAX +4 BX 4) jepresentamos el modelo transformado como M, = fy Zy +f, Z, +1, Los datos transformados serdn los siguientes: My Zo. Zu. t pr, (para t= 1) 6 - p* (parar=1)6 | ¥. ‘X, (pata t= 16 Fels (para = 2.08) | top (parat= 2,8) | Y= ps (paras =2.n8) 1 19,052S5888 0866025404 346410162, 2 1S 05 4 3 19 05 7 4 15. 05 2 5 24,5 05 7 6 26 05 95 7 23 05 12 g 27 05 2 Ahora, las matrices Xe ¥ pata el ajuste MCO (sin constante) son las siguientes 136 +© TES Parsnino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES 14 | hesscesrtar= (29). (2) x OS 7 y 245 A, Se observa que los resultados coinciden al utilizar los dos métodos. Ademés, este Lltimo ajuste por MCO presenta caracteristicas dptimas (significatividad fuerte de todos los ardmetros, tanto individual como conjunta, bajos valores de los criterios de informacién de Akaike y Swartz y buen valor del estadistico de Durbin Watson segtin la Figura 3-31), Para realizar el ajuste MCO anterior con Eviews, se elige Quick — Estimate Equation, se escribe Ia ecuaci6n del modelo a ajustar en el eampo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 3-30) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 3-31 Case) [ise Figura 3-30 Figura 3-3? 3.4. El archivo 3-4.w/1 contiene los datos de 1a economia espafiola para el perfodo 1985-1997 relativos al consumo piiblico CP y al producto interior bruto a precios de mercado PIBPM. Con esta informacién se trata de explicar el consumo piblico en funcién del PIBPM mediante Ja ecuaci6n siguiente CP, = + BPIBPM + Ajustar el modelo teniendo presente los efectos de la autocorrelacién y que el consumo en un afio dado puede depender del consumo en el afio anterior. SOLUCION: Si ajustamos el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-32 se obtienen los resultados de Ia Figura 3-33, Eicon Figura 3-32 Figura 3-33 © MTES-Paraninfow 137 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Se observa buena significatividad individual y conjunta de los pardmetros y buen coeficiente de determinacién, pero el valor del estadistico de Durbin Watson inicialmente muy alejado de 2 puede indicar presencia de autocorrelacién. En la tabla del estadistico de Durbin- Watson para T= 13, k= 1 y a= 0,05 se tiene que d; = 1,01 y dy = 1,34. Como d= 04 < di, 1,01 se acepta la existencia de autocorrelacisn positiva. Ya sabemos que existe autocorrelacién positiva. El siguiente paso sera detectar ef orden de esta autocorrelacién. Para ello puede utilizarse 1 correlograma residual, Para ello, desde Ia pantalla Equation, utilizamos View — Residual Test — Correlogram-Q-Statistics (Figura 3-34). Se eligen 11 retardos (valor por defecto) para representar las funciones de autocorrelacién (AC) y autocorrelacién parcial (PAC) de los residuos (Figura 3-35) y al pulsar OK se obtienen las gréficas de Ia Figura 3-36. La funcién de autocorrelaci6n (correlograma) presenta una estructura de decrecimiento sinusoidal y la funcién de autocorrelacién parcial s6lo tiene el primer término significativamente distinto de cero (la tinica barra que atraviesa las bandas de confianza rayadas). Por lo tanto los residuos presentan una estructura autorregresiva de orden uno AR(1). Eonar Niet teat Seco pastel + | we trees ‘ance eS i en Verte | wea | facie rom |; sez ome | (9 cee [ts Sahat ana? Pease) Figura 3-35 d 3038 OS aes oot crsbper- tte E a 3 bae 8m teu Gog | Meant Crcbpendenndenich ' pier oer aoe oe (Pa jee ee ‘ Aaqused Rescued MOH Tes. ‘ & Zi Wise terdecatty cesses) ‘ ew Fewere esas ~ Tao Poastante) —OODuD Figura 3-36 Figura 3-37 ‘También se puede detectar la autocorrelacién a través del contraste de Breus-Godfrey. Para ello, desde la pantalla Equation, utilizamos View —» Residual Tests —» Serial Correlation LM Test (Figura 3-37), Se elige | retardo en la Figura 3-38 porque ya sabemos que la estructura de los residuos es AR(I) y al pulsar OK se obtienen los resultados de la Figura 3-39. Se observan p- valores para la F (0.001498) y la Chi-cuadrado (0,003604) menores que 0,05, lo que nos lleva a aceptar la presencia de autocorrelacién. Ademés, el coeficiente AR(1) estimado es significative con p-valor = 0.0015 < 0,05, lo que confirma Ia estructura AR(1) para los residuos. 1986 TES-Paraito MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Resa Pied syne ost Sumawueined e311 Souazctemn” 286M Laglactest 0 Fatwa tes ee Onbutaien stn 03S? Pewee) ONCE een Figura 338 Figura 3 39 En presencia de autocorrelacién se puede realizar la estimacién mediante et método de Cochrane-Oreut con Eviews. Se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification (obsérvese la inclusidn del término AR(1) como una variable explicativa més justificada por la presencia de autocorrelaci6n de orden 1), se elige Least Squares en el campo Method para ajustar por ‘mfnimos cuadrados (Figura 3-40) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 3-41 ce [Sn ‘eeetomsain shores oer 1d ae, oS LeSaoe E a) . Siieed Aube crein 3.438 SS eee Figura 3-40 Figura 3-4 Se observa que le pardmetro relativo a la variable PIBPM no es significativo, con lo ‘que hemos de buscar otra via para arreglar el problema de la autocorrelacién en el modelo. ‘Como el consumo en un afio dado puede depender del consumo en el afio anterior, si introducimos en el modelo un retardo de la variable dependiente CPCI), tendrfamos para analizar el modelo siguiente: CP, = {y+ BPIBPM, + fy CP. + Si ajustamos el nuevo modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-42 se obtienen los resultados de la Figura 3-43. Se “observa buen R?, buena significatividad conjunta y mala significatividad de PIBPM. © MTES Paraninfow 139 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS ‘eaten Soeies ee Sensors tmcey Smetana” ee SSeniasin ae “Teioe Pup mane) buna ao Figura 342 Figura 343 Se obtiene un valor del estadistico de Durbin Watson d=1,61 muy proximo a 2, pero ‘como el modelo tiene como regresor el regresando desfasado, no es adecuado utilizar el estadistico de Durbin-Watson para analizar la autocorrelacién, En su lugar utilizaremos el contraste h de Durbin, cuyo estadistico se define como: n=p|—* __ =p | 4 rv» "\i-r6hy , T 30 =019 => h= 6 |————. = (0,19), | ——————__. = Shel (a(B,)y a =12(0,169258)" Como [0,8] < 1,96 se acepta la hipétesis nula de no autocorrelacién para un nivel de significacién de 0,05. Vemos entonces que el modelo con un retardo de Ia variable depenediente esté libre de autocorrelacién. Tenemos: d=21-p)>p ‘También se puede detectar la autocorrelacién a través del contraste de Breus-Godfrey. Para ello, desde la pantalla Equation, utilizamos View —» Residual Test — Serial Correlation LM Test (Figura 3-44). Se elige 1 retardo para la estructura de los residuos y al pulsar OK se obtienen Jos resultados de la Figura 3-45. Se observan p-valores para la F (0,751334) y Ia Chi-cuadrado (0.689866) mayores que 0,05, lo que nos lleva a aceptar la ausencia de autocorreiacién, stot covets yet) 8 Exe FSi Pek Saveaundeok EO" Somme e wae eyiahes ee Peer Figura 3-44 Figura 3-45 140+© TES-Paranino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Eviews permite realizar el contraste de White de heteroscedasticidad desde 1a pantalla Equation mediante View —> Residual Tests —» White Heteroskedasticity (no cross terms) (Figura 3-46), Se obtiene la Figura 3-47 en la que se observa que los p-valores de la Fy de los términos cruzados son mayores que 0,05, lo que nos lleva a aceptar formalmente la ausencia de heteroscedasticidad al 95%. Figuca 3-46 Figura 3-47 Por lo tanto, el tinico problema que presenta el modelo con el consumo retardado es la mala significatividad de PIBPM. El ajuste serfa CP, = 780684,3 — 0.02714 PIBPM, + 0.934178 CP. + u Si ajustamos el modelo sin constante por MCO rellenando Ia pantalla Equation Estimation de Eviews como se indica en la Figura 3-48 se obtienen los resultados de la Figura 3-49 ‘que presenta un buen ajuste (R° alto y significatividad individual y conjunta de los parémetros cestimados muy alta) fonclna Icom) brcJNnelnse Gemaeleweasttiats oss) itera Ee aane A 3 Ajutedagares O97 Stlcaperienar Sur § Seok ase SEdnyerion 253 Antemocusan Bese SS teae||taiceee™ ene seta Te Figura 3-48 Figura 3-49 ‘Como el modelo no tiene constante, el estadistico de Durbin Watson no es adecuado ara contrastar la autocorrelaci6n, tarea que se Ileva a cabo mediante el test de Breusch-Godfrey (Figuras 3-50 y 3-51) cuyos p-valores de la F y la Chi-cuadrado son mayores de 0,005, lo que indica ausencia de autocorrelacién. Los p-valores de la F y Ia Chi-cuadrado mayores que 0,05 del test de White (Figura 3-52) indican ausencia de heteroscedasticidad y el p-valor del test de Jarque-Vera mayor que 0,005 (Figura 3-53) indica normalidad de los residuos. © MTES-Paraninfo 141 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Figura 3-52 Figura 3-53 El ajuste del modelo con el consumo retardado sin constante seré: producto interior bruto a precios de mereado (P/B), (ambas en miles de CP, =~ 0,018535 PIBPM, + 1,204963 CP, + u 3.5. El archivo 3-5.nfl contiene informacidn de la economia espafiola correspondiente al periodo 1964-1980 sobre tres variables macroeconémicas: importaciones energéticas reales (IMPEN), illones de pesetas constantes de 1970), y el precio relativo de las importaciones energética (PREN) Estimar el modelo de regresién que pretende explicar el volumen de importaciones energéticas cen funcién de las variaciones del PIB, y el precio relativo de las importaciones. Criticar el modelo e introducir alguna variable ficticia adecuada con criterio econémico que ayude a obtener un buen ajuste. SOLUCION: Si ajustamos el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en Ia Fi observa buena significatividad indi ira 3-54 se obtienen los resultados de la Figura 3-55. Se idual y conjunta de los parémetros y buen coeficiente de determinaci6n, pero el valor del estadistico de Durbin Watson inicialmente lejano de 2 puede indicar presencia de autocorrelacisn. 14200 TES-Parnito MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES elsme Petpet) OOmIeD Figura 3-54 En la tabla del estadistico de Durbin-Watson para T'= 22, k= 2 y a= 0.05 se tiene que dy = 1,147 y dy = 1,541, Como di, = 1,147 < d= 1,41 < dy = 1,541 estamos en la zona de indeterminacién de la autocorrelacién, Una altemativa para clarificar el problema de la autocorrelacién podria ser la introduccién de una variable ficticia. El posible criterio econémico a utilizar podria ser el impacto de la crisis energética de 1997 en la economia espafiola. Dicha variable, de nombre FICTICIA, valdré 0 entre 1964 y 1976, y valdré 1 entre 1977 y 1985. Al afiadir esta variable y ajustar el modelo por MCO reilenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-56, se obtienen los resultados de la Figura 3-57. Se observa que ha mejorado 1a significatividad individual y conjunta de los parimetros y los coeficientes de determinaci6n, y el valor del estadistico de Durbin Watson se acerca mas a2. En la tabla del estadfstico de Durbin-Watson para T= 22, k= 2 y a= 0,05 se tiene que d, = 1,05 y duy= 1,66 Como dy = d=1,662690 esté més clara la ausencia de autocorrelacién, ae eet ed SS See a Figura 3-56 Los p-valores de la Fy la Chi-cuadrado mayores que 0,05 del test de White (Figura 3-58 y 3-59) indican ausencia de heteroscedasticidad y el p-valor del test de Jarque-Vera mayor que 0,005 (Figura 3-60 y 3-61) indica normalidad de los residuos. El modelo ajustado sera IMPEN = -28.080487 + 0.028836756*PIB - 0.03151911684*PREN - 9.325*FICTICIA + u Los parémetros estimados difieren poco de las estimaciones obtenidas sin Ia variable ficticia ya que el problema de Ia autocorrelacién no era muy acusado. © MTES Paraninfow 143 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Seaman 34 Dukes set “Tenase Patatee) Figuca 3-38 Figura 3-59 Rititnsane Gf sneenntn omen Figura 3-60 Figura 3-61 »3. Con el objetivo de estudiar la evolucién fiscal en Espaiia se estima un modelo de regresién que intenta explicar las variaciones de los ingresos piblicos a partir del PIB nominal. Se dispone del archivo 3-6.wf1 que contiene informacién del Banco de Espafia referida al periodo. 1955-1991. Con las variables en logaritmos, estime un modelo de regresién simple entre los ingresos piblicos (Ingresos) y el PIB nominal (PIB). Represente los residuos de la estimacién con respecto a la variable endégena del modelo. {Justifican estos residuos la existencia de algin comportamiento irregular en los ingresos piblicos no explicado por el PIB nominal y no incluido en el modelo estimado? Incluir en Ia estimacién una variable ficticia, de modo aditivo y multiplicativo, que toma el valor 1 desde el afio 1978 en adelante. Realizar la misma estimacién valorindola estadisticamente Representar de nuevo el grifico de residuos. compardndolo con el del apartado anterior. SOLUCION: Si ajustamos el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-62 se obtienen los resultados de la Figura 3-63. Se observa significatividad individual y conjunta de los parémetros muy alta y muy buen coeficiente de determinacién, pero el valor del estadistico de Durbin Watson inicialmente muy lejano de 2 puede indicar presencia de autocorrelacién. 140 TES-Paranino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Looe the Bios on ono wa . oo ie SS Fawr Figura @ Figura 63 En la tabla del estadistico de Durbin-Watson para T'= 32, k= 1 y a= 0.05 se tiene que d= 1,373 y dy= 1,502. Como d= 0,161994 < d= 1,373, existe autocorrelacién positiva Para representar los residuos contra la variable endégena del modelo utilizamos Quick = Graph — Scatter, rellenamos la pantalla Series List como se indica en la Figura 3-64 y al pulsar OK se obtiene el gréfico de la Figura 3-65, cuya estructura no aleatoria indica la no linealidad del modelo. Como ademés la gréfica es ajustable a una parabola, el modelo podré contener términos de orden dos (cuadrados © productos de variables). Ello nos leva a incluir la variable ficticia en el modelo, tanto aditivamente como multiplicativamente. i] s Fr = aI mh Figura 3 64 Figura 3-65 Al afiadir 1a variable ficticia aditiva y multiplicativamente y ajustar el modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-66, se obtienen los resultados de Ia Figura 3-67. {Sao aE i Figura 3-66 Figura 3-67 © MTES Paraninfow 145 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Se observa que ha mejorado la significatividad individual y conjunta de los pardmetros y los coeficientes de determinaci6n, y el valor del estadistico de Durbin Watson se acerca més a 2, En la tabla del estadistico de Durbin-Watson para dy = 1,65. Como d = 0.962591 < d, = 1,244, 32, k=3 y @=0,05 se tiene que d = 1,244 y sigue existiendo autocorrelacién positiva. Si representamos ahora los residuos contra Ja variable end6gena del modelo utilizamos Quick —> Graph —+ Scatter, rellenando la pantalla Series List como se indica en la Figura 3-68 y pulsando OK, se obtiene el gréfico de la Figura 3-69, cuya estructura ya es aleatoria Figura 3-68 Figura 3-69 Ya sabemos que existe autocorrelaci6n positiva. El siguiente paso serd detectar el orden de esta autocorrelacién, Para ello puede utilizarse el correlograma residual. Desde la pantalla Equation, wilizamos View —> Residual Tests — Correlogram-Q-Statistics (Figura 3-70). Se eligen 16 retardos (valor por defecto) para representar las funciones de autocorrelacién (AC) y autocorrelacin parcial (PAC) de los residuos y al pulsar OK se obtienen las grficas de la Figura 3-71 La funcién de autocorrelacién (correlograma) presenta una estructura de decrecimiento sinusoidal y la funcién de autocorrelacién parcial s6lo tiene el primer término significativamente distinto de cero (la tinica barra que atraviesa las bandas de confianza rayadas). Por lo tanto los residuos presentan una estructura autorregresiva de orden uno AR(1). sone Reaqaned Figura 3-70 Figura 3-78 En presencia de autocorrelacién se puede realizar la estimacién mediante el método de Cochrane-Oreut con Eviews. Se elige Quick — Estimate Equation, se eseribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification (obsérvese 1a inclusién del témino AR(1) como una variable explicativa més justificada por la presencia de autocorrelacién de orden 1), se elige Least Squares en el campo Method para ajustar por minimos ‘cuadrados (Figura 3-72) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 3-73, 146 © TES Paranito MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Loerie peer erotln Shenescteneebe icine ‘ree eee) eae) (Gee Figura 3 72 Figura 373 Se observa significatividad individual y conjunta de los pardmetros muy alta y muy buen coeficiente de determinacién, También es significativo el término autorregresivo AR(1). Por lo tanto, el modelo finalmente estimado tendré la siguiente ecuaci6n: LOG(INGRESOS), = -3.130478116 + 1.064410042*/.0G(PIBN), - 4.597217161*FICTICIA1, + 0.28405538 15"FICTICIA *LOG(PIBN), + u, La estructura residual sera la siguiente: y= 0,545532*u,1 +e, No hay problemas de normatidad de los residuos porque utilizando View —» Residual Tests > Histogram — Normality Test desde la pantalla Equation, se obtienen los resultados de Ja Figura 3-74 que presenta un p-valor del estadistico de Jarque-Vera superior a 0,05. ‘Tampoco hay problemas de heteroscedasticidad porque utilizando View — Residual Tests > White Heteroskedasticity (no cross terms) desde la pantalla Equation, se obtienen los resultados de la Figura 3-75 con p-valores de la F y la Chi-cuadrado superiores a 0,05. eFrstem borlairm Kars onsen © MTES Paraninfow 147 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Supongamos que el coste de las comisiones Y pagadas por una cierta empresa varia proporcionalmente con las ventas X del producto. Se sabe que a partir de un cierto nivel de estas, por ejemplo 5500, la proporcién de Ia comisién se eleva. Se dispone de los datos siguientes, ¥ x 256 1000 Ald 2000 634 3000 728 4000 1003) ‘5000 1839 ‘6000 2081 "7000 2423 8000 2734 ‘9000 2914 10000 Estimar un modelo de regresién adecuado que explique las comisiones pagadas en funcién de las ventas del producto. SOLUCION: Como a partir de ventas superiores a 5500 Ia comisiGn se eleva, la pendiente del modelo ajustado sera diferente antes y después de esa cantidad. Por esta razén utilizaremos tuna regresién por tramos. Considerar dos tramos de la variable X ( X<5500 y X>5500). Para realizar la estimacién del modelo se crearé una variable ficticia D que valga cero para valores inferiores a 5500 y 1 para los valores superiores, La ecuacién del modelo a ajustar ser la siguiente Y= ah + GX, + a (X,—-5500)D, + uy 1 si X, > 5500 ~ {i enel resto Suponiendo E(u,)=0, se tiene que: a +X, 0 - Ot X* +( aby 06)Xe Se observa que a corresponde a la pendiente de la recta de regresién en el primer tramo (X<5500) y arta es la pendiente de la recta de regresién en el segundo tramo (X>5500), Ajustamos €l modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-76 se obtienen los resultados de la Figura 3-77. La variable (X-5500)*D se ha denominado TR. Se observa mala significatividad individual para Cy TR, significatividad conjunta muy alta y muy buen coeficiente de determinacién 148 +© TES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES te Seles eee a) eee 2 |/SSiTosams Sages Seem ao | |W) Sectetncs Bigee Exec Cy eae) ae TS Ae Tigura 3-76 Figura 3-77 Los modelos ajustados en ambos tramos son los siguientes: ¥,=-145,7167 + 0279126 X, si X,< 5500 ¥,=-145,7167 - 0,0945*5500 + (0.279126 +0,0945)x, 665.466 + 0,3736X, si X,> 5500 Podrfan ajustarse los modelos sin constante por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-78 para obtener los resultados de la Figura 3-79. Ahora todos los pardmetros estimados son significativos, SS aor [vbr los) rsh res ermenroeas sles) Method Lows Squnres el ont 10 tune Gorn dea Om Saragorecret 20052 Sctewzertion 124701 feck 10 ed Coe) Figuea 3-78 Figura 3-79 Los modelos ajustados en ambos tramos son los siguientes: 244684 X, si Xi < 5500 1421895500 + (0.244684 +0,142189)X, = 782,04 + 0,386873 X; si X_> 5500 > 3.8. El archivo 3-8.w/1 contiene datos trimestrales correspondientes a los ejercicios 1996-2003, relativos al consumo de electricidad en Espaiia Y; medido en GWh y al PIB a precios de mercado en millones de euros constantes de 1995. Se trata de ajustar un modelo adecuado que explique el consumo de electricidad en funcién del PIB teniendo presente la posible estacionalidad de los datos. © MTES Paraninfow 149 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS SOLUCION: Existe la posibilidad de que el consumo de energia eléctrica ¥, sea una variable estacional trimestral. Para representarla grificamente utilizamos Quick > Graph — Scatter, rellenamos la pantalla Series List como se indica en la Figura 3-80 y al pulsar OK se obtiene el grafico de la Figura 3-81, cuya estructura indica la estacionalidad trimestral Feels er Ieee) Belrnfneleoen er), rs elie bees] teal 2S mi CRT Ea Figura 3-80 Figura 3-8? Dado que la serie temporal ¥; presenta es estacional trimestral, para tener presentes los efectos de la estacionalidad consideramos el modelo Y= Gt Qy + GQn + Hn + GX + my 0, = [lenel srimestre i "Yen el resto Se observa que en el modelo se omite la variable ficticia relativa al cuarto trimestre para evitar la colinealidad perfecta. Ajustamos el modelo por MCO rellenando 1a pantalla Equation Estimation de Eviews como se indica en la Figura 3-82 obteniendo los resultados de la Figura 3-83, Se observa significatividad individual y conjunta de los pardmetros muy alta y muy buen coeficiente de determinacién, En la tabla del estadistico de Durbin-Watson para T= 32, k= 4 y @= 0,05 se tiene que dy, = 1,177 y dy = 1,732. Como d, < d= 1,47 < dy estamos en la zona de indeterminacién de la autocorrelacisn. ‘Sirota ahevectonmenbsvietecee ‘SEE See to eh anaes 180+© I1ES-Paraito MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES También se puede detectar la autocorrelacién a través del contraste de Breus-Godfrey. Para ello, desde la pantalla Equation, utilizamos View —» Residual Tests —» Serial Correlation LM Test (Figura 3-84). Se elige 1 retardo para suponer estructura de los residuos es AR(1) y al pulsar OK se obtienen los resultados de la Figura 3-85. Se observan p-valores para la F (0.383847) y Ia Chi-cuadrado (0,332944) mayores que 0.05, lo que nos Ileva a rechazar la presencia de autocorrelacién. Figuca 3-84 Figuea 3-35 ‘Como los pardmetros estimados del modelo anterior relativos a las variables ficticias son significativamente distintos de cero individualmente, el efecto estacional esté presente. Estos pardmetros miden el efecto relativo de cada trimestre. El modelo finalmente estimado es el siguiente: ¥, = -24411.59789 +3072.03843 Q - 880.9443838 On + 1054.44384 Qs, + 0.552526998 X, + »3.9. El archivo 3-9.w/l contiene datos para la economia espaiola correspondientes a los ejercicios 1964-1998, relativos al consumo privado nacional CPN80, renta neta disponible fami (RDNFAMB09, tipo de interés real a corto plazo (RCP80) e impuesto inflacionario (IT). Se trata de ajustar un modelo adecuado que explique el consumo privado nacional en funcién de la renta disponible familiar, el tipo de interés a corto plazo y el impuesto inflacionario, teniendo presente la posible existencia de un cambio estructural en 1986 como consecuencia de Ja entrada de Espaiia en la Comunidad Econémica Europea. Analizar la estabilidad estructural (constancia en el tiempo de los parémetros estimados) y su utilidad para la prediccién SOLUCION: El modelo que se propone estimar es el siguiente: CPN80,= f+ f; RDNFAMSO, + Bs RCP8O,+ Bs IT, + u, Podemos realizar una primera estimacién en todo el perfodo de variacién de los datos rellenando Ia pantalla Equation Estimation de Eviews como se indica en la Figura 3-86 para obtener los resultados de Ia Figura 3-87. Se observa buena significatividad individual y conjunta de los parémetros y muy buen coeficiente de determinacién, En la tabla del estadistico de Durbin-Watson para T= 35, k= 3 y a= 0,05 se tiene que di, = 1,283 y dy 1,653. Como d;, < d = 1,32 < dy estamos en Ia zona de indeterminaci6n de la autocorrelacién, ero como d esta mas cerca de d, que de dyes muy posible la existencia de autocorrelacién, © MTES-Paraninfo 151 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Podemos contrastar de forma més precisa Ia autocorrelacién a través del contraste de Breus-Godfrey, Para ello, desde la pantalla Equation, utilizamos View —» Residual Tests Serial Correlation LM Test (Figura 3-88). Se elige 1 retardo para suponer estructura de los residuos es AR(I) y al pulsar OK se obtienen los resultados de la Figura 3-89. Se observan p- valores para la F (0,85) y la Chi-cuadrado (0,67) menores que 0,09, lo que nos Ileva a aceptar la presencia de autocorrelacién al 90% de confianza como poco. Ademés, el término AR(I) resulta significativo al 91% (p-valor = 0,0851), lo que corrobora la presencia de autocorrelacién. Sap Va 225 eee ; es a Figuca 3-88 Figura 3-39 Dada la presencia de autocorrelacién en el modelo completo y Ia posible existencia de tun cambio estructural en 1986 como consecuencia de la entrada de Espafia en la Comunidad Econémica Europea, contrastaremos formalmente el cambio a partir del contraste de cambio estructural de Chow. Pata ello, desde la pantalla Equation, utilizamos View —» Stability Test — Chow Breakpoint Test (Figura 3-90). Se introduce 1986 en la pantalla Chow Tests (Figura 3-91) y al pulsar se obtienen los resultados de la Figura 3-92. Hay que tener la precaucién de que el mimero de observaciones de cada submuestra sea superior al ntimero de pardmetros a estimar, hecho que en nuestro caso se cumple, En la Figura 3-92 se observa que tanto el p-valor de la F ‘como el del ratio de la raz6n de verosimilitud son menores que 0,05. Ello indica que debemos aceptar la existencia de un cambio estructural en 1986, Ante este hecho podrfamos ajustar dos modelos distintos con los datos de cada periodo. Las Figuras 3-93 y 3-94 presentan el ajuste para el primer periodo y las Figuras 3-95 y 3-96 presentan el ajuste para el segundo periodo. Las mayores diferencias se encuentran en las estimaciones de la constante y del coeficiente de IT y Ja significatividad individual es menor en el segundo period. 18260 WES-Paranino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES aes Se 2 Ee a ae Tiga 3-50 Tiga ot et Wc tenetoen te Sanaa BS I soe Figura 3-92 Sinardinaquns Uetug SC" cpmde Cee) Cem |] Baw Tens neat Simacenean’” Hae = tae foun taee Bee) (eme)||Gtnitenne Zone Pearse oom Figura 3-95 Figura 3-96 © MTES Paraninfow 153 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS A continuacién analicaremos la estabilidad estructural del modelo (constancia en el tiempo de los pardmetros estimados) mediante el contraste de prediccién de Chow. Este contraste supone que los datos muestrales se dividen en dos zonas, la primera de las cuales suele ser mayor que Ia segunda. La primera se utiliza para la estimacién del modelo y la segunda para el constraste de validez de predicciones futuras hechas con el modelo estimado, En nuestro caso consideraremos como primer perfodo desde 1964 a 1985 (22 observaciones) y ‘como segundo periodo desde 1986 a 1998 (13 observaciones). El contraste de prediccién de Chow se realiza con Eviews desde la pantalla Equation, utilizando View — Stability Test > Chow Forecast Test (Figura 3-97). Se introduce 1986 en la pantalla Chow Tests (Figura 3-98) y al pulsar OK se obtienen los resultados de Ia Figura 3-99. Hay que tener Ia precaucién de que el mimero de observaciones de la primera submuestra sea superior al mimero de pardmetros a estimar, hecho que en nuestro caso se cumple. En la Figura 3-99 se observa que tanto el p-valor de la F como el del ratio de la razén de verosimilitud son menores que 0,05. Ello indica que debemos rechazar la existencia de estabilidad estructural. Por Jo tanto, las predieciones hechas con el modelo estimado para datos hasta 1986 no son vélidas ara horizontes temporales posteriores y sern menos validas al ir alejéndonos de 1986. No se acepta la constancia de los parémetros estimados en el tiempo. Se observa que la estimacién del modelo con datos hasta 1986 coincide en las Figuras 3-99 y 3-94. TonDeE Wepre a — Wy Bue oson it ams Freestate) OOD gf | Dusen at Figura 3-97 Figura 3-98 Bos ose) oli amanda ines) Fama a [alice fees) ok Ch ogmens) OOS Pewee) oom Figura 3-99 184.6 TES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Alternativamente analizaremos 1a estabilidad del modelo a partir de la estimacién recursiva. Esta técnica es adecuada cuando no se conoce a prioiri el momento del cambio estructural y se basa en la estimaciGn secuencial del modelo para distintos tamafios muestrales ‘comenzando con un tamafio igual al mimero de parémetros a estimar y afiadiendo una unidad en cada paso sucesivo hasta llegar a la muestra total. Con las sucesivas estimaciones se generan series de coeficientes y residuos recursivos. Si no hay cambio estructural, las sucesivas estimaciones de Jos pardmetros debieran mantenerse constantes y los residuos no se desviarin mucho de cero, En el grdfico de coeficientes recursivos se presentan las series de coeficientes estimados en los sucesivos pasos junto con sus bandas de confianza. Estos grificos deben presentar una evolucién cconstante de los coeficientes para que haya estabilidad estructural Los grificos de coeficientes recursivos se obtienen con Eviews mediante View —> Stability Tests > Recursive Estimates (OLS Only) (Figura 3-100). A continuacién se elige Recursive Coefficients en la pantalla Recursive Estimation de la Figura 3-101. Al pulsar OK se obtienen los _grificos de coeficientes recursivos para todos los parmetros del modelo (Figura 3-102). Se observa ‘que ninguno de ellos presenta una evolucidn constante en el tiempo (las figuras se alejan mucho de ser rectas horizontales) con lo que no habré estabilidad estructural. Se observa que las mayores variaciones se producen en todas las grficas a partir de 1986 (punto de cambio estructural) ae r a. = Figura 3-101 TT Figura 3-102 © MTES Paraninfow 155 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS En el gréfico de residuos recursivos se presentan los errores de prediccién un periodo hhacia adelante calculados en cada etapa de la estimacién recursive, El grifico de residuos recursivos se obtiene con Eviews mediante View —> Stability Tests —> Recursive Estimates (OLS Only) Figura 3-100). A continuacién se elige Recursive Residuals en la pantalla Recursive Estimation de la Figura 3-103. Al pulsar OK se obtiene el gréfico de residuos recursivos de la Figura 3-104. Se observa que los residuos varfan alrededor del valor cero, pero con grandes saltos, sobre todo cerca de 1986, llegando a sobrepasar las bandas de confianza con lo que no habré estabilidad estructural en el modelo. Ademas, este gréfico detecta el punto de cambio estructural (valor temporal correspondinte al residuo que ms sobrepasa las bandas de confianza) coonn ~~... \ ono cae orig] Spite Stresnorincar tee momo Olson oe Ofmctaoen ey |] ame Senanseed ee] CliewDeatn Ede, We TE TO TS Figura 3-103 Otra herramienta para detectar la estabilidad estructural de un modelo es el grdfico CUSUM que se construye a partir de la suma acumulada de los residuos recursivos. EI grafico CUSUM se obtiene con Eviews mediante View —> Stability Tests > Recursive Estimates (OLS Only) (Figura 3-100). A continuaciGn se elige CUSUM Test en la pantalla Recursive Estimation de la Figura 3-105. Al pulsar OK se obtiene el grafico de CUSUM de la Figura 3-106, Se observa que el grifico varia alrededor del valor cero de forma continuada hasta llegar al afio 1985, a partir del cual se produce un fuerte alejamiento continuado del valor cero, con lo que no habra estabilidad estructural en el modelo. ey Often | aera Seinen Oveethorooent ton Shimroncariee heuer ise atone seer ral TT Figura 3-105 Figura 3-106 156 © TES-Paranino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Otra herramienta adicional para detectar Ia estabilidad estructural de un modelo es el grafico CUSUMQ que se construye a partir de la sama acumulada de los cuadrados de los residuos recursivos. EI grafico CUSUMQ se obtiene con Eviews mediante View —» Stability Test —» Recursive Estimates (OLS Only) (Figura 3-100). A continuaciGn se elige CUSUM of Squares Test en la pantalla Recursive Estimation de la Figura 3-107. Al pulsar OK se obtiene el gréfico de CUSUMQ de Ia Figura 3-108. Se observa que el grifico se sale de las bandas paralelas de confianza desde 1978 a 1987, presentando el maximo alejamiento en el afio 1986, punto de cambio estructural, Por lo tanto no habré estabilidad estructural en el modelo. TEE TS TS TE TES Figura 3-107 Figura 3-108 Comprobada Ia existencia de un cambio estructural significativo en 1986, intentaremos utilizar variables ficticias para estimar el modelo en todo el perfodo de forma adecuada, Se debe considerar el modelo completo con variable ficticia y con las interacciones de todas las variables con la variable ficticia cuya ecuacién es la siguiente: % a + o*Ficticia, + f*RNDFAMB80, + f2*(Ficticia;* RNDFAMS80; ) + Ps*RCP80, +B" (Ficticia*RCP80, ) + B3*IT, +Bo'(FicticiasIT, + u, i, _ {isit2 1986 Ficticia, On el resto Ajustamos el modelo anterior por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-109 para obtener los resultados de Ia Figura 3-110. Se observa que todas las variables iniciales del modelo son significativas (ineluida la constante) y que la tinica variable significativa que engloba a la variable ficticia es la interacci6n Ficticia*IT. Esto indica que la inestabilidad estructural la provocé la variable IT. Por Jo tanto, un ecuacién coherente para nuestro modelo considerando toda la muestra seria Ia que incluye las variables iniciales del modelo y como regresores adicionales Ficticia y la interaceién Ficticia*IT. Ajustamos este nuevo modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-111 para obtener los resultados de la Figura 3-112. Se observan significatividades individuales y conjunta muy adecuadas, un R* muy bueno y un estadistico de Durbin Watson muy cereano a dos, lo que indica que nuestro modelo ya es adecuado para contemplar el cambio estructural © MTES Paraninfo« 187 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Che nce esac antes ito oe wa) g se ‘er uaa ba np dg Seiten ORmenel ener ‘ Figura 3-109 “cn re ae eget ere ed epee Sarge timo Folin a anode omant acta fet cnet 95 oan a eo oe ee we 3 Raitwoction Zues Figura 377 Figura 3112 Laestimacién del modelo final es la siguiente: CPNB0 = 402643.7193 + 1383254.677*Ficticia + 0.8178953693*RNDFAMBO + 5301791.606*RCP80 + 496,5896716*IT - $45.2721262* Ficticia*IT + u 3.10. El archivo 3-10.wf1 contiene datos para la economia espaiiola correspondientes a los ejercicios 1970-1993, relativos a los ingresos del sector pablico INGPUB, el PIB, el ahorro privado AHORRO, las importaciones IMPORT y las exportaciones EXPORT. Se trata de ajustar un modelo adecuado que explique los ingresos pblicos en funcién del resto de las variables. Ante problemas en el ajuste, considerar Ia posibilidad de la existencia de un cambio estructural en un aiio a determinar. Si es el caso, estimar el modelo conveniente que recoja el posible cambio estructural SOLUCION: E1 modelo que se propone estimar es el siguiente: 158+ © ITES-Parnino INGPUB, = y+ PIB, + { AHORRO, + f IMPORT, + B, IEXPORT + u, MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Podemos realizar una primera estimacién en todo el perfodo de variacién de los datos rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-113 para obtener los resultados de la Figura 3-114. Se observa buena significatividad individual y conjunta de los parémetros y muy buen coeficiente de determinacién. En la tabla del estadistico de Durbin-Watson para T= 24, k= 4 y a= 0,05 se tiene que d, = 1,013 y dy = 1,775. Como d, << d= 1,38418 < dy estamos en Ja zona de indeterminaci6n de la autocorrelaci6n, Probamos ahora la presencia de heteroscedasticidad. Para ello utilizamos el contraste de White desde 1a pantalla Equation mediante View > Residual Test > White Heteroskedasticity (no cross terms) Figura 3-115). En la Figura 3-116 se observa que las probabilidades relativas a la F y a la Chi-cuadrado son muy pequefias (menores que 0,1), lo ‘que nos lleva a aceptar la presencia de heteroscedasticidad al 90% de confianza como minimo. ce soe ay) | Ataoe Se NTL Wee 10:0 Eo enact Faken) tab Een Grae 3. Figura 3-115 Figura 3-16 Los problemas detectados en el ajuste del modelo pueden hacemos pensar en la posibilidad de un cambio estructural. Para detectarlo utilizaremos el gréfico de residuos recursivos, que se obtiene con Eviews mediante View —>» Stability Tests —> Recursive Estimates (OLS Only) (Figura 3-117). A continuacién se elige Recursive Residuals en la pantalla Recursive Estimation de la Figura 3-118. Al pulsar OK se obtienen el grafico de residuos recursivos de la Figura 3-119. Este grifico detecta inestabilidad estructural con punto de cambio estructural en 1982 (valor temporal comespondiente al residuo que mas sobrepasa las bandas de confianza), © MTES Paraninfow 159 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS. Figura 3-319 Una vez detectado el punto de cambio estructural en 1982, podemos aplicar el Test de Chow de cambio estructural para corroborar el resultado, Para ello, desde la pantalla Equation, utilizamos View —> Stability Tests > Chow Breakpoint Test (Figura 3-120), Se introduce 1982 cen Ia pantalla Chow Tests (Figura 3-121) y al pulsar se obtienen los resultados de la Figura 3- 122. Hay que tener la precaucién de que el niimero de observaciones de cada submuestra sea superior al nimero de pardmetros a estimar, hecho que en nuestro caso se cumple, En la Figura 3-122 se observa que tanto el p-valor de Ia F como el del ratio de la raz6n de verosimilitud son -menores que 0,05. Ello indica que debemos aceptar la existencia de un cambio estructural en 1982. ‘gates ames ui) SO openers ution o_Toteo Penne) OUD Figura 3-120 16066 WES-Paraino MODELOS DE REGRESION MULTIPLE CON SERIES TEMPORALES Tigra 3-122 Ante este hecho podriamos ajustar dos modelos distintos con los datos de cada perfodo, Sin embargo, realizaremos un tinico ajuste para todo el periodo introduciendo una variable ficticia adecuada, Se debe considerar el modelo completo con variable ficticia y con las interacciones de todas las variables con la variable ficticia cuya ecuaciGn es la siguiente: INGPUB, = &, + o4*Ficticia, + By*PIB, + B2*(Ficticia;*PIB,) + B3*AHORRO, + *(Ficticia;*AHORRO, ) + fist IMPORT, +,*(Ficticia;* IMPORT, ) + f;*EXPORT, “+Bs*(Picticia;* EXPORT, ) +t; 1 sit 21982 0 en el resto Ajustamos el modelo anterior por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en Ia Figura 3-123 para obtener los resultados de la Figura 3-124. Se observa que la tnica variable significativa que engloba a Ia variable fieticia es la interaccién Ficticia*PIB, Esto indica que la inestabilidad estructural la provoeé la variable PIB. Teed bd np ede be tek presto te ‘ge rors wonton tem ret see FI eeTeaae Ae Ee semen Figura 3-123 Figura 3-124 Por lo tanto, un ecuacin coherente para nuestro modelo considerando toda la muestra seria la que incluye las variables iniciales del modelo y como regresores adicionales Ficticia y la interaccién Ficticia*PIB. Ajustamos este nuevo modelo por MCO rellenando la pantalla Equation Estimation de Eviews como se indica en la Figura 3-125 para obtener los resultados de Ja Figura 3-126. Se observan significatividades individuales y conjunta muy adecuadas, un R” ‘muy bueno y un estadistico de Durbin Watson muy cereano a dos, lo que indica que nuestro modelo ya és adecuado para contemplar el cambio estructural. Ademés, el contraste de White desde Ia pantalla Equation mediante View —» Residual Tests > White Heteroskedasticity (no cross terms) (Figura 3-127) nos Tleva a los resultados de Ia Figura 3-128 con probabilidades relativas ala F y a 1a Chi-cuadrado que rechazan la heteroscedasticidad al 95% de confianza. © MTES-Paraninfo 161 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS. exh SBN rg aang Serie acca cea ae 5 Laan aN oe Fewste Prete) Figura 3-127 Figura 3-128 La estimacién del modelo final es la siguiente: INGPUB = 29.30934466 + 0.0005201795715*PIB ; - 0.3902169945*AHORRO,, - 0,1625667421* IMPORT, + 0.2325721434*EXPORT, + 4,809506403* Ficticia ;- 0.0002622652693*Ficticia, *PIB, + u, 16260 WES-Paraino ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 4.1 _MODELOS DINAMICOS En el contexto de los modelos con variables que son series temporales es tipico considerar retardos, tanto de Ia variable dependiente como de las variables independientes, en ‘euyo caso nos encontramos ante los modelos dinémicos. Por tanto, un modelo dindmico ‘general tomaré la siguiente expresi6n: y, =a+Say,, +¥BX,, +u, = ‘a Casos particulares de este modelo general son los siguientes: Modelo estitico—> a, = = 0 ¥,=a+B,X, +u, Modelo autorregresivo de orden n -> f, mY, =a+yay,,+u, wot 9 Y, = at BX,, +m, S Retardo distribuido de orden m —> a;=0, i Indicador adelantado de orden m —> a = f= 0,i= 1,...n > ¥,= a+) BX, +u, Modelo de ajuste parcial > f;=0,i>0— Y,=@+B,X,+ ay, ,+u, Modelo de correccién del error > Ya, + YB, =13 Y,=a+ Yay, +Y BX, +u, En general, cuando en el modelo dindmico todos los retardos pertenecen a variables explicativas, suele utilizarse estimacién MCO vigilando la multicolinealidad. Cuando existen retardos de la variable explicada se utiliza MCO mientras no haya autocorrelacién. Cuando existen retardos de la variable explicada y hay autocorrelaci6n se suele utilizar la estimacién mediante variables instrumentales utilizando [X, X,1,...] como instrumentos de (¥,, ¥ra..-] 4.1.1 Modelos con retardos distribuidos finitos Dado el modelo en retardos distribuidos Y,= “+ °5.X,,+u, se denomina estructura del retardo al conjunto (8} = (80,81. ...8:) Siempre que {5} sea finito estamos hablando de retardos distribuidos finitos. Hay varias formas de considerar la estructura del retardo como una funci6n temporal del orden del retardo que se exponen a continuacién (st1-)5 OSi 5, 0 i>s 16460 WES-Parsnino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION ¥,=H4D5X,, tu, =Ht ON G41-DX,, tu, = M+ 5Z, +, a a z {8} = (80,81, -...8:} = (86-1), 85, 566-1), 8(6-2),....5] id Osiss/2 Retardo en V invertida de DeLeeuw — 5, = (s-)S5 (s/2)+1 iss 2a Haws Z ox tm =sneg| Lox + Seow neu 21082, +4 (8) (8.4 BP = (0,8, BD). 8.01 Retardo polinomial de Almon — 5, =O, + i+ 1° +++ Gi y, =u+YOX,, +u, HH DK aS +, te +a, D7, +u, z ze, Taw FMA ML, +OLy + OL FF Lory, +My {3B} = (80.81, Ba} = (py By FA, FA HAL, Ay HASH AS? +4 5") En cuanto al niimero de retardos a elegir podemos utilizar los criterios de informacién de Akaike o Swartz, tomando el mimero de retardos para el que el modelo tiene los menores valores de los criterios de informaci6n, 4.1.2 Modelos con retardos distribuidos infinitos Un modelo en retardos distribuidos infinitos tiene la forma Y, = M+ 5)’ w,X, +u, a Retardo geométrico + w,= (I-A) O ¥, = H+ 5S -AAX,, tu, = H+ 5U-A DAL) X, +4, = M+ 80 A AE +, = Y(U~AL)= Ml AL) + U-AX, #4 (~ AL) = ¥, =M-Au+AY,, +50-A)X, +u, — Au, , = + GY. +O,X, +1) eS © MTES Paraninfow 165 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS De esta forma se ha transformado el modelo con retardos distribuidos en un modelo autorregresivo con regresores estocésticos que podré ser estimado por variables instrumentales, minimos cuadrados en dos etapas o MCO (cuando el regresor estocéstico sea independiente de la nueva perturbaci6n). Retardo geométrico de Klein ¥,=u+ oda -AAX,, tu, = 50 -AY AX, +601- AYAX,. +u, a ro a z 52, + 80~ ANAK, +2" X AMX yee dt = 8%, +£OU-ASAX, +u, =5Z,, +12 +u, El valor de 2. se elige mediante un procedimiento de tanteo (4=0,1, 0,2, 0,3....). Una vez caleulados Zs y Zx se estima el modelo por MCO. Se toma el A que minimiza Ia suma de ccuadrados residual 4.2 _ANALISIS UNIVARIANTE DE SERIES TEMPORALES 4.2.1 Componentes de una serie temporal Inicialmente se puede definir una serie temporal como una sucesién de valores en el tiempo. Designaremos la serie temporal por Ys, donde el indice i toma los valores 1, 2, .., N (representa por ejemplo aiios), y el indice k toma los valores 1, 2, .., m que representa por ejemplo meses (m = 12) o trimestres (m = 4), 0 cualquier otra fraccién de afto. El subindice k no es necesario cuando la variacién temporal no considera periodos inferiores al aio. La teorfa clisiea considera una serie de tiempo formada por cuatro componentes tedricas: tendencia, variaciones estacionales, variaciones ciclicas y variaciones residuales. La tendencia viene dada por el movimiento general a largo plazo de la serie. Las variaciones estacionales son oscilaciones que se producen con un perfodo igual o inferior a un afio, y que se reproducen de manera reconocible en los diferentes afios. Las variaciones cfclicas son oscilaciones que se producen con un perfodo superior al afio, y que se deben principalmente a Ja alternancia de etapas largas (ciclos) en las que se repite el comportamiento de la serie. Las variaciones residuales o irregulares son movimientos en Ia serie que no muestran un carcter periddico reconocible y que son originados por fenémenos singulares que afectan a la variable en estudio de manera casual y no permanente. Un supuesto fundamental del anélisis elésico es Ja independencia de las variaciones residuales respecto de las demés componentes. Una componente importante de toda serie temporal es su fendencia 0 movimiento general a largo plazo de la serie. En este caso, designaremos a la setie temporal por Z,, dependiendo sélo del indice ¢ (perfodo de tiempo principal), ya que de Io que se trata es de aislar el movimiento a largo plazo de la serie y no se necesitan subindices para perfodos inferiores al aii. Dados los valores de la serie temporal, podremos usar varios métodos para ajustar su tendencia. Entre ellos destacan el método del ajuste analitico, el método de las medias méviles y el método de las diferencias 166 +© WES-Parsino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Las variaciones estacionales son oscilaciones que se producen con un perfodo igual 0 inferior a un afio, y que se reproducen de manera reconocible en los diferentes aos. El motivo principal que induce a estudiar la componente estacional es que en la inmensa mayoria de las series ‘econémicas dicha componente provoca una distorsién de su verdadero movimiento. Para eliminar estas distorsiones y captar el movimiento real de la serie, es necesario eliminar las oscilaciones estacionales desestacionalizando Ia serie. La desestacionalizacién es una tarea no trivial que ha dado lugar a multitud de estudios y algoritmos, entre los que destacan los programas X11 y X12 del Bureau of the Census de Estados Unidos. A nivel trivial, existen varios métodos de desestacionalizacién. Los mas sencillos son el método de la tendencia, el método de las, medias méviles, el método de las diferencias estacionales y el métodlo de las variables ficticias (estudiado en el capitulo anterior), La componente ciclica de una serie temporal es la més dificil de detectar, pues diferencia de Ia tendencia, que es un movimiento a largo plazo muy general, y de las variaciones estacionales, que tienen un perfodo fijo, las variaciones ciclicas tienen un periodo no fécilmente identificable y en muchos casos incluso variable, siendo frecuente Ia existencia de ciclos que se superponen, lo que hace todavia més dificil su identificacién, En la préetica, ara identificar el ciclo, suele eliminarse de la serie la tendencia y las variaciones estacionales, y después analizar la parte restante de la serie, que puede denotarse por x = ¢ie + ri. Incluso puede prescindirse del doble subindice, ya que no existe variacién estacional. De esta forma se intentardn detectar los ciclos en la serie x;, mediante determinados métodos entre los que destaca el anélisis arménico y filtros como el de Hodrick Prescott. 4.2.2 Modelos ARIMA Los modelos estadisticos para series temporales univariantes tienen en cuenta la dependencia existente entre los datos en el tiempo. Cada observacidn en un momento dado es modelada en funcidn de los valores anteriores. Los andlisis se basan en un modelo explicito. Estos modelos se conocen con el nombre genérico de ARIMA (AutoRegresive Integrated Moving Average), el cual deriva de sus tres componentes: Autorregresivo (AR), Integrado()) de Medias Méviles (MA). El modelo ARIMA permite describir un valor como una funcién lineal de datos anteriores y errores debidos al azar. Puede incluir, ademas, un componente cfclico 0 estacional. El objetivo consiste en obtener un modelo adecuado, pero parsimonioso. Es decir, debe contener todos los elementos necesarios, pero los minimos necesarios para describir el fenémeno. Box y Jenkins recomiendan como minimo unas 50 observaciones en la serie temporal para modelizarla con la metodologfa ARIMA. Modelizar una serie temporal consiste en derivar un modelo ARIMA que se ajuste al conjunto de datos dado. Modelos Autorregresivos AR(p) Un modelo autorregresivo (AR) describe una clase particular de proceso en el que las observaciones en un momento dado son predecibles a partir de las observaciones previas del Proceso mas un término de error. El caso més simple es el ARIMA(I,0,0), 0 AR(I) o de primer ‘orden, cuya expresién matemitica es: X= OX +a, El proceso autorregresivo de orden p, representado por ARIMA(p.0,0), 0 simplemente por AR(p) toma Ia forma: K=O Xt BXr tat OXip ty © MTES-Paraninfo« 167 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS: ‘que puede ponerse, mediante el operador de cambio retroactivo B, en la forma: (Le ®B - OB? ....- BB?) Xt =a, BAX) = Xn Un proceso autorregresivo AR(p) es estacionario si las raices del potinomio en B dado por: 1- ®B - @,B° -...- &,B” caen fuera del citculo unidad. Esa condicién es equivalente a que las rafces de la ecuaci6n: x?-@ x?" - @ x?...-@,1 x-@, =0 sean todas inferiores a uno en médulo. Un proceso autorregresivo siempre es invertible. Modelos de medias méviles Ma(q) Un modelo de medias méviles (MA) también describe una serie temporal estacionaria, En este modelo el valor actual puede predrecirse a partir de 1a componente aleatoria de este momento y, en menor medida, de los impulsos aleatorios anteriores. El modelo ARIMA(0,0, 1), también denotado por MA(I), viene dado por la expresién oY El proceso de medias méviles de orden q, representado por ARIMA(0.0,q), 0 también por MA(q), viene dado por la expresién: X= a1 Vi es Vee oe Vag ‘que puede ponerse, mediante el operador de cambio retroaetivo B, en la forma: X= (1 vB - v2B? ~ = vB) a Un proceso de medias méviles es siempre estacionario Un proceso de medias méviles MA(q) es invertible si las rafces del polinomio en B definido por: 1 - v.B - vB? - .... - vgB" caen fuera del efrculo unidad. Esta condicién es ‘equivalente a que las raices de la ecuacién x'-@ x! - @, x -...- By x~ O, = 0 sean todas inferiores a uno en médulo. Modelos ARMA(p,q) Una extensién natural de los modelos AR(p) y MA(q) es un tipo de modelos que incluyen tanto términos autorregresivos como de medias méviles y se definen como ARMA(p.q) 0 también como ARIMA(p.0.g). Se representan por la ecuacién: X= DXi + Xia tact Dp Kop # y= V1 ht = V2.2 oe Vy rg ‘que puede ponerse de Ia forma: X= @ Kar Xia -vor Nop = y= Ve ar = Ve dea =e = Vo eg o sea: (le ®B - OB? -...- OB?) X, = EL proceso ARMA(p.g) es estacionario silo es su componente autorregresiva, y es invertible si lo es su componente de medias méviles. Por lo tanto podemos decir que un modelo ARMA(p.q) es invertible si las races del polinomio en B definido mediante 1 - vB - v2B" = ... = vB caen fuera del cfreulo unidad. Esta condicién es equivalente a que las races de In ecuaci6n x'- x Bx... B,x- @,=0 sean todas inferiores a uno en médulo. 1 = vB ~ v2B? =. = v9B") ay 168 +© WES-Parsino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Un modelo ARMA(?, 4) es estacionario si las rafces del polinomio definido por 1- ®B - f° -..- @,B? caen fuera del circulo unidad. Esa condicién es equivalente a que las raices de la ‘ecuacién: x°-@ x?! @ x”? -..-,, x- @, = 0 sean todas inferiores a uno en médulo. Modelos ARIMA(p,d,q) Un modelo ARIMA(0,d.0) es una serie temporal que se convierte en un ruido blanco (proceso puramente aleatorio) después de ser diferenciada d veces. El modelo ARIMA(0.d.0) se expresa mediante: (1 - B)d X, = a,. El modelo general ARIMA(p,d.q) denominado proceso autorregresivo integrado de medias méviles de orden p, d, q, toma la siguiente expresi6n: (Le DB - P28 -..- BBV A-BY! ¥, = (1 = B= v2B? =. ¥QB Yay, Un modelo ARIMA(p.d.q) permite describir una serie de observaciones después de que hayan sido diferenciadas d veces, a fin de extraer las posibles fuentes de no estacionaiedad. Esta formula general se puede aplicar a cualquier modelo. Si hay alguna ‘componente p,d.q igual a cero, se elimina el término correspondiente de la formula general. Los modelos ciclicos 0 estacionales son aquéllos que se caracterizan por oscilaciones cfclicas, también denominadas variaciones estacionales. Las variaciones efclicas a veces se superponen a una tendencia secular. Las series con tendencia secular y variaciones cfclicas pueden representarse mediante Jos modelos ARIMA(.d,q\(P,D,Q). El primer paréntesis se refiere a Ia tendencia secular 0 parte regular de la serie y el segundo paréntesis se refiere a las variaciones estacionales, 0 parte ciclica de la serie temporal La expresin de un modelo ARIMA(,1,1)(0,0,1);2 ser4: (1-B)X,= (1-B")(1-5 2B") La expresién de un modelo ARIMA(0,1,1)(0,1,1):2 sera: (1-B)(-B")X, = (1-,B)(1-52B") a, La expresi6n de un modelo ARIMA(2,1,0)(1,0,0):2 sera: (1-@,B* BB \(1-2,B"\(1-B)X, La expresién de un modelo ARIMA(1,1,1)(2,1,1),2 sera: (1B) )(1-Q,B"-QyB™)(1-BP\(1-B)X, = (1-vB)(1-52B") ay 4.2.3 Series estacionarias Para que una serie temporal sea estacionaria debe tenet una media aproximadamente cconstante en el tiempo (estacionariedad en media) y una varianza o dispersin también constante (estacionariedad en varianza), Esto implica que si dividimos una serie en subperfodos arbitrarios, Ja media y la varianza han de ser aproximadamente iguales en cada uno de ellos. En términos gréficos, una media constante supone Ia no existencia de tendencia y una varianza constante ‘correspond a un grifico en que las oscilaciones alrededor de la media sean similares © MTES-Pareninfow 169 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Funcién de Autocorrelacién La funcién de autocorrelacién FAC para una serie temporal X, se define como hy= ge/ go OVX XiWV(X) ke .1,0,1,2,3...Para procesos reales se cumple ademas que go>0, $8=84 he=h,, ho=l y fal menor o igual que 1. La representaci6n gréfica con hy en ordenadas y ‘ken abscisas se denomina correlograma de la serie temporal. La funcién de autocorrelacién de las series estacionarias disminuye sensiblemente a medida que aumenta el desfase temporal k. Esto no suele ocurrir en las series no estacionarias. En las aplicaciones précticas, en las que se dispone de ciertas observaciones, X; (#21,2,....D), la funcién de autocorrelacién, /, se estima mediante la fiuncién de autocorrelacién -muestral o estimada, que se define por: Lex, - HX. - 7, = r=, Le, -¥ La representacién gréfica den, denominada correlograma muestral, constituye un instrumento de andlisis de series temporales de gran interés préctico. Para obtener correlogramas debe partirse en la préctica de muestras de tamafio suficientemente grande (al menos 50 observaciones). La funcién de autocorrelacién muestral no se puede calcular cuando k>7+1, y en Ja préctica no debe calcularse para k>T/4, Funcién de autocorrelacién parcial Un concepto. muy itil en el andlisis de series temporales es la funcién de autocorrelacién parcial FACP de una serie temporal. El primer término de la funcién de autocorrelacién parcial, que vamos a denotar por 1, puede estimarse transformando la serie X, en desviaciones respecto a su media muestral ¥; = X,~- X’y a continuacién estimando una regresién de Y; sobre ¥.1. La pendiente estimada de esta regresin es ®:. El modelo de regresién es ¥; = PY,1 + u. Ademis, el primer valor de Ia funci6n de autocorrelacién parcial es precisamente igual al primer valor de la funci6n de autocorrelacién, El segundo valor de la funcién de autocorrelacién parcial, @, se estima mediante una regtesiGn de ¥, sobre ¥1 € Yea, El modelo de regresisn es ¥; = @:¥,+ ®oYea + uy El tercer valor de la funcidn de autocorrelacién parcial, @®s, se estima mediante una regresi6n de ¥; sobre ¥,;, Ysa € Ys. El modelo de regresién es ¥j= ®y¥i+ Po¥iat Pais + ue Vemos pues que la funcién de autocorrelacién parcial puede estimarse mediante una serie de regresiones, cada una de las cuales contiene como variable explicativa un retardo més ‘que Ia anterior, y de Ia que nos vamos quedando en cada caso con los coeficientes estimados en los retardos més altos: 1:, 22, ®ss, ... que son asf los valores estimados de la funcién de autocorrelacién parcial. Otra posibilidad de obtener Ia funcién de autocorrelacién parcial estimada es mediante formulas recursivas, utilizando Ja funcién de autocorrelacién previamente cestimada y utilizando las ecuaciones de Yule-Walker. A veces se suele denominar correlograma ala representacién gréfica de las funciones de autocorrelacién y autocorrelacién parcial 170+ WES-Parnino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Detecci6n practica de la estacionariedad y soluciones Para detectar répidamente la estacionatiedad se puede utilizar directamente el grdfico de la serie. Se divide el campo de variacién total de Ia serie en varios intervalos calculéndose para cada uno de ellos la media y la varianza, Si existe estacionalidad se toma como longitud del intervalo la del periodo estacional. Para ver sila serie es estacionaria en media basta comprobar que las medias de los intervalos no fluctien mucho. Para ver sila serie es estacionaria en varianca basta comprobar «que las varianzas de los intervalos son estables (no cambian bruscamente) y se mantienen en una franja estrecha, Otro criterio para detectar Ia estacionariedad en varianza es el grifico rango-media de Box- Cox, consistente en representar los puntos (media, rango) para todos los intervalos en que se ha dividido la serie. Si los puntos del grafico son ajustables a una recta con pendiente positiva no hay estacionariedad en varianza (sera necesario tomar logaritmos en la serie original). Si el grifico no tiene tendencia definida o es ajustable a una recta paralela al eje de abscisas hay estacionatiedad en varianza, También se puede detectar 1a estacionariedad en varianza mediante los contrastes de igualdad de varianzas aplicados a los diferentes intervalos en que se divide la serie. Otro criterio para detectar la estacionariedad en media es el criterio de la fiucién de ‘awtocorrelaci6n estimada, Silos coeficientes de la FAC no decaen répidamente hay un indicio claro de falta de estacionariedad en media, lo que nos levaria a tomar primeras diferencias en la serie original La estacionariedad en media también puede detectarse a través de los constrastes de raices unitarias, que se estudiarén més adelante en este mismo capitulo. Muy pocas series temporales reales del mundo econémico son estacionarias. La mayorta suelen presentar tendencia, suelen tener varianza no constante y también suelen presentar variaciones cestacionales. La presencia de variaciones estacionales se traduce en una vatiabilidad de la media del proceso, lo que es contrario a la hipstesis de estacionariedad. Pero, normalmente, es posible transformar muchas series econémicas reales no estacionarias en otras aproximadamente estacionarias, sometiéndolas a operaciones algebraicas adecuadas. A las series no estacionatias en media que presentan una tendencia lineal se las somete a Ja transformacién Z; X, - Xux para convertirlas en estacionarias, Si X; muestra una tendencia lineal, la primera diferencia de la serie, Z,, ya no tendré esa tendencia. En este caso se dice que X, es una serie temporal homogénea de primer orden o integrada de primer orden y se denota por I(1).. La eliminacién de una tendencia cuadritica puede conseguirse mediante doble Aiferenciacién. Esta operaciGn se realiza en dos etapas, primero se obtiene W, = X,- Xi1 y, si sigue existiendo tendencia, se obtiene Z; = W, - Wi1. Si Z, ya no incorpora tendencia (es estacionaria), se dice que X, es una serie temporal homogénea de segundo orden o integrada de segundo orden 1). Anilogamente una tendencia de orden p puede eliminarse levando a cabo una diferenciacién de orden p dando lugar a una serie homogénea o integrada I(p) de orden p. Si hay duda sobre diferenciar 0 no, 0 sobre cudntas veces hay que diferenciar, se calcula Ia varianza de la serie original y de la setie sometida a diferentes diferenciaciones, tomando como diferenciacién adecuada aquella para Ia que la varianza es minima, El método €5 tanto més adecaudo cuanto mayor sea la diferencia entre las varianzas anteriores. La sobrediferenciacién suele evitarse observando si en la parte de medias méviles alguna raiz es proxima a la unidad. En a préctica una serie econémica se transforma en estacionaria en media con una o dos diferenciaciones. © MTES-Paraninfo 171 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS La estacionariedad en varianza suele corregirse aplicando logaritmos una transformacién més general como la de Box-Cox. La transformacién de Box-Cox consigue cestabilizar la varianza de una serie temporal (serie estacionaria en varianzd) y aproximar su. distribucién a una normal. Si X, es la serie temporal inicial, la transformaci6n viene dada por: _ +h) iat Z,=gln(X,+1,) si =0 y 1, <0 Z si #0 y X,>-L donde g es la media geométrica simple de X; + h. El primer parémetro l; gobierna la fuerza de la ‘ransformacién. Para /;=1 tenemos la serie original X, y / se elige de forma que X;+/, sea siempre positiva, Por lo tanto Iz sera cero si trabajamos con datos positives e igual en valor absoluto al valor ‘més negativo observado, en otro caso, La transformacién de Box_Cox es realmente una familia de ‘ransformaciones dependiente del parémetro , que incluye como casos particulates la transformacién logaritmica (/,=0), la raiz cuadrada (1,=1/2) y la inversa o reciproca (I,=-1). ‘Una variante més sencilla de la transformacién de Box- Cox es la siguiente: fork si 1#0 y -1SIS1 . = gy 10 o también 7 , = En(X,) st t=O Z,=1n(X,) si 1=0 Se observa que para ! = -1 tenemos la transformacién reciproca, para ! = -1/2 tenemos Ja reciproca de la rafz.cuadrada, para / = 0 tenemos la logaritmica, para [= 1/2 tenemos la rafz. ‘cuadrada y para /=1 tenemos Ia identidad. 4.2.4 Series estacionales Cuando se representa una serie temporal mediante y,, se suponen todas las observaciones ‘ordenadas una detras de otra tal y como se van produciendo (= 1, 2, .., 1). Cuando representamos. ‘una serie temporal por yx, estamos considerando explicitamente el afio i (= 1,2, N) y laestacion del aio kK = 1,2, ..., m). Cuando Ia estacidn es el afio m = 12 , y cuando es el trimestre, m = 4 Siempre se tiene que T= Nm Las series estacionales presentan oscilaciones que se producen con un periodo igual o inferior a un afio, y que se reproducen de manera reconocible en los diferentes alios. El motivo principal que induce a estudiar la componente estacional es que en la inmensa mayorfa de las series ‘econdmicas dicha componente provoca una distorsién de su verdadero movimiento, Para eliminar estas distorsiones y captar el movimiento real de la serie, es necesario eliminar las oscilaciones «estacionales desestacionalizando la serie. Deteccién practica de Ia estacionalidad y soluciones Para detectar la estacionalidad en la préctica pueden utilizarse los siguientes caminos: * El grdfico de la serie da una idea de los posibles perfodos estacionales, © EI gréfico de las subseries estacionales identifica gréficamente los periodos cestacionales presentando secciones sucesivas de los mismos. © El gréfico de tas subseries anuales valida gréficamente los periodos estacionales ‘presentando comportamientos paralelos para cada estaci6n. 17260 WES-Paraito MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION * Las funciones de autocorrelacién y autocorrelacién parcial estimadas también validan los periods estacionales de acuerdo a las siguientes consideraciones; > Los coeficientes de la FAC para retardos miltiplos del periodo estacional de la serie deben ser significativamente distintos de cero > Para una cantidad grande de retardos a FAC se configura en forma de abanico que completa su ciclo girando sobre el eje de abscisas para una cantidad de retardos igual al perfodo estacional. La FACP debe presentar estructura de ccoeficientes significativos para retardos periédicos (largos) > La FAC y la PACF deben considerase a la vez, pues a veces intercambian sus papeles en el comportamiento estacional La desestacionalizacién es una tarea no trivial que ha dado lugar a multitud de estudios y algoritmos, entre los que destacan los programas X11 y X12 del Bureau of the Census de Estados Unidos. A nivel trivial, existen varios métodos de desestacionalizacién, Los més sencillos son el método de Ia tendencia, e] método de las medias méviles, el método de las diferencias estacionales y el método de las variables ficticias. El método de desestacionalizacién de las diferencias estacionales permite eliminar la mayor parte del efecto estacional de una serie, y consiste en obtener la serie de diferencias de orden m (perfodo cestacional), definida como z = yi ~ yi -m De todos modos, es conveniente recordar que en cada Aiferenciacién de orden m perdemos m observaciones de Ia serie original. La decisién de diferenciar estacionalmente la serie se basa en la FAC con el mismo ctiterio que para la diferenciacién estacionaria pero considerando sélo los retardos referidos a periodos estacionales (m y sus miitiplos). Si los coeficientes de la FAC no decaen répidamente en los retardos miltiplos del periodo estacional m hay que diferenciar estacionalmente la serie original. Lacliminacién de las variaciones estacionales, para inducir la estacionariedad, suele hacerse ‘casi siempre, mediante Ia diferenciacién estacional. Si Jos datos son mensuales, Ia diferenciacién estacional de la serie temporal X,, consiste en caleular Z, = X; - X:i2 Con datos trimestrales cealculariamos Z; = X, - X. Si después de efectuar esta transformacién la serie sigue presentando cevidencias de variaciones estacionales, es posible aplicar de nuevo el procedimiento, es decir, calcular las diferencias de segundo orden, y asi sucesivamente, 4.2.5 Metodologia de Box Jenkins para los Modelos ARIMA Box y Jenkins disefiaron una metodologia para el tratamiento de la modelizacién de series temporales univariantes basada en las siguientes fases: 1. Recogida de datos: Es conveniente disponer de 50 0 més datos, y en el caso de series ‘mensuales, es habitual trabajar con entre seis y diez aitos completos de informacién, 2. Representacién gréfica de la serie: Para decidir sobre la estacionariedad y estacionalidad de la serie es de gran utilidad disponer de un gréfico de la misma. Suelen utilizarse medias y desviaciones tipicas por subperfodo para juzgar sobre la estacionariedad de la seri. 3. Transformacién previa de la serie y eliminacién de la tendencia: La transformacién logaritmica es necesaria para series no estacionarias en varianza y es muy frecuente, incluso en series con dispersién relativamente constante en el tiempo. Una posi prictica es ensayar siempre con la serie original y en logaritmos y comprobar resultados. La observacién del grafico de la serie nos indicaré la existencia o no de tendencia, Una tendencia lineal sera comregida tomando primeras diferencias, que serd el caso més frecuente, Una tendencia no lineal suele llevar en la préctica al uso de dos diferencias como mucho. © MTES Paraninfow 173 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS 4, Identificacién del modelo: Consiste en determinar el tipo de modelo més adecuado para la serie objeto de estudio, es decir, el orden de los procesos autorregresivos y de medias méviles de las componentes regular y estacional. Téenicamente esta decisién se tomaré en base a las funciones de autocorrelacién y autocorrelacién parcial Habitualmente se terminaré eligiendo entre los procesos més simples AR(I), AR), MA), MAQ) y ARMA(1. 1), tanto en Ia parte regular como en Ia estacional. En caso de duda pueden seleccionarse varios modelos alternativos que serén estimados y contrastadlos posteriormente, para definir el modelo definitivamente adoptado 5. Estimacién de los coeficientes del modelo: Decidido el modelo, se procede a la estimacién de sus parémetros. Dado que se trata de un procedimiento iterativo de célculo, pueden sugerirse valores iniciales. 6. Contraste de validez conjunta del modelo: Utilizaremos diversos procedimientos para valorar el modelo o modelos inicialmente seleccionados: contraste de significacién de pardmetros, covarianzas entre estimadores, coeficiente de correlaci6n, suma de cuadrados de errores, etc. 7. Andlisis detallado de los errores: Las diferencias histéricas entre valores reales. y estimados por el modelo constituyen una fuente de especial interés para una valoracién final del modelo. Deberd comprobarse un comportamiento no sistemtico de los mismos, como analizarse la posible existencia de errores especialmente significativos, 8. Seleccién del modelo: En base a los resultados de las etapas anteriores, debe estarse en condiciones de decidir sobre el modelo adoptado, 9. Prediccién: El modelo seleccionado serviré como formula inicial de predieci6n, Identificacién practica del modelo Identificar un modelo significa utilizar los datos recogidos, y cualquier informacién de cémo se genera la serie temporal objeto de estudio, para sugerir un conjunto reducido de posibles modelos, ‘que tengan muchas posibilidades de ajustarse a los datos. Ante una serie temporal empitica, el investigador debe encontrar los valores p, dq més apropiados. Si la serie temporal presenta una tendencia, lo primero que se deber hacer es convertirla en estacionaria mediante una diferenciacién de orden d. Una vez diferenciada la serie, una buena estrategia consiste en comparar los correlogramas de la funcién de autocorrelacién (FAC) y la funcién de autocorrelacién parcial (FACP). Esto suele ofrecer una orientaci6n para la formulacién del modelo tentativo. Los procesos autorregresivos presentan funcién de autocorrelacién parcial con un iémero finito de valores distinto de cero. Un proceso AR(p) tiene los primeros p términos de la funcién de autocorrelacién parcial distintos de cero y los demas son nulos. Ademés se observa un decrecimiento rapido de tipo exponencial o sinusoidal de la funcién de autocorrelacién. Esta afirmacién es muy fuerte, y en la préctica se considera que una muestra dada proviene de un proceso autorregresivo de orden p si los términos de Ia funcién de autocorrelacién parcial son casi cero a partir del que ocupa el lugar p. Un valor se considera casi cero cuando su médulo es inferior a 2N/T. Los programas de ordenador construyen la franja (-2NT, 2NT) y detectan los valores de la FACP que caen fuera de ella. 17400 WES Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Los procesos de medias méviles presentan funcién de autocorrelacién con un nimero finito de valores distinto de cero. Un proceso MA(q) tiene los primeros q términos de la Jfuncién de autocorrelacién distintos de cero y los demés son nulos. Ademés se observa un decrecimiento rdpido de tipo exponencial 0 sinusoidal de la funcién de autocorrelacién parcial. Estas propiedades son muy importantes con vistas a Ia identificacién de un proceso mediante el an‘ isis de las funciones de autocorrelacién y autocorrelacién parcial, En un proceso ARMA(.g) los primeros valores iniciales de la FAC no tiene patron fijo y van seguidos de una mezcla de oscilaciones sinusoidales amortiguadas a partir de q. Adeins, los primeros valores iniciales de la FACP no tienen patrén fijo y van seguidos de una mezcla de oscilaciones sinusoidales amortiguadas a partir de p. Podemos resumir los pasos para la identificacién de un modelo de series temporales de la siguiente forma: 1. Decidir si X; necesita ser transformada para eliminar la no estacionariedad en media o en. a no estacionariedad en varianza, Puede ser conveniente usar logaritmos de la serie 0 aplicar la transformaci6n de Box-Cox. 2. Determinacién del grado de diferenciacién adecuado d. En general la falta de estacionariedad, se manifiesta en que los coeficientes de la funcién de autocorrelacién estimada tienden a decrecer muy Ientamente. La cues ‘embargo, {cudn Ientamente ha de ser el decrecimiento de los coeficientes de la funcién de autocorrelacién parcial para que el proceso sea estacionario? En general, solo ocasionalmente los datos econémicos del correlograma dejarin de decrecer tras Jas primeras diferencias, y en este caso serfan necesarias segundas diferencias. Una diferenciacién superflua s6lo sirve para alterar el esquema de autocorrelacién evidente ‘en una serie estacionaria y complicarlo innecesariamente, 3. Decidir los valores de p y q. y xxiste una componente estacional, decidir los Srdenes de los operadores estacionales P y Q. Para este apartado se utilizan las funciones de autocorrrelacién y autocorrelaci6n parcial segiin el siguiente cuadro: Proceso Funcién de autocorrelacién FAC MA@ ‘Slo los primeros coeficientes son Significativos. El resto se analan ‘bruscamente (coef. 0 para retardo>g) AR) Decrecimiento rio exponenci atenuado w ondas sinusoidales ARMA, Los coeficientes no se anulan bruscamente 1 presentan un deerecimientorépido ARMA Los coeficientes no se analan brascamente (estacional) 1 deerecen rpido con periodicidades iuales al periodo estacional ARIMA(pdq) Comportamiento irregular en los retardos (1...) con q pcos. Decrecimiento para relardos posteriores aq ARIMA(P.D,Q) Comportamient irregular en los retardos (estacional) (1.2) con Q picos y deerecimiento para relardos posteiores a Q (periédicamente ‘con perfado igual al periodo estacional) Funcién de autocorrelacién parcial FACP ‘Decrecimiento ripido exponencial atenuado uw ondas sinusoidales ‘Sélo los p primeros coeficientes son significatvos. El resto se anulan ‘ruscamente (coef. 0 para retardo>p) Los coeficientes no se anulan bruscamente 1 presenta un decrecimiento pido Los coefcients no se anlan brascamente ‘y decrecen ripido con periodicidadesiguales, Al periodo estacional Decrece (aproximadamente con ‘exponenciales atenuados y ondas sinusoidals). No cero pronto Decrece (aproximadamente con cexponenciales atenuados y ondas sinusoidal) yno cero pronto (periddicamente con perfodo igual al periodo estacional) © MTES Paraninfow 175 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS ‘A veces es necesario determinar a priori si es correcto introducir término independiente en el modelo ARIMA que ajuste nuestra serie. Para contrastar la hipétesis nula de que el modelo se ajusta con constante suele usarse el estadistico: ‘que bajo la suposicién de que X, es ruido blanco, se distribuye segiin un 1 de Student con N-1 grados de libertad. Cuando X,, esté autocorrelacionada siendo significativos los primeros k coeficientes de autocorrelacién rl, r2,..,rk, el estadistico a utilizar en el contraste es ‘que también se distribuye segiin un # de Student con N-1 grados de libertad. Estimacién de modelos ARIMA(p.4q) El criterio que suele utilizarse es obtener los parémetros de manera que 1a suma cuadritica de los errores sea lo menor posible. Si representamos el proceso ARIMA(p. 4,q) de Ja forma @&B) X, = (B) a; los errores del modelo pueden expresarse de la forma a, = @'(B) ‘®B) a, de forma que el objetivo es encontrar el vector de pardmettos P= @(P,..®,) y v= (v1..-..¥p) que minimice la suma de cuadrados de los errores a? = S(®,v) La estimacién es complicada ya que Ia ecuacién es no lineal en Ios pardmetros. Debemos, pues, utilizar un método iterativo de estimacién no lineal, como por ejemplo el de Marquardt. Para comenzar el algoritmo necesitamos estimaciones preliminares de los ppardmetros, que se obtienen mediante el método de los momentos. Diagnéstico, vatidacién o contraste de modelos ARIMA(p,4,q) Box y Jenkins sugirieron un mimero considerable de tests para verificar si el modelo elegido se ajusta correctamente al conjunto de datos dado. Uno de ellos, conocido como sobreparametrizacién, consiste en ajustar un modelo de orden superior al elegido y comprobar silos parémetros son significativamente distintos de cero, Por otra parte, si el modelo aproxima satisfactoriamente a la serie observada, los residuos deben tender a comportarse como ruido blanco, lo cual se comprobaria mediante las Jfunciones de autocorrelacién de los residuos (ACF y PACE). Dichas funciones de autocorrelacién deben ser nulas en todo su recorrido, excepto en cero, Si el modelo no aproxima satisfactoriamente a la serie observada, los residuos se comportarén como un ruido autocorrelado, problema andlogo al encontrado en los modelos ‘econométricos con perturbaciones autocorrelacionadas. Por ello, deben emplearse contrastes ‘como el de Durbin-Watson (para la autocorrelacién de primer orden) o el de Wallis (para la de ‘cuarto orden), Otros tests, aplicados a los residuos, van encaminados a comprobar si los residuos ‘obtenidos son consistentes con el supuesto de ruido blanco (aleatorios) 176+ WEs-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Box y Pierce proponen el estadistico Q = "7; donde r; viene definido por: Yaa. Le con a, ssiduos estimados y n = mimero de observaciones. Bajo el supuesto de que m es suficientemente grande, Box y Pierce demuestran que el estadistico Q se distribuye como una Chi-cuadrado con m-p-q grados de libertad. La hipétesis de que los residuos son un ruido blanco se rechaza en general para valores de Q muy altos. Més concretamente, se halla la regi6n eritica a nivel ct, calculando un valor que cumpla P(Q>D)= ce Siel valor del estadistico Q cae dentro de la regisn critica, que es {Q>/}, entonces se rechaza la hipétesis mula de que los residuos son un ruido blanco, Si cae fuera se acepta la hipstesis nula. El valor de mes arbitrario, pero conviene tomarlo lo mas elevado posible. Para valores de m no muy grandes, Ljung y Box proponen un estaistico alternativo: Q=n(n+2)¥r?/(n—b), que también se distribuye como una Chi-cuadrado con m-p-q fat grados de libertad. Se halla la regién critica a nivel @, caleulando un valor J que cumpla P(Q'>D= & Si el valor del estadistico Q’ cae dentro de la regién critica, que es {Q'>1}, centonces se rechaza la hip6tesis nula de que los residuos son un ruido blanco. Si eae fuera se acepta la hip6tesis nula. Un diagndstico completo también surge de la inspeccién del gréfico de los residuos. Si Jos residuos provienen de un proceso de ruido blanco, deben ser incorrelacionados entre sf, 10 que les hard alternar en signo, sin ningin criterio obvio. Por el contrario, rachas de residuos consecutivos de un mismo signo son, en general, un indicativo de mala especificacién del modelo, bien por ser una indicacién de autocorrelacién de los residuos 0 por indicar no estacionariedad de los mismos. Si los residuos representados contra el indice tiempo 1, es decir si cl grafo (1), tiene una tendencia conocida, puede haber heteroscedasticidad de los residuos. Aqui se pueden aplicar todos los contrastes de aleatoriedad, autocorrelaci heteroscedasticidad, falta de linealidad y no normalidad de los residuos. El periodograma de las residuos debe presentar amplitudes destacables en casi toda la ‘gama de frecuencias. El periodograma acumulativo de los residuos debe producir una curva de amplitudes sobre la recta de reposo sin patrones de oscilacién en ninguna zona de frecuencias, También existen métodos de otro tipo para contrastar Ia bondad del modelo ‘univariante estimado, Conviene estimar el modelo excluyendo algunas observaciones al final de la muestra. Si esto provoca una variacién sensible en los valores estimados de los ardmetros podria indicar una variacién reciente de la estructura estocastica subyacente, lo que desaconsejaria el modelo para fines predictivos. Por otro lado, los modelos ARMA(p.q) deben cumplir las condiciones de estacionariedad e invertibilidad. Por tanto, si representamos el proceso ARMA(p.q) de la forma @(B) X, = v(B)a, y alguna de las rafces de las ecuaciones @XB)=0 y v(B)=0 es menor {que uno en médulo, el modelo es rechazable. Si alguna de las raices de Ia ecuacién (B)=0 es muy préxima a la unidad, Ia serie original puede estar subdiferenciada y precisaré alguna diferenciacidn adicional. Si alguna de Jas rafces de Ia ecuacién v(B)=0 es muy préxima a la unidad, Ia serie original puede estar sobrediferenciada, Si coincide una rafz de ambas ecuaciones, se puede cancelar un orden en el proceso, pasando aun ARMA(p-1,q-1). © MES Paraninfow 177 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Prediccién en modelos ARIMA Los modelos ARIMA proporcionan no solamente una prediccién puntual, sino la distribucién de probabilidad completa para los valores futuros de la serie. Considerando una prediecin Sptima a aquélla con un error cuadrstico medio de prediecién minimo, tratariamos de elegir nuestra prediccién a horizonte 1, Z,(), tal que Ele“) = E{ [XnarZ(D} } fuese minimo. En general se puede demostrar que dicha prediccién viene dada por la esperanza condicionada de X,1, es decir: ZAD = EIX XoXo Xi] El célculo real de 1a prediccién Z,(D puede hacerse de forma recursiva utilizando el modelo ARIMA estimado, de forma que si escribimos el modelo como dy =D, dys tout Dey + Oy Vis = Vy ig donde d, es la diferencia de orden d de X, (supuesto X; no estacionaria y convertible en estacionaria mediante un proceso de d diferenciaciones consecutivas) Para calcular la prediceién Z(D, se comienza calculando la estimacién de d(1) como Ia esperanza condicionada de d,,;, y posteriormente se calcula la estimacién de di2), y ast sucesivamente hasta calcular la estimacién de d(2). Una vez que la serie d, ha sido predicha, podemos obtener una prediccién de X, sumando d, d veces. Para calcular la predicci6n Z.() utilizamos la siguiente formula: ZAD= Od, + Py dey + D2 dir +. 4.3 EL PROBLEMA DE LAS REGRESIONES ESPURIAS Zot Las regresiones espurias o “sin sentido” se obtienen cuando, atin no existiendo relacién real alguna entre las variables involucradas en el modelo propuesto (generalmente series temporales), la correlacién obtenida entre ellas aparece como alta, de forma que las pruebas estadisticas y el R® del ajuste indican, equivocadamente, que el modelo es estadisticamente correcto, El problema de las regresiones espurias fue analizado por primera vez por Granger y Newbold (1974) y puede sintetizarse diciendo que cuando se llevan a cabo regresiones entre series temporales econdmicas expresadas en niveles, es muy probable encontrar relaciones con un valor elevado del coeficiente de determinacién y valor pequetio del estadistico de Durbin Watson, lo que puede invalidar la relaci6n estimada en el modelo. Ante esta situacién los estimadores mfnimo cuadriticos de los coeficientes del modelo pueden set ineficientes y los estimadores de los errores esténdar pueden resultar inconsistentes, Hasta el momento hemos tomado nuestro modelo como estitico, pero ya hemos visto que el problema de correlacién serial puede Hevamnos a la consideracién de introducit un retardo, es decir, un componente dinémico en el modelo. En general, el problema de las regresiones espurias aparece frecuentemente cuando se halla la regresidn estética entre series econdmicas alectadas por tendencias comunes, lo que lleva a encontrar una medida del ajuste global elevada, sin que exista realmente una relacién de causa efecto entre las series. Este problema ocurre de forma muy frecuente cuando las variables del modelo son integradas (no estacionarias), ya que es posible que posean una tendencia temporal similar, que es el origen de la alta correlacién observada. 17860 WES-Paraito MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION La raz6n por la cual las pruebas estadisticas estindar no son aplicables es que cuando, Jas series son no estacionarias, los estadisticos 1 de Student o F de Fisher Snedocor divergen en distribucién al aumentar el tamafo de la muestra, invalidando asf el uso de sus tablas habituales. Esto implica, ademas, que el rechazo de la hipétesis de no relacién entre las, variables se vuelve mas y més frecuente al aumentar el niimero de observaciones disponibles. Por otra parte, Phillips (1986) demostré que el estadistico de Durbin-Watson converge .0 al aumentar el tamaiio de la muestra si las series no estén relacionadas. Esto confirm6 la observaci6n realizada con anterioridad por algunos autores sobre la obtenci6n de altos valores de R’ junto con bajos valores del estadistico DW cuando la regresién es espuria. Lo expuesto hasta aqui ilustra Ia importancia que reviste realizar un anélisis exhaustivo de las series involueradas antes de estimar un modelo, Detectar si son no estacionatias (integradas) y, cuando corresponda, el orden de integracién de cada una de ellas, ¢s fundamental para decidir correctamente qué tipo de técnica es adecuada en cada caso. De esta forma, en lo que sigue se discutirén algunos de los métodos para determinar el orden de integracién de las series y, posteriormente, e6mo trabajar con series no estacionarias. La consideracién de regresiones con las variables expresadas en diferencias arroja un rayo de luz sobre el problema de las regresiones espurias, pero atin asf, la probabilidad de extraer conclusiones erréneas no desaparece, aunque sf disminuye. Los modelos de correccién por el error (MCE) vienen a mitigar el problema de las regresiones espurias, pero previamente 5 necesario analizar la estacionariedad de todas las series componentes del modelo y su cointegrabilidad. 4.4 CONTRASTES DE RAICES UNITARIAS El primer paso que tenemos que Hevar a cabo en cualquier modelo que involucra series temporales es verificar el orden de integracién de las variables implicadas. Para verificar si una serie temporal es 10), es decir, estacionaria, se pueden utilizar alternativamente diversos tests que, en la literatura especializada se conocen como fest de raices unitarias. Entre los més usados destacan los tests de Dickey-Fuller (DF), Dickey-Fuller ampliado (DFA) y de Phillips-Perron (PP). 4.4.1 Contrastes de Dickey-Fuller de las raices unitarias El contraste DF de Dickey-Fuller parte de que el proceso generador de la serie de datos es: X,=pX..+u, X,=0 u, > Niid(0,02) Para verificar la hipstesis nula de que X; no es estacionario, basta con verificar que p=1 frente a la hipstesis alternativa de que p#1. En efecto, si p=1, X; resulta ser un paseo aleatorio (que es el ejemplo mas sencillo de proceso no estacionario) pudiéndose escribir: X,=X,.4u, 9 X,-X5 , 2 (1-E)X, u, donde Les el operador retardos. Obsérvese que el polinomio en L tiene un rafz unitaria, lo que justifica el nombre genérico de este tipo de contrastes. © MTES Paraninfow 179 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Si se esta interesado en contrastar la hipotesis Ho : p = py para | py |< 1, las tablas de los valores criticos para el estadistico del contraste de dicha rafz. unitaria han sido tabulados por Dickey (1976) y recogidas en Fuller (1976). Los valores eriticos de estas tablas corresponden a tres posibles modelos estimados: X= PX. +M, X= M+ OX. tu, XS MAY At PX +My, ‘que son respectivamente, el modelo sin constante, el modelo con constante y el modelo con constante y tendencia. La hipétesis mula en cada modelo es = 1, es decir que el proceso es no estacionario. La eleccién del tipo de modelo de ajuste depende de la informacién que se tenga del proceso generador de datos. Se supone que u, €5 ruido blanco (proceso estacionario, més sencillo), El contraste DF se corrigié con el contraste ADF sobre 1a existencia de una raiz unitaria, denominado Dickey-Fuller aumentado (Dickey y Fuller 1979), en el que se parte de Ia hipétesis més general consistente en que X, sigue un proceso AR(p), es decir: X,=YpX,,+u, — u, > Niid,02) ia ‘que puede escribirse como: X, = eX, + Sy, AX, +u, El contraste ADF se basa en la estimacién minimo cuadritica del coeficiente p en este ‘iltimo modelo, que también puede ampliarse con una constante o una tendencia o ambas, 4.4.2 Contrastes de Phillips-Perron de las raices unitarias Los contrastes de Phillips-Perron extienden los contrastes de Dickey-Puller para permitir autocorrelacién en las perturbaciones, con lo cual son contrastes més generales, pudiéndose considerar los contrastes de Dickey-Fuller como un caso particular suyo. En Phillips-Perron se supone que el proceso generador de datos es del mismo tipo que en ADF, pero el proceso 1 no es necesariamente ruido blanco, Coneretamente, las condiciones que satisface 1, Son: Elu,]=0 Ve Sup,E\u, P? para B>2 T= 0? = lim ET 'S?] existe y 0? >Ocon S, =u, ++ +u, u, tiene coeficientes a, que satisfacen Yat,*'* < eo Estas condiciones son bastante generales, pues permiten, por ejemplo, que u, sea un ARMA 0 un proceso con heteroscedasticidad. 180+ I1ES-Parnino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION 4.5 _ANALISIS DE LA COINTEGRACION Si se verifica que un conjunto de variables integradas del mismo orden todas ellas, estén cointegradas, se asegura la existencia de una relacién no espuria entre las mismas que, ademés, es estacionaria (es decir, de equilibrio en el sentido estadistico). El concepto de cointegracién es la nocién estadistica equivalente a la idea de equilibrio estable, en el sentido de que cuando existe una relacién de este tipo entre variables econdmicas, las desviaciones de Ja citada relacién no pueden ser fuertes ni crecer ilimitadamente. De esta forma, la cointegracién de las variables de un modelo da validez al mismo a largo plazo. Cuando una serie es no estacionaria o integrada, los valores que toma en un momento del tiempo son, por definicién, a acumulacién de todas las perturbaciones o “shocks” pasados, a diferencia de las series estacionarias, para las cuales el efecto de las perturbaciones es transitorio, Por lo tanto, el hecho que una combinacién lineal de un conjunto de variables sea estacionaria implica, intuitivamente, que la forma en que éstas se "mueven" en el tiempo es similar. Ademés, la relaci6n de cointegracién actuarfa como un "atractor” para el conjunto de variables bajo anélisis, en cl sentido de que tiendan a formar un modelo compacto en el transcurso del tiempo. Por lo tanto, el andlisis de la cointegracién permite, entre otras cosas, detectar si existe Ja posibilidad de obtener estimaciones correctas, es decir, libres de resultados esputios, de los ardmetros que definen las relaciones entre dos © més series, tanto a corto como a largo plazo. ‘Ademiés, si existe cointegracidn entre las variables de un modelo, este puede analizarse mediante ‘un mecanismo de correccién del error (0 modelo de correccién del error MCE) que representa correctamente €l comportamiento dinémico de las series y, por tanto, constituye una base adecuada para el andlisis empitico cubriendo la faceta del equilibrio sobre todo en el corto plazo, Por otra parte, si un conjunto de variables no estacionarias esté cointegrado, es posible entonces plantear un modelo estético (de las variables en niveles, sin rezagos) que tenga sentido, sobre todo en el largo plazo. Sin embargo, la distribucién de los estimadores no seré estindar en muchos casos, impidiendo la realizacién de pruebas de hipétesis y la prediccién. No obstante, la alternativa de los modelos dindmicos no estin exentos de problemas, especialmente cuando existe més de un vector de cointegracién Por lo tanto, si realmente hay cointegracién entre las variables del modelo, la formulacién inicial estética del mismo y su estimacién, toman relevancia y se presentan como ‘una opcién muy valida y digna de tener en cuenta, entre otras cosas porque estaria ya libre de correlaciones espurias. 4.5.1 Contraste de Phi ips-Oularis para la cointegracién Los contrastes més comunes de cointegraciGn estén ditectamente relacionados con los ccontrastes de rafces unitarias. Consideremos el modelo ¥, = & + fi X; + u El andlisis de la cointegracién de X, ¥; (generalizable a més variables) se realiza mediante los siguientes pasos: 1, Anélisis del orden de integrabilidad de las series Xe ¥;, que ha de coincidir (I(1) habitualmente) 2, Estimacién del modelo ¥,= 8 + AX + 3. Con los residuos de la estimacién del modelo anterior @, = ¥, - A, - B,X, reatizamos ‘un contraste de rafces unitarias y si estos residuos resultan estacionarios (son 1(0)) las seties estén cointegradas, © MTES-Paraninfo 181 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS 4.6 MODELOS DE CORRECCION POR EL ERROR MCE El concepto de cointegracién y su relacién con los modelos de correccién del error MCE ha sido introducido por Granger (1981), Granger y Weiss (1982) y Engle y Granger (1987), Esta teoria es actualmente relevante en Las aplicaciones empfricas. En particular, la equivalencia entre la nocién de cointegracién y la existencia de un modelo de correccién de error MCE para las variables resulta importante por varios motivos. En primer lugar, la cointegracién brinda un sustento estadistico firme y con una interpretacion econsmiica clara para la formulacién MCE, al relacionarla tanto con Ia idea de equilibrio estadistico como con los desajustes al mismo en el corto plazo, Ademés, la modelizacién conjunta de los efectos de corto y largo plazo permite resolver en algiin sentido el debate sobre Ja utilizacién de variables en niveles y en diferencias. De esta forma, el enfoque de series temporales de Box-Jenkins y los modelos econométricos estructurales aparecen como casos particulates de los modelos de correccién del error MCE. Finalmente, el anélisis del orden de integracién de las variables y Ia existencia de cointegracién entre ellas permite evitar el problema de las regresiones espurias. La teorfa convencional para el tratamiento estadistico de series temporales se desarrolla bajo el supuesto de que éstas son estacionarias. Es posible también realizar el andlisis para series estacionarias alrededor de una tendencia temporal deterministica, ya que ésta es estimable y se puede depurar la serie de dicho componente. Por el contrario, cuando se trabaja con series no estacionarias, existen dos obstaculos principales: los estadisticos de prueba ya no poseen distribuciones esténdar, con Jo cual la inferencia queda invalidada; mientras que el riesgo de trabajar con regresiones espurias o sin sentido resulta bastante alto, Una de las soluciones de mayor difusién consiste en la diferenciacién de las series, tantas veces como sea necesario para transformarlas en procesos estacionarios. Este procedimiento ha sido criticado, sin embargo, al observarse que implica pérdida de informacién de largo plazo que en muchos casos resulta de interés para el investigador. El camino alternativo consiste en la utilizacién de modelos dindmicos, siendo el modelo de correccién de error MCE una de las formulaciones més populares. La definicién del concepto de cointegracién ha servido, de alguna manera, para dar cohesi6n a los diversos desarrollos aislados alrededor del tema. Por un lado brindé una justificacién tedrica nteresante para diferenciar los modelos estéticos con sentido de aquellos que se denominaron espurios, Por otto lado Hev6 a un primer plano el andlisis del orden de integracién de las series involucradas, destacando 1a importancia conceptual de distinguir entre tendencias deterministicas y estocésticas y sus aplicaciones para la inferencia estadistica. Finalmente, result6 una condicién suficiente para sustentar la equivalencia entre distintas formulaciones dindmicas, como queda demostrado en el teorema de Representaci6n de Granger, Si las variables X,¢ ¥; tiene el mismo orden de integracién ((1) habitualmente) y estén cointegradas mediante la relacién ¥; = 6, + 6s X; + u,entonces el modelo de correccién del error asociado MCE es: AY, = + JAX, + 71, -B.-B,X,.) +6, = a+ OX, + 7, +8, De este modo, las variaciones de ¥, (A¥,) dependen de las variaciones experimentales en X, através de GAX, y del equilibrio que se produjo en el perfodo anterior ¥_, - 2, - A,X,..8 A-BX) través del término de correccién del error CE=Y/(Y, 10260 WES-Paraito MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Si la variable Y estaba en el perfodo f-1 por encima de su valor de equilibrio es de esperar que sea negativo, Sila variable ¥ estaba en el periodo t-1 por debajo de su valor de cequilibrio es de esperar que sea positivo. Resumiendo podemos decir que si existe cointegracién entre las variables de un modelo, este puede analizarse mediante un modelo de correccién del error MCE que representa correctamente el comportamiento dinmico de las series del modelo. El modelo de correccién del error expresa el cambio presente en Ia variable dependiente como una funcién lineal de los cambios en las variables explicativas y del término de correccién del error CE. El coeficiente 7 del término de cotreccién del error representa la velocidad de convergencia entre el corto y el largo plazo, por lo tanto, una vez ajustado el modelo de correecién del error MCE dado por AY, =@+6AX,+/(¥,,-B,-B,X,.)+6, ya se puede medir la fuerza de la validez del modelo ¥; = A + BX, + w a largo plazo, Esta es la utilidad esencial del modelo de correccién del error asociado a un modelo cointegrado. PROBLEMAS 4.1. El archivo 4-1/1 contiene datos trimestrales en millones de délares correspondientes al sector de Ia industria manufacturera para el periodo 1953 1967 relativos a los gastos de inversion ¥ y la dotacién a reservas X. Con esta informacién se trata de explicar los gastos en inversi6n ¥ a partir de una relacién lineal con la dotacién de reservas X y sus siete primeros retardos. Utilizar los esquemas de retardos distribuidos finitos de Fisher, DeLeeuw y Almon. SOLUCION: Se trata de ajustar, segtin el retardo aritmético de Fisher, el modelo siguiente Y= at Dox, 4, Retardo aritmético de Fisher > 5, (741-5 OSiS7 0 i>7 ¥,=u+ OX, +u, = Wt+dL(741-0X,_, +u, = + OZF, +, % Una vez cargado el fichero en memoria, comenzamos generando la variable ZF, haciendo clic en GENR y rellenando la pantalla Generate Series by Equation segiin se indica en la Figura 4-1. Al pulsar OK ya disponemos de la variable ZF en nuestro fichero de trabajo. A continuaci6n ajustamos el modelo ¥, = “+5 ZF, +u, Para realizar el ajuste MCO con Eviews, se elige Quick > Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de 1a solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 4-2) y se hace clic en Aceprar. Se obtienen los resultados de la Figura 4-3 © MTES Paraninfow 183 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Erenlieercn| re )beite Keer) Sacto) SS fog HS a Bins Bs Fc aaa en ‘Senta = Figura 4-1 "tema ornare < & oes oom Saeed ienwies oer Stewart 16020) ‘TOE Figura 42 Figura 43 El ajuste del modelo es bueno, salvo el problema de la autocorrelacién residual derivada del valor tan bajo del estadistico de Durbin Watson. Ante esta. situacién intentaremos identificar la estructura de los residuos del modelo través de View + Residual Tests + Correlogram Squared Residuals (Figura 4-4) y tomando el ntimero de retardos por defecto (28). El correlograma residual (FAC-AC y FACP-PAC) se observan en la Figura 4-5, Figura +4 Figura 4-5 10460 TES-Parnino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Se observa un decrecimiento de los términos de la FAC_y los dos primeros retardos significativos en la FACP, lo que nos lleva a tomar una estructura autorregresiva de orden dos cen los residuos. Ajustaremos entonces el modelo Y, = 4+ 5ZF, +u, con un estructura AR(2) en sus residuos. Para ello se elige Quick — Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 4-6) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 4-7. El modelo presenta buena significatividad individual y conjunta de los parémetros estimados, altos coeficientes de determinaci6n y un estadistico de Durbin Watson casi igual a 2, Luego el ajuste es correcto. “acter earn te Le Sone a ines sara Seciesmer HBL (ike 1 18 Sansautac ros mer ereren” 12200 Se observa que la estimacién del pardmetro 8 es 0.024524. Entonces tenemos: = re OSIS7 _ £95,75, 65,55, 45,38, 25, 15}= 0 i>7 {0,196192, 0,171668, 0,147144, 0,12262, 0,098096, 0,073532, 0,0449048, 0,024524} Por lo tanto, Ia estimacién del modelo inicial seré la siguiente: ¥, = 306,9152+0,196192X, +0,171668X,, + 0,147144X, , + 012262X,_, + 0,098096X,,_, + 0,073532X,., +0,0449048X,_, + 0,024524X,, +e, =1,2587 le, , ~ 0,433088e,., +, ‘Vamos a trabajar ahora con el esquema de retardos distribuidos finitos de DeLeeuw. 75 Osis<3 (7-5 4 Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de 1a solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 4-9) y se hace elie en Aceprar. Se obtienen los resultados de la Figura 4-10, Figura 4-9 Figura +10 El ajuste del modelo es bueno, salvo el problema de la autocorrelacién residual derivada del valor tan bajo del estadistico de Durbin Watson. Ante esta situacién intentaremos identificar la estructura de los residuos del modelo a través de View — Residual Tests — Correlogram Squared Residuals (Figura 4-11) y tomando el nimero de retardos por defecto (28). El correlograma residual (FAC-AC y FACP-PAC) se observan en la Figura 4-12, 106 +© TES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION este) OID) Wi Figura 11 Se observa un decrecimiento de los términos de la FAC_ y los dos primeros retardos significativos en la FACP, lo que nos lleva a tomar una estructura autorregresiva de orden dos en los residuos. Ajustaremos entonces el modelo ¥, = 4+ 5 ZV, +u, con un estructura AR(2) en sus residuos. Para ello se elige Quick — Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 4-13) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 4-14, El modelo presenta buena significatividad individual y conjunta de los parémetros estimados, altos coeficientes de determinacién y un estadistico de Durbin Watson casi igual a 2. Luego el ajuste es correcto. Figura 4-13 Figura 4-14 Se observa que la estimaci6n del parémetro 5 es 0,078620. Entonces tenemos: 18 O 5, = 0, + i+ 00? +--+" y, = ut DX, +u, ="tadX,. +aDx,, +a,5PX,, feta DEX, +u, 2 ze ze SMF QL, + OZy, + O,Zy, to + Q,Z, ces My {3} = (80.81, 8x) = (0p, Oy $$, He HO oy Oy HOS HAS? Ho YS") El primer problema aquf sera elegir el grado k del polinomio de Almon, que se resolverd a través de los criterios de informacién de Akaike (AIC) y Schwarz (SBC), eligiendo aquel valor de k que minimice los valores de los criterios de informacién, Para introducir los retardos polinomiales de Almon en el modelo, Eviews dispone del comando PDL(serie, n®_de_retardos, grado_polinomio). A continuacién se realizan las estimaciones de los modelos de Almon con 7 retardos para valores de k= 1, 2, 3, 4, mediante Quick —» Estimate Equation, escribiendo la ecuacién del modelo a ajustar en el campo Equation Specification de a solapa Specification, eligiendo Least Squares en el campo Method para ajustar por minimos cuadrados (Figuras 4-15, 4-17, 4-19 y 4-21) y haciendo clic en Aceptar. Se obtienen los modelos ajustados de las Figuras 4-16, 4-18, 4-20 y 4-22. ‘oa Oi Te toy aera Seine Se eodarsasme aa yer Ha Sane EN) z Se se Figara 4-15 Figura 4-16 1086 TES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION em ta ing ei SET opt onama al ie forest es a San ae) . ce SE yar ment ting eg A a ion ahanegehonsnta cha eee 7 jean = hae ee soe eto ot aS a == elon mos ue Figura 17 Figura +18 at Cp Ea il esenetoen Siku Ranepcleasorka he vena Figura 4-20 © MTES-Paraninfow 189 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Atendiendo a los citerios de informacién obtenidos en los cuatro modelos tenemos: k k=2 k=3 4 ‘AIC | 9.826403 | 9.778554 | 9,7489096 | 9.785800 sBC_ | 9.937929 | 9,927255 | 9.933972 _| 10,00885 Se observa que el menor AIC corresponde al modelo con k = 3 y el menor SBC corresponde al modelo con k = 2. No obstante, para decidir entre estos dos modelos es necesario observar otras caracteristicas, como por ejemplo la mala significatividad de PDLO2 cuando k = 2.0 la presencia de autocorrelacin en los dos modelos. Optaremos por eliminar la autocorrelacién en los dos modelos candidatos para quedarnos con el mejor se ajuste ya con la autocorrelacién corregida, Intentaremos identificar la estructura de los residuos de los dos modelos candidatos (k = 2 y k= 3) a través de View — Residual Test > Correlogram Squared residual y tomando el mimero de retardos por defecto (28). Los correlogramas residuales (FAC-AC y FACP-PAC) se observan en las Figuras 4-23 y 4-24 eee ae Saat { Sigarscia | Ji | at lieeigeses pipee seis a: | ut ese te ames legac ieee || ili | ik (Bsis ie a a Tiga F Tiga #24 Se observan estructuras similares en los correlogramas residuales de los dos modelos, ajustables a un proceso AR(1) ya que la funcién de autocorrelacién presenta un decrecimiento sinusoidal y en la funcién de autocorrelacién parcial s6lo la primera barra es significativa Gupera Jas bandas de puntos). Por lo tanto ajustaremos los dos modelos de autocorrelacién mediante Quick —» Estimate Equation, escribiendo la ecuacién del modelo a ajustar en el ‘campo Equation Specification de la solapa Specification, eligiendo Least Squares en el campo ‘Method para ajustar por minimos cuadrados (Figuras 4-25 y 4-27) y haciendo clic en Aceprar. Se obtienen los modelos ajustados de las Figuras 4-26 y 4-28). Se observa ahora que tanto el ctiterio AIC como el BIC son menores para k = 3. Ademés el ajuste del modelo sin autocorrelacién para k= 3 es mejor que para k = 2 (Mejores significatividades R’ ajustado). 19066 TES-Parnino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION ec eel emaa6o Method LS Leute NS arc ANA) ¥ a a Sd Figura +25 ea Ta [epee dy een Bete Ravenel soon 5087340) net ene os aaa we ge 1a at Figura +27 Para ver al ecuacién del modelo ajustado, sobre la Figura 4-28 (pantalla del mejor ajuste) seleccionamos View — Representations. Se obtienen las ecuaciones del ajuste que se observan en la Figura 4-29. SS iE SVC rOURTAARG) OMISHACTOGOY +0 TEKIN) +0 eOmEMNED +. aREEAONEN +0.1ESTTIONA Joceseseoorr +0077 a0o6057(0 +0 OsQRESTS"7) + [AR PO 7351156) Figura 429 © MTES-Paraninfo 191 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS EI modelo en retardos distribuido finitos de Almon finalmente ajustado seré, H+ YX, , +u, = 100.2373546 + 0.02931407869X, + 0.1461374658 Xi.) + 0.1864090082 X, 2 + 0.1748864092 X, » + 0.1363273723 X, + 0.09548960077 Xs + 0.07713079805 X, «+ 0.1060086675 X,7 +e, €,= 0.756115596 €,1+ 4. Con la misma informacién del problema anterior se trata de explicar los gastos en inversion Y¥ a partir de una relacién lineal con la dotacién de reservas X y sus siete primeros retardos utilizando los esquemas de retardos distribuidos infinitos de Koyck y Klein. SOLUCION: Se trata de ajustar, segtin el retardo infinito de Koyck, el modelo siguiente: ¥,=u+d)w,X,, +4, a Retardo geométrico de Koyck (transformacién autorregresiva) > MASS U-AAX,,+u, = U4 50-DYAL'X, +4, u+d0-Ae Ft PNA AL) = WAL) +50 -A)X, +4, AL) => ¥, =~ AUF AY, tOU-A)X, tu, = Aug, = Oy HY, 4 +X, +O, En definitiva el modelo a estimar es ¥, = ay +@,¥,., +0%,X, + (0) Pero como el modelo presenta la variable endégena retardada como regresor, no podremos utilizar estimacién MCO. Una alternativa consiste en utilizar variables instrumentales, por lo que se ulilizaré el método estimacién por minimos cuadrados bietdpicos TSLS que permite la inclusién de una matriz. de instrumentos para los regresores del modelo. El método de las variables instrumentales exige asociar a cada regresor una variable (instrumento) que esté fuertemente correlacionada con la variable a la que sirve de instrumento y no esté correlacionada con la perturbaci6n. En este tipo de modelo de Koyck se utilizan C y X como instrumentos de si mismos, ya que no estan correlacionados con la perturbacién, y la variable X,1 como instramento de ¥,1, ya que en la formulacién del modelo X no depende de la perturbacisn y esté correlacionado con Ye Para realizar el ajuste por minimos cuadrados en dos etapas con Eviews elegimos Quick — Estimate Equation, escribiendo la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, eligiendo TSLS ~ Two Stage Least Squares (TSNLS and ARIMA) en el campo Method, situando los instrumentos en Instrument List (Figura 4-30) y haciendo clic en Aceptar. Se obtiene el modelo ajustado de la Figura 4-31, ccuyo tinico problema es la presencia de autocorrelacién (Durbin-Watson muy bajo). 19260 WES-Parsnito MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION att mre OR engi ee 8 Er Satie eS) 260 y Doe? Oca ae Oma vey nea coe Tee oom ihesriondrom rors Fe Remud DSTES Mem perce er SUB72 AuetedRswses OME SD depndanva 15338 SEtagenion (3150 Sim squndesd S006 Dutton st O73212 Secanevane SER (057594 Ge) Ga Figura 4-30 Figura 31 Para salvar el problema de Ja autocorrelacién analizaremos Ia estructura de los residuos del modelo a través de View — Residual Test + Correlogram Squared Residuals (Figura 4-32) y tomando el niimero de retardos por defecto (28). El correlograma residual (FAC-AC y FACP-PAC) se observa en la Figura 4-33, By wc tseteey tr) o SCommgenion Reser Sares Daninisson ie O7IIED Seeman SH Figura 4-33 Se observa estructura de correlograma residual ajustable a un proceso AR(1) ya que la funcién de autocorrelacién presenta un decrecimiento sinusoidal y en Ia funcién de autocorrelacién parcial sélo la primera barra es significativa (supera las bandas de puntos). Por lo tanto ajustaremos el modelo mediante Quick — Estimate Equation, escribiendo la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, eligiendo TSLS - Two Stage Least Squares (TSNLS and ARIMA) en el campo Method, situando los instrumentos en Instrument List (Figura 4-34) y haciendo clic en Aceprar. Se obtiene la Figura 4-35 con los resultados del ajuste, que son bastante adecuados, En definitiva el modelo estimado es: ¥, = -39,25832 + 0,864889Y, , + 0,151901X, +v(¢) v, =0,427890y,.. + €(0) © MTES Paraninfow 198 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS ‘hk andvomnia borealis Ray aes 2 naa Figura 434 Figura 435 ‘A continuaci6n realizaremos el ajuste de un modelo en retardos distribuidas con 1a estructura infinita de retardos de Klein. Retardo geométrico de Klein > e Pm A ¥,=K+ OY 0-AAX,, +u, =60-YV AX, +50-DY AX, +u, a a 7 %, 5Z,, +50 -AYAX, +A" X 4AM, + +u,= 52, + ROU-ASAK., +, = 52, MZ +U, cs El valor de 2 se elige mediante un procedimiento de tanteo (A = 0,1, 0.2, 0,3,..). Una vez caleulados Zi: y Z se estima el modelo por MCO. Se toma el 4 que minimiza la suma de ‘cuadrados residual, ay $ F Zy=(- aX t=1 La variable Z,, = (1- A) 2X, ival w : arise Zy, = ( yy ae ne 4AZ,, (= 23000 Z, se genera con Eviews rellenando la pantalla del bot6n Genr sucesivamente segain las Figuras 4-36 y 4-37 (tomando =0.1), [za | Peoscarzicn sa is 1) Comes] Figura 436 Figura #37 1946.0 Es-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Z,, = 2! se genera con Eviews rellenando la pantalla del botén Genr sucesivamente segtin las Figuras 4-38 y 4-39 (tomando A = 0,1). ea Elec squaton| nies equation Ta@TRENDTSS) zat Sarele 196001 198704 Figura 4-38 Figura #39 Ahora ya podemos estimar el modelo ¥, = 5Z,, +1oZs, +4, por MCO. Para ello se elige Quick — Estimate Equation, se escribe 1a ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 4-40) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 4-41, El mayor problema que presenta el ajuste es la autocorrelacién, em deer ar 2407 Aaierivetsion 155200 Uogiaoes jem) Figura +40 Figura +41 Para salvar el problema de la autocorrelacién analizaremos la estructura de los residuos del modelo a través de View — Residual Tests > Correlogram Squared residual (Figura 4-42) y tomando el mimero de retardos por defecto (28). El correlograma residual (FAC-AC y FACP-PAC) se observa en la Figura 4-43. Se observa estructura de correlograma residual ajustable a un proceso AR(2) ya que Ia funcién de autocorrelacién presenta un decrecimiento sinusoidal y en la funcién de autocorrelacién parcial s6lo las dos primeras barras son significativas (superan las bandas de puntos). Por lo tanto ajustaremos el modelo mediante Quick —» Estimate Equation, escribiendo la ecuacién en el campo Equation Specification de la solapa Specification, eligiendo Least Squares en el campo Method (Figura 4-44) y haciendo clic en Aceptar. Se obtiene la Figura 4-45 con los resultados del ajuste, que son bastante adecuados, © MTES Paraninfow 195 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Sh Ever tSIate Pal Cana as a 3) Mostra I SE ctegesion 57 Yeni rocmtere) Sovgmedwnd eNews (sree Lg atoas tea [on Seabird Soe see BRITT Figura Figura +45 EI modelo finalmente ajustado tiene el problema de la no significatividad de Z1 y 22. El problema se soluciona repitiendo el ejercicio con diferentes valores de 2. El método de Klein dice que se tomaré el 1 que minimice 1a suma de cuadrados residual SCR en el ajuste por MCO de Ia Figura 4-41. se comprueba que el valor éptimo de 2 es 0.8. Repitiendo todo el proceso con 4 = 08 se obtiene un ajuste final totalmente significativo y sin problemas de autocorrelacién » 4.3. El archivo 4-3.w/1 contiene una variable de nombre SA que representa una serie de ratios mensuales sobre la produccién de una empresa. Con la finalidad de realizar predicciones de produccién futuras se trata de ajustar la serie de ratios a un modelo ARIMA convenientemente. SOLUCION: Realizaremos el ajuste de la serie SA aun modelo ARIMA que permite trabajar y realizar predicciones con series temporales, a partir de Ia metodologia de Box-Jenkins, Para comenzar Ia fase de identificacién, y con el objeto de observar la estacionalidad, realizamos una representacién grfica de la serie mediante Quick —+ Graph — Line Graph (Figura 4-46), indicando la serie a graficar en Series List (Figura 4-47) para obtener la representacién de la serie en la Figura 4-48, Se observa a simple vista que el gréfico presenta estructura estacional ‘mensual. Sin embargo, este hecho hay que comprobarlo de modo formal. 196 © TES-Parnino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION awe (51001 SOME ~ 21305 anf V1 9602 218 te ‘ay Fier” 2 en BR Figura 4-47 BR Figura +48 Para probar la estacionalidad podemos utilizar el gréfico vertical de la serie (Figura 4-50), ‘que se obtiene haciendo doble clic sobre la serie SA para ver sus valores y eligiendo View —+ Graph —+ Spike (Figura 4-49), el grdfico de las subseries estacionales (Figura 452) que se obtiene ligiendo View — Graph — Seasonal Stacked Line (Figura 4-51) 0 el gréfico de las subseries anuales (Figura 4-54) que se obtiene eligiendo View —» Graph —+ Seasonal Split Line (Figura 4-53). Figura 4-49 Figura +50 © MTES Paraninfow 197 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Figura 152 Figura +53 Figura +54 Todos los gréficos anteriores muestran claramente la presencia de estacionalidad mensual. El grafico de las subseries anuales presenta evoluciones paralelas de los datos en los distintos meses de todo los afios. El grifico de las subseries estacionales muestra claramente las secciones similares de las estaciones. Pero la estacionalidad, asf como la estacionariedad también pueden detectarse a través de Jas funciones de autocorrelacién y autocorrelacién parcial estimadas (FAC y FACP respectivamente). Para ello elegimos View — Correlogram (Figura 4-55) y elegimos la serie en niveles con 36 retardos (Figura 4-56). Se obtienen las funciones de autocorrelacién. y autocorrelacién parcial estimadas de la Figura 4-57. La FAC muestra valores altos en Tos retardos miltiplos del perfodo estacional 12, 24 y 36. Se observa que las funciones de autocorrelacién y autocorrelacién parcial estimadas también validan los periodos estacionales porque los coeficientes de Ia FAC para retardos miltiplos del pperiodo estacional de Ia serie son significativamente distintos de cero. Ademés, para una cantidad ‘grande de retardos la FAC se configura en forma de abanico que completa su ciclo girando sobre el «je de abscisas para una cantidad de retardos igual al perfodo estacional. Por otro lado, la FACP presenta estructura de coeficientes significativos para retardos periédicos (largos). La FAC y la FACP deben considerase a la vez, pues a veces intercambian sus papeles en el comportamiento estacional. Asimismo, los coeficientes de la FAC no decaen rpidamente, lo que indica falta de estacionariedad en media, Asimismo, si consideramos la serie de medias y varianzas por meses a lo largo de toda la serie observamos variaciones significativas crecientes y decrecientes a lo largo de los aiios, lo que indica que no hay estacionariedad ni en media ni en varianza en la serie original 1986 WES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Deseriptivos “ARO. Eaiadietos | Enortp. 3A 1981 Tesi LZ2TT | 07805 Varina O10 TSE Media 72358 | Osea Varianza 18 136 Mecia 1.2030 _|—0a235 022 Tee T3818 | os1a0- ote Ts Tania | —oa767 008 1966. fase | 09574 0 TST Tatst | —oa7es 008 = Taso | —ooa98 007 1968 1.3099 | 01818 ‘004 780 986 | 08878 ‘O14 eal Tiee2 | 0ao6 008 Tez T24a6 | 0866 008 se Tatas | 03585 ‘007 1968 i2esa [03900 O14 SE Tr868 | 0aTT8 12 6, Tare | 05898 “ote 1967 2454 | 09687 016 EE T2515 | 0a2T0 021 1S 70097 [ —Dea67 Dia i [bi ved en Figura 4-55 © MTES-Paraninfo 199 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS. css ESHA epeabebanodtbbeesaee nonce: Este resultado nos Tleva a tomar logaritmos de la serie original (botén GENR y Figura 4-58) Y diferenciar la serie de logaritmos con el objetivo de atenuar la falta de estacionariedad en media y fen vatianza. Pero, una vez aplicados los logaritmos, como la serie es estacional, el problema es identificar si diferenciamos la parte regular de la serie en logaritmos (bot6n GENR y Figura 4-59) 0 cen la parte estacional (bot6n GENR y Figura 4-60). Para ello representamos las funciones de autocorrelacién estimada y autocorrelacién parcial estimada bajo los supuestos de diferenciacién en Japarte regular de la serie en logaritmos (Figuras 4-61 y 4-62) o en la parte estacional (Figura 4-63), oe Se ee Figura 4-58 Figura 4-59 (Cae Figura 4-60 Figura 4-61 200 © ITES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION iii ananialiiizanaal, Figura 4-62 Figuea 4-63 Se observa que al diferenciar sélo la parte regular de la serie en logaritmos, las funciones de autocorrelacién y autocorrelacién parcial estimadas (Figura 4-62) no superan el problema de Ia falta de estacionariedad ya que la FAC no decae répidamente, Pero al diferenciar s6lo una vez la parte estacional de la serie en logaritmos, las funciones de autocorrelacién y autocorrelacién parcial estimadas (Figura 4-63) ya superan el problema de la no estacionariedad. Asimismo, estas dos funciones cumplen las condiciones para que haya estacionalidad porque los coeficientes de Ia FAC para retardos miiltiplos del perfodo estacional de Ja serie son significativamente distintos de cero, Ademés, para una cantidad grande de retardos, la FAC se configura en forma de abanico que completa su ciclo girando sobre el eje de abseisas para ‘una cantidad de retardos igual al perfodo estacional Luego el problema de la estacionalidad y la estacionariedad en media y en varianza se ha arreglado aplicando logaritmos, diferenciando una vez la parte estacional y no diferenciando la parte regular. Luego la parte regular de la serie en logaritmos es integrada de orden cero 0) y la arte estacional es integrada de orden uno I(). Ahora resta por identificar el orden de la parte autorregresiva AR y la parte de medias -méviles MA. Para realizar esta tarea utilizaremos la FAC y la FACP para las que se obtuvo la cestacionariedad y la estacionalidad, es decir las representadas en la Figura 4-63. Observando estas dos funciones vemos que sus coeficientes no se anulan bruscamente con periodicidades y que sus estructuras se ajustan claramente a un modelo ARMA(1,1(0,1) 2. Existe una amplia literatura con baterfas de graficos de FAC y FACP parcial ajustadas a sus correspondientes modelos ARMA. En nuestro caso, Ia parte AR(I) de la parte regular proviene del decrecimiento rapido inicial y las ‘ondas sinusoidales de la FAC aftadido a que la FACP presenta s6lo un coeficiente significativo en Ia mayoria de los periodos (salvo en el primero), anulindose bruscamente el resto de los ccoeficientes. Asimismo, la parte MA(I) de la parte regular proviene de que la FAC presenta un solo retardo significativo en la mayorfa de los perfodos (salvo en el primero). De todas formas, la ‘inica duda posible serfa considerar también AR() la parte estacional © MTES-Paraninfo 201 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Ya tenemos identificada completamente Ia serie inicial como un modelo ARIMA(0,1)(@0,1,Di2. Es decir, ya hemos realizado el trabajo més importante en la ‘modelizacién de una serie temporal mediante la metodologia de Box-Jenkins, Una vez identificado el modelo realizamos su estimacién y diagnosis. Para ello se elige Quick — Estimate Equation, se escribe 1a ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification teniendo en cuenta Ia estructura ARIMA previamente identificada, se elige LS - Least Squares (NLS and ARIMA) en el campo Method (Figura 4-64) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 4-65, El modelo presenta buena significatividad individual y conjunta de los parémetros estimados, altos coeficientes de determinacién y un estadistico de Durbin Watson casi igual a2. Luego la diagnosis del ajuste es correcta, Eeptenr tla ateceee cenereanin SOT Figura +64 Figura 4-65 También es un buen instrumento de diagnosis el correlograma residual (Figura 4-67) obtenido mediante View —» Residual Tests > Correlogram Q-Statistics (Figura 4-66). Se observa que tanto la FAC como la FACP no tienen retardos claramente significativos y ademés las probabilidades asociadas al estadfstico Q son casi todas mayores que 0,05, lo que indica que los residuos del modelo estimado se comportan como un ruido blanco. ay ener "So-amesorer rae Bbeibaa5 ge seabuuy, Figura 4-66 Figura 4-67 202+ © ITES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Dado que la serie inicial como un modelo ARIMA(1,0,1)(0,1,1)i2 podemos eseribir la ecuaci6n algebraica del modelo como: (1-0,89B)DLSAS = (140,51B)(140,68B")RESID DLSAS-0,89DLSAS(-1) = RESID+0,51RESID(-1)+0,68RESID(-12)+0,51*0,68RESID(-13) DLSAS = 0,89DLSAS(-1) + RESID+0,51RESID(-1)+0,68RESID(-12)+0,51*0,68RESID(-13) No olvidemos que DLSAS Ln(X,)-Ln(X.13), con lo que podemos escribir (SA=X,): Ln(X_)-La(X12) = 0,89[Ln(X)-Lm(X 12)-(La(X,1)-Ln(% 13) + e405 Le, +0,68¢.:2+0.346e.13 0,11 La(X,)+0,89 Ln(X,.1)-0,11 La(X, 12)-0,89 La(X, 13) = e051, 140,68e,1240,346¢, 13 > Se tienen 100 datos relativos a la demanda semanal de un manufacturero relativa a contenedores de pléstico que utilizan las compaifas farmacéuticas. E] manufacturero necesita predecir el nimero de contenedores que le sern demandados en las 10 semanas siguientes con vistas a su producci6n. Utilizar la metodologfa de Box y Jenkins para realizar las predicciones, Los 100 datos se encuentran en la variable Plastic del fichero 4-4.w/l SOLUCION: Realizaremos el ajuste de la serie Plastic a un modelo ARIMA que permite ‘trabajar y realizar predicciones con series temporales, a partir de la metodologia de Box-Jenkins. Para comenzar In fase de identificacién, y con el objeto de observar Ia estacionalidad, realizamos una representaci6n gréfica de la serie mediante Quick + Graph —> Line Graph, indicando la serie a graficar en Series List (Figura 4-68) para obtener la representacién de la serie cen la Figura 4-69. Se observa a simple vista que el grifico no presenta estructura estacional. Sin ‘embargo, este hecho hay que comprobarlo de modo formal al Soles eshasesliner) feel sa i\ Ar SS Mi ae “= | oh val - = re aaa valaw “ Figura 4-68 Figura 4-69 Para probar la estacionalidad podemos utilizar el gréfico vertical de la serie (Figura 4-71), ‘que se obtiene haciendo doble clic sobre la serie SA para ver sus valores y eligiendo View Graph + Spike (Figura 4-70). A simple vista no se observa estructura estacional en la serie. Pero Ia estacionalidad, asi como la estacionariedad también pueden detectarse a través de las funciones de autocorrelacién y autocorrelacién parcial estimadas (FAC y FACP respectivamente). © MTES-Paraninfo 208 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Para ello elegimos View —» Correlogram (Figura 4-72) y elegimos la serie en niveles con 36 retardos (Figura 4-73). Se obtienen las funciones de autocorrelacén y autocorrelacién parcial cestimadas de la Figura 4-74, BeuEEEEE auaebEGzEEEs 204 © ITES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Se observa que los coeficientes de la FAC no decaen répidamente, lo que indica falta de estacionariedad en media, Por otro lado, en la FACP no se observa estructura de coeficientes significativos para ningiin tipo de retardos estacionales, con lo cual no hay estacionalidad. Por lo tanto, debido a la no estacionariedad en media, diferenciaremos la serie original creando Ia variable DPLASTIC con el bot6n GENR como se indica en la Figura 4-75 y Ja graficamos mediante Quick —» Graph —r Line Graph obteniendo la Figura 4-76 en la que se observa estacionariedad en media y en varianza, No obstante, graficamos las funciones de autocorrelacién y autocorrelacién parcial estimadas de DPLASTIC mediante View — Correlogram y elegimos la serie en niveles con 36 retardos (Figura 4-77). Se obtienen las funciones de autocorrelacién y autocorrelaci6n parcial estimadas de la Figura 4-78. ——_ ees — a ae | aE Figura 4-77 Figura 4-78 En el correlograma se observa que los retardos signifieativos de la FAC decaen tan répidamente que s6lo es significativo el primero, luego ya no existen problemas de estacionariedad cena serie diferenciada, es decir la serie diferenciada es [(0) y la setie original es I(1). ‘También se puede utilizar un contraste de raices unitarias para ver la estacionariedad de DPLASTIC. Para ello, con los datos de la variable en pantalla, se elige View — Unit Root Test (Figura 4-79) y se rellena la pantalla de entrada como se indica en ta Figura 4-80. Al pulsar OK se ve que el p-valor de la t de Student en el Test Aumentado de Dickey Fuller (0.0056) es menor que 0,05 (Figura 4-81), lo que nos Teva a aceptar la estacionariedad de DPLASTIC. Si repetimos estos pasos para PLASTIC (Figura 4-82) se observa un p-valor mayor que 0,05, lo que indica que PLASTIC no es estacionaria (hecho que ya habjamos demostrado a partir de la FAC y FACP). © ITES-Paraninfo 205 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS SEE ay | fbattaonet eet Siectews Onan Oke aire rated ara “Vaavan fon ene preae fora Sete ey ie ie Ras tau ies Figura 4-81 Figura 4-82 En cuanto a la identificacién de la parte de media m6vil de la serie DPLASTIC vemos que sélo el primer retardo de la FAC es significativo y que el decrecimiento de los retardos de la FACP ‘es muy ripido (Figura 4-78). Luego la parte de media mévil se modelizaria como un proceso MA(). Para identificar Ia parte autorregresiva vemos que, aunque hay tres retardos de ta FACP cestimada casi significativos ninguno es claramente significativo, decreciendo répido los coeficientes significativos de la FAC. Luego la parte autorregresiva se modelizaria como un proceso AR(0). ‘Ademés, considerando las dos funciones de autocorrelacién en conjunto, vemos que sus retardos no se anulan demasiado bruscamente. Estamos entonces ante una estructura ARMA(0,1) para la serie AMAL Figura +85 Figura 4-86 wag) __—OTeRT aoe Sum squaes eid 2405132 Scher citeion ‘oe ‘También es un buen instrumento de diagnosis el correlograma residual (Figura 4-67) obtenido mediante View — Residual Tests + Correlogram Q-Statistics (Figura 4-66). Se ‘observa que tanto Ia FAC como la FACP no tienen retardos claramente significativos y ademis las probabilidades asociadas al estadistico Q son casi todas mayores que 0,05, 10 que indica que los residuos del modelo estimado se comportan como un ruido blanco. Dado que Ia serie inicial como un modelo ARIMA(,1,1), podemos escribir Ia ‘ecuacién algebraica del modelo como: DPLASTIC = (1-0,758281B) RESID => (1-B)PLASTIC = (1-0,758281B) RESID X,-X.1=e,-0,75828e,1 (X;= PLASTIC) © ITES-Paraninfo« 207 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS A continuacién vamos a valorar la adecuacién de este modelo para la prediccién Para ello realizamos las predicciones de los valores ya conocidos de la serie (prediceién histérica) para ver las desavenencias con los valores reales de la misma. Se trata por tanto de predecir lo conocido con la ecuacién estimada, Para ello se hace clic en la solapa Forecast de la parte superior derecha de 1a pantalla con los resultados de la estimacién del modelo (Figura 4-85) y se sefiala Static forecast en la Figura 4-87. Al pulsar OK se obtienen los resultados de Ja Figura 4-88 que evaltian nuestro modelo estimado para hacer predicciones. Se observa que no hay sesgo en media ni en varianza y todo el valor se concentra en la covarianza, El coeficiente de desigualdad de Theil debiera de aproximarse més a cero y el porcentaje de error absoluto medio también debiera de ser mas bajo. amo UNTITLED ‘es ORASTC —, Fowcadt ne, (delet J) | Stes. Forecast sample: 1/07/1980 11/20/1961 SE rent | Caete Inches ebsamvatiane: 99. Cisse | Biatinatanense cae |] Root Mean Sapared Eror ‘m2 et Ome Mes Absolut Fe Dasara ——— Cress ‘hel oo aeies (wens roost) geen ia Prepemion Saxe Variance Proportion atone: ret eden cooc bela ‘Srartince Propaston Beanies Figura 4.87 Figura 438 A continuacién vamos a realizar predicciones futuras. Para ello se hace clic en la solapa Forecast de la parte superior derecha de la pantalla con los resultados de la estimaci6n del modelo (Figura 4-85) y se sefiala Dinamic forecast en la Figura 4-89. Al pulsar OK se obtienen los resultados de la Figura 4-90 que evalian nuestro modelo estimado para hacer predicciones. Se observa que los errores debieran ser mas pequeios. La variable dplastief situada en le campo Forecast name de la Figura 4-89 contendré las predicciones pedidas. Es muy importante observar que en el campo Forecast simple de la pantalla Forecast de la Figura 4-89 se introduce la muestra temporal para la cual queremos que Ia variable dplastief contenga las predicciones. No olvidemos que estamos haciendo predicciones con la variable en diferencias DPLASTIC, que posteriormente pueden ser ‘ransformadas a términos de la variable PLASTIC. fase UNTIED Sue PASTE recateaw it] OB Forecast DPLASTICE a SE. botnet: 1b hecehaenery Actual: PLASTIC Csiatatimcama |] Forecast sample 1100/1981 11201961 tnestarrn SE cit} Included ebseratione: 1 Fase on e Foot Mean Squared Error 147.2308 ‘Mean Abeolute Error 147.2303 Mean Abcolute Percentage Eror 1226 935 See pe he ale Figura 4-89 Figarad-90 2086 © ITES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION > Se trata de explicar el gasto real de gasolina per capita ¥ mediante el precio real de Ia gasotina X2 y el ingreso real disponible per cépita X3. Todas las variables vienen dadas en datos trimestrales desde 1959.1 a 1990.4 en logaritmos ajustados estacionalmente (archivo 4-4.wf1). {Sera posible realizar un ajuste de este modelo no espurio y valido en el largo plazo? SOLUCION: Pera realizar un ajuste del modelo vélido en el largo plazo (no espurio) seré necesario que exista una relacién de cointegracién entre las variables del modelo. Para ello, en primer lugar, analizaremos la estacionariedad de todas las variables que lo integran. En primer lugar representamos las series mediante Quick —» Graph — Line Graph (Figura 4-91) y rellenando Ja pantalla Series List sucesivamente con las vatiables ¥, X2 y X3, Se obtienen los grificos de las, Figuras 4-92, 4-93 y 4.94 Elie ores irene eee ef kere = Figura 4-93 Figura 4-94 ‘A simple vista se observa la ausencia de estacionariedad de las variables. Pero para poder afirmar este hecho, es necesario utilizar contrastes formales, por el ejemplo el test de raices unitarias de Phillips Perron. Para llevar a cabo este contraste desde Eviews elegimos Quick — Series Statistics» Unit Roots Tests Figura 4-95), rellenamos la pantalla Series Name con la variable ¥ (Figura 4-96) y al pulsar OK se obtiene la pantalla Unit Root Tests (Figura 4-97) en cuyo ‘campo Test Type elegimos Phillips-Perron y en cuyo campo Test for unit root in elegimos Level ya ‘que estamos probando Ia estacionariedad de la serie ¥ en niveles. Al pulsar OK se obtiene un p- valor mayor que 0,05 en los resultados del contraste de Phillips Perron (Figura 4-98), lo que indica ausencia de estacionariedad en la variable ¥. Los resultados del contraste de Phillips Perron para las variables X2 y X3 se presentan en las Figuras 4-99 y 4-100, observiindose que ambos p-valores también son mayores que 0,05. Luego las tres series ¥ X2 y X3 son no estacionarias, lo que nos lleva a considerar sus primeras diferencias. © MTES-Paraninfo 209 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Spe 15001 Wenat — 1 we ae Ea Figuca $95 Oheat Died Baten Olt dtewce Odsatoene wn Catena eer eeu ee Wen anh lien nin Otro (Oto ect Figura 4-97 Figura +98 es en Dl fo esto Ex cech 2 overt agate igi Pa | stanmons ema, seer Figura 4-99 Figura +100 A continuacién estudiaremos la estacionariedad de las primeras diferencias de las variables del modelo mediante el contraste de Phillips Perron. Elegimos Quick > Series Statistics» Unit Root Test (Figura 4-95), rellenamos la pantalla Series Name con la variable Y (Figura 4-96) y al pulsar OK se obtiene la pantalla Unit Root Test (Figura 4-101) en cuyo campo Test Type elegimos Phillips-Perron y en cuyo campo Test for unit root in elegimos Ist Difference ya que estamos probando la estacionariedad de la primera diferencia de la serie. Al pulsar OK se ‘obtiene un p-valor menor que 0,05 en los resultados del contraste de Phillips Perron (Figura 4-102), Jo que indica estacionariedad en la primera diferencia de la variable ¥. 2106 © ITES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Los resultados del contraste de Phillips Perron para las variables X2 y X3 se presentan en Jas Figuras 4-103 y 4-104 observindose que ambos p-valores también son menores que 0,05. Luego las primeras diferencias de las tres series ¥ X2 y X3 son estacionarias Hemos visto que las tres variables del modelo (en logaritmos) son no estacionarias, pero sf lo son sus primeras diferencias. Esto indica que las tres series son I(1). Por lo tanto, se cumple la primera condicién para que exista una relacidn de cointegracién. La siguiente tarea sera comprobar que efectivamente las variables cointegran. Para ello ajustamos el modelo ¥ = + 8X2 + BX3 + wy comprobamos si los residuos estimados tienen raices unitarias (son estacionarios). Para ello usamos Quick — Estimate Equation, escribiendo la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, eligiendo Least Squares en el campo Method Para ajustar por minimos cuadrados (Figura 4-105) y haciendo clic en Aceptar. Se obtiene el ‘modelo ajustado de la Figura 4-106, Para guardar los residuos estimados (variable RESID) con otro nombre, seleceionamos la variable RESID, elegimos Object —» Copy Selected Figura 4-107) y en 1a pantalla Object Copy elegimos RESIDO1 como variable destino (Figura 4-108). Al pulsar OK ya tenemos RESTDO1 como nueva variabe copia de RESID. 7 fay Bide ‘Simeee ee Ousermcte oa Figura +101 Figura +102 Box cna Figura 4-105 Figura +106 © MTES-Paraninfo 211 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Soi frcusfuoor ~ te errs 2 ats aT Figura 4-107 Figura +108 Para comprobar que los residuos estimados del ajuste anterior son estacionarios elegimos Quick —» Series Statistics» Unit Root Test (Figura 4-95), rellenamos la pantalla Series ‘Name con la variable RESIDO1 (Figura 4-109) y al pulsar OK se obtiene la pantalla Unit Root Tests (Figura 4-110) en cuyo campo Test Type elegimos Phillips-Perron y en cuyo campo Test for unit root in elegimos Level ya que estamos probando la estacionariedad de la serie RESIDOI en niveles. Al pulsar OK se obtiene un p-valor mayor que 0,05 en los resultados del contraste de Phillips Perron (Figura 4-111), lo que indica ausencia de estacionariedad en los residuos del modelo. Llegamos centonces a la conclusién de que las variables del modelo no cointegran y este puede ser espurio. SSS Secale (uaa Eaeertored 9) a Oras ete: Oeste Ce) Ce) 2 ates (TT Figura 4-109 Figura +110 Figura +111 2126 ITES-Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION Una vez vista Ia no existencia de una relacién de cointegracién, hemos legado a la conclusi6n de que el ajuste Y= + AX2 + X3 + u, cuyos resultados se presentan en la Figura 4-106 puede ser espurio. Aunque estos resultados presentan una gran significatividad individual y conjunta de los parémetros estimados del modelo y un alto coeficiente de determinacién ajustado, se observa que el bajo valor del estadistico de Durban Watson denota autocorrelacién serial, Este hecho, junto con Ia ausencia de cointegracién pueden llevamos a pensar en la presencia de cambios estructurales. Para detectar el posible cambio estructural, sobre los resultados de la regresién (Figura 4-106) elegimos View —» Stability Tests —> Recursive Estimates (OLS only) segsin la Figura 4-112 y en la pantalla Recursive Estimation elegimos Recursive Residuals. Al pulsar OK se obtiene el grifico de residuos recursivos de la Figura 4-113 que detecta posibles cambios estructurales alrededor de 1970, 1973, 1978 y 1986 (puntos donde la gréfica corta a las bandas de confianza) debidos sobre todo a los dramiticos cambios suftidos por el precio real de la gasolina en esas fechas. =) Cees ip ucmors "| Chsmenesr tem Figura +114 Ahora intentaremos introducir en el modelo una variable ficticia D, por cada cambio estructural, que valga cero antes de la fecha del cambio y que valga uno después de esa fecha. Como 1970 y 1973 estén muy cerca, consideraremos solamente los cambios de 1970, 1978 y 1986, D, ' 1970, 1978, 1986 p si ice 1 si i2t © MTES Paraninfow 213 ECONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Ajustando el nuevo modelo por MCO mediante Quick —» Estimate Equation, esctibiendo Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, eligiendo Least Squares en el campo Method para ajustar por minimos cuadrados (Figuras 4-115) y haciendo clic en Aceptar, se obtiene el modelo ajustado de la Figura 4-116, Para guardar los nuevos residuos estimados (variable RESID) con otro nombre, seleccionamos la vatiable RESID, elegimos Object —> Copy Selected (Figura 4-107) y en la pantalla Object Copy elegimos RESIDO2 como variable destino. Al pulsar OK ya tenemos RESIDO2 como nueva variabe copia de RESID. “Eyecam Oper — = tan = ee Sr dl eee ae te S| soe Figura #115 Figura +116 Para comprobar que los residuos estimados del nuevo ajuste son estacionarios elegimos Quick — Series Statistics—> Unit Root Test (Figura 4-95), rellenamos la pantalla Series Name con Ia variable RES1D02 (Figura 4-117) y al pulsar OK se obtiene la pantalla Unit Root Test (Figura 4- 110) en cuyo campo Test Type elegimos Phillips-Perron y en cuyo campo Test for unit root in celegimos Level ya que estamos probando la estacionariedad de la serie RESIDO2 en niveles. Al pulsar OK se obtiene un p-valor menor que 0,05 en los resultados del contraste de Phillips Perron (Figura 4-118), lo que indica presencia de estacionariedad en los residuos del modelo. Llegamos entonces ala conclusién de que las variables del nuevo modelo cointegran y este ya no es espurio. Bu By 2 sta (eT | Figura 4-117 Figure +118 Segtin los resultados de la Figura 4-116 la relacién de cointegracién estimada seré ¥ = -3.451249 - 0.206996X2 + 0.797312X3 + 0.077885D1 - 0.058546D3 - 0.120917D4 Otro método muy importante para detectar Ja cointegracién en un modelo es la prueba DWRC (prueba de Durbin Watson sobe la regresién de cointegracién). 21460 (TES Paraino MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION La prueba DWRC se basa en el valor del estadistico d de Durbin Watson en la regresién de cointegracién. Mediante simulaciones se encontraron para d los valores criticos 0,511, 0,386 y 0,322 al 1%, 5% y 10% de nivel de confianza respectivamente, de modo que para valores de d fen Ia regresién de cointegracién menores que los valores criticos anteriores, se rechaza la hipétesis de cointegracién al nivel correspondiente (para valores mayores se acepta) En nuestro caso d = 0,54 > 0,511, con lo que se acepta la cointegracién al 99% de confianza. 4.6. Supongamos que en el modelo del problema anterior introducimos la nueva variable X4 que mide los litros de gasolina consumidos por kil6metro (en logaritmos). Se trata entonces de explicar el gasto real de gasolina per cépita Y mediante el precio real de la gasolina X2, el ingreso real disponible per cépita X3 y los litros por kilémetro consumidos X4. Todas las variables vienen dadas en datos trimestrales desde 1959.1 a 1990.4 en logaritmos ajustados estacionalmente (archivo 4-5.f1) {Sera posible realizar un ajuste de este modelo no espurio y vélido en el largo plazo? En caso. afirmativo ajustar el modelo de correccién del error asociado a la relaci6n de cointegracién e interpretar los resultados. SOLUCION: Al igual que en el problema anterior, para realizar un ajuste del modelo valido en 1 largo plazo (no espurio) seri necesario que exista una relacién de cointegracién entre las variables del modelo. Para ello, en primer lugar, analizaremos la estacionariedad de todas las variables que lo integran. Ya sabemos que las variables ¥, X2.y X3 no son estacionarias y sf lo son sus primeras diferencias, es decir, son variables [(1), Nos falta por analizar Ia variable X4, En primer lugar la representamos eligiendo Quick > Graph —» Line Graph y rellenando la pantalla Series List con la variable X4. Al pulsar OK se obtiene el grifico de las Figuras 4-119, que indica la no cestacionariedad de la variable. Pero para poder afirmar este hecho, es necesario utilizar contrastes formales, por el ejemplo el test de raices unitarias de Phillips Perron. Para llevar a cabo este contraste desde Eviews elegimos Quick —» Series Statistics—» Unit Roots Tests, rellenamos la pantalla Series Name con la variable X4 y al pulsar OK se obtiene la pantalla Unit Root Tests en cuyo campo Test Type elegimos Phillips-Perron y en cuyo campo Test for unit root in elegimos Level ya que estamos probando Ia estacionariedad de la serie X4 en niveles. Al pulsar OK se ‘obtiene un p-valor mayor que 0,05 en los resultados del contraste de Phillips Perron (Figura 4-120), lo que indica ausencia de estacionariedad en la variable X4, SY Se ] SS rie oie sine 2. / al Se a oe Figura +119 Figura 4-120 © MTES Paraninfow 215 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS A continuacién estudiaremos la estacionariedad de la primera diferencia de la variable X4 mediante el contraste de Phillips Perron, Elegimos Quick — Series Statisties—> Unit Root Test, rellenamos la pantalla Series Name con la variable X4 y al pulsar OK se obtiene la pantalla Unit Root Test (Figura 4-121) en cuyo campo Test Type elegimos Phillips-Perron y en cuyo campo Test for unit root in elegimos Ist Difference ya que estamos probando la cestacionariedad de la primera diferencia de la serie. Al pulsar OK se obtiene un p-valor menor que 0,1 en los resultados del contraste de Phillips Perron (Figura 4-122), lo que indica estacionariedad cen la primera diferencia de la variable X4 al 90% de confianza. Por lo tanto, la variable X4 es también ((). hap Pent fo eo a te: Aha su Ener ae Banh 22 ew vr tt es) Dein Raters Cate te Meet Bae "akon (30) ne 88 pb Figura 412? Figura 4-122 Hemos visto que las cuatro variables del modelo (en logaritmos) son no estacionatias, pero sf lo son sus primeras diferencias, Esto indica que las cuatro series son I(1). Pot lo tanto, se cumple la primera condicién para que exista una relaci6n de cointegracién. La siguiente tarea sera comprobar que efectivamente las variables cointegran. Para ello ajustamos el modelo Y = Art BX2+ BX3 + BX4 + wy comprobamos si los residuos estimados tienen rafces unitarias (on estacionarios). Para ello usamos Quick —> Estimate Equation, escribiendo Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, eligiendo Least ‘Squares en el campo Method para ajustar por minimos cuadrados (Figuras 4-123) y haciendo clic en Acepiar. Se obtiene el modelo ajustado de las Figuras 4-124. Para guardar los residuos estimados (variable RESID) con otto nombre, seleccionamos la variable RESID, elegimos Object — Copy Selected (Figura 4-125) y en la pantalla Object Copy elegimos RESIDO3 como variable destino (Figura 4-126). Al pulsar OK ya tenemos RESIDO3 como nueva variable copia de RESID. Perlis eimline (oe eet Bupa tegen Sema ca see eck (60) DT Sl eS A Rs IR Figura +123 Figura +124 216+ © TES-Parainto MODELOS DINAMICOS Y ARIMA, RAICES UNITARIAS Y COINTEGRACION ‘mabe ens {HRT Figura 4125 Figura 4126 Para comprobar que los residuos estimados del nuevo ajuste son estacionarios elegimos Quick —> Series Statistics Unit Root Test, rellenamos Ia pantalla Series Name con la vatiable RESIDOS y al pulsar OK se obtiene la pantalla Unit Root Test (Figura 4-127) en cuyo campo Test ‘Type elegimos Phillips-Perron y en cuyo campo Test for unit root in elegimos Level ya que estamos probando Ia estacionariedad de la serie RESIDO3 en niveles. Al pulsar OK se obtiene un p-valor menor que 0,05 en los resultados del contraste de Phillips Perron (Figura 4-128), lo que indica presencia de estacionariedad en los residuos del modelo. Llegamos entonces a Ia conclusidn de que las variables del nuevo modelo cointegran y este ya no es esptrio. PrePano 3 Olen! Clad Bate Ore deren Obdatenee ania, peepee atten a Olea elon Olienttinace —— a Sue Bie caren ed Fate * (ec Figura 412? Figura +128 ‘Ademés, si aplicamos la prueba DWRC de Durbin Watson de regresin de cointegracién tenemos d = 0,744 > 0,511, con lo que se acepta la cointegracién al 99% de confianza. La relacién de cointegracién estimada es: -1,514535299 - 0,138560632 X2 + 0,9985472776 X3 - 0.518128151 X4+u Por otra parte, segiin los resultados del ajuste mostrados en la Figura 4-124, se observa una significatividad individual y conjunta de los pardmetros estimados muy alta, asf como un ccoeficiente de determinacién muy bueno, Asociado a esta relacidn de cointegraci6n existird un modelo de correcci6n del error MCE ‘que tendra la siguiente expresidn: © MTES Paraninfow 217 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Al Bot BAX2, + PrAX3, + AX4, + BRESIDOB, + 4, Ajustamos este modelo MCE utilizando Quick —» Estimate Equation, escribiendo la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, eligiendo Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figuras 4-129) y haciendo clic en Aceptar, Se obtiene el modelo ajustado de la Figura 4-130. Suma ee aca 5 a ¥ Figura4129 Figura +130 El ajuste del modelo de correccién del error MCE asociado a la relacién de cointegracién es el siguiente ay, 1.521427 - 0,13625AX2, + 0.999642AX3, - 0.517948AX4, + 0.6273586RESIDO3 Como fi = 0,6273586 es positivo, Ia variable ¥ estaba en el perfodo 1 esté por debajo de su valor de equilibrio, con lo que empezar a aumentar en el siguiente periodo hasta restaurar el valor de equilibrio. Sabemos que el coeficiente del residuo en el modelo MCE mide la velocidad de convergencia al equilibrio del modelo cointegrado en el largo plazo. Por lo tanto 3 = 0.62 indica que la velocidad de convergencia al equilibrio del modelo cointegrado en el largo plazo es bastante aceptable. La estabilizacién de nuestro modelo en el tiempo es bastante répida. La variable Y se ajusta répidamente a los cambios a corto plazo experimentados en X2, X3 y X4, 21860 ITES-Parainto ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 5.1__MODELOS DE REGRESION CON DATOS DE PANEL Consideremos una base de datos que contiene informacién relativa a una variable dependiente y varias variables independientes para un conjunto de agentes sociales en diferentes instantes dei tiempo. Los agentes sociales pueden ser personas, organizaciones, ciudades, regiones, paises de Ia OCDE, etc. Al introducir en el modelo de regresidn Ia nueva dimensi6n agente social estamos generalizando el modelo de regresién al modelo de datos de panel. Considérese el ejemplo simple del anslisis de regresién en el que yy es una funcién lineal de K variables explicativas x, donde k=1, 2,3... K: Yi = Bo Badin + Baka + one Byki +My ‘© mucho més simplificado: Y= Bot D Bote tts donde é= 1,...N unidades sociales y f=1,....7 observaciones en el tiempo y ademés donde 1, es el término de error que representa los efectos de todas las demés variables omitidas en el modelo, es decir que es la variacién observada de la variable dependiente y que no se consigue explicar mediante la variacién observada en las k variables independientes. En notacién matricial es: Yy = BX in +My Tenemos que fi, fi, fr, fe son los pardmetros que se quieren estimar. es la ordenada en el origen (el término constante), mientras que el resto de pardmetros son las pendientes de yy, con respecto de cada una de las K variables independientes, En la econometria de datos de panel, un problema importante en el caso de estimar un modelo de regresién comin para el conjunto de NxT observaciones tiene que ver con el rocedimiento de estimaci6n que se utiliza. Puede haber varios supuestos que nos permitan la estimacién del panel por minimos cuadrados ordinarios MCO como el modelo de regresién estdndar. Son los siguientes: F{u,] = 0 para toda i o unidad social. Var{u;] = & para toda unidad social i, y para todo instante 1 Covfuc, u,]=0 para todo agente i #),y para todo instante t 5, Covluiy Xu) paratodo fy sigue una distribucién normal con media 0 y Var{ui] = 0 220 © ITES-Pararino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES La estimacién por minimos cuadrados ordinarios parte del supuesto de que la varianza de Jos términos de error es la misma para cada una de las observaciones (supuesto de homocedasticidad). Ademés dichos términos de error no estan correlacionados, para distintos instantes del tiempo, ni tampoco estin correlacionados para distintas unidades sociales (esto equivale a decir, en la literatura econométrica, que el término de error es un proceso ruido blanco). La violacién de tales supuestos es implicita en el caso de datos longitudinales de corte transversal haciendo que las estimaciones realizadas mediante el método de los minimos cuadrados no sean eficientes o de minima varianza habitualmente. En un modelo de datos de panel hay que tener presente que en general el término de error se puede descomponer en tres componentes: Uy = QA 49, +E, donde el error tiene un componente individual que es invariable a través del tiempo &% como podria ser el efecto del origen socioeconémico de la persona, un componente temporal que es invariable a través de los individuos @, y finalmente un componente &, que representa el efecto de todas las otras variables que varia entre individuos y ademas a través del tiempo. Con esta estructura de error, los residuos i; ya no son aleatorios, El andlisis conjunto de Nx? observaciones puede presentar correlacién en los términos de error entre diferentes momentos del tiempo para una unidad social. También puede presentar correlacién en los términos de ‘error para unidades sociales diferentes en un mismo momento del tiempo. Y Ia situacién se puede complicar aiin més en el caso de que exista correlacién en los términos de error para diferentes unidades sociales y momentos en el tiempo diferentes. Los supuestos de homocedasticidad y no correlacién serial sugieren que no existe relacién alguna entre los valores de una variable para diferentes momentos en el tiempo para una unidad social, para diferentes unidades sociales en un momento en el tiempo, o para diferentes unidades en diferentes momentos en el tiempo. Estos supuestos son poco realistas en la préctica y los errores en tun modelo de regresi6n comtin para el conjunto de NxT observaciones estimado por minimos ccuadrados ordinarios acaban estando correlacionados, y los pardmetros estimados ya no tienen las. propiedades ideales, Los estimadores siguen siendo insesgados peto ya no son los estimadores ineales insesgados de minima varianza. Por otto lado estin los modelos en los que se asume que todos los efectos difieren para cada individuo y/o en cada momento en el tiempo, con Io cual se estiman diferentes modelos para diferentes casos 0 unidades de anélisis y/o para diferentes momentos en el tiempo. Las dos soluciones anteriores son extremas. Por un lado, asumir que los coeficientes de regresi6n son idénticos para todos los agentes de Ia muestra asi como a través del tiempo es restrictivo y dificil de creer dada la informacién contenida en los datos. Por otro lado, asumir que el vector de coeficientes es distinto para cada agente social es excesivamente general. Es por ello que los investigadores basan con mayor frecuencia sus estudios empfricos recurriendo a ‘modelos de anilisis intermedios que se consideran detalladamente en las pr6ximas secciones. Ser necesario considerar con detalle varias maneras de caracterizar la relacién entre una variable dependiente yy un conjunto de variables independientes Xx en el caso de datos Jongitudinales de seccién cruzada. El objetivo final de estos modelos es obtener estimadores fiables y eficientes, esto es, no sesgados de minima varianza. Cada uno de los modelos implica una serie de supuestos explicitos acerca de la relacidn existente entre las variables explicativas y/o la naturaleza del error de la ecuacién de regresién © MTES-Paraninfo 221 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Dependiendo de cual sea el proceso social a investigar, se pueden utilizar modelos en Jos que se identifica una estructura del error determinada, El objetivo de estos modelos también puede ser intentar identificar y modelizar si el efecto de una variable explicativa Xe en una variable dependiente ¥;,¢s el mismo para todos los agentes sociales de la muestra, y/o si dicho efecto es constante a través del tiempo. El primer conjunto de modelos se denomina modelo de coeficientes constantes (en nglés, constant coefficients models) porque los coeficientes que caracterizan el efecto de la variable x,en la variable dependiente y, son constantes para todos los agentes sociales. En este tipo de modelos se definen determinadas estructuras de error. El modelo de efectos 0 coeficientes fijos (en inglés, se han utilizedo varios nombres para referirse a este tipo de modelos: fixed effects models, 0 least square dummy variable models) capta la vatiacién existente en la muestra debido @ la presencia de diferentes agentes sociales con la inclusién de tun conjunto de N-1 variables dicotémicas d; (una para cada agente social, menos el agente social de referencia). Se puede hacer lo mismo para el caso de diferencias a través del tiempo, mediante la inclusién de %. Con ello se controla por posibles variaciones en la constante a través del tiempo. Una variacién més complicada de este modelo consiste en incorporar una setie de N-1 variables dicotémicas para controlar por el efecto de cada uno de los individuos en la variable dependiente, y una serie de T-1 variables dicotémicas para controlar por el efecto del tiempo. Este modelo se puede ampliar facilmente para incluir interacciones entre agentes sociales y periodos temporales. El tercer modelo se denomina modelo de efectos 0 coeficientes aleatorios (en inglés, random effects model). Este tipo de modelo asume que la variaci6n a través de los agentes sociales (y/o a través del tiempo) es al azar, y por lo tanto se captura y especifica explicitamente en el término de error de Ia ecuaci6n. El caso general es el método de los minimos cuadrados generalizados donde se incorpora una estructura en el ‘término de error. También se puede especificar un modelo de ecuaciones estructurales (en inglés, structural equation models), en el cual el efecto del tiempo asi como la variacién debida a la presencia de agentes sociales se modela de manera explicita en una serie de ecuaciones estructurales en lugar de modelizarlo en la estructura de error del modelo tinicamente. 5.2__MODELOS DE PANEL DE COEFICIENTES CONSTANTES En el modelo de coeficientes constantes se asume que los coeficientes son los mismos para cada uno de los agentes sociales en la muestra. Tendremos: Ye Pat DS Batn te donde k= I... K variables independientes de interés, observaciones en el tiempo, en notacin matricial es: . Nunidades sociales y t= 1,... 7 WX +My Los parimetros a estimar son K, y estos K pardmetros se consideran iguales 0 constantes para todas las unidades de la muestra y también para cada periodo de tiempo. La estimacién por minimos cuadrados ordinarios de dicha ecuacién parte del supuesto de que la varianza de los términos de error es la misma para cada una de las observaciones (supuesto de homocedasticidad) y ademas que dichos términos de error no estin correlacionados, para Aistintos instantes del tiempo. Es decir que la estimacién por minimos cuadrados supone la siguiente estructura de error: 22260 ITES-Pararino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Var{u;) Covltir, ws para toda unidad social i, y para todo instante ¢ 0 para todo agente i #/, y para todo instante ¢ #5 Sin embargo, existen varias situaciones en que Ia estructura de covarianzas del término de error es mas compleja, y en consecuencia se violan los supuestos de la estimacién por minimos cuadrados ordinarios. En el caso de heterocedasticidad a través de agentes sociales (en inglés, cross-sectional heteroskedasticity), la varianza de los términos de error es diferente para cada agente social. Es decir, Var{u,] = 07;, siendo o°, diferente de o°; (para cualquier agente i diferente de j). Otra situacién es cuando, con independencia de lo que se suponga acerca de las varianzas de los términos de error de distintos perfodos, los términos de error de cada agente social no son independientes en un momento dado. Esta es Ia situacién de correlacién a través de los agentes sociales o correlacién de corte transversal. Significa que Cov{uy, uy] es también distinta de cero; es decir, los términos de error estan correlacionados a través de las diferentes unidades sociales en un momento del tiempo Otra situacién es cuando para distintos instantes del tiempo, pero un mismo agente social, los términos de error estén correlacionados. Se puede suponer que tinicamente los términos de error de periodos consecutivos estén correlacionados, o por el contrario que todos los términos estin comrelacionados. En este segundo caso existen distintas estructuras de correlacién. En ‘cualquiera de sus variantes, esta situaci6n se conoce como autocorrelaciGn, 0 correlacién serial, es decir, el término de error (para un agente social) esté correlacionado consigo mismo a través del tiempo: con lo cual Covfius, ti | es distinto de 0 para al menos un retardo k>0, Cualquiera de estas situaciones es habitual en el anélisis de datos longitudinales. Tanto cen el caso de heterocedasticidad 0 autocorrelacién de los errores (y obviamente en el caso de ambas) si bien no afecta Ia estimacién de los pardmetros por MCO, sf que esta afectando a la desviacién tipica de los estimadores, Ia cual en general, se infravalora. Los estadisticos del ajuste global del modelo como la R° 0 el estadistico F de significacién conjunta del modelo (esto ¢s, para el conjunto de variables explicativas incluidas en el modelo) se estén sobrevalorando. ‘Como consecuencia, el riesgo de aceptar hipdtesis falsas acerca de la significacién de varios ardmetros es considerablemente mas elevado. Con la presencia de heterocedasticidad o autocorrelacisn, los estimadores minimos cuadrados ordinarios siguen siendo insesgados pero ya no son los estimadores lineales insesgados de minima varianza, pues dicha propiedad de minima varianza corresponde a otro estimador que es también lineal e insesgado, el estimador de minimos cuadrados generalizados Para estimar este modelo de coeficientes constantes con datos longitudinales se aconseja el método de minimos cuadrados generalizados (MCG). Este es sin duda un caso general y no fécil de computar, especialmente cuando se quiere incorporar tanto la correlaci6n a través de las unidades sociales como la correlacién a través del tiempo. Se supone la estructura de ‘comportamiento de los errores siguiente: Varlui) = 05° Covltte, ty] = Oe La varianza del error es diferente para cada agente social / y también puede variar a través del tiempo; la covarianza es ahora distinta de 0 y varia dependiendo de quiénes sean los agentes sociales i y j, y en qué momentos del tiempo Se esté calculando dicha covarianza, tiempos t y s Esto implica introducir un némero de pardmetros distintos que deben ser ahora estimados para obtener el estimador de mfnimos cuadrados generalizados. En el caso de N agentes sociales observados T veces en el tiempo, el mimero de parémetros a estimar es: © MTES Paraninfo 228 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS (NXT X(VXT) +1) 2 En el supuesto de heterocedasticidad y autocorrelaci6n a través de los agentes sociales, y con una muestra de 20 agentes sociales observados en 5 instantes del tiempo, el ntimero de ardmetros desconocidos ser de 5050, y su estimacién es una tarea sin solucién Debido a la imposibilidad de estimar tantos parémetros, es comén imponer alguna tesis sencilla acerea de cual es el comportamiento intertemporal y/o transversal del término de error. A continuacién se presentan los modelos dinémicos més populares en el caso de cestimacién por minimos cuadrados generalizados. En el supuesto de s6lo heterocedasticidad a través de los agentes sociales, se asume que Ja varianza es diferente para cada uno de los agentes sociales de la muestra. Esto es comtin en el caso de datos sobre paises, estados, ciudades, u otras unidades sociales donde existe una gran variacidn de escala. En ese caso el modelo heterocedastico asume: Var{uy] = oF 0 para todo agente i #j, y para todo instante 1 #s Covi, ui La varianza es distinta para cada agente social, pero al mismo tiempo no existe correlaciGn de errores a través de diferentes agentes sociales. De manera que ahora, ademas de los k+1 parémetros para estimar en la ecuacién de regresi6n (esto es, uno por cada variable independiente més la constante), se estiman N covarianzas, una covarianza por cada agente social, ya que el mimero de agentes sociales es N, #=1,2,3,...N. Oitra estructura de error posible més complicada que la anterior es cuando los términos de error estin correlacionados a través de las diferentes unidades sociales (ademés de diferencias cen la varianza de error para cada agente social). En este caso se supone que: Var{us] = oF Covluy, uy] = Covluy, uy] = 0 para todo agente i #), y para todo instante t. En este caso, ademas de los k+1 parimetros para estimar en la ecuaci6n de regresién (esto es, uno por cada variable independiente mas la constante), se estiman NV covarianzas (esto es una covarianza por cada agente social) y ademas N(N-1)/2 covarianzas. En total, se acaban estimando N(N+1)/2 nuevos parémetros. Ademés de las estructuras de error anteriores, se puede asumir que existe correlacién serial, esto es, que para cada unidad social, los términos de errores estén correlacionados a través del tiempo. Se pueden asumir varias estructuras diferentes, sin embargo, se resaltan las estructuras més usuales, Uno de los supuestos més aplicados para especificar Ia estructura del ‘término de error es el autorregresivo de primer orden: Wa = Pia + Ei donde i = 1,...V unidades sociales y = I... observaciones en el tiempo, y donde el término de error es un proceso de ruido blanco. El supuesto describe el término de error como proceso autorregresivo de primer orden, donde el pardmetro de autocorrelacién p, varia para cada agente social i de la muestra. No obstante, se puede suponer que tal correlacién serial es comiin para todos los agentes sociales, es decir, suponer que p:es el mismo para todo i 2246 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES La presencia de autocorrelacién serial en Jos términos de error se puede aproximar, aunque no siempre, con un proceso autorregresivo de primer orden o AR(1). Sin embargo, dada Ia gran distorsién en las desviaciones tipicas de los coeficientes estimados por MCO cuando existe autocorrelacién serial, existen una serie de modelos de maxima verosimilitud, en los que se intenta especificar la naturaleza del proceso autorregresivo y estimar el modelo causal teniendo en cuenta tal proceso autorregresivo. El procedimiento de estos modelos denominados modelos autorregresivos es basico. Primero ajustan un modelo de regresién por MCO y después ‘examinan los errores estimados en la biisqueda de una pauta de autocorrelacién entre ellos. De manera que si u, esta correlacionado con u.; entonces el proceso que mejor describe el comportamiento del error es un autorregresivo de primer orden. Si u, esté correlacionado s6lo con 1,2, €l proceso es un autorregresivo de segundo orden restringido, etc. En general, el proceso autorregresivo puede ser de orden p, donde: Yotiny +E, donde i = 1,...V unidades sociales y 1 = 1... observaciones en el tiempo, y donde & es ruido blanco. Esta ecuacién describe el término de error como un proceso autorregresivo de orden p, donde el parémetro de autocorrelacién entre ts y ts varia segiin cual sea el retardo p entre los errores, ¥ segiin quién sea el agente social i, Una vez identificado el proceso autorregresivo, los modelos autorregresivos incorporan dicho proceso en la estimaci6n (por maxima verosimilitud) del modelo de regresidn de interés. Si el modelo autorregresivo especificado es el correcto, el problema de estimacién asociado con la estimacién por MCO desaparece, con desviaciones tipicas precisas y estadisticos de significacién de variables fiables. Lo cual proporeiona un buen examen de las hipétesis de estudio acerca de la significacién de las variables. 5.3 MODELOS DE PANEL DE EFECTOS FIJOS El conjunto de modelos de coeficientes constantes (revisados anteriormente) supone que los coeficientes son los mismos para cada uno de los agentes sociales en la muestra, y también que son constantes a través del tiempo. Todo ello a pesar de que no se asume necesariamente varianza constante 0 ausencia de correlacién serial. Si bien la simplicidad de tales modelos puede hacer su uso més atractivo, la verdad es que tal supuesto es bastante restrictivo. Supéngase que se dispone de un panel de datos con una dimensién temporal equefia y un mimero elevado de observaciones dentro de cada seccién cruzada, Interesarfa investigar si los coeficientes del modelo, aunque siendo los mismos para todas las unidades sociales (ya sean paises, organizaciones, 0 personas) en un periodo dado, son diferentes para periodos de tiempo diferentes. Alternativamente, en el caso de un panel de datos con la componente temporal dominante, interesaria investigar si los coeficientes de regresi6n son distintos para cada unidad social si bien constantes a través del tiempo. El modelo de efectos fijos parte del supuesto de que los coeficientes (en concreto la constante 0 término independiente del modelo de regresi6n) varfan dependiendo del agente social o del momento en el tiempo. De manera que el modelo de efectos fijos permite investigar Ia variacién intertemporal y/o transversal por medio de distintos términos independientes. Ello es equivalente a tratar las diferencias entre agentes sociales y/o tiempos como si fueran deterministas. © MTES Paraninfow 225 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS En el caso de datos de panel cuya componente transversal es Ia dominante (pocos agentes sociales y muchas observaciones en el tiempo), este modelo puede captar Ia variacién cexistente en la muestra debido a la presencia de diferentes agentes sociales con la inclusién de un conjunto de N-1 variables dicotémicas di cuyos coeficientes asociados en el modelo de regresién son ai (una variable para cada agente social, menos el agente social de referencia). La variable d1_ toma el valor de 1 en el caso de que la observacién se refiera al agente social 1 de la muestra, 0 para el resto de observaciones. En el caso general, la variable di toma el valor Len el caso de que Ia observaci6n se refiera al agente i de la muestra, y es 0 para el resto de observaciones. Con lo cual se puede observar que la inclusién de estos coeficientes ai_en el modelo de regresién estindar est captando asi pues la variacién en la constante 0 del modelo (la cual cambia para cada agente social de la muestra), Se puede hacer lo mismo para el caso de diferencias a través del tiempo. Mediante la inclusién de una setie de variables dicot6micas 1, (con los coeficientes #,asociados a cada una de las 7 variables dicotémicas que toman el valor de 1 para un momento del tiempo, y 0 para el resto). Asi se controla por posibles variaciones en el término independiente a través del tiempo. Para el caso mas general de datos de panel, el modelo de regresién es el siguiente: Y= Bot Dit he donde yj, ¢s una funcién lineal de K variables explicativas (i = 1.....N unidades sociales y t= 1,....P observaciones en el tiempo), pero el término de error tiene la siguiente estructura: My =A +, + Ey donde: Sor de manera que con a; se incorporan una serie de N-1 variables dicotémicas en el modelo de regresién con el fin de controlar por el efecto de cada uno de los agentes sociales en la variable dependiente. Con ®, se introduce una serie de T-1 variables dicotémicas para controlar por el efecto del tiempo, El error u ya no es aleatorio. Tiene un componente individual fijo que es invariable a través del tiempo a; pero varia de unos agentes sociales a otros. También tiene un componente temporal fijo que es invariable a través de los individuos @,, (pero que varfa a través del tiempo). Finalmente, u, tiene un componente £, que es aleatorio. ¢, es el residuo con las propiedades de proceso ruido blanco que se asumen en Ia estimacién por MCO (sigue una distribucién normal con media cero, no correlacionado consigo mismo, homocedistico, esto es, varianza constante, y no correlacionado con las variables x, y ahora también, no correlacionado con los efectos temporales 0 transversales). De manera que el modelo de regresién a estimar es el siguiente: Bot Gy + Olay +... 4 Oy ddy + Oty + Daly toot Ooty + Beds Hy +E, ‘ode manera més simplificada: 2266 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES fo Sad, + 50,4 DB etu th +6 En forma matricial es: Y, +O + BX + Ey Wye donde se captan las diferencias estructurales entre unidades muestrales por medio de las N-1 ‘términos independientes adicionales (desde a; hasta ay, con un término a por cada agente social ‘en Ja muestra), y las diferencias en instantes del tiempo a través de los T-1 términos independientes adicionales (desde ®; hasta ®r , con un término ® diferente para cada momento en el tiempo para el que se tiene observaciones). En Ia préctica, el modelo anterior se estima por minimos cuadrados ordinarios, donde se incluyen ademés de los k pardmetros, N'+7-2 coeficientes junto con el término independiente fi. En este caso fo es el término independiente para el agente social cuyo término a se ha excluido, en el momento del tiempo cuyo término @ se ha excluido, Los pardmetros a; son Jas diferencias entre los términos independientes de cada agente social y fo (en cualquier momento Structure/Resize Current Page (Figura 5-2) y en la pantalla Workfile Structure elegimos Dated Panel como tipo de estructura de datos, la variable empresa como identificador de la seeci6n eruzada del panel y Ja variable T como temporal. El resto de los campos Jos dejamos con sus valores por defect (Figura 5-3). Al pulsar OK ya tenemos el conjunto de datos 5-1.wfl con estructura de datos de panel observéndose las dos nuevas variables identificadoras dateid y dateid01 (Figura 5-4), BY Sraanere Bi SBhathertcerae By Sct bre sat ‘ws aioe etanin teres 16 elles ara Figura 5-1 Figura 52 ea Figura 5-3 - Figura 5-4 ‘Comenzaremos a tarea de andlisis con las representaciones gréficas de las variables del panel mediante Quick — Graph —> Line Graph ¢ introduciendo la variable Log(Coste) en la pantalla Series List. Al pulsar OK se obtiene la pantalla Panel Graph de la Figura 5-5. Si elegimos Stack cross section data se obtiene la grifica de Log(Coste) en todo el panel (Figura 5-6). Repitiendo el proceso para Log(¥) se obtiene la grifiea de la Figura 5-7. Gah Sam nak | f (Pinning ie aaalcn cere | WaprieSitcr’ "| Norte olf Dron Niue mere que Ce Coe Figura 5-5 © MTES Paraninfow 235 EOONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS =a] Figuea 5-7 Si en el Figura 5-5 elegimos Individual cross section graphs se obtiene Ia gréfica de Ja variable Log(Coste) para todas las secciones cruzadas del panel (Figura 5-8). Para el caso de a variable Log(¥) se obtiene la gréfica para todas las secciones cruzadas de la Figura 5-9. . oe oe Oe Z| 4 {~~ \ \ pipetiid \ a seEpithe \ q \f EEEEEE?E \ Ny bEEERE Figura 5-8 Figura 5-9 Si en Ia pantalla Panel Graph elegimos Mean plus SD Bounds se obtiene un grafico de Ia evolucién de las medias de la variable Log(Coste) en las distintas secciones eruzadas con. ‘una franja de confianza de +2(desviaciones tipicas) segiin se ve en la Figura 5-11, Para la variable Log(¥) se obtiene la Figura 5-12. Msorcsem sate Ea S {+——— (=) pa Figura 5-10 Figura 5-11 2966 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES cand Figura 5 Figura 5-13 Si queremos hacer contrastes de igualdad de medias o varianzas de Log(¥) en las distintas secciones cruzadas, basta seleccionar View —» Tests for Descriptive Stats > Equality Tests by Classification (Figura 5-13), En la pantalla Tests By Classification se elige Ia variable cuya igualdad de medias, medianas 0 varianzas en las distintas secciones cruzadas del panel se contrasta. En la Figura 5-14 se ha elegido contrastar medias y en la Figura 5-15 se ha elegido ccontrastar varianzas para Log(¥). Las Figuras 5-16 y 5-17 muestran los resultados, observandose ‘que se rechaza la igualdad de medias y la igualdad de varianzas (p-valores menores que 0,05). Lo mismo ocurre para la variable Log(Coste) segéin los resultados de las Figuras 5-18 y 5-19. See ny Nae [Losey Di Treat HAs as category Ci Treat bis as category ee femereet Tacaay Cusp tobe sie totvanes> [160] | Siveon Brot vaes> [ico] $ asp cues [2 Olen avg coum (2 Ovsiance Mavis: [5] |] Watered Maxttofbine [5] x (ad) Figura 5-14 Figura 5-15 e) a Figura 5-16 Se. be ea eae TET Figura 1? © MTES Paraninfo« 237 EOONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS ea Saat Aviom wy EStgusecby vat ont SetCosTE) pate oas20 Tera 2228 re Nverton. 24 Categoteeg oy ues 8 OSCOSTE) fae teeac! Time 2238 el ove Peat ad vane Probeoiiy eT iy S3esm7 Come [aca vanes 19) tones ote Daim «(TE Sone ean Abe Haar Dane ema sie on Mises oe oon ea LL) Feasun se 5965 Suie 1n27s) woes Bees ers | a5 ss | te cones nose Se StS Barer a Faso _ tee 7 ‘610 oat 2 Geko Hele Foran |[Pacnmnigaed mand seamen 971 Figura 5-18 Figura 5-19 Una vez realizado el andlisis grafico y descriptive de las variables del panel se procede a su estimacién consideréndolo inicialmente como un panel de coeficientes constantes. Para ello se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 5-20), se rellena la solapa Panel Options como se indica en la Figura 5-21 (sin especificacién de efectos ni ponderaciones) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 5-22. Figura 5-24 oo . : one nd 8 mes [Bo OHO 2B 7 so end tne 24 EN si | canes ° canton eee Seta Tt. 2986 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Los resultados del ajuste del panel de la Figura 5-22 muestran una significatividad individual y conjunta de los coeficientes estimados muy alta y un coeficiente de determinacién ‘muy bueno. El mayor problema es el estadistico de Durbin Watson, que es muy bajo. Para probar si hay heteroscedasticiad entre secciones cruzadas, hacemos doble clic sobre la variable RESID y elegimos View — Tests for Descriptive Stats > Equality Tests by Classification (Figura 5-23). En la pantalla Tests By Classification (Figura 5-24) se elige la variable cuya igualdad de varianzas en las distintas secciones cruzadas del panel se contrasta (RESID). La Figura 5-25 muestra los resultados, observandose que se acepla la igualdad de varianzas residual en las distintas secciones cruzadas (p-valor mayor que 0,05). No existe entonces heteroscedasticidad entre secciones cruzadas, Le 2 E.. af EF fe ost —— eee aay oahu Ese. itesan bi Otmer ket vaiees 00 ee io = eos = as Figura 5-24 El panel de coeficientes constantes estimado seria el siguiente: LOG(COSTE), = -4.174783135 + 0.8879868182*LOG(Y) 1 + His El problema de la autocorrelacién podrfa intentar resolverse con la introduceién de una estructura AR(1) en los residuos, haciendo clic en Estimate y rellenado el campo Equation Specification de 1a solapa Specification como se indica en Ia Figura 5-26. Al hacer clic en Aceptar se obtienen los resultados de la Figura 5-27 donde se ve ya un estadistico de Durbin Watson muy préximo a 2, buena significatividad individual y conjunta y buen R® PeclrsLors franco lemenbesordose Pest ‘SeTe ot operon he oat ‘Sale edt 24 re Sait ee ae Ca Ca Be © MTES Paraninfo 239 EOONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS EI panel de coeficientes constantes estimado sin autocorrelacién seria el siguiente: LOG(COSTE), 011706 + 0,973382*LOG(Y) « + Ha Ha = 0547739 p1ir1 + El modelo general de efectos fijos presenta los residuos u, =a, +9, + €, siendo &, variable aleatoria y a, (efectos de seccién cruzada) y ¢, (efectos de tiempo) deterministas, Vamos a estimar el panel con efectos fijos de secciones cruzadas (efectos de empresa), Para ello se elige Quick — Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 5-28), se rellena la solapa Panel Options como se indica en la Figura 5-29 (se especifican efectos fijos de seccién cruzada) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 5-30 donde se ve un estadistico de Durbin Watson razonable, buena significatividad individual y conjunta y buen R®. Si queremos ver las estimaciones de los efectos fijos (Figura 5-32), basta con elegir View ~ Fixed/Random Effects > Cross Section Effects (Figura 5-31). Para probar si los efectos fiios de las empresas pueden 0 no considerarse iguales utilizamos el test de méxima verosimilitud para la redundancia de los efectos fijos eligiendo View — Fixed/Random Effects Testing—> Redundant Fixed Effects-Likelihood Ratio (Figura 5-33). Se observan p-valores menores que 0,01 (Figura 5-34), lo que nos Meva a afirmar que los efectos fijos de las ‘empresas son diferentes con un 99% de confianza al menos. Satter Figura 5-28 Figura 5-29 aap Gated cero: 2 Figura 5-30 Figura 5-31 240 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES [Cross-section Fixed Fffects EMPRESA [Effect | EMPRESA | Effect |_| EMPRESA! | -0.294518 — a EMPRESA? | 0512722 | <|| i $= EMPRESAS | -0.040948 IEMPRESAs | 0.264521 EMPRESAS 0.088170 EMPRESA 0.495497 « Figura 5-34 Segiin los resultados de las Figuras 5-30 y 5-32, la ecuacién del modelo de efectos fijos de empresas ajustado es la siguiente: LOG(COSTE)y = -2.39 + 0.67 LOG(Y)«~ 0,29 d = 0,51 dy -0,04 ds 40,26 ds + 0,08 ds + 0,49 d+ & (d,= 1 para observaciones de la empresa iy vale dj = 0 en caso contrario) Vamos a estimar el panel con efectos fijos de tiempo. Para ello se elige Quick —» Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados Figura 5-28), se rellena la solapa Panel Options como se indica en la Figura 5-35 (se especifican «efectos fijos de tiempo) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 5-36 donde se ve un estadistico de Durbin Watson muy bajo, buena significatividad individual y conjunta y buen R°. Si queremos ver las estimaciones de los efectos fijos de tiempo (Figura 5-38), basta con elegit View — Fixed/Random Effects — Period Effects (Figura 5-37) swap ome Figura 5-35 Figara 5-36 © MTES-Paraninfo 241 EOONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS bp Petodtieatmocts | ee DATEOOT | efee a 1 | Ooms 2 | oossore 3 omeess Bite thane Pm a Figura 5-38 Para probar si los efectos fijos de tiempo pueden o no considerase iguales utilizamos el test de maxima verosimilitud para a redundancia de los efectos fijos eligiendo View — Fixed/Random Effects Testing» Redundant Fixed Effects-Likelihood Ratio (Figura 5-39). Se ‘observan p-valores mayores que 0,05 (Figura 5-40), lo que nos leva a afirmar que los efectos fijos de tiempo son iguales con un 95% de confianza, luego se prescinde de su estimacién, ae D — < Gis) ose — cee eee || Prd Chisqune 3 bases ied fad foci tet natn: Sem ae COSTE 2 Dee O30! Tre 1731 Siueg Aciememe acme || Stet ‘we aeton ela 6 “een anced ebro 24 Figura 5-40 El modelo general de efectos aleatorios presenta los residuos u, =0, +4, +, siendo todas las componentes variables aleatorias (en efectos fijos a, y 9, eran deterministas), Pero habitualmente en efectos aleatorios suele prescindirse de los efectos temporales, teniendo sélo en cuenta a alos que se denomina efectos individuales. A continuaci6n estimamos el panel con efectos aleatorios. Para ello se elige Quick Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de Ia solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos ‘cuadrados (Figura 5-41), se rellena la solapa Panel Options como se indica en Ia Figura 5-42 (se especifican efectos aleatorios de seccién cruzada) y se hace clic en Acepiar. Se obtienen los resultados de la Figura 5-43 donde se ve un estadistico de Durbin Watson bajo, buena significatividad individual y conjunta y buen R. 2426 ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Para ver si el modelo de efectos aleatorios es adecuado utilicaremos el test de Hausman ligiendo View —> Fixed/Random Effects Testing—» Correlated Ramdom Effects-Hausman Test (Figura 5-44), Se observa un p-valor menor que 0,05 (Figura 5-45), lo que nos leva a afirmar que Ia hipétesis de que los efectos individuales estin incorrelacionados con Log(Y) debe de ser modelo de efectos aleatorios no es adecuado, rechazada. Por lo tanto el fon ete eel Ss Figura 5-41 tose aroma [woo Far BSUS Gace ccm arson Sous “Taree iieevese une Siac Baxte ata) Siimndnea 37a faamacenn ase |LPeremce) Som ON Figura 5-43 Figura 5-44 ite Fi Raion Vn) _ Pb wer Owain arena _coNGe Ouse Figura 5-45 © MTES Paraninfow 243 EOONOMETRIA. CONCEPTS Y PROBLEMAS RESUELTOS Mediante View —» Residual Tests —> Histogram-Normality Test se observa que el p-valor del contraste de normalidad de Jarque Bera es superior a 0,05 (Figura 5-46), lo que indica residuos normales con una confianza del 95%. La Figura 5-47 presenta los residuos estimados. ve esl) beefalo ented xeloabess) ERPeeeR een t —— ee ae ne an beet 4 538! ea —— pw Hemos Ilegado a la conclusién de que el mejor ajuste para nuestro panel es el que considera efectos fijos de seccién cruzada, es decir efectos fijos de empresa, Ya habjamos visto que este ajuste viene dado por la ecuacién: LOG(COSTE), 2.39 + 0.67 LOG(Y),~ 0,29 dy ~ 0.51 dy -0,04 d3 +0,26 ds + 008 ds +0,49 de 6 i, = | para observaciones de la empresa i y vale d) = 0 en caso contratio) ®5.2. Consideramos el archivo 5-2.w/1 que contiene informacién sobre 10 paises de la OCDE en los afios 1960, 1970, 1980 y 1990. Se trata de ajustar con estos datos un modelo de panel que ‘explique la esperanza de vida (Ev) en funcién del Producto Nacional Bruto (PNB), el gasto social (GastoS) y la protecién social (Cobertur). Comparar los resultados de los ajustes con coeficientes constantes, efectos fijos por pats y efectos aleatorios. Realizar un ajuste con efectos aleatorios robusto a la heteroscedast Ia autocorrelacién SOLUCION: Se trata de ajustar el modelo de datos de panel siguiente: 1, Ev, = + fi PNB, + fz GastoS, + fy Cobertur, i= 1,10 t= 1960, 1970, 1980, 1990 Comenzamos dotando al conjunto de datos 5-2.wfl de estructura de datos de panel. Para ello elegimos Proc — Structure/Resize Current Page (Figura 5-48) y en la pantalla Workfile Structure elegimos Dated Panel como tipo de estructura de datos, la variable PAIS ‘como identificador de la seceién eruzada del panel y la variable ANO como temporal. El resto de los campos los dejamos con sus valores por defecto (Figura 5-49). Al pulsar OK ya tenemos el conjunto de datos 5-2.wfl con estructura de datos de panel observindose las dos nuevas variables identificadoras dateid y dateid01 (Figura 5-50). 2446 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Ie ae 2a tre sa ae 2 Coal Stace la wae Benson a ent Opeibecisas™ Cx Gal 2 cant LTE, Figura 5-48 Figura 5-49 Para estimar un panel de coeficientes constantes con nuestro datos, se elige Quick > Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por mfnimos cuadrados (Figura 5-50), se rellena la solapa Panel Options como se indica en la Figura 5-51 (sin especificacién de efectos ni ponderaciones) y se hace clic en Aceptar. Se obtienen los resultados de 1a Figura 5-52 donde se ve un estadistico de Durbin Watson razonable, buena significatividad individual (salvo GastoS con un 70%) y conjunta y buen R”, Mediante View —» Residual Test Histogram-Normality Test se observa que el p-valor del contraste de normalidad de Jarque Bera es superior a 0,05 (Figura 5-53), lo que indica residuos normales con una confianza del 95%. TT sho sal P| Seem || | chet Powel Sts boss doowe Siro Petrie) Figura 5-52 Figura 5-53 © MTES Paraninfow 245 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS EI modelo estimado con coeficientes constantes resulta ser el siguiente: Ey = 68.58208682 + 0.4612987749PNB - 1.720625774GastoS + 0.03083266217Cobertur + u Vamos a estimar el panel con efectos fijos de secciones erucadas (Pais). Para ello se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method ara ajustar por minimos cuadrados (Figura 5-54), se rellena la solapa Panel Options como se indica en la Figura (se especifican efectos jos de seccién cruzada) y se hace clic en Aceptar. Se obtienen los resultados de 1a Figura 5-56 donde se ve un estadistico de Durbin Watson razonable, buena significatividad individual (salvo GastoS con poco més de un 10%) y conjunta y buen R?, Si queremos ver las estimaciones de los efectos fijos (Figura 5-58), basta con elegir View —> Fixed/Random Effects —» Cross Section Effects Figura 5-57). Para probar si los efectos fijos de Pats pueden 0 no considerarse iguales utilizamos el test de méxima verosimilitud para Ia redundancia de los efectos fijos eligiendo View — Fixed/Random Effects Testing» Redundant Fixed Effects-Likelihood Ratio (Figura 5-59). Se observan p-valores menores que 0,01 (Figura 5-60), lo que nos lleva a afirmar que los efectos fijos de las empresas son diferentes con un 99% de confianza al menos. = ei oe a Figura 5-54 bie eat ee odie “2B tat 2466 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Sree ee Peele) Pespenleers] emvvlerent oases [—_Coss-sactionFiveaeifecis «|| meme tralia | 1.158780 Sector Paustis ATISTSS rene ne 40 Blaica 0731522 fe Serr 1S Pr anada S366 oro CE ynamarea | 0.094698 — pee EE UU 30s2164 Espaia 4.167740 ino Un =1 198473 seca 604342 ize 0.150107 EEE ES Tas Tigura 5-58 Figura 5-60 Segtin los resultados de las Figuras 5-56 y 5-58, la ecuacién del modelo de efectos fijos de empresas ajustado es la siguiente: Evy = 65,07 + 0,32 PNB; - 0,21 GastoSy + 0,07 Cobertury— 1,15 di ~ 1,77 do -0,79 ds +0,035 dy~ 0,094 ds + 3,03 da + 1,18 dy— 1,19 ds +0.6 dy + 0.15 dio + @ para observaciones del pais i y vale d; = 0 en caso contrario) Se observa que los mayores efectos fijos los presentan Estados Unidos, Espaiia y Suiza, lo que indica que en estos paises las variables independientes afectan en mayor cuantia ala variable dependiente. A continuacién estimamos el panel con efectos aleatorios. Para ello se elige Quick — Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de Ia solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos ‘cuadrados (Figura 5-61), se rellena la solapa Panel Options como se indica en Ia Figura 5-62 (se especifican efectos aleatorios de seccién cruzada) y se hace clic en Acepiar. Se obtienen los resultados de la Figura 5-63 donde se ve un estadistico de Durbin Watson adecuado, buena significatividad individual (salvo GastoS con poco més del 40%) y conjunta y buen R° Para ver si el modelo de efectos aleatorios es adecuado utilicaremos el test de Hausman ligiendo View —> Fixed/Random Effects Testing—» Correlated Ramdom Effects-Hausman Test (Figura 5-64), Se observa un p-valor menor que 0,05 (Figura 5-65), lo que nos leva a afirmar que Ia hipotesis de que los efectos individuales estén incorrelacionados con las variables explicativas debe de ser rechazada al 95%, pero no al 90% ya que el p-valor no es menor que 0,01. Por lo tanto cel modelo de efectos aleatorios es 0 no adecuado segtin el nivel de confianza que se exija. © MTES Paraninfo® 247 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS ‘Seatac Maina ee) Figura 5-61 Depeea vara fs ert ets cxeseinseton tc) Samet 122 [ota panel sane) ceenations 40 Vara Coateat OW Ere fee Pa CeeRineousis done Setar _ Gam Wagied Sates |Goescmaen ——~SC*~*~*« EO Ramawes D7BI6I9 wean depndetvor aa aoe |] NS ———— [SE'ctogenen (O2s Suysquediond 10 — fpcopcrcnne) dona MON POS aged Coen So aalnc’ Seam Figura 5-63 Figura 5-64 oom ili Pere fone oe oto Yaiebe Fed Pardon Vai) _ Pew castes i Syeua Greinte ose Figura 5-65 Mediante View —> Residual Test + Histogram-Normality Test se observa que el p-valor del contraste de normalidad de Jarque Bera es superior a 0,05 (Figura 5-66), lo que indica residuos ‘normales con una confianza del 95%. La Figura 5-67 presenta los residuos estimados. 2486 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES CSL pee BI ella en) meer En) fees ame eal eocrame Rackets + ea D7enne? eer Figura 5-66 Figura 5-67 En todos los ajustes que hemos realizado venimos arrastrando la poca significatividad de la variable GastoS. Ello puede ser debido a la presencia de algin problema de heteroscedasticidad 0 autocorrelacién tanto de seccién cruzada como temporal Para probar si hay heteroscedasticidad entre secciones eruzadas, hacemos doble clic sobre la variable RESID y elegimos View —» Tests for Descriptive Stats > Equality Tests by Classification. En la pantalla Tests By Classification (Figura 5-68) se elige la variable cuya igualdad de varianzas en las distintas secciones cruzadas del panel se contrasta (RESID). La Figura 5-69 muestra los resultados, observéndose que hay disparidad de criterios para aceptar la igualdad de varianzas residual en las distintas secciones eruzadas (p-valores mayores y menores que 0,05 segiin el método), Puede existir entonces heteroscedasticidad entre secciones eruzadas. tens sa Seniinctadint hry roof 63 tau tase ro Gieediewcaer Oe Stdrmmo (me —]||| | waa evans 8 Semen 7 |] sean | _toat pi “ei one ne pave Same Be = caer a es 3 eae Figura 5-68 Figura 5-69 Ante las dudas sobre los problemas de heteroscedasticidad de secciones cruzadas, serfa I6gico utilizar un método de estimacién para el panel robusto a heteroscedasticidad y autocorrelacion, por ejemplo el método de los coeficientes de covarianza de White para secciones eruzadas. © MTES-Paraninfos 249 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Para realizar Ia estimacién del panel de efectos aleatorios mediante el método de los coeficientes de covarianza de White para secciones cruzadas, se elige Quick —> Estimate :quation, se escribe Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 5-70), se rellena la solapa Panel Options como se indica en la Figura 5-71 (se especifican ‘efectos aleatorios de seccién eruzada y coeficientes de covarianza de White de seccién eruzada) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 5-72 donde se ve un estadistico de Durbin Watson adecuado, buena significatividad individual (ahora GastoS es significativa casi al 90%) y conjunta y buen R*. En la Figura 5-71 se ven otros métodos robustos de estimacién. guna tet 2 ee eer Figura 5-70 Figura 5-71 (Depanaen Vai EY lta Panel EGLS (rss actin random eis) Jose nae Tw 1220 Semple 1 32 [Cosecians meus 10 etal cane (vances) cherticns: Seay ard srr iso corporat varnces [wie casei saad no's coaece ( cavetad) vara rot Sd Ever State ra © esr 1am7s) ase Comm Pie Uwe Lure) Baas Lo games Smee bien tAaee ced coseRTUR 004319 dooms Ae91's ConoD ree sc on anda 08% | O35 lssyrerte nto Dee! Uses ‘Waghiet Seles O7EI510 Nan doranlevar—_(aawat 76238 SD cepardenvar 2 12ND IS olmgersion 1.00234 Samaqure wed 3840012 stain (COG Dumb Wnsonsid 3 reuessusiny 0.000300 Figura 5-72 EI modelo estimado con efectos aleatorios y robusto a problemas de autocorrelacién y heteroscedasticidad de seccién cruzada es el siguiente: Evy = 67.79 + 0.39PNBy - 0.79GastoSy + 0.041 Cobertury + uy Se observa que los diferentes ajustes obtenidos difieren muy poco en Ia estimacién de Jos parémetros y no varian el signo de los mismos, 2506 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES 5.3. Se pretende evaluar el efecto de un programa de formacién sobre Ia productividad de los trabajadores de las empresas manufactureras. Se considera como variable explicativa el logaritmo de las subvenciones recibidas por las empresas para formacién (grant) y como variable explicada cel mimero de articulos de cada 100 producidos que se desechan por defectuosos (scrap). El archivo 5-3.wf1 almacena datos de 54 empresas para 1987, 1988 y 1989 (variable year) cuyos cédigos se recogen en la variable feode. Las ayudas a la formacién se concedieron en 1988 y 1989 y las ‘empresas sélo las podian recibir una vez, Por ello es necesario considerar que Ia formacién de 1988 hizo més productivos a los trabajadores en 1989. Realizar un ajuste mediante datos de panel para cexplicar la productividad en funcién de las subvenciones, SOLUCION: Consideramos las variables explicativas ficticias d88 y d89 que recogen el aio fen que se recibieron las ayudas a la formacién (valen 1 para observaciones del aio correspondiente y 0 para el resto de observaciones). Ademés, como Ia formacién de 1988 hizo més productivos a los trabajadores en 1989, se considera en el modelo un desfase de Ia grant (grant_1), por lo tanto estamos ante un modelo de panel dindmico. Se trata entonces de ajustar el modelo de datos de panel siguiente: Log(scrap)y = + By d88;+ B> 89, + Bi Grant, + By Grant_ly . 54 1= 1987, 1988, 1989 Comenzamos dotando al conjunto de datos 5-3.wfl de estructura de datos de panel. Para ello elegimos Proc — Structure/Resize Current Page (Figura 5-73) y en la pantalla Workfile Structure elegimos Dated Panel como tipo de estructura de datos, a variable FCODE como identificador de la seccién eruzada del panel y la variable YEAR como temporal. El resto de los campos los dejamos con sus valores por defecto (Figura 5-74). Al pulsar OK ya tenemos el conjunto de datos 5-3.w/1 con estructura de datos de panel. Stade tae far etre tessa tds Figura 5-73 Figura 5-74 ‘Como nuestro modelo presenta dindmica sélo en la variable explicativa grant (un desfase suyo grant_I), podemos aplicar los métodos de ajuste habituales en paneles. Inicialmente estimamos el panel con efectos aleatorios. Para ello se elige Quick —> Estimate Equation, se escribe la ecuaci6n del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 5-75), se rellena la solapa Panel Options como se indica en la Figura 5-76 (se especifican efectos aleatorios de seccién cruzada) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 5-77 donde se ve un estadistico de Durbin Watson bueno, buena significatividad individual (salvo d88 y quizas grant) y conjunta y buen R”. © MTES-Paraninfo 251 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Cees] Lome] Figura 5-76 Para ver si el modelo de efectos aleatorios es adecuado utilicaremos el test de Hausman cligiendo View — Fixed/Random Effects Testing—> Correlated Ramdom Effects-Hausman Test (Figura 5-78). Se observa un p-valor mayor que 0.05 (Figura 5-79), Io que nos leva a afirmar que Ia hipstesis de que los efectos individuales estén incorrelacionados con las variables explicativas debe de ser aceptada al 95%. Por lo tanto el modelo de efectos aleatorios es adecuado. ‘ersurney Che) Sulane SvSR at un Fea Su) Ph Ee eer oe aaRe ome gam ae Ts Sct gis, 3B Figura 5-78 252 6© ITES-Paraninto MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES La estimacién del modelo de efectos aleatorios seria la siguiente: Log(Scrap) = 0.597 - 0.09388 - 0.271489 - 0.214Grant - 0.372Grant_l + u Se observa que el valor desfasado de Grant tiene mayor efecto que el contempordneo. A continuacién vamos a estimar ef panel con efectos fijos de secciones cruzadas (Empresa). Para ello se elige Quick —> Estimate Equation, se eseribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige Least Squares en el ‘campo Method para ajustar por minimos cuadrados, se rellena la solapa Panel Options como se indica en la Figura 5-80 (se especifican efectos fijos de seccién cruzada) y se hace clic en Aceptar. Se obtienen los resultados de Ia Figura 5-81 donde se ve un estadistico de Durbin Watson razonable, buena significatividad individual (salvo 488) y conjunta y buen K°. Si queremos ver las, estimaciones de los efectos fijos (Figura 5-83), basta con elegir View — Fixed/Random Effects Cross Section Effects (Figura 5-82). Para probar si los efectos fijos de Pats pueden 0 no considerarse iguales utilizamos el test de méxima verosimilitud para la redundancia de los efectos fijos eligiendo View — Fixed/Random Effects Testing—» Redundant Fixed Effects-Likelihood Ratio (Figura 5-84). Se observan p-valores menores que 0,01 (Figura 5-85), lo que nos leva a afirmar «que los efectos fijos de las empresas son diferentes con un 99% de confianza al menos. Se ee = TET ‘pee Pol Oe rote mati see: [ote os ose a Figura 5-32 Figura 5-89 © MTES-Paraninfow 253 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS so. anorskavobrex) peecen esrb) Eom Ure Samer, Ze, Sm ome Di O204c) Teme 108k "apne eee) eens 162 Aaticsh agus Goer emi one ios ee & ime ig Bee ES ED ihe i Figura 5-84 Figura 5-85 El modelo de efectos fijos estimado seré el siguiente: Log(Scrap y = 0.597 - 0.08a88, - 0.247489, - 0.252Granty- 0.421Grant_ly + efi + uy Las estimaciones son muy similares al caso de efectos aleatorios, con la diferencia de ‘que ahora la variable grant tiene mayor efecto tanto contempordneo como desfasado. Por siltimo, estimamos el modelo de efectos fijos mediante un método robusto a la heteroscedasticidad entre secciones cruzadas (cross section weights). Para ello rellenamos Ia solapa, Panel Options como se indica en la Figura 5-86 eligiendo Cross section weights en el campo GLS Weights (si se hubiese elegido Cross section SUR el ajuste del panel seria robusto a la autocorrelacién de secciones cruzadas, y la robustez para heteroscedasticidad y autocorrelacién ‘temporales se obtiene con las opciones Period weigths y Period SUR). Al pulsar Aceptar se obtiene el ajuste de efectos fijos robusto a la heteroscedasticidad mostrado en la Figura 5-87. Se ‘observa un aumento fuerte de las significatividades, El modelo estimado es muy similar al anterior: Log(Scrap) = 0.576 - 0.076 d88 - 0.197d89 - 0.256Grant - 0.391Grant_l + ef; + uy swede GanantanediW Siue 3ee (gheoniner ene Som non Pept a Ee Figura 5-86 Figura 5-87 2546 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Se observa que los diferentes ajustes obtenidos difieren muy poco en Ia estimacién de Jos pardémetros y no varian el signo de los mismos, 5.4, Se dispone de informacién de las empresas de 22 ciudades (variable city) en las cuales se computa cl nivel de desempleo (variable luclms) y su pertenencia © no a zona empresarial (variable ec) durante los afios de 1980 a 1988 (variable year). Con estos datos recogidos en el archivo 5-4.w/l se pretende explicar el desempleo en funcién del nivel de desempleo en el perfodo anterior y de la pertenencia 0 no de las empresas a una zona empresarial. Realizar un ajuste mediante datos de panel con efectos fijos temporales, SOLUCION: Se trata de ajustar el modelo de datos de panel siguiente: Luclmsy = r+ fj Luctmsis1 + Bo ein + + My 22 1 = 1980,...., 1988 Comenzamos dotando al conjunto de datos 5-4.wfl de estructura de datos de panel. Para ello elegimos Proc — Structure/Resize Current Page (Figura 5-88) y en la pantalla Workfile Structure elegimos Dated Pane! como tipo de estructura de datos, Ia variable CITY ‘como identificador de la secci6n cruzada del panel y la variable YEAR como temporal. El resto de los campos los dejamos con sus valores por defecto (Figura 5-89). Al pulsar OK ya ‘tenemos el conjunto de datos 5-4.wl con estructura de datos de panel. Bese ‘Suidee Ge BS —_ a fo sisal ‘Demaneton| CTY CBee | — ome abs iveealateaares eR Os Coma Figura 5-88 Figura 5-89 Dado que se trata de un panel dinémico con la variable explicada desfasada, utilizaremos variables instrumentales y el método de minimos cuadrados en dos etapas para la estimacién del panel, Para estimar el panel de efectos fijos utilizaremos las variables en diferencias con la finalidad de eliminar los efectos fijos. Ademés, utilizaremos la variable Jucims(-2) como instrumento de luclms(-1), A continuacién vamos a estimar el panel con efectos fijos temporales. Para ello se elige Quick —> Estimate Equation, se escribe Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige TSLS-Two Stage Least Squares (ISLS and AR) en el ‘campo Method para ajustar por minimos cuadrados en dos etapas (Figura 5-90), se rellena la solapa Pane! Options como se indica en la Figura 5-91 (se especifican efectos fijos temporales), se rellena la pantalla Instruments como se indica en la Figura 5-92 y se hace clic en Aceprar. Se obtienen los. reulads de a Fgura 5-93 donde el mayor problema el sigifeavidd de la varaheendgena retardada y bajo R’. Si queremos ver las estimaciones de los efectos fijos (Figura 5-95), basta con legit View — Fixed/Random Effects — Period Effects (Figura 5-94) © MTES Paraninfow 255 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Satara tatiana ocssen te (ees eee — — 2 see sso toma hectare as Sou aT Coe) (oe oan Figura 5-90 Figura 5-91 pa aed Wate Part Tse a ae =|] Sate et i puctuscry Seam Late gr Brad wean) SC Rowan aoe D(Luclms;) 2566 © ITES-Paraino 1984.01.01 1985.01.01 1986.01.01 1987-01-01 1388.01-01 Cee i ee =I) 0.081174 0.052943, Figuca 5-94 Figura 5-95 El ajuste de efectos fijos temporales estimado es el siguiente: 0,201 + 0,164D(Luclms;,.:) — 0,218 D(ezs) ~ 0,228 0.17714 0,06115 - 0,092t6 + my, (1,= 1 para las observaciones del afio iy 1,= 0 en caso 1 - 0.068%) + 0,27315+ ccontrario) MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Vamos a estimar ahora el panel dindmico anterior utilizando el método generalizado de los momentos GMM siguiendo la metodologia de Arellano y Bond. Para ello, en la solapa Specification de la pantalla Equation Estimation elegimos como método de estimacién GMM/DED -Generalizad Method of Moments / Dinamic Panel data (Figura 5-96). A continuacién hacemos clic en el botén Dynamic Panel Wizard de la parte inferior izquierda de la Figura 5-96. Aparece el Asistente para Modelos de Datos de Panel de la Figura 5-97. Haciendo clic en Siguiente sucesivas veces, se van rellenando las pantallas como se indica en las Figuras 5-98 a 5-103. Al hacer clic en Finalizar en la Figura 5-104 se obtiene la Figura 5-105 que presenta el ajuste equivalente sin utilizar asistente (haciendo clic en sus diferentes solapas se ‘observan los distintos campos rellenos). Al hacer clic en Aceptar se obtiene el modelo estimado por el método GMM con la metodologia de Arellano y Bond. Mediante View —> Representations obtenemos la ecuaci6n final del modelo ajustado (Figura 5-106), ae) Cs) (=) Figura 5-96 Cteiget etre Eitemronreresaeee Coe ee) Cee Figura 5-100 © ITES-Paraninfo« 257 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Stop nr Sa een nd: e | Om sa ii meio sn eR SSE eee ene Figura 5 102 Figura 5 103 Ee) Gee) Coes) Figura 5-104 Figura 5-105 ae tou Tene 22 sma ty ae ues 2 ed ened 15 ead retune iptn [cotr0 rerce cowPeRwnTe GMN=PeRWHITE ER=ONES tec er ce [eveLPeR) wCLNS LucuMS) EZ QOYNLUCLMS,2 EZ eiNa)= oryet 9 + caN@OADIED [Peapaiseenost ia) - curaisretobc ae) ree) fessrenaoc ser) + ceyaisPencor ses) +cr) [rssPer0c 165) + CAYISPERICOC SET) +O) pessrennoctaes) xosieed Conicies Joo-cunucuns)=0 2941622281 goAniaucLN1) f ztosaaa2epdaDuen + 05:05 oscar DISPERIOOC 192) a sasatzostisPert00 195 - 02007200 QISPERIOD ay § | fie So tasenenecrencaciees oasrreare eae Fasetivoor er) <0 estar SPER try wes [2429642085 eRISPERIOO( 1956") scans CT? em seer 3 SER Sistas Ghee SS’ SS Figura 5-106 Figura 5-107 El ajuste es ahora el siguiente: Luclmsy = 0,294Luclms;, ~ 0.218 ey + Efectos + we Se observa que no es muy diferente del anterior, pero la significatividad de los coeficientes ha aumentado, 2586 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES 5.5. El archivo 5-5.wfl contiene combinaciones de secciones cruzadas de datos para los afios pares de 1972 a 1984 referidos a mujeres de 35 0 més afios sobre el mimero de hijos (kids) y otras caracteristicas socioecondmicas como la educacidn (educ), la edad (age), la raza (black), la region de residencia a los 16 afios (east, northcen, west, south) y el entorno de residencia a los 16 aos (farm, orthrural, town, smcity, largecity). Con estos datos se trata de realizar un estudio de Ia ‘evolucién de Ia fertilidad femenina en el tiempo y controlar la fertilidad por nivel educativo, edad y raza. Ademés se desea contrastar si la fertlidad afecta al entorno de residencia y a la regién de residencia. ;La influencia del nivel educativo en la fertilidad ha cambiado en el tiempo? SOLUCION: Como hay que realizar un estudio de Ia evolucién de Ia fertilidad femenina en el tiempo, lo ldgico es introducir una variable ficticia en el modelo relativa a cada afio de las ‘combinaciones de secciones cruzadas (se excluye 1972 que se considera como afio base para evitar la trampa de las variables ficticias). Asimismo se necesita controlar la fertilidad por nivel educativo, edad y raza, lo que nos leva a introducir en el modelo las variables edu, age, age? y black También se necesita controlar la fertilidad segtin la regién de residencia a los 16 aiios, lo que nos eva a introducir en el modelo las variables ficticias east, northcen y west (south se considera como ‘base y no se introduce para evitar la trampa de las variables ficticias). Por tiltimo se necesita control de fertilidad segin entorno de residencia a los 16 afios, por lo que consideraremos las variables ficticias farm, othrural, town y smcity (largecity se considera como base y no se introduce para evitar Jatrampa de las variables ficticias). El modelo a ajustar seré entonces el siguiente: kids = f+ 6,y74+ 5,y76+ 5,y78 + 5,y80+ 5,y82 + dy84+ + fledue + Page + Bage* + black + east + ynorthcen + Bywest + + Aifarm+ Bothrural + Bgtown+ B,smeity + € Para realizar el ajuste por MCO se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification teniendo en cuenta la estructura ARIMA previamente identificada, se elige LS - Least Squares (NLS and ARIMA) en el campo Method (Figura 5-108) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 5-109. El modelo presenta buena significatividad individual y conjunta de los pardmetros estimados, altos coeficientes de determinacién y un estadistico de Durbin Watson casi igual a 2. Luego la diagnosis del ajuste es correcta Spe Oc eet ay pg, Skate nepenserkt ine 2570 Oe Fe Pp pa eo ett e aise Siam ae it 5 ar DE i a Gee) Cees) ahs te Figura 5-108 Figura 5-109 © ITES-Paraninfo« 259 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS ‘Como estamos trabajando con combinaciones de secciones cruzadas, es necesario contrastar Iaheteroscedasticidad. Para ello utilizamos el contraste de White mediante View —» Residual Test —> White Heteroskedasticity (Figura 5-110) cuyos p-valores de la F y la Chi-cuadrado son menores que 0,05, lo que indica presencia de heteroscedasticidad al 95% (Figura 5-111). Para estimar el modelo sin heteroscedasticidad rellenamos el campo LS and TLS Options de la solapa Options de la pantalla Equation Estimation segiin se indica en la Figura 5-112. Al pulsar Aceptar se obtiene Ia estimacién del modelo sin heteroscedasticidad de la Figura 5-113. E SET SEO RES || Doeeee vate RESO Coen 8a Ere em ne See aa O2Wes Gree 1a es eee | O37 tire 2396 Desise Deb BeSE60 Sctwac creer” 3.bEz7 Figure 5-110 a ~ Figaca 5-202 ne eS Dieters | | Mates ‘Saree Glows Gace ris Oot commen 5] cease yuan tae Oterret (iia Sree cone tom tom Comoe, ome Sonia jeeus Game oan) Viet Slee BSGna ian sel mommies Gate Geet Stas Sam bate weer” toms Suet islam Oe sass Sst ene Figura 5-112 Figara 5-113 ‘Como la significatividad de las ficticias de afio es baja, contrastaremos si sus coeficientes pueden considerarse sinmulténeamente mulos Hyd, = 5, = 8) = 5 = 4=0 Para ello elegimos View — Coefficient Tests > Wald Coefficient Restrictions (Figura 5- 114), introducimos la condicién en la pantalla Wald Test y al hacer clic en OK se obtienen p-valores dela F y la Chi-cuadrado menores que 0.05, por lo que se rechaza la hipdtesis de coeficientes nulos. 260 © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES (a) Ee) I Sto, sco sense ncwmune Nast eat est Ey ee Siecacn” aes Siemon CI Figura 5-114 - Figura 5-115 Observando los coeficientes estimados de las ficticias de afio se observa una caida continua de la fertilidad especialmente destacable en los aiios 80. Por ejemplo, En 1982 una mujer tenia 0,52 hijos menos que en 1972 y en 1984 tenia 0,54 hijos menos que en 1972. Como el coeficiente estimado de educ es negativo, las mujeres con més educacién tienen menos hijos. Con ‘un afio de educacién més una mujer tiene 0,128 hijos menos, Por otta parte, la edad tiene un efecto marginal decreciente sobre la fertlidad, ya que el coeficiente de age*2 es negativo. Por otro lado, la fertilidad de las mujeres negras es superior que la de las blancas (1,07 hijos por mujer més). Las variables relativas a la educaci6n, Ia edad y la raza son muy significativas en el modelo. Como la significatividad de las ficticias de entorno de residencia es baja, contrastaremos si sus coeficientes pueden considerarse simultineamente nulos Hy: B. = By = Bo= Bs =0 Para ello elegimos View — Coefficient Tests —» Wald Coefficient Restrictions (Figura 5-114), {ntroducimos la condicién en Ia pantalla Wald Test (Figura 5-116) y al hacer clic en OK se obtienen p- valores de la F'y Ia Chi-cuadrado mayores que 0,05 (Figura 5-117), por lo que se acepta la hipétesis de ccoeficientes nulos simulténeamente para las vatiables de entomo de residencia, Por lo tanto no podemos asegurar que la fertilidad afecte al entorno de residencia. [wald Test. ea aria el an Equator: United [rect Statistic Probatity tai 11860 11) 039 Ichesquare 4745598 4 o3us Figura 5-116 Figura 5-17 ‘Como la significatividad de las ficticias de regién de residencia no es adlecuada para todas cllas, contrastaremos si sus coeficientes pueden considerarse simultineamente nulos. Hy:B.= By © MTES-Paraninfo 261 EOONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Para ello elegimos View —» Coefficient Tests —» Wald Coefficient Restrictions (Figura 5-114), introducimos la condicién en Ia pantalla Wald Test (Figura 5-118) y al hacer clic en OK se obtienen p- valores de la Fy la Chi-cuadrado menores que 0,05 (Figura 5-119), por lo que se rechaza la hipstesis de coeticientes nulos simulténeamente para las variables de regin de residencia. Por lo tanto podemos, asegurar que la fertlidad afecta a la region de residencia, La fertilidad de la regién del centro norte es la mayor, seguida del este y el oeste. Wald Test Equation: United = ea of RCH IAC AO Test Statistic Value of Probbity Fetatisie 3278.11) nat Chisquare 9758535 3 oo Grime, coRecin a) Figura 5 118 Figura 5119 Para estudiar si la influencia del nivel educativo en la fertiidad ha cambiado en el tiempo incluiremos en el modelo las interacciones de las ficticias de aio y la educacién, Para ello rellenamos la solapa Specification de la pantalla Equation Estimation como se indica en la Figura 5-120 y rellenamos el campo LS and TLS Options de la solapa Options segin se indica en la Figura 5-121. Al pulsar Aceptar se obtiene Ia estimacién del modelo ajustado de la Figura 5-122. man opts mm ee our Sie Oe a eve 11) 1 teen oe Cluennece Gee] Figura 5-120 Figura 5-121 262+ © ITES-Paraino MODELOS CON DATOS DE PANEL Y COMBINACIONES DE CORTES TRANSVERSALES Se observa que Ia influencia del nivel educativo en el nimero de hijos ha ido aumentando cen sentido negativo a medida que avanzan los afios, es decir, que a medida que aumentan los aiios ms disminuye el mimero de hijos por mujer al aumentar su nivel educativo (salvo en el afio 1980), Por ejemplo, en el aito 1974 un aumento unitario en el nivel educativo provocé una disminucién de 0,05 hijos por mujer, en el aiio 1976 un aumento unitario en el nivel educativo provoes una disminucién de 0,09 hijos por mujer y asf sucesivamente hasta Hegar al afio 1984 en el que un aumento unitario en el nivel educativo provoe6 una disminucién de 0,17 hijos por mujer. »5.6. El archivo 5-6.w/l contiene dos secciones cruzadas o cortes transversales de datos relativos a 1978 y 1985 respectivamente. Con esta informacién y a través de un modelo que hace depender el salario (wage) del rendimiento educativo (educ), de la experiencia laboral (exper), de Ia afiliacién 0 no a un sindicato (union) y de ser mujer o no (female), se trata de analizar si el rendimiento de la educacién y el diferencial salarial por sexo han cambiado en el tiempo. Estimar la diferencia entre los rendimientos educativos de 1978 y 1985. Evaluar la diferencia ceneel diferencial salarial por sexo entre 1978 y 1985, SOLUCION: Como se trata de evaluar cambios en el tiempo de rendimientos educativos y diferenciales salariales por sexo, sera necesario introducir una variable ficticia para 1985 (con valor 1 para todas las observaciones de 1985 y 0 para el resto) y las interacciones entre Ia ficticia de aiio _y85 y las variables educ y female, El modelo a ajustar seré el siguiente: log(wage) = A, + 5,y85+ educ+ Seducx y85+ B,exper + Bexper? + Bunion + + B.female + 8, female x y85+ € Para realizar el ajuste por MCO se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification teniendo en cuenta la estructura ARIMA previamente identificada, se elige LS - Least Squares (NLS and ARIMA) en el campo Method (Figura 5-123) y se hace clic en Aceptar. Se obtienen los resultados de Ia Figura 5-124. El modelo presenta buena significatividad individual y conjunta de Jos parémetros estimados y un estadistico de Durbin Watson casi igual a 2. Luego a diagnosis del ajuste es correcta tom aR sehen ete aod SaaS a Cz) ee) Figura 5-123 124 ‘Como estamos trabajando con combinaciones de secciones cruzadas, es necesario contrastar Iaheteroscedasticidad, Para ello utilizamos el contraste de White mediante View —» Residual Tests —» White Heteroskedasticity (Figura 5-125) cuyos p-valores de la F’y la Chi-cuadrado son précticamente 0,05, lo que indica que Ia heteroscedasticidad no es relevante al 95% (Figura 5-126). © MTES-Paraninfo 263 EOONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS sites, aaa Foam Rams |] bess, SER US See oe Dioner sx Tate? Foto) Oc thew dies damon Sete tae Figura 5-125 Figura 5-126 Los pariimetros del modelo tienen las siguientes interpretaciones: A= 00858 ‘constanie de 1978 B+ 6, = 00858001 ‘constante de 1985 x10 rendimiento educacién 1978 (+5) x100 (0,074740,0185)<100=9.32% rendimiento educacién 1985 5 x100 ‘cambio en rendimiento educacién entre 1978 y 1985 Jiferencia % salarial (aproximada) mujeres-hombres 1978 GE +3.) x100 =(.0;31740,085px100 = 25.2% iferencia % salavial (aproxianada) anyjeres-houbres 1985, 3 x 100 085x100 = 8,5% ‘cambio en diferencia % salarial por sexo entre 1978 y 1985 En la tabla anterior se muestra que si analizamos los pardmetros estimados del modelo en Ia Figura 5-125 (columna Coefficient) se observa que el rendimiento de la educacién estimado para 1978 es del 7,47%. Para 1985 el rendimiento de la educacién estimado es del 9,32%. La diferencia entre ambos es significativa al 5% (p-valor de Y85EDUC = 0,0487). En 1978 se estima que las mujeres ganaban aproximadamente un 31,7% menos que los hombres (Ia diferencia porcentual exacta es del 27.2% ya que e°*" 1 =-0272). En 1985 se estima que las mujeres ganaban_ aproximadamente un 23,2% (-0.317 40,085 = -0,232) menos que los hombres (Ia diferencia porcentual exacta es del 21% ya que e721 =-0,21). La diferencia en el diferencial salarial por sexo entre 1978 y 1985 es significativa al 10% (el coeficiente de Y85FEM tiene un p-valor = 0,0977) 2646 © ITES-Paraino EOONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 6.1 INTRODUCCION A LOS MODELOS ESTRUCTURALES DE ECUACIONES SIMULTANEAS Los modelos estructurales de ecuaciones simulténeas surgen de la necesidad de confrontar el almacén de modelos tedticos existentes en la economfa con los datos empfricos relevantes. Un ejemplo introductorio muy sencillo de modelo estructural es el modelo de equilibrio parcial, el modelo de demandwoferta para un mercado tinico. En cada lado del mercado tenemos un conjunto de agentes econémicos cuyo comportamiento viene descrito por ‘una relacién estructural estocéstica. Los demandantes regulan sus compras de acuerdo con el precio al que se enfrentan y la teorfa predice que la derivada parcial de la cantidad demandada respecto al precio es negativa. De modo similar, los oferentes ajustan la cantidad ofertada positivamente respecto al precio. Algtin mecanismo limpia el mercado en cada periodo. El modelo lineal que describe este fendmeno es: Yi + BirYar + Yi = My Bai + Yn + Yay =r (= precio, y= cantidad) EI modelo es estructural porque cada ecuacién dibuja el comportamiento de un conjunto de agentes econémicos y, simulténeo, porque los valores actuales de las variables apatecen en cada una de las ecuaciones. Si la primera ecuacién describe Ia relacién de demanda, la restriccidn fiz > 0 asegura una pendiente negativa y fy: > 0 asegura un funcidn de oferta de pendiente positiva. Se puede imponer una restricciGn adicional, ys: > 0, que asegure un término de intersee: n positivo en la funcién de demanda. Los términos de perturbacién u Yu representan cambios en las funciones que son los efectos netos de las variables que, de momento, no se modelizan explicitamente. Ante esta situacién, un analista de la demanda ajustarfa una regresi6n a un conjunto de datos y estimaria una ecuacién de demanda. Un analista de la oferta ajustarfa una regresin a los mismos datos y estimaria una ecuacién de oferta. Pero el economista de “equilibrio general” tendrfa en cuenta ambas funciones simulténeamente intentarfa estimar dos funciones separadas a partit de una dispersién bidimensional con la finalidad de poder estimarse los parémetros de cualquier ecuacién del modelo. Si pueden efectivamente obtenerse estimadores con significado econmico de los pardmetros estructurales del modelo, diremos que ef modelo de ecuaciones simultéineas es identificable. En notacién matricial el modelo de ecuaciones simuténeas anterior puede expresarse com sige Yn Yn Las variables del modelo se clasifican en endégenas y exdgenas. Las variables end6genas son yi, € Yn y las variables exégenas en este caso tan simple s6lo estén formadas por la variable ficticia x, =1. El término de error o vector de perturbaciones es 1 1 *| By, + Cx =u con B= le 4 2666 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL En el modelo se tienen en cuenta los supuestos adecuados acerca el vector de perturbaciones. Suponemos que las perturbaciones se distribuyen normalmente 1, = iidN(0,2) donde © es una matriz de varianzas y covarianzas definida positiva, son homoscedésticas y no estin correlacionadas serialmente, aunque existe la posibilidad de que se correlacionen ‘contemporneamente ‘Como lo habitual en cualquier modelo es expresar las variables end6genas en funcién de las exégenas, multiplicamos por B" la ecuacién By, + Cx; =u, y tenemos: y= Tle, +y, donde T=-BC yy =-B™u, La ecuacién yy que v= ~ iid (0,2) con Tlx, + ¥; recibe el nombre de forma reducida del modelo. Se cumple BEB A continuacién consideremos un modelo mas realista de demanda/oferta: Yur + Badan + YarXis + Yoa¥ay = Moy Bards + Yas * Yasir # VasXir * Yaak = May La variable x es una variable fieticia con valor uno en todos los perfodos y cuyo significado es abastecer el término de interseccién, x2 representaria el ingreso que, segiin la teoria econémica, afecta a la demanda; y x; y Xs serfan las variables que afectan a la oferta. Existe también la posibilidad de que ciertas variables x sean valores retardados de y. Por ejemplo, el precio retardado podria afectar a 1a oferta actual. También es posible que existan valores retardados del ingreso y de otras variables ex6genas de la especificacién. La categoria de variables end6genas retardadas y variables ex6genas retardadas y actuales, constituye el conjunto de variables predeterminadas. La caracteristica més importante de las variables predeterminadas es que son independientes de las perturbaciones actuales y futuras. Esta propiedad se sostiene para las variables ex6genas por definicién y también para variables endégenas retardadas porque se supone que los términos de perturbacién son serialmente independientes. Expresaremos el modelo en formato matricial: By. + Creu 1 *| [j: % 0 |] B= c= [> 1 Yn 0 Yn You La matriz de coeficientes en forma reducida y, = Tx, + ¥, es ice l[ Crit Bata) -%o Balas Aural Rr A=1-fy By Leno Brtix —Yos ~Ya bee "Yag Pa Yoga Una vez obtenidas las f, calcularemos A y seguiremos determinando los cinco coeficientes ‘ydel modo habitual. Asf pues, identificamos las ecuaciones de demanda y oferta de la ecuacién, -B'C = By (i Fn Ts me] Ay Mn Ms TM © ITES-Paraninfo 267 EOONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS 6.2 IDENTIFICACION DE MODELOS DE ECUACIONES SIMULTANEAS Es necesario buscar unas reglas generales para establecer si una ecuacién estructural es 0 no identificable. El modelo general lineal de ecuaciones simulténeas tiene la expresi6n: By, + donde B es una matriz de coeficientes de variables endégenas actuales de G x G,C una matriz, de coeficientes de variables predeterminadas de G X K, y Ys X1y uy Son vectores columna de G, Ky G elementos, respectivamente. De modo que tenemos: Br Ba = Boo ta Yao Nw p=| Fn Ba Bc} o_|ta Inv Ye Bar Ba Bes Yor Yor “Yow Vu Uy Var Ma : u,=|"° Yo Xe Noy Sera necesario normalizar los coeficientes . Existen muchas reglas de normalizacién entre las que elegir. Si es posible, haremos que los coeficientes de la primera variable endégena de cada ecuacisn sea igual a uno, esto es, reemplazaremos la primera columna de B por un vector unitario. Més habitual resulta sustituir la diagonal principal de B por un vector unitario. Podemos escribir el conjunto de ecuaciones del modelo como: Az, =[B ell |- donde A es la matriz. G x (G + k) de todos los coeficientes estructurales y z, es el vector de observaciones (G + K) x I de todas las variables en el periodo t. Abordamos ahora un método de identificacién que posteriormente puede ser aplicable a cualquier ecuaci6n estructural. Consideremos ahora la identificacién de Ia primera ecuacién del sistema, Formularemos la primera ecuacién estructural como az; = uy, donde ar indica la primera fila de A Es comin que Ia teorfa econdmica imponga restricciones sobre los elementos de a, Por ejemplo restricciones de exclusi6n que especifican el hecho de que determinadas variables no aparezcan en determinadas ecuaciones. Supongamos, por ejemplo, que ys no aparece en la primera ecuacién, La restriccin pertinente es fix = 0, que puede expresarse como una restriccién lineal homogénea sobre los elementos de a, 2686 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL 0 0 1 Br Ba Bo ty ell |=0 0. ‘También puede haber restricciones lineales homogéneas que incluyan dos 0 més elementos de as. Especificar, por ejemplo, que los coeficientes de y: € y2 soi expresaria como ales, se -1 1B: Br rl} o 0 mnes a priori sobre 1a primera ecu in, se expresarian o1 0 -1 4®=0 donde @=|' ° 00 00 La matriz @ tiene G + K filas y una columna para cada restriccién impuesta a priori en Ja primera ecuacién. Adicionalmente a las restricciones incluidas en Ia ecuacin, habré también restricciones sobre ay originadas en las relaciones entre los coeficientes estructurales y los de Ia forma reducida. Segiin la ecuaci6n, formulamos B/T+ C oAW=0 donde w-[] Asi pues, las restrieciones de los coeficientes de la primera ecuacién estructural son: a,W=0 Combinando las ecuaciones obtenemos el conjunto completo de restricciones tenemos: alw o]=0 © ITES Paraninfo 269 EOONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Existen G + K pardmetros desconocidos en ay. La matriz [VW ®] tiene de orden (G + K) x (K + R), donde R es el nimero de columnas de ®. Suponiendo que conocemos I, todos los elementos de [W ®] serdn conocidos. Por lo tanto, Ia ecuacién constituye un conjunto de K + R ecuaciones de G + K parimetros desconocidos. La identificacién de la primera ecuacién precisa que el rango de [W @] sea G + K -1 ya que, en dicho caso, todas las soluciones de la ecuacién se sittian en un tinico haz que pasa por el origen. Cuando normalizamos Ia primera ecuaci6n igualando a uno cierto coeficiente (por ejemplo, fi1=1), ‘obtenemos un tinico punto del haz de soluciones y ay queda determinado. En resumen, para identificar la primera ecuacién estructural en funcién del rango p de [W ©] se necesita que se cumpla la siguiente condicién de rango: pW o|=G+K-1 La condicién de rango se utilizara para examinar la identificabilidad de cualquier ecuacién estructural del modelo. Esta condicién viene determinada por Ia matriz @ que resulta de las restricciones a priori sobre dicha ecuacién. La aplicacién de dicha condicién de rango suele realizarse en sistemas muy pequefios. Sin embargo, resulta féeil desarrollar y aplicar una condicién necesaria de identificabilidad. La condicién de rango es insostenible si [W ®] no tiene un minimo de G + K -1 columnas. Por lo tanto, la condici6n necesaria para que la ecuacién cumpla cesta condicién es K + R 2 G + K-1 = R2G —1. Dicho de otro modo, la condicién necesaria de identificabilidad 0 condicién de orden es que el niimero de restricciones a priori debe ser, como ‘minimo, tan grande como el niimero de ecuaciones del modo menos uno. En el caso en que las restricciones son sélo restriceiones de exclusién, la condicién necesaria de identificabilidad o condicién de orden exige que el ntimero de variables excluidas de la ecuacién estructural debe ser, como minimo, tan grande como el niimero de ecuaciones del modelo menos uno. Sig = mimero de variables endégenas actuales incluidas en la ecuacién y k= mimero de variables predeterminadas incluidas en la ecuacién, entonces, R = (G ~ g) + (K ~ ky la condici6n necesaria de identificabilidad o condicién de orden se convierte en (Gg) + (K -k) > G~ 1=> K~k2g-l, 0 equivalentemente, ef ntimero de variables predeterminadas exeluidas de la ecuacién debe ser, como minimo, tan grande como el niimero de variables endégenas incluidas menos uno. Si K~k > g - la ecuacién es sobreidentificada, si K - k = g -1 la ecuacién es exactamente identificada y si K- k G -1, entonces A® tiene G o mas columnas, En este caso, existen més restricciones que las mfnimas exigibles para la identificacién y, en general, habré més de una submatriz cuadrada de orden G — 1 que satisfaga la condicién de rango. Diremos ahora que la ecuacién estd sobreidentificada. 6.3 ESTIMACION DE MODELOS DE ECUACIONES SIMULTANEAS Una vez identificado un modelo, la siguiente tarea es su estimacién. Como ejemplo consideremos el sistema: Buu + Bada + Yuku + Yaka = BasYis + Bar You + Vrs + Yaa ¥ne = May Imente no hay restricciones impuestas a pri ecuaciones esté identificada. Supongamos ahora que las restricciones son 7:1 = Para la primera ecuacién tenemos 0 0 y Ab= [ ] Yo Yoo. El rango de A@ es uno y, por lo tanto, identificamos la primera ecuacién ya que G = 2. La segunda ecuacién no esti identificada porque no tiene restricciones. La ecuacién @,[W ®|=0 para este modelo es: eorce Hoco Mm, M 00 Ty Mm 00 =(0 0 0 0 1B: Bo tu rally 9 1 ol=l | 0 1 01 lo que es lo mismo: Buty + Bat +%n Bun + Brn + Ya = M=9 My =0 Si Phy =.tenemosentonces que By = (© MTES-Paraninfo 271 EOONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Las anteriores especificaciones y la regla de normalizacién de este ejemplo dan lugar al modelo Yu t Bada = My BrsYy + Yue + YaaXs + YanXes = Wry La matriz de coeficientes de Ia forma reducida yy = Tr, + ¥: es Bo ~ Bab > Ba 0 [f fs | 1 Bats arn) a Fn Tm Yn -Yn Podemos expresar la forma reducida como dos ecuaciones: poten [Jolt Ze] ff Fn An | Xu Yan, Yar Yar stimamos por MCO los coeficientes men cada ecuacién de la forma reducida ky + AaXn + Vy Ay Xiy * AX + Vo, obteniendo ,,, 4,2. yy #y yhacemos fy, ® . ya tenemos estimado ‘el modelo inicial. Este método de estimacién de parémetros estructurales recibe el nombre de método de estimacién por minimos cuadrados indirectos. Obtiene estimadotes tinicos de los parémettos de ecuaciones exactamente identificadas una a una a partir de los estimadores por MCO de las ecuaciones de la forma reducida. Cuando trabajemos con el caso més general de ecuaciones sobreidentificadas, necesitaremos otros tipos de estimadores. ‘Aunque TI es una matriz de 2 x 2, su rango es s6lo 1. Se trata de un ejemplo de sobreidentificacién. Necesitamos una tinica restriecién para identificar la primera ecuaci6n, pero tenemos dos. La consecuencia es una restriccién en los coeficientes de la forma reducida. Destacaremos también que, incluso en el caso de sobreidentificacién, (A®) no puede exceder de G— 1. La matriz tiene G filas y un mfnimo de G cotumnas y, para restricciones homogéneas, la primera fila sera siempre cero y el rango no exceder de G — 1. Destacaremos finalmente que si en problema de dos ecuaciones sustituyéramos TT por la matriz de coeficientes estimados de Ia forma reducida IT , el rango de TT serfa, casi con toda seguridad, 2 y no 1, de modo que estimando By mediante — se tienen valores distintos. Buscamos ahora otros métodos de estimacién para cuando no hay identificacién exacta. Supongamos ahora que partimos del modelo de ecuaciones simulténeas By, + Cx, = ue 1= 1,....n, donde B es una matriz de coeficientes de variables endégenas actuales de G x G. C ‘una matriz de coeficientes de variables predeterminadas de G x K. y Yo 1 ¥ tr son vectores columna de G, K y G elementos, respectivamente, De modo que tenemos: 2726 ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL Br Ba Yu] [Yr Ya Ne |e] [mm Bx Br Yu |y[%a Ya oo Te | Mar Bo Bor Boa\l¥a} Wa Yor Yo SL%us Mo. ‘Consideremos la primera ecuacién de Ia ecuacién del modelo anterior: Yan = Bada 0° Big Yap Marke 0 Yung Hy Observamos que hemos impuesto Ia condicién de normalizacién fy; = 1. Ademés se supone que las g — 1 variables endégenas son variables explicativas y que, en caso necesario, Jas variables se reenumeran adecuadamente para que los indices aparezcan en forma secuencial. De modo similar, suponemos que las primeras & variables predeterminadas también aparecen en la ecuacién. En otras palabras, hay G - g variables endégenas y K - k variables predeterminadas excluidas de la ecuacién, Las ecuaciones de la forma reducida muestran que cada variable endégena es funcién de todas las perturbaciones estructurales. Asi ues, las variables explicativas y,,,-*-,y,, de la ecuacién se hallan correlacionadas con la perturbacién uj de dicha ecuacién (endogeneidad). Entonces resulta que aplicando MCO a la ecuacién obtendremos estimadores sesgados e inconsistentes. Sélo obtendremos estimadores consistentes utilizando variables instrumentales. Recopilando todas las observaciones de la ‘ecuacién, podemos formular la ecuacién estructural en forma matricial como, yaVB+Xyru donde y es el vector n x 1 de observaciones de ys, ¥: es la matriz.nx(g-1) de observaciones de las variables enddgenas del lado derecho de la ecuacién, X; es la matriz.nxk de observaciones de las variables predeterminadas incluidas, mientras que fy y recogen todos los coeficientes de Ja ecuacién, Podemos reescribir la ecuacién de modo resumido como: y=Z,a+u donde Z,=[¥, X,) y@=1f 7] Las matrices de datos de todas las variables del modelo las escribimos como: y=ly ¥ ¥] x=[x, x] donde ¥_ es la matriz nx(G-g) de observaciones de las variables endégenas que no aparecen en esta ecuacién y X2 es la matriz.nx(K-k) de observaciones de las variables predeterminadas excluidas. Como suponiamos que todas las variables predeterminadas no estin correlacionadas en el limite con las perturbaciones, X es evidentemente un conjunto de instrumentos de Z;. La matriz.Z, tiene k-+g-I variables y X, K variables, El requerimiento de tener como minimo tantos instrumentos como coeficientes a estimar, da lugar a la condicién K 2k + g-1, que es la condicién de orden para identificar la ecuacién. ‘Como ya hemos visto en capitulos anteriores, el estimador de variables instrumentales se obtiene aplicando minimos cuadrados de dos etapas (MC2E). Realizaremos, en primer lugar, la regresin de Z; sobre X para obtener la matriz.de valores predichos: © MTES Paraninfow 273 ECONOMETRIA, CONCEPTOS ¥ PROBLEMAS RESUELTOS 2,=x(x x)‘ xz, =P,Z, ‘A continuaciGn, realizaremos la regresién de y sobre Z, para obtener el estinador de variables instrumentales (MC2E) siguiente: 6 =(Z;P,Z,)'Z,Pyy con varl La matriz Z, de la ecuacién y la matriz de instrumentos X tienen una submatriz X, en comiin, Ello da lugar a una forma altemativa de expresar el estimador de variables instrumentales por minimos cuadrados en dos etapas (MC2E). Tenemos: KPH WAX] 7p y [Po XPry. ZPyZ, = Pe XiPeX, y también: 1 1, PyX, =X(X'X)'X'X, = 1X, xl ex Efectuando la regresién de X; sobre X obtenemos, simplemente, X;, Formularemos entonces el estimador de 1a ecuaci6n como: (m2) 2A] ¥O X)'X'Y, ed xy'x | XY, xx lle Xy Trabajando con modelos econométricos de escala media o grande, no resulta de gran utlidad sugerit que la mutriz de todos los valores predeterminedos del modelo X es un conjunto de instrumentos adecuados para cualquier ecuacién estructural. La razén es que el niimero de variables de X se aproximard, 0 excederd incluso, al mimero de observaciones maestrales. Una posibilidad consiste en estrechar Ia eleccién de instrumentos para cada couacién estructural a Ins variables predeterminadas que aparezcan en las ecuaciones estructurales de las variables de aquella matriz, ¥;, que sea relevante para dicha ecuacién estructural. En Ia préctica, a pesar de su reconocida inconsistencia, MCO sigue utilizéndose extensamente para estimar ecuaciones estructurales. Una posible explicacién a este hecho se basa en el contraste entre las propiedades con pequefias muestras y las de muestras grandes, La consistencia es una propiedad asintética o para muestras grandes. En muestras finitas, los estimadores consistentes no son necesariamente insesgados: de hecho, suelen mostrar un sesgo de muestra finita, Y més ain, la varianza muestral de estimadores consistentes, especialmente cuando la elecci6n de instrumentos es pobre, puede exceder la de los estimadores MCO. Por Jo tanto, en muestras finitas, MCO muestra un error cuadrético medio menor que el de los cestimadores consistentes. 27460 ITES-Paraito MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL 6.4 _METODOS DE ESTIMACION DE SISTEMAS El enfoque de variables instrumentales (MC2E) es un procedimiento de estimador de ecuacién tinica, Puede utilizarse para estimar cualquier ecuaciGn estructural identificada. Puede utilizarse también para estimar todas las ecuaciones identificadas en un modelo estructural completo, Un estimador de sistema estima conjuntamente todos los parémetros (identificados) de un modelo, Un estimador de sistema muy ttl es el estimador RANR (SUR) o estimador de regresiones aparentemente no relacionadas. Supongamos que la ecuacién i-ésima de un sistema de m ecuaciones es. Cftus i m we donde y; es un vector nxl de observaciones de la variable i-ésima, X; es una matriz de observaciones de las variables explicativas nxk;, es un vector de coeficientes xl y ui es un vector de perturbaciones nx1. Se supone que la perturbaci6n y las variables explicativas de cada ecuacién no estén relacionadas. El conjunto de ecuaciones puede escribirse como: Nn] [XO OFT BK] fu Myf Xam OAL yo pew val Loo = xB! [ee En general, la matriz de varianzas y covarianzas de u es: Banu) EQ") Buty’) Foul onl Eu) ECuytt,') Eluett,")|_| Ot Fpl E= E(u’) = E(tegtt,!) Eltiytls') > Etegtty)] (Oy! Syal + Cyl La expresién anterior suele denotarse como sigue: Ol Onl Ol) [On On Sm Cyl Onl Oyl|_|Oy Oy Foy Ea Eu y=| 2 OP al 2 : Omit Smet Sub [Fm Fr Sn donde I es la matriz. identidad nxn y el simbolo ® indica el producto de Kronecker (cada elemento de EZ, se multiplica por J ). Hemos aplicado que E(uty’) = of iy = 1, .., m. Cuando i= obtenemos la perturbacién de una ecuacién cualquiera que es homoscedistica y no autocorrelacionada, EI método de Jos mfnimos cuadrados generalizados MCG offece el mejor estimador lineal insesgado del vector f en el sistemay = X B+ © MTES Paraninfow 275 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Por lo tanto, el sistema de ecuaciones y= Xi A+ u; i= 1, ..., m debiera estimarse conjuntamente como y = X A+ u (y no de manera separada) mediante el estimador de minimos ccuadrados generalizados bors = VEX) XEy oD of a" OL ot OM] =o @l= or ol o or La matriz de varianzas y covarianzas de este estimador MCG es: Vartbers) = (XE "XY" La dificultad operativa del estimador anterior es que los elementos de Ze son desconocidos, El método de las regresiones aparentemente no relacionadas RANR 0 método SUR utiliza un estimador MCG factible estimando separadamente por MCO las m ecuaciones y utilizando los residuos para estimar ;. La inferencia sobre este método tendra validez asintstica. El estimador SUR (0 RANR) tiene dos casos muy interesantes. Si a; = 0 para i #jo MX, Xm, €l estimador MCG se reduce a aplicar MCO a todas las ecuaciones por separado. Y si ademds las perturbaciones estén normalmente distribuidas, los estimadores MCO son también estimadores maximo verosimiles, La versién de minimos cuadrados en dos etapas para Ia estimacién de sistemas es el método denominado de minimos cuadrados de tres etapas (MC3E). Este procedimiento permite la posibitidad de correlacién contemporinea entre las perturbaciones de distintas ecuaciones estructurales. Se trata, en esencia, de una aplicacién del procedimiento de regresiones aparentemente no relacionadas RANR (SUR) a wn modelo estructural. Las ecuaciones cestructurales identificadas se estiman en primer lugar por MC2E y los residuos resultantes se utilizan para estimar la matriz. de covarianzas de las perturbaciones, que se utiliza posteriormente para estimar conjuntamente todos los parémetros estructurales identificados. Cuando el proceso de estimaci6n se repite, y no se detiene al llegar a la tercera etapa, las estimaciones convergen aun estimador de méxima verosimilitud con informacién completa (MVIC) del modelo estructural Existen dos métodos de estimacién de sistemas robustos a la heteroscedasticidad que son el ‘método de los minimos cuadrados en dos etapas ponderados y el método generalizado de los ‘momentos GMM con correccién de White. El Heteroskedasticity and Autocorrelation Consistent Covariance Matrix Method (HAC) es robusto a heteroscedasticidad y autocorrelacién. En principio, siempre que la especificacién del sistema sea correcta, los métodos de estimacién de sistemas de ecuaciones son més eficientes que los métodos de ecuacién nica porque la especificacién errnea de una ecuacidn tinica puede contaminar todas las estimaciones del sistema. 6.5 MODELOS DE ECUACIONES SIMULTANEAS CON SERIES DE TIEMPO La presencia de dindmica en los modelos de ecuaciones simulténeas (MES) agregados constituye, por lo menos a efectos de prediccién, una gran mejora con respecto a los MES estiticos. 27660 ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL ‘Cuando consideramos anteriormente el modelo de demanda/oferta especificado como: Yat Bada, +1 udy + Yak = My Badu + Yor + Yakut Vaska * YosXay = My vimos que existe también Ia posibilidad de que ciertas variables x sean valores retardados de y: También es posible que existan valores retardados de otras variables exégenas de la especificacién, La categoria de variables endégenas retardadas y variables exdgenas retardadas y actuales, constituye el conjunto de variables predeterminadas. La caracteristica més importante de las variables predeterminadas es que son independientes de las perturbaciones actuales y futuras. Esta propiedad se sostiene para las variables ex6genas por definicién y también para variables endégenas retardadas porque se supone que los términos de perturbaci6n son serialmente independientes. Pero algunos problemas importantes persisten a la hora de estimar los MES con datos de series temporales agregadas. Recordemos que la validez de los procedimientos habituales de inferencia basados en el estimador MCO 0 en el MC2E en aplicaciones de series temporales se apoya en Ia nocién de estacionariedad. Desafortunadamente, parece que series tales como el consumo agregado, la renta, la inversiGn, e incluso los tipos de interés violan los requisitos de estacionariedad y presentan raices unitarias. Estas series también tienden a contener tendencias exponenciales, aunque esto se puede en parte remediar usando la ‘ransformacisn logaritmica y adoptando diferentes formas funcionales. En general, incluso las, propiedades de muestra grande de los estimadores MCO y MC2E (y no mencionemos las de muestra pequefia) son complicadas y dependen de varios supuestos cuando se aplican a ecuaciones con variables 1(1). Habra que tener presente todo lo relativo a raices unitarias y cestacionariedad a la hora de estimar modelos de ecuaciones simulténeas con series de tiempo. Pero estos comentarios no implican que los MES no sean titiles cuando se aplican a datos de series temporales. Los problemas de tendencia y de alta persistencia se pueden evitar cespecificando los sistemas en primeras diferencias o en tasa de crecimiento. Pero deberiamos Teconocer que se trata entonces de un MES distinto del que se especifica en niveles. Por otra parte, tal y como hemos comentado anteriormente, incorporar dinémica no es algo especialmente dificil. Finalmente, el problema de encontrar unas variables auténticamente ‘exégenas para incluirlas en los MES es a menudo més fil con datos desagregados. 6.6 MODELOS DE ECUACIONES SIMULTANEAS CON DATOS DE PANEL Los modelos de ecuaciones simulténeas surgen también en el contexto de datos de panel. Pot ‘ejemplo, podemos imaginar que estimamos las ecuaciones de oferta de trabajo y de oferta salarial para un grupo de gente que ha estado trabajando durante un determinado periodo de tiempo. Ademés de tomar en cuenta Ja determinacién simulténea de las variables dentro de cada periodo, podemos ‘considerar la existencia de efectos no observados en cada ecuacién, En una funcidn de oferta de trabajo, seria itil tomar en cuenta una preferencia no observada por el ocio que no varia con el tiempo. El enfoque basico para la estimacién de los MES con datos de panel consta de dos etapas (1) eliminar los efectos no observados de las ecuaciones de interés utilizando la transformacién de los efectos fijos 0 de las primeras diferencias y (2) encontrar variables instrumentales para las variables cendégenas en la ecuacién transformada con vistas a estimarla mediante MC2E combinados. Esto puede ser todo un desafio, porque para que el andlisis sea convincente, hace falta que encontremos instrumentos que cambien con el tiempo. © MTES-Paraninfo« 277 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS ‘Altemativamente, en algunos casos, podemos usar variables en desviacién de su media ‘temporal, incluyendo las variables instrumentales, y después aplicar los MC2E. combinados. Esto ‘equivale a introducir fcticias para cada observacidn de seccién cruzada, usando las ficticias como sus propios instrumentos. Las aplicaciones MES con datos de panel son muy potentes, en la medida en ‘que permiten tomar en cuenta la heterogeneidad no observada a la vez. que tratan la simultaneidad, Son cada vez més frecuentes no son particularmente dificiles de estimar, PROBLEMAS > 6.1. El archivo 6-1/1 contiene datos de 1a economia espaiiola para el perfodo 1977-1995 de las variables tipo de interés (R,), oferta monetaria (M,), producto nacional bruto a precios de mercado (¥,)¢ inversidn (Iny,). Se trata de estimar el siguiente modelo de dos ecuaciones: R= QM, +Q,Y, +u, Y, =B,+B,R, + Blnv, +u;, Realizar la identificacién de los parémetros del sistema y estimar la forma estructural del modelo utilizando los métodos de los minimos cuadrados en dos etapas (MC2E), en tres etapas (MC3E), regresiones apatentemente no relacionadas (SUR) ¥ méxima verosimilitud con informacién completa (MVIC). Estimar también el modelo ecuacién por ecuacién. SOLUCION: El modelo de ecuaciones simulténeas tiene dos variables end6genas (R, ¥), es decir, G = 2. También tiene 3 variables predeterminadas (M, Inv, y la constante), por lo tanto K = 3 Ademés, la tabla siguiente muestra los valores para la identificaci6n de las dos ecuaciones. Varabies | Variables Variables Varlables Tdentficacion endégenas | exdgenas | predeterminada | predeterminadas incluidas | inctuidas (G-g) | sincluidas (2) | excluidas (K-4) (g) Primera [2 =0 1 31=2 ecuacin. Segunda [2 2 3251 ecuacién Como 1a primera ecuacién es superidentificada, se puede estimar por minimos ‘cuadrados en dos etapas (MC2E). Como la segunda ecuaci6n es exactamente identificada, se puede estimar por mfnimos cuadrados indirectos (MCI) o por MC2E. Para realizar la estimacién de las dos ecuaciones por MC2E con Eviews, en primer ugar disefiamos el sistema de ecuaciones. Para ello elegimos Object > New Object > y le damos el nombre SYS (Figura 6-1). Pulsamos OK y en la pantalla System se escriben las ecuaciones del sistema y todos los posibles instrumentos (variables predeterminadas) tal y como se indica en la Figura 6-2. A continuacién pulsamos el bot6n Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Two Stage Least Squares (Figura 6-3). Al pulsar Aceptar se obtiene la estimacién por MC2E de las dos ecuaciones del sistema de ecuaciones simulténeas (Figura 6-4). 27860 ITES-Pararino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL =! "Fas Wts| Oe ements Figura 63 Se observa una muy buena significatividad de los coeficientes estimados, buenos coeficientes de determinacién (0,503 para la primera ecuacién y 0,862 para la segunda) y estadisticos de Durbin Watson muy cercanos a 2 para las dos ecuaciones, lo que indica que no existirén problemas de autocorrelacién serial El sistema estimado seré el siguiente: R, =-0,01024M, + 0,00000064Y, + u,, ¥, = 34996715 -1030960R, + 1,786928Inv, +1, Si queremos la estimacién por minimos cuadrados en tres etapas (MC3E), hacemos clic en Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Three Stage Least Squares (Figura 6-5). Al pulsar Aceptar se obtiene la estimacién por MCSE de las dos ecuaciones del sistema de ecuaciones simulténeas (Figura 6-6). Se observan resultados bastante parecidos al método MC2E y exentos de problemas, El sistema estimado es ahora: R, =-0,01024M, +0,000000694Y, + u, ¥, = 40399124 -1251905R, + 1,490466m, + us, © MTES-Paraninfo« 279 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Eines Figura 65 Figura 6-6 Si quetemos la estimacién por regresiones aparenetemente no relacionadas (RANR © SUR), hacemos clic en Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Seemingly Unrelated Regression (Figura 67). Al pulsar Aceptar se “obtiene la estimacién SUR de las dos ecuaciones del sistema de ecuaciones simulténeas (Figura 6-8) Se observan resultados bastante parecidos a los métodos anteriores y exentos de problemas. El sistema cestimado es ahora: R, =-0,01070M, +0,000000706Y, + 1, 8342 160 — 680237,7R, + 2,007108Inv, +u,, y, ae ean oe Eine Tine sein bets souk 1 “J Figura 67 Si queremos la estimacién por mdxima verosimilitud con informeién completa (MVIC), hacemos clic en Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Full Information Likelihood (Figura 6-9). Al pulsar Aceptar se “obtiene Ia estimacién de las dos ecuaciones del sistema de ecuaciones simultineas (Figura 6-10). Se cobservan resultados bastante parecidos a los métodos anteriores y exentos de problemas, El sistema cestimado es ahora: 200 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL R, =-0,01129M, +0,000000723Y, +u,, ¥, = 28342160 - 680237,7R, + 2,007108/nv, +1, ‘pian Ein — ala en reo erent ane endoniba Tees 8 psiesion aie ee eee Figura 69 Figura 6-10 Dado que el modelo esté identificado podemos estimar también el sistema ecuacién por ecuacién. Como la primera ecuacién esté sobreidentificada, utilizaremos el método MC2E, Para ello se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige TSLS-Two Stage Least Squares (TSNLS and ARIMA) en el campo Method para ajustar por minimos cuadrados en dos etapas (Figura 6-11) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 6-12 donde se ve el mismo ajuste que al estimar el sistema completo por el método MC2E (Figura 6-4). La ecuacién estimada R, ~0,01024M, +0,000000694Y, +u,, io Twostope Lent Sus Dae C605 Tre 1 Swe 157 125 ited towatir 19 a aT — m1 TRG Yaar epeaee eT @ ||| saseseonaee G37 SC ceeeden er et 7 5 SErseyorsen | 210072 Sun sqnsreat mors Figura 6-11 Figura 6-12 Ahora podemos probar si nuestro ajuste presenta autocorrelacién, Podlemos utilizar el ‘contraste de Breusch Godfrey mediante View —> Residual Tests —» Serial Correlation LM Test (Figura 6-13) cuyo p-valor de 1a Chi-cuadrado es superior a 0,05 (Figura 6-14), lo que indica ausencia de aautocorrelacin. Mediante View —» Residual Tests —» White Heteroskedasticity (no cross terms) (Figura 6-15) se obtienen p-valores mayores que 0,05 (Figura 6-16), luego no hay heteroscedasticidad. (© MTES-Paraninfo 261 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS cr paaentetiak ee SeeetReqwend erecta em SE ofeverson’ 2i_warhasatesaarocm se) Figura 6 13 Figura 6-14 Como la segunda ecuacién esté exactamente identificada, utilizaremos el método MC2E (0 incluso MCO). Para ello se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige TSLS-Two stage Least Squares (TSNLS and ARIMA) en el campo Method para ajustar por minimos cuadrados. ‘en dos etapas (Figura 6-17) y se hace clic en Acepiar. Se obtienen los resultados de la Figura 6-18 donde se ve el mismo ajuste que al estimar el sistema completo por el método MC2E (Figura 6-4) Frieden) Ne Tosstoe Lt Sqames Dar 20°05 rw 2930 ides heaton: Istana © 9 tne i trimtioentinisaans ||] Boas Sn 7 7 fe=zae==3] Figura 6-17 Figura 6-18 2026 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL La ecuacién estimada seré ¥, = 34996715 -1030960R, + 1,786928Inv, +u,, Para este ajuste, el contraste de Breusch Godfrey obtenido mediante View —> Residual Tests Serial Correlation LM Test cuyo p-valor de la Chi-cuadrado es superior a 0,05 (Figura 6-19), indica ausencia de autocorrelaci6n. Pero el contraste de White obtenido mediante View —» Residual Tests —> White Heteroskedasticity, con p-valores menores que 0,05 (Figura 6-20), indica presencia de heteroscedasticidad. La estimacién mediante el método de White se hard ahora rellenando la solapa Options de la pantalla Equation Estimation como se indica en la Figura 6-21. Al hacer clic en Aceptar se obtiene la estimaciGn sin heteroscedasticidad de la Figura 6-22. Se observa que la estimacién coincide con la anterior. oe FAH, ‘DeRaqnwd OVS) Pot CuSwant) O77 Doped ele RESID Wao. Two Stage Lt Bases tot Bue taotte ow Wa bar seoles R 2asis oogeKt 08812 z 2oee2 Szimp 00 reste Gee Sain Ore se Pret Asta Rouond SCrcwerdee feaexz || xed GSE Mem tmnt 22K SE simpson Aaienoennn amma Ramueet SME SD enmity | S8tE+ Simeqmed es S663 Sawareamn” oases |] Se cepa, a Dati Poureaese) 09105 | Dua ab1016 Poeraneney O07 Figura 6-19 Figura 6-20 ont, lam a J verte Enor Staite Prob ne : = Ss ee a = Ww Teens Oe 6.87 DONO ‘ised Reqd $0. dependent car «8701. Fino Figura 22 © MTES Paraninfo 283 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS 6.2. Consideramos el archivo 6-2.w/1 que contiene informaci6n correspondiente al periodo 1970- 1997 obtenida de la Contabilidad Nacional de Espafia y relativa a las macromagnitudes Consumo nacional (C), Importaciones de bienes y servicios (JM), Producto interior bruto (¥), Exportaciones de bienes y servicios (X) € Inversién (J. Supongamos que los agregados macroeconémicos anteriores pueden relacionarse segin el simulténeas: CO + OY, + OY, tity, IM, = By + BC, + BC. + BX, +a, ¥,=C,+1,+X,-IM, Realizar la identificacién de los pardmetros del sistema a través de las condiciones de orden y de rango y estimar la forma estructural del modelo utilizando el método mas adecuado. SOLUCION: EI modelo de ecuaciones simulténeas tiene tres variables endégenas (C, IM, ¥),es decir, G = 3. También tiene 5 variables predeterminadas (C;, ¥;1 X, 1, Ia eonstante), por Io tanto K ‘Ademés, Ia tabla siguiente muestra los valores para la identificacién de las dos ecuaciones a través de la condicién de orien Variables | Variables Variables Variables Tdentificacion jncluidas | incluidas (G-g) | incluidas (&) | excluidas (K-4) () Primera 2 2 Kk=3>g1=1 ecuacién. Sobreidentificada Segunda | 2 3 3 K-k=2>g-I=1 ecuacién. Sobreidentificada Vamos a realizar ahora la identificacién del sistema de ecuaciones simulténeas a través de la condicién de rango. Sea A la matriz G x (G + k) de todos los coeficientes estructurales. Como: C, =, + ,Y,+,Y,, + uy, C.-Y, = Oy + O,¥,, $y IM, = By + BC, + BC. + BX, +, > 4- B,C, + IM, = By + BC. + BX, +t, Y,=C,+1,+X,-IM, -C,+¥,+IM, =1,+X, tenemos: CX MM, Cy Yay X, f, Cons 1 -a@ 0 0 -a 0 0 -a 0 1-£ 0 -B 0 -h -1 1 1 0 0 -1 0 Ahora calcularemos el rango de la submatriz de las variables excluidas en la ecuacién que se quiere identificar, en nuestro caso la primera. Dicha submatriz. esta formada por los coeficientes que en las otras ecuaciones toman las mencionadas variables excluidas. Tenemos 2046 © ITES-Pararinto MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL 1 -B, -B 0)_, 1000-1 =1 El rango de esta matriz ha de compararse con G-1=2. Si el rango de esta matriz. es menor que G-1 la ecuacién no esté identificada, si es igual a G-1 estard exactamente identificada (salvo que haya mas de un menor distinto de cero), y si es mayor que G-1 estar sobreidentificada. En nuestro caso, aunque los rangos coinciden, como hay més de una submatriz con determinante no nulo, Ia primera ecuacién esté sobreidentificada, Ahora calcularemos el rango de Ia submatriz. de las variables excluidas en la segunda ‘ecuacién que se quiere identificar. Dicha submatriz. esta formada por los coeficientes que en las otras ecuaciones toman las mencionadas variables excluidas. Tenemos: -a, -a, 0 =2 1 0 =-1 El rango de esta matriz.ha de compararse con G-1=2, pero aunque coineiden, como hay més de una submatriz con determinante no nulo, la segunda ecuacién esta sobreidentificada. ‘Como las dos ecuaciones estén sobreidentificadas, realizaremos la estimacién del modelo de ecuaciones simulténeas mediante el método MC2E. Para realizar la estimacién de las dos ecuaciones por MC2E con Eviews, en primer ugar disefiamos el sistema de ecuaciones. Para ello elegimos Object —» New Object —> System y le damos el nombre SYS2 (Figura 6-23). Pulsamos OK y en la pantalla System se escriben las ecuaciones del sistema y todos los posibles instrumentos (variables predeterminadas) tal y ‘como se indica en la Figura 6-24. A continuacién pulsamos el bot6n Estimate y en el campo ‘Method de a solapa Estimation Method de 1a pantalla System Estimation elegimos Two Stage Least Squares (Figura 6-25). Al pulsar Aceptar se obtiene la estimacién por MC2E de las dos ‘ecuaciones del sistema de ecuaciones simulténeas (Figura 6-26). Se observa una muy buena significatividad de los coeficientes estimados, buenos coeficientes de determinacién (0,99 para la primera ecuacién y 0,96 para la segunda) y estadisticos de Durbin Watson bastante lejanos de 2 para las dos ecuaciones, lo que indica que podrfan existir problemas de autocorrelacién serial. Tells, Pepe area Figura 6-24 © MTES-Paraninfo 285 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS reerecarry tereco cee cue erPeONRINnE CEFR Desthanpeann atria Figura 6-25 Etre TS Let Stee PoE seen En ‘aia “<7 00600 a os ee Sane Foy tai iid ha oe Seem ‘ae De fe) ‘ze jie Some oe) daom are mie cow oo teem Ohms S2ers com Euan consuna -caycar core) Ih cone) EBSA He NCEP CNEIMOYCEPEONEUNTIIOM teen YI) CONSE PORT FOV Bijiies Raswons — O50 SD dependent vw SCHON Seimmecsen, ets Samsqwucence 1 RECS Figura 6-27 El sistema estimado seré el siguiente: C, =-1613994 + 0,340337Y, + 0,509783Y,,, +1, IM, = -5985962 + 1,225577C, -0,900709C, , + 0,628922X, +3, ¥,=C,41,+X,-M, ‘Si queremos la estimacién por mfnimos cuadrados en tres etapas (MIC3E). hacemos clic en Estimate y en 1 campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Three Stage Least Squares (Figura 6-28). Al pulsar Aceptar se obtiene Ta estimacién por MCSE de las dos ecuaciones del sistema de ecuaciones simultineas (Figura 629). Se observan resultados bastante parecidos al método MC2E. El sistema estimado es ahora: 206+ © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL C, = -1605035 + 0,322988Y, +0,527328Y, , +, IM, = -5501116 + 1,167781C, —0,874569C,_, + 0,682209X, +u,, ¥, =C,+1,+X,-IM, So al PEE EE oe meegay etre Enea Met Figura 6-28 Figura 29 Si queremos la estimacién por maxima verosimilitud con informacién completa (MVIC), hacemos clic en Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Full Information Likelihood (Figura 6-30). Al pulsar Aceptar se “obtiene la estimacién de las dos ecuaciones del sistema de ecuaciones simultineas (Figura 6-31). Se cobservan resultados bastante parecidos a Jos métodos anteriores y los mismos problemas. El sistema ‘estimado es ahora —1605038 + 0,434577Y, +0,412792Y,, +u,, 5601114 + 0,74C, ~0,431656C,., + 0,6668154X, + 1, +1, +X, -IM, sear AC peti Figura 6-30 Figura 6-31 © MTES-Paraninfo 287 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Todos los métodos que hemos utilizado nos Hevan a una solucién parecida. Pero en todos los casos arrastramos el problema de Ia autocorrelacién, Luego, lo mejor es estimar cada ‘ecuacién por separado mediante el método MC2E ya que ambas estin sobreidentificadas ‘Como la primera ecuacidn esté sobreidentificada, utilizaremos el método MC2B. Para clo se elige Quick — Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de ta solapa Specification, se elige TSLS-Two stage Least Squares (TSNLS ‘and ARIMA) en el campo Method para ajustar por minimos cuadrados en dos etapas (Figura 6-32) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 6-33 donde se observa un valor del cestadistico de Durbin Watson sospechoso de autocorrelacién inner © i) CSM PORT = Figura 632 Figura 633 Ahora podemos probar formalmente si nuestro ajuste presenta autocorrelacién. Podemos utilizar el contraste de Breusch Godfrey mediante View —» Residual Tests —» Serial Correlation LM Test (Figura 6-34) con un retardo (lag) cuyo p-valor de la Chi-cuadrado es inferior a 0,05 (Figura 6-35), lo que indica presencia de autocorrelaci6n, ‘Settee + Fr ogcters Serr” KSEE Bier Figura 6-34 Figura 6-35 Para estimar el modelo sin autocorrelacién se elige Quick —» Estimate Equation, se escribe Ia ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification con un término adicional AR(I), se elige TSLS-Two stage Least Squares (TSNLS and ARIMA) en el ‘campo Method para ajustar por mfnimos cuadrados en dos etapas Figura 6-36) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 6-37 donde se observa una buena significatividad de los coeficientes y un valor del estadistico de Durbin Watson cercano a 2, lo que elimina las sospechas de autocorrelacién, 2086 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL sie tapterta a el ome oe haa igri rorsase Fre one Figura 6 36 Figura 6 37 Ahora, mediante View — Residuals Test > White Heteroskedasticity (Figura 6-38) se ‘obtienen p-valores de F y Chi mayores que 0.05 (Figura 6-39), luego no hay heteroscedasticidad, Semen Fe aganen Tet Eto wi === serosa ioe iecewes fee = Figuea 6-38 Figuea 6-39 ‘Como Ia segunda ecuacién esta sobreidentificada, utilizaremos el método MC2E. Para ello se elige Quick —» Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de 1a solapa Specification, se elige TSLS-TWwo stage Least Squares (ISNLS ‘and ARIMA) en el campo Method para ajustar por minimos cuadrados en dos etapas (Figura 6-40) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 6-41 donde se observa posible autocorrelacién, Para este ajuste, el contraste de Breusch Goditey obtenido mediante View —> Residual Tests ~» Serial Correlation LM Test (Figura 6-42) con un retardo (lag) cuyo p-valor de la Chi-cuadrado es menor que 0,05 (Figura 6-43), indica presencia de autocorelacién, Para estimar el modelo sin autocorrelacidn se elige Quick —> Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification con un término adicional AR(I), se elige TSLS-TWwo stage Least Squares (TSNLS and ARIMA) en el campo Method para ajustar por mfnimos cuadrados en dos etapas (Figura 6-44) y se hace clic en Aceprar. Se obtienen los resultados de la Figura 6-45 donde se observa una buena significatividad de los coeficientes y un valor del estadistico de Durbin Watson cercano a 2, lo que elimina las sospechas de autocorrelacién, © MTES-Paraninfo 29 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS (anrelisnasaet) Fates Toots Lt Saves Da O80105 Tr 1316 Sarge 171 167 Ince hoes 2 set gman ‘petitions theses orb tbcee ‘Fhe narngmnia bar anne ona ‘sie one SCremendem or 303 Srowasge see Sater? Figura 640 Figura 6-41 hglacaitsyaee uote eget nes Figura 6-42 Figura 6-43 Stiotaer ct menertewebovehess frees cee Des mater rereaabrhitne ed (Ts tiene TNS a ||) tae Zar ewe IST rail famun SEMA ee Cese] Ceoe)] Figura 6-44 Figura 6-45 ‘Ahora, mediante View —» Residual Tests ~» White Heteroskedasticty (no cross terms) (Figura 6-46) se obtienen p-valores de Fy Chi mayores que 0,05 (Figura 6-47), luego no hay heteroscedasticidad, 2906 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL Sone” fenanire Moe] EXERT Ky tae Tnereaat Se? eoesuwe) ‘atte ari 08 Samoa? Soo AEST om ae anes 35cen: Figura 6-46 Figura 6-47 Segiin las Figuras 6-37 y 6-45, el sistema estimado definitivamente es: CC, =-1524269 + 0,403Y, + 0.441Y, , +0,53u,,. +6, IM, = ~18286308 + 1,085, -0,345C, , +0,49X, +0,91u,,., +e), ¥,=C,+1,+X,-IM, 6.3. Consideramos el archivo 6-3.wf1 que contiene informacién correspondiente al perfodo 1970- 1997 relativa a las macromagnitudes: Gasto piblico (G), Consumo privado nacional (C), Importaciones (IM), Renta (¥), Recaudaci6n directa (T), Exportaciones (X) Inversién privada nacional (J). Supongamos que los agregados macroeconémicos anteriores pueden relacionarse segtin el siguiente sistema de ecuaciones simulténeas ampliacién del modelo del problema anterior: C=O, FY, $00.4 + ,7, +, 1 =B +BY. +My, T= 14 1¥, ty IM, = 6, +6,Y, + 6,Y,, + 5M, + Uy ¥,=C,41,+G,+X,-IM, Realizar la identificacién de los pardmetros del sistema a través de las condiciones de orden y de rango y estimar Ia forma estructural del modelo utilizando métodos robustos a Ia heteroscedasticidad y a la autocorrelacién, SOLUCION: El modelo de ecuaciones simulténeas tiene 5 variables endégenas (C,, J, T, IMs ¥), es decir, G = 5. También tiene 6 variables predeterminadas (C;, Yi IM,1 X, G:y la constante), por lo tanto K = 6. Ademés, la tabla siguiente muestra los valores para la identificacién de las dos ecuaciones a través de la condicién de orden. © MTES-Paraninfo 291 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Variables | Variables Vaiables ‘Variables Taentficacion endégenas | exégenas | predeterminadas | predeterminadas incluids | inchuidas (G-g) | incluidas @ | excluidas (K-2) (2) Primera 3 5322 2 62a4 eeuncién Segunda 1 sae 2 62-4 cuacion Tercera 2 5253 1 G1=5 ecuacién Cuarta 2 5253 3 6353 Kk=3>g1=1 ecuacién. Sobreidentificada Vamos a realizar ahora 1a identificacién del sistema de ecuaciones simulténeas a través de la condicién de rango. Sea A la mattiz G x (G + k) de todos los coeficientes estructurales. Como: C20, 4Y, +0,C,, 40,7, +H, CaP -a,Y,, =O, FOC, ty 1, = B+ BY, +a, 1, = B+ BY, + Ur, 1+ Y, + Us, ST NY, = 1 tus, IM, =6,+5,¥, +6,¥,,+5,IM,,+u, — |IM,-6,Y, = 6, +6,Y,,+5,IM,, +uy ¥,=C,+1,+G,+X,-lM, -C,-1,+1M, +¥, =G,+X, tenemos: Cc 1 TM, Y¥, Ce Cy %4 M, G X, 1 0 -a@, 0 -@, -a, -a, 01000 -£ 0 00 1 0-7, -% 0 00 0 1-6 -5 0 -11 0 1 1 0 0 Ahora calcularemos los rangos de la submatrices de las variables excluidas en la ecuacién que se quiere identificar. Para la primera ecuacién ese rango es 3 < G-l = 4, como hay més de un determinante de orden 3 distinto de cero, la primera ecuacién resulta exactamente identificada. Para Jas restantes ecuaciones ese rango es 4 = G-l, pero como en todos los casos hay mas de un determinante de orden 4 distinto de cero, las tres restantes ‘ecuaciones resultan sobreidentificadas. Como hay una ecuacidn exactamente identificada y Ias otras tres ecuaciones estén sobreidentificadas, realizaremos la estimacién del modelo de ecuaciones simulténeas mediante el método MC2E, Pero como el problema pide Ia estimacién mediante métodos robustos a la heteroscedasticidad utilizaremos MC2E ponderados. 29260 ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL Para realizar 1a estimacién de las cuatro ecuaciones por MC2E ponderades con Eviews, en primer lugar diseiiamos el sistema de ecuaciones. Para ello elegimos Object —» New Object + System y le damos el nombre SYS3 (Figura 6-48). Pulsamos OK y en la pantalla System se escriben las ecuaciones del sistema y todos los posibles instrumentos (variables predeterminadas) tal y como se indica en Ia Figura 6-49. A continuacién pulsamos el botén Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Weighted Two Stage Least Squares (Figura 6-50). Al pulsar Aceptar se obtiene la estimacién por MC2E de las cuatro ecuaciones del sistema de ecuaciones simulténeas (Figuras 6-51 y 6-52). Se observa buena significatividad de los coeficientes estimados salvo la constante CG) y C(4), buenos coeficientes de determinacién y estadisticos de Durbin Watson bastante lejanos de 2 para las tres primeras ecuaciones, lo que indica que podrian existir problemas de autocorrelaci6n serial. Como no se salva el problema de la autocorrelacién, serfa conveniente estimar por mfnimos cuadrados en dos etapas cada una de las ecuaciones por separado corrigiéndolas de autocorrelacién con la introduccién de los términos AR y MA necesarios y de heteroscedasticidad tal y como se hizo en el problema anterior. Alternativamente, puede utilizarse el Método Generalizado de los Momentos GMM con correccién de White (Figura 6-53). Los resultados de la estimacién son Jos mostrados en. as Figuras 6-54 y 6-55. Se observa buena significatividad de los coeficientes estimados salvo CG) y CA), buenos coeficientes de determinacién y estadisticos de Durbin Watson bastante lejanos de 2 para las tres primeras ecuaciones, lo que indica que podrian existir problemas de autocorrelacién serial. Este tltimo método mejora la significatividad de la constante. Los resultados de la estimacién por ambos métodos no difieren demasiado. ee ere eee TI = ne ere iad pm, los loa) betaleoslos len cea CoyCPANE COT Sry scyryeycarNP 3) Ne VCD WPE} OH Figura 6-48 Figure 6-49 ‘emo Note Vhs Te Sap Let Saas [far Guinan stacey scr me ‘ae : = a =, 3 toe oa s = a = ee 3 = ; i = Figura 6-50 © ES Paraninioe 298 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS SS. et mae Figura 659 Sipe Wt ar rtd oboeetin: 7 Tea syste ic ost 102 Sens toon met Ovass “Sra ont ese Dyas S279) DOME ‘tae Nene RECO Figura 6-54 Figura 6-55 Podtfamos realizar también Ia estimacién por minimos cuadrados en tres etapas (MC3E). Para ello hacemos clic en Estimate y en el campo Method de la solapa Estimation Method de la pantalla System Estimation elegimos Three Stage Least Squares (Figura 6-56). Al pulsar Aceptar se obtiene Ja estimacién por MC3E de las tres ecuaciones del sistema de ecuaciones simulténeas (Figuras 6-57 y 6-58). Se observan resultados bastante parecidos a los de los métodos anteriores. El sistema estimado es: C, = 1431507 +0,283299Y, +0,501902C, , +0,0179497, + u,, I, =174710,1+0,231655Y,_, +13, T, = -12210402 + 0,474571Y, + us IM, = ¥,=C,+1,+G,+X,-IM, 2946 © ITES-Paraino 1814481 + 0,631648Y, -0,571591Y, , +.0,976751IM,_, +1, MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL Tomar an Oe heses i a tenetatwnaens Cee) 03 Derere) asian “teamed 5000 Figura 6-56 BRRRICH YEN MLN ox ‘Eten a-Oa) SUPT sORFYED Structure/Resize Current Page (Figura 6-61) y en la pantalla Workfile Structure elegimos Dated Panel como tipo de estructura de datos, la variable STATE como identificador de la secci6n eruzada del panel y la variable YEAR como temporal. El resto de Jos campos los dejamos con sus valores por delecto (Figura 6-62). Al pulsar OK ya tenemos el cconjunto de datos 6-4.w/l con estructura de datos de panel. ge Parlier cae fetta (eae ae ‘Cross-section eee a 2 =e = ee i Ber aor ie. ci Figura 6-61 Figara 6-62 2966 © ITES-Paraino MODELOS DE ECUACIONES SIMULTANEAS Y SISTEMAS, SISTEMAS DE DATOS DE PANEL Como estamos estimando una ecuacién de un sistema de panel comenzaremos eliminado los efectos inobservables mediante la transformacién de la primera diferencia: Alog(crip,) = 8, + a,Alog(pris,) + 0,Alog(inep,) + @,Alog(polpe, ) ‘que segtin la notacién de las variables del fichero se representa como sigue: scrip, = 8, + a, gpris, + &,ginep, + a,gpolpe, Para estimar un panel de coeficientes constantes con nuestro datos, se elige Quick > Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de 1a solapa Specification, se elige Least Squares en el campo Method para ajustar por minimos cuadrados (Figura 6-63), se rellena la solapa Panel Options como se indica en Ia Figura 6-64 (sin especificacién de efectos ni ponderaciones) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 6-65 donde se ve un estadistico de Durbin Watson razonable, buena significatividad individual (salvo la constante) y conjunta y bajo R°. Si se especifica Ia ecuacién sin constante (Figura 6-66), se obtienen las estimaciones de la Figura 6-67, donde todos los parémetros son significativos individualmente y elestadistico de Durbin Watson sigue siendo razonable. También se puede utilizar como método de estimacién MC2E Figura 6-68) utilizando como instrumento de gpris Ia variable govelec (variable binaria que vale 1 si se lleg6 a un veredicto gubernamental en el ltigio de superpoblacién) y como instrumentos de Jas restantres variables explicativas elas mismas (Figura 6-69). Al hacer clic en Aceptar se llega a Jas estimaciones de la Figura 6-70 que son muy similares a las anteriores. ferret ry aearr ato —— a 2 A eS Figura 6-63 Figura 6-64 Bice Ge ie ie | a ee) Figura 6-65 Figura 6-66 © ITES-Pareninfo« 297 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Sees Se sect Coa rb ot poe ee ae Cee) Cece 2906 © ITES-Parainto Figura 6-67 Figura 6-69 Lette atria credo tee Ce ce) Figura 6-68 Fcineons nitmebes)tereceoezaline) | TS Sedan Soe Figura 6-70 El modelo estimado con coeficientes constantes por MCO resulta ser el siguiente: gcrip, = -0.191064gpris, +0,152975gincp,, + 0,082419 gpolpc, EI modelo estimado por MC2E resulta ser el siguiente: scrip, = -0,182225 gpris,, +0,145139 gincp, + 0.082219 gpolpc, EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS 7.1__MODELOS DE VARIABLE DEPENDIENTE LIMITADA La expresién funcional del modelo de anélisis de la regresién miltiple es Y= F(X,%2,"++4X,). La regresién multiple admite la posibilidad de trabajar con variables dependientes cuyo rango de valores esté restringido (variables binarias con valores 0 y 1, variables con valores enteros positivos, etc.). En general, los modelos que admiten variables dependientes con rango restringido se denominan modelos de variable dependiente limitada. La mayoria de las variables econémicas que se analizan presentan valores que estn limitados de alguna manera, en muchas ocasiones porque deben ser positivos. Por ejemplo, el salatio por hora, los precios de las viviendas, y los tipos de interés nominales deben set mayores ‘que cero, Pero no todas esas variables requieren un trato especial. No suele ser necesario ningiin modelo econométrico especial para tratar las variables que son estrictamente positivas pero que toman muchos valores diferentes. Cuando la variable dependiente es discreta (modelos de elecci6n discreta) y toma un reducido mimero de valores, no tiene sentido que Ia tratemos como si fuera una variable aproximadamente continua. El hecho de que la variable dependiente sea discreta no implica necesariamente que los modelos lineales no sean apropiados. Sin embargo, para respuestas binarias (modelos de eleccién binaria), suelen utilizarse los modelos Logit y Probit y en ciertos casos el modelo lineal de probabilidad. También para respuestas multiples (modelos de eleccién miitiple) se wtilizan los modelo logit y probit. Otro ejemplo importante de variable dependiente limitada es la variable de recuento, que toma valores enteros no negativos. Un modelo de datos de recuento es aquel que tiene como variable dependiente una variable discreta de recuento que toma valores enteros no negativos. Los ‘modelos de regresién de Poisson son apropiados para analizar las variables de recuento. En el andlisis econométrico, aparecen otros tipos de variables dependientes limitadas, especialmente cuando analizamos el comportamiento de individuos, familias, 0 empresas. Por ejemplo, supongamos que durante un afio concreto una gran cantidad de familias de una regién no realiza ninguna donacién caritativa. Por tanto, la distribucién de la poblacién de las donaciones que realizan las familias esté muy dispersa sobre valores positivos, pero con una alta concentracién en el valor cero. Estamos aqui ante un ejemplo de solucién de esquina. El modelo Tobit esta disefiado explicitamente para variables dependientes que presentan soluciones de esquina, Estas variables valen cero para una proporcién de la poblacién considerable pero se distribuye de forma aproximadamente continua para los valores positivos, Otro tipo de variables dependientes limitadas son las originadas por Ia censura de datos. Un modelo de regresién censurado es aquel cuya variable dependiente esté censurada por encima (censura superior) © por debajo (censura inferior) de algin valor, es decir, la variable dependiente no se observa para una parte de la poblacién. En los modelos de regresién censurados la variable dependiente subyacente es aproximadadmente continua, pero estd censurada inferior 0 superiormente, debido a la forma en que recopilamos los datos 0 a limitaciones institucionales. Un modelo de regresién truncada es parecido a un modelo de regresin censurada, pero tiene alguna diferencia importante: en un modelo de regresién truncada, no disponemos de los datos acerca de algxin segmento importante de la poblacién. Normalmente, esto ocurre cuando el objetivo de una muestra es un subconjunto concreto de la poblacién y, quizé porque es costoso, ignora al resto de la poblacién, Se trata de un caso particular del problema general de la seleccién ‘muestral, donde observamos una muestra no aleatoria de la poblacién subyacente, 900+ © ITES-Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Podemos usar los modelos de variables dependientes limitadas para series temporales y datos de panel, pero son més frecuentes en datos de corte transversal. Los problemas de seleccién muestral surgen normalmente con datos de corte transversal y datos de panel. 7.2__MODELOS DE ELECCION DISCRETA La expresién funcional del modelo de anilisis de la regresién miiltiple es (.%,07%,). La regresién multiple admite 1a posibilidad de trabajar con variables dependientes discretas en vez de continuas para permitir la modelizacién de fenémenos diseretos. Cuando la variable dependiente es una variable discreta que refleja decisiones individuales en las que el conjunto de eleccién esta formado por alternativas separadas y mutuamente excluyentes estamos ante los modelos de eleccién discreta. Cuando Ia variable dependiente es disereta y toma s6lo un nimero pequefio de valores no tiene sentido tratarla ‘como si fuera una variable continua y suele interesar caracterizar la probabilidad de que un agente tome una determinada decisién discreta, condicional a los valores de ciertas variables explicativas. Estas funciones de distribucién que caracterizan probabilidades para cada valor de las variables explicativas suelen ser no lineales y no suelen tener solucién analitica por lo «que suele ser necesario recurrir a métodos numéricos We Los modelos de eleccién discreta en los que el conjunto de eleccién tiene slo dos alternativas posibles se Haman modelos de eleccién binaria. Cuando el conjunto de eleccién tiene varios valores discretos nos encontramos ante los modelos de eleccién milltiple 0 ‘modelos multinomiales, Los modelos de eleccién disereta se denominan modelos de datos de recuento cuando los valores de la variable dependiente disereta son ntimeros que no reflejan categorias. En caso de que los valores numéricos de la variable dependiente discreta reflejan categorfas los modelos se denominan modelo de eleccién discreta categéricos, y suelen clasificarse en modelos de eleccién discreta categoricos ordenados (los valores numéricos no tienen significado cuantitativo y reflejan un orden de categorias) y modelos de eleccién discreta categéricos no ordenados (los valores numéricos reflejan Gnicamente categorias), 7.3__MODELOS DE ELECCION DISCRETA BINARIA Dentro de los modelos de eleccién discreta en los que el conjunto de eleccién tiene s6lo dos alternativas posibles mutuamente excluyentes, consideraremos el modelo lineal de probabilidad, el modelo Logit y el modelo Probit. 7.3.1. Modelo lineal de probabilidad Partimos del modelo de regresi6n lineal habitual Y=A+AX,+BX+.4+AX, 46 tuna de cuyas hipstesis es EX Kays Jo que nos lleva a escribir el modelo como: EU X yo Xp Bt BX + BX ABX, © MTES-Paraninfo 301 EOONOMETRIA, CONCEPTOS Y PROBLEMAS RESUELTOS Pero en el caso de los modelos de eleccién discreta en los que el conjunto de eleccién tiene sélo dos alternativas posibles mutuamente excluyentes, ¥ es una variable aleatoria de Bernouilli de parémetro p, lo que nos permite escribir: BOX yyy Xp) = PWR UX oo X= AA AK, + BX yt ABX Estamos ahora ante el modelo lineal de probabilidad, donde, por ejemplo, £4 mide la variacin en la probabilidad de “éxito” (Y = 1) ante una variaci6n unitaria en X, (con todas las dems variables constantes), Como ¥ es una variable aleatoria de Bernouilli VOR eX.) = PO=IK on X (IPO Tenemos entonees: Y=By+ BX, +B,X) ++ BX, tusu= ~ By + BX, + ByXy tot BX Vu) =Vl ~ By + BX, + B,Xy to BX V=VL |X jo Xe) ppara cada observacién V(u) = p(-p) yaque ¥ es una variable aleatoria de Bernouill, Estamos entonces ante un modelo con heteroscedasticidad porque la varianza del error no es constante, ya que para cada valor de X,,...Xj, la varianza del error tiene un valor diferente (V(u) no constante). Ademés, ¥ es una variable de Bernouilli, con lo que tampoco se cumple la hipétesis de normalidad. Ello obliga a estimar estos modelos por un método alternativo a minimos cuadrados ordinarios, por ejemplo, utilizando estimadores maximo verosimiles, de minimos cuadrados generalizados robustos a la heteroscedasticidad (White) Realizada la estimacién del modelo lineal de probabilidad tenemos que: Pa At Ax rAxrtAx, =P se puede interpretar como una estimacién de la probabilidad de “éxito” (de que Y= 1). En algunas aplicaciones tiene sentido interpretar 8, como la probabilidad de éxito cuando todas las X; valen 0. tra limitacién importante del modelo lineal de probabilidad es que para ciertas combinaciones de las variables explicativas X;,...X., las probabilidades estimadas pueden ser mayores que cero 0 menores que uno. 7.3.2 Modelos Logit y Probit Podemos considerar los modelos Logit y Probit como modelos de respuesta binaria: PUP =X, Xgoe Xp) = GB, + BX, + BX3+-ABX,) ‘que, para evitar los problemas del modelo lineal de probabilidad, se especifican como ¥ = G(XB), donde G es una funcién que toma valores estrictamente entre 0 y 1 (00,5 nuestra prediccién seré que ¥, es 1 y si P $0.5 nuestra prediceién seré que Yes 0. El % de veces en que el valor de ¥; observado coincida con Ia prediccién es el % de predicciones correctas. Lo interesante es calcular por separado el % de predicciones correctas de ceros y de unos 904 © ITES-Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Pseudo — R* (de McFadden): Esta basado en el logaritmo de la funcién de verosimilitud: uh) uh) Pseudo —R’ donde 1() es el logaritmo de la funcién de verosimilitud para el modelo estimado y 1(A,) el de un modelo s6lo con término constante. Como [1(B)| < |/(By)|. el valor Pseudo — R° esté entre 0 y 1. Criterios de Informacién: Son medidas que tratan de buscar un equilibrio entre la bondad del ajuste, medida en base al valor del logaritmo de la funcién de verosimilitud, y una especificacién parsimoniosa del modelo (Ejemplos: Akaike (AIC), Schwarz (SC) y Hannan-Quinn (HQ). Se escoge el modelo con menor valor del critetio de informacién, A la hora de interpretar las estimaciones en los modelos Probit y Logit, generalmente Jo que nos interesa es conocer el efecto de variaciones en una variable X; sobre la probabilidad de respuesta, que si la variable es continua seré: aor =1x)=[exAé, Como g(Xf) depende de X habré que calcular los efectos parciales para valores interesantes de X (las medias muestrales, valores maximos y mfnimos de las variables de interés, etc.). También se puede calcular el efecto parcial para cada individuo y después caleular su media, El efecto parcial de una variable continua X, sobre la probabilidad de respuesta P(Y = 1|X) BPO =I) _ Or (XB, donde g(.) es la funcién de densidad de la logistica (logit) 0 de la normal esténdar (probit) Este efecto varia de individuo a individuo. Como en el caso del Probit y del Logit, g(2)>0 para todo z, el signo del efecto parcial de X;es el mismo que el de El efecto relativo de dos variables continuas X, y Xy no depende de X. Notese que 1 cociente de los efectos parciales es 8 /f. Si X;, por ejemplo, es una variable explicativa fietici el efecto parcial de que varie de 1 a0 vendra dado por: GB + B+ BX +. ABX)- GAB + BX + 4ABX) que también varia de un individuo a otro, pues depende de los valores de todas las X,, ‘Como en el Probit (0) ~ 0,4, en el Logit g(0) ~ 0.25 y en el MPL g(0) = 1, se puede obtener la siguiente relaciGn entre las estimaciones: Brose = Bose Bays * Bar © MTES Paraninfo 305 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS 7.4__MODELOS DE ELECCION MULTIPLE Los modelos estudiados hasta ahora son modelos de elecci6n discreta en los que el conjunto de elecci6n tiene sdlo dos alternativas posibles y que se Haman modelos de eleccién binaria, Pero cuando el conjunto de eleccién tiene varios valores discretos nos encontramos ante los modelos de eleccién miitiple o modelos multinomiales. Estudiaremos a continuaci6n los mas habituales, 7.4.1 Modelo Logit Multinomial El Modelo Logit Multinomial es una extensi6n del modelo binario para el caso en el que la respuesta, “desordenada”, tiene mas de 2 posibilidades. Sea (X,, ¥}) una muestra aleatoria de la poblacién (= 1. 0). Al igual que en el caso binario, lo que nos interesa es saber cémo afectan los cambios en Jos elementos de X a las probabilidades de respuesta: PU = FX Xa X VS PW HX) F= Oded En el Modelo Logit Multinomial las probabilidades de respuesta son: exp(X/ por = j]x)=—2CB) yx.) f= Oded 1+ Yexp(XA,) Py =0X)= + __= px.) 14¥ exp(XA) Si J=1 , estamos en el caso binario. En estos modelos los efectos parciales son complicados y ni siquiera el signo del parémetro nos da el signo del efecto. Si Xj es continua, el efecto parcial seré: PHP «rer = 0. AestsA)|/ 20%} donde fy-es el elemento k-ésimo de By: aX P)=14Y, exp(XA,) El odds ratio o riesgo mide la probabilidad de elegir Y= j en lugar de ¥=0 y viene dado mediante: PU= IX) _ P(X) PIY=OX) p(X.) =exp(XB) se tiene: 906+ © ITES-Parainto MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO (XB) 22 perf Ademés, el logaritmo de odds cumple: to{ 2A) XB, PAX), y por tanto: 20) Allog{ 7! = ByDX, (iia)? En general 2D) oy =X ox Oy con Jo que el cociente de probabilidades de eleccién entre 2 alternativas (Y= jen lugar de Y=) 3 independiente del resto de alternativas (independencia de alternativas irrelevantes IAD) En general, la probabilidad de elegir j, si la elecci6n es entre j y h, sigue un modelo Logit estindar con vector de parémetros 6 - fi exfX4 -AD] PUY = j¥ = jo¥=h,X)=A[X(B,-A)| iren(XA-Al] El Modelo Logit Multinomial se estima por méxima verosimilitud. El logaritmo de la funcién de verosimilitud condicional viene dado por: YL 1p) Jlogtp,(X,,B)) y en general obtendremos estimadores consistentes y asint6ticamente normales. 7.4.2, Modelo Logit Con ional EI Modelo Logit Condicional se utiliza para problemas en los que las elecciones del individuo (0 empresa) se realizan, al menos en parte, en base a los atributos observables de cada alternativa, En el Logit Multinomial, las variables explicativas no cambian entre alternativas, es decir, para cada i, X; contiene variables especificas del individuo, no de las alternativas y es apropiado para situaciones donde las caracteristicas de las alternativas no son importantes (0 no las observamos). En el Modelo Logit Condicional, para cada i, X, contiene variables especificas del individuo y de las alternativas y es apropiado para situaciones donde se observan las caracteristicas alternativas, Supongamos que disponemos de una muestra aleatoria de tamaiio n de Ia poblacién subyacente (= I,..., 7). La utilidad de elegir la alternativa j es: X,Bra, f= O12,.c donde a, son inobservables que afectan a los gustos y Xj varfa entre alternativas (y puede que también entre individuos) pero no puede contener elementos que slo varfen entre individuos (no contiene término constant). © MTES-Paraninfo 307 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS ‘Como ejemplo podemos considerar el tiempo que tarda en Ilegar al trabajo el individuo i que ‘emplea el medio de transporte jo el coste del transporte j (que puede o no variar entre individuos) Silas perturbaciones a se distribuyen independientemente con distribucién Weibull con: F(a) = expl-exp(-a)] centonces el Modelo Logit Condicional se expresa como sigue: exp(X,8) Y exp(X,,8) PU, = 4X) =p, = Los efectos marginales se expresan como sigue: x) ae POU p(B F= 0M. JK M eK x) PM pp. jth k= hon donde £5 el elemento k-ésimo de A La estimacién del Modelo Logit Condicional se realiza por el método de maxima verosimilitud. En el Modelo Logit Condicional también se cumple el supuesto de independencia de «alternativas irrelevantes IAI porque el cociente de probabilidades de eleccién entre 2 alternativas (Y= jen lugar de ¥=h) es independiente del resto de alternativas. Se tiene X,)_exp(X PAX) _exeXB) expl(X, —X,)A1 BAX) exp(X,) El supuesto de independencia de alternativas irrelevantes IAI, que se deriva del supuesto de independencia de las perturbaciones, es conveniente para la estimaciGn, pero puede suponer una imitacién, ya que en algunas aplicaciones con alternativas similares es poco realista, El supuesto de independencia de alternativas irrelevantes IAI supone que la probabilidad relativa de dos alternativas existentes no se ve afectada por la inclusién de una tercera alternativa, Se puede contrastar el supuesto de IAI empleando el un contraste sugerido en Hausman y McFadden. 7.4.3. Modelo Logit Anidado Enel Modelo Logit Anidado es un caso particular del Modelo Logit Condicional en el que se relaja el supuesto de IAI agrupando las J alternativas en L subgrupos de altemativas similares Se emplea mucho para modelizar decisiones de consumo. Se sigue manteniendo Ia 1AI dentro de ‘cada grupo pero no entre grupos, Se considera el proceso de eleccién como que primero se elige uno de los L grupos POYEG |X) y después, en ese grupo, la alterativa j PUY = j|¥EGX). El objeto de interés P(Y = j| X) se obtiene multiplicando las dos anteriores. 908 + © ITES-Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO EI Modelo Logit Anidado se puede estimar por el método de méxima verosimilitud con informacién completa (ambas decisiones) 0 en 2 etapas (Logit Condicional para Ia eleccién de cada j en cada grupo y después la probabilidad de elegir el grupo L), 7.4.4 Modelo Probit Multinomial Cuando en un Modelo Logit Condicional se puede relajar el supuesto de 1Al (independencia de alternativas irrelevantes) empleando modelos con supuestos mas flexibles sobre aj, puede obtenerse el Modelo Probit Multinomial como un caso particular suyo. Si supongamos que @y sigue una distribucién normal multivariante con correlaciones arbitrarias centre a, y ay (con jah) estamos ante el Modelo Probit Multinomial. Aunque este modelo es atractivo tedricamente, las probabilidades de respuesta son muy complicadas y Ia estimacién méximo verosimil es casi imposible con mas de 5 alternativas. Los avances econométricos recientes van haciendo més fécil el uso de estos modelos. 7.4.5 Modelo Probit y Logit Ordenados Los modelos de eleccién miltiple vistos hasta ahora no tienen en cuenta la naturaleza ordinal de ¥. A veces en los modelos de eleccién miiltiple Y es una respuesta ordenada y el valor asignado a cada alternativa no es arbitrario. Estamos entonces ante los modelos de respuesta ordenada. Por ejemplo, cuando Y puede reflejar Ia valoracién de un crédito es una escala de 0.a6. Sea ¥ una variable de respuesta ordenada que toma valores (0, 1,2, .... J}. El modelo Probit (0 Logit) ordenado para ¥ (condicionado a unas variables explicativas X) se puede derivar de un modelo de variable latente: XBte donde X no contiene constante, Beontiene k parémetros y e|X — N(0,1), Sean ay < a2 <... < ay puntos de corte (threshold parameters) desconocidos. Definimos Y¥=0 si Ysa, Y=1 si @a, La distribucién condicional de ¥ dado X vendré dada por: P(Y =X) = PUY" Sa|X) = P(X + €< a|X) = O(a, - Xf) PU =X) = Play < ¥" $ |X) = O(@, — XB)~ O(a, - XP) POY = J|X) = P(Y’ > at, |X) — ®(a, XP) Si J=1 tenemos el Probit binario con la constante ~a, incluida dentro de ®(.) (en los binarios solemos poner el punto de corte en cero y estimar Ia constante). Los parémetros ay se pueden estimar por el método de méxima verosimilitud. Si en vez de emplear () utilizamos la logfstica A(.) tendremos el Modelo Logit Ordenado. © MTES-Paraninfo 309 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Para el Probit Ordenado tenemos que los efectos parciales son: PD __ - “x, BG, ~ XB) PO - pio El signo de f s6lo determina el signo del efecto parcial para P(Y=0|X) y PO’=J|X), pero no para el resto, Podemos aplicar estos modelos de respuesta ordenada en casos en que ¥ tiene un sentido cuantitativo pero también nos interesa conocer Ia naturaleza de la respuesta ordenada disereta, En estos casos puede interesarnos conocer: E(YX) = a,P(Y = aX) + a, PCY = a\X)t.-ba, POY = |X) donde ao, a:, ..., a son los valores que toma la variable. Una vez que estimemos las probabilidades podemos estimar £(¥|X) para cualquier valor de X que nos interese. 7.5 _MODELOS DE DATOS DE RECUENTO Una tipologia importante de variable dependiente limitada es la variable de recuento, que toma valores enteros no negativos. Un modelo de datos de recuento es aquel que tiene como variable dependiente una variable discreta de recuento que toma valores enteros no negativos. Los ‘modelos de regresién de Poisson son apropiados para analizar las variables de recuento. También lo son los modelos de regresién Exponencial y los modelos de regresién Binomial Negativa Los modelos de datos de recuento se caracterizan porque no tienen, en general, un limite superior natural, toman valor cero para algunos miembros de la poblacién y suelen tomar ocos valores, Si ¥ es Ia variable de recuento y Xj, .... Xz son las variables explicativas, normalmente cestaremos interesados en: EX, X,)= BOX) En los casos en los que Y es estrictamente positiva podemos emplear la transformacién logaritmica log(¥) y usar el modelo lineal. Sin embargo, en los datos de recuento Y suele tomar valor cero para un porcentaje no despreciable de la poblacién. Con datos de recuento lo que se suele hacer es modelizar £(Y|X) eligiendo formas funcionales {que aseguren valores positivos para todo X y todo valor de los pardmetros. 7.5.1 Modelo de Regresién de Poisson Para datos de recuento, en que la variable ¥ toma pocos valores, lo més habitual es asumir que ¥ dado X;, .., Xz sigue una distribucién Poisson. La distribucién Poisson viene completamente determinada por su media, con lo que nos vale con especificar £(¥\X) 810+ © TES Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO expl-EQ IEG DOF PO = HX) fa h= 2a Una posibilidad que nos asegura valores positivos para todo valor de X y de los arimetros es modelizar la funcién esperanza condicional x(y{X) como una funcién exponencial: E(Y|X 0-5 X4) = exp(B, + BX, +.+B.Xy) = exp(XA) En este caso: POY = AX) = see ea PieseeSOT = 012, {que nos permite calcular las probabilidades condicionadas. ‘Tomando logaritmos tenemos que log EOX)= A, + BX,+.-+BX, = XB Iuego podemos decir que 100 x 8, ¢8 aproximadamente la variacién poreentual en (|X) ‘cuando X, varia en 1 unidad: GAE(Y|X) = 1008,AX,, Podemos interpretar los coeficientes como si fuera un modelo lineal con variable dependiente en logaritmo. Podemos medir la variacién % exacta en EX) ante una variaciOn unitaria de X;, por exp(B.)~1 EQX+) _ EX) xp(A,+ BX + exp(B, + BX) anorx)=( 7 100 } 100 = (exp(A) — 1) x 100 En base a los supuestos que hemos hecho sobre la distribucién Poisson y sobre la forma de esperanza condicional, podemos construir el logaritmo de la funcién de verosimilitud como: 1UB)=¥ X,B—exp(X,H)} donde se ha eliminado el término -log(¥;!) porque no depende def. Maximizando esta funci6n se obtiene el estimador MV de 8, que si la distribucién condicional de ¥ es Poisson y la E(Y{X) esti bien especificada serd consistente, eficiente y asintsticamente normal. A. partir de estas estimaciones se pueden obtener los errores esténdar de los B © MTES-Paraninfo 317 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS A veces la distribucién Poisson impone restricciones que no se cumplen en las aplicaciones empfricas. En concreto, en la Poisson todas las probabilidades y momentos de ‘orden superior estin determinados por la media, por lo que E(Y|X) = V(¥|X). Esta igualdad no se cumple en muchas aplicaciones. Sin embargo, aunque no se cumpla la distribucién Poisson, seguiremos obteniendo estimadores consistentes y asintéticamente normales de los B, sila media condicional esté bien especificada Cuando ¥ dado X;, .... X¢_no sigue una distribucién Poisson al estimador que se obtiene de maximizar el logaritmo de Ia funcién de verosimilitud: up) =y {¥X,B-exp(X,A)} se le llama estimador de cuasi mé:xima verosimilitud (CMV). Cuando estimamos por CMV si no se cumple el supuesto de E(Y|X) = V(¥|X) hay que ajustar los errores estandar para que sean vélidos, para realizar inferencia aunque Ia distribucién condicional de Y esté mal especificada, Una posibilidad para ajustar los errores estindar, es suponer que la varianza es proporcional a la media: VOY|X) = 0 EX) donde go” >0 es un parimetro desconocido. Si go’ =1 tenemos el supuesto sobre la varianza de la Poisson. Si o* > 1 tenemos sobredispersién, que es lo que sucede en muchas aplicaciones. Si o” < | tenemos infradispersién, que es raro en las aplicaciones empiricas. Bajo el supuesto de varianza proporcional a la media es féeil ajustar los errores estindar de la Poisson obtenidos por maxima verosimilitud. Habré que multiplicarlos por G= siendo 6? un estimador consistente de o* Ha¥-Y Faexp A+ AX+.ARX,) Los errores estindar asf obtenidos se llaman errores estiindar GLM (Generalized Linear Models). Estos errores estindar estin obtenidos bajo el supuesto de varianza proporcional a la media, pero también es posible obtener errores estindar para los estimadores de CMV del ‘modelo Poisson sin restringir la varianza. Bajo el supuesto de distribucién Poisson, para realizar contrastes de restricciones de exelusién, podemos emplear el contraste de razén de verosimilitudes: 1R = (By) - B,)) ‘que se distribuye asintoticamente como una Chi-cuadrado con q grados de libertad. Bajo el supuesto de varianza proporcional a 1a media, para realizar contrastes de restricciones de exclusién, basta con ajustar el contraste de Razén de verosimilitudes dividiéndolo por G del modelo sin restringir (estadfstico de CMV). Para medir la bondad del ajuste en estos modelos se puede emplear un R? definido como el cuadrado del coeficiente de correlacién entre ¥;¢ Y. Tiene la ventaja de que siempre estar entre 0 y 1 9120 TES Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO 7.5.2 Modelo de Regresién de Binomial Negativa Existen otros modelos de regresién para datos de recuento empleando distribuciones ‘que generalizan Ia Poisson, por ejemplo utilizando Ia distribuci6n Binomial Negativa. Estamos entonces ante el modelo de regresi6n de Binomial Negativa. Este modelo se emplea para casos de sobredispersién ya que se supone que V(Y|X) = 0 E(Y|X) = (14?) E(Y|X). En este caso se estiman los parémetros 8 y 77 conjuntamente por el método de méxima verosimilitud. Para {que las estimaciones sean consistentes y eficientes es necesario que se cumpla el supuesto de binomial negativa. Si estimamos para 7° fijo, las estimaciones serén consistentes si la E(Y|X) esta bien especificada. 7.5.3. Modelo de Regresién Exponencial En el Modelo de regresién exponencial se estiman los parimetro por maxima verosimilitud empleando a distribucién exponencial. Si Ia E(Y1X) esté bien especificada los estimadores serdn consistentes aunque la distribucién no sea exponencial (como otros ‘estimadores de CMV). Para obtener errores GLM se supone: V(¥|X) = 0 [E(Y|X))”. 7.5.4 Modelo de Regresién Normal En el Modelo de regresi6n normal se estiman los pardmetro por méxima verosimilitud empleando Ja distribucién normal, Para o fijo, si Ia E(Y|X) esté bien especificada los estimadores serén consistentes aunque la distribucién no sea normal. PROBLEMAS El archivo 7-1.wfl contiene datos de 753 mujeres casadas para 1975, de las cuales 428 participaron en el mercado laboral en algiin momento del aiio (inl/=1) y 325 no participaron (inlf=0). Se considera que la probabilidad de participar en el mercado de trabajo (inlf) depende de otras fuentes de ingresos (nwifeinc), de los afios de educacién (educ), de los afios de ‘experiencia laboral (exper y exper’), de la edad (age), del mimero de hijos de menos de 6 aiios (kidsl16) y del ntimero de hijos entre 6 y 18 afios (kids¢6) Mediante un modelo lineal de probabilidad analizar Ia dependencia de la probabilidad de participacién de la mujer en el mercado de trabajo en funci6n de las variables explicativas anteriormente definidas, SOLUCION: Plantearemos el siguiente modelo lineal de probabilidad (MLP): Inlf = f+ Pr nwifeinc + fy educ + Pyexper + Pu exper? + By age + i kidslt6 + Py kidsg6 ‘Comenzaremos realizando la estimaci6n del MLP mediante MCO. Para ello se elige Quick ~ Estimate Equation, se escribe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige LS-Least Squares (NLS and ARMA) en el campo Method para ajustar por minimos cuadrados ordinarios (Figura 7-1) y se hace clic en Acepiar. Se obtienen los resultados de la Figura 7-2 con buenas significatividades individuales y conjuntas para los pardmetros estimados (salvo quiz kidsge6). El R’ y el estadistico de Durbin Watson no son muy ‘buenos, pero tenemos que pensar que estamos estimando un modelo lineal de probabilidad © MES Pareninfos 313 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Figura 7-1 Pero el problema relevante en un MLP es la heteroscedasticidad. Mediante View — Residual Tests > White Heteroskedasticty (Figura 7-3) se obtienen p-valores de F y Chi menores que 0,05 (Figura 7-4), luego existe heteroscedasticidad. Utilizaremos entonces para ia estimacién un método robusto a la heteroscedasticidad, por ejemplo el de White. La estimacién mediante el método de White se haré ahora rellenando la solapa Options de la pantalla Equation Estimation como se indica en la Figura 7-5. Al hacer clic en Acepiar se obtiene Ia estimacién sin heteroscedasticidad de la Figura 7-6, me Sabo teste Condor aoe Exec wera AbintedR-saones 22579 SD tepenea Pleasant ane pups Osteen ees Persea || Ca eee | [emaeer 31460 (TES Paraino Figura 7-6 MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Salvo kidsge6 todas las variables son estadisticamente significativas y tienen los signos esperados. También se observa una fuerte significatividad conjunta, Al interpretar los coeficientes se observa que si aumenta la educacién en un afio (y las restantes variables permanecen constantes), la probabilidad de la mujer de participar en el mercado de trabajo aumenta en 0,038. El efecto de otras fuentes de ingresos (nwifeinc) es significativo, pero muy Pequefio, ya que si otros ingresos aumentan en una unidad, la probabilidad de la mujer de participar en el mercado de trabajo disminuye en 0,0034 (con el resto de los factores constantes). Al variar la experiencia en un afio, con el resto de los factores fijos, Ia variacién estimada en la probabilidad de la mujer de participar en el mercado de trabajo viene dada por 0,039-2(0,0006)exper. El punto en el que la experiencia no afecta a la probabilidad de participar (y a partir del cual cambia de signo la pendiente) es 0,039/0,0012=32,5 (s6lo hay 13 mujeres con exper>32). Al aumentar la edad en un aiio (con todo lo demés constante), la probabilidad de la mujer de participar en el mercado laboral se reduce en 0,016, Tener un hijo de menos de 6 afios més, reduce la probabilidad de la mujer de participar en el mercado de ‘trabajo en 0,262, para unos niveles dados de las demas variables. Tener un hijo entre 6 y 18 aiios, aumenta la probabilidad de Ia mujer de participar en el mercado de trabajo en 0,013, para niveles fijos del resto de las variables, Uno de los mayores problemas del MLP es que para ciertas combinaciones de valores de Jas variables explicativas, las probabilidades estimadas pueden ser menores que 0 0 mayores que 1. Podemos calcular para todas las mujeres de Ia muestra: B 586 ~ 0,0034nwifeinc + 0,038educ + 0,039exper = 0,0006exper* ~ 0,01 6age ~ 0,262kidsI16 + 0,013kidsge6 Para ello hacemos clic en Forecast y rellenamos la pantalla de prediceién como se indica en Ia Figura 7-7 (la variable inlff contiene los valores de P para las 753 mujeres de la muestra), Al pulsar Aceprar se obtiene la Figura 7-8 que representa P , observindose que hay valores superiores a Ia unidad e inferiores a 0). De hecho, si hacemos doble clic sobre la variable iniff en la pantalla Workfile, vemos sus valores. En la Figura 7-9 se observan algunos valores superiores a la unidad en la Figura 7-10 se observan valores menores que cero. En total hay 17 valores de P mayores que uno y 16 menores que cero. Otra incongruencia del MLP es que el efecto sobre la probabilidad sea el mismo para todos los valores de las variables explicativas. paar TITLED Sena as accutane Stactonce! ee tino neptiy let entsayn Se oom fonatanh aocatrcin Fecal Ce a aang aos CG Ee) © MES Paraninfos 315 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS fe Figura 7-9 Figura 7-10 7.2. Dadas las posibles deficiencias del modelo lineal de probabilidad, resolver el problema anterior utilizando un modelo Probit y un modelo Logit. Cuantificar e interpretar los efectos de las variables explicativas sobre la probabilidad de la mujer de participar en el mercado de trabajo de la forma adecuada SOLUCION: Plantearemos en primer lugar el modelo Probit: D(fy + By nwifeinc + P, educ + fs exper + Prexper* + fs age + fi kidslt6 + B; kidsg6) donde @ es la funci6n de distribuci6n de una normal (0,1). Inl ‘Comenzaremos realizando la estimacién mediante el modelo Probit. Para ello se elige Quick —» Estimate Equation, se escribe la ecuaci6n del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige BINARY-Binary choice (logit, probit, extreme value) en el campo Method, se elige Probit en el campo Binary estimation method para realizar 1 ajuste mediante el modelo Probit (Figura 7-11) y se hace clic en Aceptar. Se obtienen los resultados de Ia Figura 7-12 con buenas significatividades individuales para los pardmetros estimados (salvo la constante y kidsge6). La significatividad conjunta es muy alta porque el p- valor del estadistico de la razén de verosimilitud es muy pequefio. El Pseudo R’ de McFadden no se acerca demasiado a la unidad (0,22). Los valores de los eriterios de informacién (Akaike, Schwarz y Hannan-Quinn) son adecuados porque son bajos y muy parecidos. rapier wit ony binge Fc ee pe op? oe Mb eau ray ee as a sm Figura 7-1 Figura 7-12 916+ © ITES-Parainto MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Otro criterio para medir Ja bondad del ajuste del modelo Probit es el criterio del orcentaje de predicciones correctas que consiste en observar el porcentaje de veces en que el valor de ¥; observado coincide con su prediccién. Esta tarea se leva a cabo con Eviews mediante View — Expectation-Prediction Table (Figura 7-13). Al hacer clic en Aceptar se obtiene Ia salida de la Figura 7-14 en la que se observa que el modelo predice adecuadamente €1 73.44% de las observaciones. Se predicen mejor los unos (la participacién de la mujer en el ‘mercado de trabajo) con un 81,31% de aciertos frente a un 63,08% de la no participacién, Figura 7-1 Figura 7-12 Para cuantificar e interpretar Jos efectos de las variables explicativas sobre la probabilidad de la mujer de participar en el mercado de trabajo tendremos presente que el efecto parcial de una variable explicativa continua X, sobre la probabilidad de respuesta P(Y = 1X) es: PW =X) _ eee. a(XPB, ‘Como para cada observacién tenemos un efecto, evitaremos el célculo de 753 efectos calculando los efectos para las observaciones medias. Para ello caleulamos las medias de las variables del modelo selecciondndolas en la pantalla Workfile y abriéndolas como un grupo con el bot6n secundario del rat6n mediante Open — as Group (Figura 7-13). A continuacién se elige View + Descriptive Statistics Individual samples (Figura 7-14) y se obtienen los estadisticos descriptivos para todas las variables del modelo, incluida la media (Figura 7-15). Figura 7-13 Figura 7-14 © MTES Paraninfoe 317 ECONOMETRIA, CONCEPTS Y PROBLEMAS RESUELTOS Figura 7-15 Tenemos: iwifeine = 20.13 educ=12,29 exper = 10.63 age = 42.54 Kidsl6=0.24 idsge6= 135 ‘con lo que: educ + fexper + Byexper® + oA, + Anwifeine + + Aage + A,kidslié + f, kidsge6) = 0,391 = Funcién de densidad de la normal (0,1) Juego podemos obtener el efecto parcial estimado de las variables continuas, para los valores medios de las X, multiplicando los coeficientes estimados del modelo Probit por 0,391 Por lo tanto, un afio adicional de educacién aumenta la probabilidad de paticipar en el mercado de trabajo en 0,131x0,391 = 0,05. Al aumentar la edad en un aio la probabilidad de articipar se reduce en 0,02 (-0,053x0,391=-0,021). Al aumentar Ia experiencia en un afio, la probabilidad de participar varia en [0,123-(2x0,0019xexper}x0,391. Un aumento unitario en los ‘otros ingresos hace que la probabilidad de participar se reduzca en 0,005 (-0,012x0,391 = -0,05). También podemos calcular el efecto estimado al variar una variable discreta. Por ejemplo, para kidsli6 el efecto sobre la probabilidad de trabajar de pasar de tener 0 a 1 hijo (menor de 6 afios) es una reduccidn en 0,336 porque siendo ® = Funcién de distribucién de la normal (0,1) se tiene: (fh, + Anwifeine + feduc + exper + Bexper’ + fage + B, Kidsge6)— (fi, + Bynwifeine + f,educ + fi =0,660 ~ 0,324 = 0,336 xper + Byexper’ + fsage + fi, + fy kidsge6) = y el efecto sobre la probabilidad de trabajar de Ia mujer de pasar de 1 a 2 hijos (menor de 6 aitos) se reduciré en 0,23 Iporque: (A, + Anwifeine + Reduc-+ Rexper+ Rexper* + age + f+ AKidsge6)— (8 + Anwifeinc + Reduc+ Rexper + Rexper' + Rage +2, + Akidsge6) = =0324-0,093= 0,231 91860 ES-Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Ahora realizaremos la estimacién mediante ef modelo Logit. Para ello se elige Quick —» Estimate Equation, se esetibe la ecuaci6n del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige BINARY-Binary choice (logit, probit, extreme value) en el campo Method, se elige Logit en el campo Binary estimation method para realizar el ajuste mediante el modelo Probit (Figura 7-16) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 7-17 con buenas significatividades individuales para los pardmetros estimados (salvo la cconstante y kidsge6) al igual que en el caso del modelo Probit, La significatividad conjunta es muy alta porque el p-valor del estadistico de la razén de verosimilitud es muy pequeiio. El Pseudo R de McFadden no se acerca demasiado a la unidad (0.219). Los valores de los criterios de informacién (Akaike, Schwarz y Hannan-Quinn) son adecuados. Figura 7-15 Figura 7-16 Para la funcién logistic: <, @

Estimate Equation, se escribe 1a ecuaci6n del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige BINARY-Binary choice (logit, probit, extreme value) en el campo ‘Method, se elige Probit en el campo Binary estimation method para realizar el ajuste mediante el modelo Probit (Figura 7-20) y se hace clic en Aceprar. Se obtienen los resultados de la Figura 7- 21 con buenas significatividades individuales para los pardmetros estimados. La significatividad conjunta es muy alta porque el p-valor del estadistico de la raz6n de verosimilitud es muy equefio. El Pseudo K° de McFadden no se acerca demasiado a la unidad (0,053). Los valores de los ctiterios de informacién (Akaike, Schwarz y Hannan-Quinn) son adecuados porque son bajos y muy parecidos. A continuacién mediremos la bondad del ajuste del modelo Probit mediante el criterio del porcentaje de predicciones correctas. Esta tarea se leva a cabo con Eviews mediante View — Expectation-Prediction Table (Figura 7-22). Al hacer elie en Aceptar se obtiene la salida de la Figura 7-23 en la que se observa que el modelo predice adecuadamente el 87,73% de las observaciones, lo cual es muy aceptable. 9206 © ITES-Parainto MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Sesinane Qbah Clad Often Ge Figura 7-20 Figura 7-22 Figura 7-23 EI modelo Probit estimado resulta ser el siguiente (@ = funcién de distribucién NO,1)): P = approve = &(f, + B,white) = (0.546946 + 0,783946white) Siwhite =0 P =(,) = (0.546946) = 0,707792 Siwhite =1 P=@(A, + B,) = (0546946 + 0,783946) = 0,908388 Entonces se tiene que para un negro o un hispano (white = 0) la probabilidad estimada de que se les conceda el crédito hipotecario es de 0,707792, mientras que para un blanco es de 0.908388 = 0,707792+0,200596. Los resultados son los mismos que cuando se utilizé el modelo de probabilidad lineal. Para realizar la estimacién mediante el modelo Logit se elige Quick —> Estimate Equation, se esctibe la ecuacién del modelo a ajustar en el campo Equation Specification de la solapa Specification, se elige BINARY-Binary choice (logit, probit, extreme value) en el campo Method, se elige Logit en el campo Binary estimation method para realizar el ajuste mediante el ‘modelo Logit (Figura 7-24) y se hace clic en Aceptar, Se obtienen los resultados de Ja Figura 7-25 ea Figura 7-24 Figura 7-25 © MTES-Paraninfo 321 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS Se observan buenas significatividades individuales para los pardmetros estimados. La significatividad conjunta es muy alta porque el p-valor del estadistico de la razén de verosimilitud es muy pequeiio. El Pseudo R? de McFadden no se acerca demasiado a la unidad (0.053). Los valores de los eriterios de informacién (Akaike, Schwarz y Hannan-Quinn) son adecuados porque son bajos y muy similares. El modelo Logit estimado resulta ser el siguiente (A = funci6n de distribueién logistiea) PB vhite) = \(0,884685 + 1.409422 white) approve = \(B, + By P=A(B,) = A(O.884685 ) = 0.707792 &(B, + B,) = N(0,884685 + 1,409422) = 0,908388 Si white Siwhite = Entonces se tiene que para un negro 0 un hispano (white = 0) la probabilidad estimada de que se les conceda el crédito hipotecario es de 0,707792, mientras que para un blanco es de 0.908388 = 0,707792+0,200596. Los resultados son los mismos que cuando se utilizé el ‘modelo de probabilidad lineal y el modelo Logit. En un estudio sobre el sector turistico de la economia espafiola se ha especificado un modelo Logit para caracterizar los habitos de las familias espaftolas de los municipios de mas de 100000 habitantes. En dicho modelo la variable explicada ¥ toma el valor cero si la familia no va de vacaciones y el valor uno si la familia va de vacaciones, El modelo es el Logit siguiente 1 y, T¥e™ AX, NB, + BX a4 + BX 5 + BX a+ BX 4, donde X2 = renta familiar en millones de unidades monetarias anuales, Xs = tamaio del municipio en miles de habitantes, Xs = mimero de hijos y Xs = edad més uno del hijo menor que vive con la familia (vale 0 si ningtin hijo vive con la familia). El modelo estimado es ¥, = A(-0,375 + 0,0545 X,, + 0,0063 X,, -0,032X,, -0,257X,,) +, Sabiendo que las medias de Xo, Xs, Xs y Xs son 3,5 millones, 1,4 hijos, 276.8 miles de habitantes y 9.5 afios respectivamente se pide calcular la probabilidad de que una familia media vaya de vacaciones y de que una familia media que reside en Valencia (700 mil habitantes) se vaya de vacaciones. Calcular también el efecto marginal medio de la variable X>. SOLUCION: La probabilidad de que una familia media (con caracteristicas medias de ingresos familiares, tamaiio del municipio de residencia, mimeros de hijos y edad del hijo menor) vaya de vacaciones seré La probabilidad de que una familia media (con caracterfsticas medias de ingresos familiares, niimero de hijos y edad del hijo menor) que resida en Valencia (municipio con 700 mil habitantes) vaya de vacaciones seri: ¥ = A(X) = A(-0,375 + 0,0545 X,, + 0,0063 * 700 - 0,032 ¥, ~ 0,257 ¥,) = : Se = 0851 Trae aar RERTTIOS 9226 © ITES-Paraino MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO Para calcular el efecto marginal medio de la variable X; tendremos en cuenta que el efecto de Ia variable Xj viene dado en general por: OPW =IX)_ X, aXBB, En nuestro caso, como queremos el efecto marginal medio de X» tenemos: OPW =1|X) _ A(X, B) 8A, = APB, aX, ¥a-¥yA, =0,284( -0,284)0,054% d-e¥y 0.011 En un estudio sobre el sector turistico de la economia espaiiola se ha especificado un modelo Probit para caracterizar los hébitos de las familias espafiolas de los municipios de mas de 100000 habitantes. En dicho modelo la variable explicada ¥ toma el valor cero si la familia no va de vacaciones y el valor uno si la familia va de vacaciones. El modelo es el Probit siguiente: von donde X2 = renta familiar en millones de unidades monetarias anuales, Xs = tamaio del municipio en miles de habitantes, Xz = nimero de hijos y Xs = edad més uno del hijo menor proereatenn s ¥, = ®(B,+ BX, + BX y+ BX + BX) 4m, = ds+u, que vive con la familia (vale 0 si ningdin hijo vive con la familia), El modelo estimado es (-0,578 + 0,0537 X.,, + 0,0077 X,, - 0,039 ,, -0,301X,,) +, Sabiendo que las medias de Xo, Xs, Xs y Xs son 3,5 millones, 1,4 hijos, 276.8 miles de habitantes y 9.5 afios respectivamente se pide calcular la probabilidad de que una familia media vaya de vacaciones y de que una familia media que reside en Valencia (700 mil habitantes) se vaya de vacaciones. Calcular también el efecto marginal medio de la variable X>. SOLUCION: La probabilidad de que una familia media (con caracteristicas medias de ingresos familiares, tamaito del municipio de residencia, mimeros de hijos y edad del hijo ‘menor) vaya de vacaciones seré (® = funci6n de distribucién de una variable N(O,1)): (KB) = ©(-0,578 + 0,0837 X, + 0,0077 X, - 0,039 X, -0,301¥,) = © (-0,518 + 0,0537 *3.5+ 0,0077 #276,8 - 0,039 *1,4~ 0,301 *9,5) = @(-117279) Lea coin von La probabilidad de que una familia media (con caracterfsticas medias de ingresos familiares, niimero de hijos y edad del hijo menor) que resida en Valencia (municipio con 700 ‘mil habitantes) vaya de vacaciones seré ¥ = (Xf) = &(-0,578 + 0,0537 X, + 0,007 * 700 - 0,039 X, - 0,301 X,) = (2,0858) 0.981 oa 1 Oe Para calcular el efecto marginal medio de la variable X2 tendremos en cuenta que el efecto de la variable Xj viene dado en general por: © MTES Paraninfow 323 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS a =X) PUAN). axpyp, En nuestro caso, como queremos el efecto marginal medio de X» tenemos: APY =1|X) _ d@(X,B) za zp 1 PW =1 X) IEA) _ ox Kap, =. ax. 78 BOB, = WXPYA, Te 1 Cosmaasrssioomensoameamys! yume | 2 =e + B,=0,2006*0,0537 =| 0107 En un estudio sobre el sector turistico de Ia economia espafiola se ha especificado un modelo logit para caracterizar los habitos de las familias espafiolas de los municipios de mas de 100000 habitantes. En dicho modelo la variable explicada ¥ toma el valor cero si la familia no va de vacaciones y el valor uno si la familia va de vacaciones. El modelo es el modelo de Gompit 0 ‘modelo del valor extremo tipo I siguiente: ¥,= Q(X A+, = QB +BX yt BXy + BX t AX atu =e +H donde X; = renta familiar en millones de unidades monetarias anuales, Xs = tamaio del municipio en miles de habitantes, Xz = ntimero de hijos y Xs = edad més uno del hijo menor «que vive con la familia (vale 0 si ningtin hijo vive con la familia). El modelo estimado es ¥, = 9(-0,393 + 00531, +0,0079 X,, -0035X,, -0,289% ,)+u, Sabiendo que las medias de Xs, Xs, Xj y Xs son 3,5 millones, 1.4 hijos, 276,8 miles de habitantes y 9.5 aiios respectivamente se pide calcular la probabilidad de que una familia media vaya de vacaciones y de que una familia media que reside en Valencia (700 mil habitantes) se vaya de vacaciones. Calcular también el efecto marginal medio de Ia variable X, SOLUCION: La probabilidad de que una familia media (con caracteristicas medias de ingresos familiares, tamafio del municipio de residencia, mimeros de hijos y edad del hijo menor) vaya de vacaciones seré: ¥ = Q(XA) = 2(-0,393 + 0.0531 ¥,, +0,0079 €, - 0,035 %, - 0,289) = (0,393 + 0,0531 * 3,5 + 0,0079 *276,8~ 0,035 *1,4— 0,289 *9,5) =e" = 0,05 La probabilidad de que una familia media (con caracterfsticas medias de ingresos familiares, niimero de hijos y edad del hijo menor) que resida en Valencia (municipio con 700 ‘mil habitantes) vaya de vacaciones seré ¥ = Q(XB) = 2(-0,393 + 0.0531 8, + 0,0079 * 700 — 0,035 X, ~0,289.X,) = (0,393 + 0,0531 *3,5 + 0,0079 #700 ~ 0,035 #14 0,289 *9,5) i = 0,923 Para calcular el efecto marginal medio de la variable X; tendremos en cuenta que el efecto de Ia variable Xj viene dado en general por: 9246 © ITES-Parainto MODELOS DE VARIABLE DEPENDIENTE LIMITADA: LOGIT, PROBIT Y RECUENTO PY = 1X) a(XP)B, En nuestro caso, como queremos el efecto marginal medio de X; tenemos: OP =1| X) _ AQX,A) _ OX, aX, (Ln; \-B,) = PLAY -B, ) = 0.105(L1(0.105))(-0.0531) 8 RAB, = Xpyp, =e" He Wf.) = 0125 roblema 7-1 utilizando un modelo Gompit o modelo del valor extremo tipo 1 Cuantificar ¢ interpretar los efectos de las variables explicativas sobre la probabilidad de la mujer de participar en el mercado de trabajo de la forma adecuada SOLUCION: Plantearemos el modelo Gompit o modelo del valor extremo tipo I siguiente: Inlf = Qf + Br nwifeine + fy educ + Pyexper + Pyexper” + By age + B, kidsl6 + By kidsg6) donde @ es la funci6n de distribucién de una variable Gompit a(x) =e Para realizar la estimacién mediante el modelo Gompit 0 modelo del valor extremo tipo I se elige Quick > Estimate Equation, se escribe la ecuacién del modelo a ajustar en el ‘campo Equation Specification de la solapa Specification, se elige BINARY-Binary choice (logit, probit, extreme value) en el campo Method, se elige Extreme value en el campo Binary ‘estimation method para realizar el ajuste mediante el_ modelo Probit (Figura 7-26) y se hace clic en Aceptar. Se obtienen los resultados de la Figura 7-27 con buenas significatividades individuales para los pardmetros estimados (salvo la constante y kidsge6). La significatividad conjunta es muy alta porque el p-valor del estadfstico de la raz6n de verosimilitud es muy equefio. El Pseudo R” de McFadden no se acerca demasiado a la unidad (0,21). Los valores de los criterios de informacién (Akaike, Schwarz y Hannan-Quinn) son adecuados porque son bajos y muy similares. end tt do 9 cpt fe een op’? oS aN ray oe ene ee z Soe Figura 7-26 Figura 7-27 Para cuantificar e interpretar los efectos de las variables explicativas sobre la probabilidad de la mujer de participar en el mercado de trabajo tendremos presente que el efecto parcial de una variable explicativa continua X, sobre la probabilidad de respuesta P(Y = 1|X) es: © MTES Paraninfow 325 ECONOMETRIA. CONCEPTOS Y PROBLEMAS RESUELTOS a =X) PUAN). axpyp, ‘Como para cada observacién tenemos un efecto, evitaremos el célculo de 753 efectos calculando los efectos para las observaciones medias ‘Tenemos presente que: iwifeine = 2013 edu 4254 Ridsir6 2,29. exper = 10,63 age 124 Fidage6 = 1.35 ¥ = Q(XA) = Q(-0,743 - 0,01 * 20,13 + 0,136 * 12,29 + 0,134 * 10,63 ~ 0,001 *178,03, = 0,057 * 42,54 ~ 0,953 *0,24 40,058 *1,35) = 2(-0,60167) = e“"” = 0,1612 ‘con lo que: ap =1|X) _ dacX,A) OX, Xx, = AXA LnAKPYVB,) = PLaPy-B, * -e P 8 XPB, = XDA, 1) =0,1612(Ln(0,1612)x-A,) Iuego podemos obtener el efecto parcial estimado de las variables continuas, para los valores medios de las X, multiplicando los coeficientes estimados del modelo Gompit por 0,294. Por lo tanto, un afio adicional de educacién aumenta la probabilidad de participar en el mercado de trabajo en. 0,136x0,294 = 0,04. Al aumentar la edad en un aio la probabilidad de articipar se reduce en 0,017 (-0.0577x0,294=-0,017). Al aumentar la experiencia en un afio, la probabilidad de participar varfa en [0,134-(2x0,0018xexper|x0,294. Un aumento unitario en los ‘otros ingresos hace que la probabilidad de participar se reduzca en 0,003 (-0,0107x0.294 = -0,003), También podemos calcular el efecto estimado al variar una variable discreta. Por ejemplo, para kidsls6 el efecto sobre la probabilidad de trabajar de pasar de tener 0 a 1 hijo (menor de 6 aiios) es una reduceién en 0,3 porque siendo Q = Funci6n de distribucién de la variable Gompit se tiene: Q(-0,743 ~0,01* 20,13 + 0136 "12,29 + 0.134*10,63 ~0,001*178,03 ~0,057 *42,54~-0,953*0,24 + 0,058*1.35)~ 2(-0.743 -0,01* 20,13 + 0136"12,29 + 0.134 10,63 -0,001178,03 0,057 42,540,953 + 0,058*135) = 03 y el efecto sobre la probabilidad de trabajar de la mujer de pasar de 1 a 2 hijos (menor de 6 afios) se reducira en 0,2 porque: 2(-0.743 ~0,01* 20.13 + 013612,29 + 0.134 10,63 -0,001°178,03~0,057 42,540,953 + 0,058*1,35) - 2(-0,743 ~0,01* 20.13 + 0136*12,29 + 0134*10,63 ~0,001*178,03 ~ 0,057 *42,54~2*0,953 + 0,0581,35) = 02 En el problema 7-2 ya vimos que los efectos estimados al variar las variables explicativas coincidfan para los modelos Logit y Probit. Ahora hemos visto que estos efectos para el modelo Gompit son précticamente iguales a los de los modelos Logit y Probit (algo mas bajos en general en este caso). 9266 © ITES-Paraino

También podría gustarte