Está en la página 1de 47

Introduccin a las series temporales y Prediccin (SW Captulo 12)

Los datos de series temporales son datos recogidos en la misma unidad de observacin en mltiples perodos de tiempo Consumo agregado y PIB de un pas (por ejemplo, 20 aos de observaciones trimestrales = 80 observaciones) Tipos de cambio Yen/$, Libra/$ y Euro/$ (datos diarios de un ao = 365 observaciones) Consumo de cigarrillos per capita en un estado
12-1

Ejemplo #1 de datos de series temporales: tasa de inflacin en EE.UU

12-2

Ejemplo #2: Tasa de desempleo en EE.UU

12-3

Por qu usar datos de series temporales?


Para desarrollar modelos de prediccin o Cul ser la tasa de inflacin el prximo ao? Para estimar efectos causales dinmicos o Si la Reserva Federal incrementa los tipos de los fondos del tesoro ahora, cul ser el efecto en las tasas de inflacin y desempleo dentro de 3 meses? Y dentro de 12 meses? o Cul es el efecto a lo largo del tiempo sobre el consumo de cigarrillos de un incremento continuado en el impuesto de los cigarrillos? Adems, algunas veces no tenemos otra opcin o Las tasas de inflacin y desempleo en EE.UU. slo se pueden observar en el tiempo.
12-4

Los datos de series temporales dan lugar a nuevos resultados tcnicos Retardos temporales Correlacin a lo largo del tiempo (correlacin serial o autocorrelacin) Modelos de prediccin que no tienen una interpretacin causal (Herramientas especializadas para prediccin): o Modelos autorregresivos (AR) o Modelos autorregresivos de retardos distribuidos (ADL) Condiciones bajo las cuales los efectos dinmicos pueden estimarse, y cmo estimarlos Clculo de los errores estndar cuando los errores presentan correlacin serial
12-5

Uso de los modelos de regresin para prediccin (SW Seccin 12.1) La prediccin y la estimacin de efectos causales son objetivos algo diferentes. Para prediccin, o R 2 es importante (muy importante!) o El sesgo de variable omitida no es un problema! o No nos preocuparemos de la interpretacin de los coeficientes en los modelos de prediccin o La validacin externa es fundamental: el modelo estimado utilizando datos histricos debe mantenerse en el futuro (prximo)
12-6

Introduccin a los datos de series temporales y correlacin serial (SW Seccin 12.2)
Primero debemos introducir algo de notacin y de terminologa Notacin para los datos de series temporales Yt = valor de Y en el perodo t. Conjunto de datos: Y1,,YT = T observaciones de la serie temporal de la variable aleatoria Y Slo consideramos observaciones consecutivas, igualmente espaciadas (por ejemplo, mensuales, 1960 a 1999, sin meses prdidos) (todava ms complicaciones...)
12-7

Transformaremos las variables de series temporales utilizando retardos, primeras diferencias, logartmos, & tasas de crecimiento

12-8

12-9

Ejemplo: Tasa trimestral de inflacin en una tasa anual IPC en el primer trimestre de 1999 (1999:I) = 164.87 IPC en el Segundo trimestre de 1999 (1999:II) = 166.03 Cambio porcentual en IPC, 1999:I a 1999:II 166.03 164.87 1.16 = 100 = 100 = 0.703% 164.87 164.87 Cambio porcentual en IPC, 1999:I a 1999:II, a una tasa anual = 40.703 = 2.81% (porcentaje por ao)
Como ocurre con los tipos de inters, las tasas de inflacin se proporcionan (a modo de convencin) como tasa anual (es decir, siempre se habla de la tasa de inflacin anual, no de la tasa de inflacin trimestral) Usando la aproximacin logartmica de los cambios porcentuales obtenemos 4100[log(166.03) log(164.87)] = 2.80%
12-10

Ejemplo: Inflacin de IPC en EE.UU su primer retardo y su cambio IPC = Indice de Precios al Consumo (Bureau of Labor Statistics)

12-11

12-12

Autocorrelacin La correlacin de una serie con sus propios valores retardados values se llama autocorrelacin o correlecin serial. La primera autocorrelacin de Yt es corr(Yt,Yt1) La primera autocovarianza de Yt es cov(Yt,Yt1) As corr(Yt,Yt1) =
cov(Yt ,Yt 1 ) =1 var(Yt ) var(Yt 1 )

Estas son las correlaciones poblacionales describen la distribucin conjunta poblacional de (Yt,Yt1)
12-13

12-14

Autocorrelaciones Muestrales La jsima autocorrelacin muestral es un estimador de la sima j autocorrelacin poblacional:


cov(Yt , Yt j ) var(Yt )

j =

donde
T 1 cov(Yt , Yt j ) = 1 (Yt Y j+1,T )(Yt j Y1,T j ) T j 1 t= j+

donde Y j +1,T es la media muestral de Yt calculada sobre las observaciones t = j+1,,T


o Nota: el sumatorio va desde t=j+1 hasta T (por qu)?
12-15

Ejemplo: Autocorrelaciones de: (1) la tasa trimestral de inflacin en EE.UU (2) el cambio trimestre a trimestre en la tasa trimestral de inflacin

12-16

La tasa de inflacin presenta elevada correlacin serial (1 = .85) La tasa de inflacin del ltimo trimestre contiene mucha informacin sobre la tasa de inflacin actual (la tasa de inflacin actual depende mucho de la tasa anterior) El grfico est dominado por oscilaciones dentro de cada ao que se repiten anualmente Pero quedan an movimientos sorprendentes!
12-17

Ms ejemplos de series temporales & transformaciones

12-18

Ms ejemplos de series temporales & transformaciones, ctd.

12-19

Estacionariedad: una idea central para la validez externa de los modelos de series temporales
La estacionariedad dice que el pasado es como el presente y el futuro, al menos en un sentido probabilstico.

Nos centraremos en el caso en el que Yt es estacionaria.


12-20

Autorregresiones (SW Seccin 12.3) Un punto de partida natural para un modelo de prediccin es usar valores pasados de Y (es decir, Yt1, Yt2,) para predecir Yt.
Una autorregresin es un modelo de regresin en el cual se hace la regresin de Yt sobre sus propios valores retardados. El nmero de retardos usados como regresores se llama el orden de la autorregresin. o En una autorregresin de primer orden, se hace la regresin de Yt sobre Yt1
12-21

o En una autorregresin de orden p, se hace la regresin de Yt sobre Yt1,Yt2,,Ytp.

El modelo Autorregresivo de Primer Orden (AR(1)) El modelo AR(1) poblacional es Yt = 0 + 1Yt1 + ut


0 y 1 no tienen interpretacin causal Si 1 = 0, Yt1 no es til para predecir Yt El modelo AR(1) puede estimarse aplicando MCO a la regresin de Yt sobre Yt1

12-22

La contrastacin de 1 = 0 v. 1 0 genera un contraste de la hiptesis de que Yt1 no es til para predecir Yt

12-23

Ejemplo: modelo AR(1) para el cambio en la inflacin


Se estima usando datos desde 1962:I 1999:IV:
Inf t = 0.02 0.211Inft1 R 2 = 0.04

(0.14) (0.106) El cambio retardado en la inflacin es un predictor til del cambio actual en la inflacin? t = .211/.106 = 1.99 > 1.96 Rechaza H0: 1 = 0 al nivel de significacin del 5% Si, el cambio retardado en la inflacin es un predictor til del cambio actual en la inflacin (pero el R 2 es reducido!)
12-24

Ejemplo: modelo AR(1) para la inflacin STATA Primero, hagamos que STATA conozca que estamos trabajando con datos de series temporales
generate time=q(1959q1)+_n-1; _n es el no de observacin. As este comando crea una nueva variable tiempo que tiene un formato de fechas trimestral especial Especifica el formato de fechas trimestral Ordena por tiempo Le dice a STATA que la variable tiempo es la variable que quiero indicar la escala temporal

format time %tq; sort time; tsset time;

12-25

Ejemplo: Modelo AR(1) para la inflacin STATA, ctd.


. gen lcpi = log(cpi); . gen inf = 400*(lcpi[_n]-lcpi[_n-1]); la variable ipc ya est en memoria la tasa trimestral de inflacin en tasa anual calcula las 8 primeras autocrrelaciones muestrales

. corrgram inf

, noplot lags(8);

LAG AC PAC Q Prob>Q ----------------------------------------1 0.8459 0.8466 116.64 0.0000 2 0.7663 0.1742 212.97 0.0000 3 0.7646 0.3188 309.48 0.0000 4 0.6705 -0.2218 384.18 0.0000 5 0.5914 0.0023 442.67 0.0000 6 0.5538 -0.0231 494.29 0.0000 7 0.4739 -0.0740 532.33 0.0000 8 0.3670 -0.1698 555.3 0.0000

. gen inf = 400*(lipc[_n]-lipc[_n-1]) Esta sentencia crea una nueva variable, inf, la n-sima observacin de las cuales es 400 veces la diferencia entre la n-sima observacin de lipc y la n-sima-1 observacin de lipc, es decir, la primera diferencia de lipc
12-26

Ejemplo: modelo AR(1) para la inflacin STATA, ctd


Sintaxis: L.dinf es el primer retardo de dinf . reg dinf L.dinf if tin(1962q1,1999q4), r; Regression with robust standard errors Number of obs F( 1, 150) Prob > F R-squared Root MSE = = = = = 152 3.96 0.0484 0.0446 1.6619

-----------------------------------------------------------------------------| Robust dinf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dinf | L1 | -.2109525 .1059828 -1.99 0.048 -.4203645 -.0015404 _cons | .0188171 .1350643 0.14 0.889 -.2480572 .2856914 -----------------------------------------------------------------------------if tin(1962q1,1999q4) sintaxis de STATA para series temporales para utilizar nicamente las observaciones comprendidas entre 1962q1 y 1999q4 (ambas inclusive). Esto requiere definir primero la escala temporal, como se hizo antes

12-27

Predicciones y errores de prediccin Una nota sobre terminologa: Un valor predicho (ajustado) se refiere al valor de Y predicho (ajustado utilizando una regresin) para una observacin dentro de la muestra utilizada para estimar la regresin esta es la definicin usual Una prediccin se refiere al valor Y predicho para una observacin que no est en la muestra utilizada para estimar la regresin Valores predichos son dentro de la muestra Predicciones son predicciones del futuro que no han sido usados para estimar la regresin.
12-28

Predicciones: notacin Yt|t1 = prediccin de Yt basada en Yt1,Yt2,, utilizando los coeficientes poblacionales desconocidos (verdaderamente desconocidos)
Yt|t 1 = prediccin de Yt basada en Yt1,Yt2,,

utilizando los coeficientes estimados, que fueron estimados utilizando datos hasta el perodo t1. Para un AR(1), Yt|t1 = 0 + 1Yt1
Yt|t 1 = 0 + 1 Yt1, donde 0 y 1 se estimaron

utilizando datos hasta el perodo t1.


12-29

Errores de prediccin El error de prediccin un perodo hacia adelante es,


Error de prediccin = Yt Yt|t 1

La diferencia entre un error de prediccin y un residuo es la misma que entre un valor predicho (ajustado) y una prediccin: un residuo es dentro de la muestra un error de prediccin es fuera de la muestra el valor de Yt no se utiliza en la estimacin de los coeficientes de regresin
12-30

El error de prediccin cuadrtico medio (RMSFE)


RMSFE = E [(Yt Yt|t 1 )2 ]

El RMSFE es una medida de la escala de la distribucin del error de prediccin. El RMSFE es como la desviacin estndar de ut, excepto por el hecho de que explcitamente se centra en el error de prediccin usando coeficientes estimados, no utilizando la recta de regresin poblacional. El RMSFE es una medida de la magnitud de un tpico error de la prediccin
12-31

Ejemplo: Prediccin de la inflacin utilizando un AR(1) El AR(1) se estima usando los datos desde 1962:I a 1999:IV:
Inf t = 0.02 0.211Inft1

Inf1999:III = 2.8 (las unidades son porcentajes, a una tasa anual) Inf1999:IV = 3.2 Inf1999:IV = 0.4 De manera que la prediccin de Inf2000:I es,
Inf 2000:I |1999:IV = 0.02 0.2110.4 = -0.06 -0.1
12-32

As
Inf 2000:I |1999:IV = Inf1999:IV + Inf 2000:I |1999:IV = 3.2 0.1 = 3.1

El modelo autorregresivo de orden p (AR(p)) Yt = 0 + 1Yt1 + 2Yt2 + + pYtp + ut El modelo AR(p) utiliza p retardos de Y como regresores El modelo AR(1) es un caso especial
Los coeficientes no tienen una interpretacin causal Para contrastar la hiptesis de que Yt2,,Ytp no ayudan demasiado a predecir Yt, ms all de Yt1, se utiliza un test F Se utilizan tests t- F- para determinar el orden del retardo p O, mejor, determinar p utilizando un criterio de informacin (ver SW Seccin 12.5 no cubriremos esto aqu)
12-33

Ejemplo: modelo AR(4) para la inflacin


Inf t = .02 .21Inft1 .32Inft2 + .19Inft3

(.12) (.10)

(.09)

(.09)

.04Inft4, R 2 = 0.21 (.10) El estadstico F para contrastar los retardos 2, 3, 4 es 6.43 (p-valor < .001) R 2 se incrementa desde .04 hasta .21 aadiendo los retardos 2, 3 y 4 Los retardos 2, 3, 4 (conjuntamente) ayudan a predecir el cambio en la inflacin, por encima y ms all del primer retardo
12-34

Ejemplo: modelo AR(4) para la inflacin STATA


. reg dinf L(1/4).dinf if tin(1962q1,1999q4), r; Regression with robust standard errors Number of obs F( 4, 147) Prob > F R-squared Root MSE = = = = = 152 6.79 0.0000 0.2073 1.5292

-----------------------------------------------------------------------------| Robust dinf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dinf | L1 | -.2078575 .09923 -2.09 0.038 -.4039592 -.0117558 L2 | -.3161319 .0869203 -3.64 0.000 -.4879068 -.144357 L3 | .1939669 .0847119 2.29 0.023 .0265565 .3613774 L4 | -.0356774 .0994384 -0.36 0.720 -.2321909 .1608361 _cons | .0237543 .1239214 0.19 0.848 -.2211434 .268652 -----------------------------------------------------------------------------NOTES L(1/4).dinf es una forma conveniente de decir usa los retardos 14 de dinf como regresores L1,,L4 se refieren al primer, segundo, 4th retardos de dinf
12-35

Ejemplo: modelo AR(4) para la inflacin STATA, ctd.


. dis "Adjusted Rsquared = " _result(8); Adjusted Rsquared = .18576822 el resultado(8) es el R2 corregido de la regresin ms reciente

test L2.dinf L3.dinf L4.dinf; ( 1) ( 2) ( 3) L2.dinf = 0.0 L3.dinf = 0.0 L4.dinf = 0.0 F( 3, 147) = Prob > F = 6.43 0.0004

L2.dinf es el segundo retardo de dinf,etc.

Nota: algunas de las caractersticas de STATA para series temporales difieren de STATA v. 7 y STATA v. 8

12-36

Disgresin: usamos Inf, no Inf, en los ARs. Por qu? El modelo AR(1) de Inft1 es un modelo AR(2) para Inft: Inft = 0 + 1Inft1 + ut Inft Inft1 = 0 + 1(Inft1 Inft2) + ut Inft = Inft1 + 0 + 1Inft1 1Inft2 + ut De manera que Inft = 0 + (1+1)Inft1 1Inft2 + ut Entonces, por qu usar Inft, y no Inft?
12-37

Modelo AR(1) de Inf: Modelo AR(2) de Inf:

Inft = 0 + 1Inft1 + ut Inft = 0 + 1Inft + 2Inft1 + vt

Cuando Yt tiene fuerte correlacin serial, el estimador MCO de


los coeficientes AR est sesgado hacia cero.

En el caso extremo en el que el coeficiente AR = 1, Yt no es


estacionario: los uts se acumulan e Yt se amplia.

Si Yt no es estacionaria, la teora de regresin con la que estamos


trabajando aqu fracasa

Aqu, Inft tiene fuerte correlacin serial de manera que para


mantenernos dentro de un esquema de trabajo que comprendamos, las regresiones se especifican utilizando Inf

Como lecturas opcionales, vase SW Seccin 12.6, 14.3, 14.4

12-38

Modelos de series temporales con predictores adicionales y el modelo de retardos distribuidos (ADL) (SW Seccin 12.4)
Hasta ahora, hemos considerado modelos de prediccin que slo utilizan los valores pasados de Y Parece razonable aadir otras variables (X) que pueden ser tiles como predictores de Y, ms all de los valores predichos de los valores retardados de Y:

Yt = 0 + 1Yt1 + + pYtp + 1Xt1 + + rXtr + ut


Este es un modelo autorregresivo de retardos distribuidos (ADL)
12-39

Ejemplo: desempleo retardado e inflacin


La curva de Phillips dice que si el desempleo se encuentra por encima de su tasa de equilibrio tasa natural, entonces la tasa de inflacin se incrementar. Es decir, Inft debera relacionarse con valores retardados de la tasa de desempleo, con coeficiente negativo La tasa de desempleo a la cual la inflacin ni se incrementa ni disminuye se llama a menudo tasa de no aceleracin de inflacin tasa de desempleo: la NAIRU Se encuentra esta relacin para los datos de la economa de EE.UU? Se puede explotar esta relacin para predecir la inflacin?

12-40

La Curva de Phillips emprica

El NAIRU es el valor de u para el cual Inf = 0


12-41

Ejemplo: modelo ADL(4,4) para la inflacin


Inf t = 1.32 .36Inft1 .34Inft2 + .07Inft3 .03Inft4

(.47) (.09)

(.10)

(.08)

(.09)

2.68Desemt1 + 3.43Desemt2 1.04Desemt3 + .07Desemt4 (.47) (.89) (.89) (.44) R 2 = 0.35 significativa mejora en comparacin con el AR(4), para el cual R 2 = .21

12-42

Ejemplo: dinf y desem STATA


. reg dinf L(1/4).dinf L(1/4).unem if tin(1962q1,1999q4), r; Regression with robust standard errors Number of obs F( 8, 143) Prob > F R-squared Root MSE = = = = = 152 7.99 0.0000 0.3802 1.371

-----------------------------------------------------------------------------| Robust dinf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dinf | L1 | -.3629871 .0926338 -3.92 0.000 -.5460956 -.1798786 L2 | -.3432017 .100821 -3.40 0.001 -.5424937 -.1439096 L3 | .0724654 .0848729 0.85 0.395 -.0953022 .240233 L4 | -.0346026 .0868321 -0.40 0.691 -.2062428 .1370377 unem | L1 | -2.683394 .4723554 -5.68 0.000 -3.617095 -1.749692 L2 | 3.432282 .889191 3.86 0.000 1.674625 5.189939 L3 | -1.039755 .8901759 -1.17 0.245 -2.799358 .719849 L4 | .0720316 .4420668 0.16 0.871 -.8017984 .9458615 _cons | 1.317834 .4704011 2.80 0.006 .3879961 2.247672 -----------------------------------------------------------------------------12-43

Ejemplo: modelo ADL(4,4) para la inflacin STATA, ctd.


. dis "Adjusted Rsquared = " _result(8); Adjusted Rsquared = .34548812 . test L2.dinf L3.dinf L4.dinf; ( 1) ( 2) ( 3) L2.dinf = 0.0 L3.dinf = 0.0 L4.dinf = 0.0 F( 3, 143) = Prob > F = 4.93 0.0028 Los retardos extra de dinf son signif.

. ( ( ( (

test L1.unem L2.unem L3.unem L4.unem; 1) 2) 3) 4) L.unem = 0.0 L2.unem = 0.0 L3.unem = 0.0 L4.unem = 0.0 F( 4, 143) = Prob > F = 8.51 0.0000 Los retardos de unem son significativos

La hiptesis nula de que los coeficientes de los retardos de la tasa de desempleo son todos cero se rechaza al nivel de significacin del 1% utilizando el estadstico F
12-44

El contraste de la hiptesis conjunta de que ninguna de las Xs es un predictor til, ms all y por encima de los valores retardados de Y, se llama Test de causalidad de Granger

causalidad no es un trmino muy afortunado aqu: la Causalidad de Granger simplemente se refiere a contenido predictivo (marginal).
12-45

Resumen: Modelos de Prediccin de Series Temporales Si los objetivos son de prediccin, no es importante tener coeficientes con interpretacin causal! Se pueden producir predicciones simples y veraces utilizando modelos AR(p) estas son predicciones que sirven de base para realizar comparaciones con modelos de prediccin mucho ms complicados Se pueden aadir predictores adicionales (Xs); siendo el modelo resultante un modelo autorregresivo de retardos distribuidos (ADL)

12-46

La estacionariedad significa que los modelos pueden utilizarse fuera del rango de los datos utilizados para estimar Ahora tenemos las herramientas necesarias para estimar efectos causales dinmicos...

12-47