Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SERIES DE TIEMPO
Mg. Heber Baldeón Paucar
heberjbaldeon@gmail.com
Análisis de Datos y
Econometría Aplicada con R
Índice
• Series de tiempo
– Definición, composición y propiedades
– Análisis espectral y filtros
• Series de tiempo univariados
– Modelos para la media:
• Series estacionarias: Metodología Box Jenkins
• Series no estacionarias: Pruebas de raíz unitaria
– Modelos para la varianza:
• Efectos simétricos (ARCH, GARCH)
• Efectos asimétricos (GJR, TARCH)
• Series de tiempo multivariados
– Series estacionarias: VAR (Función impulso respuesta y Descomposición de la varianza),
SVAR
– Series no estacionarias: VEC (metodología de Johnson)
Bibliografía
¿ Qué es una Series de Tiempo?
• Es una secuencia de variables aleatorias indexadas al conjunto tiempo.
(𝑖)
𝑋𝑡 , 𝑡 = 0,1,2,3, …
Ejemplos:
– Número de horas de vista de una página web
– Temperatura diaria de la ciudad de Lima
– Ventas mensuales de un producto
– Ingresos trimestrales de una empresa
– Población anual de un país
• Filtro de Baxter-King, Band pass (1995): B son los ponderadores de promedios móviles, estos
ponderados se obtienen de una transformación inversa de Fourier.
𝑛 𝑛
𝑦𝑡 = 𝐵 𝐿 𝑥𝑡 = 𝐵 𝑥𝑡 + 𝐵
𝑗 𝑥𝑡+𝑗 = 𝐵0 𝑗 (𝑥𝑡−𝑗 + 𝑥𝑡+𝑗 )
𝑗=−𝑛 𝑗=1
• Filtro de Christiano-Fitzgerald (1999): El filtro CF trata de minimizar el error cuadrático medio –
ECM, respecto a un filtro band pass ideal.
𝑡−1
𝑐𝑓 𝑐𝑓
𝐶𝑡 = 𝜓𝑗 𝑌𝑡
𝑗=𝑡−𝑇
Series de tiempo univariadas
• Hay muchos diferentes enfoques, pero solo consideraremos 2:
– Modelos estocásticos
• ARMA
• SARIMA
– Modelos de Redes Neuronales Artificiales
Modelos ARMA: Modelos ARIMA:
• Asume que las realizaciones de los datos es un • Una generalización de los modelos ARMA para series
proceso estacionario. de diferente orden de integración (estacionarias en
• Proceso AR: tiene una relativa larga memoria, diferencia).
porque las ocurrencias están correlacionadas con • Las series de tiempo integradas son diferenciados
todos las ocurrencias anteriores, aunque con hasta que sean estacionarias.
coeficientes decrecientes. • No da soporte al modelamiento de los componentes
estacionales.
• Proceso MA: tienen memoria de corto plazo, ya
que generalmente es un número finito y pequeño
de valores del pasado.
Modelamiento de las series de tiempo univariadas
a) No estacionaria en media
b) Estacionaria en media, pero no estacionaria en varianza
c) Estacionaria en media y varianza
Modelamiento de las series de tiempo univariadas
Modelamiento de las series de tiempo univariadas
Modelamiento de las series de tiempo univariadas
Modelos SARIMA
• Es una modificación a los modelos ARIMA que soporta el comportamiento estacional.
𝐴𝑅𝐼𝑀𝐴 𝑝, 𝑑, 𝑞 𝑥 𝑃, 𝐷, 𝑄 𝑆
Donde: s es la periodicidad de la estacionalidad
(periodo trimestral: 4, periodo anual: 12, etc.)
• Verificar si hay alguna evidencia de una tendencia o efectos estacionales
• Estacionarizar tomando diferencias
• Investigación de componentes estacionales
Metodología Box Jenkins
NO
Estimación:
Identificación: Diagnóstico:
• Máxima Verosimilitud
Selección de una ¿Es válido el
• Método Generalizado de
especificaciones ARIMA modelo? ¿Cumple
Momentos
(p,d,q) o SARIMA con las
• Mínimos cuadrados propiedades?
(p,d,q,P,D,Q) tentativa.
ordinarios
SI
• Donde: 𝜇𝑡 es la media del retorno, y 𝜀𝑡 es una variable aleatoria iid con 𝐸[𝜀𝑡 ] = 0 y
𝑉𝑎𝑟(𝜀𝑡 ) = 1.
• El modelo ARCH(1) propuesto por Engle, sostiene que 𝛼0 > 0 (varianza positiva) y
0 < 𝛼1 < 1 (supuesto de estacionariedad).
𝝈𝟐𝒕 = 𝜶𝟎 + 𝜶𝟏 𝝂𝟐𝒕−𝟏
• El problema es que no conocemos 𝜎𝑡2 (volatilidad inobservable), pero si suponemos que
se puede aproximar por 𝜈𝑡2 :
𝑉𝑎𝑟 𝜈𝑡 = 𝑉𝑎𝑟 𝜎𝑡 𝜀𝑡 ⇒ 𝐸 𝜈𝑡2 = 𝐸[𝜎𝑡2 𝜀𝑡2 ] ⇒ 𝜈𝑡2 = 𝜎𝑡2
2
• Si el error de proyección es 𝜉𝑡 = 𝜈𝑡2 − 𝜎𝑡2 , entonces: 𝜈𝑡2 = 𝛼0 + 𝛼1 𝜈𝑡−1 + 𝜉𝑡
Modelos de heterocedasticidad condicional
Modelos GARCH:
• Bollerslev (1986) propuso el siguiente modelo para los retornos:
𝑦𝑡 = 𝜇𝑡 + 𝜈𝑡 , 𝑑𝑜𝑛𝑑𝑒 𝜈𝑡 = 𝜎𝑡 𝜀𝑡
• Donde: 𝜇𝑡 es la media del retorno, y 𝜀𝑡 es una variable aleatoria iid con 𝐸[𝜀𝑡 ] = 0 y
𝑉𝑎𝑟(𝜀𝑡 ) = 1.
• El modelo GARCH(1,1) propuesto por Bollerslev, sostiene que 𝛼0 > 0 (varianza positiva) y
0 < 𝛼1 < 1, 𝛽1 ≥ 0 𝑦 𝛼1 + 𝛽1 ≤ 1(supuestos de estacionariedad).
𝝈𝟐𝒕 = 𝜶𝟎 + 𝜶𝟏 𝝂𝟐𝒕−𝟏 + 𝜷𝟏 𝝈𝟐𝒕−𝟏
• El problema es que no conocemos 𝜎𝑡2 (volatilidad inobservable), pero si suponemos que se
puede aproximar por 𝜈𝑡2 :
𝑉𝑎𝑟 𝜈𝑡 = 𝑉𝑎𝑟 𝜎𝑡 𝜀𝑡 ⇒ 𝐸 𝜈𝑡2 = 𝐸[𝜎𝑡2 𝜀𝑡2 ] ⇒ 𝜈𝑡2 = 𝜎𝑡2
2
• Si el error de proyección es 𝜉𝑡 = 𝜈𝑡2 − 𝜎𝑡2 , entonces: 𝜈𝑡2 = 𝛼0 + (𝛼1 +𝛽1 )𝜈𝑡−1 + (𝜉𝑡 −𝛽1 𝜉𝑡−1 )
Modelos de heterocedasticidad condicional
Efecto Leverage:
• La correlación entre las noticias y los retornos son fuertes, sobre todo con las malas noticias.
• Cambios fuertes en el precio de los stocks disminuyen el capital de la empresa. Por eso un
mayor leverage, implica una mayor volatilidad de los precios del stock.
• Todo el modelo es similar a un modelo GARCH:
𝑦𝑡 = 𝜇𝑡 + 𝜈𝑡 , 𝑑𝑜𝑛𝑑𝑒 𝜈𝑡 = 𝜎𝑡 𝜀𝑡
expecto por:
GJR (Glosten, Jagannathan & Runkle, 1993)
𝝈𝟐𝒕 = 𝜶𝟎 + (𝜶𝟏 +𝜸𝟏 𝕝𝝂𝒕−𝟏 <𝟎 )𝝂𝟐𝒕−𝟏 + 𝜷𝟏 𝝈𝟐𝒕−𝟏
• Metodología planteada por Sims en 1980. Es un modelo aleatorio, por ello ayuda poco para la
toma de decisiones de política y su objetivo de PREDICCIÓN.
• Su principal problema conceptual está relacionado a la interpretación de las correlaciones
instantáneas entre los términos de error y por tanto entre las variables observables. El VAR
Estructural (SVAR) trata de dar una solución a este problema imponiendo restricciones.
• Como todas las variables son endógenas se requiere estimar una gran cantidad de parámetros.
Se debe determinar la cantidad de rezagos óptima (a veces es complicado).
Modelos Multivariado: VAR
𝑋𝑡 𝜙11 𝜙12 𝑋𝑡−1 𝜀𝑥,𝑡
= + 𝜀 ,
𝑌𝑡 𝜙21 𝜙22 𝑌𝑡−1 𝑦,𝑡
𝜀𝑥,𝑡 𝜎𝑥2 𝜎𝑥𝑦
donde 𝜀 ∼ 𝑊𝑁 0, Σ , y Σ = 2 .
𝑦,𝑡 𝜎 𝑥𝑦 𝜎𝑦
𝜀𝑥,𝑡−2 𝜀𝑥,𝑡−1 𝜀𝑥,𝑡
𝝓𝟏𝟏 𝝓𝟏𝟏
𝑋𝑡−2 𝑋𝑡−1 𝑋𝑡
𝝓𝟏𝟐 𝝓𝟏𝟐
𝝓𝟐𝟏 𝝓𝟐𝟏
𝑌𝑡−2 𝝓𝟐𝟐
𝑌𝑡−1 𝝓𝟐𝟐
𝑌𝑡
¿Cuál es la variable
• Test de Causalidad
más
a lo Granger
endógena/exógena?
• Una vez estimado el modelo VAR no se interpretan los coeficientes sino que se van
a analizar 2 herramientas:
• La Función Impulso Respuesta • La Descomposición de la Varianza
mide la respuesta de cada una de de Proyección nos dice la
las variables en el sistema ante un proporción de los movimientos en
shock exógeno (innovación) que se una secuencia debido a sus
presenta en alguna de ellas. “propios” shocks versus los shocks
• Se analiza: de las otras variables.
– Signo de la respuesta. • Si hay m variables en el modelo, la
– Amplitud de la respuesta (que tan variancia se descompondrá en m
grande es). partes.
– Duración de la respuesta (persistencia).
• La suma de las m partes será 100%.
Modelos Multivariado: VAR
Modelos Multivariado: VEC
Cointegración:
Para el caso de 2 series 𝐼 1 , 𝑋𝑡 e 𝑌𝑡 , si existe 𝛽 s.t. 𝑌𝑡 − 𝛽𝑋𝑡 ∼ 𝐼 0 , se puede decir que 𝑋𝑡 e 𝑌𝑡
están cointegradas o que existe una relación de cointegración entre 𝑋𝑡 e 𝑌𝑡 , por lo que 𝑌𝑡 −
𝛽𝑋𝑡 ∼ 𝐼 0 es denominado una relación de equilibrio de largo plazo entre 𝑋𝑡 y 𝑌𝑡
Test de cointegración:
Test de Engle Granger
o Fit OLS – 𝑌𝑡 = 𝛼ො + 𝛽𝑋 𝑡 + 𝑍መ 𝑡
o Test 𝑍መ 𝑡 es I(0) o I(1)
• Si las variables del VAR están cointegradas, el modelo VAR puede ser reescrito de
forma equivalente a vector error correction model (Engel y Granger 1987):
Γ𝑘 = − Π𝑗 , 𝑘 = 1, … , 𝑝 − 1
𝑗=𝑘+1
Modelos Multivariado: VEC
• Un Vector Error Correction Model (VECM) k-dimencional para un proceso VAR(p)
puede ser reescrito como:
𝛻𝑋𝑡 = Π[𝑘×𝑘] Xt−1 + Γ1 𝛻Xt−1 + ⋯ + Γ𝑝−1 𝛻𝑋𝑡−𝑝+1 + εt
𝐿𝑅𝑡𝑟 𝑟0 = −𝑇 𝑙𝑛 1 − 𝜆𝑖
𝑖=𝑟𝑜+1
Notas:
• Si 𝑟𝑎𝑛𝑘 Π = 𝑟0 , entonces 𝜆መ 𝑟0+1, … , 𝜆መ 𝑘 todos deberían ser cercanos a 0, o
𝐿𝑅𝑡𝑟 𝑟0 debería ser pequeño para no rechazar H0 como 𝑙𝑛 1 − 𝜆𝑖 ≈ 0 𝑠𝑖 𝑖 > 𝑟𝑜
• Si 𝑟𝑎𝑛𝑘 Π > 𝑟0 , entonces 𝜆መ 𝑟0+1 , … , 𝜆መ 𝑘 deberían mayores de 0 pero menores de
1, y 𝐿𝑅𝑡𝑟 𝑟0 debería ser grande para 𝑙𝑛 1 − 𝜆𝑖 ≪ 0 para algún 𝑖 > 𝑟0 .
Modelos Multivariado: VEC
• Test del Máximo eigenvalue: Es un procedimiento secuencial para determinar el
número de cointegración
𝐻0 : 𝑅𝑎𝑛𝑘 Π = 𝑟0
• Hipótesis:ቊ
𝐻1 : 𝑅𝑎𝑛𝑘 Π = 𝑟0 + 1
• Test:
𝐿𝑅𝑚𝑎𝑥 𝑟0 = −𝑇𝑙𝑛(1 − 𝜆መ 𝑟0+1)
Notas:
• El test consiste en ordenar los eigenvalues en orden descendente y considerar
cuando ellos son significativamente diferentes de 0.
• Supongamos que obtenemos n eigenvalues denotados 𝜆1 > 𝜆2 > ⋯ > 𝜆𝑘 , si las
variables no están cointegradas, entonces el rango de Π es 0 y todos los
eigenvalues debería ser iguales a 0, por eso, ln 1 − 𝜆𝑖 sería igual a 0.
Modelos Multivariado: VAR, SVAR y SVEC