Está en la página 1de 135

Modelos de Umbral

Profesor: Mg. Ricardo Ramos Rojas

XIII PEEA - 2022

FIEECS - Universidad Nacional de Ingeniería (UNI)


Introducción
• El comportamiento dinámico no lineal de una serie de tiempo implica que ciertas propiedades como su media, varianza o
autocorrelación son diferentes según el régimen prevaleciente en cada momento.

• En lo que respecta a las series de precios y rentabilidades de activos financieros, una característica a destacar es que la asimetría en
la distribución de los rendimientos podría ser explicada si consideramos un modelo con diferentes estados o regímenes.

• Modelos de regímenes son procesos invariantes en el tiempo condicionados a una variable que identifica el régimen St, el cual
puede ser observable o no observable. Además, estos modelos admiten un número discreto de regímenes.

• Los modelos no lineales se clasifican según el proceso estocástico que genera cada régimen:
 Modelos de Transición Determinística: Régimen observable.
 Modelos autoregresivos de umbral: TAR, SETAR.
 Modelos autoregresivos de transición suave: STAR (LSTAR, ESTAR).
 Modelos de transición Estocástica: Régimen no observable. En este caso, nada puede asegurarse acerca de la ocurrencia de
un determinado régimen, y por lo tanto solo es posible la asignación de probabilidades a los distintos estados.
 Modelos de Markov con probabilidades de transición constantes .
 Modelos de Markov con probabilidades de transición variables.
Modelo TAR (Threshold Autorregressive)
• Este modelo usa modelos lineales a trozos para obtener una mejor aproximación de la media condicional.

• Los modelos TAR se asume que el régimen queda determinado por una variable observable qt. Para un modelo TAR con 2 estados
se fija un valor c el cual se conoce como valor umbral. Dependiendo de si qt ≤ c o qt > c, nos situaremos en uno u otro estado.

• Ejemplo: Suponemos un AR(1) para cada régimen.

• La forma general de un modelo de umbrales TAR es:

donde los 𝑒𝑡 son variables aleatorias independientes e idénticamente distribuidas con 𝐸 𝑒𝑡 = 0 y 𝑉 𝑒𝑡 = σ < ∞, y 𝐽𝑡 es un
indicador temporal que tomará valores en 1,2, . . 𝑘 . La idea básica de un modelo por umbrales es la descomposición del sistema
no lineal en 𝑘 sistemas lineales más sencillos, mediante el indicador temporal 𝐽𝑡 .
Modelo SETAR (Self-Exciting Threshold Autoregressive)
• Un modelo autorregresivo por umbrales auto-alimentado 𝑆𝐸𝑇𝐴𝑅 (𝑘; 𝑝1 , 𝑝2 , … 𝑝𝑘 ; 𝑑) con 𝑘 regímenes, siendo 𝑘 ≥ 2, se define
como:

donde Ω𝑖 es una partición del dominio −∞, ∞ de manera que ∪𝑘𝑖=1 Ω𝑖 = −∞, ∞ y Ω𝑖 ∩ Ω𝑗 = ∅, ∀𝑖 ≠ 𝑗 . Las particiones del
dominio están dictadas por el valor de la variable umbral 𝑌𝑡−𝑑 , donde 𝑑(𝑑 ∈ 𝑍 + ) es conocido como parámetro delay. En cada
(𝑖)
régimen, 𝑒𝑡 es una secuencia de variables aleatorias independientes e idénticamente distribuidas con media cero y desviación
finita σ(i). La función I(.) es una función indicadora, que toma valor 1 cuando se cumple la condición y 0 en otro caso.

• Su extensión directa será añadiendo el componente media móvil, con lo que un modelo 𝑆𝐸𝑇𝐴𝑅𝑀𝐴 (𝑘; 𝑝1 , … , 𝑝𝑘 ; 𝑞1 , … , 𝑞𝑘 ; 𝑑) se
define como
Estimación e identificación modelo SETAR
• Minimizar la suma de residuos al cuadrados:

• El estimador MCO:

• Contraste de linealidad:
Hipótesis nula (linealidad)

 Ratio de Verosimilitud
Hipótesis alternativa (No Linealidad)
 Tsay (1998)
Aplicación Eviews

- Dependiente
- Explicativas

No afectadas por
el umbral

SETAR: Rezagos
TAR: Variable y rezagos
Aplicación Eviews (tasa crecimiento PBI)
1. Modelo Univariado 2. Modelo con Umbral

a) Correlograma b) Estimación AR(3)


Aplicación Eviews (tasa crecimiento PBI)
1 3

 Mejora en indicadores de información


 Incremento de R2
2

Inflación Baja: 𝝅𝒕−𝟏 < 𝟒%

𝑦 = 0.009 + 0.45𝑦𝑡−1 + 0.19𝑦𝑡−2 + 0.21𝑦𝑡−3 + 𝑒𝑡

Inflación Alta:𝝅𝒕−𝟏 ≥ 𝟒%

𝑦 = −0.004 + 0.20𝑦𝑡−1 + 0.79𝑦𝑡−2 − 0.04𝑦𝑡−3 + 𝑒𝑡


Aplicación Eviews (tasa crecimiento PBI)
4 Correlograma de los residuos: 6 Ramsey Test:

7 Pruebas CUSUM (H0: Ausencia de quiebre o estab.parámetros)

5 Test Jarque Bera (H0: Errores siguen distribución Normal)

6 y 7: No habría especificación incorrecta del modelo.

¿Se puede mejorar? ¿Qué podemos hacer?


Modelo STAR (Smooth Transition Autoregressive )
• Fueron introducidos en la literatura de series de tiempo por Chan y Tong (1986), representaron un avance respecto a los modelos
TAR ya que estima la velocidad de transición entre estados y el threshold que separa los distintos PGD.

• Teräsvirta & Tjøstheim (2010) señalan que el modelo STAR tiene como supuesto que los cambios de regímenes son generados por
una variable de transición observable 𝑍𝑡 , ya sea endógena rezagada, exógena o ambas. Además de ello se define la función de
transferencia exponencial que determina el peso del régimen y que está, usualmente, limitada entre 0 y 1.

• Matemáticamente se expresan así:


 Variables explicativas:
 Función de transición:  Función logística (LSTAR)
 Umbral: 𝑐1
 Variable de transición observable: 𝑠1
 Parámetro de suavidad: 𝛾1
• El parámetro 𝜸𝟏 determina la suavidad del cambio en el valor de la función logística y, por lo tanto, la suavidad de la transición de
un régimen a otro.
Aplicación 1: Crecimiento de créditos
• Paper “Existencia de un boom de créditos en el Perú: Análisis desde la perspectiva de un modelo de cambio de
régimen” (Bacigalupo & Bacigalupo, 2009).

• ¿A qué tasa de crecimiento del PBI los bancos empiezan a volverse miopes e incrementar sus préstamos?. Boom
Crediticio.

• Esta metodología permite verificar la existencia de un cambio de régimen en el comportamiento de los créditos de
consumo, dependiendo del crecimiento del PBI experimentado en el último período de doce meses.

• Supuesto: Causalidad desde el crecimiento económico hacia los créditos de consumo.


• Variable endógena: Tasa de crecimiento de los créditos de Consumo.
• Variable transición: Promedio de los últimos doce meses de la variación porcentual anualizada del PBI.
Aplicación 1: Crecimiento de créditos
• Paper “Existencia de un boom de créditos en el Perú: Análisis desde la perspectiva de un modelo de cambio de
régimen” (2009).
𝐶𝑟𝑒𝑑𝑡 = 0.08 + 1.3 ∗ ∆%𝑃𝐵𝐼𝑡 + −0.13 + 2.84 ∗ ∆%𝑃𝐵𝐼𝑡 ∗ 𝐹 𝑠𝑡 , 𝛾, 𝑐 + 𝜀𝑡
1
𝐹 𝑠𝑡 , 𝛾, 𝑐 =
(1 + 𝑒𝑥𝑝 −312 ∗ ∆%𝑃𝐵𝐼𝑡−2 − 𝟑. 𝟖% )
 Si la economía peruana crece en promedio doce meses a una tasa mayor a
3.8%, los bancos sobrereaccionan y empiezan a prestar a una tasa casi tres
veces mayor a la que prestarían con un crecimiento promedio de los
últimos doces meses menor a la tasa umbral encontrada.

Ratio = 3

 Coloquialmente se puede decir que los bancos se emocionan y expanden


los créditos, impulsados por el mayor crecimiento económico.

 En Perú existió un Boom crediticio en los periodos 2004-2008 y 2010-2014.


Aplicación 1: Crecimiento de créditos
• Evaluación del modelo:
Verificamos en qué periodos se activa la función de transición
Se recomienda el uso del modelo no lineal

Función de transición y la variable de transición.


Aplicación 2: Identificación Ciclos Económicos
• Paper: “Application of Three Non-Linear Econometric Approaches to Identify Business Cycles in Peru” (2010)
• Utilizaremos la serie Producto Bruto Interno (mill S/.).
𝑦𝑡 = log(𝑝𝑏𝑖_𝑠𝑎) Δ4 𝑦𝑡 = 𝑦𝑡 − 𝑦𝑡−4
PBI desestacionalizado (logaritmo): yt Tasa Crecimiento Anual: d4yt
12.0 .2

.1
11.6
.0

11.2 -.1

-.2
10.8
-.3

10.4 -.4
1980 1985 1990 1995 2000 2005 2010 2015 2020 1980 1985 1990 1995 2000 2005 2010 2015 2020

• Originalmente el documento analiza los periodos 1980q1 – 2008q4. Esta vez nos extenderemos hasta el 2021q1.
• Modelo logístico de 2do orden: Δ4 𝑦𝑡 = 𝜙1 ′𝑥𝑡 1 − 𝐹(𝑠𝑡 ; γ; 𝑐) + 𝜙2 ′𝑥𝑡 𝐹(𝑠𝑡 ; γ; 𝑐) + ε𝑡
𝑥𝑡 = (1, Δ4 𝑦𝑡−1 , Δ4 𝑦𝑡−2 , Δ4 𝑦𝑡−3 , Δ4 𝑦𝑡−4 )
1
𝐹 𝑠𝑡 , 𝛾, 𝑐 = 𝟐
(1 + 𝑒𝑥𝑝 −𝛾 ∗ Π𝑖=1 𝑠𝑡 − 𝒄𝒊 )

• Dos versiones del modelo, usando: 𝑠𝑡 = Δ4 𝑦𝑡−1 y 𝑠𝑡 = Δ4 𝑦𝑡−4


Aplicación 2: Identificación Ciclos Económicos
• Paper: “Application of Three Non-Linear Econometric Approaches to Identify Business Cycles in Peru” (2010)
• Resultados:
𝑴𝒐𝒅𝒆𝒍𝒐 𝟏: 𝒔𝒕 = 𝜟𝟒 𝒚𝒕−𝟏 𝑴𝒐𝒅𝒆𝒍𝒐 𝟐: 𝒔𝒕 = 𝜟𝟒 𝒚𝒕−𝟒 𝑹𝒆𝒔𝒖𝒍𝒕𝒂𝒅𝒐𝒔 𝑹𝒐𝒅𝒓𝒊𝒈𝒖𝒆𝒛 (𝟐𝟎𝟏𝟎)

• Basado en los criterios de información, el modelo 1 sería elegido.


• El valor de gamma (slope) en el modelo 2, indica un cambio abrupto entre ambos régimenes.
• Evaluemos estacionariedad en ambos regímenes.
Aplicación 2: Identificación Ciclos Económicos
• Paper: “Application of Three Non-Linear Econometric Approaches to Identify Business Cycles in Peru” (2010)
• Resultados:
1.2 𝑴𝒐𝒅𝒆𝒍𝒐 𝟏: 𝒔𝒕 = 𝜟𝟒 𝒚𝒕−𝟏
1.0

0.8 • Pocas observaciones menores a 𝒄1 y regulares


0.6
observaciones por encima de 𝒄2
• La mayoría de las observaciones se encuentran
0.4 entre ambos umbrales. Sin embargo, el
intervalo es muy alto.
0.2
• Existen muchos puntos a la derecha de 0,
0.0
demostrando que la economía peruana ha
mantenido mayores periodos de crecimiento.
-0.2

-0.4 𝑴𝒐𝒅𝒆𝒍𝒐 𝟐: 𝒔𝒕 = 𝜟𝟒 𝒚𝒕−𝟒


1980 1985 1990 1995 2000 2005 2010 2015 2020

TF_1SERIES D4YT
• Regulares observaciones menores a 𝒄1 y pocas
• La función de transición muestra los periodos donde la economía peruana observaciones por encima de 𝒄2
presenta grandes tasas de crecimiento o decrecimiento. • La mayoría de las observaciones se encuentran
• Altas tasas de crecimiento: entre ambos umbrales.
o 1era mitad del gobierno de AG 1986Q4-1987Q2 (elevado gasto fiscal) • Con este modelo, cuando la economía peruana
o 2da mitad del gobierno de AF 1994Q2 – 1995Q2 estuvo en recesión no estuvo en este régimen
• Este modelo no identifica periodos recesivos (más de dos tasas de por mucho tiempo.
decrecimiento consecutivas)
Aplicación 2: Identificación Ciclos Económicos
• Paper: “Application of Three Non-Linear Econometric Approaches to Identify Business Cycles in Peru” (2010)
• Evaluación del modelo: Test LM

Test de autocorrelación Test de NO linealidad restante Test de constancia de parámetros


serial en los residuos (tests of no remaining nonlinearity) (Parameter Constancy Test)
Hipotesis nula: NO autocorrelación ¿Existe alguna no-linealidad adicional no modelada?
Hipotesis nula: NO hay cambio de parámetros
Hipotesis nula: NO existe no-linealidad

• Rechaza H0. Parámetros cambian en el tiempo.


• Los modelos LSTAR ofrecen una alternativa útil
a los modelos lineales como consecuencia de
su capacidad para mostrar una dinámica de
cambio entre regímenes.
Modelo Markov - Switching
• Se asume que el cambio de un régimen a otro depende de una variable discreta no-observable 𝑠𝑡 que sigue una
cadena de Markov:
𝑃𝑟𝑜𝑏 𝑠𝑡 = 𝑗 𝑠𝑡−1 = 𝑖 = 𝑝𝑖𝑗 𝑡
Además cumple la condición: σ𝑚
𝑗=1 𝑝𝑖𝑗 = 1 ∀𝑖, 𝑗 ∈ {1,2}
El proceso 𝑠𝑡 se caracteriza por la matriz de transición P (considerando solo dos regímenes):
𝑝11 𝑝12
𝑃= 𝑝 𝑝
21 22
• Se asumirá que las probabilidades de transición son constantes en el tiempo.
• Cada probabilidad se puede estimar como un modelo multinomial que depende de variables exógenas 𝐺𝑡−1 :

• Función de máxima verosimilitud:


Aplicación 3: Identificación Ciclos Económicos
• El modelo de PIB de Hamilton (1989) es un ejemplo notable de una especificación de probabilidad de transición
constante.
• Hamilton (1989) especifica un modelo de cambio de Markov de dos estados en el que la tasa media de crecimiento
del PBI está sujeta a cambios de régimen, y donde los errores siguen un proceso AR (4) invariante de régimen.
• Aplicación con tasa de crecimiento Perú:
Proceso AR (4) invariante Proceso AR (4) variante en cada régimen
Filtro de Kalman
Modelos Estado-Espacio
Profesor: Mg. Ricardo Ramos Rojas

XIII PEEA - 2022

FIEECS - Universidad Nacional de Ingeniería (UNI)


Introducción
• El filtro de Kalman es un conjunto de ecuaciones matemáticas que proveen una solución recursiva eficiente del método de
mínimos cuadrados.
• Este filtro es el principal algoritmo para estimar sistemas dinámicos especificados en la forma de estado-espacio (State-space).
• Entre los usos particulares se encuentra la modelación de componentes no observables y parámetros que cambian en el tiempo.
• El filtro de Kalman consta de dos conjunto de ecuaciones:
 La primera es una ecuación de medición (también conocida como ecuación de señal o de observación):

Donde:
𝑦𝑡 es un vector de variables observables de orden nx1
𝐻𝑡 es una matriz de orden nxm
𝑍𝑡 es una matriz de variables exógenas de orden nxk
𝛽𝑡 es un vector de variables de estado no observables de orden mx1
𝐴𝑡 es una matriz de parámetros kxn
𝜀𝑡 es el error de observación con media 𝐸 𝜀𝑡 = 0 y varianza
𝑣𝑎𝑟(𝜀𝑡 ) = 𝑅𝑡 donde 𝑅𝑡 es una matriz conocida nxn
Introducción
• El filtro de Kalman consta de dos conjunto de ecuaciones:
 La segunda es la ecuación de estado (variables no observables):

Donde:
𝐹𝑡 es una matriz mxm
𝑢𝑡 es un vector mx1
𝑆𝑡 es una matriz mxg
𝑣𝑡 es un vector de perturbaciones no correlacionadas con media
𝐸 𝑣𝑡 = 0 y varianza 𝑣𝑎𝑟(𝑣𝑡 ) = 𝑄𝑡 donde 𝑄𝑡 es una matriz conocida
gxg

• Los dos errores 𝑣𝑡 y 𝜀𝑡 pueden estar correlacionados:

• En la mayoría de los casos, sin embargo, asumimos que la matriz de covarianzas 𝐺𝑡 = 0


• Las matrices 𝐻𝑡 , 𝑅𝑡 , 𝐹𝑡 , 𝑆𝑡 , 𝑄𝑡 y 𝐺𝑡 se conocen como matrices del sistema. La mayoría de los elementos de estas matrices serán elementos
fijos, principalmente unos y ceros.
• Las matrices de transición 𝐹𝑡 en la ecuación de transición suelen ser invariantes en el tiempo, al igual que las varianzas de los choques 𝑄𝑡 .
• Por otro lado, muchos modelos no necesitan incluir ninguna variable exógena, 𝑍𝑡 .
Introducción
• Ventajas del filtro de Kalman:
 Puede estimar variables no observables.

 Método de estimación para modelos estado-espacio.

 Evita la influencia de posibles cambios estructurales en la estimación (*): el filtro de Kalman utiliza toda la historia de la serie
pero con la ventaja de que intenta estimar una trayectoria estocástica de los coeficientes en lugar de una determinística, con lo
cual soluciona el posible sesgo de la estimación ante la presencia de cambios estructurales. Puede generar errores estándar
más grandes.

• Entre las desventajas del filtro se menciona que requiere condiciones iniciales de la media y varianza del vector estado para iniciar el
algoritmo recursivo.

• Método de estimación: Máxima verosimilitud.


Descomposición PBI: Ciclo y tendencia
• Diversos autores consideran la brecha del producto como una variable latente.
• Un modelo básico para representar una serie de tiempo, 𝑦𝑡 , es el modelo aditivo, también conocido como descomposición clásica.
• Busca descomponer una serie de tiempo, 𝑦𝑡 , en un conjunto exhaustivo de componentes subyacentes no observados:

donde:
𝜏𝑡 un componente no observado que cambia lentamente (tendencia);
𝑐𝑡 un componente no observado que se repite periódicamente (ciclo);
𝛾𝑡 un componente no observado periódico, (estacional);
𝑣𝑡 un componente autorregresivo no observado; y
𝜀𝑡 un componente irregular no observado (perturbación)

• No es necesario incluir todos los componentes al mismo tiempo.


• Algunos componentes se modelan explícitamente como procesos estocásticos que tienen una interpretación directa (al menos semi-
económica). Como tales, los componentes pueden ser funciones deterministas del tiempo (por ejemplo, polinomios) o procesos
estocásticos.
Descomposición PBI: Ciclo y tendencia
Tendencia local (Random Walk con ruido)

 En este modelo, solo el nivel 𝜏𝑡 , y el componente irregular, 𝜀𝑡 , no se observan.

 El componente 𝜏𝑡 es la variable de estado que representa el valor fundamental (señal) del logaritmo del PIB real, mientras que la
ecuación de transición muestra que los valores de 𝜏𝑡 , y por lo tanto 𝑦𝑡 , evolucionan de acuerdo con un paseo aleatorio. Aquí, 𝜏𝑡 es
un paseo aleatorio puro y 𝑦𝑡 es una versión observada de 𝜏𝑡 con ruido añadido 𝜀𝑡 .
 El componente 𝜀𝑡 representa desviaciones aleatorias (ruido) del valor fundamental que se supone que son independientes de las
innovaciones de 𝜏𝑡 .
 En la literatura, 𝜏𝑡 se conoce como la tendencia de la serie, que no es directamente observable y 𝑦𝑡 es el logaritmo observado de
datos del PIB real con error de observación (o medición) 𝜀𝑡 .
 La interpretación de este modelo es que 𝜏𝑡 es un nivel local o media (no observable) para el proceso. Es local en el sentido de que el
nivel puede evolucionar de un período a otro debido al proceso de choque, 𝜂𝑡 .
 El ciclo en todos estos casos es igual a 𝑐𝑡 = 𝜀𝑡 = 𝑦𝑡 − 𝜏𝑡 .
Descomposición PBI: Ciclo y tendencia
Tendencia LINEAL local

 Utilizado para modelar series de tendencia fuerte.

 Permite que el nivel de tendencia y la pendiente varíen con el tiempo. Este modelo puede ser útil en los casos en que una sola
tendencia lineal no se ajusta bien a los datos.

 En este modelo, 𝛽𝑡 es la tasa de tendencia local y 𝜏𝑡 es la tendencia local en sí misma, que es el valor medio local para el observable
𝑦𝑡 .. En otras palabras, 𝜏𝑡 y 𝛽𝑡 son el nivel y la pendiente de la tendencia respectivamente.

 El parámetro de pendiente estocástica, 𝛽𝑡 , permite que la tendencia cambie suavemente con el tiempo.

 En este modelo 𝜂𝑡 y 𝜁𝑡 , dan cuenta de los choques permanentes en el nivel de producción, proporcionando una explicación de los
movimientos en esa variable.

 Se ha utilizado ampliamente con el propósito de descomponer el ciclo de tendencia.

 El ciclo viene dado de nuevo por 𝑐𝑡 = 𝑦𝑡 − 𝜏𝑡


Descomposición PBI: Ciclo y tendencia
Ciclo

con 0 <𝑝𝑐 <1 y 0 ≤ 𝜆𝑐 ≤ π, donde 𝜆𝑐 es la periodicidad del ciclo en radianes. Además, 𝐾𝑡 , 𝐾𝑡 * ~ N (0,𝜎𝑘2 ), es decir, los dos procesos de error
comparten la misma varianza.

 El componente del ciclo, 𝑐𝑡 , siguiendo a Harvey y Jäger (1993), es de forma trigonométrica y consta de uno o más ciclos.

 La idea básica detrás del modelo de componentes no observados (UC por sus siglas en inglés) es proporcionar ecuaciones
estructurales para los componentes de la descomposición del ciclo-tendencia que tienen una interpretación estadística directa.

 Las especificaciones de UC para extraer componentes cíclicos generalmente se prefieren a las representaciones ARIMA (Beveridge y
Nelson):
o No necesariamente un modelo ARIMA(p,d,q) recoge las características de las series subyacentes.
o Modelos ARIMA no permiten pronosticar ciertos componentes a largo plazo.
Aplicación I en Eviews
Objects/New Object.../SSpace
(Modelo tendencial local)

e-10 = 0.00005

param c(1) -10 c(2) -10 valores iniciales de los parámetros que se van a estimar

@ename e1 @ename Error de medición

@ename v1 @ename Error de la ecuación de estado

@evar var(e1) = exp(c(1)) @evar Varianza del error Ec. Señal

@evar var(v1) = exp(c(2)) @evar Varianza del error Ec. Estado

@signal lrgdp_sa = trend + e1 Ecuación de observación o señal


Error con nombre
@state trend = trend(-1) + v1 Ecuación de Estado

 La función exponencial se utiliza para garantizar estimaciones de varianza no negativas


 Si no hay error o varianza del error, se supone que la ecuación de la señal/estado es determinista.
 Esta estructura es más flexible.
Aplicación I en Eviews
Objects/New Object.../SSpace
(Modelo tendencial local)

e-10 = 0.00005

param c(1) -10 c(2) -10 valores iniciales de los parámetros que se van a estimar

@signal lrgdp_sa = trend + [var = exp(c(1))] Ecuación de observación o señal Especificación


de varianza de
@state trend = trend(-1) + [var = exp(c(2))] Ecuación de Estado
error

 La función exponencial se utiliza para garantizar estimaciones de varianza no negativas.


 Si no hay error o varianza del error, se supone que la ecuación de la señal/estado es determinista.
 No permite la correlación entre errores en diferentes ecuaciones.
 Asume que la covarianza entre diferentes errores en diferentes ecuaciones es cero.
Aplicación I en Eviews
*
(Modelo tendencial local)

1 2 3

 Los coeficientes c(1) y c(2), son los logaritmos de la varianza de los términos de error para las medidas y
ecuaciones de estado. Por lo tanto, estimamos que 𝜎 2 𝜀 = exp(𝑐1) y 𝜎 2 𝜂 = exp(𝑐2).
 Varianza del error de medición es muy bajo [exp(-27.37892) =] y en el error de la tendencia 0.17.
 ¿Por qué la tendencia obtenida es similar a la serie observada? ¿Cuál sería el ciclo?
 ¿Podemos mejorar el modelo?
Aplicación II en Eviews
Watson (1986)*
….
watson_1.append @state trend = c(1) + trend(-1) + v1
watson_1.append @state cycle = c(2) + c(3)*cycle(-1) + c(4)*sv1(-1) + v2
….
 Ciclo se modela como un AR(2)

1 2

 Podemos ver que el coeficiente c(2) es estadísticamente insignificante (𝜙0 ).


 ¿El ciclo obtenido puede considerarse un ciclo económico?

(*) Watson, M W (1986), Univariate detrending methods with stochastic trends, Journal of Monetary Economics, Vol. 18, No. 1, pages 49-75.
Aplicación II en Eviews
Watson (1986)*
….
watson_2.append @state trend = c(1) + trend(-1) + v1
watson_2.append @state cycle = 0 + c(3)*cycle(-1) + c(4)*sv1(-1) + v2
….
 Ciclo se modela como un AR(2)

1 2

(*) Watson, M W (1986), Univariate detrending methods with stochastic trends, Journal of Monetary Economics, Vol. 18, No. 1, pages 49-75.
Aplicación III en Eviews
Modelo tendencial Lineal local
….
linealtrend_1.append @signal lrgdp_sa = trend + e1
linealtrend_1.append @state trend = trend(-1) + beta(-1) + v1
linealtrend_1.append @state beta = beta(-1) + v2
….

1 2

2 2
 Se puede establecer escenarios según las varianzas 𝜎𝑣1 y 𝜎𝑣2 .
Aplicación IV en Eviews
Modelo tendencial Lineal local (Harvey, 1985; Clark, 1987)
….
linealtrend_6.append @signal lrgdp_sa = trend + cycle
linealtrend_6.append @state trend = trend(-1) + beta(-1) + v1
linealtrend_6.append @state beta = beta(-1) + v2
linealtrend_6.append @state cycle = c(1)*cycle(-1) + c(2)*sv1(-1) + v3
linealtrend_6.append @state sv1 = cycle(-1)
….

1 2
Aplicación IV en Eviews
Modelo Multivariado
 Las estimaciones del filtro de Kalman univariante se pueden mejorar agregando información macroeconómica
complementaria.

 Clark (1989) proporcionó una aplicación temprana, donde el movimiento cíclico en el producto se mide usando un
modelo UC bivariado, donde el producto y el desempleo (o alternativamente inflación) tienen cada uno su propio
componente de tendencia, pero el componente cíclico es común a las dos series.
u: tasa de inflación
….
@signal lrgdp_sa = trendy + cycley
@state trendy = c(1) + trendy(-1) + v1
@state cycley = c(2)*cycley(-1) + c(3)*sv2(-1) + v2

@signal inflation = trendpi + cyclepi


@state trendpi = trendpi(-1) + v3
@state cyclepi = c(4)*cycley(-1) + c(5)*sv2(-1) + v4
@state sv2 = cycley(-1)
….
Aplicación V en Eviews
Modelo Componente No Observables (UC)
 Modelo:
….
@signal lrgdp_sa = trend + psi + e1
@state trend = trend(-1) + beta(-1) + v1
@state beta = beta(-1) + v2
@state psi = c(5)*cos(c(6))*psi(-1) + c(5)*sin(c(6))*psistar(-1) + v3
@state psistar = -c(5)*sin(c(6))*psi(-1) + c(5)*cos(c(6))*psistar(-1) + v3
….

1 2
Aplicación: Identificación de Auges Crediticios
“Identificacion de Episodios de Auge Crediticio: Una propuesta Metodologica con
Fundamentos Economicos” (Lahura et al., 2013)
 Metodologías para capturar la tendencia y desvío excesivo del nivel de crédito:
a) Filtros estadísticos: Principalmente el filtro de Hodrick-Prescott
b) Modelos basados en fundamentos del crédito: Cointegración y Modelo de Corrección de errores.
c) Propuesta por Lahura et al. (2013): Filtro de Kalman. Las desviaciones del crédito (respecto de su tendencia
filtrada) se modelan en función de: (i) variables fundamentales (medidas como desviaciones respecto de su
tendencia filtrada), y (ii) una variable (de estado) no observable, la cual mide el componente de las desviaciones
del crédito que no está asociado a sus fundamentos.

 Modelo (representación Estado-Espacio):


𝐶𝑡𝑑 Ratio crédito/PBI Crédito Real per cápita

Ecuación de observación: 𝑌𝑡𝑑 Logaritmo del PBI real

𝑇𝐼𝑡𝑑 Logaritmo de los términos de intercambio


Ecuación de estado:
ξt Desvíos del crédito

d: todas las variables están expresadas como


desviaciones respecto de su tendencia filtrada con HP
Aplicación: Identificación de Auges Crediticios
“Identificación de Episodios de Auge Crediticio: Una propuesta Metodológica con
Fundamentos Económicos” (Lahura et al., 2013)
 Enfoque estadístico
a) Metodología de Mendoza y Terrones (2008)
Identificación de periodos de auge crediticio Identificación de periodos de auge crediticio
Serie: Ratio Crédito/PBI Serie: Credito Real per Capita
4 20

1 3 2 15

2
10
1
5
0
0
-1

-5
-2

-3 -10

-4 -15
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18

Umbral = 1.65*Desviación{Ciclo 1} Umbral = 1.65*Desviación{Ciclo 2}


Umbral = 2.31 Umbral = 8.26

Periodos de auge crediticio: Periodos de auge crediticio:


 1998Q4-1999Q4  1998Q3-1999Q4
 2008Q4
 2015Q3-2015Q4
Aplicación: Identificación de Auges Crediticios
“Identificación de Episodios de Auge Crediticio: Una propuesta Metodológica con
Fundamentos Económicos” (Lahura et al., 2013)
 Propuesta con Filtro de Kalman:
CREDITO_PBI_TOT CREDITOREAL_PERCAPITA

1 44

40
160
2 4
CD1
20
CD2

140
36 15

32 2
120 10
28
5
24 100 0
0
20
80 -5
16 Ciclo de cada serie con HP -2

12 60
-10
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
-4 -15
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18

PBI_REAL TI
160,000 120 YD TID

110 .08 .2
140,000

100 .06
120,000 .1
90 .04
100,000 .0
80 .02

80,000 .00
70 -.1
60,000 60 -.02
-.2
40,000 50 -.04
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
-.06 -.3
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
Aplicación: Identificación de Auges Crediticios
“Identificación de Episodios de Auge Crediticio: Una propuesta Metodológica con
Fundamentos Económicos” (Lahura et al., 2013)
 Propuesta con Filtro de Kalman:
Ciclo 1: Ratio Credito/PBI
5 6
3 6

Calibrados a partir de simulaciones 0

-2

-4
94 96 98 00 02 04 06 08 10 12 14 16 18

CICLOCREDITICIO ± 2 RMSE

Un episodio de auge se identifica como aquel


periodo durante el cual i) la variable de estado
es positiva y estadísticamente significativa; y
(ii) el crédito registra un crecimiento positivo y
persistente (es decir, la tasa de crecimiento
muestra una tendencia positiva).
Aplicación Ciclo Económico y Ciclo Financiero
Modelo Multivariado UC (Koopman, Lit y Lucas, 2016)
 Extraer ciclo económico y ciclo financiero simultáneamente con diferentes escalas y fases.

 Modelo:

• Cada serie 𝑦𝑖 tiene un ciclo


económico o ciclo económico.
• Metodología de cambio de fase entre
ciclos.
• Ciclo Financiero y Económico común.
Tienen una especificación
trigonométrica.

 El vector 𝑦𝑡 = 𝐺𝐷𝑃 ; 𝐶𝑟𝑒𝑑𝑖𝑡 ; 𝐶𝑟𝑒𝑑𝑖𝑡 − 𝑡𝑜 − 𝐺𝐷𝑃 ; 𝑟𝑒𝑠𝑖𝑑𝑒𝑛𝑡𝑖𝑎𝑙 𝑝𝑟𝑜𝑝𝑒𝑟𝑡𝑦 𝑝𝑟𝑖𝑐𝑒𝑠

 Tarea: Considerar estas variables u otras y plantear un modelo de multivariado para estimar con Filtro de Kalman.
Análisis Espectral
(Spectral Analysis)
Profesor: Mg. Ricardo Ramos Rojas

XIII PEEA - 2022

FIEECS - Universidad Nacional de Ingeniería (UNI)


Introducción
• Los datos se series de tiempo son usualmente vistos desde el análisis en el dominio del tiempo. Sin embargo también pueden ser
interpretados con técnicas de análisis espectral, las cuales se conocen comúnmente como análisis en el dominio de la frecuencia.
• Aunque ambos contienen la misma información, difieren en términos de presentación e interpretación, por ejemplo, es sencillo
encontrar una onda determinista que explique la serie utilizando análisis espectral, mientras que no ocurre lo mismo con el análisis
en el dominio del tiempo, por lo tanto, deben ser visto como herramientas complementarias más que competitivas.
• Joseph Fourier buscó descomponer una señal o serie de tiempo en una suma infinita de ondas sinusoidales:
𝑇/2

𝑥𝑡 = ෍ 𝑎𝑖 cos 𝑤𝑖 𝑡 + 𝑏𝑖 𝑠𝑒𝑛(𝑤𝑖 𝑡)
𝑖=0
2𝜋𝑖
donde 𝑎𝑖 y 𝑏𝑖 determinan la importancia de cada onda y 𝑤𝑖 es la frecuencia angular dada en radianes 𝑤𝑖 = .
𝑇
• Por un lado, el Teorema de Wold en el dominio del tiempo establece que cualquier serie de tiempo estacionaria se puede
representar mediante una suma infinita de términos AR (p) y MA (q).

• Por otro lado, en el dominio de la frecuencia el Teorema de Representación Espectral (Hamilton, 1994) establece que cualquier
serie estacionaria puede ser representada por una suma infinita de señales de seno y coseno.
𝜋 𝜋
𝑌𝑡 = 𝜇 + න 𝛼 𝜔 . cos 𝜔𝑡 𝑑𝜔 + න 𝜑 𝜔 . sin 𝜔𝑡 𝑑𝜔
0 0
Densidad espectral
• El objetivo será determinar qué tan importantes son los ciclos de diferentes frecuencias en teniendo en cuenta el comportamiento
de la serie 𝑌𝑡 .
• Se tiene un proceso estacionario
Con media: 𝐸 𝑌𝑡 = 𝜇
Autocovarianzas: 𝐸 𝑌𝑡 − 𝜇 𝑌𝑡−𝑗 − 𝜇 = 𝛾𝑗 ∞

• La función de generadora de autocovarianzas se define: 𝑔𝑦 𝑧 = ෍ 𝛾𝑗 ∗ 𝑧 𝑗


𝑗=−∞

1
• La densidad espectral poblacional se define: 𝑠𝑌 (𝜔) = ෍ 𝛾𝑗 ∗ 𝑒 −𝑖𝜔𝑗 donde, 𝑒 −𝑖𝜔𝑗 = cos 𝜔𝑗 − 𝑖 sin(𝜔𝑗)
2𝜋
𝑗=−∞

1
𝑠𝑌 (𝜔) = ෍ 𝛾𝑗 cos 𝜔𝑗 − 𝑖 sin(𝜔𝑗)
2𝜋
𝑗=−∞

1 1
𝑠𝑌 𝜔 = 𝛾 cos 0 − 𝑖 sin 0 + ෍ 𝛾𝑗 cos 𝜔𝑗 + cos −𝜔𝑗 − 𝑖 sin(𝜔𝑗)−𝑖 sin(−𝜔𝑗)
2𝜋 0 2𝜋
𝑗=1


1 A partir del comportamiento del espectro, podemos ver
𝑠𝑌 𝜔 = 𝛾 + 2 ෍ 𝛾𝑗 cos 𝜔𝑗 qué frecuencias agregan más a la varianza del proceso.
2𝜋 0
𝑗=1 Son aquellas en las que el espectro tiene un valor alto.
Densidad espectral
• Otra forma de analizarlo, es a través del Proceso Lineal General:
𝑦𝑡 = 𝐵(𝐿)𝜀𝑡
𝜎2
𝑠𝑌 𝜔 = 𝐵 𝑒 𝑖𝑤 𝐵 𝑒 −𝑖𝑤
2𝜋
𝜎2 2
𝑠𝑌 𝜔 = 𝐵 𝑒 𝑖𝑤
2𝜋

• Propiedades:
 Simétrica alrededor de 𝑤 = 0
 Periódica 2 𝜋
 No-negativa
Densidad espectral (ejemplos)
• Modelo: Ruido Blanco 𝜎2
𝑌𝑡 = 𝑒𝑡 𝑠𝑌 𝜔 =
2𝜋

• Modelo: MA(1) 𝑌𝑡 = 𝑒𝑡 + 𝜃𝑒𝑡−1 𝜎 2 [1 + 𝜃 2 + 2𝜃 cos 𝑤 ]


𝑠𝑌 𝜔 =
2𝜋

• Modelo: AR(1) 𝑌𝑡 = 𝑐 + ϕ𝑌𝑡−1 + 𝑒𝑡 1 𝜎2


𝑠𝑌 𝜔 =
2𝜋 [1 + ϕ2 − 2ϕcos(𝑤)]

• Modelo: ARMA(p,q) 𝑌𝑡 = 𝑐 + ϕ1 𝑌𝑡−1 + ϕ2 𝑌𝑡−2 + ⋯ + ϕ𝑝 𝑌𝑡−𝑝 +𝑒𝑡 + 𝜃1 𝑒𝑡−1 + 𝜃2 𝑒𝑡−2 + ⋯ + 𝜃𝑞 𝑒𝑡−𝑞

Polinomio MA(q): 1 + 𝜃1 𝑧 + 𝜃2 𝑧 2 + ⋯+𝜃𝑝 𝑧 𝑝 = (1 − η1 𝑧) 1 − η2 𝑧 … (1 − η𝑞 𝑧)

Polinomio AR(p): 1 + ϕ1 𝑧 + ϕ2 𝑧 2 + ⋯+ϕ𝑝 𝑧 𝑝 = (1 − λ1 𝑧) 1 − λ2 𝑧 … (1 − λ𝑝 𝑧)


𝑞 2
𝜎 2 ς𝑗=1[1 + η𝑗 − 2η𝑗 cos 𝑤 ]
𝑠𝑌 𝜔 =
2𝜋 ς𝑝𝑗=1[1 + λ𝑗2 − 2λ𝑗 cos 𝑤 ]
Ejemplo MA (1)
𝜎 2 [1 + 𝜃 2 + 2𝜃 cos 𝑤 ]
• MA (1) 𝑠𝑌 𝜔 =
2𝜋

 MA positivo: espectro se concentra en frecuencias bajas.

 MA negativo: espectro se concentra en frecuencias altas.


Ejemplo AR (1)
• AR (1) 1 𝜎2
𝑠𝑌 𝜔 =
2𝜋 [1 + ϕ2 − 2ϕcos(𝑤)]

 AR positivo: espectro se concentra en frecuencias bajas.

 AR negativo: espectro se concentra en frecuencias altas.


Ejemplo AR(2)
• AR(2) 𝑌𝑡 = ϕ1 𝑌𝑡−1 + ϕ2 𝑌𝑡−2 + 𝑒𝑡

𝜎2 1
𝑠𝑌 𝜔 =
2𝜋 [1 + ϕ1 2 + ϕ2 2 − 2ϕ1 cos 𝑤 − 2ϕ2 cos 2𝑤 + 2ϕ1 ϕ2 cos 𝑤 ]

• Simulación:

 AR(2) estacionario
 w: representa la fracción dentro del rango de 0: 2𝜋
ϕ1 = 1.5 donde la densidad espectral alcanza su mayor valor.
ϕ2 = −0.95  𝑤𝑚á𝑥 = 0.11
 Ciclos ocurre cada 1/𝑤𝑚á𝑥 = 8.9 periodos
Estimación de la densidad espectral
• El periodograma es el estimador del área bajo el espectro de población de una serie, que puede verse como una función de
distribución de probabilidad. Debe interpretarse como frecuencias cercanas a un valor ayudan a explicar la varianza.

𝑇−1
1
𝑠Ƹ𝑌 𝜔 = 𝛾ො + 2 ෍ 𝛾ො𝑗 cos 𝜔𝑗
2𝜋 0
𝑗=1

• Problemas de estimación:
 Se requiere de un tamaña de T suficientemente grande.
 𝑠Ƹ𝑌 no alcanza más precisión a medida que T crece.
Aplicación en Eviews
• Ejemplo. AR(1): 𝒚𝒕 = α + ρ𝒚𝒕−𝟏 + 𝜺𝒕
Picos:

1
ρ = 𝟎. 𝟓 → 𝑓 ≈ 0.12 → 𝑐 = ≈ 8
𝑓
1
ρ = 𝟎. 𝟗 → 𝑓 ≈ 0.03 → 𝑐 = ≈ 33
𝑓
1
ρ = 𝟏. 𝟎 → 𝑓 ≈ 0.01 → 𝑐 = ≈ 100
𝑓

• Una vez obtenido las frecuencias de los ciclos, se pueden introducir en la modelación del AR como una variable exógena. Por
ejemplo en el caso de AR(1) con coeficiente 0.9:

genr cycle=@cos(2*3.14*@trend*0.03)+@sin(2*3.14*@trend*0.03)

También se puede introducir cada componente por separado y analizar quién explica mejor la serie.
Aplicación en R
• Crearemos una serie de tiempo simple y luego veremos cómo podemos extraer la información de frecuencia usando análisis
espectral.

 La variable x tiene una frecuencia de 1/16 y otra


frecuencia de 1/5

• El periodograma distribuye la varianza sobre la frecuencia, pero tiene dos inconvenientes.


i) El conjunto de frecuencias es arbitrario, en la medida en que depende de la longitud del registro.
ii) El periodograma no se vuelve más suave a medida que aumenta la duración de la serie de tiempo, sino que solo incluye más juntos.

• Gráfico de la serie X:
(*)

(*) Multiplicar la densidad espectral por 2 para que el área bajo el periodograma sea realmente igual a la varianza de la serie de tiempo.
Aplicación en R
• Ejemplos con variables macroeconómicas:

Densidad Espectral - Crecimiento PBI


0.009
0.008
0.008
0.007
0.007
0.006
0.006
0.005
0.005
0.004
0 1 2 3 4 5 6 7

• Crecimiento económico tiene ciclos con las siguientes características:


 Frecuencias de Mediano plazo
 Frecuencias de corto plazo
 Frecuencias de muy corto plazo (ruido ?)
• Existen papers que evidencia la existencia de ciclos de mediano plazo en el PBI.
• Tarea: Que características en el dominio de la frecuencia se encuentran en el resto de series?
Aplicación en Eviews:
Estimación del Ciclo Financiero (1980-2020)
• Leer paper “The New Zealand financial cycle 1968–2017” (Davies y Gai, 2018).
• Metodologías utilizadas:
 Componentes principales
 Análisis espectral CREDITO_REAL CREDITO_PBI DINERO_REAL

 Filtro de Christiano-Fitzgerald 500 50 160

1 400 40
140

120
300 30 100

• Construcción de Índice de Condiciones Financieras: 200 20 80

60
100 10
40

Variables abreviatura 0
92 94 96 98 00 02 04 06 08 10 12 14 16 18
0
92 94 96 98 00 02 04 06 08 10 12 14 16 18
20
92 94 96 98 00 02 04 06 08 10 12 14 16 18

DINERO_PBI CREDITO_DINERO INMUEBLES


Crédito real credito_real 14 9 120

12 8
100

Ratio Crédito/PBI credito_pbi 10


7
80
6
8

Dinero real (M3) dinero_real 6


5

4
60

40
4 3

M3/PBI dinero_pbi 2
92 94 96 98 00 02 04 06 08 10 12 14 16 18
2
92 94 96 98 00 02 04 06 08 10 12 14 16 18
20
92 94 96 98 00 02 04 06 08 10 12 14 16 18

Crédito/M3 credito_dinero 25,000


IGBVL

Precios Vivienda inmuebles 20,000

15,000

Precio de Acciones igbvl 10,000

5,000

Diferencial tasas No se encontró 0


92 94 96 98 00 02 04 06 08 10 12 14 16 18
Aplicación en Eviews:
Estimación del Ciclo Financiero (1980-2020)
• Leer paper “The New Zealand financial cycle 1968–2017” (Davies y Gai, 2018).
• Generar tasas de crecimiento anual
• Aplicar test de Raíz Unitaria a las variables en tasas de crecimiento anual (ADF especificación sin constante ni tendencia)
G_CREDITO_PBI G_DINERO_PBI G_CREDITO_DINERO
Variables P-value 1.6 .6 .8
Alternativas para medir el Ciclo Financiero
.6
1.2 5
g_credito_real 0.189 .4
.4
0.8 .2
4

g_credito_pbi 0.000 0.4


.2
.0 3
-.2
.0
g_dinero_real 0.289 0.0
-.4
2

-0.4 -.2 -.6 1


g_dinero_pbi 0.010 96 98 00 02 04 06 08 10 12 14 16 18 96 98 00 02 04 06 08 10 12 14 16 18 96 98 00 02 04 06 08 10 12 14 16 18
0
G_INMUEBLES G_IGBVL

g_credito_dinero 0.029 1.0 8 -1

0.8 -2
6
g_inmuebles 0.040 0.6
4 -3
0.4
g_igbvl 0.035 2 -4
0.2
96 98 00 02 04 06 08 10 12 14 16 18
0
0.0
PC1A PC1B PC1C
2 -0.2
96 98 00 02 04 06 08 10 12 14 16 18
-2
96 98 00 02 04 06 08 10 12 14 16 18

Creamos diferentes grupos 3 4


Consideramos PC1C como el
G1: Series Estacionarias índice de condiciones
G2: G1 - {g_inmuebles} financieras
G3: G2 - {g_igbvl}
Aplicación en Eviews:
Estimación del Ciclo Financiero (1980-2020)
• Leer paper “The New Zealand financial cycle 1968–2017” (Davies y Gai, 2018).
• Calculamos el Periodograma al Indice de Condiciones Financieras (ICF)

5 Descargar ADD-INS spectral analysis


Dar Click a la Serie y aplicar ADD-INS
> Davies y Gai (2018)
consideran punto de
truncación:
𝑀=2 𝑛
En este caso tenemos 161
datos. 𝑀 = 2 161 ≈ 25

> Davies y Gai (2018) utilizan


Barlett-Priestley.

> Analizar significancia de ciclos


en la serie (Signal Significance
Tests).
Aplicación en Eviews:
Estimación del Ciclo Financiero (1980-2020)
• Leer paper “The New Zealand financial cycle 1968–2017” (Davies y Gai, 2018).
• Calculamos el Periodograma al Indice de Condiciones Financieras (ICF)

7 H0: Frecuencia 𝑓𝑖 no significativa H0: Frecuencia 𝑓𝑖 no significativa H0: Observaciones provienen de un


proceso White noise
P-value VS Frequency on ICF (H0: The periodogram ordinate is not significant enough) T Statistic - Critical Value VS Frequency on ICF (H0: The periodogram ordinate is not significant enough) Normalized Integrated spectrum VS Frequency on ICF (H0: The observations come from a white noise process)

40 .1 1.4

30 1.2
.0
1.0
20

T Statistic - Critical Value


-.1 0.8
10
0.6
0 -.2
1.0 0.4
0.8
-.3 0.2
0.6
0.0
0.4 -.4
-0.2
0.2 Valor crítico = 5%
-0.4
0.0 -.5
.05 .10 .15 .20 .25 .30 .35 .40 .45
.1 .2 .3 .4 .05 .10 .15 .20 .25 .30 .35 .40 .45

FREQUENCY FREQUENCY

P-Value Test Statistic


• Si el test sale de alguna de las bandas se
rechaza H0.
• Ciclos de duración 33Q, 50Q y 100Q • Si el test es mayor a >0 se rechaza H0.
• Dentro de las frecuencias de mediano
son significativos • Ciclos de duración 50Q y 100Q son plazo, los ciclos de duración 33Q no
significativos provienen de datos White noise (rechaza
H0).
Aplicación en Eviews:
Estimación del Ciclo Financiero (1980-2020)
• Leer paper “The New Zealand financial cycle 1968–2017” (Davies y Gai, 2018).
• Calculamos el Ciclo Financiero con filtro Christiano-Fitzgerald

8 Densidad Espectral 9
IC (95%) l Smoothed Spectrum of ICF

3.2

2.8

2.4

2.0

1.6 Introducimos los


El aplanamiento del espectro rangos de frecuencia
1.2
f = 0.010 / d= 100Q = 25Y en 0.25 sugiere que hay muy que queremos extraer
f = 0.020 / d= 50Q = 13Y
pocos ciclos de un año de
0.8 f = 0.030 / d= 33.3Q = 8Y duración.
0.4

0.0
.05 .10 .15 .20 .25 .30 .35 .40 .45

• Ciclos con mayor frecuencia son 33Q, 50Q y 100Q


Aplicación en Eviews:
Estimación del Ciclo Financiero (1980-2020)
• Leer paper “The New Zealand financial cycle 1968–2017” (Davies y Gai, 2018).
• Calculamos el Ciclo Financiero con filtro Christiano-Fitzgerald

Ciclo Económico y Ciclo Financiero del Perú


1980-2020
.15 2.0 ¿Qué podemos concluir?
.10 1.5

.05 1.0
Ciclo económico

Ciclo Financiero
.00 0.5

-.05 0.0

-.10 -0.5

-.15 -1.0

-.20 -1.5

-.25 -2.0
1980 1985 1990 1995 2000 2005 2010 2015 2020

Ciclo económico Ciclo Financiero


Análisis Multivariado : Cross-Spectral Analysis
• Índice de Coherencia Cuadrada (magnitude-squared coherence): Es una medida de correlación de dos
series temporales en el dominio de la frecuencia. Toma valores entre 0 y 1.

Donde:
 𝑆𝑥𝑦 es la densidad espectral cruzada
 𝑆𝑥 y 𝑆𝑦 es la densidad espectral de las series x e y.
• Fase del espectro cruzado (phase of the cross spectrum): Muestran si una variable adelanta a otra o lo
contrario (rezago). Más específicamente, la estadística de fase muestra el retraso o adelanto de una variable
frente a la otra en fracciones de π. Toma valores entre -1 y 1.
Análisis Multivariado : Cross-Spectral Analysis
• Ejemplo (Matlab)
Series Crecimiento PBI (Var.% anualizada) y Crecimiento importaciones (Var.% anualizada)

 Correlación alta en frecuencias 0.15 radianes,  Fase >0: adelanto (lead)


equivalente a ciclos de 6.7 trimestres.  Fase <0: retraso (lag)
 Serie de importaciones está adelantada al crecimiento en 2.5 Trimestres
(1/0.4)
Prueba de causalidad Breitung y Candelon (2006)
Sea el vector 𝑍𝑡 = [𝑋1𝑡 , 𝑋2𝑡 ] un vector bidimensional de las series observadas para 𝑡 = 1,2, . . , 𝑇, que
representa el ciclo total de estas dos variables. Así, la representación del modelo VAR puede ser expresado
como:

La representación de media móvil del sistema anterior es la siguiente:

Donde Φ L = Θ−1 (𝐿) y Ψ L = Φ(𝐿)G−1 . G es la matriz triangular inferior de la descomposición de Cholesky. Usando
esta representación, la densidad espectral de 𝑋1𝑡 , por ejemplo, puede ser expresado como:
Prueba de causalidad Breitung y Candelon (2006)
• Esta representación separa las contribuciones de 𝑋1𝑡 , (es decir, Ψ11 ) y 𝑋2𝑡 (es decir, Ψ12 ) al espectro de 𝑋1𝑡
y, por lo tanto, permite probar la causalidad en el sentido de Granger en cualquier frecuencia 𝜔. La
hipótesis nula, en este ejemplo, es que 𝑋2𝑡 no causa a lo Granger a 𝑋1𝑡 , lo que significa que Ψ12 (𝑒 −𝑖𝜔 )= 0 e
implica que ningún valor rezagado de 𝑋1𝑡 influye en 𝑋2𝑡 .

• La medida de causalidad utilizada en el dominio de frecuencia es:

2
𝑀𝑋2→𝑋1 𝜔 = 0 si Ψ12 (𝑒 −𝑖𝜔 ) = 0, es decir 𝑋2 no causa en el sentido de Granger 𝑋1 .
Aplicación en Eviews
• Relación de causalidad entre el ciclo financiero (CF) y el ciclo económico (CE) en el Perú.

• Los resultados del test permiten comprobar que existe una relación de causalidad del ciclo financiero, al
ciclo económico , con un nivel de significancia de 1%. Sin embargo, no hay evidencia de que el CE cause al
CF.
Prueba de causalidad entre el CF y el CE
Econometría Bayesiana
Profesor: Mg. Ricardo Ramos Rojas

XIII PEEA - 2022

FIEECS - Universidad Nacional de Ingeniería (UNI)


Introducción
• “En la segunda mitad del siglo XV III fue publicado el teorema de Bayes (1764), así llamado por el nombre del monje
que lo desarrolló, en respuesta a los postulados de la inferencia Gaussiana. El estudio clásico de las distribuciones de
probabilidad o estadística Gausiana supone funciones de densidad simétricas y bien definidas, así como la ausencia
de cualquier conocimiento previo por parte del investigador. Bayes, en la justificación de su teoría argumenta que los
datos no necesariamente provenían de tales funciones de densidad, sino que probablemente eran generados por
leyes probabilísticas sujetas a formas asimétricas y sesgadas”.

• La teoría bayesiana plantea la solución a un problema estadístico desde el punto de vista subjetivo de la probabilidad.

• La probabilidad que un estadístico asigna a uno de los posibles resultados de un proceso, representa su propio juicio sobre la
verosimilitud de que se tenga el resultado.

• La información que el estadístico tiene sobre la verosimilitud de los distintos eventos relevantes al problema de decisión, debe ser
cuantificada a través de una medida de probabilidad Θ.
Introducción
• En estadística existen dos conceptos de probabilidad:

 Probabilidad frecuentista
 Probabilidad subjetiva

• Probabilidad frecuentista: Los frecuentistas restringen la asignación de probabilidades a enunciados que describen el resultado de
un experimento que se puede repetir.

Evento A = Una moneda lanzada tres veces saldrá cara dos o tres veces.

• Probabilidad subjetiva:
 Aquellos que adoptan el punto de vista subjetivo de la probabilidad creen que la teoría de la probabilidad es aplicable a cualquier situación en
la que haya incertidumbre.

 No sólo los resultados de experimentos repetidos entran en esa categoría, sino también aquellos que no son el resultado de experimentos
repetidos (por ejemplo, predicción del clima el día de mañana).

 Llamar a las probabilidades "subjetivas" no implica que puedan establecerse arbitrariamente.


Introducción
• Recordemos que las probabilidades cumplen las siguientes propiedades:

 0 ≤ Pr 𝐴 ≤ 1
 Pr 𝐴 = 1 𝑠𝑖 𝐴 𝑢𝑛𝑎 𝑙ó𝑔𝑖𝑐𝑎 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎.
 Si A y B describen eventos disjuntos (eventos que no pueden ocurrir al mismo tiempo), entonces Pr 𝐴 U 𝐵 = Pr 𝐴 + Pr(𝐵)
Pr(𝐴∩𝐵)
 La probabilidad condicional: Pr 𝐴ȁ 𝐵 =
Pr(𝐵)
 La unión de A y B es el evento que ocurra A o B; se denota como 𝐴 ∪ 𝐵
 La intersección de A y B es el evento que ocurra A y B; se denota como 𝐴 ∩ 𝐵

• También recordemos la función de verosimilitud (L):

Bajo el supuesto de i.i.d: Depende:


o Muestra (realizaciones)
o Conjetura sobre θ
Distribuciones prior y posterior
• Enfoque frecuentista:

 Desde el punto de vista frecuentista, la teoría de la probabilidad puede decirnos algo sobre la distribución de los datos para un θ dado.
𝑌~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝜃)

 El parámetro θ es un número desconocido entre cero y uno.

 No se le da una distribución de probabilidad propia, porque no se considera el resultado de un experimento repetido.

En un enfoque frecuentista, los parámetros θ se consideran términos constantes y el objetivo es


estudiar la distribución de los datos dados θ, a través de la verosimilitud de la muestra.

• Enfoque bayesiano:

 Desde el punto de vista subjetivo, 𝜃 también es un valor desconocido.

 Dado que hay incertidumbre acerca de su valor se considera como una variable aleatoria y se asigna una probabilidad.

 Antes de revisar la data, se asume una distribución prior. 𝜋(𝜃)


Distribuciones prior y posterior
• Ejemplo:

 Observamos la variable Y discreta con valor 0 ó 1:


𝑌~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖 𝜃
 El parámetro 𝜃 puede ser considerado como una variable aleatoria sobre el rango [0,1].

 Podemos postular la siguiente distribución a priori de 𝜃: 𝜃~𝑈[¨0,1]

Nota: Un prior no informativo es un prior flat (plano). Por ejemplo 𝜃: 𝜃~𝑈[¨0,1]

 En la mayoría de casos, la distribución prior también depende de parámetros: 𝜋(𝜃, 𝜸)


Nota: Los parámetros de la distribución previa,
llamados hiperparámetros, son proporcionados por el
investigador.

1 (𝜃−𝜇)2
Por ejemplo, prior de 𝜃 sigue una distribución normal: 𝜋 𝜃, 𝜸 = exp(− ), vector de hiperparámetros 𝛾 = (𝑢, 𝜎 2 ).
𝜎 2𝜋 2𝜎2
Distribuciones prior y posterior
• Distribución Beta (prior):

Con vector de hiperparámetros 𝛾 = (𝛼, 𝛽). Esta distribución tiene características importantes:

Dependiendo de la elección de α y β, este a priori puede capturar


creencias que indican que θ está centrado en 1/2, o puede estar inclinado
hacia cero o uno;

Puede estar muy concentrado o esparcido;

Cuando ambos parámetros son menores que uno, puede tener dos
modas.
Distribuciones prior y posterior
• Distribución posterior:
La inferencia bayesiana se centra en la distribución posterior 𝜋 𝜃 ȁ𝑦 , que es la distribución condicional de la variable aleatoria θ
dados los datos (realización de la muestra) 𝑦 = 𝑦1 , 𝑦2 , … 𝑦𝑛 .

La función de densidad posterior 𝜋 𝜃 ȁ𝑦 se calcula mediante el teorema de Bayes:

Los datos (𝑦1 , 𝑦2 , … , 𝑦𝑛 ) son considerados como constantes cuyas distribuciones (marginales) no involucran los parámetros de
interés θ:
𝑓𝑌1,…,𝑌𝑛 𝑦1 , 𝑦2 , … , 𝑦𝑛 = constantes
Como consecuencia del teorema de Bayes:
Pr 𝑑𝑎𝑡𝑎ȁ 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 ∗ Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠ȁ 𝑑𝑎𝑡𝑎 ∝ Pr 𝑑𝑎𝑡𝑎ȁ 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 ∗ Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠
Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠ȁ 𝑑𝑎𝑡𝑎 =
Pr 𝑑𝑎𝑡𝑎
Posterior Verosimilitud Prior
Distribuciones prior y posterior
• Ejemplo:
 Observamos la variable Y discreta con valor 0 ó 1:

𝑌~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖 𝜃

𝑓𝑌 𝑦𝑖 , 𝜃 = Pr 𝑌𝑖 = 𝑦𝑖 = 𝜃 𝑦𝑖 (1 − 𝜃)1−𝑦𝑖

𝐿𝑛 𝜃, 𝑦1 , … , 𝑦𝑛 = 𝜃 σ 𝑦𝑖 (1 − 𝜃)𝑛−σ 𝑦𝑖

 Asumimos que la distribución prior para 𝜽 es una distribución beta:

Γ(𝑎 + 𝑏) 𝑎−1
𝜋 𝜃, 𝛾 = 𝜃 (1 − 𝜃)𝑏−1 , 𝑎, 𝑏 > 0 , 𝜃𝜖 [0,1]
Γ(𝑎)Γ(𝑏)
 La distribución posterior es:
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝐿𝑛 𝜃, 𝑦1 , … , 𝑦𝑛 ∗ 𝜋 𝜃, 𝛾
Distribuciones prior y posterior
• Ejemplo:
 La distribución posterior es:
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝐿𝑛 𝜃, 𝑦1 , … , 𝑦𝑛 ∗ 𝜋 𝜃, 𝛾

Γ(𝑎 + 𝑏) 𝑎−1
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝜃 (1 − 𝜃)𝑏−1 𝜃 σ 𝑦𝑖 (1 − 𝜃)𝑛−σ 𝑦𝑖
Γ(𝑎)Γ(𝑏)

Γ(𝑎 + 𝑏) (𝑎+σ 𝑦 )−1


𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝜃 𝑖 (1 − 𝜃)(𝑏+𝑛−σ 𝑦𝑖 )−1
Γ(𝑎)Γ(𝑏)

𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝜃 (𝑎+σ 𝑦𝑖 )−1 (1 − 𝜃)(𝑏+𝑛−σ 𝑦𝑖 )−1

 La distribución posterior tiene la forma de una distribución beta con parámetros:

𝑎1 = (𝑎 + ෍ 𝑦𝑖 ) − 1 𝑏1 = 𝑏 + 𝑛 − ෍ 𝑦𝑖
 Este es un ejemplo de un conjugado a priori, donde la distribución posterior pertenece a la misma familia
que la distribución anterior.
Distribuciones prior y posterior
• Ejemplo:
 Una solución sería:

Γ(𝑎1 + 𝑏1 ) 𝑎 −1
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 = 𝜃 1 (1 − 𝜃)𝑏1 −1
Γ(𝑎1 )Γ(𝑏1 )

 Usando las propiedades de la distribución beta:


𝑎1
𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = 𝑎
1 +𝑏1

𝑎+σ 𝑦𝑖
𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = 𝑎+𝑏+𝑛

𝑎+𝑏 𝑎 𝑛
𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = + 𝑦ത
𝑎+𝑏+𝑛 𝑎+𝑏 𝑎+𝑏+𝑛

Prior Estimador media


(datos)
Si 𝑛 → ∞ 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 lim 𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = 𝑦ത
𝑛→∞
𝑎
Si 𝑛 → 0 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 lim 𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = 𝑎+𝑏
𝑛→∞
Regresión Lineal Bayesiana
• También podemos apuntar a estimar los parámetros de un modelo (con variables dependientes y explicativas) de manera que:

donde 𝜃 denota el vector o los parámetros, 𝑋 un conjunto de variables explicativas, 𝜀 un término de error y 𝑔(. ) la función de enlace.
• En este caso, generalmente consideramos la distribución condicional de 𝑌 dado 𝑋, que es equivalente a la distribución
incondicional del término de error 𝜀:

𝑛
• La función de verosimilitud (condicional) de una muestra i.i.d 𝑋𝑖 , 𝑌𝑖 𝑖=1 se define como:

Donde 𝑓𝑌ȁ𝑋 (𝑦𝑖 ȁ𝑥𝑖 , 𝜃) denota la distribución condicional de 𝑌𝑖 dado 𝑋𝑖 .

• Consideremos el caso de la regresión lineal: 𝑦𝑖 = 𝑋𝑖 𝛽 + 𝜀𝑖


 La distribución condicional de 𝑌𝑖 dado 𝑋𝑖 = 𝑥𝑖 : 𝑌𝑖 ȁ𝑥𝑖 ~𝑁(𝑥𝑖 𝛽, 𝜎 2 )
1 (𝑦 −𝑥 𝛽)2
 La función de verosimilitud: 𝐿𝑛 (𝜃; 𝑦ȁ𝑥) = ς𝑛𝑖=1 exp(− 𝑖 𝑖2 )
𝜎 2𝜋 2𝜎
𝑛 𝑛 1
 La función log-verosimilitud 𝑙𝑛 𝜃; 𝑦ȁ𝑥 = − ln 𝜎 2 − ln 2𝜋 − 2 σ𝑛𝑖=1(𝑦𝑖 − 𝑥𝑖 𝛽)2
2 2 2𝜎
Regresión Lineal Bayesiana
• La distribución posterior es la distribución condicional de 𝜃 dado 𝑦 definida como:

𝐿𝑛 𝜃; 𝑦ȁ𝑥 ∗ 𝜋 𝜃
𝜋 𝜃 ȁ𝑦, 𝑥 =
𝑓𝑌ȁ𝑋 (𝑦ȁ𝑥)
Donde 𝐿𝑛 𝜃; 𝑦ȁ𝑥 es la verosimilitud de la muestra y
𝑓𝑌ȁ𝑋 𝑦ȁ𝑥 = න 𝐿𝑛 𝜃; 𝑦ȁ𝑥 ∗ 𝜋 𝜃 𝑑(𝜃)
Θ

• El output de la estimación bayesiana es la distribución posterior 𝜋 𝜃 ȁ𝑦 :

 En algún caso particular, la distribución posterior es una distribución estándar (Beta, normal, etc.) y su función de
probabilidad tiene forma analítica.
 En otro caso, la distribución posterior se obtiene a partir de simulaciones numéricas.

• Cualquiera que sea el caso (analítico o numérico), el resultado del procedimiento de estimación bayesiano puede ser:
 Gráfico de la densidad posterior 𝜋 𝜃 ȁ𝑦 para todos los valores de 𝜃 𝜖 Θ
 Algunos momentos (media, varianza, etc.) o cuantiles de la distribución.
Regresión Lineal Bayesiana
• Pero también nos puede interesar estimar un parámetro del modelo. El enfoque bayesiano de este problema utiliza la idea de una
función de pérdida:
෡ 𝜽)
𝑳(𝜽,
෡ es el estimador bayesiano.
Donde 𝜽
• Ejemplos de funciones de pérdida:
෡ 𝜽 = 𝜽
 Función de pérdida absoluta 𝑳 𝜽, ෡−𝜽
2
෡ 𝜽 = 𝜽
 Función de pérdida cuadrática 𝑳 𝜽, ෡−𝜽
• Estimador bayesiano:
El estimador bayesiano de θ es el valor de θ෠ que minimiza el valor esperado de la
función de pérdida, donde la expectativa es tomada sobre la distribución
posterior de θ, esto implica que θ෠ es elegido para minimizar:

෠𝜃
𝐸 𝐿 𝜃, ෠ 𝜃 𝜋 𝜃 ȁ𝑦 𝑑(𝜃)
= න 𝐿 𝜃,
Regresión Lineal Bayesiana
• Ejemplo: Regresión entre las Importaciones (Var.%12M) y PBI (Var.%12M).

Regresión Lineal: Regresión Bayesiana:


Nota: La rutina MCMC produce un
conjunto de extracciones que
representan una muestra aleatoria de
la distribución posterior de los
parámetros.
Regresión Lineal Bayesiana
• Ejemplo: Regresión entre las Importaciones (Var.%12M) y PBI (Var.%12M).

• El resultado de la regresión bayesiana es muy similar al de la regresión por mínimos cuadrados y los coeficientes estimados son
casi exactamente los mismos, pero existen algunas diferencias conceptuales en la interpretación.

 La salida bayesiana habla directamente de cuáles son las partes posteriores de los parámetros y no se refiere a las pruebas de
hipótesis. (¡Sin valores t, valores p o significancia!).

 La salida bayesiana muestra cuantiles del posterior exacto para cada parámetro (que puede ser asimétrico).

 La salida informa el valor del parámetro sigma2.


VAR Bayesiano (BVAR)
• Consideremos un modelo básico VAR(p) con T observaciones y un máximo de rezago de p.

dónde
𝜀𝑡 = (𝜀𝑡1 , … . 𝜀𝑛𝑡 )′ es un término de error con E(𝜀𝑡 ) = 0 e invariante en el tiempo (es decir, constante).
La matriz de varianza-covarianza definida positiva cov (𝜀𝑡 ) = E(𝜀𝑡 𝜀𝑡 ’) = Σ(ruido blanco).
c es un vector (n × 1) vector de interceptos.
𝐵𝑡 es una matriz (n × n) de coeficientes de regresión para el j-rezago (j = 1, ..., p).

• Los modelos VAR con muchas variables y rezagos contienen muchos parámetros. El número de coeficientes en el modelo VAR
básico sin restricciones (forma reducida) se multiplican fácilmente. Esto significa lo siguiente:
 Hay muchos coeficientes para estimar.
 En un conjunto de pocos datos, los valores de los coeficientes a menudo no están muy bien determinados (imprecisos).
 Si el 𝐵1 , ..., 𝐵𝑃 se estiman de manera imprecisa debido a los datos limitados, las funciones de respuesta al impulso, los
pronósticos y las descomposiciones de la varianza del error de pronóstico que son basado en ellos también se estimarán de
manera imprecisa.
• Por lo tanto, se han desarrollado métodos alternativos para estimar los coeficientes, el más destacado es la estimación bayesiana.
VAR Bayesiano (BVAR)
• El análisis de modelos VAR utilizando métodos bayesianos requiere el conocimiento de las propiedades distributivas de las
estimaciones de los parámetros.
• Denotamos la distribución prior de los parámetros de interés por p(θ) y la distribución posterior correspondiente por p(θ|Y).
• El vector de parámetros β y la matriz de Var-Cov de los residuos: Σ
• Usando el teorema de Bayes, la distribución posterior se resume como el producto de la verosimilutd L(Y|θ) y el prior p(θ):

• El VAR(p) puede escribirse de la siguiente forma:

Distribución Normal

Distribución Wishart
Aplicación BVAR
Series de tiempo a utilizar:

 Inflación
 Tasa de desempleo
 Tasa de interés de los bonos a 10 años (Perú)
Aplicación BVAR
VAR (4) sin restricciones

 Como puede ver en la Tabla, incluso estimar un VAR pequeño de tres variables y
4 rezagos genera una gran cantidad de resultados.

 Cada columna de la tabla corresponde a la ecuación de una variable endógena


en el VAR.

 Para cada variable del lado derecho, EViews informa la estimación puntual del
coeficiente, el error estándar del coeficiente estimado (entre paréntesis) y el t-
estadística (entre corchetes).
Aplicación BVAR
Prio no informativo, difuso o flat
• Podemos comparar el modelo anterior con la opción de EViews de imponer un prior difuso (o flat).

• El prior toma la siguiente forma:

donde n es el número de variables en el VAR. Usando el teorema de Bayes, podemos derivar la distribución posterior:

donde
Aplicación BVAR
Prio no informativo, difuso o flat
• Descargar Add-ins: BVAR
 Betas similares que en el caso VAR sin
restricciones.

 Sin embargo errores estándar más grandes.

 Un a prior difuso significa que no sabemos "nada",


es decir, estamos incorporando una enorme
cantidad de incertidumbre..

 MCO promediamos solo los errores de predicción,


mientras que BVAR con prior difuso promediamos
los errores de predicción más la incertidumbre
adicional que proviene de admitir que no sabemos
nada sobre las estimaciones de los parámetros.
Aplicación BVAR
Prior Minnesota de Koop y Korobilis (Ko-Ko)1/
• Descargar Add-ins: BVAR

• La simplicidad del prior Minnesota proviene del hecho de que se asume que Σ es conocido (y reemplazado por su
estimación 𝜮෡ ) lo que significa que no se requiere una distribución previa para Σ.

• El prior Minnesota simplifica aún más asumiendo que Σ es una matriz diagonal.

• Cuando Σ se reemplaza por una estimación, solo nos preocupamos por un prior para β y la distribución prior para β
bajo el prior Minnesota está dado por:

• La configuración predeterminada es β𝟎 = 𝟎(𝐦𝐩𝐱𝟏) y 𝐕𝟎 ≠ 0. En resumen, el prior Minnesota implica poner a cero la


mayoría o todos sus elementos. Disminuye el riesgo de sobreajuste.

• Σ es una matriz diagonal con elementos 𝑠𝑖2 obtenidos de regresiones univariadas de cada variable dependiente
sobre una intersección y el número rezagos elegidos de todas las variables.
1/ Koop, G and Korobilis, D (2009), Bayesian multivariate time series methods for empirical macroeconomics.
Aplicación BVAR
Prior Minnesota de Koop y Korobilis (Ko-Ko)1/
• Koop y Korobilis (2009) especificaron su propia matriz prior de covarianzas 𝐕𝟎 como una matriz diagonal con
elementos 𝑣𝑖𝑗,𝑙 (𝑙 = 1, … , p):
𝑎1
para coeficientes sobre sus propios rezagos
𝑝2
l𝑣𝑖𝑗,𝑙 = (𝑎2 𝜎𝑖) para coeficientes de rezagos 𝐢 ≠ 𝒋
𝑝2 𝜎𝑗
𝑎3 𝜎𝑖 para coeficientes de variables exógenas

donde 𝜎𝑖2 es el elemento diagonal 𝑖-ésimo de Σ

• Si se establece que 𝑎1 > 𝑎2 , es más probable que los retrasos propios sean predictores importantes que los retrasos
de otras variables.

• Una ventaja del prior Minnesota es que conduce a una inferencia posterior simple que involucra sólo la distribución
Normal. La distribución posterior resultante para β tiene la forma:
Nota: Desventaja no incorpora
MCO
incertidumbre sobre la matriz Σ
Aplicación BVAR
Prior Minnesota Koop y Korobilis (Ko-Ko)
• Descargar Add-ins: BVAR
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• El prior Normal-Wishart es un ejemplo de prior conjugado natural.

• Estos son priors donde la distribución prior, verosimilitud y posterior provienen de la misma familia de distribuciones.

• Kadiyala y Karlsson (1997) pudieron demostrar que la verosimilitud L(Y|β, Σ) del modelo VAR se puede descomponer en
dos partes. Uno es una distribución para β dado Σ y otro es una distribución para Σ−1 . Se supone que el primero es
Normal, mientras que el segundo es una distribución Wishart.

• Si se relaja el supuesto que la matriz de varianza-covarianza es fija y diagonal, la distribución prior conjunta es la
distribución Normal-Wishart:

donde 𝛽0 y 𝑉0 en la distribución prior para 𝛽 dado Σ se especifican como:

y cada elemento (diagonal) de 𝑉0 se calcula como:

donde 𝜎𝑖 2 es el elemento diagonal 𝑖-ésimo de Σ para el l-ésimo rezago de la variable i en la ecuación j y λ1, λ2 y λ3 son tres
hiperparámetros establecidos por el investigador.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• La distribución posterior de 𝛽 y Σ son:
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Definición de parámetros:

Hiperparámetro Propósito
λ0 Severidad del priori en la matriz de covarianza. Los valores más pequeños significan un prior más severo.
λ1 Desviación estándar o severidad del priori sobre el coeficiente AR (1). Los valores más pequeños significan un
previo más severo.
λ2 =1 supuesto bajo Sims y Zha.
λ3 Controla qué tan rápido llegan a cero los retrasos más altos. Los valores más altos significan que los retrasos
decaen más rápido.
λ4 Desviación estándar o rigidez de la constante a priori. Los valores más pequeños significan un previo más
estricto.
λ5 Severidad de a priori sobre variables exógenas. Los valores más pequeños significan un previo más severo.
μ5 Los valores más altos implican que los coeficientes de los propios rezagos suman uno.
μ6 Los valores más altos implican que hay menos de N tendencias estocásticas en el VAR.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Los dos hiperparámetros adicionales 𝑢5 y 𝑢6 permiten lidiar con cualquier variable no estacionaria o cointegración en las
variables que aparecen en el VAR.

• Un modelo VAR en primeras diferencias (tasas de crecimiento) no necesita de cointegración / raíz unitaria antes de la
construcción porque es estacionario.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ0 = 1

λ1 = 1

λ3 = 1
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ0 = 0.1

o Si λ0  0, los prior
se impone y los
datos no influyen
en las
estimaciones.

o Si λ0  1, los prior
pierden influencia
en la estimación y
la estimación se
aproxima a MCO.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ1 = 0.1

Coeficientes AR(1) más


cercanos a la unidad.
Paseo aleatorio.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ3 = 0.1

Coeficientes de rezagos
más altos no caen tan
rápido a cero.
Aplicación BVAR
Prior Normal-Flat de Sims y Zha (1998)
• El prior Normal-Flat de Sims y Zha (1998) asume la independencia entre B y Σ, donde:

• Debido a que B y Σ ahora son independientes, Σ ya no se considera en la distribución prior para B, el cual está escrito
simplemente como p(B) en lugar de p(B | Σ). Las distribuciones posteriores son:
Aplicación BVAR
Prior Normal-Flat de Sims y Zha (1998)
• Descargar Add-ins: BVAR
Las estimaciones de
betas se mantienen sin
cambios, mientras que
los errores estándar
han cambiado (son
marginalmente más
pequeños que en el
caso Normal-Wishart.)
Forecast - Aplicación BVAR
• La otra herramienta adicional es la capacidad de pronosticar con el modelo BVAR estimado.
• En muchas situaciones de pronóstico, el horizonte de pronóstico, h, es más largo que la frecuencia utilizada para recopilar datos y
estimar el modelo de predicción.
• Enfoques para el pronóstico: iterado.
 Consideremos un modelo AR(1)

El pronóstico de un paso adelante se genera como:

mientras que los pronósticos para horizontes de h-pasos hacia adelante se obtienen como:

 Los pronósticos iterados son eficientes si el modelo de un periodo hacia adelante se especifica correctamente.
Forecast - Aplicación BVAR
Ecuación: Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
1 3

2 Simulation type:
 Solución determinística: Todas las
ecuaciones del modelo se resuelven sin
considerar los términos de error.
Dynamics:
 Solución dinámica: solo se utilizan los valores
de las variables endógenas que preceden a la
4 Pronósticos en
muestra de la solución al formar el pronóstico. escenario base
Es recomendable cuando se proyecta varios
periodos hacia adelante.

 Solución Estática: se utilizan los valores de las


variables endógenas hasta el período anterior
cada vez que se resuelve el modelo.
Ecuaciones Simultáneas
Profesor: Mg. Ricardo Ramos Rojas

XIII PEEA - 2022

FIEECS - Universidad Nacional de Ingeniería (UNI)


Introducción
• Los modelos uniecuacionales reflejan relaciones de dependencia o causalidad unidireccionales, pero no permiten representar
adecuadamente la relación de interdependencia o interrelación entre las variables consideradas en el análisis.
• Estas relaciones unidireccionales son raras en la economía debido a que las variables económicas están interrelacionadas.
• Por ejemplo, los precios y cantidades se determinan simultáneamente y conjuntamente en los mercados. De la misma manera
con la renta y el nivel de precios se determinan en la interacción de la oferta y demanda agregada.
Forma estructural y forma reducida
• Se tiene m variables interdependiente o endógenas:
• Se tiene k variables independientes exógenas
• Para cada variable endógena tiene una ecuación regresión lineal.
De esta manera, forma un sistema de ecuaciones simultaneas puede escribirse como:

donde los coeficientes de la regresión son:

• En su forma matricial, la ecuación anterior toma la siguiente forma estructural:


Forma estructural:
Forma estructural y forma reducida
• Resolviendo las m variables endógenas, podemos expresar cada variable endógena únicamente en términos de variables exógenas:

Forma reducida:

• Entonces, se tiene las siguientes propiedades:


El problema de identificación
• Los parámetros de la forma reducida están identificados.
• Un parámetro de la forma estructural está identificado si su valor puede deducirse de los parámetros de la forma reducida.
• Si no se imponen restricciones sobre la estructura (A, B, Σ), ninguno de los parámetros estructurales está identificado.
• Si el problema de identificación surge porque todas las ecuaciones estructurales incluyen las mismas variables, entonces una forma de
resolver el problema es omitir algunas variables en la forma estructural de ecuaciones simultáneas fijando algunos de los parámetros
estructurales 𝛼𝑗𝑖 y 𝛽𝑗𝑖 en cero. Este tipo de restricciones se denominan restricciones de exclusión.
Métodos de estimación
1. Estimación individual de cada ecuación:
Problema de endogeneidad:
 Podemos escribir la ecuación de forma estructural de la siguiente forma:

donde:
𝑦𝑗 : Variable endógena j
𝑌𝑗 : submatriz luego de eliminar la j-ésima fila de Y
𝑋: matriz de variables explicativas
𝟏
 Se demuestra que: 𝐩𝐥𝐢𝐦 𝐘𝐣 𝛜𝐣 = 𝐀−𝟏
𝐣 𝛔𝐣 ≠ 𝟎
𝐓

donde: 𝐴𝑗−1 es la submatriz luego de eliminar la j-ésima fila de 𝑨−𝟏 𝑬 y 𝝈𝒋 es la j-ésima columna de Σ.
Estimación MCO
 No tiene las propiedades deseables en el contexto económico.
 Estimadores inconsistentes
Métodos de estimación
2. Mínimos Cuadrados en dos etapas (MC2E)
• Recordemos la otra forma de escribir la forma estructura: … (1)

• En la primera etapa, se realiza la regresión de las variables endógenas explicativas 𝒀 ෡ 𝒋 sobre todas las variables exógenas del modelo X,
y se obtiene la matriz (m − 1 × T) de valores ajustados 𝒀෡ 𝒋 = 𝒀𝒋 X’ (XX’)−𝟏 X y la matriz de residuos 𝑽
෡ 𝒋 = 𝒀𝒋 −𝒀
෡𝒋.

• En la segunda etapa, se estima la siguiente ecuación mediante MCO para obtener 𝛽෠𝑀𝐶2𝐸 = (𝛿, 𝛾)

෡ 𝑗 𝛾ො𝑗
Esta regresión se obtiene sustituyendo la identidad 𝑌𝑗 = 𝑌෠𝑗 + 𝑉෠𝑗 en (1) siendo 𝑒𝑗 = 𝜖𝑗 +𝑉′
• Los estimadores de MC2E son consistentes.
Métodos de estimación
3. Mínimos Cuadrados en tres etapas (MC3E)
• Es una técnica apropiada el término de error es heteroscedástico y autocorrelacionado.
• Consiste en dos etapas de aplicación de mínimos cuadrados ordinarios y otra de mínimos cuadrados generalizados (MCG).
• Etapas del modelo son las siguientes:

Etapa 1 Etapa 2 Etapa 3


 Se aplica MCO a cada una de las  Se sustituyen los valores calculados de  Estimar nuevamente
ecuaciones de la forma reducida y se las variables endógenas en el lado
obtiene estimadores de las variables derecho de las ecuaciones estructurales utilizando MCG.
endógenas. y se aplica MCO a las ecuaciones
transformadas. ෠ 𝑋 y 𝛽መ = (𝛿, 𝛾) entonces
Sea 𝑋෨ = 𝑌,

 Estimar la matriz de varianzas y 𝛽መ𝑀𝐶𝐺 = (𝑋′Σ


෨ −1 𝑋)
෨ −1 𝑋෨ ′ Σ−1 𝑦
covarianzas de los términos de error.
Métodos de estimación
4. Full Information Maximum Likelihood (FIML)
• Si la estructura de error se distribuye normalmente, MC3E es asintóticamente equivalente a FIML.
Ecuación Forma Estructural: 𝐴𝑌 + 𝐵𝑋 = 𝐸 También puede ser:
Ecuación Forma Reducida: 𝑌 = Π𝑋 + 𝑈

 Partiendo de la forma reducida se llega a la función de verosimilitud a maximizar es:


1 1 1
𝐿 𝐴, 𝐵, Σ, 𝑌, 𝑋 = − 𝑇𝑚 ln 2𝜋 − 𝑇 ln Σ + 𝑇 ln 𝐴 − 𝑡𝑟(Σ −1 𝐴𝑌 + 𝐵𝑋 ′
𝐴𝑌 + 𝐵𝑋 )
2 2 2
Donde:
m indica el número de ecuaciones simultáneas (relaciones estructurales),
T es la número de periodos de la muestra
𝜮 es la matriz de varianzas y covarianzas.

 El estimador FIML maximiza esta función de verosimilitud sujeto a todas las restricciones sobre A, B y 𝚺. Para encontrar el óptimo se
requiere, por lo general, utilizar métodos de optimización numérica.
Métodos de estimación
5. GMM (Generalized Method of Moments)
• GMM es un estimador robusto ya que no requiere información de la distribución exacta de las perturbaciones.
• La estimación de GMM se basa en el supuesto de que las perturbaciones en las ecuaciones no están correlacionadas con un conjunto
de variables instrumentales.
• El estimador GMM selecciona las estimaciones de los parámetros para que las correlaciones entre los instrumentos y las
perturbaciones sean lo más cercanas posible a cero posible
• Denotamos estas condiciones de momento como:

El estimador del método de momentos se define reemplazando la condición de momento por su análogo en muestras:

• Para obtener estimaciones de GMM, debe poder escribir las condiciones de momento en la ecuación como una condición de
ortogonalidad entre los residuos de una ecuación de regresión, y un conjunto de variables instrumentales:
Aplicación – Modelo macroeconómico
1. Definición de ecuaciones
𝑪𝒐𝒏𝒔𝒖𝒎𝒐𝒕 = 𝜷𝟏𝟎 + 𝜷𝟏𝟏 𝑷𝑩𝑰𝒕 + 𝒆𝟏𝒕

𝑷𝑩𝑰𝒕 = 𝜷𝟐𝟏 𝑪𝒐𝒏𝒔𝒖𝒎𝒐𝒕 + 𝜷𝟐𝟐 𝑰𝒏𝒗𝒆𝒓𝒔𝒊𝒐𝒏𝒕 + 𝒆𝟐𝒕

𝑰𝒏𝒇𝒍𝒂𝒄𝒊𝒐𝒏𝒕 = 𝜷𝟑𝟎 + 𝜷𝟑𝟏 𝑬𝒙𝒑𝑰𝒏𝒇𝒍𝒂𝒄𝒊ó𝒏 + 𝜷𝟑𝟐 𝑰𝒏𝒇𝒍𝒂𝒄𝒊𝒐𝒏𝒕−𝟏 + 𝒆𝟑𝒕

𝑻𝒂𝒔𝒂𝑰𝒏𝒕𝒆𝒓𝒆𝒔𝒕 = 𝜷𝟒𝟏 𝑻𝒂𝒔𝒂𝑰𝒏𝒕𝒆𝒓𝒆𝒔𝒕−𝟏 + 𝜷𝟒𝟐 𝑷𝑩𝑰𝒕 + 𝜷𝟒𝟑 𝑰𝒏𝒇𝒍𝒂𝒄𝒊𝒐𝒏𝒕 + 𝒆𝟒𝒕


Aplicación – Modelo macroeconómico
2. Gráfico de las series a utilizar
Aplicación – Modelo macroeconómico
3. Resultados del modelo (método de estimación GMM)

1 3 Test de sobreidentificación de instrumentos:

J*Obs < 𝝌𝟐𝒗,𝟏−𝜶 Instrumentos válidos

𝒗 = # parámetros - #instrumentos
𝜶 = nivel de significancia
2
Aplicación – Modelo macroeconómico
4. Solución al Sistema

a) Tipo de simulación:

 Determinista:
 Implica resolver el modelo sin simular los residuos.
 Todos los coeficientes estimados se utilizan en la simulación en
sus estimaciones puntuales,
 Todas las variables exógenas se mantienen constantes.

 Estocástico:
 Implica simular los residuos.
 Coeficientes varían aleatoriamente.
 Se genera una distribución de resultados para las variables
endógenas en cada período. Se escoge promedio como
estadístico resumen de la solución.

• Este es el período de simulación.


• Suele utilizar el periodo de estimación.
Aplicación – Modelo macroeconómico
4. Solución al Sistema

b) Dinámica (Dynamics)

 Solución dinámica:
 Utiliza la estimación anterior para seguir proyectando o realizar
estimaciones hacia atrás (histórico).
 Para proyectar fuera de muestra se debe conocer el valor de las
variables exógenas.

 Solución estática:
 Sólo utiliza datos observados para realizar la proyección o
realizar la estimaciones hacia atrás (histórico).
 Para proyectar fuera de muestra se debe conocer el valor de las
variables exógenas.

¿Cómo podemos proyectar los valores de las variables exógenas?


o Utilizar encuestas que proyecten las variables.
o Crear un modelo a parte para proyectar las variables
Aplicación – Modelo macroeconómico
5. Gráfico de variables endógenas en el Sistema

3
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
5
2

7
4
Aplicación – Modelo macroeconómico
6. Definición de Escenarios

9
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si las expectativas de la inflación se hubiesen anclado en 3%?

2
1
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si las inversión de la inflación se hubiesen anclado en 3%?

 Al término del 2020Q3:

 Dato real: 1.8%


 Dato Escenario 1: 3.9%
Aplicación – Modelo macroeconómico
6. Definición de Escenarios (crear otro escenario)

1 3

6
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si la inversión crecía 5%?
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si la inversión crecía 5%?

 Al término del 2020Q3:  Al término del 2020Q3:  Al término del 2020Q3:

 Dato real: -9.7%  Dato real: -9.4%  Dato real: 0.25%


 Dato Escenario 2: 4.5%  Dato Escenario 2: 4.2%  Dato Escenario 2: 2.3%
Aplicación – Modelo macroeconómico
7. Forecast del Modelo

1
3

2
Aplicación – Modelo macroeconómico
7. Forecast del Modelo
Aplicación – Modelo VAR - FIML
0. Formulación del problema 𝑔𝑎𝑝𝑡
Modelo en forma estructural: ... (1) 𝑦𝑡 = 𝑖𝑛𝑓𝑙𝑡
𝑡𝑎𝑠𝑎𝑟𝑒𝑓𝑡
Por problemas de identificación estimamos: ... (2)

Modelo en forma estructural: ... (3)

Comparar residuos FR vs FE: ... (4)

Imponer restricciones Modelo AB: ... (5)

Solución (ejemplo) Cholesky:


... (6)

... (7)

... (8) ... (9)


Aplicación – Modelo VAR - FIML
1. Definción de Series 2. Estimación del modelo VAR
Tasa de Referencia (tasaref) Inflación (infl)
4 .04

2 .02

0 .00

-2 -.02

-4 -.04
2004 2006 2008 2010 2012 2014 2016 2018 2004 2006 2008 2010 2012 2014 2016 2018

Brecha producto (gap)


.04

.02

.00

-.02

-.04

-.06
2004 2006 2008 2010 2012 2014 2016 2018

Nota: Todas las series son corregidas por su valor promedio

¿Por qué no son significativos?


Aplicación – Modelo VAR - FIML
3. Test de significancia de rezagos 4. ¿VAR(2) tiene propiedades adecuadas?
Hipótesis nula: Todas las variables en el rezago i NO son Normalidad Autocorrelación Estabilidad
signifcativas

VAR(2) estable. Raíces


Nota: Todas las series son corregidas por su valor promedio dentro del círculo
unitario.

¿Cómo mejorar el modelo? No hay problemas de autocorrelación


Aplicación – Modelo VAR - FIML
5. Identificación VAR (2) – Descomposición Cholesky

Colocar restricciones
Aplicación – Modelo VAR - FIML
0. Regresando a la formulación del problema

Modelo VAR(2) en forma reducida: ... (10)

Modelo VAR(2) en forma estructural: ... (11)

... (12)

Resultados:  gap no depende de ninguna variable contemporánea


 Infl depende contemporáneamente de la variable gap
 Tasaref depende contemporáneamente de la variable gap y infl
Aplicación – Modelo VAR - FIML
6. Funciones Impulso – Respuesta (SVAR)

Consideremos:
 Choque ecuación gap como choque de demanda
 Choque ecuación infl como choque de oferta
 Choque ecuación tasaref como choque de monetario
Aplicación – Modelo VAR - FIML
7. Significancia individual de los coeficientes

 Modelo VAR(2) puede estar sobreparametrizado. Se han utilizado 65 datos para estimar 18 coeficientes.

 Al nivel de significancia de 5%, solo 6 coeficientes de los 18 son no significativos (estadístico t-student en valor absoluto < 1.96).

 Técnicas para reducir la sobreparametrización:


 Modelo VAR con restricciones cero en los coeficientes  Subset VAR Model
 Convertir el objeto VAR en un objeto System para estimar sistema de ecuaciones desequilibradas.

 Para el VAR desequilibrado ya no se utilizará la técnica de estimación MCO dado que no se tienen los mismos regresores al lado
derecho de la ecuación. Ahora tendremos que usar el método de Máxima Verosimilitud con Información Completa (FIML).

 Vamos a imponer las siguientes restricciones:

• El 2do rezago de la inflación no afecta la brecha producto.


• Los rezagos de la tasa de interés no afectan la inflación.
Aplicación – Modelo VAR - FIML
7. Estimación con Máxima Verosimilitud

Respuesta de las variables ante un choque de la variable tasaref Respuesta de las variables ante un choque de la variable infl

Respuesta de las variables ante un choque de la variable gap


Aplicación – Modelo VAR - FIML
7. Estimación FIML con objeto System

 Crear objeto System en Eviews

 Introducir valores iniciales (se puede utilizar valores de la regresión lineal)

Parámetros

Sistema de ecuaciones

También podría gustarte