Documentos de Académico
Documentos de Profesional
Documentos de Cultura
• En lo que respecta a las series de precios y rentabilidades de activos financieros, una característica a destacar es que la asimetría en
la distribución de los rendimientos podría ser explicada si consideramos un modelo con diferentes estados o regímenes.
• Modelos de regímenes son procesos invariantes en el tiempo condicionados a una variable que identifica el régimen St, el cual
puede ser observable o no observable. Además, estos modelos admiten un número discreto de regímenes.
• Los modelos no lineales se clasifican según el proceso estocástico que genera cada régimen:
Modelos de Transición Determinística: Régimen observable.
Modelos autoregresivos de umbral: TAR, SETAR.
Modelos autoregresivos de transición suave: STAR (LSTAR, ESTAR).
Modelos de transición Estocástica: Régimen no observable. En este caso, nada puede asegurarse acerca de la ocurrencia de
un determinado régimen, y por lo tanto solo es posible la asignación de probabilidades a los distintos estados.
Modelos de Markov con probabilidades de transición constantes .
Modelos de Markov con probabilidades de transición variables.
Modelo TAR (Threshold Autorregressive)
• Este modelo usa modelos lineales a trozos para obtener una mejor aproximación de la media condicional.
• Los modelos TAR se asume que el régimen queda determinado por una variable observable qt. Para un modelo TAR con 2 estados
se fija un valor c el cual se conoce como valor umbral. Dependiendo de si qt ≤ c o qt > c, nos situaremos en uno u otro estado.
donde los 𝑒𝑡 son variables aleatorias independientes e idénticamente distribuidas con 𝐸 𝑒𝑡 = 0 y 𝑉 𝑒𝑡 = σ < ∞, y 𝐽𝑡 es un
indicador temporal que tomará valores en 1,2, . . 𝑘 . La idea básica de un modelo por umbrales es la descomposición del sistema
no lineal en 𝑘 sistemas lineales más sencillos, mediante el indicador temporal 𝐽𝑡 .
Modelo SETAR (Self-Exciting Threshold Autoregressive)
• Un modelo autorregresivo por umbrales auto-alimentado 𝑆𝐸𝑇𝐴𝑅 (𝑘; 𝑝1 , 𝑝2 , … 𝑝𝑘 ; 𝑑) con 𝑘 regímenes, siendo 𝑘 ≥ 2, se define
como:
donde Ω𝑖 es una partición del dominio −∞, ∞ de manera que ∪𝑘𝑖=1 Ω𝑖 = −∞, ∞ y Ω𝑖 ∩ Ω𝑗 = ∅, ∀𝑖 ≠ 𝑗 . Las particiones del
dominio están dictadas por el valor de la variable umbral 𝑌𝑡−𝑑 , donde 𝑑(𝑑 ∈ 𝑍 + ) es conocido como parámetro delay. En cada
(𝑖)
régimen, 𝑒𝑡 es una secuencia de variables aleatorias independientes e idénticamente distribuidas con media cero y desviación
finita σ(i). La función I(.) es una función indicadora, que toma valor 1 cuando se cumple la condición y 0 en otro caso.
• Su extensión directa será añadiendo el componente media móvil, con lo que un modelo 𝑆𝐸𝑇𝐴𝑅𝑀𝐴 (𝑘; 𝑝1 , … , 𝑝𝑘 ; 𝑞1 , … , 𝑞𝑘 ; 𝑑) se
define como
Estimación e identificación modelo SETAR
• Minimizar la suma de residuos al cuadrados:
• El estimador MCO:
• Contraste de linealidad:
Hipótesis nula (linealidad)
Ratio de Verosimilitud
Hipótesis alternativa (No Linealidad)
Tsay (1998)
Aplicación Eviews
- Dependiente
- Explicativas
No afectadas por
el umbral
SETAR: Rezagos
TAR: Variable y rezagos
Aplicación Eviews (tasa crecimiento PBI)
1. Modelo Univariado 2. Modelo con Umbral
Inflación Alta:𝝅𝒕−𝟏 ≥ 𝟒%
• Teräsvirta & Tjøstheim (2010) señalan que el modelo STAR tiene como supuesto que los cambios de regímenes son generados por
una variable de transición observable 𝑍𝑡 , ya sea endógena rezagada, exógena o ambas. Además de ello se define la función de
transferencia exponencial que determina el peso del régimen y que está, usualmente, limitada entre 0 y 1.
• ¿A qué tasa de crecimiento del PBI los bancos empiezan a volverse miopes e incrementar sus préstamos?. Boom
Crediticio.
• Esta metodología permite verificar la existencia de un cambio de régimen en el comportamiento de los créditos de
consumo, dependiendo del crecimiento del PBI experimentado en el último período de doce meses.
Ratio = 3
.1
11.6
.0
11.2 -.1
-.2
10.8
-.3
10.4 -.4
1980 1985 1990 1995 2000 2005 2010 2015 2020 1980 1985 1990 1995 2000 2005 2010 2015 2020
• Originalmente el documento analiza los periodos 1980q1 – 2008q4. Esta vez nos extenderemos hasta el 2021q1.
• Modelo logístico de 2do orden: Δ4 𝑦𝑡 = 𝜙1 ′𝑥𝑡 1 − 𝐹(𝑠𝑡 ; γ; 𝑐) + 𝜙2 ′𝑥𝑡 𝐹(𝑠𝑡 ; γ; 𝑐) + ε𝑡
𝑥𝑡 = (1, Δ4 𝑦𝑡−1 , Δ4 𝑦𝑡−2 , Δ4 𝑦𝑡−3 , Δ4 𝑦𝑡−4 )
1
𝐹 𝑠𝑡 , 𝛾, 𝑐 = 𝟐
(1 + 𝑒𝑥𝑝 −𝛾 ∗ Π𝑖=1 𝑠𝑡 − 𝒄𝒊 )
TF_1SERIES D4YT
• Regulares observaciones menores a 𝒄1 y pocas
• La función de transición muestra los periodos donde la economía peruana observaciones por encima de 𝒄2
presenta grandes tasas de crecimiento o decrecimiento. • La mayoría de las observaciones se encuentran
• Altas tasas de crecimiento: entre ambos umbrales.
o 1era mitad del gobierno de AG 1986Q4-1987Q2 (elevado gasto fiscal) • Con este modelo, cuando la economía peruana
o 2da mitad del gobierno de AF 1994Q2 – 1995Q2 estuvo en recesión no estuvo en este régimen
• Este modelo no identifica periodos recesivos (más de dos tasas de por mucho tiempo.
decrecimiento consecutivas)
Aplicación 2: Identificación Ciclos Económicos
• Paper: “Application of Three Non-Linear Econometric Approaches to Identify Business Cycles in Peru” (2010)
• Evaluación del modelo: Test LM
Donde:
𝑦𝑡 es un vector de variables observables de orden nx1
𝐻𝑡 es una matriz de orden nxm
𝑍𝑡 es una matriz de variables exógenas de orden nxk
𝛽𝑡 es un vector de variables de estado no observables de orden mx1
𝐴𝑡 es una matriz de parámetros kxn
𝜀𝑡 es el error de observación con media 𝐸 𝜀𝑡 = 0 y varianza
𝑣𝑎𝑟(𝜀𝑡 ) = 𝑅𝑡 donde 𝑅𝑡 es una matriz conocida nxn
Introducción
• El filtro de Kalman consta de dos conjunto de ecuaciones:
La segunda es la ecuación de estado (variables no observables):
Donde:
𝐹𝑡 es una matriz mxm
𝑢𝑡 es un vector mx1
𝑆𝑡 es una matriz mxg
𝑣𝑡 es un vector de perturbaciones no correlacionadas con media
𝐸 𝑣𝑡 = 0 y varianza 𝑣𝑎𝑟(𝑣𝑡 ) = 𝑄𝑡 donde 𝑄𝑡 es una matriz conocida
gxg
Evita la influencia de posibles cambios estructurales en la estimación (*): el filtro de Kalman utiliza toda la historia de la serie
pero con la ventaja de que intenta estimar una trayectoria estocástica de los coeficientes en lugar de una determinística, con lo
cual soluciona el posible sesgo de la estimación ante la presencia de cambios estructurales. Puede generar errores estándar
más grandes.
• Entre las desventajas del filtro se menciona que requiere condiciones iniciales de la media y varianza del vector estado para iniciar el
algoritmo recursivo.
donde:
𝜏𝑡 un componente no observado que cambia lentamente (tendencia);
𝑐𝑡 un componente no observado que se repite periódicamente (ciclo);
𝛾𝑡 un componente no observado periódico, (estacional);
𝑣𝑡 un componente autorregresivo no observado; y
𝜀𝑡 un componente irregular no observado (perturbación)
El componente 𝜏𝑡 es la variable de estado que representa el valor fundamental (señal) del logaritmo del PIB real, mientras que la
ecuación de transición muestra que los valores de 𝜏𝑡 , y por lo tanto 𝑦𝑡 , evolucionan de acuerdo con un paseo aleatorio. Aquí, 𝜏𝑡 es
un paseo aleatorio puro y 𝑦𝑡 es una versión observada de 𝜏𝑡 con ruido añadido 𝜀𝑡 .
El componente 𝜀𝑡 representa desviaciones aleatorias (ruido) del valor fundamental que se supone que son independientes de las
innovaciones de 𝜏𝑡 .
En la literatura, 𝜏𝑡 se conoce como la tendencia de la serie, que no es directamente observable y 𝑦𝑡 es el logaritmo observado de
datos del PIB real con error de observación (o medición) 𝜀𝑡 .
La interpretación de este modelo es que 𝜏𝑡 es un nivel local o media (no observable) para el proceso. Es local en el sentido de que el
nivel puede evolucionar de un período a otro debido al proceso de choque, 𝜂𝑡 .
El ciclo en todos estos casos es igual a 𝑐𝑡 = 𝜀𝑡 = 𝑦𝑡 − 𝜏𝑡 .
Descomposición PBI: Ciclo y tendencia
Tendencia LINEAL local
Permite que el nivel de tendencia y la pendiente varíen con el tiempo. Este modelo puede ser útil en los casos en que una sola
tendencia lineal no se ajusta bien a los datos.
En este modelo, 𝛽𝑡 es la tasa de tendencia local y 𝜏𝑡 es la tendencia local en sí misma, que es el valor medio local para el observable
𝑦𝑡 .. En otras palabras, 𝜏𝑡 y 𝛽𝑡 son el nivel y la pendiente de la tendencia respectivamente.
El parámetro de pendiente estocástica, 𝛽𝑡 , permite que la tendencia cambie suavemente con el tiempo.
En este modelo 𝜂𝑡 y 𝜁𝑡 , dan cuenta de los choques permanentes en el nivel de producción, proporcionando una explicación de los
movimientos en esa variable.
con 0 <𝑝𝑐 <1 y 0 ≤ 𝜆𝑐 ≤ π, donde 𝜆𝑐 es la periodicidad del ciclo en radianes. Además, 𝐾𝑡 , 𝐾𝑡 * ~ N (0,𝜎𝑘2 ), es decir, los dos procesos de error
comparten la misma varianza.
El componente del ciclo, 𝑐𝑡 , siguiendo a Harvey y Jäger (1993), es de forma trigonométrica y consta de uno o más ciclos.
La idea básica detrás del modelo de componentes no observados (UC por sus siglas en inglés) es proporcionar ecuaciones
estructurales para los componentes de la descomposición del ciclo-tendencia que tienen una interpretación estadística directa.
Las especificaciones de UC para extraer componentes cíclicos generalmente se prefieren a las representaciones ARIMA (Beveridge y
Nelson):
o No necesariamente un modelo ARIMA(p,d,q) recoge las características de las series subyacentes.
o Modelos ARIMA no permiten pronosticar ciertos componentes a largo plazo.
Aplicación I en Eviews
Objects/New Object.../SSpace
(Modelo tendencial local)
e-10 = 0.00005
param c(1) -10 c(2) -10 valores iniciales de los parámetros que se van a estimar
e-10 = 0.00005
param c(1) -10 c(2) -10 valores iniciales de los parámetros que se van a estimar
1 2 3
Los coeficientes c(1) y c(2), son los logaritmos de la varianza de los términos de error para las medidas y
ecuaciones de estado. Por lo tanto, estimamos que 𝜎 2 𝜀 = exp(𝑐1) y 𝜎 2 𝜂 = exp(𝑐2).
Varianza del error de medición es muy bajo [exp(-27.37892) =] y en el error de la tendencia 0.17.
¿Por qué la tendencia obtenida es similar a la serie observada? ¿Cuál sería el ciclo?
¿Podemos mejorar el modelo?
Aplicación II en Eviews
Watson (1986)*
….
watson_1.append @state trend = c(1) + trend(-1) + v1
watson_1.append @state cycle = c(2) + c(3)*cycle(-1) + c(4)*sv1(-1) + v2
….
Ciclo se modela como un AR(2)
1 2
(*) Watson, M W (1986), Univariate detrending methods with stochastic trends, Journal of Monetary Economics, Vol. 18, No. 1, pages 49-75.
Aplicación II en Eviews
Watson (1986)*
….
watson_2.append @state trend = c(1) + trend(-1) + v1
watson_2.append @state cycle = 0 + c(3)*cycle(-1) + c(4)*sv1(-1) + v2
….
Ciclo se modela como un AR(2)
1 2
(*) Watson, M W (1986), Univariate detrending methods with stochastic trends, Journal of Monetary Economics, Vol. 18, No. 1, pages 49-75.
Aplicación III en Eviews
Modelo tendencial Lineal local
….
linealtrend_1.append @signal lrgdp_sa = trend + e1
linealtrend_1.append @state trend = trend(-1) + beta(-1) + v1
linealtrend_1.append @state beta = beta(-1) + v2
….
1 2
2 2
Se puede establecer escenarios según las varianzas 𝜎𝑣1 y 𝜎𝑣2 .
Aplicación IV en Eviews
Modelo tendencial Lineal local (Harvey, 1985; Clark, 1987)
….
linealtrend_6.append @signal lrgdp_sa = trend + cycle
linealtrend_6.append @state trend = trend(-1) + beta(-1) + v1
linealtrend_6.append @state beta = beta(-1) + v2
linealtrend_6.append @state cycle = c(1)*cycle(-1) + c(2)*sv1(-1) + v3
linealtrend_6.append @state sv1 = cycle(-1)
….
1 2
Aplicación IV en Eviews
Modelo Multivariado
Las estimaciones del filtro de Kalman univariante se pueden mejorar agregando información macroeconómica
complementaria.
Clark (1989) proporcionó una aplicación temprana, donde el movimiento cíclico en el producto se mide usando un
modelo UC bivariado, donde el producto y el desempleo (o alternativamente inflación) tienen cada uno su propio
componente de tendencia, pero el componente cíclico es común a las dos series.
u: tasa de inflación
….
@signal lrgdp_sa = trendy + cycley
@state trendy = c(1) + trendy(-1) + v1
@state cycley = c(2)*cycley(-1) + c(3)*sv2(-1) + v2
1 2
Aplicación: Identificación de Auges Crediticios
“Identificacion de Episodios de Auge Crediticio: Una propuesta Metodologica con
Fundamentos Economicos” (Lahura et al., 2013)
Metodologías para capturar la tendencia y desvío excesivo del nivel de crédito:
a) Filtros estadísticos: Principalmente el filtro de Hodrick-Prescott
b) Modelos basados en fundamentos del crédito: Cointegración y Modelo de Corrección de errores.
c) Propuesta por Lahura et al. (2013): Filtro de Kalman. Las desviaciones del crédito (respecto de su tendencia
filtrada) se modelan en función de: (i) variables fundamentales (medidas como desviaciones respecto de su
tendencia filtrada), y (ii) una variable (de estado) no observable, la cual mide el componente de las desviaciones
del crédito que no está asociado a sus fundamentos.
1 3 2 15
2
10
1
5
0
0
-1
-5
-2
-3 -10
-4 -15
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
1 44
40
160
2 4
CD1
20
CD2
140
36 15
32 2
120 10
28
5
24 100 0
0
20
80 -5
16 Ciclo de cada serie con HP -2
12 60
-10
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
-4 -15
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
PBI_REAL TI
160,000 120 YD TID
110 .08 .2
140,000
100 .06
120,000 .1
90 .04
100,000 .0
80 .02
80,000 .00
70 -.1
60,000 60 -.02
-.2
40,000 50 -.04
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
-.06 -.3
94 96 98 00 02 04 06 08 10 12 14 16 18 94 96 98 00 02 04 06 08 10 12 14 16 18
Aplicación: Identificación de Auges Crediticios
“Identificación de Episodios de Auge Crediticio: Una propuesta Metodológica con
Fundamentos Económicos” (Lahura et al., 2013)
Propuesta con Filtro de Kalman:
Ciclo 1: Ratio Credito/PBI
5 6
3 6
-2
-4
94 96 98 00 02 04 06 08 10 12 14 16 18
CICLOCREDITICIO ± 2 RMSE
Modelo:
Tarea: Considerar estas variables u otras y plantear un modelo de multivariado para estimar con Filtro de Kalman.
Análisis Espectral
(Spectral Analysis)
Profesor: Mg. Ricardo Ramos Rojas
𝑥𝑡 = 𝑎𝑖 cos 𝑤𝑖 𝑡 + 𝑏𝑖 𝑠𝑒𝑛(𝑤𝑖 𝑡)
𝑖=0
2𝜋𝑖
donde 𝑎𝑖 y 𝑏𝑖 determinan la importancia de cada onda y 𝑤𝑖 es la frecuencia angular dada en radianes 𝑤𝑖 = .
𝑇
• Por un lado, el Teorema de Wold en el dominio del tiempo establece que cualquier serie de tiempo estacionaria se puede
representar mediante una suma infinita de términos AR (p) y MA (q).
• Por otro lado, en el dominio de la frecuencia el Teorema de Representación Espectral (Hamilton, 1994) establece que cualquier
serie estacionaria puede ser representada por una suma infinita de señales de seno y coseno.
𝜋 𝜋
𝑌𝑡 = 𝜇 + න 𝛼 𝜔 . cos 𝜔𝑡 𝑑𝜔 + න 𝜑 𝜔 . sin 𝜔𝑡 𝑑𝜔
0 0
Densidad espectral
• El objetivo será determinar qué tan importantes son los ciclos de diferentes frecuencias en teniendo en cuenta el comportamiento
de la serie 𝑌𝑡 .
• Se tiene un proceso estacionario
Con media: 𝐸 𝑌𝑡 = 𝜇
Autocovarianzas: 𝐸 𝑌𝑡 − 𝜇 𝑌𝑡−𝑗 − 𝜇 = 𝛾𝑗 ∞
∞
1 A partir del comportamiento del espectro, podemos ver
𝑠𝑌 𝜔 = 𝛾 + 2 𝛾𝑗 cos 𝜔𝑗 qué frecuencias agregan más a la varianza del proceso.
2𝜋 0
𝑗=1 Son aquellas en las que el espectro tiene un valor alto.
Densidad espectral
• Otra forma de analizarlo, es a través del Proceso Lineal General:
𝑦𝑡 = 𝐵(𝐿)𝜀𝑡
𝜎2
𝑠𝑌 𝜔 = 𝐵 𝑒 𝑖𝑤 𝐵 𝑒 −𝑖𝑤
2𝜋
𝜎2 2
𝑠𝑌 𝜔 = 𝐵 𝑒 𝑖𝑤
2𝜋
• Propiedades:
Simétrica alrededor de 𝑤 = 0
Periódica 2 𝜋
No-negativa
Densidad espectral (ejemplos)
• Modelo: Ruido Blanco 𝜎2
𝑌𝑡 = 𝑒𝑡 𝑠𝑌 𝜔 =
2𝜋
𝜎2 1
𝑠𝑌 𝜔 =
2𝜋 [1 + ϕ1 2 + ϕ2 2 − 2ϕ1 cos 𝑤 − 2ϕ2 cos 2𝑤 + 2ϕ1 ϕ2 cos 𝑤 ]
• Simulación:
AR(2) estacionario
w: representa la fracción dentro del rango de 0: 2𝜋
ϕ1 = 1.5 donde la densidad espectral alcanza su mayor valor.
ϕ2 = −0.95 𝑤𝑚á𝑥 = 0.11
Ciclos ocurre cada 1/𝑤𝑚á𝑥 = 8.9 periodos
Estimación de la densidad espectral
• El periodograma es el estimador del área bajo el espectro de población de una serie, que puede verse como una función de
distribución de probabilidad. Debe interpretarse como frecuencias cercanas a un valor ayudan a explicar la varianza.
𝑇−1
1
𝑠Ƹ𝑌 𝜔 = 𝛾ො + 2 𝛾ො𝑗 cos 𝜔𝑗
2𝜋 0
𝑗=1
• Problemas de estimación:
Se requiere de un tamaña de T suficientemente grande.
𝑠Ƹ𝑌 no alcanza más precisión a medida que T crece.
Aplicación en Eviews
• Ejemplo. AR(1): 𝒚𝒕 = α + ρ𝒚𝒕−𝟏 + 𝜺𝒕
Picos:
1
ρ = 𝟎. 𝟓 → 𝑓 ≈ 0.12 → 𝑐 = ≈ 8
𝑓
1
ρ = 𝟎. 𝟗 → 𝑓 ≈ 0.03 → 𝑐 = ≈ 33
𝑓
1
ρ = 𝟏. 𝟎 → 𝑓 ≈ 0.01 → 𝑐 = ≈ 100
𝑓
• Una vez obtenido las frecuencias de los ciclos, se pueden introducir en la modelación del AR como una variable exógena. Por
ejemplo en el caso de AR(1) con coeficiente 0.9:
genr cycle=@cos(2*3.14*@trend*0.03)+@sin(2*3.14*@trend*0.03)
También se puede introducir cada componente por separado y analizar quién explica mejor la serie.
Aplicación en R
• Crearemos una serie de tiempo simple y luego veremos cómo podemos extraer la información de frecuencia usando análisis
espectral.
• Gráfico de la serie X:
(*)
(*) Multiplicar la densidad espectral por 2 para que el área bajo el periodograma sea realmente igual a la varianza de la serie de tiempo.
Aplicación en R
• Ejemplos con variables macroeconómicas:
1 400 40
140
120
300 30 100
60
100 10
40
Variables abreviatura 0
92 94 96 98 00 02 04 06 08 10 12 14 16 18
0
92 94 96 98 00 02 04 06 08 10 12 14 16 18
20
92 94 96 98 00 02 04 06 08 10 12 14 16 18
12 8
100
4
60
40
4 3
M3/PBI dinero_pbi 2
92 94 96 98 00 02 04 06 08 10 12 14 16 18
2
92 94 96 98 00 02 04 06 08 10 12 14 16 18
20
92 94 96 98 00 02 04 06 08 10 12 14 16 18
15,000
5,000
0.8 -2
6
g_inmuebles 0.040 0.6
4 -3
0.4
g_igbvl 0.035 2 -4
0.2
96 98 00 02 04 06 08 10 12 14 16 18
0
0.0
PC1A PC1B PC1C
2 -0.2
96 98 00 02 04 06 08 10 12 14 16 18
-2
96 98 00 02 04 06 08 10 12 14 16 18
40 .1 1.4
30 1.2
.0
1.0
20
FREQUENCY FREQUENCY
8 Densidad Espectral 9
IC (95%) l Smoothed Spectrum of ICF
3.2
2.8
2.4
2.0
0.0
.05 .10 .15 .20 .25 .30 .35 .40 .45
.05 1.0
Ciclo económico
Ciclo Financiero
.00 0.5
-.05 0.0
-.10 -0.5
-.15 -1.0
-.20 -1.5
-.25 -2.0
1980 1985 1990 1995 2000 2005 2010 2015 2020
Donde:
𝑆𝑥𝑦 es la densidad espectral cruzada
𝑆𝑥 y 𝑆𝑦 es la densidad espectral de las series x e y.
• Fase del espectro cruzado (phase of the cross spectrum): Muestran si una variable adelanta a otra o lo
contrario (rezago). Más específicamente, la estadística de fase muestra el retraso o adelanto de una variable
frente a la otra en fracciones de π. Toma valores entre -1 y 1.
Análisis Multivariado : Cross-Spectral Analysis
• Ejemplo (Matlab)
Series Crecimiento PBI (Var.% anualizada) y Crecimiento importaciones (Var.% anualizada)
Donde Φ L = Θ−1 (𝐿) y Ψ L = Φ(𝐿)G−1 . G es la matriz triangular inferior de la descomposición de Cholesky. Usando
esta representación, la densidad espectral de 𝑋1𝑡 , por ejemplo, puede ser expresado como:
Prueba de causalidad Breitung y Candelon (2006)
• Esta representación separa las contribuciones de 𝑋1𝑡 , (es decir, Ψ11 ) y 𝑋2𝑡 (es decir, Ψ12 ) al espectro de 𝑋1𝑡
y, por lo tanto, permite probar la causalidad en el sentido de Granger en cualquier frecuencia 𝜔. La
hipótesis nula, en este ejemplo, es que 𝑋2𝑡 no causa a lo Granger a 𝑋1𝑡 , lo que significa que Ψ12 (𝑒 −𝑖𝜔 )= 0 e
implica que ningún valor rezagado de 𝑋1𝑡 influye en 𝑋2𝑡 .
2
𝑀𝑋2→𝑋1 𝜔 = 0 si Ψ12 (𝑒 −𝑖𝜔 ) = 0, es decir 𝑋2 no causa en el sentido de Granger 𝑋1 .
Aplicación en Eviews
• Relación de causalidad entre el ciclo financiero (CF) y el ciclo económico (CE) en el Perú.
• Los resultados del test permiten comprobar que existe una relación de causalidad del ciclo financiero, al
ciclo económico , con un nivel de significancia de 1%. Sin embargo, no hay evidencia de que el CE cause al
CF.
Prueba de causalidad entre el CF y el CE
Econometría Bayesiana
Profesor: Mg. Ricardo Ramos Rojas
• La teoría bayesiana plantea la solución a un problema estadístico desde el punto de vista subjetivo de la probabilidad.
• La probabilidad que un estadístico asigna a uno de los posibles resultados de un proceso, representa su propio juicio sobre la
verosimilitud de que se tenga el resultado.
• La información que el estadístico tiene sobre la verosimilitud de los distintos eventos relevantes al problema de decisión, debe ser
cuantificada a través de una medida de probabilidad Θ.
Introducción
• En estadística existen dos conceptos de probabilidad:
Probabilidad frecuentista
Probabilidad subjetiva
• Probabilidad frecuentista: Los frecuentistas restringen la asignación de probabilidades a enunciados que describen el resultado de
un experimento que se puede repetir.
Evento A = Una moneda lanzada tres veces saldrá cara dos o tres veces.
• Probabilidad subjetiva:
Aquellos que adoptan el punto de vista subjetivo de la probabilidad creen que la teoría de la probabilidad es aplicable a cualquier situación en
la que haya incertidumbre.
No sólo los resultados de experimentos repetidos entran en esa categoría, sino también aquellos que no son el resultado de experimentos
repetidos (por ejemplo, predicción del clima el día de mañana).
0 ≤ Pr 𝐴 ≤ 1
Pr 𝐴 = 1 𝑠𝑖 𝐴 𝑢𝑛𝑎 𝑙ó𝑔𝑖𝑐𝑎 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎.
Si A y B describen eventos disjuntos (eventos que no pueden ocurrir al mismo tiempo), entonces Pr 𝐴 U 𝐵 = Pr 𝐴 + Pr(𝐵)
Pr(𝐴∩𝐵)
La probabilidad condicional: Pr 𝐴ȁ 𝐵 =
Pr(𝐵)
La unión de A y B es el evento que ocurra A o B; se denota como 𝐴 ∪ 𝐵
La intersección de A y B es el evento que ocurra A y B; se denota como 𝐴 ∩ 𝐵
Desde el punto de vista frecuentista, la teoría de la probabilidad puede decirnos algo sobre la distribución de los datos para un θ dado.
𝑌~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝜃)
• Enfoque bayesiano:
Dado que hay incertidumbre acerca de su valor se considera como una variable aleatoria y se asigna una probabilidad.
1 (𝜃−𝜇)2
Por ejemplo, prior de 𝜃 sigue una distribución normal: 𝜋 𝜃, 𝜸 = exp(− ), vector de hiperparámetros 𝛾 = (𝑢, 𝜎 2 ).
𝜎 2𝜋 2𝜎2
Distribuciones prior y posterior
• Distribución Beta (prior):
Con vector de hiperparámetros 𝛾 = (𝛼, 𝛽). Esta distribución tiene características importantes:
Cuando ambos parámetros son menores que uno, puede tener dos
modas.
Distribuciones prior y posterior
• Distribución posterior:
La inferencia bayesiana se centra en la distribución posterior 𝜋 𝜃 ȁ𝑦 , que es la distribución condicional de la variable aleatoria θ
dados los datos (realización de la muestra) 𝑦 = 𝑦1 , 𝑦2 , … 𝑦𝑛 .
Los datos (𝑦1 , 𝑦2 , … , 𝑦𝑛 ) son considerados como constantes cuyas distribuciones (marginales) no involucran los parámetros de
interés θ:
𝑓𝑌1,…,𝑌𝑛 𝑦1 , 𝑦2 , … , 𝑦𝑛 = constantes
Como consecuencia del teorema de Bayes:
Pr 𝑑𝑎𝑡𝑎ȁ 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 ∗ Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠ȁ 𝑑𝑎𝑡𝑎 ∝ Pr 𝑑𝑎𝑡𝑎ȁ 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 ∗ Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠
Pr 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠ȁ 𝑑𝑎𝑡𝑎 =
Pr 𝑑𝑎𝑡𝑎
Posterior Verosimilitud Prior
Distribuciones prior y posterior
• Ejemplo:
Observamos la variable Y discreta con valor 0 ó 1:
𝑌~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖 𝜃
𝑓𝑌 𝑦𝑖 , 𝜃 = Pr 𝑌𝑖 = 𝑦𝑖 = 𝜃 𝑦𝑖 (1 − 𝜃)1−𝑦𝑖
𝐿𝑛 𝜃, 𝑦1 , … , 𝑦𝑛 = 𝜃 σ 𝑦𝑖 (1 − 𝜃)𝑛−σ 𝑦𝑖
Γ(𝑎 + 𝑏) 𝑎−1
𝜋 𝜃, 𝛾 = 𝜃 (1 − 𝜃)𝑏−1 , 𝑎, 𝑏 > 0 , 𝜃𝜖 [0,1]
Γ(𝑎)Γ(𝑏)
La distribución posterior es:
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝐿𝑛 𝜃, 𝑦1 , … , 𝑦𝑛 ∗ 𝜋 𝜃, 𝛾
Distribuciones prior y posterior
• Ejemplo:
La distribución posterior es:
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝐿𝑛 𝜃, 𝑦1 , … , 𝑦𝑛 ∗ 𝜋 𝜃, 𝛾
Γ(𝑎 + 𝑏) 𝑎−1
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 ∝ 𝜃 (1 − 𝜃)𝑏−1 𝜃 σ 𝑦𝑖 (1 − 𝜃)𝑛−σ 𝑦𝑖
Γ(𝑎)Γ(𝑏)
𝑎1 = (𝑎 + 𝑦𝑖 ) − 1 𝑏1 = 𝑏 + 𝑛 − 𝑦𝑖
Este es un ejemplo de un conjugado a priori, donde la distribución posterior pertenece a la misma familia
que la distribución anterior.
Distribuciones prior y posterior
• Ejemplo:
Una solución sería:
Γ(𝑎1 + 𝑏1 ) 𝑎 −1
𝜋 𝜃 ȁ𝑦1 , … , 𝑦𝑛 = 𝜃 1 (1 − 𝜃)𝑏1 −1
Γ(𝑎1 )Γ(𝑏1 )
𝑎+σ 𝑦𝑖
𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = 𝑎+𝑏+𝑛
𝑎+𝑏 𝑎 𝑛
𝐸 𝜃ȁ𝑦1 , … , 𝑦𝑛 = + 𝑦ത
𝑎+𝑏+𝑛 𝑎+𝑏 𝑎+𝑏+𝑛
donde 𝜃 denota el vector o los parámetros, 𝑋 un conjunto de variables explicativas, 𝜀 un término de error y 𝑔(. ) la función de enlace.
• En este caso, generalmente consideramos la distribución condicional de 𝑌 dado 𝑋, que es equivalente a la distribución
incondicional del término de error 𝜀:
𝑛
• La función de verosimilitud (condicional) de una muestra i.i.d 𝑋𝑖 , 𝑌𝑖 𝑖=1 se define como:
𝐿𝑛 𝜃; 𝑦ȁ𝑥 ∗ 𝜋 𝜃
𝜋 𝜃 ȁ𝑦, 𝑥 =
𝑓𝑌ȁ𝑋 (𝑦ȁ𝑥)
Donde 𝐿𝑛 𝜃; 𝑦ȁ𝑥 es la verosimilitud de la muestra y
𝑓𝑌ȁ𝑋 𝑦ȁ𝑥 = න 𝐿𝑛 𝜃; 𝑦ȁ𝑥 ∗ 𝜋 𝜃 𝑑(𝜃)
Θ
En algún caso particular, la distribución posterior es una distribución estándar (Beta, normal, etc.) y su función de
probabilidad tiene forma analítica.
En otro caso, la distribución posterior se obtiene a partir de simulaciones numéricas.
• Cualquiera que sea el caso (analítico o numérico), el resultado del procedimiento de estimación bayesiano puede ser:
Gráfico de la densidad posterior 𝜋 𝜃 ȁ𝑦 para todos los valores de 𝜃 𝜖 Θ
Algunos momentos (media, varianza, etc.) o cuantiles de la distribución.
Regresión Lineal Bayesiana
• Pero también nos puede interesar estimar un parámetro del modelo. El enfoque bayesiano de este problema utiliza la idea de una
función de pérdida:
𝜽)
𝑳(𝜽,
es el estimador bayesiano.
Donde 𝜽
• Ejemplos de funciones de pérdida:
𝜽 = 𝜽
Función de pérdida absoluta 𝑳 𝜽, −𝜽
2
𝜽 = 𝜽
Función de pérdida cuadrática 𝑳 𝜽, −𝜽
• Estimador bayesiano:
El estimador bayesiano de θ es el valor de θ que minimiza el valor esperado de la
función de pérdida, donde la expectativa es tomada sobre la distribución
posterior de θ, esto implica que θ es elegido para minimizar:
𝜃
𝐸 𝐿 𝜃, 𝜃 𝜋 𝜃 ȁ𝑦 𝑑(𝜃)
= න 𝐿 𝜃,
Regresión Lineal Bayesiana
• Ejemplo: Regresión entre las Importaciones (Var.%12M) y PBI (Var.%12M).
• El resultado de la regresión bayesiana es muy similar al de la regresión por mínimos cuadrados y los coeficientes estimados son
casi exactamente los mismos, pero existen algunas diferencias conceptuales en la interpretación.
La salida bayesiana habla directamente de cuáles son las partes posteriores de los parámetros y no se refiere a las pruebas de
hipótesis. (¡Sin valores t, valores p o significancia!).
La salida bayesiana muestra cuantiles del posterior exacto para cada parámetro (que puede ser asimétrico).
dónde
𝜀𝑡 = (𝜀𝑡1 , … . 𝜀𝑛𝑡 )′ es un término de error con E(𝜀𝑡 ) = 0 e invariante en el tiempo (es decir, constante).
La matriz de varianza-covarianza definida positiva cov (𝜀𝑡 ) = E(𝜀𝑡 𝜀𝑡 ’) = Σ(ruido blanco).
c es un vector (n × 1) vector de interceptos.
𝐵𝑡 es una matriz (n × n) de coeficientes de regresión para el j-rezago (j = 1, ..., p).
• Los modelos VAR con muchas variables y rezagos contienen muchos parámetros. El número de coeficientes en el modelo VAR
básico sin restricciones (forma reducida) se multiplican fácilmente. Esto significa lo siguiente:
Hay muchos coeficientes para estimar.
En un conjunto de pocos datos, los valores de los coeficientes a menudo no están muy bien determinados (imprecisos).
Si el 𝐵1 , ..., 𝐵𝑃 se estiman de manera imprecisa debido a los datos limitados, las funciones de respuesta al impulso, los
pronósticos y las descomposiciones de la varianza del error de pronóstico que son basado en ellos también se estimarán de
manera imprecisa.
• Por lo tanto, se han desarrollado métodos alternativos para estimar los coeficientes, el más destacado es la estimación bayesiana.
VAR Bayesiano (BVAR)
• El análisis de modelos VAR utilizando métodos bayesianos requiere el conocimiento de las propiedades distributivas de las
estimaciones de los parámetros.
• Denotamos la distribución prior de los parámetros de interés por p(θ) y la distribución posterior correspondiente por p(θ|Y).
• El vector de parámetros β y la matriz de Var-Cov de los residuos: Σ
• Usando el teorema de Bayes, la distribución posterior se resume como el producto de la verosimilutd L(Y|θ) y el prior p(θ):
Distribución Normal
Distribución Wishart
Aplicación BVAR
Series de tiempo a utilizar:
Inflación
Tasa de desempleo
Tasa de interés de los bonos a 10 años (Perú)
Aplicación BVAR
VAR (4) sin restricciones
Como puede ver en la Tabla, incluso estimar un VAR pequeño de tres variables y
4 rezagos genera una gran cantidad de resultados.
Para cada variable del lado derecho, EViews informa la estimación puntual del
coeficiente, el error estándar del coeficiente estimado (entre paréntesis) y el t-
estadística (entre corchetes).
Aplicación BVAR
Prio no informativo, difuso o flat
• Podemos comparar el modelo anterior con la opción de EViews de imponer un prior difuso (o flat).
donde n es el número de variables en el VAR. Usando el teorema de Bayes, podemos derivar la distribución posterior:
donde
Aplicación BVAR
Prio no informativo, difuso o flat
• Descargar Add-ins: BVAR
Betas similares que en el caso VAR sin
restricciones.
• La simplicidad del prior Minnesota proviene del hecho de que se asume que Σ es conocido (y reemplazado por su
estimación 𝜮 ) lo que significa que no se requiere una distribución previa para Σ.
• El prior Minnesota simplifica aún más asumiendo que Σ es una matriz diagonal.
• Cuando Σ se reemplaza por una estimación, solo nos preocupamos por un prior para β y la distribución prior para β
bajo el prior Minnesota está dado por:
• Σ es una matriz diagonal con elementos 𝑠𝑖2 obtenidos de regresiones univariadas de cada variable dependiente
sobre una intersección y el número rezagos elegidos de todas las variables.
1/ Koop, G and Korobilis, D (2009), Bayesian multivariate time series methods for empirical macroeconomics.
Aplicación BVAR
Prior Minnesota de Koop y Korobilis (Ko-Ko)1/
• Koop y Korobilis (2009) especificaron su propia matriz prior de covarianzas 𝐕𝟎 como una matriz diagonal con
elementos 𝑣𝑖𝑗,𝑙 (𝑙 = 1, … , p):
𝑎1
para coeficientes sobre sus propios rezagos
𝑝2
l𝑣𝑖𝑗,𝑙 = (𝑎2 𝜎𝑖) para coeficientes de rezagos 𝐢 ≠ 𝒋
𝑝2 𝜎𝑗
𝑎3 𝜎𝑖 para coeficientes de variables exógenas
• Si se establece que 𝑎1 > 𝑎2 , es más probable que los retrasos propios sean predictores importantes que los retrasos
de otras variables.
• Una ventaja del prior Minnesota es que conduce a una inferencia posterior simple que involucra sólo la distribución
Normal. La distribución posterior resultante para β tiene la forma:
Nota: Desventaja no incorpora
MCO
incertidumbre sobre la matriz Σ
Aplicación BVAR
Prior Minnesota Koop y Korobilis (Ko-Ko)
• Descargar Add-ins: BVAR
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• El prior Normal-Wishart es un ejemplo de prior conjugado natural.
• Estos son priors donde la distribución prior, verosimilitud y posterior provienen de la misma familia de distribuciones.
• Kadiyala y Karlsson (1997) pudieron demostrar que la verosimilitud L(Y|β, Σ) del modelo VAR se puede descomponer en
dos partes. Uno es una distribución para β dado Σ y otro es una distribución para Σ−1 . Se supone que el primero es
Normal, mientras que el segundo es una distribución Wishart.
• Si se relaja el supuesto que la matriz de varianza-covarianza es fija y diagonal, la distribución prior conjunta es la
distribución Normal-Wishart:
donde 𝜎𝑖 2 es el elemento diagonal 𝑖-ésimo de Σ para el l-ésimo rezago de la variable i en la ecuación j y λ1, λ2 y λ3 son tres
hiperparámetros establecidos por el investigador.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• La distribución posterior de 𝛽 y Σ son:
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Definición de parámetros:
Hiperparámetro Propósito
λ0 Severidad del priori en la matriz de covarianza. Los valores más pequeños significan un prior más severo.
λ1 Desviación estándar o severidad del priori sobre el coeficiente AR (1). Los valores más pequeños significan un
previo más severo.
λ2 =1 supuesto bajo Sims y Zha.
λ3 Controla qué tan rápido llegan a cero los retrasos más altos. Los valores más altos significan que los retrasos
decaen más rápido.
λ4 Desviación estándar o rigidez de la constante a priori. Los valores más pequeños significan un previo más
estricto.
λ5 Severidad de a priori sobre variables exógenas. Los valores más pequeños significan un previo más severo.
μ5 Los valores más altos implican que los coeficientes de los propios rezagos suman uno.
μ6 Los valores más altos implican que hay menos de N tendencias estocásticas en el VAR.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Los dos hiperparámetros adicionales 𝑢5 y 𝑢6 permiten lidiar con cualquier variable no estacionaria o cointegración en las
variables que aparecen en el VAR.
• Un modelo VAR en primeras diferencias (tasas de crecimiento) no necesita de cointegración / raíz unitaria antes de la
construcción porque es estacionario.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ0 = 1
λ1 = 1
λ3 = 1
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ0 = 0.1
o Si λ0 0, los prior
se impone y los
datos no influyen
en las
estimaciones.
o Si λ0 1, los prior
pierden influencia
en la estimación y
la estimación se
aproxima a MCO.
Aplicación BVAR
Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
λ1 = 0.1
Coeficientes de rezagos
más altos no caen tan
rápido a cero.
Aplicación BVAR
Prior Normal-Flat de Sims y Zha (1998)
• El prior Normal-Flat de Sims y Zha (1998) asume la independencia entre B y Σ, donde:
• Debido a que B y Σ ahora son independientes, Σ ya no se considera en la distribución prior para B, el cual está escrito
simplemente como p(B) en lugar de p(B | Σ). Las distribuciones posteriores son:
Aplicación BVAR
Prior Normal-Flat de Sims y Zha (1998)
• Descargar Add-ins: BVAR
Las estimaciones de
betas se mantienen sin
cambios, mientras que
los errores estándar
han cambiado (son
marginalmente más
pequeños que en el
caso Normal-Wishart.)
Forecast - Aplicación BVAR
• La otra herramienta adicional es la capacidad de pronosticar con el modelo BVAR estimado.
• En muchas situaciones de pronóstico, el horizonte de pronóstico, h, es más largo que la frecuencia utilizada para recopilar datos y
estimar el modelo de predicción.
• Enfoques para el pronóstico: iterado.
Consideremos un modelo AR(1)
mientras que los pronósticos para horizontes de h-pasos hacia adelante se obtienen como:
Los pronósticos iterados son eficientes si el modelo de un periodo hacia adelante se especifica correctamente.
Forecast - Aplicación BVAR
Ecuación: Prior conjugado natural (Normal-Wishart) de Sims y Zha (1998)
• Descargar Add-ins: BVAR
1 3
2 Simulation type:
Solución determinística: Todas las
ecuaciones del modelo se resuelven sin
considerar los términos de error.
Dynamics:
Solución dinámica: solo se utilizan los valores
de las variables endógenas que preceden a la
4 Pronósticos en
muestra de la solución al formar el pronóstico. escenario base
Es recomendable cuando se proyecta varios
periodos hacia adelante.
Forma reducida:
donde:
𝑦𝑗 : Variable endógena j
𝑌𝑗 : submatriz luego de eliminar la j-ésima fila de Y
𝑋: matriz de variables explicativas
𝟏
Se demuestra que: 𝐩𝐥𝐢𝐦 𝐘𝐣 𝛜𝐣 = 𝐀−𝟏
𝐣 𝛔𝐣 ≠ 𝟎
𝐓
donde: 𝐴𝑗−1 es la submatriz luego de eliminar la j-ésima fila de 𝑨−𝟏 𝑬 y 𝝈𝒋 es la j-ésima columna de Σ.
Estimación MCO
No tiene las propiedades deseables en el contexto económico.
Estimadores inconsistentes
Métodos de estimación
2. Mínimos Cuadrados en dos etapas (MC2E)
• Recordemos la otra forma de escribir la forma estructura: … (1)
• En la primera etapa, se realiza la regresión de las variables endógenas explicativas 𝒀 𝒋 sobre todas las variables exógenas del modelo X,
y se obtiene la matriz (m − 1 × T) de valores ajustados 𝒀 𝒋 = 𝒀𝒋 X’ (XX’)−𝟏 X y la matriz de residuos 𝑽
𝒋 = 𝒀𝒋 −𝒀
𝒋.
• En la segunda etapa, se estima la siguiente ecuación mediante MCO para obtener 𝛽𝑀𝐶2𝐸 = (𝛿, 𝛾)
𝑗 𝛾ො𝑗
Esta regresión se obtiene sustituyendo la identidad 𝑌𝑗 = 𝑌𝑗 + 𝑉𝑗 en (1) siendo 𝑒𝑗 = 𝜖𝑗 +𝑉′
• Los estimadores de MC2E son consistentes.
Métodos de estimación
3. Mínimos Cuadrados en tres etapas (MC3E)
• Es una técnica apropiada el término de error es heteroscedástico y autocorrelacionado.
• Consiste en dos etapas de aplicación de mínimos cuadrados ordinarios y otra de mínimos cuadrados generalizados (MCG).
• Etapas del modelo son las siguientes:
El estimador FIML maximiza esta función de verosimilitud sujeto a todas las restricciones sobre A, B y 𝚺. Para encontrar el óptimo se
requiere, por lo general, utilizar métodos de optimización numérica.
Métodos de estimación
5. GMM (Generalized Method of Moments)
• GMM es un estimador robusto ya que no requiere información de la distribución exacta de las perturbaciones.
• La estimación de GMM se basa en el supuesto de que las perturbaciones en las ecuaciones no están correlacionadas con un conjunto
de variables instrumentales.
• El estimador GMM selecciona las estimaciones de los parámetros para que las correlaciones entre los instrumentos y las
perturbaciones sean lo más cercanas posible a cero posible
• Denotamos estas condiciones de momento como:
El estimador del método de momentos se define reemplazando la condición de momento por su análogo en muestras:
• Para obtener estimaciones de GMM, debe poder escribir las condiciones de momento en la ecuación como una condición de
ortogonalidad entre los residuos de una ecuación de regresión, y un conjunto de variables instrumentales:
Aplicación – Modelo macroeconómico
1. Definición de ecuaciones
𝑪𝒐𝒏𝒔𝒖𝒎𝒐𝒕 = 𝜷𝟏𝟎 + 𝜷𝟏𝟏 𝑷𝑩𝑰𝒕 + 𝒆𝟏𝒕
𝒗 = # parámetros - #instrumentos
𝜶 = nivel de significancia
2
Aplicación – Modelo macroeconómico
4. Solución al Sistema
a) Tipo de simulación:
Determinista:
Implica resolver el modelo sin simular los residuos.
Todos los coeficientes estimados se utilizan en la simulación en
sus estimaciones puntuales,
Todas las variables exógenas se mantienen constantes.
Estocástico:
Implica simular los residuos.
Coeficientes varían aleatoriamente.
Se genera una distribución de resultados para las variables
endógenas en cada período. Se escoge promedio como
estadístico resumen de la solución.
b) Dinámica (Dynamics)
Solución dinámica:
Utiliza la estimación anterior para seguir proyectando o realizar
estimaciones hacia atrás (histórico).
Para proyectar fuera de muestra se debe conocer el valor de las
variables exógenas.
Solución estática:
Sólo utiliza datos observados para realizar la proyección o
realizar la estimaciones hacia atrás (histórico).
Para proyectar fuera de muestra se debe conocer el valor de las
variables exógenas.
3
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
5
2
7
4
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
9
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si las expectativas de la inflación se hubiesen anclado en 3%?
2
1
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si las inversión de la inflación se hubiesen anclado en 3%?
1 3
6
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si la inversión crecía 5%?
Aplicación – Modelo macroeconómico
6. Definición de Escenarios
¿Qué hubiera pasado con la economía si la inversión crecía 5%?
1
3
2
Aplicación – Modelo macroeconómico
7. Forecast del Modelo
Aplicación – Modelo VAR - FIML
0. Formulación del problema 𝑔𝑎𝑝𝑡
Modelo en forma estructural: ... (1) 𝑦𝑡 = 𝑖𝑛𝑓𝑙𝑡
𝑡𝑎𝑠𝑎𝑟𝑒𝑓𝑡
Por problemas de identificación estimamos: ... (2)
... (7)
2 .02
0 .00
-2 -.02
-4 -.04
2004 2006 2008 2010 2012 2014 2016 2018 2004 2006 2008 2010 2012 2014 2016 2018
.02
.00
-.02
-.04
-.06
2004 2006 2008 2010 2012 2014 2016 2018
Colocar restricciones
Aplicación – Modelo VAR - FIML
0. Regresando a la formulación del problema
... (12)
Consideremos:
Choque ecuación gap como choque de demanda
Choque ecuación infl como choque de oferta
Choque ecuación tasaref como choque de monetario
Aplicación – Modelo VAR - FIML
7. Significancia individual de los coeficientes
Modelo VAR(2) puede estar sobreparametrizado. Se han utilizado 65 datos para estimar 18 coeficientes.
Al nivel de significancia de 5%, solo 6 coeficientes de los 18 son no significativos (estadístico t-student en valor absoluto < 1.96).
Para el VAR desequilibrado ya no se utilizará la técnica de estimación MCO dado que no se tienen los mismos regresores al lado
derecho de la ecuación. Ahora tendremos que usar el método de Máxima Verosimilitud con Información Completa (FIML).
Respuesta de las variables ante un choque de la variable tasaref Respuesta de las variables ante un choque de la variable infl
Parámetros
Sistema de ecuaciones