Está en la página 1de 23

Estimación de la inflación aplicando ARIMA y GARCH:

Caso en Argentina

Vargas, Matías Tomás

Septiembre, 2022

Abstract:
El objetivo de este estudio es determinar las características estadísticas que caracterizan a los datos de
inflación en Argentina, y posteriormente modelarlas para realizar estimaciones in-sample y out-of
sample. Con el fin de modelar la media condicional, se utiliza la metodología de Box-Jenkins. Las
herramientas estadísticas utilizadas para identificar los modelos son las funciones de autocorrelación
(ACF) y autocorrelación parcial (PACF) de los residuos de los modelos estimados. El modelo con menor
AIC (entre todos los posible candidatos) es el SARIMA(1,1,1)(1,0,1,12). Para modelar la varianza
condicional, luego de comprobado que existe de heterocedasticidad condicional autorregresiva en los
residuos al cuadrado del modelo SARIMA, se procedió a iterar sobre varios modelos GARCH con valores
de p y q hasta de orden 2 inclusive. El modelo con el que nos quedamos fue GARCH(1,1).

Para evaluar la capacidad predictiva de los modelos SARIMA y SARIMA-GARCH, comparamos los errores
cuadráticos medios de las estimaciones contra la serie original y también contra la mediana de las
estimaciones recolectadas por el BCRA en su informe mensual de Relevamiento de Expectativas de
Mercado (REM). Las estimaciones out-of-sample son mejor en el modelo SARIMA, aún así decidimos
quedarnos con el modelo SARIMA-GARCH ya que se asemeja más a las estimaciones de especialistas en
el tema y que seguramente tienen en cuenta más factores que la misma serie de inflación al momento
de hacer extrapolaciones.

En la comparación de los errores cuadráticos medios in-sample de ambos modelos podemos observar
que un modelo de media condicional junto con uno de varianza condicional captura mejor la volatilidad
de la tasa de inflación en Argentina.
I. INTRODUCCIÓN

El incremento sostenido de precios de bienes y servicios durante un período de tiempo determinado


resultante en una disminución en la capacidad de compra medida en unidades monetarias es
conocido como inflación.

La medida más común de la inflación es el cambio porcentual en el índice de precios al consumidor


(IPC), el mismo captura el costo de vida del consumidor promedio. El IPC incluye bienes de consumo
de producción nacional e importados.

Elevadas tasas de inflación indican una economía en la que la demanda agregada supera la oferta
agregada. Una alta inflación se suele asociar con un menor crecimiento económico y crisis
financieras. El aumento de los niveles de precios también se encuentra relacionado con menor
confianza del inversor, disminuye los incentivos al ahorro y deteriora los balances tantos financieros
como públicos. Además, el impacto de la alta inflación puede tener un efecto desproporcional en los
pobres en comparación al resto de las clases sociales ya que los primeros dependen aún más en
ingresos salariales y es menos probable que tengan activos financieros o reales distintos al efectivo.
Una alta volatilidad en la inflación se suele asociar con inestabilidad macroeconómica e
incertidumbre sobre el nivel de precios. Otra consecuencia de ello es que empeora la redistribución
de los ingresos y, por lo tanto, debilita el consumo. También es probable que la actividad económica
de un país se debilite por las políticas monetarias restrictivas necesarias para reducir la inflación
cuando se encuentra en niveles altos. Esto es particularmente importante para el mercado laboral
debido a la rigidez general a la baja de los salarios nominales. Por estas razones una inflación baja y
estable está asociada con mejor crecimiento y desarrollo económico, estabilidad financiera y
reducción de pobreza. Menores tasas de inflación suelen estar acompañadas con menor volatilidad
y mayor ahorro e inversión.

En cuanto al impacto de la inflación en la actividad económica, cuando la misma es baja brinda


mayor certidumbre en el futuro valor real de los activos nominales y reduce la incertidumbre de los
rendimientos relacionados con la inversión, por ende, una inflación baja y estable fomenta la
inversión a largo plazo. Dicha inversión puede ser una fuente importante de productividad y
crecimiento del producto de un país. También cabe mencionar que niveles de inflación bajos y
estables, pero positivos, hace que los cambios en los precios relativos de los bienes sean más
transparentes. Esto reduce la necesidad de una costosa búsqueda de información de los precios de
distintos bienes que sería necesaria cuando hay alta inflación. Tercero, una inflación baja y estable

2
tiende a asociarse con una mayor estabilidad del sector financiero. Esto, a su vez, respalda la
estabilidad macroeconómica. La inflación estable suele estar asociada con tasas nominales de
interés más bajas a largo plazo. Esto puede ayudar a reducir el riesgo de reinversión o
incumplimiento y el costo de financiamiento para inversiones a largo plazo.

Cuando hay elevada inflación, es probable que se requieran ajustes frecuentes de precios por parte
de las empresas para mantener su rentabilidad. Si los ajustes de precios de diferentes bienes y
servicios son asincrónicos, se producirán distorsiones de precios relativos. Estos tenderán a socavar
la asignación eficiente de recursos y el crecimiento de la productividad. La inflación puede alentar la
inversión en propiedades en lugar de inversiones más productivas.

En cuanto a la certidumbre, una alta inflación puede dificultar que los hogares y las empresas
distingan la variación de precios relativa de la absoluta. La inflación alta y volátil indica una
incapacidad de las políticas gubernamentales para garantizar la estabilidad macroeconómica. Estos
factores aumentan la incertidumbre sobre el valor futuro de los activos y, por lo tanto, desalientan
la inversión que requiere que los rendimientos sean más previsibles o estables a largo plazo para
garantizar rentabilidad (Woodford 2003).

Otre efecto negativo de una elevada inflación es que puede reducir el ahorro. Al aumentar los
ingresos nominales, acelera la progresión impositiva cuando los mismos se miden frente a los
tramos fijos de impuestos sobre la renta nominal. Esto reduce los ingresos después de impuestos, lo
que tenderá a suprimir el ahorro de los hogares y, en consecuencia, agota un medio de financiación
para la inversión.

Los hogares de bajos recursos económicos tienden a depender de salarios, pensiones y prestaciones
sociales como principales fuentes de ingresos y, en su mayoría, mantienen la mayor parte de sus
ahorros en efectivo (Erosa y Ventura 2002). Los salarios, las pensiones y los beneficios sociales
tienden a responder menos a la inflación que los ingresos no salariales, y el valor real de los ahorros
en efectivo, al no ser remunerado, se ve afectado negativamente por la inflación (Kahn 1997). Como
resultado, los ingresos reales de los hogares de bajos recursos económicos tienden a disminuir en
mayor proporción que los de los hogares de mayores ingresos en contextos de alta inflación
(Albanesi 2007).

Otro punto no menor es que se produce un daño a la productividad de un país que sufre de alta
inflación cuando se toman las medidas necesarias para disminuir la misma. La indexación de salarios

3
y otros precios puede hacer que se necesiten grandes pérdidas en el producto cuando se trata de
bajar la tasa de inflación.

Hasta el momento podemos apreciar que se encuentra bien establecido en la literatura el efecto
negativo y las consecuencias de elevadas tasas de inflación.

En Argentina, al momento de escribir esta investigación, acumula una inflación interanual del 71%
que comprende el período desde julio 2021 a Julio 2022 1. Dicha cifra es la más alta de los últimos 30
años, es decir, desde 1991 cuando el país salía de una hiperinflación. Para diciembre de 2022, según
el informe de Relevamiento de Expectativas de Mercado publicado por el Banco Central de la
República Argentina (BCRA), la inflación superará los 80% 2.

Teniendo en cuenta lo anterior y la gran volatilidad que ha tenido la inflación a lo largo del tiempo,
no cabe duda de que es difícil de pronosticar la inflación en Argentina debido a que existen muchos
factores relevantes que influyen la misma. Por lo tanto, la selección de un marco metodológico o
modelo adecuado representa un desafío en la investigación que estamos llevando a cabo ya que el
pronóstico de la inflación no solo se basa en datos históricos, sino que también se debe prestar
atención a otros factores que pueden influir en la variación de la misma.

Las investigaciones relacionadas con el pronóstico de la inflación han recibido mucha atención por
parte de los investigadores macroeconómicos. La mayoría de los bancos centrales utilizan la tasa de
inflación esperada como una variable clave al momento de determinar la política monetaria ya que
estos pronósticos pueden usarse de referencia con el objetivo de reducir y/o estabilizar el
crecimiento del nivel general de precios. Obtener un pronóstico preciso también es importante para
establecer políticas fiscales y la toma de decisiones al momento de invertir. Si la estimación de la
inflación se lleva a cabo con un método robusto, podrá ayudar a los gobiernos en la elaboración de
políticas económicas.

El pronóstico de la inflación generalmente se realiza utilizando datos de series de tiempo. Una serie
de tiempo es un conjunto de datos ordenados y equiespaciados en el tiempo. El análisis de series de
tiempo implica el desarrollo de modelos que capturen o mejor describan el proceso subyacente de
un conjunto de datos observados o, dicho de otra forma, encontrar patrones en los datos y
extrapolar hacia al futuro estos patrones haciendo pronósticos. Pronosticar es predecir el futuro

1
https://estadisticasbcra.com/inflacion_interanual_argentina
2
https://www.bcra.gob.ar/Pdfs/PublicacionesEstadisticas/REM220729%20Resultados%20web.pdf

4
utilizando datos históricos y/o el conocimiento de eventos futuros que podrían afectar nuestros
pronósticos.

Según varios estudios, la dinámica subyacente de la inflación puede capturarse utilizando modelos
univariados de series de tiempo, es decir, el comportamiento de una variable se puede estudiar con
su propia serie de datos pasados. En esta investigación, para pronosticar las tasas de inflación, el
método que se va a utilizar es el Promedio Móvil Integrado Autorregresivo Estacional (SARIMA) que
es una derivación del método ARIMA. Este modelo asume que los residuos del modelo son ruido
blanco y se distribuyen normalmente. La metodología aplicada con mayor frecuencia son los
modelos autorregresivos de promedio móvil integrado (ARIMA) en los que las series de tiempo no
estacionarias se transforman en estacionarias al diferenciarlas hasta un orden apropiado y luego
aplicar el modelo ARMA. Estos modelos también operan bajo el supuesto de varianza constante,
pero la mayoría de las series de tiempo económicas/financieras exhiben heteroscedasticidad
variable en el tiempo. Para capturar este fenómeno utilizaremos un modelo Heteroscedástico
Condicional Autorregresivo Generalizado (GARCH).

Este estudio tiene como objetivo determinar el mejor modelo SARIMA y GARCH para estimar la
inflación mensual de Argentina en los próximos 4 meses.

II. REVISIÓN DE LITERATURA

Numerosos estudios han investigados alternativos métodos para la estimación de la inflación en


distintos países. Entre ellos, varios han utilizado el modelo ARIMA para la estimación de inflación de
países desarrollados donde la volatilidad es relativamente estable. Mientras que, en investigaciones
realizadas en países en desarrollo, algunos autores han implementado, además de ARIMA, un
modelo GARCH para capturar la volatilidad de los residuales resultantes del modelo ARIMA.
Meyler, Kenny y Quinn (1998) utilizaron un modelo de promedio móvil integrado autorregresivo
(ARIMA) para pronosticar la inflación irlandesa. Los autores del paper utilizaron dos enfoques para
la identificación de posibles modelos ARIMA: el enfoque de Box Jenkins y funciones de penalización,
en este caso el Criterio de Información Bayesiano (BIC). Hacen énfasis en el performance de las
estimaciones, es decir, su enfoque es minimizar los errores de pronóstico fuera de la muestra (out-
of-sample) en vez en maximizar la "bondad de ajuste" dentro de la muestra (in-sample). Por lo
tanto, la forma de abordar el problema en su trabajo es uno de "minería de modelos" con el
objetivo de optimizar el rendimiento del pronóstico fuera de muestra.

5
Ling y Li (1997) consideran modelos de promedio móvil autorregresivos fraccionalmente integrados
con heterocedasticidad condicional, que combina el modelo heteroscedástico condicional
autorregresivo generalizado (GARCH) y el modelo fraccional (ARMA).
Wati, Eltivia y Djajanto (2021) en su estudio intentan determinar el mejor modelo de promedio
móvil integrado autorregresivo (ARIMA) para estimar la inflación mensual en Indonesia. El
resultado de esta investigación muestra que el modelo ARIMA (12,0,12) es el mejor modelo para
predecir la inflación mensual en el grupo de gastos de alimentos, bebidas, cigarrillos y tabacos en
Indonesia para el próximo período.
La investigación de Qasim, Ali, Malik y Liaquat (2021) tiene como objetivo construir un modelo
adecuado para la media y la varianza condicionales para pronosticar la tasa de inflación en Pakistán.
Los distintos modelos de promedios móviles integrados autorregresivos (ARIMA) y
heteroscedasticidad condicional autorregresiva generalizada (GARCH) han sido seleccionados según
los criterios AIC y BIC. Se ha comparado la capacidad de estimación y pronóstico de tres modelos
ARIMA con el modelo GARCH (2,2) para capturar la posible no linealidad presente en los datos. Para
representar el posible efecto asimétrico en la varianza condicional, se han aplicado dos modelos
GARCH asimétricos, EGARCH y TGARCH.
Salam, Salam y Feridun (2006) utilizan modelos promedios móviles integrados autorregresivos
(ARIMA) para pronosticar la inflación de Pakistán. En base al pronóstico dentro y fuera de la
muestra (in-sample y out-of-sample), concluyen que el modelo ARIMA tiene suficiente capacidad
predictiva y que los hallazgos están en línea con los de otros estudios.
Moffat y David (2016) utilizaron la metodología de Box y Jenkins para modelar la inflación en
Nigeria y llegaron a la conclusión que ARIMA (0,0,1) es el mejor modelo para predecir la tasa de
inflación en Nigeria.
Por último, Xiang (2022) utilizó un modelo de promedio móvil integrado autorregresivo (ARIMA) y
un modelo de heterocedasticidad condicional autorregresiva generalizada (GARCH) para analizar y
realizar estimaciones de los precios internacionales del petróleo. El estudio muestra que el modelo
combinado de ARIMA(1,1,0) - GARCH(1,1) es más adecuado para la previsión a corto plazo de los
precios internacionales del petróleo.

III. DATOS Y METODOLOGÍA

En esta investigación vamos a modelar y estimar varios modelos SARIMA y GARCH a partir de datos
mensuales de la inflación argentina proporcionados por el Banco Central de la República Argentina

6
(BCRA) que abarca el período desde enero-2020 hasta julio-2022 inclusive, y luego estimar los
valores de la inflación mensual para los próximos 4 meses, es decir hasta noviembre.

La primera fase consistirá en dividir la serie de tiempo en 2 partes iguales y luego aplicar
estadísticas descriptivas sobre ellas para describir las propiedades de nuestro conjunto de datos y
ver si hay variaciones en los números obtenidos. En el caso de que haya asimetría en los mismos, es
decir, que no tengan distribución simétrica/normal, aplicaremos el logaritmo sobre los datos luego
de sumar el valor 1 a toda la serie ya que hay valores negativos en la misma.

La segunda fase será graficar la totalidad de los datos para hacer una inspección visual y observar si
los mismos tienen algún tipo de tendencia, estacionalidad o ver si existen cambios bruscos en la
misma que indiquen variación de la varianza, en otras palabras, vamos a intentar corroborar de
forma visual si los datos son estacionarios o no lo son. Para formalizar la estacionariedad
aplicaremos el test de raíz unitaria “Augmented Dickey-Fuller”. En el caso que rechacemos la
hipótesis nula de que los datos tienen raíz unitaria, es decir que sean no estacionarios, aplicaremos
diferenciación simple para convertirlos en estacionarios.

La tercera fase consistirá en utilizar el procedimiento Box-Jenkins para encontrar los mejores
modelos SARIMA que describan el movimiento de la serie de inflación a través del tiempo. Ésta
metodología consiste de 3 pasos.

1) Identificación del modelo: El objetivo de esta etapa es acotar la cantidad de posibles


modelos ARIMA. Previamente se debe probar si la serie temporal es o no estacionaria.
Después de estacionario se procede a la determinación de los parámetros p y q de los
procesos ARMA en base a las funciones de autocorrelación (ACF) y autocorrelación parcial
(PACF). Este paso es el más importante.
2) Evaluación de los parámetros: Identificados los valores p y q del proceso ARMA, el siguiente
paso es estimar los coeficientes asociados con el término autorregresivo y el promedio
móvil. Los métodos de estimación son diferentes según el tipo de proceso diagnostico
utilizado. En general, se utilizan los métodos de máxima verosimilitud y de mínimos
cuadrados ordinarios, entre otros.
3) Validación: en esta última etapa se verifica que la especificación del modelo sea adecuada a
la dinámica de una variable aleatoria, cuyo comportamiento está siendo explicado por el
modelo. Una forma de lograr esta validación es mediante el análisis de los residuos y

7
corroborar que los mismos tengan un comportamiento como el del ruido blanco, es decir,
que los errores tengan una distribución normal con media cero, varianza constante y no
correlación entre ellos. Caso contrario significaría que el modelo no logró capturar la
dinámica de la serie de tiempo y que aún se puede mejorar. Algunos de las pruebas de
hipótesis que podemos encontrar en esta etapa son: de homocedasticidad (pruebas ARCH,
Breusch-Pagan), de autocorrelación para los residuos (pruebas de Ljunge-Box o función de
autocorrelación), de normalidad (Q-Q plot). Se utilizan criterios de información en la
selección entre diferentes modelos (AIC o BIC)

Este proceso es iterativo hasta determinar un modelo que describa las propiedades de la serie
temporal en cuestión. En esta investigación se utiliza la metodología Box-Jenkins para el modelo
SARIMA.

Una de las debilidades conocidas de la clase de modelos ARIMA es su incapacidad para capturar
el clustering (agrupamiento) de volatilidad que se observa en la mayoría de los activos
financieros. Es por ello que también utilizaremos el modelo GARCH junto con SARIMA para
capturar la heteroscedasticidad condicional, fenómeno causado cuando un aumento en la
volatilidad se correlaciona con un mayor aumento en la volatilidad. El modelo GARCH podría ser
considerado el un modelo ARMA pero aplicado a la varianza de una serie se tiempo.

Modelo ARIMA:

Los modelos ARIMA son la extensión de los modelos ARMA para superar el problema de las series
de tiempo no estacionarias al introducir los términos integrados en el modelo ( d). El modelo
resultante denotado por ARIMA (p, d, q) tiene la forma:

p d q d
Θ(L) Δ y t =Φ( L) Δ ϵ t

X t =α 1 d X t−1 +…+α p d X t− p + β 1 ϵ t −1+ β1 ϵ t −1 + β q ϵ t−q

En la elección de que valor asignar a p y a q, uno se puede ayudar observando el patrón de la


función de autocorrelación (ACF) y autocorrelación parcial (PACF) de la serie analizada.

Para AR(p) el PACF se corta después del retraso p. Para MA(q) el ACF se corta después del retraso q.

Modelo SARIMA:

8
Los modelos SARIMA tienen en cuenta la estacionalidad aplicando un modelo ARIMA a los rezagos
que son múltiplos de la estacionalidad. Una vez que se modela la estacionalidad, se aplica un
modelo ARIMA al sobrante para capturar la estructura no estacional. El modelo resultante
denotado por SARIMA (p, d, q)(P, D, Q, s) tiene la forma:

Θ(L) p (Ls )P Δ d Δ Ds y t=Φ ( L)q ∅ ( Ls)Q Δd Δ Ds ϵ t

Modelo ARCH:

Para capturar el comportamiento dinámico de la varianza, Engle (1982) sugirió el proceso de


heteroscedasticidad condicional autorregresiva (ARCH) que modela la varianza condicional como
una función de los residuos pasados (errores) de un proceso medio y se define como ARCH(q):

q
σ =α + ∑ α t ϵ t−i
2 2
t
i

Donde α > 0, α1 ≥ 0 para todos lo i = 1, 2, …, q. El hiperparámetro q es:

- q: número de errores residuales rezagados de un proceso medio

Modelo GARCH:

Bollerslev (1986) amplió el modelo de Engle al incorporar las varianzas condicionales pasadas en el
modelo ARCH. La forma del modelo GARCH (p, q) se presenta como:

q p
σ =α + ∑ α t ϵ
2
t
2
t−i + ∑ β j σ 2t − j
i i

Donde α > 0, α1 ≥ 0 para todos los i = 1, 2, …, q y βj ≥ 0 para todos los j = 1, 2, … j. Otra restricción es
que la suma de los coeficientes α t y β j sea menor a 1 sino el modelo es inestable. Los
hiperparámetros p y q son:

- p: número de varianzas rezagadas


- q: número de errores residuales rezagados de un proceso medio

Modelo ARIMA + GARCH:

p q
^y t =μ+ ∑ a i y t −i+ ∑ bi ϵ t−i +ϵ t
i i

9
q p
ϵ t =√ σ . z t ; σ =α +∑ α t ϵ
2
t
2
t
2
t−i + ∑ β j σ 2t− j
i i

Donde z t es el error estandarizado.

IV. RESULTADOS

Los datos analizados en este estudio corresponden a la inflación mensual de Argentina calculada a
partir del índice de precios al consumidor (IPC) que van desde enero del año 2000 hasta julio de
2022 inclusive. Los datos fueron obtenidos en la web del Banco Central de la República Argentina
(BCRA)3. La base datos contiene 271 observaciones mensuales, de las cuales 267 se utilizan para
entrenar los modelos SARIMA-GARCH y 4 observaciones para la evaluación de las predicciones.
Finalmente, se vuelve ajustar un modelo SARIMA-GARCH con la totalidad de las observaciones para
hacer una estimación de la tasa de inflación para los próximos 4 meses de agosto, septiembre,
octubre y noviembre del corriente año.
Siguiendo la metodología Box-Jenkins se han evaluado diversos modelos SARIMA de distintos
órdenes para modelar la media condicional. Con el motivo de modelar la varianza condicional,
también se han evaluado distintos modelos GARCH. Tanto la selección del modelo SARIMA como
GARCH se realiza en base al criterio de información de Akaike (AIC). Estos dos modelos serán
utilizados conjuntamente para hacer estimaciones de inflación en Argentina. Como métrica para la
evaluación de los pronósticos del modelo utilizaremos el error cuadrático medio (MSE) con
respecto a la serie original de inflación y al Relevamiento de Expectativas de Mercado (REM)
publicado mensualmente por el Banco Central de la República Argentina.
En primer lugar, al observar la figura 1 de la inflación mensual en Argentina, podemos observar que
la serie de tiempo presenta cambios de tendencia, particularmente en los períodos más recientes
en la que se aprecia una tendencia alcista. Otro punto a destacar a partir de esta primera
inspección visual es que los datos presentan una gran variabilidad a través del tiempo, es decir, no
parecieran tener una varianza constante. En el apéndice del documento se encuentra una
descomposición de la serie de tiempo por tendencia, estacionalidad y, luego de sustraídas ambas
de la serie original, se encuentran los residuales al pie del gráfico. En dicha imagen se observa
claramente la tendencia alcista de la inflación mensual como así también una estacionalidad anual,
cuya periodicidad debiera tener sentido ya que los datos son recolectados mensualmente. Otra
manera de cerciorarnos de ello es a través de una tabla de estadísticas descriptivas. En la tabla 1 se
3
http://www.bcra.gov.ar/PublicacionesEstadisticas/Principales_variables_datos.asp

10
observa que los datos agrupados en periodos equiespaciados no poseen estadísticas descriptivas
estables a través del tiempo, es decir, no son estacionarias.

Figura N° 1: Tasa de inflación mensual

Años Media Desviación Std. Mediana


2000-2005 0,7309 1,5813 0,40
2005-2011 0,7206 0,2560 0,70
2011-2016 1,3779 0,9403 1,00
2017-2022 3,2552 1,3888 3,10

Cuadro N° 1: Estadísticas descriptivas por periodos de la inflación mensual en Argentina

En pos de aplicar un modelo clase ARIMA necesitamos aplicar transformaciones en los datos
obtenidos para convertirlos en estacionarios. La primera transformación aplicada para estabilizar la
varianza de los datos ha sido aplicar el logaritmo sobre ellos luego de haber sumado el valor 1 ya
que hay algunas observaciones con valores negativos. Luego se realizó una diferenciación mensual
para convertirlos en estacionarios. Para asegurarnos que sea estacionaria post transformaciones, se
hizo una prueba de raíz unitaria de Augmented Dickey-Fuller (ADF). La hipótesis nula es que la serie
de tiempo posee raíz unitaria, y la hipótesis alternativa es que no posee raíz unitaria. Los resultados
son los siguientes:
ADF Statistic: -6.734799

Critical Values:
1%: -3.456
5%: -2.873

11
10%: -2.573
Rechazamos la hipótesis nula a un nivel de significancia del 1% de que la serie de tiempo tiene raíz
unitaria, esto significa que es estacionaria luego de aplicar las transformaciones.

Figura N° 2: Gráficos de tasa de inflación mensual logarítmica diferenciada, ACF y PACF

Luego de transformar la serie de tiempo a una estacionaria, procedemos a inferir los posibles
valores de p, q, P, D, Q y s a partir de la observación de los gráficos de autocorrelación y
autocorrelación parcial. Después procedemos a ajustar distintos modelos SARIMA a nuestros datos
con posibles combinaciones de p, q, P, D, Q y m, en otras palabras, probamos con diferentes
modelos incluyendo rezagos estacionales y distintos periodos para la estacionalidad. Como se
observa en la figura 2, podemos juzgar que los valores candidatos de p y q son hasta 2 rezagos
inclusive. En cuanto a los parámetros estacionales, tenemos como candidatos a los valores 8 y 12
meses para el parámetro s. El valor 8 se deduce solamente de los correlogramas y el valor 12,
además del correlograma, también por la periodicidad con la que se recolectan los datos y la
estacionalidad según la descomposición de la serie de tiempo. Para el parámetro P, D y Q iteramos

12
con valores desde el 0 hasta el 2 inclusive. Para tener un modelo parsimonioso y que no se sobre
ajuste a los datos in-sample establecimos una restricción de que la suma de los parámetros, sin
incluir s, tiene que ser menor o igual a 6. A continuación los resultados de los primeros 5 modelos
con menor AIC:

(p, d, q, P, D, Q, m) AIC
(1, 1, 1, 1, 0, 1, 12) 59,07687
(1, 1, 2, 1, 0, 1, 12) 60,16731
(2, 1, 1, 1, 0, 1, 12) 60,35159
(2, 1, 2, 0, 0, 1, 8) 60,55861
(1, 1, 1, 0, 0, 1, 8) 62,06657
Cuadro N° 2: Orden SARIMA y AIC
El modelo SARIMA (1, 1, 1) (1, 0, 1, 12) es el que tiene menor AIC y por ende lo elegimos para
modelar la media condicional de la tasa de inflación mensual de Argentina. El modelo tiene el
siguiente output:

Figura N° 3: Output SARIMA(1,1,1)(1,0,1,12)


Se puede observar que todos los coeficientes estimados son estadísticamente significativos para
explicar la serie de tiempo. Posteriormente procedemos a hacer un análisis de los residuales para
corroborar si tienen comportamiento al de ruido blanco, es decir, independientes e idénticamente
distribuidos con media 0, varianza constante y no correlacionados.

13
Figura N° 4: Análisis de residuales del modelo SARIMA(1,1,1)(1,0,1,12)

Los residuales parecieran ser ruido blanco excepto por la varianza de los residuales. Si bien los
residuales no están correlacionados entre sí, ello no significa que los mismos sean independientes;
sino que los mismos pueden presentar heteroscedasticidad condicional. Para corroborar si este
fenómeno se encuentra o no en los residuales del modelo ajustado, procedemos hacer una prueba
de Engle de Heterocedasticidad Condicional Autorregresiva (ARCH) y un correlograma de los
residuales al cuadrado. A continuación ambos resultados:
p-value for F test: 0,0

Figura N° 5: Correlograma de residuos al cuadrado

14
Rechazamos la hipótesis nula a un nivel de significancia del 5% de que los residuales al cuadrado no
están correlacionados, es decir los residuales al cuadrado son significantes y los mismos son
condicionalmente heteroscedásticos; ahora podemos continuar y construir el modelo SARIMA-
GARCH.
Para poder construir el modelo GARCH, utilizamos los residuales del modelo SARIMA previamente
seleccionado e iteramos sobre distintos modelos. Los resultados para algunos modelos se muestran
en la siguiente tabla:

(p, o, q) AIC
(1, 0, 2) -92,751
(1, 0, 1) -91,7201
(2, 0, 2) -90,751
(2, 0, 1) -89,7201
(2, 0, 0) -47,9208
Cuadro N° 3: Orden GARCH y AIC
Dado que la diferencia en el criterio de información de Akaike entre el modelo GARCH(1,0,2) y
GARCH(1,0,1) es pequeña, para preservar el modelo lo más simple posible, nos quedaremos con el
segundo modelo. La salida del modelo es el siguiente:

Figura N° 6: Output GARCH(1,0,1)


A partir del output del comando podemos decir que solamente el coeficiente beta es
estadísticamente significativo para modelar la heteroscedasticidad condicional de los residuales.
Para probar la validez del modelo, podemos inspeccionar si los residuos estandarizados y los
residuos estandarizados al cuadrado muestran o no autocorrelación serial.

15
Figura N° 7: Correlograma residuales GARCH
Con un nivel de significancia del 1% podemos decir que los residuos estandarizados y residuos
estandarizados al cuadrado no presentan autocorrelación serial. Si bien no se muestran los
resultados en el trabajo, es importante remarcar que los residuos estandarizados al cuadrado si
presentan autocorrelación a un nivel de significancia del 5%.
Para finalizar, compararemos las estimaciones del modelo SARIMA y SARIMA-GARCH de la tasa de
inflación desde Abril hasta Julio de 2022 contra la serie original de datos de inflación y las
estimaciones publicadas en el Relevamiento de Expectativas de Mercado. También haremos una
inspección del ajuste de las estimaciones dentro de la muestra (in-sample) de ambos modelos.

  Valor Actual SARIMA SARIMA SE SARIMA-GARCH SARIMA-GARCH SE


abr-22 6,0 5,27 0,5305 5,08 0,8493
may-22 5,1 4,36 0,5449 4,19 0,8197
jun-22 5,3 4,20 1,2191 4,03 1,6110
jul-22 7,4 3,85 12,6045 3,69 13,7459
MSE     3,7248   4,2565
Cuadro N° 4: MSE Serie Original

16
  Valor REM SARIMA SARIMA SE SARIMA-GARCH SARIMA-GARCH SE
abr-22 4,3 5,27 0,9441 5,08 0,6059
may-22 3,8 4,36 0,3156 4,19 0,1557
jun-22 3,8 4,20 0,1567 4,03 0,0532
jul-22 3,7 3,85 0,0224 3,69 0,0001
MSE     0,3597   0,2037
Cuadro N° 5: MSE REM

Los resultados del cuadro 4 y 5 son contradictorios. En el primero se muestra que el error
cuadrático medio es menor para el modelo SARIMA al momento de hacer extrapolar estimaciones,
mientras que en el último cuadro se puede apreciar que los pronósticos del modelo SARIMA-GARCH
se encuentran más cercanos a la mediana de los pronósticos macroeconómicos de corto y mediano
plazo que recopila el BCRA de personas especializadas, locales y extranjeras, sobre la evolución de
variables seleccionadas de la economía argentina, es este caso la tasa de inflación basada en el IPC.
Quizá en esta ocasión el MSE de las estimaciones de SARIMA fueron menores por casualidad o
simplemente quizá tiene mejor predictivo en el periodo de tiempo analizado, pero al ser la inflación
una variable tan compleja (ya que es influida por múltiples factores) nos quedaremos con el modelo
SARIMA-GARCH que se asemeja más a los pronósticos realizados por especialistas en el tema;
además captura la heteroscedasticidad condicional de los residuales del modelo SARIMA. Para
agregar otro fundamento vemos en la figura 8 y 9 que el modelo SARIMA-GARCH se ajusta mejor a
los datos in-sample en periodos de volatilidad de la variable analizada, es decir, mejora la precisión
de la predicción dentro de la muestra. Posiblemente, el modelo SARIMA-GARCH captura mejor
factores complejos por los que puede verse afectada la tasa de inflación en Argentina. Por último,
comparamos el error cuadrático medio de las estimaciones dentro de la muestra (in-sample) de
SARIMA-GARCH y SARIMA y corroboramos que la métrica del primer modelo es menor.

  SARIMA SARIMA-GARCH
MSE in-sample 0,6185 0,3111
Cuadro N° 6: MSE in-sample

17
Figura N° 8: Serie original vs estimaciones SARIMA-GARCH

Figura N° 9: Serie original vs estimaciones SARIMA


En el siguiente cuadro hacemos las estimaciones para los meses de agosto, septiembre, octubre y
noviembre:

  SARIMA-GARCH
ago-22 6,0
sep-22 6,6
oct-22 5,4
nov-22 4,6
Cuadro N° 7: Estimaciones próximos períodos

V. CONCLUSIÓN

El objetivo de este estudio es determinar las características estadísticas que caracterizan a los datos
de inflación en Argentina, y posteriormente modelarlas para poder hacer estimaciones de la serie
de tiempo analizada. Para modelar la media condicional, se utiliza la metodología de Box-Jenkins, es
por ello que hemos estimado diversos modelos SARIMA para identificar aquel que mejor se ajusta a
nuestros datos, imponiendo una restricción sobre los parámetros para no sobre ajustar los
modelos. Las herramientas estadísticas utilizadas para identificar los modelos son las funciones de
autocorrelación (ACF) y autocorrelación parcial (PACF) de los residuos de los modelos estimados. El
modelo con menor AIC (entre todos los posible candidatos) es el SARIMA(1,1,1)(1,0,1,12). Para

18
modelar la varianza condicional se aplicaron pruebas de heterocedasticidad condicional
autorregresiva (ARCH), y luego de comprobado de que la misma se encuentra presente en los
residuos al cuadrado del modelo SARIMA, se procedió a iterar sobre varios modelos GARCH hasta
de orden 2 inclusive. El modelo con el que nos quedamos fue GARCH(1,1) ya que la diferencia con
el modelo con menor AIC es pequeña e intentamos mantener los modelos lo más simples posibles.

Para evaluar la capacidad predictiva y terminar de decidirnos si nos quedamos con un modelo
SARIMA o SARIMA-GARCH, comparamos los errores cuadráticos medios de las estimaciones contra
la serie original y también contra la mediana de las estimaciones recolectadas por el BCRA en su
informe mensual de Relevamiento de Expectativas de Mercado (REM). Si bien las estimaciones out-
of-sample son mejor en el modelo SARIMA, decidimos quedarnos con el modelo SARIMA-GARCH ya
que se asemeja más a las estimaciones de especialistas en el tema y que seguramente tienen en
cuenta más factores que la misma serie de inflación al momento de hacer extrapolaciones. Que los
pronósticos de la inflación mensual que realizan personas especializadas de manera habitual no
vayan en línea con la serie original demuestra la complejidad de hacer extrapolaciones de la tasa de
inflación mensual en Argentina.

Por último, otra razón por la que nos hemos quedado con la combinación SARIMA-GARCH es que
hemos comprobado que existe heterocedasticidad condicional regresiva en la serie de tiempo
analizada, en otras palabras, hay clustering de varianza en distintos periodos que un modelo
SARIMA no es capaz de capturar. Esto se corrobora en la comparación de los errores cuadráticos
medios in-sample de ambos modelos, y a su vez demuestra que un modelo de media condicional
junto con uno de varianza condicional captura mejor este fenómeno económico que se suele dar en
países en desarrollo donde la variable económica en cuestión es más volátil que en países con tasas
de inflación más estables. Esto concuerda con la bibliografía analizada.

REFERENCIAS:

1- Jongrim Ha, M. Ayhan Kose, Franziska Ohnsorge (2019). Inflation in Emerging Inflation in
Emerging and Developing Economies and Developing Economies. World Bank Publications.
2- Qasim, T. B., Ali, Hina., Malik, Natasha. and Liaquat, Malika. (2021) Forecasting Inflation Applying
ARIMA Model with GARCH Innovation: The Case of Pakistan’, Journal of Accounting and Finance
in Emerging Economies, 7(2), pp. 305–316. doi: 10.26710/jafee.v7i2.1681.

19
3- Y. Xiang (2022). U sing ARIMA-GARCH Model to Analyze Fluctuation Law of International Oil
Price. Changzhou Vocational Institute of Mechatronic Technology. Article ID 3936414.
doi.org/10.1155/2022/3936414.
4- D. A. Wati, N. Eltivia, L. Djajanto (2021). Inflation Forecasting by Commodity Using the
Autoreggressive Integrated Moving Average (ARIMA) Method. Business and Economic
Conference (AMBEC 2020), Politeknik Negeri Malang. doi:10.2991/aebmr.k.210717.045.
5- Salam, M., Ferudin M., 2006.”Forecasting inflation in developing nations: The case of Pakistan”,
International Research Journal of Finance and Economics, No.3, pp.138-159.
6- Merabet, F., Zeghdoudi, H., Yahia, R. H., and Saba, I. (2021). Modelling of Oil Price Volatility
using ARIMA-GARCH Models. Adv. Mathematics. 10. 2361–2380. doi: 10.37418/amsj.10.5.6
7- Meyler, A, G. Kenny and T. Quinn (1998) "Forecasting Irish Inflation using ARIMA models",
Central Bank of Ireland Technical Paper 3/RT/98, December.
8- E. Lewinson (2020). Python for Finance Cookbook: Over 50 recipes for applying modern Python
libraries to financial data analysis. Packt.
9- M. Peixeiro (2022). Time Series Forecasting in Pyhton. Manning.

20
APENDICE:

Figura N° 10: Descomposición de la serie de tiempo de inflación

Figura N° 11: Estacionalidad de la tasa de inflación mensual (Oct-Oct)

21
Figura N° 12: Diagramas de caja-bigote de la inflación por año

Figura N° 13: Volatilidad inflación vs. volatilidad modelada

22
Proceso Iterativo para selección de modelo clase ARIMA:

Juntar información

No
Es estacionaria? Aplicar transformaciones

Si

Establecer “d” igual a la


cantidad de veces que fue
diferenciada la serie

Lista de posibles valores “p”


y “q”

Ajustar cada combinación


posible de ARIMA(p, d, q)

Seleccionar el modelo con


menor AIC

No No

Análisis de residuos

Hay distribución normal de Residuos no


los residuos en el Q-Q plot? correlacionados?
El procedimiento explicado se ajusta
para tener en cuenta los parámetros
Si P, D, Q y m del modelo SARIMA.

Modelado terminado

23

También podría gustarte