Está en la página 1de 16

Universidad Católica Andrés Bello

Facultad de Ciencias Económicas y Sociales

Escuela de Economía

Econometría I

Profesor Sandy Oliveros

Trabajo final: Modelos estocásticos de series de tiempo

(ARIMA)

Estudiantes:

Héctor Hernández Cl: 26.747.950

María Francia Volcanes Cl: 27.028.108

Caracas, 18 de enero de 2020


INDICE

Pág.

Introducciòn……………………………………………………………………………… 3

Metodología de Box-Jenkins ………………………………………………………….. 4

Conclusiones………………………………………………………………………….. 15

Bibliografìa…………………………………………………………………………….. 16

2
Introducción

Las series temporales son una sucesión ordenada de observaciones que están asociadas a un
momento en el tiempo. En el caso de economía, se utiliza para estudiar el comportamiento de una
variable económica y su equilibrio o no a largo plazo. Los objetivos que se pretender alcanzar a
través de la generación de series de tiempo suelen ser varios, dentro de los cuales se destacan:

a) Analizar las características de la serie de acuerdo al interés u objeto de estudio. Suele


hacerse por medio de los estadísticos como la media, varianza, covarianza y correlación
de coeficientes.
b) Para predecir los valores futuros, lo cual es muy importante para el desarrollo actual de
estudios económicos.

Este trabajo permitió analizar las observaciones del PIB per cápita de Canadá. Este último se
ha caracterizado por ser un buen indicador de nivel de vida a nivel global. Por ello, se procedió a
buscar los datos de esta variable de interés para llevar a cabo la Metodología de Box-Jenkis:

1) Identificación del modelo.


2) Estimación de este mismo.
3) Validación de los resultados obtenidos.
4) Predicción.

Cada uno de estos fue desarrollado a lo largo del trabajo y se explica a detalle en que consistió
cada uno de ellos. Así como, el análisis de los resultados y recomendaciones a partir de estos.

Por último, es importante mencionar la aplicabilidad de los métodos ARIMA, denominados


autocorrelación de los coeficientes que explica el grado de asociación de las distintas
observaciones separadas tantos rezagos tenga la misma. Además, permite brindar el mayor
apoyo para construir el mejor modelo apropiado para los datos escogidos.

3
Metodología de Box-Jenkins: Consiste en estudiar los procesos autoregresivos integrados de
media móvil (ARIMA). Su objetivo principal es derivar modelos que puedan generar la
suficientemente información para describir el comportamiento pasado de una serie cronológica.

Para la aplicación de ARIMA en el modelo estocástico, se requiere tener un mínimo de 50


observaciones o 100 en el caso de series estacionales. En el presente trabajo, la variable escogida
que mejor se ajusta para al comportamiento de la serie es el Producto Interno Bruto per cápita de
Canadá anual (datos suministrados “DataMacro”) , para el período de 1870 a 2018 expresado en
dólares estadounidenses (US$).

Aplicación de la metodología:

1) Identificación del modelo:

¿La serie es estacionaria o no?: Este paso consiste en saber si la serie presenta
estacionariedad; en caso contrario, para transformarla se deberá llevar al proceso de
diferenciación para poder eliminar la tendencia o en su defecto, aplicar logaritmo para la
disminución de la varianza.

En este caso, se procedió a graficar el PIB per cápita de Canadá en las ordenadas y el
tiempo en las abscisas para evaluar este primer punto:

PIB per capita Canada

50,000

40,000

30,000

20,000

10,000

0
1875 1900 1925 1950 1975 2000

Gráfico 1.1
Fuente: Eviews 4.1

4
Dado el Gráfico 1.1, se evidencia la presencia de tendencia (crece con los años) en la serie puesto que,
exhiben desviaciones en la media a medida que transcurren los años de 1870 a 2018. Por otro lado, no se
observan grandes cambios en el segundo momento de la serie (varianza). Según lo anterior, se puede
sospechar que dicha serie es no estacionaria en el primer momento (media).

Por otro lado, cabe destacar que hay una caída del PIB per cápita en este país en el año 1997. Así como
el aumento de la media en la serie a partir de los años siguientes, lo que confirma una clara tendencia en
estos años.

Test de Dickey- Fuller: Se procedió a realizar este test para confirmar la sospecha de no estacionaridad, a
través de la presencia de raíz unitaria en la serie. Por lo que, se plantea la siguiente hipótesis:

Hipótesis nula (Ho) Hipótesis alternativa (H1)


δ= 0 (p=1 La serie tiene raíz unitaria, es no p <1 (La serie no tiene raíz unitaria, es
estacionaria) estacionaria)

Null Hypothesis: PIBCN has a unit root


Exogenous: Constant
Lag Length: 1 (Automatic - based on SIC, maxlag=13)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic 1.847113 0.9998


Test critical values: 1% level -3.475184
5% level -2.881123
10% level -2.577291

*MacKinnon (1996) one-sided p-values.


Fuente: Eviews 4.1

Dado que p -valor > α , hay elementos suficientes para no rechazar la Ho. Por lo que, se concluye que
la serie presenta raíz unitaria, es decir, no es estacionaria. A continuación, se procedió a realizar otro test
para la confirmación de lo que indica el Dickey- Fuller:

Test de Phillips-Perrón: Consiste en la modificación no paramétrica del test anteriormente planteado,


basándose en la corrección de robustez en el caso que se presente correlación serial y la varianza aumente
a medida que transcurre los años.

Hipótesis nula (Ho) Hipótesis alternativa (H1)


p=1 La serie tiene raíz unitaria, es no p <1 La serie no tiene raíz unitaria, es
estacionaria estacionaria

5
Null Hypothesis: PIBCN has a unit root
Exogenous: Constant
Bandwidth: 0 (Newey-West automatic) using Bartlett kernel

Adj. t-Stat Prob.*

Phillips-Perron test statistic 3.222213 1.0000


Test critical values: 1% level -3.474874
5% level -2.880987
10% level -2.577219

*MacKinnon (1996) one-sided p-values.


Fuente: Eviews 4.1

Dado que p -valor > α, no se rechaza la Ho. Por ello, se vuelve a confirmar que la serie seleccionada
presenta no estacionariedad a nivel.

Seguidamente, como la serie tiene raíz unitaria se debe aplicar la primera diferencia a la variable
aleatoria para corregir el problema de no estacionariedad en media. Una vez realizado lo anterior, se
procedió a aplicar de nuevo los test correspondientes:

Test de Dickey-Fuller: Primera diferenciación

Null Hypothesis: D(PIBCN) has a unit root


Exogenous: Constant
Lag Length: 0 (Automatic - based on SIC, maxlag=13)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -7.774569 0.0000


Test critical values: 1% level -3.475184
5% level -2.881123
10% level -2.577291

*MacKinnon (1996) one-sided p-values.

Fuente: Eviews 4.1

Test de Phillips-Perron: Primera diferenciación

Null Hypothesis: D(PIBCN) has a unit root


Exogenous: Constant
Bandwidth: 5 (Newey-West automatic) using Bartlett kernel

Adj. t-Stat Prob.*

Phillips-Perron test statistic -7.721588 0.0000


Test critical values: 1% level -3.475184
5% level -2.881123
10% level -2.577291

*MacKinnon (1996) one-sided p-values.

6
Fuente: Eviews 4.1

Aplicando la primera diferencia a la variable aleatoria se corrigió el problema de no estacionariedad.


Así lo confirma cada uno de los test, dado que el p valor < α se rechaza la hipótesis nula de la presencia de
raíz unitaria, es decir, la serie es estacionaria en su media.

¿La serie presenta estacionalidad o no?: Recordando que la estacionalidad es la presencia


de patrones que se manifiesta periódicamente en la serie. En este caso, no se evidencia la
estacionalidad en los periodos escogidos del PIB per cápita de Canadá, sino la
periodicidad anual de la misma.

La forma del modelo y orden del proceso: Para hallar la forma del modelo es necesario
analizar los correlogramas de FAC (correlación simple) y FACP (correlación parcial). En
el caso del orden del proceso, se deben contar los coeficientes de correlación
significativos y por consiguiente, proponer un modelo.

Correlograma de la serie original:

Correlograma 1.1
Fuente: Eviews 4.1

7
De acuerdo al Correlograma 1.1, se puede evidenciar que la variable aleatoria (PIBCN) en la función de
autocorrelación simple (FAC) decrece de forma muy lenta para llegar a cero, debido a que se manifiesta
raíz unitaria en la serie. Lo que comprueba que la serie no es estacionaria en media, porque presenta
tendencia con medias diferentes.

Correlograma de la serie diferenciada:

Correlograma 1.2
Fuente: Eviews 4.1

Al aplicar la primera diferencia D(PIBCN) para corregir el problema de no estacionariedad en la


media. Una vez aplicada, en el Correlograma 1.2 se puede observar que FAC (autocorrelación simple) cae
rápidamente a cero y FACP (autocorrelación parcial) tiene cambios abruptos a lo largo de la serie. Por
ello, se puede afirmar que la serie de la variable aleatoria diferenciada una sola vez I(1), presenta un
proceso autoregresivo (AR) y no de media móvil (MA). Se concluye que se está en presencia de una serie
estacionaria en media, es decir que, fluctúa alrededor de una media constante a medida que se incrementan
los años.

8
Basándose en lo anterior, el correlograma muestral decrece rápidamente en FAC y la primera barra
para esta función pasa “las bandas de Barlet”, es decir, que existe a priori autocorrelación simple y es
estadísticamente significativo el coeficiente de correlación del primer rezago AR(1) (proceso
autoregresivo de primer orden). Seguidamente, es importante recordar que esta serie es de orden 1 d=1
para lograr la estacionariedad. Por último, el FACP tiene un salto significativo y se confirma
autocorrelación parcial en el primer rezago, lo que quiere decir que no se manifiesta un orden en el
proceso de media móvil MA(0)

Así pues, la serie estacionaria del PIB per cápita de Canadá de los años 1870 a 2018:

a) D(PIBCN) ∼ AR(1) b) D(PIBCN) ∼ MA(0) c) D(PIBCN) ∼ ARIMA(1,1,0)

2) Estimación del modelo: Esta etapa consiste en estimar los parámetros desconocidos de este
modelo: β (α, ϴ1, ϴ2…. ϴp) . Estos pueden ser hallados a través de Mínimos Cuadrados Ordinarios
(MCO) dado que se está en presencia de un AR(1).

Por ello, un modelo D(PIBCN) ∼ ARIMA(1,1,0) se puede escribir de la siguiente


manera:

Dependent Variable: D(PIBCN)


Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 01/17/20 Time: 17:34
Sample: 1871 2018
Included observations: 148
Convergence achieved after 16 iterations
Coefficient covariance computed using outer product of gradients

Variable Coefficient Std. Error t-Statistic Prob.

C 277.3089 71.57015 3.874645 0.0002


AR(1) 0.409433 0.057013 7.181433 0.0000
SIGMASQ 237873.8 21687.34 10.96832 0.0000

R-squared 0.169750 Mean dependent var 278.4595


Adjusted R-squared 0.158299 S.D. dependent var 537.0826
S.E. of regression 492.7426 Akaike info criterion 15.25915
Sum squared resid 35205317 Schwarz criterion 15.31991
Log likelihood -1126.177 Hannan-Quinn criter. 15.28384
F-statistic 14.82312 Durbin-Watson stat 1.985840
Prob(F-statistic) 0.000001

Inverted AR Roots .41

Fuente: Eviews 4.1

9
Así pues, se puede concluir que el modelo sí presenta AR(1) dado que sí hay autocorrelación simple en
el coeficiente del primer rezago y es estadísticamente significativo (p valor < α). También se comprueba
que el intersecto es estadísticamente significativo.

A manera de reconfirmar que el modelo D(PIBCN) ∼ ARIMA(1,1,0) es el que mejor se adapta para
esta serie temporal:

Dependent Variable: D(PIBCN)


Method: ARMA Maximum Likelihood (OPG - BHHH)
Date: 01/17/20 Time: 17:29
Sample: 1871 2018
Included observations: 148
Convergence achieved after 16 iterations
Coefficient covariance computed using outer product of gradients

Variable Coefficient Std. Error t-Statistic Prob.

C 277.3867 71.67327 3.870155 0.0002


AR(1) 0.390454 0.186366 2.095088 0.0379
MA(1) 0.022852 0.204182 0.111921 0.9110
SIGMASQ 237851.0 21814.99 10.90310 0.0000

R-squared 0.169830 Mean dependent var 278.4595


Adjusted R-squared 0.152534 S.D. dependent var 537.0826
S.E. of regression 494.4269 Akaike info criterion 15.27257
Sum squared resid 35201948 Schwarz criterion 15.35358
Log likelihood -1126.170 Hannan-Quinn criter. 15.30548
F-statistic 9.819461 Durbin-Watson stat 1.993803
Prob(F-statistic) 0.000006

Inverted AR Roots .39


Inverted MA Roots -.02

Fuente: Eviews 4.1

Efectivamente, la incorporación de la media móvil MA(1) para este modelo no es estadísticamente


significativa. Por lo que, el proceso ARIMA(1,1,0) es el que mejor se adapta para el Correlograma 1.2 de
la primera diferencia I(1) de la variable aleatoria.

3) Validación del modelo: Consiste en la evaluación del modelo estimado para las observaciones.
Para ello, se debe tener en cuenta:

Si los residuos del modelo tienen un comportamiento de media cero, varianza constante y
autocorrelaciones nulas , es decir, si son de ruido blanco:

10
a) Comprobación de que la media de los residuos es igual a cero a lo largo del tiempo y si los valores
oscilan alrededor de este valor:

Hipótesis nula (Ho) Hipótesis alternativa (H1)


E(µ)=0 La media de los residuos es constante a E(µ)≠0 La media de los residuos no es
lo largo del tiempo constante a lo largo del tiempo

Correlograma de residuos:

Correlograma 1.3
Fuente: Eviews 4.1

Dado el Correlograma 1.3 todos los residuos presentan un p-valor > α, entonces, no hay elementos
suficientes para rechazar la Ho, entonces, los valores oscilan alrededor de una media constante. También
es importante mencionar, la ausencia de correlación serial dado que estos residuos son de ruido blanco,
los valores de FAC y FACP son prácticamente nulos para cada uno de los rezagos.

11
Regresión de residuos contra valores retardados de ellos mismos, con el objetivo de
determinar la significancia de los parámetros:

Hipótesis nula (Ho) Hipótesis alternativa (H1)


Los parámetros son estadísticamente no Los parámetros son estadísticamente
significativos (no existe relación significativa significativos ( existe relación significativa
entre los términos de error y sus rezagos) entre los términos de error y sus rezagos)

Regresión de los residuos vs residuos(-1):

Dependent Variable: RESIDUOS


Method: Least Squares
Date: 01/17/20 Time: 18:00
Sample (adjusted): 1872 2018
Included observations: 147 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

C 1.676498 40.62484 0.041268 0.9671


RESIDUOS(-1) 0.006711 0.083013 0.080847 0.9357

R-squared 0.000045 Mean dependent var 1.680858


Adjusted R-squared -0.006851 S.D. dependent var 490.8709
S.E. of regression 492.5496 Akaike info criterion 15.25058
Sum squared resid 35177734 Schwarz criterion 15.29127
Log likelihood -1118.918 Hannan-Quinn criter. 15.26711
F-statistic 0.006536 Durbin-Watson stat 2.000249
Prob(F-statistic) 0.935675

Fuente: Eviews 4.1

El parámetro tiene un p-valor >α (no se rechaza Ho) por lo que, no existe una relación significativa
entre los términos de error y sus valores rezagados un periodo. Por ello, se sigue afirmando que el modelo
no sigue un proceso de media móvil en su primer rezago MA(0). Es importante destacar, los estadísticos
Akaike y Schwarz que se analizaron más adelante.

Test Q de Ljiung-Box: Utilizado para muestras pequeñas, permite saber si existe


autocorrelación conjunta.

Hipótesis nula (Ho) Hipótesis alternativa (H1)


No existe correlación de orden j (conjunta) Existe correlación de orden j (conjunta)

12
k 2
QLB= T(T+2)   /(T  j )
j
j 1

El Correlograma 1.3 indica conjuntamente con el estadístico Ljiung-Box. En este mismo, se observa
que todos los p-valor son superiores al nivel de significación de 0,05, es decir, no hay elementos
suficientes para rechazar la hipótesis nula de no autocorrelación conjunta.

Prueba de sobre-ajuste:

Se estimó los siguientes procesos ARIMA(1,1,1) , ARIMA(0,1,1) , ARIMA(2,1,1) y ARIMA(1,1,2)


para corroborar la significación de los coeficientes introducidos anteriormente.

Para evaluar cada uno de los procesos, se tomó en cuenta el nivel de significación de los parámetros y
los criterios de los estadísticos Akaike (AIC) y Schwarz (BIC):

 El primer modelo ARIMA(1,1,1), el parámetro que acompaña a MA(1) no es estadísticamente


significativo y no mejora el valor de los criterios de información.

 Seguidamente, el modelo ARIMA(0,1,1) confirma que la serie puede tener una media móvil de
orden uno MA(1). Sin embargo, no mejora el valor de los criterios de información, por lo cual se
descarta dicho modelo.

 Para el modelo ARIMA(2,1,1), el parámetro que acompaña AR(2) no es estadísticamente


significativo y a pesar, que el parámetro para MA(1) es estadísticamente significativo no mejora
el valor de los criterios de información.

 Por último, para el proceso ARIMA(1,1,2) se comprueba que el parámetro de AR(1) es


estadísticamente significativa, pero no lo es para el parámetro MA(2). De acuerdo a lo anterior,
esto no ayuda a mejorar los de información valores.

Tabla 1.1
Modelo ARIMA(1,1,1) ARIMA(1,1,0) ARIMA(0,1,1) ARIMA(2,1,1) ARIMA(1,1,2)
ARIMA
Akaike info. 15.27257 15.25915 15.28126 15.27240 15.27266
criterion
Schwarz 15.35358 15.31991 15.34202 15.35340 15.35367
criterion
Fuente: Elaboración propia

13
Una vez expuesto lo anterior, se reafirma que el mejor modelo que explica la serie temporal de la
variable aleatoria es ARIMA(1,1,0). Debido a que, el parámetro autoregresivo de orden 1 es
estadísticamente significativo AR(1). Por otro lado, este modelo posee los valores más bajos de los
criterios de Akaike y Schwarz.

Por último se procede a demostrar la salida generada por Eviews (Procs/Seasonal


Adjustment/Tramo/Seats/) que confirma una vez más, el mejor modelo al cual se debe
ajustar es ARIMA(1,1,0).

MODEL FINALLY CHOSEN:


(1,1,0)

WITH MEAN

OUTLIERS

140 TC ( 1 2009)
113 TC ( 1 1982)

METHOD OF ESTIMATION: EXACT MAXIMUM LIKELIHOOD

PARAMETER ESTIMATE STD ERROR T RATIO LAG

AR1 1 -.48828 0.71734E-01 -6.81 1

REGULAR AR INVERSE ROOTS ARE


NO. REAL P. IMAG.P. MODULUS ARGUMENT PERIOD
1 0.48828 0.0000 0.48828 0.0000 -

CORRELATIONS OF THE ESTIMATES

1.0000

AIC
2217.8702

BIC
12.2269

4) Predicción: El objetivo es poder tener las predicciones más óptimas y generar el conjunto de
información para describir el comportamiento a largo plazo de la variable aleatoria. Es importante
distinguir para la predicción, un intervalo que permitirá la proyección de intervalos que generará
dicha predicción. Sin embargo, no se realizó este último paso de la metodología descrita a lo largo
del trabajo.

14
Conclusiones

Este trabajo consistió en un modelo de serie de tiempo univariante, es decir, solo se


analizó una serie temporal en función de su propio pasado. En el análisis es importante
utilizar los procesos estocásticos para determinar cuál proceso ha sido capaz de generar
dicha serie temporal, con el objetivo de describir el comportamiento de dicha serie y
predecir el futuro.

Dicho lo anterior, este proceso estocástico es importante que sea estable para poder
predecir, lo que se denomina como estacionariedad de estos procesos. En este caso, las
observaciones del PIB per cápita de Canadá y la serie de tiempo que fue escogida para
analizar no presenta condiciones de estacionariedad, lo que limitaba su análisis y la
predicción de la misma. Por ello, se consideró realizar las correcciones necesarias para
volver al principio de estacionariedad y parsimonia I(1).

Se analizaron cada uno de los correlogramas, reafirmando que el modelo que mejor se
adapta es un ARIMA (1,1,0). Dada la significancia relevante que recibió el parámetro
AR(1), se puede concluir que el modelo persigue un proceso autoregresivo de primer
orden. Además de que este modelo al lado de los demás, da los valores más bajos de
Akaike y Schwarz.

Seguidamente, se confirmó que los residuos no dependen de sus procesos regresivos.


Asimismo, se manifestó que estos se distribuyen con una media consta media que oscila a
cero y una varianza constante, lo que se conoce como ruido blanco.

Por último, aunque no se profundizó en la predicción de la variable aleatoria se puede


concluir que el modelo ARIMA(1,1,0) es el que mejor describe la serie y por
consiguiente, permitirá la mejor predicción a largo plazo de la misma.

15
Bibliografía

Datosmacro (2020). Datos Canadá. Recuperado el 15 de enero 2020.


https://www.rug.nl/ggdc/historicaldevelopment/maddison/

16

También podría gustarte