Está en la página 1de 27

LA METODOLOGIA

BOX-JENKINS
MODELOS ARIMA
METODOLOGIA BOX-
JENKINS

Esta metodología es diferente a la mayoría de los métodos para generar


pronósticos porque no supone ningún patrón en particular en los datos
históricos de las series que se van a pronosticar. Se fundamenta en un
enfoque iterativo para identificar un modelo posible a partir de una
clase general de modelos. Luego, el modelo seleccionado se coteja
con los datos históricos para ver si describe los datos con exactitud.
METODOLOGIA BOX-
JENKINS

El modelo está bien ajustado si los residuos son


generalmente pequeños, están distribuidos
aleatoriamente. Si el modelo especificado no es
satisfactorio, el proceso se repite usando un nuevo
modelo diseñado para mejorar el original y se repite hasta
que se encuentra un modelo satisfactorio y en ese
momento el modelo se considera útil para pronosticar.
DIAGRAMA DE FLUJO

Postular una clase general de modelo

Identificar el modelo que se considera


tentativamente

Estimar los parámetros en el modelo


considerado tentativamente

Diagnosticar el modelo
(¿El modelo es adecuado?)
No Si

Usar el modelo para pronosticar


ESTRATEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL
MODELO

 IDENTIFICACION DEL MODELO


El primer paso consiste en determinar si la serie es estacionaria, es
decir, si la serie de tiempo parece variar alrededor de un nivel
fijo. Es útil observar una gráfica de la serie junto con la función
de autocorrelación de la muestra. Se recomienda una serie de
tiempo estacionaria si la serie parece crecer o declinar en el
tiempo y las autocorrelaciones de la muestra no se desvanecen
rápidamente.
ESTARTEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL MODELO

 Una vez se haya obtenido una serie estacionaria, el


analista debe identificar la forma del modelo que utilizará.
la identificación de la forma del modelo se lleva a cabo
comparando las autocorrelaciones y las autocorrelaciones
parciales calculadas con los datos de las autocorrelaciones
y autocorrelaciones parciales teóricas de los diferentes
modelos ARIMA.
ESTRATEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL MODELO

 ESTIMACION DEL MODELO


Una vez que se ha seleccionado un modelo tentativo, se
deben estimar los parámetros de ese modelo.
Los parámetros de los modelos ARIMA se estiman
minimizando la suma de cuadrados de los errores de
ajuste. Estos deben obtenerse, en general, usando un
procedimiento no lineal de mínimos cuadrados
ESTRATEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL MODELO

 VERIFICACION DEL MODELO


Antes de utilizarse el modelo debe verificarse qué tan adecuado
es. En esencia es verificar que los residuos son aleatorios.
1. Muchas de las gráficas residuales en el análisis de regresión, se
pueden desarrollar para los residuos de un modelo ARIMA. Un
histograma y una gráfica de probabilidad normal
ESTRATEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL MODELO

2. Las autocorrelaciones residuales individuales deben ser pequeñas y


generalmente
de cero
3. Las autocorrelaciones residuales como grupo deben ser
congruentes con aquellas producidas por los errores aleatorios
ESTRATEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL MODELO

 ELABORACION DE PRONOSTICOS
Una vez que se ha encontrado un modelo adecuado, es factible
elaborar los pronósticos de uno o varios períodos. Con base en
los pronósticos se pueden construir intervalos de predicción. En
general, para un nivel de confianza dado, cuanto más largo sea el
tiempo guía del pronóstico, mayor será el intervalo de predicción.
ESTRATEGIA DE IMPLEMENTACION
DE LA CONSTRUCCION DEL MODELO

Si el patrón de la serie parece estar cambiando con el tiempo, los


datos nuevos se pueden usar para recalcular los parámetros del
modelo o si es necesario, desarrollar un modelo completamente
nuevo.
MODELOS ARIMA (p, d, q)
ARIMA significa modelo autorregresivo integrado de media móvil
(AutoRegresive Integrated Moving Average).

 Los modelos ARIMA fueron popularizados en los años 70 por


George Box y Gwilym Jenkins, y sus nombres se utilizan,
frecuentemente, como sinónimos de la metodología
 ARIMA aplicada a análisis y predicción de series. Esta familia de
modelos ha sido utilizada ampliamente a partir de los 80, debido
a los avances de recursos de cálculo y de optimización.
VENTAJAS

 La principal ventaja de esta metodología es que


proporciona predicciones óptimas en el plazo inmediato y
en el corto plazo. Esto se debe a que la metodología Box-
Jenkins nos permite elegir entre un amplio rango de
distintos modelos según represente mejor el
comportamiento de los datos.
El sentido de predicciones óptimas significa que ningún
modelo univariante puede ofrecer mejores predicciones que
un modelo ARIMA.
DESVENTAJAS

 La principal desventaja de estos modelos es que la determinación


del modelo que mejor se adecua a la serie de datos no es trivial y,
por tanto, se requiere que la persona que realice predicciones
tenga amplios conocimientos sobre esta metodología.
EJERCICIO PRACTICO

 Se tiene una base de datos del valor promedio en el mes de la


divisa del dólar desde enero de 2000, hasta septiembre de 2018, y
se quiere pronosticar cual sería el valor promedio de la divisa
desde octubre 2018 hasta septiembre de 2019.
 Se adjunta la base de datos en Excel en el archivo
(tipo_de_cambio_dólar.xls).
VARIABLE OBJETO DE ANÁLISIS: Tipo de Cambio
(dólar)

 IDENTIFICACIÓN

1.1. GRAFICA1

Esta es la gráfica de la serie, vemos que la serie No es estacionaria en


media y en varianza, dado que tiene tendencias crecientes y decrecientes en
el tiempo.
1.2. CORRELOGRAMA

 La serie no es estacionaria; ya que la función de autocorrelación simple FAC cae


muy lentamente a cero. Por lo tanto la serie hay que diferenciarla.
1.3. Gráfica2 de la serie diferenciada una vez.

 Podemos observar que esta serie ya es estacionaria.


1.4. CORRELOGRAMA de la serie Diferenciada una
vez.

 El correlograma confirma la estacionariedad, observando, cómo


caen rápidamente a cero sus autocorrelaciones, tan solo en la
primera diferenciación.
2. Modelos posibles
 De acuerdo con el Correlograma de la serie diferenciada vemos que los posibles modelos para la
parte AUTORREGRESIVA serían: 0,1,2, la parte INTEGRADA de orden 1 y de MEDIAS MÖVILES
serían: 0,1.

 AR (p) = 0,1,2 I (d) = 1 MA(q) = 0,1

Después de varias pruebas se encontró que el mejor modelo es Arima (0, 1, 1).
El modelo propuesto seria el siguiente:

 El Modelo ARIMA (0,1,1). Por la parte AR no trae. Por la parte MA es Estacionario


por naturaleza y es Invertible ya que sus raíces, están por fuera del círculo unitario.
|-2.5| >1

Modelo ARIMA (0, 1, 1)

Modelo 3: ARIMA, usando las observaciones 2000:02-2018:09 (T = 224)


Variable dependiente: (1-L) PROMEDIOMES
Desviaciones típicas basadas en el Hessiano
Coeficiente Desv. Típica z valor p
const 5,09530 6,23009 0,8179 0,4134
theta_1 0,393817 0,0612064 6,434 <0,0001 ***

Media de la vble. dep. 4,974241 D.T. de la vble. dep. 72,17406


Media de innovaciones −0,032589 D.T. innovaciones 66,98215
R-cuadrado 0,975098 R-cuadrado corregido 0,975098
Log-verosimilitud −1259,718 Criterio de Akaike 2525,436
Criterio de Schwarz 2535,671 Crit. de Hannan-Quinn 2529,567

Real Imaginaria Módulo Frecuencia


MA
Raíz 1 -2,5393 0,0000 2,5393 0,5000
3. DIAGNOSTICO DEL MODELO

Para que el Modelo sea apropiado, se deben cumplir los supuestos de éste, es decir:
3.1 SUPUESTO DE NO AUTOCORRELACIÓN

H0 : Los errores no están autocorrelacionados


H1 : Los errores están autocorrelacionados
Función de autocorrelación de los residuos
***, ** y * indica significatividad a los niveles del 1%, 5% y 10%
Utilizando desviación típica 1/T^0,5

RETARDO FAC FACP Estad-Q. [valor p]

1 0,0013 0,0013
2 -0,0108 -0,0108 0,0268 [0,870]
3 -0,0320 -0,0320 0,2613 [0,878]
4 0,0083 0,0083 0,2771 [0,964]
5 0,1094 0,1089 3,0457 [0,550]
6 0,0672 0,0671 4,0955 [0,536]
7 -0,1087 -0,1076 6,8504 [0,335]
8 -0,1173 * -0,1135 * 10,0750 [0,184]
9 0,0488 0,0515 10,6369 [0,223]
10 0,0205 0,0041 10,7363 [0,294]
11 0,0674 0,0502 11,8166 [0,298]
12 -0,0219 0,0007 11,9309 [0,369]
13 -0,0306 0,0069 12,1558 [0,433]
Teniendo un α = 0.05 y un valor P = 0.870 no existen suficientes argumentos para rechazar
H0 , por tanto los residuos o errores NO están autocorrelacionados (son
Independientes).
3.2. SUPUESTO DE HOMOCEDASTICIDAD (VARIANZAS
IGUALES)

H0 : Los errores tienen varianza constante


H1 : Los errores No tienen varianza constante
Contraste de ARCH de orden 1

coeficiente Desv. típica Estadístico t valor p


----------------------------------------------------------------
alpha(0) 3688,45 679,256 5,430 1,48e-07 ***
alpha(1) 0,181526 0,0661304 2,745 0,0065 ***

Hipótesis nula: [No hay efecto ARCH]


Estadístico de contraste: LM = 7,35241
con valor p = P(Chi-cuadrado(1) > 7,35241) = 0,00669729

Teniendo un α = 0.05 y un valor P = 0.006 Existen suficientes argumentos para rechazar H0 ,


por tanto los errores NO son Homocedasticos, o No tienen varianza constante.
3.3 SUPUESTO DE MEDIAS IGUALES A CERO

H0 : Los errores se distribuyen normalmente


H1 : Los errores No se distribuyen normalmente
Contraste de Normalidad de PROMEDIOMES:

Contraste de Doornik-Hansen = 44,7868, con valor p 1,8822e-010

W de Shapiro-Wilk = 0,923277, con valor p 2,05217e-009

Contraste de Lilliefors = 0,109831, con valor p ~= 0

Contraste de Jarque-Bera = 17,3071, con valor p 0,000174504

Teniendo un α = 0.05 y un valor P = 0.00000 Existen suficientes argumentos para rechazar


H0 , por tanto los residuos o errores No se distribuyen Normalmente.

Concluimos con las pruebas desarrolladas que nuestro modelo es “No Ruido blanco
normal”.
4. Pronóstico para los doce siguientes períodos

Para intervalos de confianza 95%, z(0,025) = 1,96

ObservacionesPROMEDIO Predicción Desv. típica Intervalo de 95%


MES
2018:10 3060,80 66,9822 (2929,51, 3192,08)
2018:11 3065,89 114,904 (2840,69, 3291,10)
2018:12 3070,99 148,051 (2780,81, 3361,16)
2019:01 3076,08 175,030 (2733,03, 3419,14)
2019:02 3081,18 198,372 (2692,38, 3469,98)
2019:03 3086,27 219,244 (2656,56, 3515,98)
2019:04 3091,37 238,294 (2624,32, 3558,42)
2019:05 3096,46 255,930 (2594,85, 3598,08)
2019:06 3101,56 272,427 (2567,61, 3635,51)
2019:07 3106,66 287,981 (2542,22, 3671,09)
2019:08 3111,75 302,736 (2518,40, 3705,10)
2019:09 3116,85 316,805 (2495,92, 3737,77)
3.4. SUPUESTO DE NORMALIDAD

H0 : Los errores se distribuyen normalmente


H1 : Los errores No se distribuyen normalmente
Contraste de Normalidad de PROMEDIOMES:

Contraste de Doornik-Hansen = 44,7868, con valor p 1,8822e-010

W de Shapiro-Wilk = 0,923277, con valor p 2,05217e-009

Contraste de Lilliefors = 0,109831, con valor p ~= 0

Contraste de Jarque-Bera = 17,3071, con valor p 0,000174504

Teniendo un α = 0.05 y un valor P = 0.00000 Existen suficientes argumentos para rechazar


H0 , por tanto los residuos o errores No se distribuyen Normalmente.
Gracias!!

También podría gustarte