Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MÉTODOS AUTOPROYECTIVOS
ESTOCÁSTICOS DE PREDICCIÓN.
METODOLOGÍA DE BOX-JENKINS
Sin embargo, para muchos fines prácticos, los procesos se suelen describir
mediante sus momentos. La media del proceso estocástico se define por ut = E(Xt) y
generalmente es una función del tiempo. La función de autocovarianza se define como:
g(t,t+k) = Cov[Xt,Xt+k] = E{[Xt-E(Xt)][Xt+k-E[Xt+k]]}
k = ... -3, -2, -1, 0, 1, 2, 3, ...
A partir de esta función se obtienen dos resultados útiles. Por una parte, para
k=0 surge la función de varianza del proceso g(t,t) = Var Xt.
(X t X )( X t k X )
rk t 1
T
k = 1, 2, ...
(X
t 1
t X) 2
82 SERIES TEMPORALES
Si hay duda sobre diferenciar o no, o sobre cuántas veces hay que
diferenciar, se calcula la varianza de la serie original y de la serie sometida a
diferentes diferenciaciones, tomando como diferenciación adecuada aquella para al
que la varianza es mínima. El método es tanto más adecuado cuanto mayor sea la
diferencia entre las varianzas anteriores. La sobrediferenciación suele evitarse
observando si en la parte de medias móviles alguna raíz es próxima a la unidad.
( X t l 2 ) l1 1
Z t si l1 0 y X t l 2
l1 g l1 1
Z gLn( X l ) si l 0 y l 0
t t 2 1 2
84 SERIES TEMPORALES
l
X t 1
Z t X t l si l 0 y 1 l 1 Z t si l 0
o también l
Z t Ln( X t ) si l 0 Z Ln( X ) si l 0
t t
Figura 2-1
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 85
Figura 2-2
Ahora los retardos significativos de la FAC decaen tan rápidamente que sólo es
significativo el primero, luego ya no existen problemas de estacionariedad en la serie
diferenciada, es decir la serie diferenciada es I(0) y la serie original es I(1).
Comenzamos abriendo el fichero cap13.sf3 con la opción Abrir Datos del menú
Archivo y seleccionando el procedimiento Métodos Descriptivos de la opción Análisis de
series Temporales del menú Avanzado, para rellenar su pantalla de entrada como se indica
en la Figura 2-29. Se pulsa Aceptar y se elige la opción gráfica Gráfico de Secuencia
Cronológica Horizontal (Figura 2-30) para hacernos una idea de la evolución de la serie
de datos. Se obtiene la Figura 2-31 que muestra la presencia de una posible tendencia y de
no estacionariedad en media y varianza.
Figura 2-49
92 SERIES TEMPORALES
Figura 3-38
Figura 3-39
96 SERIES TEMPORALES
Figura 3-40
Figura 3-41
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 97
STATIONARITY=(ADF)
STATIONARITY=(KPSS )
STATIONARITY=(PHILLIPS )
STATIONARITY=(ERS)
STATIONARITY=(NP)
STATIONARITY=(ADF,ERS, KPSS, NP, PHILLIPS )
data datos;
set ejemplos.marima;
run;
98 SERIES TEMPORALES
La salida presenta p-valores de Rho y Tau muy altos, lo que indica que no
hay estacionaridad de la serie plastic.
Procedimiento AUTOREG
Error Aprox
Variable DF Estimador estándar Valor t Pr > |t|
La salida es la siguiente:
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 99
Procedimiento AUTOREG
Error Aprox
Variable DF Estimador estándar Valor t Pr > |t|
Se observa que, tanto para el test de Phillips Perron, como para el test aumentado
de Dickey-Fukker, los p-valores de Rho y Tau son muy pequeños, lo que indica
presencias de estacionariedad en la serie de primeras diferencias.
Hemos visto que los resultados del análisis de estacionaridad, tanto por los
métodos gráficos, como por los contrasyes formales de raíces unitarias, son coincidentes
para la serie de nuestro ejemplo.
100 SERIES TEMPORALES
Xt = 1 Xt-1 + at
h1 para j 1
h2 h1
2
para j2
1 h12
1 h1 h p2 h1
h 1 h p 3 h2
1
hkk
h p 1 h p 2 h1 hp
para j p
1 h1 h p 2 h p 1
h1 1 h p 3 h p 2
h p 1 h p 2 h1 1
0 para j p
Figura 2-3
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 103
Xt = at - v1 at-1
1 a2 para k 1
gk
0 para k 1
1
para k 1
hk 1 12
0 para k 1
1k (1 12 )
hkk para k 1
1 12 ( k 1)
( 1 1 2 ) a2 para k 1
. g k 2 a2 para k 2
0 para k 2
1 1 2
1 2 2 para k 1
1 2
2
hk para k 2
1 1 2
2 2
0 para k 2
h1 para k 1
h2 h1
2
para k 2
1 h12
hkk 3
h1 h1 h2 (2 h2 ) para k 3
1 h 2 2h 2 (1 h )
2 1 2
k 1 k 1 q k q
para k 1,2,, q
hk 1 12 q2
0 para k q
h1 para k 1
h2 h1
2
para k 2
1 h12
hkk 3
h1 h1 h2 (2 h2 ) h3 (1 h1 ) para k 3
2
1 h22 2h12 (1 h2 )
MODELOS ARMA(p,q)
Una extensión natural de los modelos AR(p) y MA(q) es un tipo de modelos
que incluyen tanto términos autorregresivos como de medias móviles y se definen
como ARMA(p,q) o también como ARIMA(p,0,q). Se representan por la ecuación:
o sea:
Figura 2-4
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 107
a2 (1 12 2 1 1 )
La varianza de un proceso ARMA(1,1) es: g 0
1 12
a2 (1 1 1 )( 1 1 )
para k 1
gk 1 12
g para k 1
1 k 1
La función de autocorrelación de un proceso ARMA(1,1) es:
(1 1 1 )( 1 1 )
para k 1
hk 1 12 2 1 1
h para k 1
1 k 1
La función de autocorrelación parcial de un proceso ARMA(p,q) es:
h1 para k 1
h2 h1
2
para k 2
1 h1
2
hkk 3
h1 h1 h2 (2 h2 ) h3 (1 h1 ) para k 3
2
1 h22 2h12 (1 h2 )
ARMA(1,1)
Figura 2-5
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 109
MODELOS ARIMA(p,d,q)
Un modelo ARIMA(0,d,0) es una serie temporal que se convierte en un ruido
blanco (proceso puramente aleatorio) después de ser diferenciada d veces. El modelo
ARIMA(0,d,0) se expresa mediante: (1 - B)d Xt = at. El modelo general
ARIMA(p,d,q) denominado proceso autorregresivo integrado de medias móviles de
orden p, d, q, toma la siguiente expresión:
(1- 1B - 2B2 -...- pBp)(1-B)d Yt = (1 - v1B - v2B2 - .... vqBq )at
8. Análisis detallado de los errores: Las diferencias históricas entre valores reales y
estimados por el modelo constituyen una fuente de especial interés para una
valoración final del modelo. Deberá comprobarse un comportamiento no sistemático
de los mismos, así como analizarse la posible existencia de errores especialmente
significativos.
9. Selección del modelo: En base a los resultados de las etapas anteriores, debe
estarse en condiciones de decidir sobre el modelo adoptado.
Figura 2-6
112 SERIES TEMPORALES
También existen métodos de otro tipo para contrastar la bondad del modelo
univariante estimado. Conviene estimar el modelo excluyendo algunas observaciones
al final de la muestra. Si esto provoca una variación sensible en los valores estimados
de los parámetros podría indicar una variación reciente de la estructura estocástica
subyacente, lo que desaconsejaría el modelo para fines predictivos.
Por otro lado, los modelos ARMA(p,q) deben cumplir las condiciones de
estacionariedad e invertibilidad. Por tanto, si representamos el proceso ARMA(p,q)
de la forma (B) Xt = v(B)at y alguna de las raíces de las ecuaciones (B) = 0 y
v(B)=0 es menor que uno en módulo, el modelo es rechazable.
Ahora los retardos significativos de la FAC decaen tan rápidamente que sólo
es significativo el primero, luego ya no existen problemas de estacionariedad en la
serie diferenciada, es decir la serie diferenciada es I(0) y la serie original es I(1). En
cuanto a la identificación de la parte de media móvil de la serie vemos que sólo el
primer retardo de la FAC es significativo y que el decrecimiento de los retardos de la
FACP es muy rápido. Luego la parte de media móvil se modelizaría como un proceso
MA(1). Para identificar la parte autorregresiva vemos que, aunque hay tres retardos de
la FACP casi significativos, ninguno es claramente significativo, decreciendo rápido los
coeficientes significativos de la FAC. Luego la parte autorregresiva se modelizaría
como un proceso AR(0). Además, considerando las dos funciones de autocorrelación
en conjunto, vemos que sus retardos no se anulan demasiado bruscamente. Estamos
entonces ante una estructura ARMA(0,1) para la serie diferenciada.
Figura 3-51
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 119
Figura 3-52
Figura 3-53
Al hacer clic en Aceptar se obtienen los estadísticos de ajuste del modelo (Figura
3-62) entre los que destaca R2=0,948. No obstante, el p-valor correspondiente a la
constante en la tabla ARIMA Model Parameters es muy alto (0,785), lo que invalida su
presencia en el modelo por tener muy baja significatividad. Este hecho conduce a
eliminar la citada constante del modelo de ajuste de la serie. Para ello, en la pantalla
Criterios de ARIMA de la Figura 3-55 se elimina la marca de la casilla Incluir constante
en modelo y se ejecuta nuevamente la estimación con el modelizador. Ahora, los
resultados de la estimación de la Figura 3-63 son correctos, ya que el único parámetro
estimar, correspondiente a la media móvil, tiene una significatividad muy alta. El fichero
de datos presenta una columna adicional a la derecha con las predicciones.
Figura 3-54
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 121
Figura 3-55
Figura 3-56
122 SERIES TEMPORALES
Figura 3-57
Figura 3-58
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 123
Figura 3-59
Figura 3-60
124 SERIES TEMPORALES
Figura 3-61
Figura 3-62
Figura 3-63
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 125
Figura 3-64
Figura 3-65
Figura 3-81
Figura 3-82
Figura 3-83
Para analizar la serie en diferencias de primer orden, hacemos clic en
cualquier salida tabular con el botón derecho del ratón y elegimos la Opciones de
análisis en el menú emergente resultante. Se obtiene la pantalla Opciones de ajuste
de la Figura 3-84 y situamos un 1 en el campo Orden no estacional. Al hacer clic en
Aceptar se obtienen los resultados para la serie diferenciada (Figura 3-84).
Figura 3-84
128 SERIES TEMPORALES
Figura 3-85
Figura 3-86
Pulsamos Aceptar y sobre cualquier salida tabular de los resultados hacemos
clic con el botón derecho de ratón para elegir Opciones de Análisis en el menú
emergentre resultante. Se obtiene la pantalla de Opciones de especificación del modelo,
que se cumplimemta como se indica en la Figura 3-87. Al pulsar en Aceptar se obtiene
la salida de la Figura 3-88 con las opciones tabulares de Resumen de Análisis, Tabla de
Pronósticos, Comparación de Modelos y contrastes de Aleatoreidad activadas. Las
opciones gráficas a activar serían Gráfico de secuencia Cronológica, Función de
autocorrelación de Residuos y Priodograma de Residuos.
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 129
Figura 3-87
Figura 3-88
130 SERIES TEMPORALES
Resumen de Pronósticos
Diferenciación no estacional de orden: 1
Modelo de pronóstico seleccionado: ARIMA(0,1,1)
Número de pronósticos generados: 12
Número de periodos retenidos para validación: 0
Periodo de Periodo de
Estadístico Estimación Validación
RMSE 156,675
MAE 120,989
MAPE 2,05293
ME 2,31786
MPE 0,0340701
Resumen de Modelo ARIMA
Parámetro Estimado Error Estd. t Valor-P
MA(1) -0,732512 0,0685066 -10,6926 0,000000
Pronóstico Histórico: sí
Varianza estimada de ruido blanco = 24978,4 con 98 grados de libertad
Desviación estándar estimada de ruido blanco = 158,046
Número de iteraciones: 4
Comparación de Modelos
Variable de datos: plastic
Número de observaciones = 100
Indice Inicial = 1,0
Intervalo de Muestra = 1,0
Modelos
(A) ARIMA(0,1,1)
(B) Tendencia lineal = 5242,95 + 14,6972 t
(C) Promedio móvil simple de 3 términos
(D) Suavización exponencial simple con alfa = 0,9999
(E) Suavización exp. De Brown con alfa = 0,8122
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 131
Periodo de Estimación
Modelo RMSE MAE MAPE ME MPE
(A) 156,675 120,989 2,05293 2,31786 0,0340701
(B) 659,588 546,136 9,22751 3,63798E-14 -1,21264
(C) 280,442 220,117 3,63009 15,4639 0,173884
(D) 187,474 138,175 2,29981 4,43049 0,0364939
(E) 199,039 155,334 2,62356 -2,98316 -0,0213021
Clave:
RMSE = Root Mean Squared Error (Raíz del Cuadrado Medio del Error)
RUNS = Prueba corridas excesivas arriba y abajo
RUNM = Prueba corridas excesivas arriba y abajo de la mediana
AUTO = Prueba de Box-Pierce para autocorrelación excesiva
MEDIA = Prueba para diferencia en medias entre la 1ª mitad y la 2ª mitad
VAR = Prueba para diferencia en varianza entre la 1ª mitad y la 2ª mitad
OK = no significativo (p >= 0,05)
* = marginalmente significativo (0,01 < p <= 0,05)
** = significativo (0,001 < p <= 0,01)
*** = altamente significativo (p <= 0,001)
Si hacemos clic con el botón derecho del ratón sobre cualquier salida tabular
y elegimos la opción Opciones de Análisis sobre el menú emergente resultante, se
obtiene la pantalla Opciones de especificación del modelo (Figura 3-87), que permite
restringir el ajuste de modelos a la selección realizada en la figura.
Como ejemplo estudiaremos con Eviews la misma serie que hemos estudiado
previamente con SPSS y Statgraphics.
Figura 2-49
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 135
Figura 2-60
La salida es la siguiente:
Proc ARIMA
Autocorrelaciones
Proc ARIMA
Proc ARIMA
Periodo(s) de diferenciación 1
Media de series de trabajo 4.474747
Desviación estándar 187.413
Número de observaciones 99
Observación(es) eliminadas por diferenciación 1
Autocorrelaciones
Autocorrelaciones parciales
Retardo Correlación -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
1 0.40468 | . |******** |
2 -0.21748 | ****| . |
3 0.22485 | . |**** |
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 143
4 -0.29872 | ******| . |
5 0.15620 | . |***. |
6 0.17282 | . |***. |
7 -0.05219 | . *| . |
8 -0.04494 | . *| . |
9 0.01670 | . | . |
10 -0.07992 | . **| . |
11 -0.04605 | . *| . |
12 0.03127 | . |* . |
Ahora observamos que los p-valores de los estadísticos Tau y Rho del test de
Dickey Fuller aumentado son inferiores a 0,05, lo que constituye una prueba formal
de la estacionariedad de la serie en primeras diferencias, lo que nos permite ya
identificarla a través de la forma de sus funciones FAC y FACP. Las citadas
funciones observadas en la salida muestran que la serie en primeras diferencias puede
identificarse con una estructura ARMA(0,1). El p-valor muy bajo de la chi-cuadrado
144 SERIES TEMPORALES
Error Approx
Parámetro Estimador estándar Valor t Pr > |t| Retardo
Correlaciones de los
estimadores de parámetro
Parámetro MU MA1,1
MU 1.000 -0.034
MA1,1 -0.034 1.000
Error
Obs Predicción std. 95% Límites de confianza
Error Approx
Parámetro Estimador estándar Valor t Pr > |t| Retardo
Proc ARIMA
Periodo(s) de diferenciación 1
Error
Obs Predicción std. 95% Límites de confianza
Se observa que los parámetros estimados del modelo son muy significativos
(el término MA tienen un p-valor menor que 0,0001). También se observan las
predicciones relativas a las 10 semanas con sus intervalos de confianza al 95%. Las
predicciones son iguales por tratarse de un modelo de líneas aéreas sin constante. En
este caso se realiza una sola predicción y se incorpora a la serie para realizar la
siguiente predicción. Y así sucesivamente hasta finalizar.
Ejercicio 3-1. Consideramos una serie de ventas con datos mensuales desde enero de
1988 hasta abril de 1996 (la variable date contiene los meses y la variable i el índice
temporal) contenida en el fichero SAS de nombre test.sas7bdat e intentamos
ajustarla al modelo ARIMA más adecuado para realizar 6 predicciones.
Figura 3-113
148 SERIES TEMPORALES
Figura 3-114
Figura 3-115
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 149
Figura 3-116
Los p-valores de los estadísticos Tau y Rho del test de Phillips Perron son
muy superiores a 0,05, lo que constituye una prueba formal de la no estacionariedad
de la serie ventas. También se contrasta si la serie es un ruido blanco para varios
retardos de la FAC. El p-valor muy bajo de la chi-cuadrado (<0,0001) indica que la
serie inicial no es un ruido blanco (porque ni es estacionaria). En la salida del
procedimiento ARIMA (Figura 3-117) también se observa que la función de
autocorrelación decrece lentamente lo que es un síntoma claro de no estacionariedad.
Figura 3-117
El siguiente paso será constrastar la estacionariedad e identificar la serie en
primeras diferencias. Se utilizará la siguiente sintaxis SAS:
ods graphics on;
proc arima data=ejemplos.test;
identify var=ventas(1) nlag=24 stationarity=(phillips);
run;
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 151
Periodo(s) de diferenciación 1
Media de series de trabajo 0.660589
Desviación estándar 2.011543
Número de observaciones 99
Observación(es) eliminadas por diferenciación 1
Figura 3-118
152 SERIES TEMPORALES
Ahora observamos que los p-valores de los estadísticos Tau y Rho del test de
Dickey Fuller aumentado son inferiores a 0,05, lo que constituye una prueba formal
de la estacionariedad de la serie en primeras diferencias, lo que nos permite ya
identificarla a través de la forma de sus funciones FAC y FACP (Figura 3-118). Las
citadas funciones observadas en la salida muestran que la serie en primeras
diferencias puede identificarse con una estructura ARMA(1,1). El p-valor muy bajo
de la chi-cuadrado (0,0008) indica que la serie diferenciada no es un ruido blanco
(porque entonces no se podría ajustar a una estructura ARIMA).
Periodo(s) de diferenciación 1
Media de series de trabajo 0.660589
Desviación estándar 2.011543
Número de observaciones 99
Observación(es) eliminadas por diferenciación 1
Error Approx
Parámetro Estimador estándar Valor t Pr > |t| Retardo
Proc ARIMA
Factores autorregresivos
Error
Obs Predicción std. 95% Límites de confianza
Se observa que los parámetros estimados del modelo son muy significativos
(la constante tiene un p-valor de 0,0738 y los términos AR y MA tienen un p-valor
menor que 0,0001). También se observan las predicciones relativas a los 12 meses
del año siguiente con sus intervalos de confianza al 95%.
Figura 3-119
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 155
Figura 3-122
Se obtiene el Modelizador de series temporales. Hemos seleccionado la serie
ventas y la hemos desplazado al campo Variables dependientes. El campo Variable
independiente, que sería el tiempo, se mantiene vacío, ya que se suponen por defecto
períodos de tiempo consecutivos. A continuación hacemos clic en la flecha situada a la
derecha de la opción Modelizador experto del campo Método y elegimos ARIMA (Figura
3-122). En la pantalla Criterios de ARIMA (Figura 3-123) introducimos los parámetros del
modelo ARIMA identificado previamente como ARIMA(1,1,1). Al hacer clic en
Continuar, ya tenemos la pestaña Variables del modelizador rellenada adecuadamente
(Figura 3-124). A continuación hacemos clic en la pestaña Estadísticos y elegimos los
estadísticos deseados en la salida (Figura 3-125. En la pestaña Gráficos se eligen las
opciones gráficas deseadas en la salida (Figura 3-126).
156 SERIES TEMPORALES
Figura 3-123
Figura 3-124
Figura 3-125
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 157
Figura 3-126
Al hacer clic en Aceptar se obtienen los estadísticos de ajuste del modelo (Figura
3-129) entre los que destaca R2=0,997 y los p-valores de los parámetros estimados muy
pequeños (el parámetro menos significativo es la constante al 85%, pero no se trata de un
valor para rechazar en este tipo de estimaciones). Por otro lado, el p-valor del estadístico
de Ljung-Box es lo suficientemente alto como para asegurar la aleatoriedad formal de los
residuos.
Figura 3-127
Figura 3-128
Figura 3-129
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 159
Figura 3-130
Figura 3-131
Figura 3-132
Figura 3-133
Figura 3-134
Figura 3-135
162 SERIES TEMPORALES
Figura 3-136
Pronósticos - ventas
Datos/Variable: ventas
Resumen de Pronósticos
Diferenciación no estacional de orden: 1
Modelo de pronóstico seleccionado: ARIMA(1,1,1) con constante
Número de pronósticos generados: 6
Número de periodos retenidos para validación: 0
Periodo de Periodo de
Estadístico Estimación Validación
RMSE 0,948425
MAE 0,772115
MAPE 0,564996
ME -0,00195293
MPE 0,00578595
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 163