Está en la página 1de 36

Estadstica III 3009137, semestre 01 de 2015

Equipo de Trabajo No. 15


Serie No. 10

Curso: Ma - Ju

Anlisis de serie de tiempo: Ajuste con errores estructurales ARMA


Jean Michell Alvarado Arrautt1, Melissa Maya Lpez2, Ana Carolina Restrepo Parra3, Christian
Camilo Surez Zapata4
Fecha de entrega: 4 de Mayo de 2015
Resumen
Se analizar la componente de error estructural para la serie de tiempo Valor de las ventas
(miles de pesos corrientes) de libros, papelera, peridicos y revistas en los grandes almacenes
minoristas e hipermercados, de manera que dicha componente pueda ser representada mediante
modelos ARMA que al ser agregados al modelo global logren capturar de mejor manera la
dinmica de la serie en comparacin con el mejor modelo global propuesto en el trabajo
anterior.
Palabras claves: Ruido blanco, estacionariedad, correlacin, error, ergodicidad.

1.INTRODUCCIN
En el siguiente artculo se analizarn las ventas totales (en miles de pesos corrientes) de Libros,
papelera, peridicos y revistas de los Grandes Almacenes e Hipermercados Minoristas. El mtodo
de muestreo empleado para la recoleccin de los datos fue un censo a 120 Grandes Almacenes e
Hipermercados Minoristas con ventas anuales mayores o iguales a 7.000 millones de pesos de
1995 (segn la EAC/95) y/o personal ocupado mayor o igual a 200, dicha informacin fue
obtenida y consolidada por el Departamento Administrativo Nacional de Estadstica (DANE) y fue
clasificada por trimestres, comenzando por el primer trimestre del ao 1997 hasta el primer
trimestre del ao 2014 (69 datos en total).
Con el fin de explicar el comportamiento de dichas observaciones en el tiempo, en el trabajo 1
fueron propuestos cuatro modelos con estacionalidad modelada con variables indicadoras: dos
modelos parcialmente multiplicativos ajustados mediante descomposicin multiplicativa y Loess
lineal y descomposicin multiplicativa y Loess cuadrtico; un modelo completamente
multiplicativo bajo transformacin logartmica, con tendencia cuadrtica; y uno parcialmente
multiplicativo bajo transformacin exponencial, con tendencia cuadrtica, el cual result ser el
mejor modelo global, pues present mejores medidas de ajuste y de pronstico, adems, en general
1 Estudiante Ingeniera de Control, Universidad Nacional de Colombia Sede Medelln.
2 Estudiante Ingeniera Industrial, Universidad Nacional de Colombia Sede Medelln.
3 Estudiante Ingeniera Administrativa, Universidad Nacional de Colombia Sede Medelln
4 Estudiante Ingeniera Administrativa, Universidad Nacional de Colombia Sede Medelln
1

logr capturar la dinmica de la serie, siguiendo un patrn creciente no lineal, sin embargo, la serie
presenta ciclos que no fueron capturados en el ajuste y que se evidenciaron en los grficos de
residuales.
El modelo establecido mediante el mtodo de descomposicin y Loess lineal obtuvo una mejor
calidad de ajuste respecto al mejor modelo global que result ser inestable (los parmetros cambian
en el tiempo), lo cual afecta el ajuste de la serie, pues dicha condicin indica que existen parmetros
estimados en el modelo que no son constantes, por lo tanto resulta ms apropiado realizar el ajuste
empleando un mtodo local para seguir estas variaciones en el tiempo, adems los pronsticos sern
tiles solo a corto plazo, pues como los parmetros varan en el tiempo, si se pronostican periodos
muy lejanos se puede incurrir en un error considerable; sin embargo, la calidad de pronsticos fue
mejor para el modelo global; y en general se le dio ms importancia al pronstico que al ajuste,
dado del anlisis de la serie est centrado en la planeacin y toma de decisiones, lo cual slo podra
hacerse correctamente con pronsticos de buena calidad.
Este trabajo es la continuacin del trabajo 1 y tiene en general dos objetivos: analizar los residuos
estructurales del mejor modelo global elegido para la serie e identificar un modelo ARMA para los
errores estructurales, esto con el fin de ajustar y pronosticar la serie completa con dichos errores y la
misma tendencia y estacionalidad identificadas para el mejor modelo global encontrado en el
trabajo 1.

2. ANLISIS DESCRIPTIVO DE LA SERIE


A partir de la Figura 1se pueden realizar diferentes observaciones acerca de las componentes de la
serie: respecto a la tendencia se puede decir que es creciente, no lineal y podra ser representada
mediante una curva suave. Adems entre los aos 2000 y 2005 se percibe la presencia de un patrn
cclico; se evidencia tambin la existencia de componente estacional, dado que se presentan
variaciones regulares dentro de un ao calendario y son repetidas todos los aos de una forma
aproximadamente constante, por esto la componente es modelada ms adelante usando variables
indicadoras; la variabilidad de los datos es creciente a lo largo del tiempo, lo cual da indicios de que
la serie es de componentes multiplicativas; para comprobar dicha hiptesis, se realiz la grfica del
logaritmo natural de la serie original (Figura 1Derecha) para comparar el patrn de varianza; en
dicha grfica se evidencia un patrn de varianza ms estable en relacin con el de la serie original
presentada en la Figura 1 Izquierda, conservando el patrn cclico, la componente estacional y
claramente la tendencia sigue siendo creciente y no lineal, esto permite concluir que efectivamente
la serie es de componentes multiplicativas; las componentes de tendencia y estacionalidad pueden
considerarse de tipo global, ya que si bien la tendencia se ajusta mejor con un modelo local debido a
una mejor calidad de ajuste que presenta frente que al modelo global, los pronsticos para la misma
son mejores con modelos globales.

Figura 1. Izquierda. SerieValor de las ventas (miles de pesos corrientes) de libros, papelera, peridicos y
revistas en los grandes almacenes minoristas e hipermercados,1971.Q1-2014.Q1. Derecha.Serie del
logaritmo natural del Valor de las ventas (logaritmo de miles de pesos corrientes)de libros, papelera,
peridicos y revistas en los grandes almacenes minoristas e hipermercados,1971.Q1-2014.Q1.

Log de Ventas

18.0

18.5

19.0

2.0e+08
1.5e+08
1.0e+08

17.5

5.0e+07

Ventas

2000

2005

2010

2000

Tiempo

2005

2010

Tiempo

Se desea saber si el logaritmo se la serie original es estacionario en covarianza, para esto se utilizar
la grfica ACF. A continuacin se plantean las respectivas hiptesis, estadstico de prueba para el
test y criterio de rechazo.

Hiptesis:

Ho : (k )=0 vs Ha : (k) 0
Donde ( k )=Corr ( log ( Y t ) , log ( Y t+ k ) )

k =1, ,m
El valor de m para estimar es

[]

n 69
= =18, pero por tener una serie estacional de
4
4

periodo s=4 se recomienda utilizar un m mltiplo de s, por lo que se puede usar m=20.

k =1, ,20

Estadstico de prueba:

^ ( k )=

^ (k )
^ (o)

Criterio de decisin:

|^ ( k)|>

2
, con n= 69
n

En la Figura 1se presenta la grfica de la ACF para el logaritmo de las ventas, en esta se nota que
los picos no decaen rpidamente, por tanto el proceso no es ergdico, de lo cual se concluye que el
logaritmo de la serie no es estacionario. Esto se poda intuir con el anlisis de la Figura 1 Derecha,
pues como se dijo anteriormente, esta serie muestra claramente tendencia no constante y un patrn
estacional (de periodo s=4), ambas funciones del tiempo, por lo tanto la media de la serie no es
constante, pues se explica por su tendencia y estacionalidad, caracterstica que contradice la
estacionariedad. Tambin se rechaza la hiptesis nula para k=4, 8, 12 y 16 (hay rezagos), lo que
permite concluir que las variables de la serie distanciadas dichos valores de k en el tiempo estn
correlacionadas, por tanto el logaritmo de la serie no proviene de un ruido blanco, esto con =5%.

0.0
-0.5

ACF

0.5

ACF de Log(Ventas)

10

15

20

Figura 1. ACF del Logaritmo de la Serie Original

En el trabajo anterior, luego de un estudio de calidad de pronstico y ajuste para varios modelos
polinmicos planteados, se lleg a la conclusin de que el mejor modelo que pronosticaba y
ajustaba conjuntamente era un modelo exponencial polinmico de grado dos con estacionalidad
modelada por variables indicadoras.

Y t =exp 0 + 1 t + 2 t 2+ 1 + i I i ,t + E t , E t =log ( Et ) Et iidN ( 0, 2 ) ( 1)


i=1

Donde:

Y t : Valor de las ventas (miles de pesos corrientes)de libros, papelera, peridicos y


revistas en los grandes almacenes minoristas e hipermercados, 1971.Q1-2014.Q1.
T t : Componente de tendencia de Y t .
S t : Componente de estacionalidad de Y t .
Et : Errores presentes en el modelo.

S t = i I i ,t

(2)

i=1

Donde s=4
Cada coeficiente i representa el efecto o diferencia promedio de la serie en el trimestre i con
relacin al trimestre de referencia (en este caso es Q4).
Las variables

I i , t i= 1,2,3,4 son tales que:

I i , t= 1 sien t la serie est en el trimestre i


0 si ent laserie no est en el trimestre i

(3)

Para un tiempo dado, slo una de las s indicadoras puede tomar el valor de 1, de modo que
4

I i ,t =1, t 1
i=1

2.1. Ajuste del Modelo con validacin cruzada


Dado que la serie de tiempo cuenta con N=69 observaciones, en la estrategia de validacin
cruzada se propuso utilizar m=65 observaciones para el ajuste de la serie de tiempo y las
n=4 observaciones restantes se usaron para pronosticar.
En la Tabla 1se presentan los parmetros estimados del modelo bajo las condiciones de la
validacin cruzada, la prueba de significancia individual y la prueba de significancia conjunta de
todo el modelo para los primeros m=65 datos.
Tabla 1. Parmetros estimados para el modelo Exponencial polinmico de grado 2 estacional
Parmetro

valor

P(|T 59|>|T 0|)

Estimacin

Error estndar

0
1

1.754x101
2.011x10-2

5.108x10-2
2.495x10-3

343.317
8.059

<2x10-16
4.34x10-11

-1.314x10-4

3.333x10-5

-3.941

0.000217

1
2
3

8.147x10-1
-5.401x10-2
2.770x10-1

3.285x10-2
4.426x10-2
3.794x10-2

24.797
-1.220
7.301

<2x10-16
0.227228
8.35x10-10

T0

AIC= 9.138035x1013 BIC= 1.347701x1014 R2adjs=0.9602156


Ecuacin ajustada:

Y^t =exp ( 1.754 x 10 1+2.011 x 102 t1.314 x 104 t 2+ 8.147 x 101 I 1,t 5.401 x 102 I 2,t +2.770 x 101 I 3,t )
A continuacin se muestra la prueba de hiptesis realizada para evaluar la significancia de la
tendencia en el modelo, para esto basta con probar la significanciadel parmetro que acompaa al
tiempo con mayor grado del polinomio de dicha variable

Hiptesis:

Ho: 2=0 vs H 1 : 2 0
Estadstico de prueba:

T o=

^
2

bajo H 0

s . e .( ^
2 )

t (nk ) , k=Nmero de parmetros=6


^
2

T o=

bajo H 0

t (59)
s . e .( ^
2 )
^
2
T o=
=3.941
s . e .( ^
2 )

Criterio de decisin:

Vp=P (|t nk|>|T 0|) =P (|t 59|>|3.941|) =0.000217


Como Vp es muy pequeo, la probabilidad equivocarse al rechazar H 0 es muy baja, por lo
tanto se rechaza y se concluye que el parmetro 2 es significativo en el modelo y por
tanto una tendencia cuadrtica es significativa.
A continuacin se evaluar la significancia de la estacionalidad en el modelo.

Ho: i=0 vs H 1 : i 0

Estadstico de prueba

T o=
T o=

^i bajo H
t (n k) , k=Nmero de parmetros=6
Se ( ^i)
0

^i bajo H
t (59)
Se ( ^i)
0

Criterio de decisin
6

Vp=P (|t nk|>|T 0|) =P (|t 59|>|T 0|)


Segn los valores p consignados en la Tabla 1 para las pruebas de hiptesis de significancia
de los i, para 1 y 3 los valores p son muy pequeos y por tanto la estacionalidad es
significativa en el modelo.

e 1 =2.258498
Se estima que valor promedio de las ventas (miles de pesos corrientes) de libros, papelera,
peridicos y revistas en los grandes almacenes minoristas e hipermercados, en el trimestre
1en cada ao es un 2.258498 veces el esperado en el trimestre 4 (de referencia)

e 2 =0.947423
Se estima que valor promedio de las ventas (miles de pesos corrientes) de libros, papelera,
peridicos y revistas en los grandes almacenes minoristas e hipermercados, en el trimestre 2
en cada ao es 0.947423 esperado en el trimestre 4 (de referencia)

e 3 =1.038669
Se estima que valor promedio de las ventas (miles de pesos) a precios corrientes de libros,
papelera, peridicos y revistas en los grandes almacenes minoristas e hipermercados, en el
trimestre 3en cada ao es 1.038669 veces el esperado en el trimestre 4 (de referencia)

En laFigura 2se muestran los grficos correspondientes al modelo seleccionado, en los que se puede
ver la serie real y la serie ajustada por el mismo, en esta es posible ver que el modelo describe
acertadamente la serie de tiempo real, excepto en algunos intervalos donde se ve un poco alejado, lo
que posiblemente se deba a la presencia de ciclos.

5.0e+07 1.0e+08 1.5e+08 2.0e+08

Ventas

Ajuste Modelo
Exp-Cuadratico Estacional
Serie Original
Mejor Modelo
trabajo 1

2000

2005

2010

Tiempo

Figura 2. Grfica del Modelo Ajustado a la Serie del valor de las ventas (miles de pesos corrientes) de libros,
papelera, peridicos y revistas en los grandes almacenes minoristas e hipermercados,1971.Q1-2014.Q1

En la Error: Reference source not foundse muestran los residuales comunes contra el tiempo y
contra los ajustados, aqu se observa como en la grfica de residuales contra el tiempo hay presencia
de ciclos, de manera que el supuesto de independencia de los errores estructurales se rechaza; por lo
anterior, se puede concluir que estos no son un ruido blanco (RB) pero el supuesto de varianza
constante no est siendo violado fuertemente aun bajo cierta acumulacin de una nube de puntos,
adems de esto se puede ver que hay puntos que se alejan demasiado de los dems, estos puntos
atpicos y la presencia de ciclos podran representar problemas a la hora de validar posibles
supuestos o modelos ms adelante.

2e+07
1e+07

Residuales

-2e+07

-1e+07

0e+00

1e+07
0e+00
-2e+07

-1e+07

Residuales

2e+07

3e+07

Residuales vs. Tiempo

3e+07

Residules vs. Ajustados

5.0e+07

1.0e+08

1.5e+08

2.0e+08

10

20

Valores ajustados

30

40

50

60

Tiempo

Et vs Y^ t .Derecha:
Figura 4. Izquierda : ^

^
Et vs t

2.2. Pronsticos
Para el modelo seleccionado se realizan pronsticos puntuales para los cuatro ltimos datos
(trimestres), pronosticando as un ao completo que va desde el segundo trimestre de 2013 hasta el
primer trimestre de 2014.
Ecuacin de pronstico:

Y^ 59 ( L )=exp ( 1.754 101 +2.011 102 ( 59+ L )1.314 104 ( 59+ L )2 +8.147 101 1,59 +L 5.401 102 2,59 +L
Los pronsticos arrojados por R con una confianza del 95% fueron:
Tabla 2. Pronsticos del Modelo Exponencial
Perodo
2013 Q2
2013 Q3
2013 Q4
2014 Q1

L
1
2
3
4

Valor Real
83016753
110468924
91802127
2088913801

Pronstico
83205371
116158428
88263765
199760433

En la Tabla 2se observan los pronsticos realizados con el modelo exponencial polinmicocuadrtico estacional para los ltimos cuatro trimestres de la serie, donde se evidencia que tales
valores pronosticados son muy cercanos a los valores reales algunos por encima y otro por debajo
del valor real.

La precisin del pronstico se comprob con las medidas que se muestran en la Tabla 3en los
resultados del modelo exponencial el valor del MAPEes bajo por lo que puede concluir que el
modelo cuenta con una buena precisin para realizar pronsticos.
9

MAPE=100

m1
Y
Y^
1
t + j+1
ER j|, donde E R j = t + j+1
|

m j=0
Y t + j+1

Tabla 3: Precisin pronsticos modelo 2.


Medida
Valor

RMSE
5672526

MAE
4642463

MAPE
3.403318

En la Tabla 3se observa que al realizar los pronsticos con el modelo se cometi en promedio un
error de 5.672.526 miles de pesos segn la medida de pronostico RMSE y un error de 4.642.463
miles de pesos segn MAE. Respecto a MAPE, esta indica que en promedio se est incurriendo en
un error del 3.40%.
Con lo anterior podemos concluir que el pronstico bajo este modelo aun que es bueno mas en
promedio los errores, en miles de pesos, que se cometen son considerables.

3. POSTULACIN DE MODELOS CON ERRORES ARMA


3.a. Validacin de Supuestos
Anlisis de la Grfica de Residuales:
Como se puede observar en la Figura 4,hay presencia de ciclos entre los residuales del modelo
seleccionado, lo que desmiente el supuesto de independencia de los errores. Esto nos lleva a
concluir que no son Ruido Blanco (RB). En cuanto al supuesto de varianza constante aparentemente
se cumple considerando la presencia de observaciones atpicas. Por ltimo el supuesto de media
constante en cero tambin se cumple aparentemente.
Pruebas de Incorrelacin:
Con el objetivo de determinar la incorrelacin entre los residuales del modelo propuesto se
realizarn algunas pruebas que permitirn determinar si se cumple el supuesto de Ruido Blanco.
Hiptesis de proceso de ruido.
Se desea probar la hiptesis:

H 0 : E t RB ( 0, 2 ) vs H 1 : E t No RB(0, 2)
Esta hiptesis ya es rechazada por el comportamiento de los residuales, pues en estos se observan
ciclos y por ende correlacin.

ACF
10

Para evaluar si los errores estructurales distribuyen Ruido Blanco, segn la prueba de ACF se
establece la siguiente prueba de hiptesis:
Sea

E ( k )=corr ( Et , Et +k )

H o : ( k )=0 para todo k 0 vs H 1= ( k ) 0 Para algn k


n 65
k =1,2 .. m= = 16 .25, se
4 4
2
aproxima hasta m = 20 , donde la regin de rechazo a una confianza de 5% es: |(k)|
.
n
Si

Et RB

entonces

( k )=0 k 0

donde

En este caso n=65 ya que el tamao total de la muestra de la serie es


recortaron 4 datos para realizar la estrategia de validacin cruzada.

N=69

y se

Ahora se ver grficamente cada una de las pruebas de hiptesis para evaluar si al menos para un
k , ( k ) es 0 o sea que se rechaza la hiptesis nula.
En la Figura 5 se puede observar que las bandas de rechazo de hiptesis nula son cortadas en k= 1
y 4 en la ACF, lo que permite concluir que se rechaza la posibilidad de que los residuales del
modelo sean Ruido Blanco.
PACF de los Residuales

-0.4

-0.2

-0.2

0.0

0.0

ACF

Partial ACF

0.2

0.2

0.4

0.4

ACF de los Residuales

10

15
K

20

10

15

20

Figura 5. Grfica ACF y PACF para los residuales estructurales del modelo.

PACF
Ahora se analiza si los residuales son Ruido blanco por el metodo grafico de la PACF, para esto se
establece:

E , kk =corr ( Et , Et +k| Et +1 + Et +k1 )


11

^ ^ ^
^
^
eEkk =corr ( Et , Et +k| Et +1 + Et +k1)
Equlivalentemente, si Et RB
siguiente prueba de hiptesis:

entonces

E , kk =0 k 0

H 0 : E , kk =0 vs H 1 : E , kk 0 ,
Donde la regin de rechazo a una confianza de 5% es:

para lo que se establece la

para k=1 20

|(k)|

2
n

Ahora se ver grficamente cada una de las pruebas de hiptesis para evaluar si al menos para un
k , kk es 0 o sea que se rechaza la hiptesis nula.
En la Figura se observa que para k =1, 4 y 5 el valor del estadstico de prueba supera el valor
de rechazo, por lo que se concluye nuevamente que los residuales del modelo no son un Ruido
Blanco.
Test de Ljung-Box
En este test se realizaran pruebas simultneas para identificar ruido blanco primero con m=6 datos,
luego con m=12 y por ultimo con m=18 datos, de la siguiente manera:
Pruebas de hiptesis:

Ho: ( 1 )= ( 2 )== ( m )=0 vs Ha: ( k ) 0 para algn K=1,2 , m


Donde:m=6, 12, 18 ( k )=Corr ( Et , E t+ k )
Estadstico de prueba:Criterio de rechazo:
m

VP=P ( m Q LB ) Q LB =n (n+2)
2

k =1

^2 (k ) 2
m
nk

De acuerdo a los resultados del test presentados en la Tabla 4se observa que Ho es rechazada
para cada una de las pruebas, por presentar valores p muy pequeos, los cuales cumplen con el
criterio de rechazo, por tal razn existe evidencia en contra de ruido blanco.
Tabla 4. Test Ljung-Box

QLB

Gl

6
12
18

31.4616
39.8112
50.1071

6
12
18

P( x m >QLB )
2.0689 105
7.7284 105
7.2718 105

Test de Durbin-Watson
Dado que el modelo planteado es exponencial, no es posible aplicar el test Durbing Watson, por lo
que se proceder a concluir de acuerdo a los resultados del Ljung-Box, la ACF y la PACF.
12

Los resultados obtenidos en los test aplicados coinciden en presentar evidencia al supuesto de ruido
blanco, por lo que se puede concluir que los residuales del modelo exponencial cuadrtico no siguen
un proceso de ruido blanco, pero se puede observar en el grfico de la ACF un patrn ergdico lo
que muestra que los residuales al menos son estacionarios en covarianza de acuerdo a ACF y PACF,
por lo que se proceder a evaluar los modelos ARMA, AR y MA ms adecuados.
3.b. Identificacin de modelos AR, MA ARMA
Grafica ACF y PACF:
Dado que se rechaz ruido blanco en al menos una de las pruebas anteriores, los modelos
provisionales AR, MA o ARMA que se propondrn disponiendo de la informacin disponible, sern
los siguientes:
De la Figura se observa un patrn de cola en la ACF y uno de corte en la PACF lo que significa
que, inicialmente, se buscar un modelo AR(p) para los residuales. Como se observa claramente un
corte significativo en k =5, lo que significa que, inicialmente, se postular un modelo AR(5) para
los residuales.
La ecuacin terica del modelo AR(5) se escribe de la siguiente forma:

Et =1 Et 1 + 2 Et 2+ 3 Et3 + 4 Et 4 +5 Et 5 + at , Cona t RBN (0, 2a ) (6)


EACF
El test de EACF se establece de la siguiente forma:

^
^
W t , j , k= ^
Et (1j) ^
E t1 .(kk ) ^
Et k Residuos autoregresivos
Sea

w ( k )=Funcion de autocorrelacion para W t , j , k , entonces

H o : w ( j+1 )=0 0 en casilla( k , j)


H 1 : w ( j+1 ) 0 X en casilla( k , j)
H o : w ( j+1 )=0 para todos los valores siguientes de j, y que
Se selecciona el modelo donde
adems sea el que menor nmero de parmetros contenga.
.

13

Tabla 5. EACFMuestral para el Modelo

Dado que los datos tienen periodicidad trimestral se procedi a realizar la grfica con rdenes
mximos de 20 y 24, pero las salidas de R para estos ordenes fueron errores como se presenta en la
Figura 3 y , por lo que se procedi a graficar la EACF con un orden mximo de 15, los resultados se
presentan en la Tabla 5en la que se observa que el modelo ms parsimonioso a escoger es un
modelo ARMA(1,4).

Figura 6. Salida R para EACF de orden 24


Figura 3. Salida R para EACF con orden 20

La
ecuacin terica del modelo ARMA(1,4) se escribe de la siguiente forma:

Et =1 Et 1 +1 at 1+ 2 a t2 +3 at 3+ 4 at 4 +at , Cona t RBN ( 0, 2a) (7)


Armasubsets:
Por medio de la funcin armasubsets() tambin es posible identificar modelos ARMA haciendo uso
del criterio BIC.
Luego de calcular el armasubsets() con las configuraciones 12, 16 y 20 se determina que la
combinacin optima de acuerdo al criterio del BIC se da en el armasubsets 12. En la Figura se
presentan los resultados arrojados por dicha funcin, en los cuales las casillas marcadas o pintadas
14

BIC

(Intercept)
AR-lag1
AR-lag2
AR-lag3
AR-lag4
AR-lag5
AR-lag6
AR-lag7
AR-lag8
AR-lag9
AR-lag10
AR-lag11
AR-lag12
error-lag8
error-lag9
error-lag10
error-lag11
error-lag12
error-lag1
error-lag2
error-lag3
error-lag4
error-lag5
error-lag6
error-lag7

en la parte AR(p) y MA(q) hacen referencia a aquellos parmetros k y k diferentes de


cero; para las 12 configuraciones se prefiere la segunda lnea donde se hace la deteccin del
modelo: ARMA(8,8) con 4 , 8 y 8 0 , mas tambin se detectan como posible modelo un
ARMA(1,11)para este mismo tablero y los mejores modelos para las configuraciones de 16 y 20
son respectivamenteARMA(2,15) y ARMA(6,20)
Las salidas de programa R se presenta a continuacin en la Figura , Figura y Figura 9

-7.2
-5.1
-2.3
-1.6
1.6
4.3
7.7
11
15

Figura 7.Resultado de la funcin armasubsets() sobre Residuales para 12 configuraciones


La ecuacin terica del modelo ARMA (8,8) se escribe de la siguiente forma:

Et =4 Et 4 +8 E t8 +8 at 8 +at con at RBN (0, 2a)( 8)

BIC

(Intercept)
AR-lag1
AR-lag2
AR-lag3
AR-lag4
AR-lag5
AR-lag6
AR-lag7
AR-lag8
AR-lag9
AR-lag10
AR-lag11
AR-lag12
AR-lag13
AR-lag14
AR-lag15
AR-lag16
error-lag12
error-lag13
error-lag14
error-lag15
error-lag16
error-lag1
error-lag2
error-lag3
error-lag4
error-lag5
error-lag6
error-lag7
error-lag8
error-lag9
error-lag10
error-lag11

La ecuacin terica del modelo ARMA (1,11) se escribe de la siguiente forma:

-4.6
-4.2
-3.9
-3.7
-2.2
-0.5
1.6
3.9
6.5

Et =1 E t1+ 11 at 11 +at con at RBN (0, 2a)( 9)

15

Figura 8. Resultado de la funcin armasubsets() sobre Residuales para 16 configuraciones

La
ecuacin
terica del

modelo ARMA (2,15) se escribe de la siguiente forma:

Et =2 E t2 +9 at 9+ 15 a t15+ at con a t RBN (0, 2a)(10)


La ecuacin terica del modelo ARMA (4,9) se escribe de la siguiente forma:

BIC

(Intercept)
AR-lag1
AR-lag2
AR-lag3
AR-lag4
AR-lag5
AR-lag6
AR-lag7
AR-lag8
AR-lag9
AR-lag10
AR-lag11
AR-lag12
AR-lag13
AR-lag14
AR-lag15
AR-lag16
AR-lag17
AR-lag18
AR-lag19
AR-lag20
error-lag16
error-lag17
error-lag18
error-lag19
error-lag1
error-lag2
error-lag3
error-lag4
error-lag5
error-lag6
error-lag7
error-lag8
error-lag9
error-lag10
error-lag11
error-lag12
error-lag13
error-lag14
error-lag15
error-lag20

Et =2 E t2 +4 Et 4 +7 at 7+ 9 at9 + at con at RBN (0, 2a )(11)

-6.6
-5.9
-4.9
-3.2
-3.2
-1.3
-0.47
0.33
2.6

Figura 9. Resultado de la funcin armasubsets() sobre Residuales para 20 configuraciones


La ecuacin terica del modelo ARMA (6,20) se escribe de la siguiente forma:
2

Et =6 E t6 +19 at 19+20 at 20+ at con at RBN (0, a )(12)


La ecuacin terica del modelo ARMA (20,19) se escribe de la siguiente forma:

Et =6 E t6 +20 E t20 +10 at10 +19 at 19 +a t con at RBN (0, 2a )(13)


La ecuacin terica del modelo ARMA (10,19) se escribe de la siguiente forma:
16

Et =6 E t6 +10 E t10 +11 at 11 +19 at 19 +20 at 20+a t con at RBN (0, a )(14)

SelectModel:
Aunque con la ACF y PACF se concluy que podra tomarse en cuenta un modelo AR(5), se corri
la funcin SelectModel() para evaluar otros posibles modelos que se puedan ajustar a los residuales
del modelo seleccionado en laFigura se presenta la salida de R para esta funcin

Figura 10. Salida R para la funcin SelecModel


Tabla 6. Modelos candidatos por Selecmodel() bajo AIC
Orden p

AIC-Exacto

AIC-Aproximado

2049.938

-16.0586

2051.937

-14.9224

2053.153

-14.8059

Tabla 7. Modelos candidatos por Selecmodel() bajo BIC


Orden p

BIC-Exacto

BIC-Aproximado

1
2

2058.701
2062.870

-4.2370
-1.8747

2064.886

-5.0113

Observando laTabla 6 y Tabla 7se pueden ver los resultados arrojados por la funcin SelectModel(),
segn dos criterios. Bajo el criterio del AIC, en primer lugar, se sugiere un modelo AR(5), lo que
confirma lo observado en la ACF y la PACF; por otro lado de acuerdo con el criterio del BIC se
sugiere como mejor modelo un AR(1).
La ecuacin terica del modelo AR(1) se escribe de la ecuacin (15) y la del modelo AR(5) se
postul previamente en la ecuacin (6).

17

Et =1 Et 1 +a t Donde at RBN ( 0, 2a) (15)


Auto.arima()
Identificacin de modelos usando funcin auto.arima
Esta funcin se aplic a los residuales ^
Et sin convertir en serie de tiempo obteniendo los
siguientes resultados presentados en la Tabla 8
Tabla 8. Modelos candidatos con

^
Et

Modelo AIC
AR(1)

sin convertir
Modelo BIC
AR(1)

En la Figura 4 se presentan las salidas de R al usar tal funcin bajo criterio AIC y BIC:

Figura 41. Salida R para auto.arima sin convertir a Serie

La funcin auto.arima sobre ^


Et seleccion el mismo modelo AR(1) tanto bajo el criterio de AIC
como de BIC. La ecuacin terica de tal modelo es la ecuacin (15).

Tabla 9. Estimaciones del modelo AR(1) seleccionado


AR(1)
Estimacin
Error Estndar
AIC=2238.8

1
0.4924
0.1127
AICC=2239
BIC=2243. 15

18

En la criterio BIC y AIC.se presentan los modelos identificados bajo la funcin auto.arima sobre

^
Et

convertido a serie de tiempo haciendo uso del criterio BIC y AIC.


Tabla 10. Modelos candidatos con ^
Et como serie
Modelo AIC
ARIMA(1,0,0)(2,0,0)[4]

Modelo BIC
ARIMA(1,0,0)(1,0,0)[4]

En la Figura 5 se presentan las salidas de R al usar tal funcin bajo criterio AIC y BIC:

Figura 5. Salida R para auto.arima con

En la funcin

^
Et como

^
auto.arima sobre
Et
convertido serie de
tiempo,
usando criterio AIC y BIC arroj un modelo ARIMA (p,q,d) (P,D,Q)[4] con D igual a cero, lo que
implica que los ^
Et sigue un proceso estacionario, los modelos resultantes son ARIMA(1,0,0)
(2,0,0)[4] yARIMA(1,0,0)(1,0,0)[4], estos modelo intentan modelar todos los rezagos que son
bastante cercanos a las bandas de rechazo, las ecuacinesdel modelo terico son la (16) y (17)
respectivamente.

Et =1 ( Et 1) + 1 ( Et 4 ) +2 ( Et 8 ) +1 1 ( Et 5 ) + 1 2 ( Et9 ) + at ,
con at RBN ( 0, 2a ) (16)
Et =1 ( Et 1) + 1 ( Et 4 ) +1 1 ( Et 5 )+ at con a t RBN ( 0, 2a ) (17)
Las estimaciones del modelo arrojadas por R se presentan en la Tabla 11 y Tabla 12

19

Tabla 11. Estimaciones del modelo AR(1)*AR(2)[4]

1
Estimacin
Error Estndar
AIC=2228.17

0.4912
0.1108
AICc=2228.84

2
0.4983
0.1229
BIC=2236.87

-0.2316
0.1241

Tabla 12. Estimaciones del Modelo AR(1)*AR(1)[4]

Estimacin
Error Estndar
AIC=2229.51

0.5023
0.1088
AICc=2229.91

0.4152
0.1163
BIC=2236.04

3.c. MODELOS PROPUESTOS DE REGRESIN GLOBAL CON ERRORES


ESTRUCTURALES ARMA
Partiendo de todos los posibles modelos que pudiesen ajustarse a la serie, mencionados en el punto
anterior, se procede a postular 3 como finalistas as: Uno es el mejor modelo de regresin con
errores ARMA segn funcin R armasubsets(), otro es el mejor modelo de regresin con errores
ARMA(p,q)(P,Q)[4] y el ltimo es el mejor modelo con errores ARMA(p,q) que se pudo identificar
sobre los residuales estructurales sin fecha, con ACF-PACF, auto.arima, SelecModel y EACF.
3.c.1. Mejor Modelo con armasubsets()
ARMA(4,9) con phi2, phi4, theta1, theta7 y theta9 distintos de cero
Este modelo fue identificado inicialmente por la funcin armasubsets 16 como un modelo
ARMA(4,9) con phi2, phi4, theta7 y theta9 distintos de cero, aunque se rechaz para ese modelo la
hiptesis de ruido blanco, por lo que se decidi agregar el parmetro theta1 al modelo despus de
realizar los respectivos anlisis de eleccin, el modelo del error se postula como sigue:

Et =2 Et 2 + 4 Et 4 +at + 1 at1 +7 at 7+ 9 at 9 Donde at RBN ( 0, 2a )


Tabla 13: Parmetros estimados modelo ARMA(4,9)
Parmetro

2
4
1
7
9

Estimacin
0.161541632
0.393576627
0.482676900
-0.002663266
-0.005483377

s.e
0.1291165
0.1180222
0.1280808
0.1575434
0.1424828

20

El modelo ajustado se escribe de la siguiente forma:

^
^
.
Et =0.1615 ^
Et 2 +0.3936 ^
Et 4 +0.4827 ^
at10.0027 ^
at7 0.0055 a^
t9
3.c.2. Mejor Modelo De Regresin con Errores ARMA(p,q)(P,Q)[4]
AR (1)xAR(2)[4]: Identificado a partir de la funcin auto.arima tomando los residuales del modelo
como serie de tiempo, es decir, con fechas. El modelo considerado con sus respectivos supuestos es:

1 ( B1 ) 2 ( B4 ) E t=at , con at RB N ( 0, 2a )
Siendo:

1 ( B 1 )=11 B

2 ( B4 ) =1 1 B4 2 B 8

Entonces se tiene que:

Et =1 Et 1 + 1 Et 4 1 1 E t5 + 2 Et 8 1 2 Et 9+ at , con at RB N ( 0, 2a )
Tabla 14. Parmetros estimados para AR(1)xAR(2)[4]
Parmetro

Estimacin
0.4911599
0.4982900
-0.2316323

1
1
2

AIC =

Error estndar
0.1108484
0.1229121
0.1241300

5.1503 x 1013

Valor Z o
4.430915
4.054037
-1.866045

BIC =

Valor P
0.0000441410
0.0001570488
0.0672753336

6.9596 x 1013

El modelo ajustado sera entonces:

^
^ t4 0.2447401 E
^ t50.2316323 ^
Et =0.4911599 ^
Et 1+ 0.4982900 E
Et 8

3.C.3. Mejor Modelo de Regresin con Errores ARMA con ACF-PACF, auto.arima,
SelecModel y EACF
Modelo AR(5):
Con estas funciones se hallaron tres modelos: AR(1), AR(5) y ARMA(1,4). Se descarta
inmediatamente el AR(1), ya que para que pudiera ser un modelo correcto, en la ACF se observara
un patrn de cola exponencial positivo o alternante; por tanto se proceder a comparar el AR(5) y el
ARMA(1,4) con criterios de calidad del ajuste, calidad de pronstico y cumplimiento de supuestos
sobre el error de ajuste.
5

Modelo AR(5):

Et = j E t j+ at , con at RB N ( 0, 2a )
j=1

Modelo ARMA (1,4):

Et=1 E t1 +at + j a t j , con at RB N ( 0, a )


2

j=1

Tabla 15: Criterios de calidad de ajuste Modelo AR(5) y Modelo ARMA (1,4)
21

Modelo
AR(5)
ARMA(1,4)

AIC

BIC
13

8.2255 x 1013
8.1020 x 1013

5.6932 x 10
13
5.6077 x 10

Segn los resultados de la Tabla 15 el modelo que mejor ajusta es el ARMA(1,4), dado que tiene
menores valores de criterios de calidad de ajuste, teniendo la misma cantidad de parmetros que el
AR(5)
Tabla 16: Criterios de calidad de pronstico Modelo AR(5) y Modelo ARMA (1,4)

Modelo
AR(5)
ARMA(1,4)

MAPE

MAE
3047740
4474249

2.092987
3.399738

RMSE
3989117
5184249

Segn los resultados de la Tabla 16 el modelo que mejor pronostica es el AR (5), dado que tiene
menores valores de criterios de calidad de pronstico en las tres medidas (MAE, MAPE Y RMSE)
Para validar los supuestos sobre los at de los modelos anteriores, se procede a realizar diferentes
test:
ACF
PACF

a ( k )=corr ( at , at +k )
H 0 : a ( k )=0 vs H 1 : a (k ) 0, k

akk =corr (at , at +k at +1 , at +2 , , at +k1 )


H 0 : akk =0 vs H 1 :akk 0, k=1, , 20

=1,2, ,20

Estadstico de prueba:

Estadstico de prueba:

^ (k )
~normal (0, 1/n)
^ (o)
2
Criterio de rechazo: |^a ( k )|>
n

^ akk ( k ) normal (0, 1/n)

^ ( k )=

Criterio de rechazo:

|^ akk ( k )|>

2
n

-Ljung Box

H 0 : ( 1 )= ( 2 ) == ( m )=0 vs H 1 : (k ) 0 Para algn k=1, 2,, m


m

Estadstico de prueba:

Q LB =n (n+2)
k=1

Criterio de rechazo:

^2 ( k )
nk

aprox

2m

Valor p=P( 2m Q LB ) pequeo.

-Shapiro-Wilk:

H 0 : at Normal vs H 1 :at Normal


22

Criterio de rechazo: Valor P muy pequeo

Figura 13. ACF Modelo AR(5)

Figura 14. PACF Modelo AR(5)

Figura 15. ACF Modelo ARMA(1,4)

Figura 16. PACF Modelo ARMA(1,4)

Tabla 17. Ljung Box Modelo AR(5)


M
Df
QLB
V p=P( 2m Q LB )
6

0.605133
6
0.9963143
9
12 6.219815 12
0.9045981
0
18Tabla
9.862755
0.9362938
18. Ljung 18
Box Modelo
ARMA(1,4)
1
M
Df
QLB
V p=P( 2m Q LB )
6
12
18

0.474298
9
4.991456
9
8.259602
4

0.9981373

12

0.9582637

18

0.9745162

23

Segn la ACF, PACF y el test Ljung Box para ambos modelos, no hay evidencia en contra del
supuesto de ruido blanco.

Figura 17. Q-Q Plot Modelo AR(5)

Figura 18. Q-Q Plot Modelo ARMA(1,4)

Tabla 19. Test de normalidad para


Modelo
Estadstico W
Valor P

AR(5)
0.9817
0.4501

at

ARMA(1,4)
0.9893
0.8481

Segn el test Shapiro Wilk y la grfica Q-Q Plot para ambos modelos, no hay evidencia en contra
del supuesto de normalidad.
En conclusin se puede decir que los errores de ajuste para ambos modelos son ruido blanco, o por
lo menos no hay evidencia fuerte que contradiga dicha hiptesis.
Finalmente se eligi el modelo AR(5) pues al compararlo con el ARMA(1,4) ganaba en pronsticos,
mientras que el segundo ganaba en ajuste, y en relacin a la validacin de supuestos ambos modelos
cumplieron con estos. Se decidi darle ms importancia a los pronsticos, dado que el inters mayor
en el anlisis de series de tiempo es planificar y tomar decisiones basados en una proyeccin, que
solo ser acertada si se tienen pronsticos prximos a lo real.
4. VALIDACIN CRUZADA
Con la Ecuacin presentada a continuacin se realiza las estimaciones apropiadas para los modelos
con todas las componentes, dado que es un modelo exponencial.

Y^t =Ajuste estructuraestimada+Ciclos estimados


Para el Modelo 1: Tendencia, Estacionalidad + ARMA(4,9)
La ecuacin del modelo es:

24

Y t =exp 0 + 1 t + 2 t + i I i ,t + Et
2

i=1

Et =2 Et 2 + 4 Et 4 +1 at 1 +7 a t7 +9 at 9 , Con at RBN ( 0, 2a )
Las estimaciones de este modelo son las estimaciones del modelo de tendencia y estacionalidad del
trabajo 1 y las estimaciones de los ciclos obtenidas anteriormente, esto se resume en la tabla 20
Tabla 20. Parmetros estimados para el modelo 1
Parmetro

2
4
1
7
9
0
1
2
1
2
3

Estimacin

Error estndar

Valor T0

0.161541632
0.1291165
1.25113107
0.393576627
0.1180222
3.33476702
0.482676900
0.1280808
3.76853422
-0.002663266
0.1575434
-0.01690497
-0.005483377
0.1424828
-0.03848450
1.754x101
5.108x10-2
343.317
2.011x10-2
2.495x10-3
8.059
-4
-5
-1.314x10
3.333x10
-3.941
-1
-2
8.147x10
3.285x10
24.797
-5.401x10-2
4.426x10-2
-1.220
-1
-2
2.770x10
3.794x10
7.301
13
AIC = 5.916581x10 , BIC = 1.428918x1014

Vp
0.2172125482
0.0016942431
0.0004662419
0.9865855353
0.9694679317
<2x10-16
4.34x10-11
0.000217
<2x10-16
0.227228
8.35x10-10

Ecuacin de ajuste del modelo ARMA (4,9)

^
y t =exp ( 1.754 x 10 1+2.011 x 102 t1.314 x 104 t 2+8.147 x 101 I 1,t 5.401 x 102 I 2,t +2.770 x 101 I 3,t )
^
^ t2 +0.393576627 ^
Et =0.161541632 E
Et 4 +0.482676900 a^ t 1 0.002663266 a^ t 7 0.005483377 a^ t 9
Para el Modelo 2: Tendencia, Estacionalidad + ARMA(1,0)(2,0)[4]
La ecuacin del modelo es:

Y t =exp 0 + 1 t + 2 t + i I i ,t + Et
2

i=1

1 (B1 ) 2 ( B4 ) E t=at , con at RBN ( 0, 2a )


1 ( B 1 )=11 B y 2 ( B4 ) =1 1 B4 2 B 8
Et =1 Et 1 + 1 Et 4 1 1 E t5 + 2 Et 8 1 2 Et 9+ at , con at RBN ( 0, 2a )
Las estimaciones de este modelo son las estimaciones del modelo de tendencia y estacionalidad del
trabajo 1 y las estimaciones de los ciclos obtenidas anteriormente, esto se resume en la tabla 21

25

Tabla 21. Parmetros estimados para el modelo 2


Parmetro

1
1
2
0
1
2
1
2
3

Estimacin
0.4911599
0.4982900
-0.2316323
1.754x101
2.011x10-2
-1.314x10-4
8.147x10-1
-5.401x10-2
2.770x10-1
AIC =

Error estndar
0.1108484
0.1229121
0.1241300
5.108x10-2
2.495x10-3
3.333x10-5
3.285x10-2
4.426x10-2
3.794x10-2
13

5.1503 x 10

Valor T0
4.430915
4.054037
-1.866045
343.317
8.059
-3.941
24.797
-1.220
7.301

Vp
0.0000441410
0.0001570488
0.0672753336
<2x10-16
4.34x10-11
0.000217
<2x10-16
0.227228
8.35x10-10

, BIC = 6.9596 x 1013

Ecuacin de ajuste del modelo ARMA (1,0)(2,0)[4]

^
y t =exp ( 1.754 x 10 1+2.011 x 102 t1.314 x 104 t 2+8.147 x 101 I 1,t 5.401 x 102 I 2,t +2.770 x 101 I 3,t )

^
Et =0.4911599 ^
Et 1+ 0.4911599 ^
Et 4( 0.49115990.4982900 ) ^
Et 50.2316323 ^
Et8 (0.4911599(0.2316
Para el Modelo 3: Tendencia, Estacionalidad + AR(5)
La ecuacin del modelo es:

Y t =exp 0 + 1 t + 2 t + i I i ,t + Et
2

i=1

Con Et = j Et j +at ,con at RBN (0, 2a )


j=1

Las estimaciones de este modelo son las estimaciones del modelo de tendencia y estacionalidad del
trabajo 1 y las estimaciones de los ciclos obtenidas anteriormente, esto se resume en la tabla 22
Tabla 22. Parmetros estimados para el modelo 3
Parmetro

1
2
3
4
5
0
1

Estimacin
0.510396704
-0.031972804
0.009788459
0.417138833
-0.311583449
1.754x101
2.011x10-2

Error estndar
0.1217236
0.1284173
0.1297386
0.1292720
0.1221779
5.108x10-2
2.495x10-3

Valor T0
4.19307989
-0.24897584
0.07544752
3.22683013
-2.55024365
343.317
8.059

Vp
0.0001028643
0.8043240238
0.9401374756
0.0021288694
0.0136343060
<2x10-16
4.34x10-11
26

2
1
2
3

-1.314x10-4
3.333x10-5
-3.941
-1
-2
8.147x10
3.285x10
24.797
-2
-2
-5.401x10
4.426x10
-1.220
2.770x10-1
3.794x10-2
7.301
13
AIC = 5.693182x10 , BIC = 8.225529x1013

0.000217
<2x10-16
0.227228
8.35x10-10

Ecuacin de ajuste del modelo AR(5)

^
y t =exp ( 1.754 x 10 1+2.011 x 102 t1.314 x 104 t 2+8.147 x 101 I 1,t 5.401 x 102 I 2,t +2.770 x 101 I 3,t )
^
^ t 3 +0.417138833 E
^ t4 0.311583449
Et =0.510396704 ^
Et 10.031972804 ^
Et 2+ 0.009788459 E

Luego de observar todos los modelos se observan sus medidas de ajuste, AIC y BIC en cada una de
las tablas en la parte inferior estos criterios fueron calculados de la siguiente forma.

AIC log

1
a^ 2 +2 k /n
n t =1 t

1
BIC log a^ 2t + k log(n)/n
n t =1
Con k: nmero de parmetros,

a^ 2t : residual de ajuste y n: el total de datos.

En la tabla 23 se presenta un resumen de los criterios de calidad de ajuste.

Tabla 23. Criterios de Calidad de Ajuste


MODELOS
ESTRUTURA
ARMA(4,9)
ARMA(1,0)(2,0)
[4]
AR(5)

AIC
BIC
13
7.761958x10 9.487236x1013
5.916581x1013 1.428918x1014

5.1503 x 1013 6.9596 x 1013


5.693182x1013 8.225529x1013

Tambien se analiza por medio del metodo grafico, En la Figura 19, se presentan el ajuste de los de
los modelos presentados a la serie de tiempo. Al observar los criterios de calidad vemos un cambio
significativo entre el modelo global y los modelos de ajuste con ciclos, observando las graficas de
los ajustes de los modelos no se logra notar gran diferencia entre los modelos pero si se alcanza a
tener en cuenta la mejoria explicada por estos modelos comparando con el modelo explicado con
tendencia y estacionalidad.
Figura 19 : Grafica de ajuste de los modelos ARMA junto con la tendencia y estacionalidad

27

Luego de saber las que el mejor modelo ajustado resulto ser una estructura con presencia de ciclos
del modelo 2 ARMA (1,0)(2,0)[4] observado en el AIC y BIC, y en las grficas. Se contina con el
anlisis de residuales con el fin de observar la presencia de correlacin

5. ANLISIS DE RESIDUALES Y VALIDACIN DE SUPUESTOS


Se verificar si se cumple

at un RB N (0, a2)

at es ruido blanco es necesario probar que at y at +k estn


Para probar que
at +k =0 , esto no implica independencia, que es la condicin
incorrelacionados (corr( at ,
necesaria para el ruido blanco, pero por lo menos no la contradice. Para probar esto se usan la ACF,
la PACF y el test Ljung Box. Adems, si no hay evidencia fuerte en contra del supuesto de que
28

at sea un ruido blanco, entonces se procede a probar que dichos errores tienen una distribucin
normal, para esto se cuenta con el test Shapiro-Wilk y con un el grfico normal QQ-plot.

2e+07
1e+07
0e+00

residuals(Arma4_9)

-2e+07

-1e+07

0e+00
-2e+07

-1e+07

residuals(Arma4_9)

1e+07

2e+07

Antes de realizar las pruebas se analizarn los residuales contra el tiempo y los residuales contra
valores ajustados de los tres modelos elegidos.

10

20

30

40

50

60

5.0e+07

1.0e+08

Time

2.0e+08

Figura 21. Residuales vs ajustados Modelo 1

0.0e+00

residuals(arima5)

-2.0e+07

-1.5e+07

-1.0e+07

-5.0e+06
-2.0e+07

-1.5e+07

-1.0e+07

-5.0e+06

0.0e+00

5.0e+06

5.0e+06

1.0e+07

1.0e+07

1.5e+07

1.5e+07

Figura 20. Residuales vs tiempo Modelo 1

residuals(arima5)

1.5e+08

as.numeric(ytArma4_9)

2000

2005

2010

5.0e+07

1.0e+08

Time

1.5e+08

2.0e+08

as.numeric(yttarima5)

1e+07
0e+00

residuals(Ar5)

-1e+07

0e+00
-1e+07

residuals(Ar5)

1e+07

Figura 22. Residuales vs tiempo Modelo 2 Figura 23. Residuales vs ajustados Modelo 2

10

20

30

40

50

60

Time

Figura 24. Residuales vs tiempo Modelo 3

-5000000

5000000

10000000

15000000

as.numeric(ajusteAr5)

Figura25. Residuales vs ajustados Modelo 3

De las Figuras 21, 23 y 25, se observa que la nube de puntos est distribuida alrededor de la media
cero, a excepcin de unos puntos atpicos, sin embargo lo que importa es analizar la forma general,
por lo tanto se puede decir que hay una varianza constante alrededor de la media cero.
De las Figuras 20,22 y 24 se ve un patrn que si bien conserva un poco los ciclos, ya se ve un poco
ms aleatorio en comparacin con los residuales del modelo global elegido en el trabajo 1 como el
29

mejor, sin embargo no se ve ningn patrn muy marcado viole el supuesto de independencia del
error de ajuste para los tres modelos modelo.

-0.2

-0.2

-0.1

0.0

Partial ACF

0.0
-0.1

ACF

0.1

0.1

0.2

0.2

Nota: Los test que se usarn a continuacin ya fueron explicados en el punto 3.C.3.

10

15

20

10

Lag

15

20

15

20

15

20

Lag

-0.2

-0.2

-0.1

0.0

Partial ACF

0.0
-0.1

ACF

0.1

0.1

0.2

0.2

Figura 26. ACF y PACF Modelo 1

10

15

20

10

Lag

Lag

-0.2

-0.2

-0.1

0.0

Partial ACF

0.0
-0.1

ACF

0.1

0.1

0.2

0.2

Figura 27. ACF y PACF Modelo 2

10

15

20

10

Lag

Lag

Figura 28. ACF y PACF Modelo 3


No hay evidencia en contra de que at es un ruido blanco para ninguno de los modelos, dado que
en ninguna de las 6 grficas hay rezagos.
M
6
12
18

Tabla 24. Ljung Box Modelo 1


Df
QLB
V =P( 2 Q
p

2.066714
7.434486
10.411298

6
12
18

LB

0.9134618
0.8276174
0.9176511
30

Figura 25. PACF, modelo 4.

Tabla 25. Ljung Box Modelo 2


2
Df
QLB
V =P( Q

M
6
12
18

1.170766
3.336333
6.795258

0.6051339
6.2198150
9.8627551

LB

LB

0.9783040
0.9926676
0.9917423

Tabla 26. Ljung Box Modelo 3


Df
QLB
V =P( 2 Q

M
6
12
18

6
12
18

6
12
18

0.9963143
0.9045981
0.9362938

Para las tres pruebas el valor P es muy alto y por esto no se rechaza Ho, por tanto no hay evidencia en

at

contra del supuesto de ruido blanco para

en ninguno de los modelos.


Normal Q-Q Plot

statistic
0.981721116848758
p.value
0.450105882427475
method
Shapiro-Wilk normality test
data.name
residuals(Ar5)

Theoretical Quantiles

-1e+07

-1.0e+07
-1

-2.0e+07

-2

0e+00

Sample Quantiles

1e+07

1.0e+07
Sample Quantiles

1e+07
0e+00

Sample Quantiles

-1e+07
-2e+07

Normal Q-Q Plot

statistic
0.988544800038144
p.value
0.812330593613278
method
Shapiro-Wilk normality test
data.name
residuals(arima5)

0.0e+00

2e+07

Normal Q-Q Plot


statistic
0.985309817483816
p.value
0.636041519963323
method
Shapiro-Wilk normality test
data.name
residuals(Arma4_9)

-2

-1

-2

Theoretical Quantiles

Figura 27. Q-Q Plot Modelo 1

-1

Theoretical Quantiles

Figura 28. Q-Q Plot Modelo 2 Figura 29. Q-Q Plot Modelo

Tabla 27. Test de Shapiro-Wilk para at


Modelo
ARMA(4,9) AR (1)xAR(2)[4]
Estadstico W
0.9853
0.9885
Valor P
0.636
0.8123

AR(5)
0.9817

0.4501

Segn las tres grficas para probar normalidad, se puede decir que estas apoyan el supuesto de que
at se distribuye normal, dado que los puntos se ajustan bien a una lnea recta, sin contar los de
los extremos que son puntos atpicos, dicha hiptesis se rectifica con la prueba de Shapiro-Wilk,
cuyos valores P obtenidos fueron muy grandes.
Se prueba entonces que

at un RB N ( 0, a2) .

31

6. PRONSTICOS VALIDACIN CRUZADA


A partir de las ecuaciones de ajuste halladas se presentan las ecuaciones de pronstico, que son
inherentes a cada uno de los modelos propuestos; as mismo, despus de las ecuaciones de
pronsticos y los valores puntuales se tabulan las medidas de precisin de pronsticos puntuales:

Para el ARMA(4, 9) con phi2, phi4, theta1, theta7 y theta9 distintos de cero:

1
2
4
2
1
^
Estructura 65 ( L ) e xp ( 1.754 10 +2.169 10 ( 65+ L )1.632 10 ( 65+ L ) +7.950 10 1,65 +L 5.244 10
^
^
^
^
^
^
Ciclos65 (L)=0.1615 E
65 ( L1)+ 0.3936 E 65 ( L4 )+ 0.4827 a
151 (L1)0.0027 a
151 (L7)0.0055 a
151 (L9

Luego, el pronstico del modelo est dado por la ecuacin:

^
Ciclos65 (L)
Y^ 65 (L)=Estructura65 ( L ) + ^
Tabla 28: Pronsticos puntuales obtenidos con el modelo ARMA(4, 9)
Perodo
L
Valor Real
Pronstico
2013 Q2
1
83016753
84745958
2013 Q3
2
110468924
115331396
2013 Q4
3
91802127
90308487
2014 Q1
4
2088913801
201792698
En la tabla 28 se pueden apreciar los pronsticos puntuales realizados con el modelo ARMA(4,9)
con los parmetros phi2, phi4, theta1, theta7 y theta9 distintos de cero, donde se evidencia que los
valores pronosticados son relativamente cercanos a los valores reales. A este modelo no se le
presentan los intervalos de prediccin, ya que por ser una funcin exponencial no puede ser
representada como una regresin lineal y esto impide que se pueda realizar dicho clculo. El
modelo predijo que en los trimestres 2013-2, 2013-3, 2013-4 y 2014-1 las ventas de libros,
papelera, peridicos y revistas a precios corrientes en los grandes almacenes e hipermercados
minoristas seran de 84745958000 pesos, 115331396000 pesos, 90308487000 pesos y
201792698000 pesos respectivamente.

Para el Modelo de Regresin con Errores AR (1)xAR(2)[4]:

^
Estructura 65 ( L ) e xp ( 1.754 101 +2.169 102 ( 65+ L )1.632 104 ( 65+ L )2 +7.950 101 1,65 +L 5.244 10
^
^ 65 ( L4 )0.2447401 ^
Ciclos65 (L)=0.4911599 ^
E65 ( L1)+0.4982900 E
E65 (L5)0.2316323 ^
E65 ( L8)
As, el pronstico del modelo est dado por la ecuacin:

^
Ciclos65 (L)
Y^ 65 (L)=Estructura65 ( L ) + ^
Tabla 29: Pronsticos puntuales obtenidos con el modelo AR(1)xAR(2)
Perodo
L
Valor Real
Pronstico
32

2013 Q2
2013 Q3
2013 Q4
2014 Q1

1
2
3
4

83016753
110468924
91802127
2088913801

85018534
116350130
89906051
200355463

En la Tabla 29 se pueden apreciar los pronsticos puntuales obtenidos con el modelo de regresin
con errores AR(1)xAR(2), donde se evidencia que los valores pronosticados son muy cercanos a
los valores reales. A este modelo no se le presentan los intervalos de prediccin, ya que por ser una
funcin exponencial no puede ser representada como una regresin lineal y esto impide que se
pueda realizar dicho clculo.
El modelo predijo que en los trimestres 2013-2, 2013-3, 2013-4 y 2014-1 las ventas de libros,
papelera, peridicos y revistas a precios corrientes en los grandes almacenes e hipermercados
minoristas seran de 85018534000 pesos, 116350130000 pesos, 89906051000 pesos y
200355463000 pesos respectivamente.

Para el Modelo AR (5):

1
2
4
2
1
^
Estructura 65 ( L ) e xp ( 1.754 10 +2.169 10 ( 65+ L )1.632 10 ( 65+ L ) +7.950 10 1,65 +L 5.244 10

^
^ 65 ( L1 ) 0.0319728 E
^ 65 ( L2 ) +0.0097885 ^
Ciclos65 ( L )=0.5103967 E
E65 ( L3 ) +0.4171388 ^
E65 ( L4 )0.311
Y de la misma manera, el pronstico del modelo est dado por la ecuacin:

^
Ciclos65 (L)
Y^ 65 (L)=Estructura65 ( L ) + ^

Perodo
2013 Q2
2013 Q3
2013 Q4
2014 Q1

Tabla 30: Pronsticos puntuales obtenidos con el modelo AR(5)


L
Valor Real
Pronstico
1
83016753
83344820
2
110468924
113890405
3
91802127
90428291
4
2088913801
201846225

En la tabla 30 se pueden apreciar los pronsticos puntuales obtenidos con el modelo AR(5), donde
se evidencia que los valores pronosticados son muy cercanos a los valores reales. A este modelo no
se le presentan los intervalos de prediccin, ya que por ser una funcin exponencial no puede ser
representada como una regresin lineal y esto impide que se pueda realizar dicho clculo.
El modelo predijo que en los trimestres 2013-2, 2013-3, 2013-4 y 2014-1 las ventas de libros,
papelera, peridicos y revistas a precios corrientes en los grandes almacenes e hipermercados
minoristas seran de 83344820000 pesos, 113890405000 pesos, 90428291000 pesos y
201846225000 pesos respectivamente.
Medidas de precisin de pronstico
Tabla 31: Medidas de precisin de pronstico
Modelo
MAE
MAPE
RMSE
Modelo Estructura
4642463
3.403318
5672526
33

Modelo Ar(5)
Modelo ARMA(4,9)
Modelo AR(1)xAR(2)[4]

3047740
3801605
4584350

2.092987
3989117
2.880069
4460237
3.474284 5372057

En la tabla 31 se aprecian los valores de las medidas de precisin de pronstico MAE, MAPE y
RMSE para cada uno de los cuatro modelos, incluyendo los tres modelos propuestos que tienen en
cuenta los ciclos y el modelo estructural que solo contiene la tendencia y la estacionalidad. Tales
valores indican que el modelo Ar(5) es el que mayor calidad de pronstico presenta, ya que posee
los valores menores en todas las medidas de prediccin en comparacin con los otros 3 modelos. De
all se concluye que el modelo que mejor pronostica es el modelo Ar(5).
Se muestran a continuacin grficamente los pronsticos ex-post de los diferentes modelos:

Figura 30. Pronsticos de los modelos propuestos


En la figura 30 se observa el comportamiento de los datos pronosticados en cada uno de los
modelos propuestos junto a los valores reales de la zona ex post. Todos los pronsticos son
relativamente cercanos entre ellos, lo que dificulta la visibilidad de los mismos, pero se alcanza a
notar que el modelo AR(5) es el que ms se acerca a la serie original; as mismo, parece ajustar muy
bien el comportamiento en ese tramo, manteniendo la misma tendencia que lleva la serie original, lo
que permitira concluir que el modelo Ar(5) es el que mantendra mejor la tendencia de la serie en
un futuro cercano, o en otras palabras se perfila como el modelo que mejor pronosticara en un
periodo ex ante adems de pronosticar mejor en el periodo ex post. La serie se model con el
principal inters de predecir comportamientos futuros de sta, como ya se haba mencionado, y es
evidente que el mejor predictor es el modelo AR(5).
34

7. CONCLUSIONES
Al usar la funcin armasubsets(), se obtuvieron 7 modelos ARMA posibles que permitieron incluir
tanto trminos autorregresivos como de medias mviles. Posteriormente, al evaluar con las pruebas
ACF y PACF si estos cumplan con el supuesto de Ruido Blanco, se observ que ninguno cumpla,
por lo que se procedi a postular un nuevo modelo ARMA modificado tomando como base aquel
que tuviera mejor calidad de pronstico y ajuste, que fue un ARMA(4,9) con

2 , 4 , 7 y 9

diferentes de 0, donde el nuevo trmino incluido fue 1 , ya que hubo un corte en k=1 en la ACF
del modelo ARMA(4,9); tambin hubo un corte en k=1 en la PACF, lo que daba indicio de que
deba incluirse el parmetro
solamente

1 , solamente

solo se incluy

1 , sin embargo al probar con las tres combinaciones (incluyendo


1 y 1 y

1 a la vez), result ser mejor el modelo en el que

1 , por parsimonioso, mejor calidad de ajuste y pronstico y validacin de

supuestos.

El modelo 2 con error estructural modelado por un AR (1)xAR(2)[4] fue el modelo que
mejor ajust, esto est sustentado en las medidas de calidad de ajuste que fueron las
menores de entre todos los modelos.

El modelo que mejor pronostic fue el modelo 3, dado que con este se obtuvieron menores
medidas de calidad de pronstico, indicando que el error cometido al pronosticar con este
es inferior al error cometido al pronosticar con los dems modelos. Dicho modelo fue
encontrado a partir del anlisis de la PACF, encontrando un corte en k=5; esto indica que
dicho test logra identificar buenos modelos, adems de que es importante tener en cuenta
los cortes en k pequeos y especialmente si son mltiplos de s o cercanos a dicho valor.

En 2 de los mtodos empleados para identificar posibles modelos AR, MA y ARMA, se


identific un AR(1), sin embargo, dado la complejidad de la serie y su comportamiento
global, un modelo AR(1) no se considerara apropiado para modelar la serie, estos solo es
posible cuando en la ACF para los residuos estructurales del modelo se presenta un patrn
de cola exponencial positivo o un decaimiento amortiguado alternando signos, lo cual no
ocurri en este trabajo. Posteriormente se vio que at del modelo no era Ruido Blanco,
pues cortaba las bandas de rechazo y en el Test Ljung-Box presentaba bajos valores P.

Se logra observar que la modelacin del error de ajuste como un ruido blanco logra mejorar
tanto el ajuste como el pronstico de la serie, ya que anteriormente los ciclos estaban
afectando la estimacin y ahora sern explicados.

El test grfico para evaluar normalidad (Q-Q Plot) puede verse afectado por puntos
atpicos; para evitar sacar conclusiones erradas en dicho test, se deben identificar los puntos
atpicos en la grfica de residuales vs valores ajustados y no tenerlos en cuenta en el anlisis
del Q-Q Plot. En el caso de este trabajo dichos puntos generaban cierta curvatura que daba

35

indicios de no normalidad en caso de que no se tuviera en cuenta la importancia de extraer


los puntos atpicos.
REFERENCIAS
[1] DANE. (2014). Grandes Almacenes e Hipermercados Minoristas (GAHM). Bogot. Recuperado
el 29 de Abril de 2015, de: http://www.dane.gov.co/index.php/comercio-y-servicios/comerciointerno/grandes-almacenes-e-hipermercados-minoristas
[2] Gonzlez, N. G. (2013) Notas de Clase Estadstica III 3009137. Escuela de Estadstica,
Universidad Nacional de Colombia Sede Medelln.

36