Está en la página 1de 25

Estadstica III 3009137-1, semestre 02 de 2012

Grupo de Trabajo No. 01



Anlisis de Series de Tiempo: Modelos ARMA para los Residuos
Estructurales

Daniela Maya Gutirrez
1
, Carlos Jose Arango
2
y Diana Marcela Yanes
3


Fecha de entrega: de Octubre de 2012

Resumen
En este documento se analizan los residuales estructurales del mejor modelo de regresin encontrado en el
trabajo anterior, y se proponen modelos ARMA para dichos residuos.

Palabras claves: serie, ciclo, residual estructural, incorrelacin, estacionariedad.


1 Introduccin

Este documento se hace con el propsito de continuar el anlisis realizado sobre la serie de tiempo
tratada en el primer trabajo, en el que se modelaron la tendencia y la estacionalidad de una serie que
contiene la generacin total de electricidad en la industrial estadounidense entre Enero de 1985 y
Octubre de 1996. Para este segundo trabajo se tiene como propsito analizar los residuales
estructurales del mejor modelo de regresin encontrado, y se propondrn modelos AR, MA o
ARMA para dichos residuales. Mediante el uso de la estrategia de validacin cruzada, se realizarn
pronsticos para modelos que incluyan tendencia, estacionalidad y ciclos, y se compararn con los
valores reales de la serie y con las predicciones del modelo de regresin.

2 Puntos del trabajo

2.1 Punto # 1

La serie de tiempo asignada trata sobre la generacin total de electricidad entre enero de 1985 y
octubre de 1996. Los datos fueron tomados mensualmente. La serie consta de N = 142 datos. La
estrategia de validacin cruzada propone dividir esta serie en dos porciones: la primera que tendr
los primeros n = 130 datos, donde se ajustarn modelos con tendencia, estacionalidad y ciclos,
mientras que la segunda que contendr los N n = 12 ltimos datos, se reservar para comparar los
pronsticos de los modelos propuestos con los valores reales de la serie, y as evaluar la calidad de
dichas predicciones.

En el primer trabajo se propusieron modelos de la forma


t t t t
E S T Y + + =
, donde
( )
2
, 0 ~ o N E
t
(1)

En la ecuacin (1), T
t
representa la componente de tendencia, S
t
es la componente estacional y E
t
es
la componente asociada al error.

1
Estudiante Ingeniera Industrial, Universidad Nacional de Colombia Sede Medelln.
2
Estudiante Ingeniera Industrial, Universidad Nacional de Colombia Sede Medelln.
3
Estudiante Ingeniera Industrial, Universidad Nacional de Colombia Sede Medelln
Suponiendo que la componente E
t
se distribuye inicialmente como un ruido blanco normal, osea
que las observaciones E
t
son independientes, con distribucin normal de media cero y varianza
constante. Para modelar la tendencia, se propusieron tres modelos determinsticos: polinomial
cbico, polinomial de grado cuatro y polinomial de grado cinco. En cuanto a la estacionalidad, se
model utilizando variables indicadoras, tomando al mes de diciembre como el mes de referencia.
De acuerdo al primer trabajo, result que el modelo que mejor ajustaba y pronosticaba era un
modelo con tendencia polinmica de grado cinco, es decir, un modelo de regresin representado de
la forma:

Y
t
=
0
+
t
t +
2
t
2
+
3
t
3
+
4
t
4
+
5
t
5
+
i=1
11

i
I
i,t
+E
t Con
E
t
RBN(0,
2
) (2)

La tabla de parmetros estimados del modelo de regresin representado en la ecuacin (2) se
presenta a continuacin:

Tabla 1: Parmetros estimados para el mejor modelo de regresin del trabajo anterior
Parmetro Estimacin Error de
Estimacin
Valor t
P(| |>| |)


























































De la tabla 1 podemos destacar algunos sucesos:

El valor p de la prueba de significancia de la regresin es menor a 2.210
-16
, que es menor
que el nivel de significancia de la regresin ( Esto significa que para la prueba
de hiptesis:

0 ... ... :
11 1 5 4 3 0 0
= = = = = = = = o o | | | | H Vs H
1
: algn . 11 ,..., 1 , 5 ..., 0 , 0 , = = = i j
i j
o |
Se rechaza la hiptesis nula a favor de la hiptesis alternativa, para concluir que el modelo
planteado es significativo.
El valor p de la prueba individual de significancia del parmetro es 0.016154, que es
menor que el nivel de significancia de la regresin ( . Esto significa que en
presencia de las dems variables, que es el parmetro que acompaa a la variable t
5
, es
significativo.
Hay ms de un parmetro estacional individualmente significativo, lo que evidencia que s
existe una componente estacional que afecta los valores de la serie de tiempo. Los
parmetros estacionales que son significativos dan a entender que al comparar diciembre
con el mes i, hay una variacin importante de la cantidad de electricidad generada (aumento
si y disminucin si ). Los parmetros que no son significativos dan a
entender que la variacin de generacin de electricidad y el mes i no es importante.
El R
2
adj
de la regresin es 0.9436, cercano a la unidad, lo que evidencia un buen ajuste de la
curva del modelo respecto a los valores reales de la serie.

En la figura 1 se muetra la serie ajustada con la real

Time
y
t
2
1986 1988 1990 1992 1994 1996
2
0
0
2
2
0
2
4
0
2
6
0
2
8
0
3
0
0 Serie Real
Serie Ajustada Modelo Polinomial de grado 5

Figura 1: Serie real con serie ajustada.



En la figura 2 se presentan los residuales del modelo de regresin: la grfica de la izquierda muestra
los residuales contra el tiempo, y la de la derecha los residuales contra los valores predichos de la
regresin.


Figura 2: Residuales del modelo de regresin, contra el tiempo y contra predichos.

En la grfica de residuales contra el tiempo, es complicado censurar si los residuales tienen media
cero. Adems se observan patrones de crecimiento y decrecimiento sucesivos que no deberan
aparecer; vistos con detalle, dichos patrones se repiten anualmente. Esto permite intuir que en los
residuales se qued retenido un patrn estacional aleatorio que la estacionalidad determinstica
no pudo capturar y que est afectando la independencia de los residuales del modelo. En cuanto a la
grfica de residuales contra valores predichos, se puede observar que en general los valores se
encuentran, dentro de una franja constante, exceptuando algunos puntos atpicos. Lo que preocupa
de dicha grfica es que hay ms valores debajo de la lnea cero que encima de ella, lo cual significa
que tal vez la media de los errores no es cero. Por todo lo anterior, no se puede decir que los errores
del modelo de regresin no se distribuyen como un ruido blanco normal, y por lo tanto se hace
necesario modelarlos a travs de modelos AR (p), MA (q) o ARMA (p,q). Las pruebas realizadas en
el punto 2 confirmarn esta hiptesis.

2.2 Punto # 2

Para determinar el comportamiento de los errores y comenzar a ajustarlos, se supone en principio
que los errores del modelo son ruido blanco normal. Pero para concluir sobre el comportamiento
real de los errores se deber probar si est afirmacin es verdadera. Se espera por lo menos que sean
estacionarios en covarianza. Las pruebas de incorrelacin de los residuos estructurales se presentan
a continuacin.

Prueba Ljung-Box

La prueba Ljung-Box supone como hiptesis nula que las autocorrelaciones para k=1m son nulas
conjuntamente, es decir:



Si se acepta la hiptesis nula, se afirmara que el proceso es ruido blanco. Se obtuvieron los
siguientes valores de la prueba Ljung-Box.


Tabla 2: Resultados de la prueba Ljung-Box
Test Ljung-Box para del modelo de regresin



6 11.60599 6

12 16.45018 12 0.17147576
18 20.86544 18

24 25.79616 24

30 31.09779 30


Con una significancia del 95%, los valores p de la prueba Ljung-Box permiten afirmar que no se
comete un error significativo al rechazar la hiptesis nula, es decir que los errores estn
incorrelacionados, por lo tanto se puede decir que distribuyen ruido blanco.

Prueba Durbin-Watson

Esta prueba supone inicialmente que los errores estructurales son un proceso AR(1) de la siguiente
forma:


El test plantea las siguientes hiptesis:

Hiptesis Nula


Hiptesis Alternativas




La eleccin de la hiptesis alternativa se hace mediante el valor del estadstico:



Tabla 3: Resultados de la prueba Durbin-Watson
Lag

Estadstico D-W
VP >0 VP < 0
1

0.242141 1.501675 0 0.999

La prueba arroj un d=1.501675. Como entonces se selecciona la hiptesis alternativa



El valor p de esta prueba es muy cercano a cero, por lo que con seguridad se puede rechazar la
hiptesis nula y afirmar que los errores no distribuyen ruido blanco, dado que existe por lo menos
autocorrelacin positiva de orden 1.

Prueba ACF

Esta prueba grfica plantea las siguientes hiptesis



Donde . Para el caso de la serie asignada, como n=130, se tiene que m=32.

Se rechaza que los errores son ruido blanco, si para cualquier valor de , al menos uno es mayor
que .

De la grfica presentada a continuacin, no se observa que existen varios valores de donde
supera las bandas de rechazo.

Se observa ergodicidad en la prueba ACF, debido a que existe un rpido decaimiento de los datos.
Esto garantiza entonces que los errores son estacionarios en covarianza y por tanto se puede
continuar haciendo todo el anlisis del modelacin de los errores.

0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
0
.
2
ACF errores estructurales
Lag
A
C
F

Figura 3: Grfico prueba ACF para el modelo de regresin

Prueba PACF

La prueba PACF de un proceso ruido blanco debe cumplir que



Esta prueba plantea las siguientes hiptesis



Si para algn k se rechaza H
0
, se concluye finalmente que el proceso no es ruido blanco. Al igual
que la ACF, esta prueba se realiza grficamente trazando los lmites de aceptacin donde el proceso
es ruido blanco si para todo k, .

0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
0
.
2
Lag
P
a
r
t
i
a
l

A
C
F
PACF errores estructurales

Figura 4: Grfico prueba PACF para el modelo de regresin

Segn la figura 3, existen valores que superan las bandas de aceptacin exactamente en k=11,
24. Por lo anterior se concluye que el proceso no es ruido blanco.

No todas las pruebas anteriores permiten concluir que los errores no distribuyen ruido blanco, ya
que el grfico de ACF no rechaza que los errores son ruido blanco al igual que la prueba Ljung-
Box, sin embargo es importante resaltar que la PACF y la prueba DW si concluyen que los errores
estructurales no son ruido blanco.

Para identificar los posibles modelos de los errores, son de ayuda, en un principio las pruebas ACF
y PACF. La siguiente tabla ayuda a determinar el modelo a validar, observando el comportamiento
de las pruebas.

Tabla 4: Patrones en la ACF y PACF segn el tipo de proceso

Modelo ACF PACF
AR Cola Corte
MA Corte Cola
ARMA Cola Cola

La prueba ACF tiene un comportamiento de corte, por lo que no se descartara un modelo MA(q),
an no se puede proponer con seguridad si podra ser un ARMA o un AR(p) ya que la ACF Y
PACF al tener ambas un patrn de corte no proponen con seguridad un modelo. Parece que
posiblemente siga modelos ARMA, ARIMA, SARMA, SARIMA (siendo estos ltimos estudiamos
finalizando el curso).








Otra estrategia til para encontrar el orden de los modelos que se propongan es la prueba EACF.


Figura 5: Grfico EACF para el modelo de regresin

Para elegir el orden (p, q) de un modelo ARMA segn la prueba EACF, se busca encontrar el
vrtice de un triangulo tal que en su interior aparezcan ceros, por lo que vemos un ARMA(1,1) tal
como lo sealan las lneas rojas en la Figura 5. De entrada se sabe que existe la posibilidad de que
sea un modelo MA puesto que el patrn de la ACF es de corte. Se encuentra un vrtice en la
posicin 0,1 y por tanto se propone un MA (1).

2.3 Punto # 3

Identificacin de posibles modelos ARMA con mtodos automticos de R.

Los mtodos automticos permiten proponer ms modelos para los errores estructurales.

1. Funcin Selectmodel: Esta funcin automtica propuso modelo AR(1) , AR(2) y AR(3) en
donde el criterio de seleccin era el AIC. De acuerdo a lo anterior se seleccion un modelo
AR(1) por ser el mas parsimonioso, como otro posible candidato para modelar los errores.

2. Funcin autoarmafit: propone varios modelos, entre ellos MA(1) y un ARMA(1,1), de los
cuales el mejor modelo es un ARMA (1,1).

3. Funcin auto.arima: De este mtodo automtico se obtiene modelo un MA(1).

En sntesis, de las pruebas automticas y segn el anlisis de las grficas ACF y PACF se tienen
como posibles modelos para explicar el comportamiento de los errores los siguientes: AR(1),
ARMA(1,1), MA(1).


2.4 Punto # 4

a) Basado en el anlisis de las races del polinomio autorregresivo p(B) estimado, y en las
races del polinomio MA q(B) estimado, la funcin R polyroot() calcula las races de un
polinomio de grado m de la forma P(x) = a0 +a1x+a2x2 + + amxm y la funcin Mod()
calcula el mdulo de un nmero complejo, y arroja lo siguiente:

Para el modelo AR(1): r1 = -4.103406+ 0i y su mdulo es |r1| = 4.103406.
Para este modelo, como r1 > 1 entonces, el proceso AR (1) es estacionario en covarianza y en
general todo proceso AR (1) es invertible.

Para el modelo ARMA(1,1): para la parte AR(), r1= -147.0588+0i , y su mdulo es |r1| =
147.0588, para la parte Ma() , r1=-3.875969+0i, y su mdulo es |r1|=3.875969. Dado que sus races
son mayores que la unidad, se concluye que el proceso ARMA(1,1) es invertible.

Para el modelo MA(1): r1= -3.785011+0i, y su mdulo es |r1|=3.785011.
Para este modelo, dado que su raz esta fuera de la unidad, se concluye que es estacionario e
invertible.

b) Para todos los modelos ARMA identificados en el punto anterior, se construirn la ACF y la
PACF tericas, para compararlas con los resultados obtenidos en la ACF y la PACF de los
errores estructurales del modelo de regresin. Las grficas se muestran en la figuras 6 a 8.


0 5 10 15 20 25 30
k
k
0
1
ARMA(1,1)-terico
0 5 10 15 20 25 30
k
k
k
0
1
ARMA(1,1)-terico

Figura 6: ACF y PACF tericas modelo ARMA(1,1)

0 5 10 15 20 25 30
k
k
0
1
AR(1)-terico
0 5 10 15 20 25 30
k
k
k
0
1
AR(1)-terico

Figura 7: ACF y PACF tericas modelo AR(1)

0 5 10 15 20 25 30
k
k
0
1
MA(1)-terico
0 5 10 15 20 25 30
k
k
k
0
1
MA(1)-terico

Figura 8: ACF y PACF tericas modelo MA(1)



Como se recordar, el modelo ARMA (1,1) se eligi mediante mtodos automticos, y es
consecuente con la informacin brindada por la ACF y PACF muestral, que sugeran que se
modelara posiblemente por modelos ARMA entre otros. La ACF y PACF de los modelos MA (1),
AR (1) y ARMA (1,1), tienen un patrn de cierta forma parecido entre ellos, pero diferente al de la
ACF y PACF de los errores estructurales del modelo de regresin. Sin embargo, puede que el
ajuste y pronstico de modelos que involucren dichos ciclos mejoren de alguna forma los resultados
obtenidos con el modelo de regresin.

Punto # 5

A continuacin se encuentran las tablas de parmetros estimados para modelos completos (que
consideran tendencia, estacionalidad y ciclos ARMA). La tendencia y la estacionalidad se proponen
de la misma forma que en el modelo de regresin; es decir, la tendencia se modela con un
polinomio de grado cinco, y la estacionalidad con variables indicadoras, tomando a diciembre como
el mes de referencia.

Ciclo AR (1):

Modelo 1:
( )
2
1 1 t ,
11
1
,
5
5
4
4
3
3
2
2 1 0
, 0 ~ , , E
a t t t t t i
i
t i t
RBN a con a E E I t t t t t Y o | o | | | | | | + = + + + + + + + =

=



Tabla 5: Parmetros estimados para Modelo 1
Parmetro Estimacin Error estndar valor ( )
0 89
T t P >

1
|

0.2453 0.0704 3.4862 1.338710
-3

0
|
218.5237 4.2784 51.0759 1.827510
-36

1
|
-1.5898 0.5839 -2.7229
1.002010
-2

2
|
0.0966 0.0266 3.6260
9.067910
-4

3
|
-0.0017 0.0005 -3.3642
1.872210
-3

4
|

1.2210
-5
0.0001 0.1298
0.8974
5
|

-3.1310
-8
0.0000 -0.0439
0.9652
1
o

5.2065 2.1364 2.4370
2.003110
-2

2
o
-21.241 2.3622 -8.9922
1.266010
-10

3
o
-15.5016 2.4116 -6.4279
2.116810
-7

4
o
-31.0077 2.4212 -12.8065
9.064410
-15

5
o
-17.3201 2.4216 -7.1522
2.432710
-8

6
o
2.8842 2.4200 1.1918
0.2413
7
o
27.2089 2.4183 11.2513
3.551310
-13

8
o
25.5928 2.4183 10.5830
1.885110
-12

9
o
-9.2617 2.4198 -3.8274
5.126510
-4

10
o
-20.0322 2.2832 -8.7738
2.313310
-10

11
o
-22.2797 2.1556 -10.3357 3.5472
10
-12

AIC = 845.1 BIC = 899.58


Considerando que el nivel de significancia de la regresin 05 . 0 = o puede escribirse en notacin
exponencial como
2
10 5

= o , puede observarse en la tabla de parmetros estimados el parmetro
1
| asociado a la componente cclica del modelo result ser significativo en presencia de las dems
variables, debido a que su valor p es menor que el nivel . De nuevo, hay parmetros estacionales
significativos y no significativos. En esta ocasin, no se puede verificar la significancia del
parmetro , debido a que el valor p es menor que el nivel significancia de la regresin.

Ciclo ARMA(1,1):

Modelo 2:
( )
2
1
1
1 1 t ,
11
1
,
5
5
4
4
3
3
2
2 1 0
, 0 ~ , , E
a t
k
k t k t t t t i
i
t i t
RBN a con a a E E I t t t t t Y o u | o | | | | | |

=

=
+ + = + + + + + + + =

Tabla 6: Parmetros estimados para Modelo 2
Parmetro Estimacin Error estndar valor ( )
0 89
T t P >

1
|

0.0108 0.1318 0.0821 0.9349
1
u

0.2546 0.1322 1.9552 6.191110
-2

0
|
218.2460 4.1903 52.0836 3.181410
-36

1
|
-1.5451 0.5812 -2.6583
1.153010
-2

2
|
-0.0945 0.0272 3.4767
1.314110
-3

3
|
-0.0017 0.0005 -3.1264
3.437310
-3

4
|

1.1910
-5
0.0001 0.1322
0.8955
5
|

-3.0310
-8
0.0000 -0.0443
0.9649
1
o

5.2269 2.1314 2.4523
1.902910
-2

2
o
-21.229 2.4301 -8.7361
1.594110
-10

3
o
-15.4955 2.4303 -6.3759
1.948210
-7

4
o
-31.0058 2.4286 -12.7668
3.979410
-15

5
o
-17.3231 2.4279 -7.1350
1.874210
-8

6
o
2.8769 2.4280 1.1848
0.2436
7
o
27.1968 2.4290 11.1966
1.929510
-13

8
o
25.5764 2.4309 10.5212
1.127710
-12

9
o
-9.2846 2.4342 -3.8142
5.017310
-4

10
o
-20.0658 2.4025 -8.3521
4.873410
-10

11
o
-22.2757 2.1501 -10.3602 1.7333
10
-12

AIC = 846.2324, BIC = 903.58


De nuevo puede observarse en la tabla de parmetros estimados que el parmetro
1
u asociado a la
componente cclica del modelo result ser no significativos en presencia de las dems variables,
debido a que su valor p es mayor que el nivel , pero para
1
| encontramos que si es un parmetro
significativo respecto las dems variables. Puede verse, respecto al modelo 1, que aumentan los
valores obtenidos de los criterios AIC y BIC. Tal y como en el caso anterior, hay parmetros
estacionales significativos y no significativos.








Ciclo MA(1):

Modelo 3:
( )
2
1
1
t ,
11
1
,
5
5
4
4
3
3
2
2 1 0
, 0 ~ , , E
a t
k
k t k t t i
i
t i t
RBN a con a E I t t t t t Y o u o | | | | | |

=

=
= + + + + + + + =


Tabla 7: Parmetros estimados para Modelo 3
Parmetro Estimacin Error estndar valor ( )
0 89
T t P >

1
O

0.2643 0.0807 3.2764 2.249610
-3

0
|
218.2310 4.0917 53.3351 2.464910
-37

1
|
-1.5429 0.5419 -2.8473
7.073310
-3

2
|
0.0944 0.0242 3.9029
3.762410
-4

3
|
-0.0016 0.0004 -3.6769
7.269310
-4

4
|

1.1910
-5
0.0001 0.1346
0.8936
5
|

-3.0310
-8
0.0000 -0.0449
0.9644
1
o

5.2295 2.1323 2.4525
1.888710
-2

2
o
-21.2273 2.4325 -8.7264
1.304910
-10

3
o
-15.4937 2.4297 -6.3766
1.734510
-7

4
o
-31.0039 2.4276 -12.7715
2.527410
-15

5
o
-17.3220 2.4257 -7.1409
1.586610
-8

6
o
2.8785 2.4240 1.1875
0.2439
7
o
27.9761 2.4223 11.2282
1.239710
-13

8
o
25.5773 2.4202 10.5682
7.186410
-13

9
o
-9.2841 2.4177 -3.8400
4.524710
-4

10
o
-20.0656 2.2323 -8.9889
6.056610
-11

11
o
-22.2722 2.1318 -10.4476 9.9675
10
-13

AIC = 844.23 BIC = 898.72

En la tabla de parmetros estimados se observa que el parmetro
1
u asociado a la componente
cclica del modelo result ser significativa en presencia de las dems variables, debido a que su
valor p es menor que el nivel . Puede verse, respecto al modelo 1, que disminuyen los valores
obtenidos de los criterios AIC y BIC. Tal y como en el caso anterior, hay parmetros estacionales
significativos y no significativos.

Luego de comparar los valores estimados de los parmetros de tendencia y de estacionalidad en los
tres modelos, se puede ver que toman valores muy similares. Con esta informacin se puede intuir
que, muy probablemente debido a la presencia de una componente estacional aleatoria no capturada
hasta el momento, aadirle al modelo de regresin una componente ARMA no mejora el ajuste, y
muy probablemente no mejorar la capacidad de prediccin del modelo, lo cual se reflejar en los
valores MAPE de cada modelo con componente cclica.




2.6 Punto # 6

En la tabla 8 y en la figura 9 se retoman los pronsticos del modelo de regresin, realizados en el
trabajo anterior.

Tabla 8: Datos observados vs pronosticados del modelo de regresin.
Ao

Pronstico
Lim.
Inf.
Lim.
Super.
Nov
1995 237,1503 222,9806 251,320
Dec
1995 259,8544 245,2012 274,5075
Jan
1996 265,8177 250,5469 281,0885
Feb
1996 239,9137 223,9426 255,8849
Mar
1996 246,1729 229,373 262,9728
Apr 1996 231,1565 213,3895 248,9236
May 1996 245,2974 226,4156 264,1791
Jun 1996 265,9152 245,7635 286,067
Jul 1996 290,608 269,0241 312,1919
Aug 1996 289,3103 266,1261 312,4945
Sep 1996 254,7167 229,7588 279,6747
Oct 1996 244,1425 217,2322 271,0528
MAPE 1,280282342

Time
e
l
e
c
t
2
n
u
e
v
o
1995.8 1996.0 1996.2 1996.4 1996.6
2
2
0
2
4
0
2
6
0
2
8
0
3
0
0
3
2
0
Original
Pronstico Modelo Polinomial de grado 5


Figura 9. Pronsticos con modelo de regresin.



A continuacin se muestran los pronsticos obtenidos con cada uno de los modelos ajustados en el
punto anterior.



Modelo 1: AR (1)
Tabla 9: Pronsticos del Modelo AR (1) IP 95% y MAPE
Periodo Prediccin Lm. Inf Lm. Sup.
Nov 1995 235.5891 225.0197 246.1585
Dic 1995 259.0867 248.2040 269.9694
Ene 1996 264.9463 254.0450 275.8476
Feb 1996 238.9867 228.0843 249.8891
Mar 1996 245.1448 234.2423 256.0473
Abr 1996 230.0067 219.1042 240.9092
May 1996 244.0129 233.1104 254.9154
Jun 1996 264.4832 253.5807 275.3857
Jul 1996 289.0158 278.1134 299.9183
Ago 1996 287.5444 276.6420 298.4469
Sep 1996 252.7655 241.8630 263.6680
Oct 1996 241.9956 231.0931 252.8980
MAPE = 1.2032


Serie real, aj ustes ypronosticos
Modelo AR1
Meses
G
e
n
e
r
a
c
i

n

t
o
t
a
l

d
e

e
l
e
c
t
r
i
c
i
d
a
d
1986 1988 1990 1992 1994 1996
2
0
0
2
2
0
2
4
0
2
6
0
2
8
0
3
0
0
Original
Ajustada
Pronsticos
Time
G
e
n
e
r
a
c
i

n

t
o
t
a
l

d
e

e
l
e
c
t
r
i
c
i
d
a
d
2
3
0
2
4
0
2
5
0
2
6
0
2
7
0
2
8
0
2
9
0
Noviembre Enero Marzo Mayo Julio Septiembre
Serie Original
Pronostico Modelo AR1

Figura 10. Pronsticos con Modelo AR (1).

Se puede notar que en la Figura 10, se ve que los datos pronosticados tratan se seguir de cerca los
datos originales (obeservados). Los valores observados (reales) quedaron incluidos en los intervalos
de prediccin calculados. Ademas el MAPE de este modelo es hasta ahora mejor que el del modelo
de regresin.

Modelo 2: ARMA (1,1)
Tabla 10: Pronsticos del Modelo ARMA (1,1) IP 95% y MAPE
Periodo Prediccin Lm. Inf Lm. Sup.
Nov 1995 236.3051 225.7712 246.8391
Dic 1995 259.6693 248.7706 270.5680
Ene 1996 265.4348 254.5361 276.3355
Feb 1996 239.4827 228.5840 250.3814
Mar 1996 245.6882 234.7894 256.5869
Abr 1996 230.6124 219.7136 241.5111
May 1996 244.6878 233.7891 255.5866
Jun 1996 265.2342 254.3355 276.1329
Jul 1996 289.8490 278.9502 300.7477
Ago 1996 288.4667 277.5680 299.3654
Sep 1996 253.7816 242.8829 264.6803
Oct 1996 243.1086 232.2099 254.0074
MAPE = 1.2437

Serie real, aj ustes ypronosticos
Modelo ARMA11
Meses
G
e
n
e
r
a
c
i

n

t
o
t
a
l

d
e

e
l
e
c
t
r
i
c
i
d
a
d
1986 1988 1990 1992 1994 1996
2
0
0
2
2
0
2
4
0
2
6
0
2
8
0
3
0
0
Original
Ajustada
Pronsticos
Time
G
e
n
e
r
a
c
i

n

t
o
t
a
l

d
e

e
l
e
c
t
r
i
c
i
d
a
d
2
3
0
2
4
0
2
5
0
2
6
0
2
7
0
2
8
0
2
9
0
Noviembre Enero Marzo Mayo Julio Septiembre
Serie Original
Pronostico Modelo ARMA11

Figura 11. Pronstico con Modelo ARMA (1,1).
De la Tabla 10 se puede observar que el MAPE es similar en comparacin con el modelo de
regresin. Esto se puede corroborar en la Figura 11, ya que se ve que los datos pronosticados tratan
de seguir los originales (obeservados).

Modelo 3: MA (1).
Tabla 11: Pronsticos del Modelo MA (1) IP 95% y MAPE
Periodo Prediccin Lm. Inf Lm. Sup.
Nov 1995 236.3538 225.8198 246.8878
Dic 1995 259.6910 248.7952 270.5868
Ene 1996 265.4559 254.5601 276.3518
Feb 1996 239.5060 228.6102 250.4019
Mar 1996 245.7143 234.8184 256.6101
Abr 1996 230.6419 219.7461 241.5377
May 1996 244.7202 233.8244 255.6160
Jun 1996 265.2709 254.3751 276.1668
Jul 1996 289.8890 278.9932 300.7849
Ago 1996 288.5114 277.6155 299.4072
Sep 1996 253.8307 242.9349 264.7266
Oct 1996 243.1625 232.2667 254.0583
MAPE = 1.2461


Serie real, aj ustes ypronosticos
Modelo MA1
Meses
G
e
n
e
r
a
c
i

n

t
o
t
a
l

d
e

e
l
e
c
t
r
i
c
i
d
a
d
1986 1988 1990 1992 1994 1996
2
0
0
2
2
0
2
4
0
2
6
0
2
8
0
3
0
0
Original
Ajustada
Pronsticos
Time
G
e
n
e
r
a
c
i

n

t
o
t
a
l

d
e

e
l
e
c
t
r
i
c
i
d
a
d
2
3
0
2
4
0
2
5
0
2
6
0
2
7
0
2
8
0
2
9
0
Noviembre Enero Marzo Mayo Julio Septiembre
Serie Original
Pronostico Modelo MA1

Figura 12. Pronstico con Modelo MA (1).

Se puede observar que el MAPE es similar en comparacin con el modelo de regresin, es decir la
precisin del pronstico puede ser buena. Se siguen subestimando los datos. Sin embargo en la
Figura 12, los datos pronosticados tratan de seguir los datos originales, pero siguen existiendo datos
reales que no estan incluidos en los intervalos de prediccion.

Time
E
l
e
c
t
r
i
c
i
d
a
d

t
o
t
a
l
2
3
0
2
4
0
2
5
0
2
6
0
2
7
0
2
8
0
2
9
0
Noviembre Enero Febrero Marzo Abril Mayo Junio Julio Agosto Octubre
Serie Original
Pronostico Modelo ARMA11
Pronostico Modelo AR1
Pronostico Modelo MA1

Figura 13. Valores reales y pronosticados con los 3 modelos.

Todos los modelos tienen un MAPE similar al de regresin, y aunque desde la grfica se observan
leves mejoras, en la prctica el aumento en la precisin de pronsticos es irrelevante, cuando este
aumento no es significativo como en nuestro caso, aclarando que para el modelo AR(1) contamos
con un MAPE mucho menor que el de los modelos trabajados, por lo que este modelo resulta ser el
mejor pronosticando.

2.7 Punto # 7

A continuacin se realiza la validacin de supuestos para los residuales de ajuste de los modelos
de completos planteados en el punto 5.













Modelo 1: AR (1)
Residuales Modelo AR1 vs tiempo
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
2
)
1986 1988 1990 1992 1994 1996
-
1
5
-
1
0
-
5
0
5
1
0
1
5
2
0
180 200 220 240 260 280
-
1
5
-
1
0
-
5
0
5
1
0
1
5
2
0
Residuales Modelo AR1 vs Aj ustados
as.numeric(fitted(modelo2))
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
2
)



0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
0
.
2
Series residuals(AR1)
Lag
A
C
F
0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
Lag
P
a
r
t
i
a
l

A
C
F
Series residuals(AR1)

Figura 14. Grfico Residuales, ACF y PACF Modelo AR (1).

De la Figura 14, se puede observar que en el Modelo AR (1), en la grfica de Residuales vs
ajustados se cumple el supuesto de varianza constante, ya que la dispersin alrededor de la media es
constante a lo largo del tiempo, adems en el grfico de residuales vs tiempo no se ve ningn
patrn. En las grficas, ACF se puede ver que en k=24 y en la PACF, en k=15,24, las barras
verticales se sale de la regin de aceptacin, pero de una forma no significativa a excepcin de k=24
en la PACF, por tanto sta se despreciar y existira la posibilidad de asumir que los errores de
ajuste distribuyen Ruido Blanco.






Tabla 12: Test de Ljung-Box de Modelo AR (1)
Test Ljung-Box para del modelo AR(1)

6 3.216370 6

12 7.827625 12

18 14.085198 18

24 20.578911 24

30 25.684248 30 0.6911456

De la Tabla 12 se puede concluir que como todos los Vp son mayores que =0.05; entonces se
acepta H
0
y se dice que los errores del modelo ajustado son Ruido Blanco.

Tabla 13: Test de Normalidad de Modelo AR (1).






De la Tabla 13 se puede apreciar que como que Vp=0.001156 < =0.05; entonces los errores de
ajuste no tienen distribucin normal, esto se puede corroborar en la figura 15, en la cual se observa
que el modelo se distribuye no tan idnticamente normal ya que algunos de los residuales no se
ajustan a la lnea.

-2 -1 0 1 2
-
1
5
-
5
0
5
1
0
1
5
2
0
Grafico Normal Residuales Modelo AR1
Theoretical Quantiles
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s

Figura 15. Grfico Normalidad de modelo AR (1).









Test de Shapiro-Wilk
w 0.9624
Valor p 0.001156

Modelo 2: ARMA (1,1).

Residuales Modelo ARMA11 vs tiempo
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)
1986 1988 1990 1992 1994 1996
-
1
5
-
1
0
-
5
0
5
1
0
1
5
2
0
180 200 220 240 260 280
-
1
5
-
1
0
-
5
0
5
1
0
1
5
2
0
Residuales Modelo ARMA11 vs Aj ustados
as.numeric(fitted(modelo1))
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
1
)

0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
0
.
2
Series residuals(ARMA11)
Lag
A
C
F
0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
Lag
P
a
r
t
i
a
l

A
C
F
Series residuals(ARMA11)

Figura 16. Grfico Residuales, ACF y PACF Modelo ARMA (1,1).

De la Figura 16 se puede observar que en el Modelo ARMA (1,1), en la grfica de Residuales vs
ajustados se cumple el supuesto de varianza constante, ya que la dispersin alrededor de la media es
constante a lo largo del tiempo, adems en el grfico de residuales vs tiempo no se ve ningn
patrn. En las grficas, ACF en k= 24 no es tan significante la salida de la barra, por lo que se
concluye que ningn k se sale de ninguna barra y en la PACF, en k=15,24, las barras verticales se
sale de la regin de aceptacin, pero de una forma poco significativa, excepto en el caso de k=24,
por tanto sta se despreciar y se asumir que los errores de ajuste distribuyen Ruido Blanco,
informacin que corroboraremos con la tabla Ljung-Box.





Tabla 14: Test de Ljung-Box de Modelo ARMA (1,1)
Test Ljung-Box para del modelo ARMA(1,1)

6 2.271464 6

12 6.723238 12

18 13.042238 18

24 19.666083 24

30 24.832683 30 0.7331217


De la Tabla 14 se puede concluir que como todos los Vp son mayores que =0.05; entonces se
acepta H
0
y se dice que los errores del modelo ajustado son Ruido Blanco.

Tabla 15: Test de Normalidad de Modelo ARMA (1,1).






De la Tabla 19 se puede apreciar que como que Vp=0.001090 < =0.05; entonces los errores de
ajuste no tienen distribucin normal, esto se puede corroborar en la figura 17, en la cual se observa
que el modelo se no distribuye idnticamente normal ya que algunos de los residuales no se ajustan
a la lnea.
-2 -1 0 1 2
-
1
5
-
5
0
5
1
0
1
5
2
0
Grafico Normal Residuales Modelo ARMA11
Theoretical Quantiles
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s

Figura 17. Grfico Normalidad de modelo ARMA (1,1)







Test de Shapiro-Wilk
w 0.9621
Valor p 0.001090

Modelo 3: MA (1)
Residuales Modelo MA1 vs tiempo
Time
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
3
)
1986 1988 1990 1992 1994 1996
-
1
5
-
1
0
-
5
0
5
1
0
1
5
2
0
180 200 220 240 260 280
-
1
5
-
1
0
-
5
0
5
1
0
1
5
2
0
Residuales vs Aj ustados
as.numeric(fitted(modelo3))
r
e
s
i
d
u
a
l
s
(
m
o
d
e
l
o
3
)



0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
Lag
P
a
r
t
i
a
l

A
C
F
Series residuals(MA1)
0 5 10 15 20 25 30
-
0
.
2
-
0
.
1
0
.
0
0
.
1
0
.
2
Series residuals(MA1)
Lag
A
C
F

Figura18. Grfico Residuales, ACF y PACF Modelo MA (1).

De la Figura 18, se puede observar que en el Modelo MA (1), en la grfica de Residuales vs
ajustados se cumple el supuesto de varianza constante, ya que la dispersin alrededor de la media
es constante a lo largo del tiempo, adems en el grfico de residuales vs tiempo no se ve ningn
patrn. En las grficas, ACF se sale k= 15,11,24, de las barras de manera significativa y en la
PACF, en k=24, la barra vertical se sale de la regin de aceptacin, pero de una forma no
significativa, por tanto sta se despreciar. De acuerdo a lo anterior no se asumir que los errores de
ajuste distribuyen Ruido Blanco.






Tabla 16: Test de Ljung-Box de Modelo MA (1)
Test Ljung-Box para del modelo MA(1)



6 2.275177 6

12 6.720239 12

18 13.024340 18

24 19.642678 24

30 24.808180 30 0.7342993

Finalmente por medio de la Tabla 20 se puede concluir que como todos los Vp son mayores que
=0.05; entonces se acepta H
0
y se dice que los errores del modelo ajustado son Ruido Blanco.

Tabla 17: Test de Normalidad de Modelo MA (1)





De la Tabla 17 se puede apreciar que como que Vp=0.001095 < =0.05; entonces los errores de
ajuste tienen distribucin normal, esto se puede corroborar en la figura 19, en la cual se observa
que el modelo se no distribuye idnticamente normal ya que algunos de los residuales no se ajustan
a la lnea.

-2 -1 0 1 2
-
1
5
-
5
0
5
1
0
1
5
2
0
Grafico Normal Residuales Modelo MA1
Theoretical Quantiles
S
a
m
p
l
e

Q
u
a
n
t
i
l
e
s

Figura 19. Grfico Normalidad de modelo MA (1).


3. Conclusiones

Una de todas la estrategias para complementar la modelacin por regresin son los modelos
ARMA; en los talleres realizados en clase todos los residuales de ajuste de modelos propuestos
satisfacan distribucin ruido blanco y mejoraban significativamente ajuste y pronstico, sin
embargo, en este caso, esto no siempre se va a cumplir. En el caso de la serie de tiempo que habla
sobre la totalidad de electricidad generada, se satisfizo el supuesto de ruido blanco en algunos los
Test de Shapiro-Wilk
w 0.9621
Valor p 0.001095
modelos propuestos, y aunque la calidad de ajuste y pronostico mejoraban, estos valores no eran
significativamente altos o bajos respecto al del modelo de regresin. Debido a que ningn modelo
cumpli el supuesto de normalidad no se tiene evidencia suficiente para decir cul es el modelo ms
adecuado, pero basndonos nicamente en su capacidad de ajuste y de pronstico, y teniendo en
cuenta que finalmente los errores distribuyen ruido blando, el mejor modelo seria un AR(1). Sin
embargo sera conveniente encontrar un modelo ms adecuado para la serie como por ejemplo un
modelo SARMA. A lo largo de este trabajo, se encontraron diferentes contradicciones entre los
resultados encontrados con los diferentes procedimientos, por esto, es importante no centrar los
anlisis de los modelos en un solo resultado, sino en una comparacin global entre todas las pruebas
realizadas a los modelos implementados.

También podría gustarte