Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesion5 Series Temporales
Sesion5 Series Temporales
SERIES TEMPORALES
Autores: Manuel Terrdez (mterradez@uoc.edu), ngel A. Juan (ajuanp@uoc.edu)
ESQUEMA DE CONTENIDOS__
________________________
Medias mviles
Series Temporales
Anlisis de la serie
Anlisis de la tendencia
Mtodo de descomposicin
Autocorrelacin
Modelo combinado
INTRODUCCIN
___________________
Series Temporales
OBJETIVOS
________________________
CONOCIMIENTOS PREVIOS
___________________________________
Aparte de estar iniciado en el uso del paquete estadstico Minitab, resulta muy conveniente
haber ledo con profundidad los siguientes math-blocks:
Estadstica descriptiva.
CONCEPTOS FUNDAMENTALES
______________________________
Los pasos 2 y 3 se pueden hacer con Minitab mediante las opciones Stat > Time
Series > Lag , y Calc > Calculator, o bien directamente con la opcin
Stat > Time Series > Differences, como se muestra a continuacin:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Series Temporales
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Series Temporales
200
DIFER
100
0
-100
-200
-300
Index
10
20
30
40
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Series Temporales
Anlisis de la tendencia
El anlisis de la tendencia es un mtodo que consiste en ajustar un modelo de
tendencia general a una serie temporal con el fin de realizar predicciones. Se suele
utilizar cuando la serie no contiene componente estacionario alguno.
Los datos deben estar todos en la misma columna. Minitab permite elegir entre cuatro
modelos diferentes: lineal, cuadrtico, exponencial, y curva en forma de S. En el caso
de elegir este ltimo, es necesario eliminar de la columna todas las casillas que no
contengan datos vlidos (missing data).
El programa ofrece tres medidas para estimar la bondad del ajuste:
MAPE =
MAD =
MSD =
(y t y t ) / y t
n
100
(y t 0)
y t y t
n
(y t y t )
n
y
En las expresiones anteriores, y t representa la observacin, t representa el valor
pronosticado, y n representa el nmero de predicciones a realizar.
Para las tres medidas, cuanto menor sea su valor, mejor ser el ajuste del modelo.
Descomposicin
El mtodo de descomposicin permite, dada una serie temporal, separarla en sus
respectivos componentes: por un lado nos proporcionar la tendencia lineal y, por otro,
su estacionalidad.
Usaremos el mtodo de descomposicin cuando:
(a)
(b)
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Modelo multiplicativo:
Modelo aditivo:
Modelo combinado
Cuando las observaciones muestren una tendencia no lineal, suele ser conveniente
realizar una descomposicin de los residuos del modelo de tendencia previamente
calculado (anlisis combinado). Esta alternativa suele mejorar el ajuste del modelo al
combinar la informacin del anlisis de tendencia con la informacin de la
descomposicin.
Medias mviles
El mtodo de las medias mviles es un mtodo dinmico que consiste en promediar
observaciones consecutivas de una serie para suavizar el patrn que siguen los datos
y realizar predicciones a corto plazo. Este procedimiento suele emplearse cuando las
observaciones no muestran patrones de tendencia o estacionarios, si bien es posible
emplearlo tambin con series que tengan componentes estacionarios o de tendencia.
Para calcular la media mvil se promedian grupos de observaciones consecutivas.
Supongamos, por ejemplo, que una serie comienza con los nmeros 4, 5, 8, 9, 10, ,
y que usamos una longitud de 3 para calcular la media mvil. Entonces, los dos
primeros valores de la media mvil sern desconocidos, mientras que el tercero ser el
promedio entre las observaciones 4, 5, y 8. Por su parte, el cuarto valor ser el
promedio entre 5, 8, y 9, etc.
Si la serie no tiene componente estacionario, suele ser habitual tomar medias mviles
de poca longitud para suavizar la serie, si bien dicha longitud depende del nivel de
ruido (error) que contenga la serie: si tomamos una media mvil de longitud grande
estaremos eliminando mucho ruido, pero el patrn resultante tambin ser menos
sensible a cambios en las series. Si la serie contiene un patrn estacionario se suele
usar el perodo como longitud para la media mvil.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Series Temporales
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Series Temporales
Trend Analysis
Data
Length
NMissing
Empleados
60,0000
0
+ 1,07E-02*t**2
Accuracy Measures
MAPE:
MAD:
MSD:
Row
1
2
3
4
...
1,70760
5,95655
59,1305
Period
61
62
63
64
...
FORE1
391,818
393,649
395,502
397,376
...
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Series Temporales
Actual
Fits
Forecasts
Empleados
Actual
Fits
Forecasts
370
MAPE:
MAD:
MSD:
320
0
10
20
30
40
50
60
1,7076
5,9566
59,1305
70
Time
El grfico anterior muestra las observaciones (Actual), la curva de tendencia que se ajusta a
las mismas (Fits), y los valores pronosticados (Forecasts).
Las observaciones presentan una tendencia creciente, con un claro componente estacionario.
La curva obtenida parece ajustarse bastante bien a la tendencia de las observaciones, pero el
patrn estacionario no est siendo considerado en este modelo.
Anlisis de descomposicin
Seleccionamos Stat > Time Series > Decomposition y completamos las ventanas
como se indica (elegiremos un modelo aditivo):
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
10
Series Temporales
El output del programa nos ofrece informacin textual y grfica. Observar que, con este
modelo, obtenemos un valor de 20,30 para el MSD:
Time Series Decomposition
Data
Length
NMissing
Empleados
60,0000
0
Index
1
2
3
4
5
6
7
8
9
10
11
12
-8,48264
-13,3368
-11,4410
-5,81597
0,559028
3,55903
1,76736
3,47569
3,26736
5,39236
8,49653
12,5590
Accuracy of Model
MAPE:
MAD:
MSD:
0,8797
2,9550
20,2982
Forecasts
Row
Period
Forecast
1
2
3
4
5
6
7
8
9
10
11
12
61
62
63
64
65
66
67
68
69
70
71
72
376,562
372,873
375,933
382,723
390,263
394,428
393,801
396,674
397,631
400,921
405,190
410,417
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
11
Series Temporales
Actual
Predicted
400
Forecast
Actual
Empleados
Predicted
Forecast
350
0,8797
2,9550
20,2982
MAPE:
MAD:
MSD:
300
0
10
20
30
40
50
60
70
Time
En las siguientes imgenes se muestran, por separado, la serie original de observaciones, los
datos una vez eliminada la tendencia, los datos una vez extrado el patrn estacional, y los
datos una vez extrados el patrn estacional y la tendencia:
Detrended Data
400
390
380
370
360
350
340
330
320
310
10
0
-10
-20
0
10
20
30
40
50
60
10
20
30
40
50
60
390
15
380
10
370
360
350
340
-5
330
320
-10
0
10
20
30
40
50
60
10
20
30
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
40
50
60
12
Series Temporales
Finalmente, en el ltimo conjunto de grficos se muestra un anlisis estacional: grfico de
ndices estacionales, grfico de variacin porcentual por estaciones, grfico de boxplots
referidos a observaciones agrupadas por perodos estacionarios, y grfico de boxplots de los
residuos agrupados por perodos estacionarios.
10
-10
1
9 10 11 12
9 10 11 12
10
5
0
-5
0
-10
1
9 10 11 12
9 10 11 12
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
13
Series Temporales
A continuacin se muestra el output generado por el programa:
Time Series Decomposition
Data
Length
NMissing
RESI1
60,0000
0
Seasonal Indices
Period
Index
1
2
3
4
5
6
7
8
9
10
11
12
-8,48264
-13,3368
-11,4410
-5,81597
0,559028
3,55903
1,76736
3,47569
3,26736
5,39236
8,49653
12,5590
Accuracy of Model
MAPE:
MAD:
MSD:
881,582
2,802
11,899
Forecasts
Row
Period
FORE2
1
2
3
4
5
6
7
8
9
10
11
12
61
62
63
64
65
66
67
68
69
70
71
72
-8,4826
-13,3368
-11,4410
-5,8160
0,5590
3,5590
1,7674
3,4757
3,2674
5,3924
8,4965
12,5590
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
14
Series Temporales
Actual
Predicted
10
Forecast
Actual
RESI1
Predicted
Forecast
-10
MAPE:
MAD:
MSD:
-20
0
10
20
30
40
50
60
881,582
2,802
11,899
70
Time
En las siguientes imgenes se muestran, por separado, la serie original de observaciones
(residuos), los datos una vez eliminada la tendencia (en este caso queda igual, por ser la
tendencia horizontal), los datos una vez extrado el patrn estacional, y los datos una vez
extrados el patrn estacional y la tendencia:
Detrended Data
10
10
-10
-10
-20
-20
0
10
20
30
40
50
60
-5
-5
10
20
30
40
50
20
30
40
50
60
10
10
60
10
20
30
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
40
50
60
15
Series Temporales
En el primero de los grficos (Decomposition FIT) se observa que los residuos obtenidos en el
anlisis de tendencia (ver ejemplo anterior) se ajustan bastante bien por el modelo generado
usando el mtodo de descomposicin. Si acaso, vemos que el valor estimado en el primero
de los ciclos es considerablemente menor que el valor real, mientras que ocurre todo lo
contrario en el ltimo de los ciclos. Esto tambin se puede apreciar claramente en el grfico
de nombre Seasonally Adj. And Detrended Data.
-10
-10
-20
1
9 10 11 12
9 10 11 12
10
5
0
-5
0
1
9 10 11 12
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
9 10 11 12
16
Series Temporales
Veamos ahora cmo podemos calcular los valores estimados (Predicted) y los pronosticados
(Forecasted):
Guardaremos los nuevos valores estimados, obtenidos como suma (por ser un modelo
aditivo) de:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
17
Series Temporales
Comprobemos cmo quedan todos los datos anteriores en un grfico de series temporales.
Usaremos la opcin Graph > Time Series Plot :
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
18
Series Temporales
Empleados
400
350
300
Index
12
22
32
42
52
62
72
En el grfico anterior, los crculos representan las observaciones, los smbolos + representan
las estimaciones. Los pronsticos se representan con otro smbolo.
Calculemos ahora el valor del MSD. Haremos uso para ello de la frmula y de la opcin Calc
> Calculator :
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
19
Series Temporales
Como se observa en la siguiente pantalla, el valor del MSD que se obtiene con este mtodo
combinado es de 11,90:
Podemos comparar la bondad del ajuste de los diferentes modelos usando el MSD obtenido.
El valor del MSD para el modelo de tendencia cuadrtica era de 59,13. Los modelos de
descomposicin aditiva y multiplicativa con tendencia lineal daran un MSD de 20,30 y 18,54
respectivamente. El valor del MSD para la combinacin de tendencia cuadrtica y
descomposicin de residuos es de 11,90, lo que indica que este mtodo combinado es el que
proporciona un mejor ajuste. Probablemente sea tambin interesante calcular el valor MSD
para el modelo multiplicativo.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
20
Series Temporales
Evolucin de la temperatura de un ro
En el archivo Rio.mtw se ha registrado (en la variable Temp) la temperatura del agua de
un ro en las ltimas 90 horas.
En primer lugar, a fin de determinar si la temperatura en una hora concreta est
correlacionada con la temperatura registrada una hora antes, dos horas antes, etc.,
calcularemos la funcin de autocorrelacin con lags = 24
Posteriormente realizaremos con Minitab un anlisis de la tendencia y un anlisis de
descomposicin (no combinado) de la serie temporal que origina la variable Temp.
Por otra parte, usando medias mviles de longitud 4, intentaremos predecir la temperatura de
las prximas 12 horas
Estudio de la autocorrelacin y la autocorrelacin parcial
Observar en el grfico siguiente que la funcin de correlacin tiene una forma senosuidal, lo
cual sugiere que las temperaturas de horas cercanas estarn positivamente correlacionadas
(de hecho, el valor obtenido para la correlacin entre la columna de las observaciones y la
columna desplazada en una unidad es de 0,95), mientras que temperaturas separadas por 12
horas estarn negativamente correlacionadas (-0,70 en este ejemplo). Notar tambin la
existencia de un componente estacionario de perodo 24 horas.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
21
Series Temporales
Autocorrelation
Lag Corr
12
LBQ
Lag Corr
LBQ
Lag Corr
22
LBQ
Lag Corr
LBQ
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
22
Series Temporales
Partial Autocorrelation
Lag PAC
12
Lag PAC
22
Lag PAC
Lag PAC
1 0,95
9,25
0,02
0,24
15
0,04
0,40
22 0,14
1,36
2 -0,66
-6,44
9 -0,08
-0,77
16
0,10
0,95
23 -0,10
-0,93
3 -0,29
-2,80
10 -0,03
-0,30
17
0,07
0,72
24 -0,13
-1,25
4 -0,23
-2,28
11 -0,08
-0,77
18
0,16
1,56
5 -0,09
-0,84
12 -0,14
-1,36
19
0,01
0,06
6 -0,16
-1,60
13 -0,07
-0,70
20 -0,02
-0,16
7 -0,01
-0,11
14
0,04
0,35
21
0,02
0,19
Anlisis de la tendencia
Dado que se observa en los datos un patrn lineal, usaremos un modelo lineal para ajustar
las observaciones. Adems, tambin se observa un claro componente estacionario, por lo
que guardaremos los residuos a fin de realizar, ms adelante, una descomposicin de los
mismos y poder as mejorar nuestro modelo.
Seleccionamos Stat > Time Series > Trend Analisis
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
23
Series Temporales
Temp
95,0000
0
6,13991
2,51294
8,26801
Row
Period
FORE1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
40,6501
40,6291
40,6080
40,5869
40,5659
40,5448
40,5238
40,5027
40,4817
40,4606
40,4396
40,4185
40,3975
40,3764
40,3554
40,3343
40,3133
40,2922
40,2712
40,2501
40,2291
40,2080
40,1870
40,1659
Observar que las medidas de bondad del ajuste (MAPE, MAD y MSD) mantienen unos
valores bastante buenos (pequeos).
El siguiente grfico muestra las observaciones (Actual), la curva de tendencia que se ajusta a
las mismas (Fits), y los valores pronosticados (Forecasts).
Las observaciones presentan una tendencia decreciente, con un claro componente
estacionario. La recta obtenida no ajusta mal la tendencia de las observaciones, pero el
patrn estacionario no est siendo considerado en este modelo.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
24
Series Temporales
45
Fits
Forecasts
Actual
Fits
Temp
Forecasts
40
MAPE:
MAD:
MSD:
35
0
50
Pasamos a realizar el anlisis de descomposicin.
6,13991
2,51294
8,26801
100
Time
Anlisis de descomposicin
Utilizamos un modelo aditivo, al no observarse que la variacin del patrn estacional crezca
con el tiempo.
Seleccionamos Stat > Time Series > Decomposition
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
25
Series Temporales
Time Series Decomposition
Data
Length
NMissing
Temp
95,0000
0
Index
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
0,919957
1,60121
1,94391
2,41391
2,91829
3,09621
2,99412
3,15204
3,16475
3,07621
2,61058
0,905998
-1,14609
-1,59484
-2,81734
-3,60754
-4,40838
-4,77692
-4,44046
-3,22254
-1,92629
-0,73692
-0,10129
-0,01859
Accuracy of Model
MAPE:
MAD:
MSD:
2,03073
0,83542
1,13924
Forecasts
Row
Period
Forecast
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
40,6315
41,5490
42,2092
42,5309
42,9798
43,4631
43,6200
43,4969
43,6337
43,6254
43,5158
43,0291
41,3035
39,2304
38,7606
37,5170
36,7057
35,8839
35,4943
35,8097
37,0065
38,2817
39,4501
40,0646
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
26
Series Temporales
Notar que todas las medidas de bondad del ajuste (MAPE, MAD y MSD) son menores que en
el caso anterior, lo cual indica que este modelo se ajusta mejor a la serie. Esto tambin se ve
claramente en el primero de los grficos siguientes, donde se observa que ahora el
componente estacional s se est teniendo en cuenta.
En el segundo bloque de imgenes se muestran, por separado, la serie original de
observaciones, los datos una vez eliminada la tendencia, los datos una vez extrado el patrn
estacional, y los datos una vez extrados el patrn estacional y la tendencia
Finalmente, en el ltimo conjunto de grficos se muestra un anlisis estacional: grfico de
ndices estacionales, grfico de variacin porcentual por estaciones, grfico de boxplots
referidos a observaciones agrupadas por perodos estacionarios, y grfico de boxplots de los
residuos agrupados por perodos estacionarios.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
27
Series Temporales
Actual
45
Predicted
Forecast
Actual
Predicted
Temp
Forecast
40
MAPE:
MAD:
MSD:
35
0
50
2,03073
0,83542
1,13924
100
Time
Detrended Data
5
45
40
-5
35
0
10 20 30 40
50 60 70 80 90 100
10 20 30 40 50 60 70 80 90 100
43
42
41
40
-1
39
-2
38
-3
37
0
10 20 30 40
50 60 70 80 90 100
10 20 30 40 50 60 70 80 90 100
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
28
Series Temporales
40
35
2
8 10 12 14 16 18 20 22 24
8 10 12 14 16 18 20 22 24
4
3
2
1
-1
-2
-3
0
2
8 10 12 14 16 18 20 22 24
8 10 12 14 16 18 20 22 24
A pesar de que una transformacin de la variable suele tener efectos positivos en el anlisis,
en este caso no parece que sea necesario a la vista del grfico de residuos, ya que presentan
un comportamiento errtico alrededor del 0, sin ningn patrn claro.
Medias mviles
Utilizamos un modelo aditivo, al no observarse que la variacin del patrn estacional crezca
con el tiempo.
Seleccionamos Stat > Time Series > Moving Average
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
29
Series Temporales
Moving average
Data
Length
NMissing
Temp
95,0000
0
Moving Average
Length: 4
Accuracy Measures
MAPE: 3,78930
MAD: 1,54115
MSD: 3,28697
Row
Period
Forecast
Lower
Upper
1
2
3
4
5
6
7
8
9
10
11
12
96
97
98
99
100
101
102
103
104
105
106
107
36,37
36,37
36,37
36,37
36,37
36,37
36,37
36,37
36,37
36,37
36,37
36,37
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
32,8165
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
39,9235
La prediccin que nos ofrece el anlisis es que la temperatura en las prximas 12 horas
estar entre 32,82 y 39,92; siendo el valor medio 36,37.
En el siguiente grfico se muestran las observaciones (Actual), los valores estimados
(Predicted), y los valores pronosticados (Forecast). Observar que el patrn de los valores
estimados est ligeramente desplazado a la derecha con respecto al patrn de las
observaciones (ello se debe a que el valor estimado en el instante t es el valor de la media
mvil en t-1).
Actual
45
Predicted
Forecast
Temp
Actual
Predicted
Forecast
40
Moving Average
Length:
35
50
MAPE:
3,78930
MAD:
1,54115
MSD:
3,28697
100
Time
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
30
Series Temporales
BIBLIOGRAFA
______________________________________________
[1]
Bar, J. y Alemany, R. (2000): Estadstica II. Ed. Fundaci per a la Universitat Oberta de
Catalunya. Barcelona.
[2]
[3]
[4]
[5]
Martn-Guzmn, P. (1991): Curso bsico de estadstica econmica. AC, DL. Madrid. ISBN:
84-7288-142-3
[5]
[7]
ENLACES
___________________________________
http://perso.wanadoo.es/bledatobias/series.html
Curso "Anlisis, Regresin y Prediccin de Series Temporales Epidemiolgicas"
http://www.ii.uam.es/~asuarez/docencia/doctorado/TS2001.html
Curso de doctorado de la Universidad Autnoma de Madrid: "Series Temporales"
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
31