Análisis y Pronóstico de Serie de Tiempo

ANÁLISIS Y PRONÓSTICO DE SERIES DE TIEMPO
ELABORADO POR:
DHEYBI CERVAN
TABLA DE CONTENIDO
1 Introducción .......................................................................................................................... 3
2 Elaborando la serie de tiempo en R ....................................................................................... 4
2.1 Cargando librerias y datos ............................................................................................. 4
2.2 Creando el objeto de serie de tiempo ............................................................................ 5
3 Análisis de la serie de tiempo ................................................................................................ 6
3.1 Grafico de la serie de tiempo......................................................................................... 7
3.2 Descomposición de la serie de tiempo .......................................................................... 8
3.3 Grafico de la serie de tiempo con su tendencia ............................................................. 9
3.4 Grafico de estacionalidad ............................................................................................ 10
4 Pronóstico ............................................................................................................................ 11
4.1 Métodos simples.......................................................................................................... 11
4.2 Método regresión......................................................................................................... 14
4.3 Método holt winters .................................................................................................... 17
4.4 ARIMA ....................................................................................................................... 20
4.5 Red neuronal ............................................................................................................... 23
5 Estimación de error ............................................................................................................. 26

1 INTRODUCCIÓN
En este tutorial se explica lo relacionado al pronóstico de series de tiempo. Lo cual comprende:
• Elaborando la serie de tiempo en R

• Análisis de la serie de tiempo
• Pronóstico de la serie de tiempo
• Estimación de errores de pronóstico
Para el análisis de series de tiempo en R, existen una gran variedad de librerias. En este tutorial
se emplea la librería fpp2, la cual contiene contiene:
• La librería forecast, que contiene funciones de pronóstico

• La librería ggplot2, que contiene funciones para graficos
Esta librería se instala y se carga mediante install.packages("fpp2")y library(fpp2)

respectivamente.
La explicación de este tutorial lo puedes encontrar en los siguientes videos:
• Parte I : Análisis de patrones

• Parte II : Pronóstico
Si aun desconoces como instalar librerías, te sugiero mirar este video. Si desconoces el uso del
software R, puedes mirar esta lista de reproducción y/o revisar algunos recursos de aprendizaje.
2 ELABORANDO LA SERIE DE TIEMPO EN R
2.1 CARGANDO LIBRERÍAS Y DATOS
Recordemos que se puede leer datos directamente desde una API, SQL u otros medios. Para este
tutorial empleo la lectura de datos desde Excel. Entonces para ello emplearemos las siguientes
funciones:
• La función read_excel() nos permite leer datos desde un archivo excel. Para ello es
necesario instalar la libreria readxl
• La función head() nos muestra los primeros datos de nuestra tabla de datos
library(readxl)
library(fpp2)
## Loading required package: ggplot2
## Loading required package: forecast
## Registered S3 method overwritten by 'quantmod':

## method from
## as.zoo.data.frame zoo
## Loading required package: fma
## Loading required package: expsmooth
dataset <- read_excel("Data serie tiempo.xlsx", sheet = 'Data1')

2.2 CREANDO EL OBJETO DE SERIE DE TIEMPO
La serie de tiempo se debe almacenar en el objeto ts empleando la función ts(). El empleo de

esta función es de la siguiente forma: serie <- ts(data, frequency= ,start=). Donde
el primer argumento es un vector de datos. Luego los dos siguientes argumentos se indican de
acuerdo a la siguiente tabla.
Frecuencia frequency = start =
Anual 1 2000
Trimestral 4 c(2000,2)
Mensual 12 c(2000,9)
Diario 7 o 365.25 1 o c(2000,234)
Semanal 52.18 c(2000,23)
Horario 24 o 168 o 8766 1
cada 30 min 48 o 336 o 17532 1
Por ejemplo, para los datos del archivo excel adjunto:
• En Data1, los datos son mensuales y empieza el 2004. Entonces corresponde

frequency=12 y start=2004
• En Data2, los datos son mensuales y empieza el 2005. Entonces corresponde
• En Data3, los datos son cada 30 minutos y empieza el 2019. Entonces corresponde
En el siguiente fragmento de código definimos el objeto de la serie de tiempo y lo

almacenaremos en data_serie.
data_serie <- ts(dataset$Serie, frequency=12, start=2004)
Nota: Los resultados de esta guía corresponden a Data1 del archivo excel. Sugiero que también
practiques con las otras series de tiempo como Data2 o Data3.
3 ANÁLISIS DE LA SERIE DE TIEMPO
Para el análisis de datos, esta librería fpp2 nos permite emplear las siguientes funciones:
• autoplot(), para graficar la serie de tiempo

• ggseasonplot(), para graficar la estacionalidad de una serie de tiempo
• ggsubseriesplot(), para graficar subseries
• ggAcf(), para graficar la autocorrelación
• decompose(), permite realizar una descomposición de estacionalidad y tendencia.
3.1 GRÁFICO DE LA SERIE DE TIEMPO
Para el gráfico simple de la serie de tiempo empleamos la función autoplot(). Donde solo se
requiere ingresar el objeto de la serie de tiempo.
autoplot(data_serie)+
labs(title = "Serie de tiempo",
x = "Tiempo",
y = "Valor",
colour = "#00a0dc")+
theme_bw()
3.2 DESCOMPOSICIÓN DE LA SERIE DE TIEMPO
Para la descomposición de la serie de tiempo se emplea la función decompose(). Donde se

debe indicar el objeto de la serie de tiempo y el tipo de descomposición. Los tipos de
descomposición que acepta esta función es additive y multiplicative.
# Descomposición de la serie de tiempo. Se almacena en el objeto fit

fit <- decompose(data_serie, type='additive')
# Para graficar esta descomposición volvemos a emplear la función auto

plot, pero con el objeto fit
autoplot(fit)+
labs(title = "Descomposición de la serie de tiempo",
x = "Tiempo",
y = "Valor",
colour = "Gears")+
theme_bw()
3.3 GRÁFICO DE LA SERIE DE TIEMPO CON SU TENDENCIA
El siguiente fragmento de código nos permite graficar la serie de tiempo con su tendencia. Nótese
que emplea el objeto fit en el cual guardamos previamente los valores de la descomposición.
Nótese que se emplea la función trendcycle() para obtener los datos de tendencia del objeto
fit.
autoplot(data_serie, series="Serie tiempo") +

autolayer(trendcycle(fit), series="Tendencia") +
labs(title = "Serie de tiempo",
x = "Tiempo",
y = "Valor"
) +
theme_bw()
3.4 GRÁFICO DE ESTACIONALIDAD
Para realizar el gráfico de estacionalidad empleamos la función ggseasonplot. Donde el

argumento es el objeto que contiene la serie de tiempo.
ggseasonplot(data_serie)
4 PRONÓSTICO
4.1 MÉTODOS SIMPLES
Para el pronóstico de series de tiempo mediante métodos básicos, la librería fpp2 nos brinda las
siguientes funciones:
• naive(), metodo de naive simple

• ses(), exponential smoothing
• meanf(), media movil
• snaive(), metodo naive considerando estacionalidad
El argumento a colocar en estas funciones es la serie de tiempo y el valor de h. Este valor de h

es la cantidad de datos que deseamos pronosticar. Por ejemplo, si deseamos pronosticar 12
datos, se debe indicar h=12.
Finalmente, para verificar el ajuste del método podemos emplear las siguientes funciones:
• fitted(), obtiene un ajuste con la data histórica

• checkresiduals(), permite analizar los residuales
# elaborando el método
m1 <- snaive(data_serie, h=24)
# graficando el pronóstico
autoplot(m1)
# verificando el ajuste del método
autoplot(m1)+autolayer(fitted(m1), series="Ajuste")
## Warning: Removed 12 row(s) containing missing values (geom_path).

# verificando los residuales
checkresiduals(m1)
## Ljung-Box test
##
## data: Residuals from Seasonal naive method
## Q* = 229.01, df = 24, p-value < 2.2e-16
##
## Model df: 0. Total lags used: 24
4.2 MÉTODO REGRESIÓN
Para el pronóstico de series de tiempo mediante regresión, la librería fpp2 nos brinda la función
tslm(). Esta función la emplearemos para crear una regresión de la serie de tiempo con los
datos de la descomposición estacional y/o tendencia. Entonces:
• Si observamos solo tendencia usaremos: tslm(data_serie ~ trend)

• Si observamos solo estacionalidad usaremos: tslm(data_serie ~ season)
• Si observamos tendencia y estacionalidad usaremos: tslm(data_serie ~ trend +
season)
Luego con la función forecast realizamos el pronóstico. El argumento a colocar en esta

función es la regresión y el valor de h. Este valor de h es la cantidad de datos que deseamos
pronosticar.
• fitted(), obtiene pronostico con la data histórica

# elaborando la regresion
regresion <- tslm(data_serie ~ trend + season)
# elaborando el pronostico
m2 <- forecast(regresion, h=96)
autoplot(m2)

checkresiduals(m2)
##
## Ljung-Box test
##
## data: Residuals from Linear regression model
## Q* = 939.69, df = 11, p-value < 2.2e-16
##
4.3 MÉTODO HOLT WINTERS
Para el pronóstico de series de tiempo mediante holt winters, la librería fpp2 nos brinda la
función hw().
Los argumentos a colocar en esta función son:
• La serie de tiempo
• El valor de h. Este valor de h es la cantidad de datos que deseamos pronosticar.
• El tipo de descomposición a usar para la estacionalidad. Los tipos de descomposición que
acepta esta función es additive y multiplicative.
• fitted(), obtiene pronostico con la data historica

m3 <- hw(data_serie, h=96, seasonal = 'multiplicative')
autoplot(m3)

checkresiduals(m3)
##
## Ljung-Box test
##
## data: Residuals from Holt-Winters' multiplicative method
## Q* = 35.398, df = 8, p-value = 2.262e-05
##
4.4 ARIMA
Para el pronóstico de series de tiempo mediante ARIMA, la librería fpp2 nos brinda la función
auto.arima().
Primero crearemos un modelo ARIMA, para ello el argumento a colocar en esta función es la
serie de tiempo. Luego con la función forecast realizamos el pronóstico. El argumento a
colocar en esta función es el modelo ARIMA y el valor de h. Este valor de h es la cantidad de
datos que deseamos pronosticar.
Considerar que esta función auto.arima() es solo una aproximación iterativa que busca los
índices de AR y MA. Pues en determinadas series de tiempo podría no encontrar los índices
adecuados para un modelo ARIMA. En ese caso lo adecuado es seguir la metodología de
estimación de índices ARIMA. Esta metodología no está cubierta en este tutorial.

# elaborando el modelo ARIMA

modelo_arima <- auto.arima(data_serie)
m4 <- forecast(modelo_arima, h=96)
autoplot(m4)

checkresiduals(m4)
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,1)(1,1,2)[12]
## Q* = 31.738, df = 20, p-value = 0.04618
##
4.5 RED NEURONAL
Para el pronóstico de series de tiempo mediante una red neuronal, la librería fpp2 nos brinda la
función nnetar().
Primero crearemos un modelo de red neuronal (neural network), para ello el argumento a
colocar en esta función es la serie de tiempo.
Luego con la función forecast realizamos el pronóstico. El argumento a colocar en esta

función es el modelo de red neuronal y el valor de h. Este valor de h es la cantidad de datos que
deseamos pronosticar.

# elaborando el modelo de red neuronal

neural_network <- nnetar(data_serie)
m5 <- forecast(neural_network, h=96)
autoplot(m5)
## Warning: Removed 12 row(s) containing missing values (geom_path).

checkresiduals(m5)
## Warning in modeldf.default(object): Could not find appropriate degr

ees of
## freedom for this model.
5 ESTIMACIÓN DE ERROR
Para estimar los errores de pronóstico, se debe realizar con los valores ocurridos o reales. Es
decir, este error se mide tiempo después de haber realizado el pronóstico. Supongamos que los
valores reales ocurridos para la Data1 son los siguientes:
Mes Valor Real Mes Valor Real
Enero 19 13487 Mayo 19 14268
Febrero 19 12776 Junio 19 14473
Marzo 19 13812 Julio 19 15539
Abril 19 13032 Agosto 19 14457
Entonces, para poder comparar nuestros datos será necesario almacenarlo en un objeto de serie
de tiempo. Entonces:
real <- c(13487, 12776, 13812, 13032, 14268, 14473, 15359, 14457 )
data_real <- ts(real, frequency=12,start=2019)
La función accuracy() determina los errores de pronóstico, para ello es necesario:
• Indicar el modelo de pronóstico, donde estará el pronóstico

• Indicar datos reales, donde estará los valores reales
Entonces lo que realizará esta función es comparar el pronóstico de los siguientes 8 datos y el
valor real. Pues estamos considerando que ya pasaron 8 meses, y nos encontramos en la etapa de
evaluar el error de pronóstico de nuestros modelos.
# modelo en base a métodos simples

accuracy(m1,data_real)
## ME RMSE MAE MPE MAPE MASE

ACF1
## Training set 384.75 505.6560 431.1548 3.523001 3.918342 1.000000 0
.4327075
## Test set 365.00 466.3137 438.0000 2.602949 3.107894 1.015877 -0
.2078547
## Theil's U
## Training set NA
## Test set 0.5388025
# modelo en base a regresion lineal

## ME RMSE MAE MPE MAPE

MASE
## Training set -5.046141e-14 332.1779 251.4463 -0.1051868 2.220769 0.
5831928
## Test set -6.430464e+02 678.8526 643.0464 -4.6198455 4.619846 1.
4914515
## ACF1 Theil's U
## Training set 0.7182366 NA
## Test set -0.3644790 0.7820812
# modelo en base a holt winters

## ME RMSE MAE MPE MAPE M

ASE
## Training set -18.06908 230.7608 174.6523 -0.1444046 1.559487 0.4050
804
## Test set -58.72820 271.5594 148.5207 -0.4098491 1.032395 0.3444
719
## ACF1 Theil's U
## Test set -0.2064019 0.2958201
# modelo en base a ARIMA


MASE
## Training set -4.256141 210.5291 157.8358 -0.0486745 1.399429 0.366
0768
## Test set -57.295339 229.0560 153.4890 -0.4244515 1.079951 0.355
9951
## ACF1 Theil's U
## Training set -0.0261825 NA
## Test set -0.4049233 0.2518715
# modelo en base a red neuronal

accuracy(m5, data_real)

MASE
## Training set -0.1187071 284.1652 213.2667 -0.06508566 1.896118 0.4
946407
## Test set 204.5742969 391.2487 315.0416 1.38273779 2.181251 0.7
306927
## ACF1 Theil's U
## Test set -0.02750959 0.4592974
Entonces a partir de estos errores de pronóstico podemos determinar cuál es el modelo más
adecuado. En la práctica se suelen evaluar varios modelos e incluso tomar como pronóstico un
valor medio de los resultados de dos o más modelos.

Análisis y Pronóstico de Serie de Tiempo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis y Pronóstico de Serie de Tiempo

Cargado por

Copyright:

Formatos disponibles

ANÁLISIS Y PRONÓSTICO DE SERIES DE TIEMPO

2 Elaborando la serie de tiempo en R ....................................................................................... 4

2.1 Cargando librerias y datos ............................................................................................. 4

2.2 Creando el objeto de serie de tiempo ............................................................................ 5

3 Análisis de la serie de tiempo ................................................................................................ 6

3.1 Grafico de la serie de tiempo......................................................................................... 7

3.2 Descomposición de la serie de tiempo .......................................................................... 8

3.3 Grafico de la serie de tiempo con su tendencia ............................................................. 9

3.4 Grafico de estacionalidad ............................................................................................ 10

4.1 Métodos simples.......................................................................................................... 11

4.2 Método regresión......................................................................................................... 14

4.3 Método holt winters .................................................................................................... 17

4.4 ARIMA ....................................................................................................................... 20

4.5 Red neuronal ............................................................................................................... 23

5 Estimación de error ............................................................................................................. 26

En este tutorial se explica lo relacionado al pronóstico de series de tiempo. Lo cual comprende:

• Elaborando la serie de tiempo en R

• La librería forecast, que contiene funciones de pronóstico

Esta librería se instala y se carga mediante install.packages("fpp2")y library(fpp2)

La explicación de este tutorial lo puedes encontrar en los siguientes videos:

• Parte I : Análisis de patrones

2.1 CARGANDO LIBRERÍAS Y DATOS

## Loading required package: ggplot2

## Loading required package: forecast

## Registered S3 method overwritten by 'quantmod':

## Loading required package: fma

## Loading required package: expsmooth

dataset <- read_excel("Data serie tiempo.xlsx", sheet = 'Data1')

La serie de tiempo se debe almacenar en el objeto ts empleando la función ts(). El empleo de

Frecuencia frequency = start =

Diario 7 o 365.25 1 o c(2000,234)

Semanal 52.18 c(2000,23)

Horario 24 o 168 o 8766 1

cada 30 min 48 o 336 o 17532 1

Por ejemplo, para los datos del archivo excel adjunto:

• En Data1, los datos son mensuales y empieza el 2004. Entonces corresponde

En el siguiente fragmento de código definimos el objeto de la serie de tiempo y lo

data_serie <- ts(dataset$Serie, frequency=12, start=2004)

• autoplot(), para graficar la serie de tiempo

Para la descomposición de la serie de tiempo se emplea la función decompose(). Donde se

# Descomposición de la serie de tiempo. Se almacena en el objeto fit

# Para graficar esta descomposición volvemos a emplear la función auto

autoplot(data_serie, series="Serie tiempo") +

Para realizar el gráfico de estacionalidad empleamos la función ggseasonplot. Donde el

4.1 MÉTODOS SIMPLES

• naive(), metodo de naive simple

El argumento a colocar en estas funciones es la serie de tiempo y el valor de h. Este valor de h

• fitted(), obtiene un ajuste con la data histórica

## Warning: Removed 12 row(s) containing missing values (geom_path).

• Si observamos solo tendencia usaremos: tslm(data_serie ~ trend)

Luego con la función forecast realizamos el pronóstico. El argumento a colocar en esta

• fitted(), obtiene pronostico con la data histórica

# verificando los residuales

Los argumentos a colocar en esta función son:

• fitted(), obtiene pronostico con la data historica

# verificando los residuales

• fitted(), obtiene pronostico con la data histórica

# elaborando el modelo ARIMA

# verificando los residuales

Luego con la función forecast realizamos el pronóstico. El argumento a colocar en esta

• fitted(), obtiene pronostico con la data histórica

# elaborando el modelo de red neuronal

## Warning: Removed 12 row(s) containing missing values (geom_path).