Está en la página 1de 3

MODELOS DE SERIES TEMPORALES

Los modelos de series temporales determinan la evolución de una variable a lo largo del
tiempo. Utilizan valores pasados para predecir valores futuros e incluyen una variable
temporal como explicativa.

Algunos datos pueden recogerse en tiempo real y con frecuencias muy elevadas. Esto también
tiene desventajas, ya que hay más ruido en la serie cuanto más detallada sea la escala, lo cual
se suaviza al agregar datos.

El modelado de series temporales suele tener dos objetivos:

- El análisis de series temporales, que tiene fines descriptivos (describir el


comportamiento de las series) para determinar los componentes de la serie que se
pueden utilizar para tomar decisiones.
- El modelado predictivo que tiene como objetivo predecir el futuro de la serie
(parte en la que nos vamos a centrar en la asignatura).

Las series temporales suelen descomponerse en 4 componentes principales:

- Nivel (valor medio de la serie, a veces también se considera que es el nivel inicial,
sirve para situar la serie en el eje Y)
- Tendencia (cambio medio en la serie de un periodo al siguiente, si es horizontal
decimos que no tiene tendencia)
- Estacionalidad (patrón que se repite en el tiempo con una frecuencia fija, esta
frecuencia se puede establecer a muchos niveles) (los ciclos económicos no se
pueden considerar estacionalidad porque no sabemos cuánto dura cada ciclo)
- Ruido (todo lo que no explican las componentes anteriores, variación aleatoria
debida a errores de medida u otras causas)

Para evaluar la capacidad de pronóstico, las observaciones se dividen en un conjunto de


entrenamiento y otro de validación. Estas observaciones con series temporales no se pueden
asignar a los conjuntos de forma aleatoria a diferencia de los datos de corte transversa, debido
a que en las series temporales importa el orden en el que cogemos los datos, ya que hay una
dependencia temporal entre observaciones.

Hay varias métricas distintas para evaluar si un modelo es bueno o no:

- Mean Absolute Error (MAE): sumatorio de las diferencias entre valor observado y
valor predicho dividido entre el número de observaciones. Se expresa en las
mismas unidades que la serie.
- Mean Absolute Percentage Error (MAPE): diferencia entre valor real y valor
predicho dividido entre el valor real. Hacer el sumatorio de todas estas diferencias
y posteriormente dividirlo entre el número de observaciones. Se expresa como un
porcentaje.
- Root-Mean-Square Error (RMSE): es lo mismo que el MAE pero consideramos las
raíces de los errores cuadráticos. La unidad de medida será también la misma que
la de la serie. Con este error penalizamos más los errores grandes.

Los modelos de referencia que se utilizan en los modelos de series temporales son los modelos
ingenuos (el pronóstico para el siguiente periodo es la última observación conocida). Hay otro
tipo de pronóstico, pronóstico ingenuo estacional, que lo que hace es decir que la serie el mes
que viene va a ser el mismo valor que tuvo esa misma estación del último periodo.

La tendencia es el cambio medio de una serie en el tiempo. La forma más sencilla de modelar
la tendencia es la tendencia lineal, la cual modela que la serie varía cada periodo en una
determinada cantidad. Lo que tenemos son variaciones sumativas, La especificación es Yt = B0
+ B1*t + ut, donde B0 es el nivel inicial de la serie, B1 es la tendencia y ut es el ruido.

Para considerar variaciones multiplicativas tenemos las tendencias exponenciales. Una


variación multiplicativa es el porcentaje con respecto al periodo anterior, que aumenta (o
disminuye) un tanto por ciento. La transformación lineal de la especificación de esta tendencia
es: ln Yt = B0 + B1*t + ut. Los errores de este modelo no son comparables a los del otro modelo
de tendencia lineal, ya que las unidades no son las mismas.

Una última tendencia es la polinomial, pues podemos utilizar cualquier otra forma funcional en
la especificación, pero debemos ir con cuidado con el sobreajuste de los datos (la forma
funcional debe mantenerse tanto en los datos observados como en los que queremos
predecir).

Una serie tiene patrón estacional cuando observaciones de la misma estación tienen
consistentemente valores por encima o por debajo de las de otras observaciones. La forma
más sencilla de hacer esto es con variables dicotómicas, donde tenemos k estaciones y k-1
variables dicotómicas. La estacionalidad la podemos hacer aditiva (Yt = BMES(t) + ut) o
multiplicativa (ln Yt = BMES(t) + ut). La función mes devuelve una variable categórica indicando
el mes.

Autocorrelación  correlación entre observaciones de periodos de tiempo consecutivos, las


series temporales suelen tener dependencia entre las distintas observaciones. La
autocorrelación tiene problemas porque los estimadores por MCO no son óptimos y esto hace
que las predicciones sean menos fiables.

Medimos la autocorrelación con el coeficiente de autocorrelación de orden K, que mide la


relación lineal entre observaciones separadas k periodos de tiempo. Se calcula como el
coeficiente de correlación entre la serie original y la serie retrasada k periodos de tiempo.

Si el modelo estacional es correcto, los residuos no deberían mostrar autocorrelación.

Corrección de la AC con modelos autorregresivos (AR)  utilizan como variables explicativas


los valores pasados de la serie. El modelo autorregresivo más sencillo (AR(1)) sería Yt = B0 +
B1*Yt-1 + ut. Según el orden del modelo iríamos añadiendo variables en las que vamos
retrasando los periodos de tiempo. Estos modelos son un caso especial de los modelos ARIMA
(Autoregressive Integrated Moving Average), que usa medias móviles como explicativas y
puede tomar la serie en diferencias.

Corrección de la AC con pronóstico en dos etapas. El procedimiento sería el siguiente:

1. Pronosticar Yt+k con cualquier método

2. Pronosticar el residuo Et+k de esa predicción

3. Al final tendremos una predicción mejorada de la inicial ajustándola con la


predicción del error: Y*t+k = Yt+k + Et+k
SEMINARIO

Ejercicio 4.

b) 1690,52 pasajeros (yt = 1701.53 – 7.23*122 + 0.061*122^2 + (-44.84) = 1690.52)

Errores del modelo exponencial:

RMSE = 36,84

MAPE = 2.14%

Lambda = 0 es un modelo logarítmico pero los resultados no los dan en logaritmos.

Errores de modelo logarítmico:

RMSE = 127,39

MAPE = 7.58%

Ejercicio 5.

a) los componentes que están en la gráfica son: nivel, ruido y tendencia (estacionalidad no
porque va por años)

b) el modelo más adecuado sería un modelo cuadrático sin estacionalidad

c)

cuando hay correlación negativa hay saltos en los datos.

Por cuanto se multiplican las ventas cada periodo  tendencia multiplicativa

El coeficiente de season6 =0.447046 quiere decir que sube un 44,7% respecto a enero.

También podría gustarte