Está en la página 1de 24

Forecasting con IA

FUNDAMENTOS DE FORECASTING
D.Sc. Yván Jesús Túpac Valdivia
Febrero 2024
Contenido
Consideraciones
Generales
Datos Temporales
Procesos Estocásticos

Forecasting
1 Consideraciones Generales
Identificación de
Sistemas Datos Temporales
Procesos Estocásticos

2 Forecasting

3 Identificación de Sistemas

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 2/24]


Consideraciones Generales
Datos Temporales
Consideraciones
Generales
Datos Temporales
Es necesario comprender bien lo que es un dato temporal, para más adelante
Procesos Estocásticos
poder hacer analisis y previsiones.
Forecasting

Identificación de Datos temporales son conjuntos de observaciones que tienen como


Sistemas
característica común: estar ordenadas en el tiempo.
También llamados series temporales (Time Series), que pueden provenir de
fenómenos de diversas naturalezas, tales como:
i) Estimativas trimestrales del Producto Per Cápita del país.
ii) Valores promedio diarios de temperatura del centro de la ciudad de Arequipa.
iii) Índices diarios de la Bolsa de Valores de Lima.
iv) Lluvia mensual acumulada en Pucallpa
v) Ventas mensuales de autobuses Modasa
vi) Registro horario de mareas en el Puerto de Matarani

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 3/24]


Consideraciones Generales
Procesos Estocásticos
Consideraciones
Generales Formalmente se define una serie como la realización de un proceso
Datos Temporales
Procesos Estocásticos estocástico (normalmente con modelo o parámetros no conocidos).
Forecasting

Identificación de Proceso Estocástico


Sistemas
Conjunto de variables aleatorias que depende de parámetros o argumentos, si uno
de los parámetros o argumentos es el tiempo t, el proceso genera datos temporales.

Por provenir de un proceso estocástico, una serie de datos temporales tiene


comportamiento probabilístico, existe incertidumbre.
Es importante vislumbrar el proceso estocástico que generó la muestra de
datos con la que se cuenta para:
a) Explicar el fenómeno
b) Hacer previsiones de valores futuros (corto o largo plazo)
c) Describir los datos (analítica, visual o estadísticamente)

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 4/24]


Consideraciones Generales
Procesos Estocásticos: Random Walk
Consideraciones
Generales Un ejemplo sencillo de proceso estocástico es el Paseo Aleatorio (Random
Datos Temporales
Procesos Estocásticos walk), que genera una trayectoria a partir de un punto inicial, definido de la
Forecasting siguiente manera:
Identificación de
Sistemas Sea X(t) una trayectoria que inicia en t = 0 en la posición X(0) = X0 , el
paseo aleatorio cumple la siguiente expresión:

X(t + τ ) = X(t) + Ψ(τ ) (1)

donde:
Ψ es la variable aleatoria que define el siguiente paso a desplazarse
(distancia y ángulo)
τ el intervalo de tiempo entre pasos subsecuentes
Demostración en [Colab]

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 5/24]


Consideraciones Generales
Procesos Estocásticos: Random Walk
Consideraciones Random Walk 2D grid (n = 1000 steps) Random Walk (n = 1000 steps)
Generales
Datos Temporales 15 20
Procesos Estocásticos

Forecasting 10 15
Identificación de
Sistemas 5
10
0
5
5

10 0

0 10 20 30 40 50 15 10 5 0 5 10

Usado en: modelos básicos de precios, modelo de deriva genética, base del
Movimiento Geométrico Browniano (movimiento de moléculas o partículas),
movimiento de poblaciones en ecología, cálculo de soluciones en la ecuación
de Laplace.

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 6/24]


Consideraciones Generales
Procesos Estocásticos: Random Walk
Consideraciones
Generales En Computación: estimar el tamaño de la WEB, segmentación de imágenes,
Datos Temporales
Procesos Estocásticos
base del modelo MCMC, etc.
Forecasting

Identificación de
Sistemas

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 7/24]


Consideraciones Generales
Procesos Estocásticos: Proceso Autorregresivo
Consideraciones
Generales Puede que sea el modelo más elemental en series de datos temporales.
Datos Temporales
Procesos Estocásticos
Es parecido al Paseo Aleatorio pero con algunos parámetros más.
Forecasting

Identificación de
Su ecuación es la siguiente:
Sistemas

X(t) = c + φ1 X(t − 1) + ε(t) (2)

donde:
c es una constante real.
φ1 es un parámetro de dependencia del dato anterior, se cumple que
|φ1 | ≤ 1.
ε(t) es una variable aleatoria con distribución gaussiana N (0, 1)
Demostración en [Colab - AR]

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 8/24]


Consideraciones Generales
Procesos Estocásticos: Proceso Autorregresivo
Consideraciones
Generales Se muestra realizaciones para 1000 iteraciones de
Datos Temporales
Procesos Estocásticos
X(t) = c + φ1 X(t − 1) + ε(t) con c = 0, y φ1 = 0.5, φ1 = 0.9
Forecasting respectivamente:
Identificación de AR(1) process (1000 iterations) AR(1) process (1000 iterations)
10.0
Sistemas
7.5
2
5.0

0 2.5

0.0
2
2.5

5.0
4
7.5
0 200 400 600 800 1000 0 200 400 600 800 1000

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 9/24]


Consideraciones Generales
Procesos Estocásticos: Proceso Autorregresivo
Consideraciones
Generales Uso en modelado de fenómenos de la naturaleza como caudales acumulados
Datos Temporales
Procesos Estocásticos
de ríos por mes o semanas.
Forecasting

Identificación de
Sistemas

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 10/24]


Consideraciones Generales
Ejemplo de Serie de Datos Temporales
Consideraciones
Generales Imagine medir cada hora la temperatura de un lugar durante 24 horas.
Datos Temporales
Procesos Estocásticos Z(t)
Forecasting

Identificación de Z (1) (t)


Sistemas
Z Z(t)
Z (2) (t)

t = 15 24 t
Si Z(t) es la temperatura en una hora t, y se mide en dos días diferentes, no
necesariamente serán los mismos valores que se observarán.
Z(t) es una variable aleatoria.
Cada serie Z j (t) es una muestra o trayectoria del proceso estocástico Z

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 11/24]


Consideraciones Generales
Ejemplo de Serie de Datos Temporales
Consideraciones
Generales Hay casos en que es factible obtener muchas trayectorias (procesos medibles
Datos Temporales
Procesos Estocásticos o simulables muchas veces), pero hay casos en que sólo se cuenta con una
Forecasting única trayectoria para analizar (fenómenos económicos, sociales,
Identificación de
Sistemas
astronómicos, por ejemplo).
La serie Z(t) puede ser función de otros parámetros (físicos u otros) además
del tiempo.
La serie puede ser vectorial Z(t), como se ve en en el ejemplo:
Z(t) = [Z1 (t), Z2 (t), Z3 (t)]

Z Z1 altura
Z(t) Z2 presión t=
 tiempo
latitud
Z3 temperatura longitud

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 12/24]


Consideraciones Generales
Analizar Series Temporales
Consideraciones
Generales Dada una serie de datos Z(t1 ), . . . , Z(tn ) observada en los instantes
Datos Temporales
Procesos Estocásticos
t1 , . . . , tn , cuyo modelo generador es un proceso estocástico, se puede estar
Forecasting interesado en:
Identificación de
Sistemas
a) Investigar el modelo estocástico generador de la serie de datos.
b) Hacer previsiones (forecasting) de valores futuros de la serie, a corto o largo
plazo.
c) Describir el comportamiento de la serie de datos: construir gráficas, verificar
existencia de tendencias, ciclos, comportamientos estacionales, encontrar
periodicidades relevantes en los datos

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 13/24]


Contenido
Consideraciones
Generales
Datos Temporales
Procesos Estocásticos

Forecasting
1 Consideraciones Generales
Identificación de
Sistemas Datos Temporales
Procesos Estocásticos

2 Forecasting

3 Identificación de Sistemas

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 14/24]


Forecasting
Principios de Forecasting
Consideraciones
Generales Dada una serie de datos Z(t) = Z(t1 ), Z(t2 ), . . . , Z(tn ), e mayor interés es
Datos Temporales
Procesos Estocásticos predecir los valores Z(tn+1 ), Z(tn+2 ), . . ..
Forecasting ¿Qué desafíos tenemos aquí?
Identificación de
Sistemas
i) Saber si los datos son consistentes, si es necesario corregir fallas
ii) Tener una idea del tipo de modelo (proceso estocástico) más adecuado que
podría generar los datos
iii) Estimar los parámetros del modelo candidato.
iv) Hacer previsiones y medir la calidad de las mismas

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 15/24]


Contenido
Consideraciones
Generales
Datos Temporales
Procesos Estocásticos

Forecasting
1 Consideraciones Generales
Identificación de
Sistemas Datos Temporales
Procesos Estocásticos

2 Forecasting

3 Identificación de Sistemas

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 16/24]


Identificación de Sistemas
Definiciones básicas
Consideraciones
Generales Área de la matemática aplicada, busca inferir modelos de sistemas dinámicos
Datos Temporales
Procesos Estocásticos a partir de observaciones de los mismos e identificación de sus propiedades.
Forecasting
Los modelos (hipótesis, leyes naturales, paradigmas, etc.) pueden ser más o
Identificación de
Sistemas menos formales.
En cualquier caso se intenta relacionar las observaciones con patrones.
Sistemas Dinámicos
Son objetos en los cuales variables de diferentes tipos interactuan entre ellas y
generan señales observables (salidas)
Pueden ser afectados por estímulos externos (entradas).
Pueden existir perturbaciones (ruidos), medidas directamente o sólo inferidas a
partir de su impacto en las salidas.

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 17/24]


Identificación de Sistemas
Definiciones básicas
Consideraciones v
Generales
Datos Temporales
Procesos Estocásticos w
Forecasting y y salida
Identificación de u entrada
Sistemas u
u′ perturbación medible
v perturbación no medible

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 18/24]


Identificación de Sistemas
Modelos fundamentales (NARX)
Consideraciones
Generales NARX (Non-linear Auto-Regressive with eXogenous inputs):
Datos Temporales
Procesos Estocásticos
y(k) = Ψ [y(k − 1), . . . , y(k − Ny ), u(k − 1), . . . , u(k − Nu )] + w(k)
Forecasting
y(k)
Identificación de
Sistemas z−1

w(k) Σ

Ψ
u(k − 1) . . . u(k − Nu ) y(k − 1) y(k − 2) . . . y(k − Ny )

u(k) z−1 z−1


z−1 z−1

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 19/24]


Identificación de Sistemas
Modelos fundamentales (NARX)
Consideraciones
Generales Predictor NARX:
Datos Temporales
Procesos Estocásticos
ŷ(k) = Φ [y(k − 1), . . . , y(k − Ny ), u(k − 1), . . . , u(k − Nu )]
Forecasting
ŷ(k)
Identificación de
Sistemas

u(k − 1). . . u(k − Nu ) y(k − 1) . . . y(k − Ny )

La función paramétrica Φ(◦) puede ser aproximada usando cualquier modelo


de aprendizaje supervisado no recurrente.

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 20/24]


Identificación de Sistemas
Modelos fundamentales (NOE)
Consideraciones
Generales NOE (Non-linear Output Error ):
Datos Temporales
Procesos Estocásticos
x(k) = Ψ [x(k − 1), . . . , x(k − Ny ), u(k − 1), . . . , u(k − Nu )] + w(k)
Forecasting y(k) = x(k) + w(k)
Identificación de
Sistemas y(k)
w(k) Σ

x(k) z−1

Ψ
u(k − 1) . . . u(k − Nu ) x(k − 1) x(k − 2) . . . x(k − Ny )

u(k) z−1 z−1


z−1 z−1

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 21/24]


Identificación de Sistemas
Modelos fundamentales (NOE)
Consideraciones
Generales Predictor NOE:
Datos Temporales
Procesos Estocásticos
ŷ(k) = Φ [ŷ(k − 1), . . . , ŷ(k − Ny ), u(k − 1), . . . , u(k − Nu )]
Forecasting
ŷ(k)
Identificación de
Sistemas z−1

Φ
u(k − 1) . . . u(k − Nu ) ŷ(k − 1) ŷ(k − 2) . . . ŷ(k − Ny )

u(k) z−1 z−1


z−1 z−1

La función paramétrica Φ(◦) puede ser aproximada usando cualquier modelo


de aprendizaje recurrente.
DCC-UCSP Clase 01 TÚPAC, Y. [pp. 22/24]
Identificación de Sistemas
Modelos fundamentales (NARMAX)
Consideraciones
Generales NARMAX (NL Auto-Regressive Moving Average with eXogenous inputs):
Datos Temporales
Procesos Estocásticos
y(k) = Ψ [y(k − 1), . . . , y(k − Ny ), u(k − 1), . . . , u(k − Nu ), . . .
Forecasting w(k − 1), w(k − Nw )] + w(k)
Identificación de
Sistemas y(k)
z−1
w(k)
Σ

Ψ
w(k − 1) . . . w(k − Nw ) u(k − 1) . . . u(k − Nu ) y(k − 1) y(k − 2) . . . y(k − Ny )
−1 −1
z z
z−1 z−1 z−1 z−1
u(k)

DCC-UCSP Clase 01 TÚPAC, Y. [pp. 23/24]


Identificación de Sistemas
Modelos fundamentales (NARMAX)
Consideraciones
Generales Predictor NARMAX:
Datos Temporales
Procesos Estocásticos e(k)
Forecasting z−1
Identificación de y(k)
Sistemas −
ŷ(k)

Φ
y(k − 1) . . . y(k − Ny ) u(k − 1) . . . u(k − Nu ) e(k − 1) e(k − 2) . . . e(k − Ne )

z−1 z−1
z−1 z−1 z−1 z−1
u(k)

La función paramétrica Φ(◦) puede ser aproximada usando cualquier modelo


de aprendizaje supervisado de funciones.
DCC-UCSP Clase 01 TÚPAC, Y. [pp. 24/24]

También podría gustarte