Resumen Redes Bayesianas

Bayesian Physics Informed Neural Networks for
real-world nonlinear dynamical systems
Juan David Carrascal Ibañez
Abril 2023
Juan David Carrascal Ibañez Bayesian Physics Informed Neural Networks for real-world nonlinear dynamical syst
Temario
1 Motivación
2 Problema a modelar
3 Modelamiento vı́a redes neuronales
4 Modelamiento vı́a inferencia Bayesiana
5 Conclusiones del artı́culo
Motivación
Existe una tendencia reciente consistente en introducir

conocimiento previamente obtenido a partir de modelos fı́sicos
en modelos de aprendizaje de máquina.
Motivación
Existe una tendencia reciente consistente en introducir

conocimiento previamente obtenido a partir de modelos fı́sicos
en modelos de aprendizaje de máquina.
Esto es conveniente pues el proceso de entrenamiento es menos
costoso y el modelo obtenido resulta ser más robusto ante la
presencia de datos con presencia de ruido o datos faltantes.
Motivación
Además se integran técnicas de inferencia bayesiana dar una

interpretación a algunos parámetros del modelo obtenido, a
partir de intervalos de credibilidad.
Motivación

Para ejemplificar el potencial de integrar estas tres técnicas, se
usan datos obtenidos de la pandemia de COVID 19.
Motivación

Para ejemplificar el potencial de integrar estas tres técnicas, se
usan datos obtenidos de la pandemia de COVID 19.
Esto, teniendo en cuenta que las predicciones hechas con redes
neuronales convencionales solı́an ser acertadas
aproximandamente hasta una brecha de dos semanas.
Motivación
Situación a modelar
Partimos de una red neuronal con dos capas ocultas, tomando

el tiempo t como el input:
z0 =t
z1 = σ(W1 z0 + b1 )
z2 = σ(W2 z1 + b2 )
z3 = W3 z2 + b3
El modelo fı́sico que introduciremos está dado por la ecuación

que describe a un oscilador armónico amortiguado:
r = ẍ + 2ζω0 ẋ + ω02 x = 0
El modelo fı́sico que introduciremos está dado por la ecuación

que describe a un oscilador armónico amortiguado:
r = ẍ + 2ζω0 ẋ + ω02 x = 0
Aquı́ ζ representa el radio de amortiguamiento y w0 la

frecuencia angular. Adicionalmente consideraremos el
paramétro δ = c/m, siendo c un coeficiente de viscosidad.
La solución a esta ecuación viene dada por:
x(t) = 2A0 cos(ωt + ϕ)exp(−δt)
La solución a esta ecuación viene dada por:
x(t) = 2A0 cos(ωt + ϕ)exp(−δt)

p
Donde, A0 es la longitud de onda, ω = w02 − δ 2 es la
frecuencia y ϕ = arctan(−δ/ω) es el angulo de fase.
Comportamineto diferentes modelos
Modelamiento vı́a redes neuronales
El espacio parametral del modelo Θ, está constituido por:
Θ = {θ, ϑ, ϵ} donde θ = {Wk , bk } y ϑ = {c, k, x0 }
Aquı́ θ representa los parámetros de la red neuronal, ϑ los

parámetros del oscilador armónico y ϵ es un peso usado para
equilibrar aportación de cada uno de estos modelos.
Aquı́ θ representa los parámetros de la red neuronal, ϑ los

parámetros del oscilador armónico y ϵ es un peso usado para
equilibrar aportación de cada uno de estos modelos.
El objetivo de PINN es aprender θ y ϑ entrenando la red
neuronal y simultáneamente resolviendo la ecuación del
oscilador armónico.
Modelamiento via redes neuronales
Esto se logra a partir de unificar ambos problemas de

optimización en uno solo mediante la función de pérdida:
L(Θ; t) = (1 − ϵ)Ldata + ϵLphys

Ldata = n1trn ni=1 ||x(ti ) − x̂i ||2 es la función de pérdida de la

P trn
red en el conjunto de entrenamiento.

Ldata = n1trn ni=1 ||x(ti ) − x̂i ||2 es la función de pérdida de la

P trn
red en el conjunto de entrenamiento.
1
Pnsmp ¨ c k 2
Lphys = nsmp i=1 ||(ti ) + m ẋ(ti ) + m (x(ti ) − x0 )|| es la
función de pérdida usada en el oscilador armónico.
Esquema funcionamiento de una PINN.
Comparación diferentes valores de ε
Modelamiento via inferencia Bayesiana
El objetivo de usar inferencia bayesiana es estimar la

distribución posterior de un conjunto de parámetros, de
manera que las estadı́sticas de un modelo coincidan con las del
conjunto de entrenamiento, de manera que se maximice la
verosimilitud de la distribución previa dada por:
P(x̂, r |Θ)P(Θ) P(x̂|Θ)P(r |Θ)P(Θ)
P(Θ|x̂, r ) = =
P(x̂)P(r ) P(x̂)P(r )
Modelamiento vı́a inferencia Bayesiana
Aquı́, P(x̂, r |Θ) es la verosimilitud del conjunto de datos x̂ y

P(r |Θ) es la verosimilitud de los parametros del modelo fı́sico
usado r, P(Θ) es la distribución previa; P(x̂) y P(r ) son las
verosimilitudes marginales o también llamadas evidencias.


n 1 −||x̂−x(ti )||2
P(x̂|Θ) = Πi=0 pi (x̂|Θ) con pi (x̂|Θ) = 2πσ exp
√
2σ 2 .


n 1 −||x̂−x(ti )||2
P(x̂|Θ) = Πi=0 pi (x̂|Θ) con pi (x̂|Θ) = 2πσ exp
√
2σ 2 .
2

1
P(r |Θ) = Πni=0 pi (r |Θ) con pi (r |Θ) = √2πσ exp −||r2σ(t2i )|| .
Usando el mismo espacio parametral del modelo anterior
Θ = {θ, ϑ, ϵ}, estimamos P(Θ), mediante:
P(Θ) = P(c, k, x0 , Wk , bk )
Usando el mismo espacio parametral del modelo anterior
Θ = {θ, ϑ, ϵ}, estimamos P(Θ), mediante:
P(Θ) = P(c, k, x0 , Wk , bk )
Donde
log (c) ∼ N (µ = log (2.2), σ = 0.5)
log (k) ∼ N (µ = log (350), σ = 0.5)
log (x0 ) ∼ N (µ = log (0.56), σ = 0.5)
Wk ∼ N (µ = 0.0, σ = 2.0)
bk ∼ N (µ = 0.0, σ = 2.0)
Esquema inferencia bayesiana de los paramétros de la red.
Comparación de modelos usando inferencia bayesiana.

Conclusiones del artı́culo
Desempeño diferentes métodos
Las redes neuronales por sı́ solas son un método simple y

robusto para interpolar datos de entrenamiento pero tienen un
potencial predictivo muy limitado.

PINN integran la información de un cojunto de datos y un
modelo fı́sico, obteniendo un buen potencial predictivo.

La inferencia bayesiana permite ajustar un modelo fı́sico a un
conjunto de datos y proporciona intervalos de credibilidad.

La inferencia bayesiana permite ajustar un modelo fı́sico a un
conjunto de datos y proporciona intervalos de credibilidad.
BPINN proporcionan un buen ajuste y tienen buena habilidad
predictiva, sin embargo son sensibles a escalamiento.
Gracias

Resumen Redes Bayesianas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Redes Bayesianas

Cargado por

Copyright:

Formatos disponibles

Bayesian Physics Informed Neural Networks for

real-world nonlinear dynamical systems

Juan David Carrascal Ibañez

3 Modelamiento vı́a redes neuronales

4 Modelamiento vı́a inferencia Bayesiana

5 Conclusiones del artı́culo

Existe una tendencia reciente consistente en introducir

Existe una tendencia reciente consistente en introducir

Además se integran técnicas de inferencia bayesiana dar una

Además se integran técnicas de inferencia bayesiana dar una

Además se integran técnicas de inferencia bayesiana dar una

Partimos de una red neuronal con dos capas ocultas, tomando

El modelo fı́sico que introduciremos está dado por la ecuación

El modelo fı́sico que introduciremos está dado por la ecuación

Aquı́ ζ representa el radio de amortiguamiento y w0 la

La solución a esta ecuación viene dada por:

x(t) = 2A0 cos(ωt + ϕ)exp(−δt)

La solución a esta ecuación viene dada por:

x(t) = 2A0 cos(ωt + ϕ)exp(−δt)

Comportamineto diferentes modelos

El espacio parametral del modelo Θ, está constituido por:

Θ = {θ, ϑ, ϵ} donde θ = {Wk , bk } y ϑ = {c, k, x0 }

El espacio parametral del modelo Θ, está constituido por:

Θ = {θ, ϑ, ϵ} donde θ = {Wk , bk } y ϑ = {c, k, x0 }

Aquı́ θ representa los parámetros de la red neuronal, ϑ los

El espacio parametral del modelo Θ, está constituido por:

Θ = {θ, ϑ, ϵ} donde θ = {Wk , bk } y ϑ = {c, k, x0 }

Aquı́ θ representa los parámetros de la red neuronal, ϑ los

Esto se logra a partir de unificar ambos problemas de

L(Θ; t) = (1 − ϵ)Ldata + ϵLphys

Esto se logra a partir de unificar ambos problemas de

L(Θ; t) = (1 − ϵ)Ldata + ϵLphys

Ldata = n1trn ni=1 ||x(ti ) − x̂i ||2 es la función de pérdida de la

Esto se logra a partir de unificar ambos problemas de

L(Θ; t) = (1 − ϵ)Ldata + ϵLphys

Ldata = n1trn ni=1 ||x(ti ) − x̂i ||2 es la función de pérdida de la

Esquema funcionamiento de una PINN.

Comparación diferentes valores de ε

El objetivo de usar inferencia bayesiana es estimar la

Aquı́, P(x̂, r |Θ) es la verosimilitud del conjunto de datos x̂ y

Aquı́, P(x̂, r |Θ) es la verosimilitud del conjunto de datos x̂ y

Aquı́, P(x̂, r |Θ) es la verosimilitud del conjunto de datos x̂ y

Esquema inferencia bayesiana de los paramétros de la red.

Comparación de modelos usando inferencia bayesiana.

Desempeño diferentes métodos

Las redes neuronales por sı́ solas son un método simple y

Las redes neuronales por sı́ solas son un método simple y

Las redes neuronales por sı́ solas son un método simple y

Las redes neuronales por sı́ solas son un método simple y

También podría gustarte