Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Programación Dinámica
Conceptos básicos
Contenido
1. Introducción
2. Recursividad dinámica
3. Tipos de programas dinámicos
4. Modelos dinámicos.
5. Subdivisión del problema
6. Estructura de un programa dinámico
7. Representación de un modelo dinámico
8. Función recursvia
9. Representación y procesos de solución
10. Tableros dinámicos del proceso
11. Procesos de decisión dinámica
12. Rangos de estado y decisión por etapa
13. El problema de la diligencia
14. El problema de las inversiones
15. Bibliografía
LOGRO DE LA UNIDAD
PD
dn
Sn n Sn-1
Rendimientos
dn dn-1 d1
Sn-1 Sn-2 S1
Sn n Sn-1
n-1 1 S0
rn rn-1 r1
FUNCIÓN RECURSIVA
fn(Sn) = Optimizar {rn(Sn,dn) 𝜏 f*n-1(Sn-1)}
Donde:
dn fn(Sn) = Función óptima del estado en la etapa n
Optimizar = Maximizar (Max) o Minimizar (Min)
rn(Sn,dn) = Rendimiento en función de estado y decisión de la etapa n
𝜏 = Aditivo (+) o Multiplicativo (x)
Sn n f*n-1(Sn-1) = La mejor decisión de la Función en la etapa anterior (n-1)
𝑛
rn 𝑖=1
FUNCIÓN DEL ESTADO dn
Sn-1 = Sn – ωndn
Sn n Sn-1
𝑆𝑛
𝑑𝑛 ≤
𝜔𝑛 ωndn
Donde:
Sn = Estado en la etapa n Sn n Sn-1
Sn-1 = Estado en la etapa n-1
ωn = Factor de relación entre estado y decisión
dn = Decisión en la etapa n
REPRESENTACIÓN Y PROCESOS DE SOLUCIÓN
De atrás hacia adelante: Comienza en la etapa 1 y termina en la etapa n
dn dn-1 dn-2 d2 d1
rn rn-1 rn-2 r2 r1
De adelante hacia atrás hacia adelante: Comienza en la etapa n y termina en la etapa 1
d1 d2 d3 dn-1 dn
S2 S3 S4 Sn-1 Sn Sn+1
S1 1 2 3 n-1 n
r1 r2 r3 rn-1 rn
TABLEROS DINÁMICOS DEL PROCESO
General: casos de atrás hacia adelante Etapa 1: n=1 (última etapa y primera de evaluación)
dn d1
Sn n Sn-1 S1 1
S0
f1(S1) = Optimizar {r1(S1,d1)}
rn
f1(S1) = Optimizar {r1(S1,d1) 𝜏 f* 0(S0)} r1
S1 d1 f1*(S1) X1
Si 𝜏 = aditivo S0 = 0, entonces f* 0(S 0) = 0 Valor mínimo
Si 𝜏 = multiplicativo S0 = 0, entonces f* 0(S 0) = 1
…
S0 = S1 – d1 d1 = S1 Valor máximo
Todo lo disponible se decide
TABLEROS DINÁMICOS DEL PROCESO
General: casos de atrás hacia adelante Etapa 2 hasta n-1 (etapas intermedias)
dn dn-1 d2
rn rn-1 r2
Valormáximo
TABLEROS DINÁMICOS DEL PROCESO
General: casos de atrás hacia adelante Etapa n (última etapa de evaluación, primera de decisión)
dn dn
dn
Sn fn*(Sn) Xn
Valor mínimo … Valor máximo
Disponible
…
Sn n Sn-1
Valor máximo
Todo lo disponible se decide
rn S[2hasta n-1]
d[2 hastan-1] f[2hasta n-1]*
X[2hastan-1]
Valor mínimo … Valormáximo (S[2hastan-1])
fn(Sn) = Optimizar {rn(Sn,dn) 𝜏 f* (S )} Valormínimo
n-1 n-1
dn ≤ Sn/ωn
…
Sn-1 = Sn – ωndn
Valormáximo
dn
Sn fn*(Sn) Xn
Valor mínimo … Valor máximo
Disponible
PROCESO DE DECISIÓN DINÁMICA
dn
Sn fn*(Sn) Xn
Valor mínimo … Valor máximo
Disponible
Valormáximo
S1 d1 f 1 *(S 1 ) X1
Valor mínimo
…
Decisiones desde la última etapa de evaluación
hacia la primera etapa, de manera recursiva Valor máximo
T o d o lo disponible se decide
RANGOS DE ESTADO Y DECISIÓN POR ETAPA
…
Minimo Valor mínimo Valor mínimo
n-1
Maximo Valor máximo Valor máximo
Minimo Disponible Valor mínimo
n
Maximo Disponible Valor máximo
EL PROBLEMA DE LA DILIGENCIA (RUTAS)
Se necesita conocer cual es la mejor ruta desde la estación A hasta la estación H si tiene
opciones de recorrido por las estaciones B, C…G con información de distancias (en
kilómetros) entre cada estación.
10
B E
2
5 8
10
6 12 3
A C F H
10
7
9 8
D 10 G
¿Cuál es la ruta mas corta?
Etapas: Tramos de la ruta
Estados: Estación i (A..H)
Decisión: Elegir la estación o ruta
Función de retorno: Minimizar distancia
Etapa 1
Decisión F1 X1
Estado H
E 2 2 H
F 3 3 H
G 8 8 H
Rangos Estado Decisión
Mínimo B E
Máximo D G
Etapa 2
Decisión F2 X2
Estado E F G
B =10 +2 =12 =8+3=11 - 11 F
C =10+2=12 =12+3=15 =10+8=18 12 E
D - =9+3=12 =10+8=18 12 F
Etapa 3
Decisión F3 X3
Estado B C D
A =5+11=16 =6+12=18 =7+12=19 16 B
d3=B d2 = F d1=H
S2=B S1=F
S3 = A 3 Sn-1
n-1 S0=H
1
r3 = 5 r2=8 r1= 3
Ruta óptima:
A–B–F-H
Ejercicio – Ruta mas corta
Un apostador de Oregón decide irse al medio oriente para unirse a la fiebre del
petróleo en Bagdad (Irak) . Tiene que hacer un viaje por avión, férreo y terrestre a
través de territorios donde existen serios peligros de ser atacados por personas de
mal vivir. El lugar de partida y destino son fijos, pero tiene muchas opciones en
cuanto a que zonas debe elegir como puntos intermedios. Se desea determinar la ruta
mas segura, con el objetivo que el costo del seguro para cualquier ruta este basada
en una evaluación de seguridad del viaje, la ruta mas segura debe ser aquella con el
costo total mas barato. ¿Cuál es la ruta que minimiza el costo total del seguro?
Etapas : Tramos de la ruta Hurgada 395
Estados : Zonas intermedias (Bruselas, Copenahue… Bagdag)
Decisión : Elegir ruta Bagdag
Función de retorno: Minimizar costo del seguro
450
Rango Estado Decisión ETAPA 1 Ismalía
Decisión F1 X1
Estado Bagdag
Hurgada 395 395 Bagdag
Ismalía 450 450 Bagdag
Rango Estado Decisión
Estocolmo 185
Mínimo Estocolmo Hurgada ETAPA 2
Máximo Gdansk Ismalía 475
Hurgada
695
415
350
420
Dortmun 150
Gdansk
d
565
Decisión F3 X3
Estado Estocolmo Florencia Gdansk
Bruselas =700+580=1280 =400+830=1230 =600+745= 1345 1230 Florencia
Copenahue =320+580=900 =280+830=1110 =415+745=1160 900 Estocolmo
Dortmund =420+580=1000 =150+830=980 =565+745=1310 980 Florencia
Rango Estado Decisión
Mínimo Oregón Bruselas ETAPA 4 Brusela
s
Máximo Oregón Dortmund 200
Oregó 450 Copena
n hue
350
Dortmu
nd
Decisión F4 X4
Estado Bruselas Copenahue Dortmund
Oregón =200+1230=1430 =450+900=1350 =350+980=1330 1330 Dortmund
ETAPA 1 = Banco D
Decisión F2 X2
Estado 1 2 3 4 5
2 =7+10=17 - - - - 17 1
3 =7+13=20 =8+10=18 - - - 20 1
4 =7+16=23 =8+13=21 =9+10=19 - - 23 1
5 =7+18=25 =8+16=24 =9+13=22 =14+10=24 - 25 1
6 =7+19=26 =8+18=26 =9+16=25 =14+13=27 =16+10=26 27 4
ETAPA 3 = Banco B
Decisión F3 X3
Estado 1 2 3 4 5
3 =10+17=27 - - - - 27 1
4 =10+20=30 =11+17=28 - - - 30 1
5 =10+23=33 =11+20=31 =12+17=29 - - 33 1
6 =10+25=35 =11+23=34 =12+20=32 =13+17=30 - 35 1
7 =10+27=37 =11+25=36 =12+23=35 =13+20=33 =16+17=33 37 1