Documentos de Académico
Documentos de Profesional
Documentos de Cultura
19-3
Diagrama.
B E
H
A C F J
I
D G
E F G H I
B C D J
B 7 4 6 E 1 4
H 3
A 2 4 3 C 3 2 4 F 6 3
I 4
D 4 1 5 G 3 3
19-4
¿Cual es la ruta
que minimiza el
costo total de la
póliza de seguro?
19-5
Algunas estrategias de solución.
1. Enumeración exhaustiva:
Enumerar todas las rutas posibles,
calcular su costo y elegir la de menor
valor. En total son 18 rutas.
“Fuerza bruta”
19-7
Por P.D la solución sería entonces ir desde el
estado actual (cualquiera que sea) y llegar a
su destino final (estado J) al costo c ij
La
La decisión en la última etapa puede ser trivial
sigue 19-9
Sea fn (Sn, Xn) el costo total de la mejor
política global para las etapas restantes, dado
que el agente se encuentra en el estado Sn
listo para iniciar la etapa n y se dirige a Xn
como destino inmediato.
Etapa n = 4
C E, H
=1 H f3(E) = cE ,H + f4*(H) = 4
E
CE =
,I 4
I f3(E) = cE ,I + f4*(I) = 8
19-13
Luego f3*(E) = 4 y X3* = H
F 9 7 7 I
G 6 7 6 H
19-14
Etapa n = 2
E f2(C) = cC ,E + f3*(E) = 7
=3
,E
c C
c C, F =2
C F f2(C) = cC ,F + f3*(F) = 9
c
C
,G
=4
G f2(C) = cC ,G + f3*(G) = 10
19-15
Luego f2*(C) = 7 y X2* = E
C 7 9 10 7 E
D 8 8 11 8 EoF
19-16
Etapa n = 1
En la primera etapa, el cazafortunas tiene todas las
jornadas por recorrer (n = 1). Necesariamente debe
salir de A
B f1(A) = cA ,B + f2*(B) = 13
=2
,B
c A
c A, C =4
A C f1(A) = cA ,C + f2*(C) = 11
c
A
,D
=3
D f1(A) = cA ,D + f2*(D) = 11
19-17
Luego f1*(A) = 11 y X1* = C o D
Veamos :
4
A C F 3
J
1 4
3
3 I
D G
19-20
3. El efecto de la decisión en cada etapa, es
transformar el estado actual en un estado
asociado con el INICIO de la siguiente etapa.
19-21
5. Dado el estado actual, la política óptima
desde este estado es independiente de las
políticas adoptadas en las etapas
anteriores. (la solución
depende únicamente del estado actual y no
de cómo se llegó allí).
PRINCIPIO DE OPTIMALIDAD EN
P.D,
(Richard Bellman, 1957)
19-24
Algoritmo de P.D hacia atrás
19-25
Algoritmo de P.D hacia adelante
19-26