Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Programacion Dinamica Probabilistica PDP
Programacion Dinamica Probabilistica PDP
Probabilística (PDP).
Programación Dinámica
Probabilística (PDP).
• La PDP Se caracteriza porque el valor
asociado a los arcos es un valor probable, y
por lo tanto el valor de las rutas posibles desde
el estado inicial hasta el estado final tiene un
valor asociado a la probabilidad de ocurrencia
de ella. Estando en un estado s cualquiera en
cualquiera de las etapas del problema, los
arcos que de ese estado s salen tienen una
probabilidad de ocurrencia, que puede ser
igual para todos o tener valores diferentes.
• En este tipo de problemas de la PDP se
distinguen: -estados, -etapas, -estado
inicial, -estado final -valor al horizonte,
-función objetivo, -política óptima, -arcos,
-valor asociado a los arcos (estos son
probables y no determinísticos), -óptimo,
-solución óptima, -ruta óptima.
• Presentemos otros conceptos asociados a
estos problemas de PDP mediante un
ejemplo y su solución asociada.
Ejemplo 1. (PDP)
• Una empresa ha recibido el encargo de construir un
artículo, que, por las características exigidas por el
cliente deberá pasar controles de calidad altos. Esto hace
que la empresa estime que la probabilidad de que un
artículo producido salga bueno es 2/3 (66,6667%) y de
1/3 (33,3333%) que salga malo sin posibilidad de
recuperarlo o arreglarlo. El plazo que tiene la empresa
para obtener al menos un artículo bueno es de 3 días, y
la producción del artículo implica ocupar el día en hacer
andar la línea de producción, fabricarlos y finalmente
ver si salieron buenos; por lo que la empresa tiene 3
intentos de fabricación para obtener el artículo bueno.
• Por contrato con el cliente se acuerda que si la
empresa no obtiene el artículo bueno en los 3 días, en
los 3 intentos, la empresa deberá pagar una multa de
$200 al cliente por indemnización o perdida de
tiempo.
• También la empresa sabe que cada día que decide
elaborar ese producto incurre en un costo fijo de $20
por iniciar toda la línea de producción ese día , y tiene
un costo de $5 por cada unidad que decida fabricar.
• Se pide encontrar la política óptima a seguir por la
empresa en cuanto a la producción de este artículo,
para hacer mínimo el costo total de producción y
obtener al menos un artículo de buena calidad, según
lo exigido.
El Modelo y sus partes
• Las etapas. En este problema estarán asociadas a los
dias de producción. Por lo que el problema tiene 3
etapas. La Etapa 1 es el proceso de decidir si produce o
no produce el día 1; y si decide producir, cuántas
unidades producir. De manera similar se entienden las
etapas 2 y 3.
• Los estados: En este problema se pueden distinguir 2
estados posibles dentro de cada etapa, y son: "la
cantidad de artículos buenos que se tiene la obligación
de obtener en esa etapa". Se indicarán por 0 y 1. Por lo
que el estado inicial es 1 y los estados finales posibles
son 0 y 1.
• Es decir, el estado:
• 0 : indica que en esa etapa no se tiene la
necesidad obligada de obtener un
artículo bueno.
• 1 : indica que en esta etapa sí se tiene la
necesidad obligada de obtener un
artículo bueno.
• Las variables de decisión : Son las decisiones
que cada día deberá tomarse, y son: la cantidad
de artículos que se deberá fabricar ese día. Por
lo que son 3 variables de decisión: x1, x2, x3,
donde: x1 es la cantidad de artículos a fabricar el
día 1, x2 es la cantidad de artículos a fabricar el
día 2, y x3 es la cantidad de artículos a fabricar
el día 3.
• Es claro que si un día tiene el estado 0, fabricará
0 artículos, y ese día tendrá un costo de $0. Si un
día tiene el estado 1, deberá fabricar algunos
artículos (si es lo más conveniente), e incurrirá
en un costo de $5 por unidad más $200 fijos.
• El costo de producción de cada día esta
dado por:
200 ; si xi > 0
Costo por dia: = ; Donde
5xi + K(xi) K(xi) =
<
0 ; si xi = 0
• Para cada artículo que se produzca la
probabilidad de que salga bueno es 2/3, y que
salga malo es 1/3 (datos del problema).
n=3,
• f3(1,0) = 0 + 5*0 + (1/3)0*200 = 200
• f3(1,1) = 20 + 5*1 + (1/3)1*200 = 91.666
• f3(1,2) = 20 + 5*2 + (1/3)2*200 = 52.222
• f3(1,3) = 20 + 5*1 + (1/3)3*200 = 42.407
• f3(1,4) = 20 + 5*1 + (1/3)4*200 = 42.469
• f3(1,5) = 20 + 5*1 + (1/3)5*200 = 45.82
• (Se calcula hasta que, para valores de x3,
la f.o. empiece a aumentar de valor, luego
de haber ido descendiendo. En este caso
nos interesa el menor valor de la f.o.).
s \ x3 0 1 2 3 4 5 f *3 x*3
0 0 -- -- -- -- -- 0 0
n=1,
f1(1,0) = 0 + 5*0 + (1/3)0*34.7119 = 34.7119
f1(1,1) = 20 + 5*1 + (1/3)1*34.7119 = 36.5706
f1(1,2) = 20 + 5*2 + (1/3)2*34.7119 = 33.8568
f1(1,3) = 20 + 5*3 + (1/3)3*34.7119 = 36.2856
f1(1,4) = 20 + 5*4 + (1/3)4*34.7119 = 40.4285
s \ 0 1 2 3 4 f *1 x*1
x2