Está en la página 1de 9

PROGRAMACION DINAMICA

PROBABILISTICA (PDP)

DEFINICIONES
Hillier-Lieberman
Hamdy Taha
Richard Bronson
La Programacin Dinmica Probabilstica
difiere de la Determinstica en que el estado
de la siguiente etapa no est determinado
por completo por el estado y la poltica de
decisin de la etapa actual. En su lugar
existe una distribucin de probabilidad para
determinar cul ser el siguiente estado.
Sin embargo, esta distribucin de
probabilidad si queda bien determinada por
el estado y la decisin de la etapa actual.
DEFINICIONES
Hillier-Lieberman
Hamdy Taha
Richard Bronson
La Programacin Dinmica Probabilstica
difiere de la Determinstica en que los
estados y los retornos o retribuciones en
cada etapa son probabilsticos.
DEFINICIONES
Hillier-Lieberman
Hamdy Taha
Richard Bronson
Un proceso de decisin de N etapas es
probabilstico, si el rendimiento asociado con al
menos una decisin del proceso es aleatorio.
Esta aleatoriedad generalmente se presenta en
una de dos formas:

Los estados son determinados
exclusivamente por las decisiones, pero los
rendimientos asociados con uno o ms de los
estados son inciertos.

Los rendimientos son determinados
exclusivamente por los estados, pero los
estados que se presentan a partir de una o
ms de las decisiones son inciertos.
Estado:
f
n
(s
n
,x
n
)
Etapa
n
S
n
X
n
f
*
n+1
(s
n+1
)
Etapa
n+1
S
n+1
C
1
ESTRUCTURA BASICA DE LA PROGRAMACION DINAMICA DETERMINISTICA
Estado:
f
n
(s
n
,x
n
)
Etapa
n
f
*
n+1
(1)
Etapa
n+1
1
C
1
ESTRUCTURA BASICA DE LA PROGRAMACION DINAMICA PROBABILISTICA
p
1
f
*
n+1
(2) 2

C
2
p
2
f
*
n+1
(m) m

C
m


S
n
X
n
Sea m el nmero de estados posibles en la etapa n+1. El
sistema cambia al estado i con probabilidad p
i
( i=1, 2,
m) dados el estado s
n
y la decisin x
n
en la etapa n. Si el
sistema cambia al estado i, C
i
es la contribucin o costo
de la etapa n a la funcin objetivo.
p
m
EJEMPLO 1
Un proyecto de investigacin sobre cierto problema de ingeniera tiene 3 equipos de
investigadores que buscan resolver el problema desde 3 puntos de vista diferentes. Se
estima que en las circunstancias actuales la probabilidad de que los equipos A, B, C
fracasen es de: 0.40, 0.60 y 0.80 respectivamente. As, la probabilidad de que los 3
equipos fracasen es de: (0.40)(0.6)(0.8) = 0.180. (Un 180%). El objetivo es minimizar la
probabilidad de fracaso de los 3 equipos, y por ello, se asignaran al proyecto 2 nuevos
cientficos de alto nivel.
Segn la asignacin a los equipos, la probabilidad de fracaso cambia segn lo indicado
en la tabla siguiente:
# de cientficos
adicionales
asignados
Probabilidad de fracaso de los equipos
A B C
0 0.40 0.60 0.80
1 0.20 0.40 0.50
2 0.15 0.20 0.30
EJEMPLO 2
Un repartidor compra a una ganadera 6 galones de
leche a $1 por galn. Cada galn lo vende a $2 y
solamente comercia con 3 clientes. La ganadera est
dispuesta a comprar los galones de leche que el
repartidor no alcance a vender pero solamente le
pagar la mitad de lo que l pag al inicio.
Desafortunadamente para el repartidor la demanda
diaria de cada uno de sus clientes es incierta, es por
esto que llev el registro de sus ventas del ao pasado
y resumi la informacin en probabilidades de la
siguiente manera:

Si lo que quiere el repartidor es asignar los 6 galones de
leche entre los tres clientes para maximizar los ingresos
esperados (ya que el costo siempre ser $6); sabiendo
adems que de los galones de leche enviados a un
determinado cliente no se pueden enviar los rechazados
luego a otro cliente, utilice la programacin dinmica
para determinar cmo el repartidor debe asignar los 6
galones de leche entre sus tres clientes.

Demanda
diaria
(galones)
Probabilidad
Cliente
1
1 0.60
2 0.00
3 0.40
Cliente
2
1 0.50
2 0.10
3 0.40
Cliente
3
1 0.40
2 0.30
3 0.30