Está en la página 1de 11

PROGRAMACIÓN DINÁMICA DETERMINISTICA

El enfoque de programación dinámica en los problemas determinísticos, es


donde el estado en la siguiente etapa está completamente determinado por el
estado y la política de decisión de la etapa actual. El caso probabilístico en el
que existe una distribución de probabilidad para el valor posible del siguiente
estado este se analizará más adelante. Aplicaciones de programación dinámica
determinística.
Algunas de las aplicaciones de programación dinámica determinística son:
 Modelo de Volumen-
 Carga “Mochila”
 Modelo del tamaño de la fuerza de trabajo
 Modelo de reposición de equipos
 Modelo de inversión
 Modelos de inventarios
A continuación, se presentarán algunas de estas aplicaciones, cada una de las
cuales muestra una nueva idea en la puesta en práctica de la PD. Técnica
matemática orientada a la solución de problemas con decisiones secuenciales
en etapas sucesivas donde se debe minimizar el coste total de dichas
decisiones. En cada etapa se valora no sólo el coste actual de tomar una
decisión sino los costes futuros que se originan a partir de ella
En cada etapa se evalúa la decisión óptima para cada uno de sus estados
 Cada estado guarda toda la información necesaria para tomar las decisiones
futuras sin necesidad de conocer cómo se ha alcanzado dicho estado. Es un
procedimiento recursivo que resuelve de manera iterativa, incorporando cada
vez una etapa, partes cada vez mayores del problema original. El
procedimiento puede hacerse hacia delante o hacia atrás. 
ETAPAS: Divisiones del problema (n+1).
 ESTADOS: Cada etapa tiene distintos estados. 
DECISIÓN: Transición del estado actual a otro estado de la etapa siguiente.
FORMULACIÓN RECURSIVA: Ecuación que relaciona el costo de un estado
actual con el costo del siguiente estado.
Características comunes de los problemas de programación dinámica 
El problema original de n variable de decisión se puede dividir en n etapas
comuna decisión por tomar en cada etapa. 
Cada etapa tiene un número de estados asociado a ella
La decisión tomada en una etapa conduce a cierto estado en la etapa
siguiente(anterior)
Dado el estado actual, la decisión óptima para cada uno de los estados
restantes no depende de las decisiones o etapas previo
Existe una relación recursiva que identifica la decisión óptima para la etapa
i, dado que la etapa i-1 (recursión hacia delante) o i+1 (recursión hacia atrás)
ha sido resuelta
La etapa final (inicial) debe ser resoluble sin hacer referencia a las siguientes

Características de los problemas de programación dinámica


determinística
Las características de la programación dinámica se emplean para formular
e identificar la estructura de los problemas de este tipo. A continuación, se
presentarán estas características básicas que distinguen a los problemas de
programación dinámica. El problema se puede dividir en etapas que requieren
una política de decisión en cada una de ellas. En muchos problemas de
programación dinámica, la etapa es la cantidad de tiempo que pasa desde
el inicio del problema, en ciertos casos no se necesitan decisiones en cada
etapa. Cada etapa tiene un cierto número de estados asociados a ella. Por
estado se entiende la información que se necesita en cualquier etapa para
tomar una decisión óptima. 
El efecto de la | información sobre su comportamiento anterior, y esta
información es necesario para determinar la política óptima de ahí en adelante.
El procedimiento de solución se inicia al encontrar la política óptima para la
última etapa. La política óptima para la última etapa prescribe la política óptima
de decisión para cada estado posible en esa etapa. Se dispone de una relación
recursiva que indica la política óptima para la etapa dada apolítica óptima para
la etapa (n+1) A pesar de esta característica, los problemas que pueden ser
atacados con la PD tienen otras dos propiedades adicionales:
Sólo un número reducido de variables se debe conocer en cualquier etapa con
el fin de describir al problema. En efecto, los problemas de la PD
se caracterizan por la dependencia de los resultados derivados de decisiones
sobre un número reducido de variables. 
El resultado de una decisión en cualquier etapa altera los valores numéricos de
un número reducido de variables relevantes al problema. La decisión actual ni
incrementa ni decremento el número de factores sobre los cuales

EJEMPLO 1

AGENCIA DE PUBLICIDAD

Una agencia de publicidad está llevando a cabo una campaña de publicidad de


una semana para una tienda local. La agencia ha determinado que es posible
que la campaña más efectiva pudiera incluir la colocación de anuncios en
cuatro medios. Un periódico diario, un periódico dominical, radio y televisión.
Se tiene disponible $ 8,000 para esta campaña y la agencia le gustaría
distribuir esa cantidad en incrementos de $1,000 en todos los medios, de
manera que se maximice el índice de exposición a la publicidad.
Investigaciones llevadas a cabo por la agencia permiten obtener las siguientes
estimaciones de la exposición por cada $1,000 de gasto en cada uno de los
medios.

Determine cuánto debe invertir la agencia en cada uno de los medios para
maximizar la exposición de los anuncios.

Resolución

Vemos que no se menciona de forma explícita las etapas, para ello debemos
de ponernos a meditar sobre la toma decisión que ha de ocurrir, podemos decir
que si empezamos de arriba hacia abajo en la tabla que se ha presentado,
podríamos decir que nuestro estado inicial es S1=$8000 y tomaremos una
decisión X1 que sería el valor de la inversión en uno de los medios informativos
tal que nos lleve al  siguiente estado (el siguiente medio informativo) y en el
siguiente estado tendremos S2=8000-X1, y así sucesivamente S3=S2-X2 tal que
al final quedemos con 0, observemos la situación determinística que dicta que
el estado n+1 está determinado enteramente por el estado anterior y su
contribución , ahora bien bajo esto podríamos decir que los medios informativos
son las etapas, ya que en ellos se concentran las tomas de decisiones,
podemos entonces realizar la siguiente tabla:
Sí cada etapa es cada medio informativo, observemos lo que sucede en la
etapa 1; en la etapa 1 podemos elegir, invertir 0 a 8, no sabemos cuánto, pero
sabemos que esas son los valores posibles:

Si encontramos una razón a ello


podemos decir, sea:

 Sea n el número de estados que es 4.


 Sn: La cantidad actual para invertir en la etapa n
 xn: La cantidad actual que se invertirá en la etapa n tal que
xn ={0,1,2,3,4,5,6,7,8}
 Sn+1: La cantidad restante de inversión en la etapa n+1.
 Csn,sn+1: la contribución inmediata de ir de n a n+1.

Entonces:

Con estos datos podemos buscar la relación recursiva; nuestro objetivo es


obtener la maximización de exposición en los medios, entonces en cada etapa
se ha evaluado y obtenido un gn+1(Sn+1), entonces podemos decir que la
maximización de exposición (Gmax) es:
Gmax=C(Sn,Sn+1)+gn+1(Sn+1) equivalente a C(Sn,Sn+1)+gn+1(Sn-Xn)

Entonces en la etapa 1, sea S1=8, si invertimos los 8 el cual es nuestro X1 en la


etapa 1 nos quedamos con 0 el cual es nuestro Sn+1.Y la contribución de invertir
esos 8 en la etapa 1 es C(Sn,Sn+1)=82, según dato en tabla. Esto ocurre de
forma similar con los otros posibles estados. Bajo esa misma lógica creamos
los demás estados y etapas.
Obtenemos una red de la forma en que se muestra, expliquemos un poco que
es lo que está sucediendo:

En la primera etapa el esfuerzo de invertir 6 trae como resultado 80 y me quedo


con 2 que es el estado inicial para la etapa 2, luego yo puedo decidir invertir
esos 2 en la etapa 2 y me quedaría con 0, el resultado de invertir 2 en la
segunda etapa es 55, o podría solo invertir 1 y el resultado de invertir 1 es 15
en la segunda etapa o no podría invertir nada, quedándome con 2 y el
resultado de no invertir nada es 0, no puedo invertir 3 ya que no poseo dicha
cantidad, siguiendo esa misma lógica es que se ha desplegado toda la red. En
la última etapa sea lo que quede se va a distribuir, entonces el último estado
será de valor 0, con todo esto descrito pasamos a las tablas:

Etapa 4 (Televisión):
Etapa 1 (Periódico diario):

Aquí se observa lo sucedido con el nodo de 8 a 2, existe una inversión 6,


invertir 6 en la etapa 1 trae una exposición de 80, dejando esos 2 para la
siguiente etapa, es ahí donde revisamos cual es la forma más óptima de
distribuir 2, que en la siguiente etapa es de 40

Finalmente, la mayor exposición es de 167 y se logra a través de


la distribución de inversión de:

PROBLEMA 2

Una empresa requiere tener una máquina que trabaje durante los 5 años
siguientes. En la actualidad tiene una máquina nueva. La compañía podría
conservar la máquina o venderla al empezar cada año y comprar una nueva.
Una máquina nueva cuesta 5000 dólares. Los ingresos obtenidos con la
máquina, el costo de mantenimiento y el valor de salvamento que se puede
obtener al venderla al final del año, dependen de la edad de la máquina(véase
tabla). Puede utilizarse una máquina hasta un máximo de tres años de
antigüedad. Utilice la programación dinámica para maximizar la utilidad neta
ganada durante los seis años siguientes.

ESTADOS: Edad de la máquina


ALTERNATIVAS: Conservar, Reemplazar como esta es la última etapa, la
máquina debe venderse, y no hay contribuciones posteriores.
El estado de la etapa n es la antigüedad t de la máquina al inicio del año n,
entonces:
CONCLUSIÓN
Programación dinámica, debe tener una naturaleza secuencial; es decir, debe
poder ser dividido en etapas (i.e., períodos de tiempo razonablemente
elegidos). Cada etapa debe tener estados asociados, que representan
características destacadas del proceso y dan la descripción de la condición del
sistema en una etapa determinada. En cada etapa, una decisión es el resultado
de una elección dentro de un conjunto predeterminado
de posibilidades, que depende del estado del sistema. En conjunto, las decisio
nes constituyenun plan de acción cuya finalidad es obtener los mejores
resultados posibles en términos del problema planteado. La decisión óptima en
cada etapa depende sólo del estado actual y no de las decisiones anteriores y
determina cual será el estado del sistema en la etapa siguiente. El método se
basa en la optimización de una ecuación funcional que gobierna el desarrollo
del proceso de optimización y que depende de manera secuencial de los
cambios de estado, sobre la base de decisiones que siguen a un estado inicial.
BIBLIOGRAFIA

https://upcommons.upc.edu/bitstream/handle/2117/191405/tr_mhd2016_programacion_din
amica_2-5718.pdf

https://whdeveloper.wordpress.com/2019/06/03/programacion-dinamica-deterministica-
investigacion-de-operaciones/

https://www.academia.edu/38199042/PROGRAMACI%C3%93N_DIN
%C3%81MICA_DETERMINISTICA_docx

También podría gustarte