Está en la página 1de 21

INSTITUO TECNOLOGICO DE PIEDRAS NEGRAS

MATERIA: INVESTIGACION DE OPERACIONES 2

MAESTRO: ING. LUIS MANUEL GARCIA PIZARRO.

UNIDAD 1 PROGRAMACION DINAMICA

EQUIPO #1 INTEGRANTES: BLANCA MARGAARITA LARA PERALES. GABRIELA RIVAS CALVO. DALILA GARCIA ROCHA. BLANCA CECILIA NAVA OLIVA. YESENIA CASTRO LOPEZ. KEYLA SAUCEDO DE LA ROSA. ENRIQUE MARTINEZ. SAUL NAVA MARTINEZ.

INDICE

UNIDAD 1 PROGRAMACION DINAMICA

1.1 CARACTERISTICAS DE LOS PROBLEMAS DE PROGRAMACION DINAMICA: ETAPAS, ESTADOS, FORMULA RECURSIVA, PROGHRAMACION EN AVANCE Y EN RETROCESO.

1.2 ALGUNOS EJEMPLOS DE PROGRAMACION DINAMICA.

1.3 PROGRAMACION DINAMICA DETERMINISTICA.

1.4 PROGRAMACION DINAMICA PROBABILISTICA.

1.5 PROBLEMA DE DIMENSIONALIDAD EN PROGRAMACION DINAMICA.

1.6 USO DE PROGRAMAS DE COMPUTACION.

1.7 CARACTERISTICAS DE LOS PROBLEMAS DE PROGRAMACION DINAMICA: ETAPAS, ESTADOS, FORMULA RECURSIVA, PROGHRAMACION EN AVANCE Y EN RETROCESO.
La programacin dinmica (PD) es un procedimiento matemtico diseado principalmente para mejorar la eficiencia de clculo de problemas de programacin matemtica seleccionados, descomponindolos en subproblemas de menor tamao y por consiguiente, ms fciles de calcular. La programacin dinmica comnmente resuelve el problema en etapas, en donde en cada etapa interviene exactamente una variable de optimizacin (u optimizadora). Los clculos en las diferentes etapas se alcanzan a travs de clculos recursivos de manera que se genere una solucin ptima factible a todo el problema. Caractersticas de la programacin dinmica 1. El problema puede dividirse en etapas, con una decisin de la poltica requerida en cada etapa. El problema de la diligencia se dividi literalmente es sus cuatro etapas, correspondientes a las cuatro jornadas del viaje. La decisin de una poltica en cada etapa fue el destino para esa jornada particular (es decir, cual poltica de seguro de vida a elegir). 2. Cada etapa tiene un cierto nmero de estados asociados a ella. Los estados asociados con cada diligencia fueron los estados (o territorios) en los que el vendedor poda estar localizado al embarcarse en esa jornada particular del viaje. 3. En efecto de la decisin de una poltica en cada etapa es transformar el estado actual en un estado asociado a la etapa siguiente (posiblemente de acuerdo con una distribucin de probabilidad). 4. Dado el estado actual, una poltica ptima para las etapas restantes es independiente de la poltica adoptada en las etapas previas. 5. El procedimiento de resolucin empieza por hallar la poltica optima para cada estado de la ltima etapa. 6. Se dispone de una relacin recursiva que identifica la poltica ptima para cada estado en la etapa n, dada la poltica optima para cada estado en la etapa (n+1).

La forma precisa de relacin recursiva difiere de un problema a otro de Programacin dinmica, pero usaremos una notacin anloga a la siguiente:

N = nmero de etapas. n = etiqueta para la etapa actual ( n = 1,2,...,N) sn = estado actual para la etapa nxn = variable de decisin para la etapa nxn* = valor ptimo de xn (dado sn) 8.Cuando se usa esta relacin recursiva, el procedimiento de solucin comienza al final y se mueve hacia atrs etapa por etapa, hasta que encuentra la poltica ptima desde la etapa inicial.

Procedimiento de solucin.
1. Se construye una relacin recursiva que identifica la poltica ptima para cada estado en la etapa n, dada la solucin ptima para cada estado en la etapa n+l. 2. Se encuentra la decisin ptima en la ltima etapa de acuerdo a la poltica de decisin establecida. Comnmente la solucin de esta ltima etapa es trivial, es decir, sin ningn mtodo establecido, tomando en cuenta solamente la "contribucin" de la ltima etapa. 3. La idea bsica detrs de la relacin recursiva es trabajar "hacia atrs", preguntndose en cada etapa: qu efecto total tendra en el problema si tomo una decisin particular en esta etapa y acto ptimamente en todas las etapas siguientes? Si se resolviera el problema "hacia adelante", es decir, de la primera etapa hacia la sera necesario realizar una enumeracin exhaustiva de todas las alternativas, que resolvindolo "hacia atrs" reducimos el nmero de alternativas a analizar, simplificando la solucin del problema. Cuando se llega a la etapa inicial se encuentra la solucin ptima.

1.2 ALGUNOS EJEMPLOS DE PROGRAMACION DINAMICA.

Una compaa est planeando una estrategia de publicidad durante el ao prximo para sus 3 productos ms importantes. Como los tres son bastantes diferentes, cada esfuerzo de publicidad estar dedicado a solo un producto. Se dispone de un total de 6 millones de dlares para esta campaa de publicidad y se supone que el gasto para cada producto deber ser un nmero entero mayor o igual a uno. El vicepresidente de mercadotecnia ha establecido el objetivo como sigue: determinar cunto gastar en cada producto con el fin de maximizar las ventas totales. La siguiente tabla da un incremento estimado en ventas (en las unidades apropiadas) para los diferentes gastos en publicidad:
GASTOS EN PUBLICIDAD

P1 7 10 14 17

P2 4 8 11 14

P3 6 9 13 15

1 2 3 4

Utilizar la programacin dinmica para resolver este problema.


Red Sn 1 F2 4 Xn F3 1 6 8 17 2 4 2 9

6 10 3

0 11 8 13 3 4 7 14 11 4 8 4 4 15 S3 1 2 3 4

n=3 Solucin

n=2

X2= 1 Ff2= (2,1) = P2 (1) + f3* (2-1)= 4+6 = 10

= 4(1) +6(1) = 4+6 =

10

X= 1 X= 2 1 6

2 4 2 9

F2 (3,1) = p2 ( 1 ) + f3 * ( 3-1 ) = = 4(1 ) +9 ( 2 ) = 4 + 18 =

22

F2 (3,2) =p2 ( 2 ) + f3* ( 3-2 ) = = 8 ( 2 ) + 6 (1) = 16 + 6 =

22

11

X2 = 1 X2 =2

X2 = 3

13

F2 (4,1) = p2 (1) + f3* (4-1) = =4 (1) + 4(39) = 4 + 39 = 43

F2 (4,2) = p2 (2) + f3* (4-2) = =8 (2) + 9(2) = 16 + 18 = 34

F2 (4,3) = p2 (3) + f3* (4-3) = = 11 (3) + 6(1) = 33 + 6 = 39

6 1

4 X2 = 1 2 11 X2=3 4 18 3 13 X2=4 9 X2 =2

15

F2 = (5, 1) = p2 (1) +f3* (5-1) = =4 (1) + 15 (4) = 4 + 60 = 64

F2 = (5, 2) = p2 (2) +f3* (5-2) = =8 (2) + 13 (3) = 16 + 39 = 55

F2 = (5, 3) = p2 (3 ) +f3* (5- 3 ) = =11(3) + 9(2) = 33 + 18 = 51

F2 = (5, 4) = p2 (4) +f3* (5- 4) = =14(4) +6(1) = 56 + 6 = 62

TABLA DE RESULTADOS

S2 1 2 3 4

X2

1 10 22 43 64

2 22 34 55

3 39 51

4 62

F2* (S2) 10 22 43 64

X2* 1 1,2 1 1

n=1
1

10

17
2

22 14

10
3

43

64

F1(6,1) = p1 (1) + F2* (6-1) = 7(1) +64(5) = 7 + 320 =

327

F1(6,2) = p1 (2) + F2* (6-2) = 10(2) +43(4) = 20 + 172 = 192

F1(6,3) = p1 (3) + F2* (6-3) = 14(3) +22 (3) = 42 + 66 =

108

F1(6,4) = p1 (4) + F2* (6-4) = 17(4) +10(2) = 68 + 20=

88

S2 6

X1

1 327

2 192

3 108

4 88

F2 *(S2) 327

X2* 1

LA RUTA CRITICA ES:

= 7 + 8 + 13 = 28

= 14 + 8 + 6 =

28

El problema de la diligencia. Un caza fortunas desea ir de Missouri a California en una diligencia, y quiere viajar de la forma ms segura posible. Tiene los puntos de salida y destino conocidos, pero tiene mltiples opciones para viajar a travs delterritori o. Se entera de la posibilidad de adquirir seguro de vida como pasajero de la diligencia. El costo de la pliza estndar (cij ) se muestra en la tabla siguiente. El costo de la pliza estndar (cij ) se muestra en la tabla siguiente.

El problema de las monedas. Para el problema de las monedas con programacin dinmica se necesita crear un algoritmo que permita a una mquina expendedora devolver el cambio mediante el menor nmero de monedas posible. Mediante l a programacin dinmicase solucionar el caso en el que el nmero demonedas de cada tipo es ilimitado. En el problema de las monedas mediante el algoritmo voraz el que el nmero de monedas es ilimitado. El problema de la mochila. Sean n objetos no fraccionables de pesos pi y beneficios bi. El peso mximo que puede llevar la mochila es C. Queremos llenar la mochila con objetos, tal que se maximice el beneficio. Los pasos que vamos a seguir son los siguientes: Ver que se cumple el principio de optimalidad de Bellman. Buscar ecuaciones recurrentes para el problema. Construir una tabla de valores a partir de las ecuaciones.

1.3 PROGRAMACION DINAMICA DETERMINISTICA.

Es una tcnica que se utiliza para resolver diversos problemas de optimizacin Esta tcnica llega a la solucin: Trabajando hacia atrs partiendo del final del problema hacia el principio Esta categora de Programacin dinmica tiene que ver con la naturaleza de la evolucin del sistema, una vez que se ha tomado la decisin. Cuando, en una etapa determinada, podemos conocer con certeza la evolucin del sistema para un determinado estado y un determinado valor de la variable de decisin, para este modelo podemos establecer las decisiones que, en cada etapa, dan valor ptimo de la funcin de recurrencia. Los problemas determinsticos de programacin dinmica son aquellos en los cuales el estado asociado en la etapa siguiente est totalmente determinado por el estado y la poltica de decisin de la etapa actual. La siguiente figura describe el funcionamiento de la programacin dinmica determinstica.

Los problemas de programacin dinmica determinstica son aqullos en los que el estado en la etapa siguiente queda completamente determinado por el estado y la poltica en la etapa actual. Una manera de catalogar los problemas de programacin dinmica determinstica es por la forma de la funcin objetivo.

Por ejemplo, el objetivo podra ser minimizar la suma de contribuciones de las etapas individuales, o bien minimizar un producto de tales trminos y as sucesivamente. En un problema de programacin dinmica, las temporadas deben ser las etapas

Algunas Aplicaciones De La Programacin Dinmica Determinstica Modelo De La Ruta Ms Corta Modelo De Volumen-Carga Mochila Modelo Del Numero De Empleados Modelo De Reemplazo De Equipos Modelo De Asignacin De Recursos Modelo De Inventarios

EJEMPLOS del tema 1.2

1.4 PROGRAMACION DINAMICA PROBABILISTICA

La PDP Se caracteriza porque el valor asociado a los arcos es un valor probable, y por lo tanto el valor de las rutas posibles desde el estado inicial hasta el estado final tiene un valor asociado a la probabilidad de ocurrencia de ella. Estando en un estado s cualquiera en cualquiera de las etapas del problema, los arcos que de ese estado s salen tienen una probabilidad de ocurrencia, que puede ser igual para todos o tener valores diferentes.

En este tipo de problemas de la PDP se distinguen: -estados, -etapas, -estado inicial, estado final -valor al horizonte, -funcin objetivo, -poltica ptima, -arcos, -valor asociado a los arcos (estos son probables y no determinsticos), -ptimo, -solucin ptima, -ruta ptima.

Ejemplo 1. (PDP)

El Enunciado: Una empresa ha recibido el encargo de construir un artculo, que, por las caractersticas exigidas por el cliente deber pasar controles de calidad altos. Esto hace que la empresa estime que la probabilidad de que un artculo producido salga bueno es 2/3 (66,6667%) y de 1/3 (33,3333%) que salga malo sin posibilidad de recuperarlo o arreglarlo. El plazo que tiene la empresa para obtener al menos un artculo bueno es de 3 das, y la produccin del artculo implica ocupar el da en hacer andar la lnea de produccin, fabricarlos y finalmente ver si salieron buenos; por lo que la empresa tiene 3 intentos de fabricacin para obtener el artculo bueno. Por contrato con el cliente se acuerda que si la empresa no obtiene el artculo bueno en los 3 das, en los 3 intentos, la empresa deber pagar una multa de $200 al cliente por indemnizacin o prdida de tiempo. Tambin la empresa sabe que cada da que decide elaborar ese producto incurre en un costo fijo de $20 por iniciar toda la lnea de produccin ese da , y tiene un costo de $5 por cada unidad que decida fabricar. Se pide encontrar la poltica ptima a seguir por la empresa en cuanto a la produccin de este artculo, para hacer mnimo el costo total de produccin y obtener al menos un artculo de buena calidad, segn lo exigido.

El Modelo y sus partes.

Las etapas. En este problema estarn asociadas a los dias de produccin. Por lo que el problema tiene 3 etapas. La Etapa 1 es el proceso de decidir si produce o no produce el da 1; y si decide producir, cuntas unidades producir. De manera similar se entienden las etapas 2 y 3. Los estados: En este problema se pueden distinguir 2 estados posibles dentro de cada etapa, y son: "la cantidad de artculos buenos que se tiene la obligacin de obtener en esa etapa". Se indicarn por 0 y 1. Por lo que el estado inicial es 1 y los estados finales posibles son 0 y 1. Es decir, el estado: 0 : indica que en esa etapa no se tiene la necesidad obligada de obtener un artculo bueno. 1 : indica que en esta etapa s se tiene la necesidad obligada de obtener un artculo bueno. Las variables de decisin : Son las decisiones que cada da deber tomarse, y son: la cantidad de artculos que se deber fabricar ese da. Por lo que son 3 variables de decisin: x1, x2, x3, donde: x1 es la cantidad de artculos a fabricar el da 1, x2 es la cantidad de artculos a fabricar el da 2, y x3 es la cantidad de artculos a fabricar el da 3. Es claro que si un da tiene el estado 0, fabricar 0 artculos, y ese da tendr un costo de $0. Si un da tiene el estado 1, deber fabricar algunos artculos (si es lo ms conveniente), e incurrir en un costo de $5 por unidad ms $200 fijos.

El costo de produccin de cada da esta dado por:

200 ; si xi > 0 Costo por dia: = 5xi + K(xi) ; Donde K(xi) = < 0 ; si xi = 0

Para cada artculo que se produzca la probabilidad de que salga bueno es 2/3, y que salga malo es 1/3 (datos del problema).

Por lo que, si produce 2 artculos la probabilidad de que los 2 salgan malos es: (1/3)*(1/3) = (1/3)2. Si decide producir 3 artculos, la probabilidad de que los 3 salgan malos es de (1/3)3 , asi tambin se tendr que si fabrica 4 es (1/3)4 = 0,0123 la probabilidad de que los 4 salgan malos. Generalizando, si se decide fabricar xi artculos, entonces la probabilidad de que todos salgan malos es: (1/3) xi.

Probabilidades de cada uno de los casos finales, si se decide producir 3 artculos.

Los 3 malos tiene probabilidad de ocurrencia de: (1/3) .


3

y para xi artculos a fabricar la Probab. ser de: (1/3) de que todos salgan malos.
xi

La funcin objetivo, para cualquiera de las etapas contendr lo que representa el costo de esa etapa ms el costo probable de la etapa siguiente si todos hubiesen salido malos, y ms el costo probable de la etapa siguiente si no todos hubiesen salidos malos (al menos uno sali bueno). Y en la etapa n-sima tendremos el estado 0 y el estado 1. Tomenos el estado 1 para f.

donde: K(xn ) es el costo de produccin fijo de $0 o de $200, segn ese da produzca artculos o no. 5*xn : representa el costo de $5 por unidad que se decida producir. (1/3)xn : representa la probabilidad de que los xn artculos salgan malos. fn+1(1) : es el costo que se tendr en la etapa siguiente, si se llega a ella con la obligacin de obtener un artculo bueno. Este valor es: f *n+1(1). (1/3)xnfn+1(1) : es el costo probable desde la etapa siguiente en adelante, si todos los de esta etapa salen malos. (1- (1/3)xn) : es la probabilidad de que no todos los xn artculos salgan malos; alguno sale bueno. fn+1(0) : es el costo en que se incurrir desde la etapa siguiente, si se llega a ella al estado 0, es decir sin la necesidad de producir un artculo bueno, porque ya se obtuvo. Es f *n+1(0) (1-(1/3)xn)fn+1(0) : es el costo probable desde la etapa siguiente, si en esta etapa sale alguno de los artculos bueno. En el problema aqu dado, se tiene que f *n+1( 0 ) es cero, porque es cero el costo ms bajo si no se tiene la obligacin de producir un artculo bueno, en cualquiera de las etapas. La etapa 1 tiene como estado inicial: 1; es decir, en la etapa 1 se tiene la obligatoriedad de obtener un artculo bueno.

Los clculos:

n=3,

f3(1,0) = 0 + 5*0 + (1/3) *200 = 200


1

f3(1,1) = 20 + 5*1 + (1/3) *200 = 91.666 f3(1,2) = 20 + 5*2 + (1/3) *200 = 52.222 2 f3(1,3) = 20 + 5*1 + (1/3) *200 = 42.407 3 f3(1,4) = 20 + 5*1 + (1/3) *200 = 42.469
4 3 2

f3(1,5) = 20 + 5*1 + (1/3) *200 = 45.82 (Se calcula hasta que, para valores de x3, la f.o. empiece a aumentar de valor, luego de haber ido descendiendo. En este caso nos interesa el menor valor de la f.o.).

s \ x3 0 1

0 0 =200

1 -= 91.666

2 -=52.222

3 -=42.407

4 -=42.469

5 -=45.82

f *3 0 42.407

x*3 0 3

n=2,

f2(1,0) = 0 + 5*0 + (1/3) *42.407 = 42.407


1 2 3 4

f2(1,1) = 20 + 5*1 + (1/3) *42.407 = 39.1356 f2(1,2) = 20 + 5*2 + (1/3) *42.407 = 34.7119 f2(1,3) = 20 + 5*3 + (1/3) *42.407 = 36.5706 f2(1,4) = 20 + 5*4 + (1/3) *42.407 = 40.5235

s \ x2 0 1

0 0 42.407

1 -39.14

2 -34.71

3 -36.57

4 -40.52

f *2 0 34.7119

x*2 0 2

n=1,

f1(1,0) = 0 + 5*0 + (1/3) *34.7119 = 34.7119


1 2 3 4

f1(1,1) = 20 + 5*1 + (1/3) *34.7119 = 36.5706 f1(1,2) = 20 + 5*2 + (1/3) *34.7119 = 33.8568 f1(1,3) = 20 + 5*3 + (1/3) *34.7119 = 36.2856 f1(1,4) = 20 + 5*4 + (1/3) *34.7119 = 40.4285

s \ x2 1

0 34.71

1 36.57

2 33.857

3 36.29

4 40.43

f *1 33. 857

x* 1 2

Respuesta: Costo Mnimo Probable: 33. 857 Solucin ptima: x1 = 2 , x2 = 2 , x3 = 3 El costo mnimo probable para obtener al menos un producto bueno es de $ 33. 857; y el da 1 se debe producir 2, y si los 2 salen malos el da 2 se deben producir 2, y si salen malos el da 3 se deben producir 3. Con ms detalles, la poltica ptima, y costos, en cuanto al lote de produccin es: - Que el da 1 fabrique 2 artculos, y si al menos uno de ellos sale bueno, el da 2 y da 3 no fabrica, y tiene un costo total de $20 + $5*2 = $30. - Si todos los artculos del da 1 salen malos, entonces el da 2 se deben fabricar 2 nuevos arculos. Si al menos uno de ellos sale bueno, el da 3 no fabricar, y tiene un costo total de $60. ($30 el dia 1 ms $30 el da 2). - Si todos los artculos del da 2 salen malos, entonces el da 3 se deben fabricar 3 artculos ms. Si todos los del da 3 salen malos, tendr un costo total de $295. ($30 el dia 1 + $30 el da 2 + $35 el dia 3 + $200 de multa). Si al menos uno del da 3 sale bueno, tendr un costo total de $95, dado por $30 el da 1 + $30 el da 2 + $35 el da 3. Otras preguntas: *) Cul es el costo total en los 3 das?. No se sabe de ese costo a priori, y no se sabe cual ser en cada ocasin que se deba fabricar uno de estos artculos, porque no se sabe si se obtendr el da 1 con un costo de $30, o el da 2 con un costo de $60, o el da 3 con un costo de $95, o bien deber pagar la multa de $200 con un costo de $295. El costo del da 1 es seguro, los dems son costos probables. *) De que modo se puede obtener un costo total mnimo de $33. 857 ?. En este caso, de ninguna manera se tendr en alguna ocasin un costo de $33. 857. Segn lo ya indicado, el dia 1 hay un costo de $30, si debe fabricar el da 2 el costo es de $60, y si fabrica el da 3, el costo es de $95, y si todos salen malos, tiene un costo total con multa de $295. *)Tomando en cuenta los resultados y valores de los costos ya indicados, cul debiese ser el mnimo valor al que convendra vender ese artculo de calidad exigente?.

El costo mnimo probable de $33. 857 es aquel costo al que se tender, si se tiene muchos pedidos de este artculos, y cada vez se toma la poltica de produccin que ya se indic (x1=2, x2=2, x3=3). Como el da 1 tiene un costo de $30, (cerca de $33.857), se puede concluir que casi siempre, (en el 88,89% porque: 1 - (1/3)*(1/3) = 0,888 ) el artculo bueno se obtiene el primer da, logrndolo con un costo de $30. En muy pocas ocasiones pasa al da 2 con un costo de $60. (11,11%), y casi nunca pasar al da 3. ( (1/3)^4 = 0,0123; el 1,2 % ). Muy rara vez pagar la multa y tendr un costo de $295, ( (1/3)^7 = 0,00045724737082 ; un 0,045% ). Por lo que el piso para el precio de venta que se debe considerar es de $ 33.857, que es el costo al que tender si se tiene muchos pedidos de este tipo.

1.5 PROBLEMA DE DIMENSIONALIDAD EN PROGRAMACION DINAMICA.

La programacin dinmica tradicional permite obtener las trayectorias ptimas de control para procesos no lineales, variantes, con cualquier tipo de funcional o ndice de desempeo y con restricciones en las variables.

Con un nmero del orden de cinco variables de estado, los algoritmos tradicionales de programacin dinmica exigen elevados requisitos de memoriay de tiempo de clculo a los sistemas de procesamiento digital. Estaca racterstica de la metodologa fue denominada maldicin de dimensionalidad por el propio Bellman, lo cual desalent el empleo de la programacin dinmica tradicional durante ms de veinte aos.

También podría gustarte