Tarea Progamacion Dinamic

TÉCNICA DE PROGRAMACIÓN DINÁMICA APLICADA A UN MODELO DE
CONFIABILIDAD EN EL AREA MÉDICA.
1.- PROBLEMA DE APLICACIÓN.
En la medicina, la ingeniería farmacéutica y las consultas médicas, el aire comprimido debe

estar seco y totalmente exento de aceite y gérmenes. Los estrictos requisitos para el aire
comprimido médico requieren un equipo fiable donde la estrategia de Redundancia se elige
para subsistemas individuales. Para esto, hemos hecho uso de la técnica de operaciones de
programación dinámica. Gracias a su diseño modular y flexible, así como a su concepto de
redundancia sofisticado, los sistemas de BOGE están siempre diseñados para casos extremos
y, además, garantizan un suministro de aire comprimido médicamente puro incluso en el
caso de producirse un corte en la tensión. Así, cada instalación dispone de redundancia triple
en la generación de aire comprimido.
Considere el diseño de un dispositivo del equipo del equipo de aire comprimido que consta
de 3 componentes dispuestos en serie, de manera que la falla de por lo menos uno de ellos
hara que falle el Dispositivo. La confiabilidad (probabilidad de que no haya falla) del
dispositivo se puede mejorar a través de la instalación de unidades de reserva en cada
componente. El diseño Requiere del uso de uno o dos unidades de reserva, lo que significa
que cada componente puede incluir hasta 3 unidades en paralelo. El capital disponible para
el diseño del dispositivo es de $10 en miles de dólares. Los datos de confiabilidad y el costo
de las unidades adicionales en paralelo se dan a continuación.
Unidades en cada componente

1 2 3
Componente 1 0.6 0.8 0.9
Costo ($)
1 2 3
Componente 1 1 2 3
Componente 2 3 5 6
Componente 3 2 4 5
Se debe formular un modelo de Programacion Dinamica para determinar el numero de

unidades en paralelo en cada componente, que maximice la confiabilidad del dispositivo
Sin exceder el capital asignado.
1.1.- METODOLOGIA
1. CONCEPTOS
1. ¿Qué es la Programación Dinámica (PD)?
 Es una técnica de optimización.
 Es el planeamiento de los cambios de las variables de estado a través del tiempo.
2. ¿Qué es un Estado?
Es una situación actual del problema que se está solucionando. Esta situación actual está
representada por un vector de estado.
3. ¿Qué es un vector de estado?
Es un conjunto de variables de estado, cuyos valores especifican la condición actual del
subproblema del sistema. La cantidad de variables de estado, dependerá de la
complejidad del problema. Para nuestro curso el máximo será 5 variables.
Las variables de estado cambian de valor cuando se toma una decisión.
4. ¿Qué es una variable de estado?
Es la representación de todo elemento o entidad del sistema que requiere ser evaluado
en el modelo dinámico; su valor es necesario saberlo para poder tomar una decisión.
5. ¿Qué es una decisión?
Es una oportunidad para cambiar el valor de algunas variables de estado. En un estado
determinado, podemos tomar un conjunto de decisiones.
2. HISTORIA DEL PD
 Richard Bellman y sus colegas de la corporación RAND, son los creadores de esta
técnica.
 Su trabajo fue publicado en 1957.
 La tecnología de esos tiempos, no permitió que esta técnica alcance éxitos.
 Hoy, gracias al avance tecnológico, software y hardware, la PD está permitiendo
resolver problemas grandes y complejos.
3. PRINCIPIO DE OPTIMALIDAD
”La mejor ruta desde cualquier estado Z al estado Final o cualquier otro estado, depende
solo del estado Z, estado en que está, y no depende de la ruta para llegar al estado Z”
En grandes problemas donde se pueda aplicar el principio de optimalidad, podemos

aplicar PD.
4. APLICACIÓN DE LA PD
Para un problema dado, podemos aplicar PD, si:
 Cumple con el principio de optimalidad.

 Podemos aplicar el concepto de ecuación recursiva: f(s) = max o min{ a(s,d) + f(sn)}.
 Los valores óptimos de los estados finales, estados de contorno, son valores triviales.
2. TERMINOLOGÍA
1. Estado
Es el vector de estado, formado por una variable o por un conjunto de variables. El símbolo
que lo representa es: S = { s1, s2, … , sn}.
2. Decisión
Es una oportunidad para que las variables de estado cambien su valor; por lo tanto,
cambiemos de estado. Si nos encontramos en un estado actual (S) y queremos generar un
estado siguiente (Sn), debemos tomar una decisión en el estado actual.
El símbolo que lo representa es: D = {d1, d2, …, dk}.
Para un problema determinado, se puede dar:
 Que todos los estados tengan el mismo conjunto de decisión.
 Que cada estado tenga su conjunto de decisión.
3. Función de Transición
Es la función T(S,d) que define el nuevo estado, cuando en el estado actual S se toma una
decisión d.
Sn = T(S,d), donde Sn es el nuevo estado.
4. Restricciones
Toda generación de estados debe estar limitado por lo menos por una restricción.
Sn <= ValorSuperior
Sn >= ValorInferior
Cuando un estado actual S no puede generar un estado siguiente, este estado se convierte
en un estado de contorno.
5. Estado Inicial
Es el estado formado por los valores inicial de las variables de estado.
6. Función del Valor Óptimo
Es la regla que asigna al estado S el valor óptimo de la función objetivo del subproblema
asociado a él. Su símbolo es: F(s)
7. Función de Política Óptima
Es la regla que indica la mejor decisión inmediata para cada subproblema. Su símbolo es:
P(s).
8. Función de Retorno
Es la regla que asigna al estado S y a la decisión del valor óptimo de la función objetivo del
subproblema asociado a él cuando la decisión que se toma en el estado S es d. Su símbolo
es: R(s,d). Donde: R(s,d) = a(s,d) + f(sn), valor asociado más el valor óptimo del estado
generado.
9. Valor asociado o ecuación de retorno
Es el valor asociado que obtenemos cuando tomamos una decisión en el estado S. En una
red de estados, el valor del arco estaría representando al valor asociado, es decir cuánto me
cuesta si estoy en el estado S y deseo llegar al estado generado Sn.
10. Ecuación Recursiva
Es la ecuación que calcula el valor de la función de valor óptimo para cada estado S. Dicha
ecuación es recursiva porque para calcular f(s) se debe previamente calcular otros valores
de la f. La ecuación es: f(s) = max o min {R(s,d)}, para todo d que pertenezca al conjunto D.
11. Condiciones de Contorno
Son los valores óptimos de los estados de contorno que no requiere cálculo alguno. Los
valores son obvios por las condiciones del problema.
2. FUENTES DE REFERENCIA.
References
[1] Balagurusamy.E., Reliability Engineering, Tata Mc Graw-Hill Publishing Company Limited,

2010.
[2] Chang,T., System Reliability analysis with Dynamic Programming.
[3] Eddy, S.R ., What is dynamic programming ?, Nature Biotechnology, 22,909-910(2004).
[4] Fredrick S.Hillier., Gerald J., Lieberman., Introduction To Operation Research, Second
Edition, Mc Graw Hill publications
[5] HamdyA.Taha., Operations Research: An Introduction 8 th Edition, Pearson prentice hall,

Pearson Education,Inc
[6] Kasana H. S., Kumar K. D., Advance Operations Research, Asian Book Publisher ,2005.
[7] Prem Kumar Gupta., D.S. Hira., Operations Research 6th edition.
[8] Srinath L.S., Reliability Engineering fourth edition, Affiliated East- West Press Private
Limited
[9] Sujit K Bose ., Operations Research Methods Narosa Publishing House , New Delhi.
[10] Sharma.J.K.,Operations Research: theory and application, Macmillan Publishers.
[11] F.A. Tillman, C.V. Hwang & W. Kuo, Optimization of Systems Reliability, Cambridge
University Press, 2001.
3. SOLUCIÓN.
Para este caso

S1 =Etapa 3 Componentes
S2=Estado Presupuesto Disponible ( $)
Unidades en paralelo a colocar en el componente actual

Decisión d=
S1.
d = { 1,2,3}
Retorno r (Confiabilidad)
Las variables de estado inicial serian:

S1= 1 Componente
S2= 10 $
Funcion de Transicion:
Sn1= S1 + 1
Sn2= S2 - costo(S1,d)
Ecuacion Recursiva:
fn(Sn) = Max [Rn * fn-1(Sn-1)]
Sn1= S1 + 1
Sn2= S2 - costo(S1,d)
dn = Xn
Sn2 Sn2-1
n
rn
n =3
d3 = X3 d2 = X2 d1 = X1
S3=6 S2 S1 S0
3 2 1
f0(S0)=1
r3 r2 r1
Etapa = 1 [Componente 3]
d1 = X1
S1 S0
1
S0
f0*(S0) = 1
Rangos: Mínimo Máximo
r1 Estado 2 6
Decisión 1 3
S1 d1 [X1] f*1 X1
2 0.5 0.5 1
3 0.5 0.5 1
4 0.7 0.7 2
5 0.9 0.9 3
6 0.9 0.9 3
d2 = X2
S2 S1
2

r2 Estado 5 9
Decisión 1 3
d2 [X2]
S2 f*2 X2
1 2 3
5 0.35 --- --- 0.35 1
6 0.35 --- --- 0.35 1
7 0.49 0.4 --- 0.49 1
8 0.63 0.4 0.45 0.63 1
9 0.63 0.56 0.45 0.63 1
d3 = X3
S3 S2
3

r3 Estado 10 10
Decisión 1 3
d3 [X3]
S3 f*3 X3
1 2 3
10 0.378 0.504 0.441 0.504 2
4. REPORTE ADMINISTRATIVO.
– El máximo valor de Confiabilidad a obtener es 0.504 .

El cual podemos obtener de la siguiente manera.
– Al componente 1 se le colocan 2 unidades en paralelo
al Componente 2 se le coloca 1 unidad en paralelo
al Componente 3 se le colocan 3 unidades en paralelo
Y todo esto con un costo adicional de $ 2+3+5 = $10 dólares
5. CONCLUSION DE LA SOLUCIÓN.
La programación dinámica es una herramienta matemática

técnica que a menudo es útil para hacer una secuencia de
decisiones interrelacionadas. Hemos hecho uso de esta técnica
para asignar el recurso mínimo para un sistema y encontrar su
máxima Fiabilidad. Donde el costo adicional no excede el dinero total asignado
para este proposito.

Tarea Progamacion Dinamic

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea Progamacion Dinamic

Cargado por

Copyright:

Formatos disponibles

TÉCNICA DE PROGRAMACIÓN DINÁMICA APLICADA A UN MODELO DE

CONFIABILIDAD EN EL AREA MÉDICA.

1.- PROBLEMA DE APLICACIÓN.

En la medicina, la ingeniería farmacéutica y las consultas médicas, el aire comprimido debe

Unidades en cada componente

Se debe formular un modelo de Programacion Dinamica para determinar el numero de

En grandes problemas donde se pueda aplicar el principio de optimalidad, podemos

Para un problema dado, podemos aplicar PD, si:

 Cumple con el principio de optimalidad.

[1] Balagurusamy.E., Reliability Engineering, Tata Mc Graw-Hill Publishing Company Limited,

[2] Chang,T., System Reliability analysis with Dynamic Programming.

[3] Eddy, S.R ., What is dynamic programming ?, Nature Biotechnology, 22,909-910(2004).

[5] HamdyA.Taha., Operations Research: An Introduction 8 th Edition, Pearson prentice hall,

[10] Sharma.J.K.,Operations Research: theory and application, Macmillan Publishers.

Para este caso

Unidades en paralelo a colocar en el componente actual

Las variables de estado inicial serian:

Rangos: Mínimo Máximo

Rangos: Mínimo Máximo

– El máximo valor de Confiabilidad a obtener es 0.504 .

La programación dinámica es una herramienta matemática

También podría gustarte