Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Costo ($)
1 2 3
Componente 1 1 2 3
Componente 2 3 5 6
Componente 3 2 4 5
1.1.- METODOLOGIA
1. CONCEPTOS
1. ¿Qué es la Programación Dinámica (PD)?
Es una técnica de optimización.
Es el planeamiento de los cambios de las variables de estado a través del tiempo.
2. ¿Qué es un Estado?
Es una situación actual del problema que se está solucionando. Esta situación actual está
representada por un vector de estado.
3. ¿Qué es un vector de estado?
Es un conjunto de variables de estado, cuyos valores especifican la condición actual del
subproblema del sistema. La cantidad de variables de estado, dependerá de la
complejidad del problema. Para nuestro curso el máximo será 5 variables.
Las variables de estado cambian de valor cuando se toma una decisión.
4. ¿Qué es una variable de estado?
Es la representación de todo elemento o entidad del sistema que requiere ser evaluado
en el modelo dinámico; su valor es necesario saberlo para poder tomar una decisión.
5. ¿Qué es una decisión?
Es una oportunidad para cambiar el valor de algunas variables de estado. En un estado
determinado, podemos tomar un conjunto de decisiones.
2. HISTORIA DEL PD
Richard Bellman y sus colegas de la corporación RAND, son los creadores de esta
técnica.
Su trabajo fue publicado en 1957.
La tecnología de esos tiempos, no permitió que esta técnica alcance éxitos.
Hoy, gracias al avance tecnológico, software y hardware, la PD está permitiendo
resolver problemas grandes y complejos.
3. PRINCIPIO DE OPTIMALIDAD
”La mejor ruta desde cualquier estado Z al estado Final o cualquier otro estado, depende
solo del estado Z, estado en que está, y no depende de la ruta para llegar al estado Z”
4. APLICACIÓN DE LA PD
2. TERMINOLOGÍA
1. Estado
Es el vector de estado, formado por una variable o por un conjunto de variables. El símbolo
que lo representa es: S = { s1, s2, … , sn}.
2. Decisión
Es una oportunidad para que las variables de estado cambien su valor; por lo tanto,
cambiemos de estado. Si nos encontramos en un estado actual (S) y queremos generar un
estado siguiente (Sn), debemos tomar una decisión en el estado actual.
El símbolo que lo representa es: D = {d1, d2, …, dk}.
Para un problema determinado, se puede dar:
Que todos los estados tengan el mismo conjunto de decisión.
Que cada estado tenga su conjunto de decisión.
3. Función de Transición
Es la función T(S,d) que define el nuevo estado, cuando en el estado actual S se toma una
decisión d.
Sn = T(S,d), donde Sn es el nuevo estado.
4. Restricciones
Toda generación de estados debe estar limitado por lo menos por una restricción.
Sn <= ValorSuperior
Sn >= ValorInferior
Cuando un estado actual S no puede generar un estado siguiente, este estado se convierte
en un estado de contorno.
5. Estado Inicial
Es el estado formado por los valores inicial de las variables de estado.
6. Función del Valor Óptimo
Es la regla que asigna al estado S el valor óptimo de la función objetivo del subproblema
asociado a él. Su símbolo es: F(s)
7. Función de Política Óptima
Es la regla que indica la mejor decisión inmediata para cada subproblema. Su símbolo es:
P(s).
8. Función de Retorno
Es la regla que asigna al estado S y a la decisión del valor óptimo de la función objetivo del
subproblema asociado a él cuando la decisión que se toma en el estado S es d. Su símbolo
es: R(s,d). Donde: R(s,d) = a(s,d) + f(sn), valor asociado más el valor óptimo del estado
generado.
9. Valor asociado o ecuación de retorno
Es el valor asociado que obtenemos cuando tomamos una decisión en el estado S. En una
red de estados, el valor del arco estaría representando al valor asociado, es decir cuánto me
cuesta si estoy en el estado S y deseo llegar al estado generado Sn.
10. Ecuación Recursiva
Es la ecuación que calcula el valor de la función de valor óptimo para cada estado S. Dicha
ecuación es recursiva porque para calcular f(s) se debe previamente calcular otros valores
de la f. La ecuación es: f(s) = max o min {R(s,d)}, para todo d que pertenezca al conjunto D.
11. Condiciones de Contorno
Son los valores óptimos de los estados de contorno que no requiere cálculo alguno. Los
valores son obvios por las condiciones del problema.
2. FUENTES DE REFERENCIA.
References
[4] Fredrick S.Hillier., Gerald J., Lieberman., Introduction To Operation Research, Second
Edition, Mc Graw Hill publications
[6] Kasana H. S., Kumar K. D., Advance Operations Research, Asian Book Publisher ,2005.
[7] Prem Kumar Gupta., D.S. Hira., Operations Research 6th edition.
[8] Srinath L.S., Reliability Engineering fourth edition, Affiliated East- West Press Private
Limited
[9] Sujit K Bose ., Operations Research Methods Narosa Publishing House , New Delhi.
[11] F.A. Tillman, C.V. Hwang & W. Kuo, Optimization of Systems Reliability, Cambridge
University Press, 2001.
3. SOLUCIÓN.
dn = Xn
Sn2 Sn2-1
n
rn
n =3
d3 = X3 d2 = X2 d1 = X1
S3=6 S2 S1 S0
3 2 1
f0(S0)=1
r3 r2 r1
Etapa = 1 [Componente 3]
d1 = X1
S1 S0
1
S0
f0*(S0) = 1
Rangos: Mínimo Máximo
r1 Estado 2 6
Decisión 1 3
S1 d1 [X1] f*1 X1
2 0.5 0.5 1
3 0.5 0.5 1
4 0.7 0.7 2
5 0.9 0.9 3
6 0.9 0.9 3
Etapa = 2 [Componente 2]
d2 = X2
S2 S1
2
d2 [X2]
S2 f*2 X2
1 2 3
5 0.35 --- --- 0.35 1
6 0.35 --- --- 0.35 1
7 0.49 0.4 --- 0.49 1
8 0.63 0.4 0.45 0.63 1
9 0.63 0.56 0.45 0.63 1
Etapa = 3 [Componente 1]
d3 = X3
S3 S2
3
d3 [X3]
S3 f*3 X3
1 2 3
10 0.378 0.504 0.441 0.504 2
4. REPORTE ADMINISTRATIVO.
5. CONCLUSION DE LA SOLUCIÓN.