Trabajo de Io

Instituto Tecnológico
Superior de Lerdo
Temas: Inventarios, Líneas De Espera, Simulación, Teoría De Juegos, Cadenas

De Markov Y Programación Dinámica.
Carrera: Informática
Materia: Investigación de operaciones II
Catedrático:
4F4B I.S.C. E.D. M.E. Ricardo de Jesús Bustamante González
Alumnos del equipo:
Andrea Alejandra De La Cruz Ortiz (09231073)
Yulma Carolina Camacho Medrano (09231132)
Sheila Lizeth Contreras Torres (09231285)
Manuel de Jesús Campos Sánchez (09231148)
Jafet Rubén Carrillo Bustamante (09231286)
Juan David Alvarado Balderas (09231214)

Página 1
Índice
Contenido
Superior de Lerdo
S
1. INVENTARIOS.........................................................................................................................3
1.1. El costo total.....................................................................................................................3
1.2. FORMULARIO.................................................................................................................4
2. LÍNEAS DE ESPERA..............................................................................................................8
2.1. Modelos de una cola y un servidor................................................................................8
Nomenclatura de las fórmulas:.......................................................................................9
3. SIMULACIÓN........................................................................................................................17
4. TEORÍA DE JUEGOS...........................................................................................................18
4.1. ¿Qué es un juego?........................................................................................................18
4.1.1. Estrategias...............................................................................................................18
4.1.2. Juegos de suma cero para dos personas: estrategias aleatorias,
dominación y solución gráfica......................................................................................18
4.1.3.........................................................Estrategias aleatorias o combinados
20
4.1.4. Solución grafica de pares y nones...........................................................20
5. CADENA DE MARKOV........................................................................................................22
5.1.1. Problema de la cadena de Markov:..................................................................22
6. PROGRAMACIÓN DINÁMICA............................................................................................25
6.1. Problema de la diligencia:............................................................................................25
7. PROGRAMACIÓN DINÁMICA DETERMINÍSTICA.........................................................28
Página 2
Superior de Lerdo
1. INVENTARIOS
En este modelo se representan iguales el inventario máximo y la cantidad pedido.
Cabe mencionar que este no siempre es verdadero.
1.1. El costo total

Para un periodo en este modelo está conformado por tres componentes de costo:
 Costo unitario del producto (C1)

 Costo de ordenar una compra (C2)
 Costo de mantener un producto en almacén (C 3)
Página 3
Superior de Lerdo
1.2. FORMULARIO
Este formulario es de gran utilidad a la hora de tratar con problemas empleados en
la teoría de inventarios.
EOQ = Cantidad optima de periodo:
Q= √
2 DC 2
C3
Costo total por año:
TC( q)=(C 1)(D)+(C 2) D/Q+( C 3)Q/2

Ó
C2D C 3q
TC ( q )= +( C 1 ) ( D ) +
q 2
El número de periodos por año:
N=D /Q
Tiempo en pedidos (tiempo ÷ periodos)
T =Q/ D
Inventario promedio:
Q/ 2
Costo de retención anual si la cantidad de pedidos es:
C3q
HC ( q ) =
2
Página 4
Costo de pérdida anual si la cantidad de pedido es:
C2 D
OC ( q ) =
q
Superior de Lerdo
S
EOQ cuando costo de retención se expresa en términos del valor del
q∗¿ √
2 DC 2
inventario en dólares:
C1C3
Punto de reposición = LD
Ejemplo 1: Inventario
La empresa servimedica vende agujas hipodérmicas a hospitales y desea reunir
el costo de su inventario determinado el costo óptimo de agujas hipodérmicas de
cada pedido. La demanda anual es de 1000 unidades, el costo de preparación por
pedido es de $10 .00 y el costo de almacenamiento por unidad por año es de
$0.50 cada aguja tiene un precio de $3.00.
Cantidad óptima:
Primero se reemplazan los datos en la primera fórmula, ésta es
utilizada para calcular la cantidad óptima de pedido:
Q=
√ ( 2 DC 2 )
(c 3) Q=
√ 2(1000)(10)
.50
Después se efectúan cada una de las operaciones indicadas iniciando por las
operaciones dentro del paréntesis, después la división y por último la raíz
cuadrada:
Q=
√ 2000
.50
Q=200
Página 5
Ahora se reemplazaran los datos para calcular el costo total por año:
2∗D 3∗Q
CT= (C 1∗D ) + C ( Q )
+(C
2
)
CT= (3∗1000 ) + ( 10∗1000

200 ) +(
.50∗200
2
)
Superior de Lerdo
CT = (3000 )+ ( 10∗5 )+(.50∗100)
CT= (3000 )+ ( 50 ) +(50) CT=3100
Número de pedidos por año:
A continuación calcularemos el número de pedidos por año, de igual modo

remplazamos los datos en la fórmula, y se efectúa la operación.
D 1000 N=5
N= N=
Q 200
Tiempo entre pedidos:

Por último reemplazamos los valores en la siguiente fórmula, y se realiza la
operación.
Q 200 t=0.2
t= t=
D 1000
Ejemplo 2: Inventario
Una empresa vende un artículo que tiene una demanda de 18,000 unidades por
año, su costo de almacenamiento por unidad es de $1.20 y el costo de ordenar
una compra es de $400.00. El costo total unitario del artículo es de $1.00 no se
permite faltante de unidades y su tasa de reemplazo es instantáneo.
Cantidad óptima:
Página 6
Al igual que el problema anterior se reemplazan los datos en la

primera fórmula y calcularemos la cantidad óptima de pedido:
Q=
√ (2 D C 2)
(iC 1)
Q=
√ 2(18,000)( 400)
(1.20∗1)
Después se efectúan cada una de las operaciones indicadas.
Q=
√ 14400000
1.20
Superior de Lerdo
Q=3,465 unidades
2∗D 3∗Q
CT= (C 1∗D ) + C ( Q )+(C
2
)
Ahora se reemplazaran los datos para calcular el costo total por año:
CT= (1.00∗18,000 ) + ( 400∗18,000

3,465 ) +(
1.20∗3,465
2
)
Y se efectúan cada una de las operaciones indicadas, en orden jerárquico.
CT = (18,000 )+ ( 2077.92 )+(2079)
CT=22,156.92∗año
Número de pedidos por año:
A continuación calcularemos el número de pedidos por año, se sustituyen los

valores en la fórmula, y se realiza la operación.
D 18,000
N= N=
Q 3,465 N=5.19
Tiempo entre pedidos:

Para concluir; se calcula el tiempo entre pedidos, de igual modo se sustituyen los
Página 7
vales en la fórmula, y se realiza la operación correspondiente.
Q 3,465 t=0.1925 años

t= t=
D 18,000
Superior de Lerdo
2. LÍNEAS DE ESPERA
 Una cola es una línea de espera.
 La teoría de colas es un conjunto de modelos matemáticos que describen

sistemas de líneas de espera particulares.
 El objetivo es encontrar el estado estable del sistema y determinar una

capacidad de servicio apropiada.
2.1. Modelos de una cola y un servidor

 M/M/1
 M/G/1
 M/D/1
 M/Ek/1
Página 8
Superior de Lerdo
M/M/1: Un servidor con llegadas de Poisson y tiempos de servicio

exponenciales.
Fórmula M/M/1
λ2
λ Lq =
Ls = μ ( μ−λ )
λ−µ
λ
W q=
1 μ ( μ− λ )
Ws=
µ− λ
n P=( L S >n ) Pn+1

Pn=( 1−P ) P
P ( W S >t ) ¿ e−µ( 1− p) t P ( W q >t ) pe−µ (1− p) t
t ≥ 0, p< 1
Nomenclatura de las fórmulas:

 λ: Tasa media de llegadas o probabilidad de llegadas.
 µ: Es el número de clientes que puedo atender en un tiempo (n).
 p: Tasa media de llegadas/ número de clientes que puedo atender en un
tiempo (n).
 Ls: Número esperado de clientes en el sistema.
 Lq: Número esperado de clientes en la cola.
Página 9
 Ws: Tiempo esperado de espera en el sistema.

 Wq: Tiempo esperado de espera en la cola.
 Pn: Probabilidad de tener “X” cantidad de clientes en el sistema.
 Pn+1: Probabilidad de tener una cola de “x”.
 P (Ws > t): Probabilidad de esperar más de “x” tiempo en el sistema.
 P (Wq > t9: Probabilidad de esperar más de “x” tiempo en la cola.
Superior de Lerdo
S
Ejemplo1. M/M/1
Un lavacar puede atender un auto cada 5 minutos y la tasa media de llegadas es
de 9 autos por hora. Obtenga las medidas de desempeño de acuerdo con el
modelo M/M/1. Además la probabilidad de tener 0 clientes en el sistema, la
probabilidad de tener una cola de más de 3 clientes y la probabilidad de esperar
más de 30min. En la cola y en el sistema.
9
λ=9, µ=12, P= =0.75
Solución: 12
λ λ2
Ls = =3 clientes Lq = =2.25 clientes
λ−µ μ ( μ−λ )
1
W s= =0.33 hrs .=20 min . λ
µ− λ W q= =0.25 hrs .=15 min .
μ ( μ− λ )
0
P0=( 1−P ) P =0.25
P=( L S >3 ) P3+1=0.32
−µ ( 1− p ) t
P ( W S >30 /60 ) ¿ e =0.22 P ( W q >30 /60 ) Pe
−µ ( 1−p ) t
=0.17
Ejemplo 2. M/M/1
A un supermercado llegan en promedio 80 clientes por hora que son atendidos
entre sus 5 cajas. Cada caja puede atender en promedio a un cliente cada 3
minutos. Obtenga las medidas de desempeño de acuerdo con el modelo M/M/1.
Además la probabilidad de tener 2 clientes en el sistema, la probabilidad de tener
una cola de más de 4 clientes y la probabilidad de esperar más de 10 min. En la
cola.
80 1 1.33
λ= =1.33 μ= =1.66 P= =0.801
60 3 1.66
Página 10
1
ws= − λ
μ
1
ws= −1.33=−0.72
1.66
λ 1.33
Ls= −μ= −1.66=−4.03 clientes
λ 1.33
M/G/1: Un servidor con tiempos entre llegadas exponenciales y una distribución
generalλ 2 de tiempos
(1.33)2 1.7689
de servicio.
Lq= = = =0.665
μ ( μ− λ ) 1.66 ( 1.66−1.33 ) 1.66(−1)
Superior de Lerdo
Fórmula M/G/1
2
Ls=Lq + P 2 σ 2+¿ P
λ
2 ( 1−P )
Lq=¿
1 L
W s =W q + W q= q
µ λ
P0=1−P PW =P
P<1

 (m): El tiempo esperado de servicio depende de la tasa media de servicio.
 (l): El número esperado de llegadas por unidad de tiempo se llama tasa

media de llegadas.
 (s=0): Tiempos de servicio constantes.
 1/m: El tiempo esperado de servicio.
 (P0): Probabilidad de error.

Página 11
 Probabilidad de tiempo de espera (PW).
Ejemplo1. M/G/1
Superior de Lerdo
S
Un lavacar puede atender un auto cada 5 min. y la tasa media de llegadas es de 9
autos/hora, s = 2 min. Obtenga las medidas de desempeño de acuerdo con el
modelo M/G/1. Además la probabilidad de tener 0 clientes en el sistema y la
probabilidad de que un cliente tenga que esperar por el servicio.
2
Solución: 2 σ 2+¿ P
λ =1.31 clientes
Ls=Lq + P=1.31+.75=2.06 clientes 2 ( 1−P )
Lq =¿
1
W s =W q + =0.228 hrs .=13.7 min . Lq
µ W q= =0.145hrs . 8.7 min .
λ
P0=1−P=0.25 PW =P=0.75 P<1
Ejemplo1. M/G/1
minutos. Suponga s = 5 min. Obtenga las medidas de desempeño de acuerdo con
el modelo M/G/1. Además la probabilidad de tener 0 clientes en el sistema y la
probabilidad de que un cliente tenga que esperar por el servicio.
λ=1.33 μ=.05 P=26.6 σ =5

Ls=Lq+ p
Ls=9.94+ 4.03=13.97
P2
Lq= λ 2 σ 2+
2 ( 1−P )
16.24
Lq= (1.76 )( 25 )+
Página 12
−6.06
Lq=9.94
1
ws=wq+
μ
1
ws=7.47+ =10.50
.33
Superior de Lerdo
S
M/D/1: Un servidor con tiempos entre llegadas exponenciales y una distribución
degenerada de tiempos de servicio.
Fórmula M/D/1
P2
Ls= λW s Lq =
2 ( 1−P )
1 Lq
W s =W q + W q=
µ λ
P<1


media de llegadas.

Página 13

Superior de Lerdo
Ejemplo1. M/D/1
Un lavacar puede atender un auto cada 5 min. La tasa media de llegadas es de 9
autos/hora. Obtenga las medidas de desempeño de acuerdo con el modelo M/D/1.
P2
Ls= λW s=1.875 clientes Lq = =1.125 clientes
2 ( 1−P )
1
W s =W q + =0.21hrs .=12.5 min . Lq
µ W q= =0.125hrs .=7.5 min .
λ
Ejemplo1. M/D/1
minutos. Obtenga las medidas de desempeño de acuerdo con el modelo M/D/1.
Ls= λW s λ=1.33 µ=0.33 P=4.03
(1.33)(5.04)=6.70
Ls=6.70
P2 (k +1)
Lq = =( 4.03 ) 2=8.06
2 k ( 1−P )
Página 14
2(1−4.03)
¿ 16.2409
−6.06
¿−2.688(−1)=2.68
1
W s =W q + =2.01+ 1=.33=5.04
µ
Superior de Lerdo
Lq 2.68
W q= = =2.01
M/Ekλ/1:1.33
Un servidor con tiempos entre llegadas exponenciales y una distribución
Erlang de tiempos de servicio.
Fórmula M/Ek/1
k +1
Ls= λW s ¿
P2 ¿
Lq=¿
Lq
1 W q=
W s =W q + λ
µ
P<1


media de llegadas.

Página 15

Superior de Lerdo
Ejemplo1. M/Ek/1
Un lavacar puede atender un auto cada 5 min. La tasa media de llegadas es de 9
autos/hora. Suponga s = 3.5 min (aprox.) Obtenga las medidas de desempeño de
acuerdo con el modelo M/Ek/1
k +1
Ls= λW s=2.437 clientes ¿
P2 ¿
Lq=¿
1 Lq
W s =W q + =0.2708 hrs .=16.25min . W q= =0.1875hrs .=11.25 min
µ λ
Ejemplo1. M/Ek/1
minutos. Suponga que k= 4. Obtenga las medidas de desempeño de acuerdo con
el modelo M/Ek/1 µ=0.33 τ =1.33
Ls= λW s
LS=1.33(5.54)
LS=7.36
Página 16
1
W s =W q + =¿ 2.51 + 1 / 0.33 = 2.51 + 3.03 = 5.54
µ
k +1
¿
P2 ¿
Lq=¿
Lq= 4.032 (4+1) = 16.24 (5) = 81.2 = -3.34 (-1) = 3.34
2(4) (1-4.03) 8(-3.03) -24.24

Superior de Lerdo
Lq 3.34
W q= = =2.51
λ 1.33
3. SIMULACIÓN
La simulación es indispensable para la descripción y análisis de una amplia
variedad de problemas reales. Proporciona considerables beneficios según el
contexto en los que se use:
• Ahorro de tiempo.
• Ahorro de recursos económicos.
• Permite analizar la ocurrencia de ciertos fenómenos a través de la

reconstrucción de escenas y un minúsculo análisis, que no podría llevarse a
cabo en una situación real.
Página 17
Superior de Lerdo
4. TEORÍA DE JUEGOS
4.1. ¿Qué es un juego?
Un juego es una situación competitiva entre N personas o grupos, denominados
jugadores, que se realiza bajo un conjunto de reglas previamente establecidas,
con consecuencias conocidas. Las reglas definen las actividades elementales, o
movimientos del juego. Pueden permitirse diferentes movimientos para los
distintos jugadores, pero, cada jugador conoce los movimientos de que dispone
los otros jugadores.
Si un jugador gana lo que otro jugador pierde , el juego se le denomina juego de

suma 0. Un juego de dos personas es un juego que tiene solo dos jugadores.
4.1.1. Estrategias
Una estrategia pura es un plan previamente determinado que establece la
secuencia de movimientos y contramovimientos que un jugador realizará durante
un juego completo.
4.1.2. Juegos de suma cero para dos

personas: estrategias aleatorias,
dominación y solución gráfica.
En este tipo de juegos, lo que uno gana es igual a lo que otro pierde, entonces al
sumar la ganancia y la pérdida de uno y otro, el resultado obtenido es
Página 18
exactamente cero.
Se analiza cómo determinar el valor y la estrategia óptima para un juego de suma

cero para dos personas que no tiene un punto silla. Se inicia con el juego sencillo
de pares y nones.
Superior de Lerdo
Ejercicio 1
Dos jugadores (que se llaman Non y Par) escogen de manera simultánea el

número de dedos (1 o 2) que deben mostrar. Si la suma de los dedos que
muestran los jugadores en non, entonces, Non gana 1 dólar a Par. Si la suma de
los dedos es par, entonces Par gana 1 dólar a Non. Consideramos que el jugador
de los renglones es Non y que el jugador de las columnas es Par. Determine si
este juego tiene un punto silla.
Solución:
Este juego de suma cero cuya matriz de recompensas es la que se muestra en la

siguiente tabla. Puesto que Max (mínimo del renglón= =-1 y min (máximo de las
columnas)= +1, no se cumple la ecuación (1), y este juego no tiene punto silla.
Bueno todo lo que sabemos es que Non puede estar seguro de una recompensa
de por lo menos -1, y Par puede mantener a Non es una recompensa de cuando
mucho +1. Por lo tanto no es evidente como determinar el valor del juego y las
estrategias óptimas
Jugador de Jugador de las columnas (Par)
Los renglones
Página 19
(Non) 1 dedo 2 dedos mínimo de los renglones
1 dedo -1 +2 -1
2 dedos +1 -1 -1
Superior de Lerdo
S
Máximo de columnas +1 +1
4.1.3. Estrategias aleatorias o combinados
Debemos ampliar el conjunto de estrategias admisibles para cada jugador con el

fin de incluir las estrategias aleatorias. Hemos supuesto que hasta ahora que cada
vez que un jugador juega, aplica la misma estrategia. ¿Por qué no dejar que cada
jugador escoja una probabilidad de aplicar cada estrategia? Por ejemplo:
X1= probabilidad de que Non levante un dedo.
X2= probabilidad de que Non levante dos dedos.
y1= probabilidad de que Par levante un dedo.
y2= probabilidad de que Par levante dos dedos.
Por lo que se entendió si x1≥0, x2≥0 y x1+x2 = 1, entonces (x1, x2) es una
estrategia combinada o aleatoria a Non. Por ejemplo, Non puede seguir la
estrategia (1/2,1/2) si lanza una moneda antes de cada jugada del juego y levanta
un dedo si sale cara o dos dedos si sale cruz; de igual manera para Par.
4.1.4. Solución grafica de pares y nones

Con este es posible determinar la estrategia óptima de Non.
Como x1 + x2 = 1, sabemos que x2 = 1 – x1. Por lo tanto, cualquier
estrategia combinada puede ser (x1, 1 - x1) y solo basta determinar el valor
Página 20
de x. Supóngase que Non selecciona una estrategia combinada [x1, (1 –

x1)]. ¿Cuál es la recompensa esperada de Non comparada con cada una
de las estrategias de Par? Si Par levanta un dedo, entonces Non recibirá
una recompensa de -1 con probabilidad x1 y una recompensa de +1 con
probabilidad de x2 = 1 – x1. Por lo tanto, si Par levanta un dedo y Non elige
la estrategia combinada (x1, 1 – x1), entonces la recompensa esperada de
Non es:
Superior de Lerdo
(-1) x1 + (+1) (1 - x1) = 1 – 2x1

Como función de x1 esta recompensa esperada se traza como un
segmento de recta AC en que de igual manera, si Par muestra dos dedos y
Non elige la estrategia combinada (x1, 1 – x1), la recompensa esperada de
Non es:
(+1) x1 + (-1) (1 - x1) = 2x1 – 1
¿Qué es el segmento de la recta DE?
E (1,1)
A
B X1
D C (1,-1)
AC= recompensa de Non x1 si par escoge 1.
DE= recompensa de Non x1 si par escoge.
¿Cómo hacer que una estrategia no óptima recompense?
Estrategia de Non Par puede escoger Recompensa esperada

Página 21
X1< ½ 2 dedos <0 (sobre BD)
X1 > ½ 1 dedo <0 (sobre BC)
Y1< ½ 1 dedo >0 (sobre AB)
Y2> ½ 2 dedos > 0 (sobre BE)

Superior de Lerdo
S
5. CADENA DE MARKOV
Es una serie de eventos, en la cual la probabilidad de que ocurra un evento
depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen
memoria. “Recuerdan” el último evento y esto condiciona las posibilidades de los
eventos futuros. Esta dependencia del evento anterior distingue a las cadenas de
Markov de las series de eventos independientes, como tirar una moneda al aire o
un dado.
Una cadena de Markov es una secuencia X1, X2, X3,… de variables aleatorias. El
rango de estas variables, es llamado espacio estado, el valor de Xn es el estado
del proceso en el tiempo n. Si la distribución de probabilidad condicional de Xn+1
en estados pasados es una función de Xn por sí sola, entonces:
Donde xi es el estado del proceso en el instante i. La identidad mostrada es la

Propiedad de Markov.
5.1.1. Problema de la cadena de Markov:
Si hoy está nublado, para que pasado mañana esté nublado, podríamos tener un
día de mañana soleado o nublado. Así tenemos las siguientes secuencias en
orden de (hoy, mañana y pasado mañana):
(Nublado, soleado, nublado) o (nublado, nublado, nublado) donde pasado mañana

es nublado.
Estas secuencias son mutuamente excluyentes, corresponden a caminos distintos

en el árbol, así tenemos que:
= P (pasado mañana nublado | hoy nublado)
= P ((nublado, soleado, nublado) o (nublado, nublado, nublado))

Página 22
=P (nublado,soleado,nublado)+P(nublado, nublado, nublado)=(.6 ´.3)+(.4´.4) =.34
Este resultado se obtuvo multiplicando las probabilidades condicionales a lo largo

de los caminos desde hoy nublado hasta pasado mañana nublado.
No es necesario que seamos tan específicos en términos de hoy, mañana o

pasado mañana, podemos darnos cuenta que lo realmente importante es el
número de días que pasa entre una predicción y otra.
Superior de Lerdo
Tiempo de hoy Mañana Pasado mañana
Nublado
Soleado
Nublado
Nublado
Nublado
EJERCICIO #1
El ascensor de un edificio con bajo y 2 pisos más realiza viajes de uno a otro piso.
El piso en el que finaliza el viaje enésimo del ascensor, sigue una cadena de
markov.
Se sabe que la mitad de los viajes que parten del bajo se dirigen a los otros 2
pisos, mientras que si un viaje comienza en el primer piso, sólo el 25% de las
veces finaliza en el segundo.
Por último, si un trayecto comienza en el segundo piso, siempre finaliza en el bajo

calcula la raíz de probabilidades de transición según la cadena de markov.
Página 23
*** 0 1 2
0 0 50 50
1 75 0 25
2 100 0 0
Pa 0
1
2
Superior de Lerdo
0 0%
Pb 1 50%
2 50%
B
75%
0 75%
1 1
50% 0%
Pm 1 0% 25% 2
Pb
50% 100% B
2 25% 2
100%
0
Pm
Pa 1 0%
Pb
2 0%
Pa
Página 24
Superior de Lerdo
6. PROGRAMACIÓN DINÁMICA
Es un enfoque general para la solución de problemas en los que es necesario
tomar decisiones en etapas sucesivas. Las decisiones tomadas en una etapa
condicionan la evolución futura del sistema, afectando a las situaciones en las que
el sistema se encontrará en el futuro (denominadas estados), y a las decisiones
que se plantearán en el futuro.
La programación dinámica no tiene formulación matemática estándar. Se trata de

un enfoque de tipo general para la solución de problemas, y las ecuaciones se
derivan de las condiciones individuales de los mismos.
 El procedimiento general de resolución de estas situaciones se divide en el

análisis recursivo de cada una de las etapas del problema, en orden
inverso, es decir comenzando por la última y pasando en cada iteración a la
etapa antecesora. El análisis de la primera etapa finaliza con la obtención
del óptimo del problema.
6.1. Problema de la diligencia:

Es una manera de reconocer una situación que se puede formular como un
problema de programación dinámica. Es encontrar la ruta que minimiza el costo
total de un nodo específico.
6.1.1. Terminología y notación básica

Períodos o etapas: Sea N= {1, 2,....., n} un conjunto finito de elementos.
Mediante el índice, representamos cada uno de ellos. N es el conjunto de períodos
o etapas del proceso.
Espacio de estados: { } es una familia de conjuntos, uno para cada período n. S se

Página 25
denomina espacio de estados en el período n. Cada uno de sus elementos, que se

representa mediante Sn, es un estado, que describe una posible situación del
proceso en ese período.
 Sea s: El estado de inicio; j: estado destino.
 n: La fase, normalmente representa el número de arcos hasta el destino.
 C(s, j): Costo o distancia de ir desde s hasta j.

Superior de Lerdo
S
 f(n, s): La política de costo mínimo cuando se encuentra en el estado s de
la etapa n.
Ejemplo1. Programación dinámica

Un cazafortunas desea ir de Missouri a California en una diligencia, y quiere viajar
de la forma más segura posible. Tiene los puntos de salida y destino conocidos,
pero tiene múltiples opciones para viajar a través del territorio.
Se entera de la posibilidad de adquirir un seguro de vida como pasajero de la

diligencia.
El costo de la póliza estándar (cij) se muestra en la tabla siguiente:
El objetivo es hallar f 1∗( A) y su ruta correspondiente. Cuando el cazafortunas

tiene sólo una etapa por recorrer (n=4) su ruta de ahí en adelante, estará
determinada por el estado actual (H o I) y su destino final X4 = J.
Luegof 4∗( S )=C sj + f 5∗( J )=c sj

Página 26
f 4∗( H )=c sj =3
f 4∗( H )=c sj =4
Etapa n=3
El cazafortunas tiene 2 etapas por recorrer (n=3). Suponga que sale de E.

C E, H =1
H +f 4∗( H )=f 3 ( E )=C E , H + f 4∗( H )=4
E
C E, I =4 I
Superior de Lerdo
+f 4∗( I )=f 3 ( E )=C E , I + f 4∗( I )=8

Página 27
Superior de Lerdo
S
Etapa n=2
En la segunda etapa, el cazafortunas tiene 3 jornadas por recorrer (n=2). Suponga

que sale de C.
C, C E =3 E +f 3∗( E ) =f 2 ( C ) =CC , E + f 3∗( E )=7
C, C F =2 +f 3∗( F )=f 2 ( C )=C C ,F +f 3∗( F )=9

C
F
C, C G =4
G +f 3∗( G )=f 2 (C )=C C ,G + f 3∗( G )=10
Etapa n=1
En la primera etapa, el cazafortunas tiene todas las jornadas por recorrer (n=1).
Necesariamente debe salir de A.
C A, B =2 B +f 2∗( B )=f 1 ( A )=C A , B +f 2∗( B )=13
C A, C =4 +f 2∗( C )=f 1 ( A ) =C A ,C + f 2∗( C )=11

A C
C A, D =3
D +f 2∗( D )=f 1 ( A )=C A , D + f 2∗( D )=11
Características de la P.D
1. El problema se puede dividir

por etapas, que requieren una
política de decisión en cada una
Página 28
de ellas.
2. Cada etapa tiene un cierto

número de estados asociados a
su inicio. (Estados son las
diferentes condiciones posibles
en las que se puede encontrar el
sistema en cada etapa del
problema).
Superior de Lerdo
S
7. PROGRAMACIÓN DINÁMICA DETERMINÍSTICA
Una ruta crítica es la secuencia de los elementos terminales de la red de
proyectos con la mayor duración entre ellos, determinando el tiempo más corto en
el que es posible completar el proyecto.
La duración de la ruta crítica determina la duración del proyecto entero. Cualquier

retraso en un elemento de la ruta crítica afecta a la fecha de término planeada del
proyecto, y se dice que no hay holgura en la ruta crítica.
Un proyecto puede tener varias rutas críticas paralelas. El método de la ruta crítica
usa ciertos tiempos (reales o determinísticos).
El método de la ruta crítica se basa en 2 procedimientos que recorren la red de las

actividades de un proyecto: La pasada hacia atrás y la pasada hacia adelante,
cada actividad de la red se representa con el diagrama siguiente:
 Inicio más cercano IC: Es el tiempo más cercano en el que puede empezar
una actividad, suponiendo que todas las actividades precedentes han
concluido.
 Tiempo más cercano TC: El tiempo más cercano en que una actividad
Página 29
puede terminar.
 Inicio más lejano IL: Tiempo más lejano en que una actividad puede
comenzar sin retrasar el tiempo de terminación del todo el proyecto.
 Tiempo más lejano TL: El tiempo más lejano en que una actividad puede
terminar sin retrasar el tiempo de terminación de todo el proyecto.
Superior de Lerdo
S
Ejemplo1. Programación dinámica determinística.
Página 30
Superior de Lerdo
Personas que no trabajaron:
José de Jesús Castillo Molina

Página 31

Trabajo de Io

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Trabajo de Io

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnológico

Temas: Inventarios, Líneas De Espera, Simulación, Teoría De Juegos, Cadenas

Materia: Investigación de operaciones II

Alumnos del equipo:

Andrea Alejandra De La Cruz Ortiz (09231073)

Yulma Carolina Camacho Medrano (09231132)

Sheila Lizeth Contreras Torres (09231285)

Manuel de Jesús Campos Sánchez (09231148)

Jafet Rubén Carrillo Bustamante (09231286)

Juan David Alvarado Balderas (09231214)

Cabe mencionar que este no siempre es verdadero.

1.1. El costo total

 Costo unitario del producto (C1)

EOQ = Cantidad optima de periodo:

Costo total por año:

TC( q)=(C 1)(D)+(C 2) D/Q+( C 3)Q/2

El número de periodos por año:

Tiempo en pedidos (tiempo ÷ periodos)

Costo de retención anual si la cantidad de pedidos es:

Costo de pérdida anual si la cantidad de pedido es:

Costo total por año:

CT= (3∗1000 ) + ( 10∗1000

CT = (3000 )+ ( 10∗5 )+(.50∗100)

CT= (3000 )+ ( 50 ) +(50) CT=3100

Número de pedidos por año:

A continuación calcularemos el número de pedidos por año, de igual modo

Tiempo entre pedidos:

Al igual que el problema anterior se reemplazan los datos en la

Después se efectúan cada una de las operaciones indicadas.

Costo total por año:

CT= (1.00∗18,000 ) + ( 400∗18,000

Y se efectúan cada una de las operaciones indicadas, en orden jerárquico.

CT = (18,000 )+ ( 2077.92 )+(2079)

Número de pedidos por año:

A continuación calcularemos el número de pedidos por año, se sustituyen los

Tiempo entre pedidos:

vales en la fórmula, y se realiza la operación correspondiente.

Q 3,465 t=0.1925 años

 La teoría de colas es un conjunto de modelos matemáticos que describen

 El objetivo es encontrar el estado estable del sistema y determinar una

2.1. Modelos de una cola y un servidor

M/M/1: Un servidor con llegadas de Poisson y tiempos de servicio

n P=( L S >n ) Pn+1

P ( W S >t ) ¿ e−µ( 1− p) t P ( W q >t ) pe−µ (1− p) t

Nomenclatura de las fórmulas:

 Ws: Tiempo esperado de espera en el sistema.

Nomenclatura de las fórmulas:

 (l): El número esperado de llegadas por unidad de tiempo se llama tasa

 Lq: Número esperado de clientes en la cola.

 Ls: Número esperado de clientes en el sistema.

 Wq: Tiempo esperado de espera en la cola.

 Ws: Tiempo esperado de espera en el sistema.

 (s=0): Tiempos de servicio constantes.

 1/m: El tiempo esperado de servicio.

 (P0): Probabilidad de error.

 Probabilidad de tiempo de espera (PW).

P0=1−P=0.25 PW =P=0.75 P<1

λ=1.33 μ=.05 P=26.6 σ =5

Nomenclatura de las fórmulas:

 (l): El número esperado de llegadas por unidad de tiempo se llama tasa

 Ls: Número esperado de clientes en el sistema.

 Lq: Número esperado de clientes en la cola.

 Ws: Tiempo esperado de espera en el sistema.