Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ii
CONTENIDO
1 PRELIMINARES
1.1 TOMA DE DECISIONES . . . . . . . . . . . . . . . . . . . . . .
1.2 PROGRAMACIN DINMICA . . . . . . . . . . . . . . . . . .
1.2.1 INTRODUCCIN . . . . . . . . . . . . . . . . . . . . . .
1.2.2 ELEMENTOS DE UN MODELO DE PD . . . . . . . . .
1.2.3 CARACTERSTICAS DE LOS PROBLEMAS DE PROGRAMACIN DINMICA . . . . . . . . . . . . . . . . .
1.2.4 LA PROGRAMACIN DINMICA TIPO DETERMINSTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 LA PROGRAMACIN DINMICA PROBABILSTICA
1.3 PROCESOS ESTOCSTICOS . . . . . . . . . . . . . . . . . . .
1.3.1 INTRODUCCIN . . . . . . . . . . . . . . . . . . . . . .
1.3.2 LA PROPIEDAD DE MARKOV Y MATRICES DE TRANSICIN . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.3 ECUACIONES DE CHAPMAN-KOLMOGOROV . . . .
1.3.4 CLASIFICACIN DE ESTADOS EN UNA CADENA
DE MARKOV . . . . . . . . . . . . . . . . . . . . . . . .
1.3.5 TIEMPOS DE PRIMERA PASADA . . . . . . . . . . . .
1.3.6 PROPIEDADES A LARGO PLAZO DE LAS CADENAS
DE MARKOV . . . . . . . . . . . . . . . . . . . . . . . .
1
1
8
8
9
9
11
12
14
14
18
19
21
24
25
2 TEORA DE INVENTARIOS
29
2.1 COMPONENTES DE LOS MODELOS DE INVENTARIOS . . 29
2.2 MODELOS DETERMINSTICOS . . . . . . . . . . . . . . . . . 31
2.2.1 REVISIN CONTINUA, DEMANDA UNIFORME Y NO
SE PERMITEN FALTANTES . . . . . . . . . . . . . . . 31
2.2.2 REVISIN CONTINUA, DEMANDA UNIFORME Y SE
PERMITEN FALTANTES . . . . . . . . . . . . . . . . . 32
2.3 MODELOS ESTOCSTICOS . . . . . . . . . . . . . . . . . . . 34
2.3.1 MODELO DE UN PERIODO SIN COSTO FIJO . . . . 34
2.3.2 MODELO CON UN INVENTARIO INICIAL . . . . . . . 36
2.3.3 DERIVACIN DE LA POLTICA PTIMA . . . . . . . 36
2.3.4 MODELO DE INVENTARIOS DE UN PERIODO CON
COSTO DE PREPARACIN . . . . . . . . . . . . . . . . 38
iii
iv
CONTENIDO
2.3.5
2.4
40
43
43
43
44
3 APLICACIN
51
3.1 INTRODUCCIN . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 SOLUCIN DE UN PROBLEMA DE INVENTARIOS . . . . . 51
3.3 CONCLUSIONES . . . . . . . . . . . . . . . . . . . . . . . . . . 57
CAPTULO 1
PRELIMINARES
1.1
TOMA DE DECISIONES
CAPTULO 1. PRELIMINARES
CAPTULO 1. PRELIMINARES
reconocer que estas soluciones son ptimas slo respecto al modelo que se est
utilizando. Como el modelo es una idealizacin y no una representacin exacta
del problema real, no puede existir una garanta utpica de que la solucin ptima del modelo resulte ser la mejor solucin posible que pueda llevarse a la
prctica para el problema real. Esto es de esperarse si se toman en cuenta los
muchos imponderables e incertidumbres asociados a casi todos los problemas
reales, pero si el modelo est bien formulado y verificado, la solucin que resulta
debe tender a una buena aproximacin de un curso de accin ideal para el problema real. Por todo esto, ms que enfrascarse en pedir lo imposible, la prueba
del xito de un estudio de investigacin de operaciones debe ser el hecho de si
proporciona o no una mejor gua en las decisiones que la que se puede obtener
por otros medios.
El eminente cientfico de la administracin y premio Nobel de Economa,
Herbert Simon(ver [5]), introdujo el concepto de que en la prctica es mucho
ms frecuente satisfizar que optimizar. Al inventar el trmino satisfizar como
una combinacin de satisfacer y optimizar, Simon describe la tendencia de los
administradores a buscar una solucin que sea lo suf icientemente buena para
el problema que se tiene. En lugar de intentar desarrollar una medida global
de eficiencia para conciliar de manera ptima los conflictos entre los diferentes
objetivos deseables se puede usar un enfoque ms pragmtico. Las metas se
pueden establecer de manera que marquen los niveles mnimos satisfactorios
de eficiencia en las diferentes reas, basndose quiz en niveles de desempeo
anteriores o en los logros de la competencia. Si se encuentra una solucin que
permita que todas estas metas se cumplan, es posible que se adopte sin ms
requisitos. sta es la naturaleza de satisfizar. La distincin entre optimizar y
satisfizar refleja la diferencia entre la teora y la realidad, diferencia que con
frecuencia se encuentra al tratar de implantar esa teora en la prctica.
La cuarta f ase indica cuando un modelo es vlido, ste debe dar una prediccin confiable del funcionamiento del sistema. Para realizar la validez, se puede
comparar su funcionamiento con algunos datos pasados disponibles del sistema
actual. El modelo ser vlido si, bajo condiciones similares de entrada, puede
reproducir el funcionamiento pasado del sistema.
Es inevitable que la primera versin de un modelo matemtico tenga muchas
fallas. Sin duda, algunos factores o interrelaciones relevantes no se incorporaron
al modelo y algunos parmetros no se estimaron correctamente. Por lo tanto,
antes de usar el modelo debe probarse exhaustivamente para intentar identificar
y corregir todas las fallas que se pueda. Con el tiempo, despus de una larga
serie de modelos mejorados, se concluye que el modelo actual produce resultados
razonablemente vlidos.
Este proceso de prueba y mejoramiento de un modelo para incrementar su
validez se conoce como validacin del modelo. Es difcil describir cmo se lleva
a cabo la validacin del modelo porque el proceso depende en gran parte del
problema bajo estudio y del modelo usado. Para ello, despus de completar
los detalles de la versin inicial del modelo, una buena manera de comenzar
las pruebas es observarlo en forma global para verificar los errores u omisiones
obvias. El grupo que hace esta revisin debe, de preferencia, incluir por lo
menos a una persona que no haya participado en la formulacin. Al examinar de nuevo la formulacin del problema y compararla con el modelo pueden
descubrirse este tipo de errores. Tambin es til asegurarse de que todas las
expresiones matemticas sean consistentes en las dimensiones de las unidades
que emplean. Adems, puede obtenerse un mejor conocimiento de la validez del
modelo variando los valores de los parmetros de entrada y/o de las variables
de decisin, y comprobando que los resultados del modelo se comporten de una
manera factible.
Un enfoque ms sistemtico para la prueba del modelo es emplear una prueba
retrospectiva. Esta prueba utiliza datos histricos y reconstruye el pasado para
determinar si el modelo y la solucin resultante hubiera tenido un buen desempeo, de haberse usado. La comparacin de la efectividad de este desempeo
hipottico con lo que en realidad ocurri, indica si el uso del modelo tiende
a dar mejoras significativas sobre la prctica actual. Puede tambin indicar
reas en las que el modelo tiene fallas y requiere modificaciones. Lo que es
ms, al emplear las alternativas de solucin y estimar sus desempeos histricos hipotticos, se pueden reunir evidencias en cuanto a lo bien que el modelo
predice los efectos relativos de los diferentes cursos de accin.
Por otra parte, la prueba retrospectiva tiene la desventaja de que usa los
mismos datos que sirvieron para formular el modelo. Entonces, la pregunta crucial es si el pasado en realidad representa el futuro. Para salvar esta desventaja
de la prueba retrospectiva, a veces es til continuar con las cosas como estn
por una temporada. Esto proporcionar datos con los que no se contaba cuando
se construy el modelo.
Es importante documentar el proceso usado para las pruebas de la validacin
del modelo. Esto ayuda a aumentar la confianza en l, de los usuarios subsecuentes. Ms an, si en el futuro surgen preocupaciones sobre el modelo, esta
documentacin ayudar a diagnosticar en donde pueden estar los problemas.
La quinta f ase recae principalmente en los investigadores de operaciones,
emitiendo en una forma comprensible a los individuos que administrarn y operarn el sistema. Si el modelo ha de usarse varias veces, el siguiente paso es
instalar un sistema bien documentado para aplicar el modelo segn lo establecido
por la administracin. Este sistema incluir el modelo y el procedimiento de
solucin y los procedimientos operativos para su implementacin. Entonces,
aun cuando cambie el personal, el sistema puede consultarse peridicamente
para proporcionar una solucin numrica especfica.
Una vez desarrollado un sistema para aplicar un modelo, la ltima etapa
de un estudio de investigacin de operaciones es implementarlo siguiendo lo
CAPTULO 1. PRELIMINARES
aleatorios que se encuentran fuera del control del tomador de decisiones. Estos
factores aleatorios determinan en qu situacin se encontrar en el momento en
que se ejecute la accin. Cada una de estas situaciones posibles se conoce como
un estado de la naturaleza, que se denotar por . Para cada combinacin de
una accin a y un estado de la naturaleza , el tomador de decisiones sabe cul
sera el pago resultante. El pago es una medida cuantitativa del valor de las
consecuencias del resultado para el tomador de decisiones. Sea p(a, )= pago al
tomar la accin a cuando el estado de la naturaleza es .
En general, se usa una tabla de pagos para dar p(a, ) para cada combinacin
de a y . Existe una analoga interesante entre los conceptos de anlisis de
decisiones y el juego de dos personas con suma cero. Un juego de dos personas
con suma cero (vese[10]), como su nombre lo indica, es aquel en que participan
slo dos jugadores o adversarios y se le llama con suma cero porque un jugador
gana lo que el otro pierde, de manera que la suma de sus ganacias netas es cero.
El tomador de decisiones y la naturaleza se pueden ver como dos jugadores de
este juego. Las acciones posibles y los estados de la naturaleza posibles se pueden
ver como las estrategias disponibles para los respectivos jugadores, donde cada
combinacin de estrategias da como resultado un pago para el jugador 1 (el
tomador de decisiones) . Desde este punto de vista, el marco conceptual del
anlisis de decisiones se puede resumir como sigue:
1.- El tomador de decisiones necesita elegir una de las acciones posibles.
2.- La naturaleza elegir entonces uno de los estados de la naturaleza posibles.
3.- Cada combinacin de una accin a y un estado de la naturaleza da
como resultado un pago p(a, ), que est dado como uno de los elementos de la
tabla de pagos.
4.- Esta tabla de pagos debe usarse para encontrar una accin ptima para
el tomador de decisiones segn un criterio adecuado.
En la teora de juegos se supone que ambos jugadores son racionales y eligen
sus estrategias para promover su propio beneficio. Esta descripcin se ajusta
al tomador de decisiones pero no se ajusta a la naturaleza. Por el contrario, la
naturaleza es un jugador pasivo que elige sus estrategias (estados de la naturaleza) de alguna manera aleatoria. Este cambio significa que el criterio de la
teora de juegos para la forma de elegir una estrategia ptima (accin) no ser
el ms convincente para muchos tomadores de decisiones en el contexto actual.
Es necesario agregar otro elemento a estos conceptos de teora de decisiones.
El tomador de decisiones por lo general tendr alguna informacin que debe
tomar en cuenta sobre la posibilidad relativa de los estados de la naturaleza
posibles. Es comn que se pueda traducir esta informacin a una distribucin
de probabilidad, si se piensa que el estado de la naturaleza es una variable
aleatoria, en cuyo caso esta distribucin se conoce como una distribuci
on a
priori. Las probabilidades individuales para los respectivos estados se llaman
probabilidades a priori.
CAPTULO 1. PRELIMINARES
n
X
P ( = i , S = s)
P (S = s)
P ( = i , S = s)
(1.1)
(1.2)
i=1
P ( = i |S = s) = P (S = s| = i )P ( = i ).
(1.3)
P (S = s| = i )P ( = i )
.
n
P
P ( = i , S = s)
(1.4)
i=1
1.2
1.2.1
PROGRAMACIN DINMICA
INTRODUCCIN
1.2.2
ELEMENTOS DE UN MODELO DE PD
1.2.3
10
CAPTULO 1. PRELIMINARES
(1.5)
fn+1
(sn+1 ) en el lado derecho, de manera que fn (sn ) est definida en trminos
de fn+1 (sn+1 ).
8.- Cuando se usa esta relacin recursiva, el procedimiento de solucin comienza al final y se mueve hacia atrs etapa por etapa (encontrando cada vez la
poltica ptima para esa etapa) hasta que se encuentra la poltica ptima desde
la etapa inicial. Esta poltica ptima lleva de inmediato a una solucin ptima para el problema completo, a saber x1 para el estado inicial s1 , despus
x2 para el estado s2 que resulta, luego x3 para el estado s3 que resulta, y as
sucesivamente hasta xN para el estado sN resultante.
Para todos los problemas de programacin dinmica, se obtiene una tabla
como la que se muestra en la Figura 1.1 para cada etapa (n = N, N 1, ..., 1).
11
fn (sn , xn )
xn
sn
f n* ( sn )
x n*
Etapa
n
Etapa
sn
fn(sn, xn)
Etapa
n +1
Contribucin
de xn
s n +1
fn*+1(sn+1)
1.2.4
Aqu se ve el enfoque de la programacin dinmica para problemas determinsticos, en donde el estado en la siguiente etapa est completamente determinado
por el estado y la poltica de decisin de la etapa actual.
La programacin dinmica determinstica se puede escribir en forma de diagrama como se ve en la Figura 1.2.
En la etapa n el proceso se encontrar en algn estado sn . Al tomar la
decisin xn se mueve a algn estado sn+1 en la etapa n+1. El valor de la funcin
objetivo para la poltica ptima de ese punto en adelante se calcul previamente
como fn+1
(sn+1 ). La poltica de decisin tambin hace una contribucin a
la funcin objetivo. Al combinar estas dos cantidades en la forma apropiada
se proporciona a la funcin objetivo fn (sn , xn ) la contribucin de la etapa n
12
CAPTULO 1. PRELIMINARES
1.2.5
13
Etapa n + 1
Etapa n
Probabilidad
Contribucin
de la etapa n
C1
1
fn*+1(1)
p1
sn
Decisin
xn
p2
C1
ps
2
fn*+1(2)
C1
S
fn+*1(S)
Figure 1.3: Estructura bsica para programacin dinmica probabilstica
14
CAPTULO 1. PRELIMINARES
1.3
1.3.1
PROCESOS ESTOCSTICOS
INTRODUCCIN
k
X
P(
i ).
(1.6)
i=1
AXIOMAS DE LA PROBABILIDAD
Axioma 1 Para cada evento A , 0 P (A) 1.
Axioma 2 P () = 1.
15
(1.7)
P (B)
P (A Ak+1 )
P (A) + P (Ak+1 )
P (A1 ) + P (A2 ) + ... + P (Ak ) + P (Ak+1 ).
16
CAPTULO 1. PRELIMINARES
P (E|F ) =
P (E F )
.
P (F )
(1.8)
17
Esta formulacin nos muestra que todos los teoremas generales de probabilidad
tambin son vlidos para probabilidades condicionales con respecto a cualquier
hiptesis particular F .
As tenemos dos maneras de calcular la probabilidad condicional P (E|F ):
a) Directamente considerando la probabilidad de E con respecto al espacio
muestral reducido F .
b) Usando la definicin anterior, donde P (E F ) y P (F ) se calculan con
respecto al espacio muestral original .
A continuacin daremos la definicin de partici
on de un espacio muestral
y algunos resultados preliminares para demostrar el T eorema de Bayes, el
cual involucra a la probabilidad condicional.
Definicin 7 Decimos que los eventos B1 , B2 , ..., BK representan una particin del espacio muestral si:
a) Bi Bj = para todo i 6= j.
b)
k
S
Bi = .
i=1
c) P (Bi ) > 0 para todo i. En otras palabras: cuando se efecta un experimento, ocurre uno y s
olo uno de los eventos Bi .
Teorema 2 (T eorema de la probabilidad total)Sea A un evento de y sea
B1 , B2 , ..., BK una particin de . Entonces
(1.9)
A=A=A
k
[
i=1
Bi
= (A B1 ) (A B2 ) ... (A Bk ).
18
CAPTULO 1. PRELIMINARES
P (Bi |A) =
P (A|Bi )P (Bi )
k
P
(1.10)
P (A|Bj )P (Bj )
j=1
k
X
P (A|Bj )P (Bj ).
j=1
Por lo tanto
P (Bi |A) =
P (A|Bi )P (Bi )
P (A Bi )
P (Bi A)
= k
= k
P
P
P (A)
P (A|Bj )P (Bj )
P (A|Bj )P (Bj )
j=1
j=1
1.3.2
(1.11)
19
(1.12)
entonces se dice que las probabilidades de transicin (de un paso) son esta
cionarias y se denotan por pij.
As, tener probabilidades de transicin estacionarias implican que las probabilidades de transicin (de un paso) no cambian con el tiempo. La existencia de
probabilidades de transicin estacionarias (de un paso) tambin implican que
para i, j y n (n = 0, 1, 2, ...)
P [Xt+n = j|Xt = i] = P [Xn = j|X0 = i] para toda t = 0, 1, ....
(1.13)
(n)
P (n)
Estado
0
1
=
.
.
.
M
0
(n)
p00
(n)
p10
...
...
...
.
.
.
(n)
pM0
...
M
(n)
p0M
(n)
p1M
.
.
.
(1.14)
(n)
pM M
o, en forma equivalente,
P (n)
1.3.3
(n)
p
00
= ...
(n)
pM0
(n)
... p0M
...
... .
(n)
... pM M
(1.15)
ECUACIONES DE CHAPMAN-KOLMOGOROV
pij =
M
P
k=0
(m) (nm)
pik pkj
(1.16)
20
CAPTULO 1. PRELIMINARES
(m) (nm)
pij =
Para m = n 1
(n)
pij =
para toda i, j y n.
M
P
k=0
M
P
k=0
(n1)
pik pkj
(1.17)
(n1)
pkj
(1.18)
pik
P (n)
(n)
p00
...
=
...
(n)
pM0
(n)
p01
...
...
(n)
pM1
p00 p01
...
...
P =
...
...
pM0 pM1
la matriz de transicin de un paso.
La demostracin ser por induccin.
i) Para n = 1 se tiene que
P (1)
(1)
p00
...
=
...
(1)
pM0
(1)
p01
...
...
(1)
pM1
(n)
... p0M
...
...
...
...
(n)
... pMM
... p0M
...
...
...
...
... pM M
(1)
p00
... p0M
...
...
...
=
...
... ...
(1)
pM0
... pMM
p01
...
...
pM1
... p0M
...
...
=P
...
...
... pM M
P k+1
= P k P = P (k) P
(k)
(k)
p00 p01
...
...
=
...
...
(k)
(k)
pM 0 pM1
P
M
(k)
p p
j=0 0j j0
...
=
...
M
P
(k)
pMj pj0
j=0
(k+1)
p00
...
=
...
(k+1)
pM 0
21
(k)
p00
... p0M
...
...
...
...
... ...
(k)
pM0
... pMM
M
P
j=0
M
P
j=0
(k+1)
p01
...
...
(k+1)
pM1
(k)
p0j pj1
...
...
...
...
...
(k)
...
pMj pj1
M
P
j=0
M
P
j=0
p01
...
...
pM1
(k)
p0j pjM
...
...
(k)
pMj pjM
(k+1)
... p0M
...
...
= P (k+1)
...
...
(k+1)
... pMM
... p0M
...
...
...
...
... pMM
(n)
(n)
1.3.4
22
CAPTULO 1. PRELIMINARES
23
1 si Xn = i
Bn =
.
(1.21)
0 si Xn 6= i
La cantidad
(Bn |X0 = i)
(1.22)
n=1
n=1
Bn |X0 = i
=
=
=
n=1
X
n=1
E (Bn |X0 = i)
P (Xn = i|X0 = i)
(n)
pii .
(1.23)
n=1
n=1
(n)
pii = .
(1.24)
24
CAPTULO 1. PRELIMINARES
1.3.5
Con frecuencia es conveniente poder hacer afirmaciones en trminos de probabilidades sobre el nmero de transiciones que hace el proceso al ir de un estado
i a un estado j por primera vez. Este lapso se llama tiempo de primera pasada
al ir del estado i al estado j. Cuando j = i, este tiempo de primera pasada es
justo el nmero de transiciones hasta que el proceso regrese al estado inicial i.
En este caso, el tiempo de primera pasada se llama tiempo de recurrencia para
el estado i.
En general, los tiempos de primera pasada son variables aleatorias y, por lo
tanto, tienen una distribucin de probabilidad asociada a ellos. Estas distribuciones de probabilidad dependen de las probabilidades de transicin del proceso.
(n)
En particular, fij denota la probabilidad de que el tiempo de primera pasada
del estado i al j sea igual a n. Se puede demostrar que estas probabilidades
satisfacen las siguientes relaciones recursivas:
(1)
= pij = pij
(2)
fij
fij
(n)
fij
(1)
(2)
(1)
(1.25)
25
(n)
n=1
fij 1.
(1.26)
Mientras que puede ser difcil calcular fij para toda n, es relativamente
sencillo obtener el tiempo esperado de primera pasada del estado i al estado j.
Sea ij este valor esperado, que se define como
ij =
si
n=1
P
(n)
nfij
si
n=1
Siempre que
n=1
(n)
(n)
fij < 1
n=1
.
(n)
fij
(1.27)
=1
pik kj
(1.28)
k6=j
1.3.6
(n)
M
X
i pij
para j = 0, 1, ..., M,
i=0
M
X
j=0
= 1.
(1.29)
26
CAPTULO 1. PRELIMINARES
1
,
jj
para j = 0, 1, ..., M.
(1.30)
j = 1
(1.31)
j=0
27
lim
1 X (k)
pij
n
k=1
= j
(1.34)
1 si Xt = j
C(Xt ) =
.
(1.37)
0 si Xt 6= j.
28
CAPTULO 1. PRELIMINARES
1X
C(Xt )
lim E
n
n t=1
= lim E (f racci
on de veces que el sistema est
a en el estado j) = j . (1.38)
n
De igual manera, j se puede interpretar tambin como la fraccin o porcentaje real (a la larga) del nmero de veces que el sistema se encuentra.
CAPTULO 2
TEORA DE
INVENTARIOS
2.1
Las polticas de inventarios afectan las ganancias. La eleccin entre una poltica
y otra depende de su rentabilidad relativa. Algunos de estos costos que determinan esta rentabilidad son:
1.- Los costos de ordenar o fabricar.
2.- Los costos de mantener o almacenar.
3.- Los costos de penalizacin por faltantes o demanda insatisfecha.
Otros costos relevantes incluyen:
4.- Los ingresos.
5.- Los costos de recuperacin o salvamento.
6.- Las tasas de descuento.
El costo de ordenar o f abricar una cantidad z se puede representar por
una funcin c(z) (vese [5] y [10]). La forma ms sencilla de esta funcin es
aquella que es directamente proporcional a la cantidad ordenada o producida,
es decir, cz, donde c es el precio unitario pagado. Otra suposicin es que c(z)
se compone de dos partes: un trmino que es directamente proporcional a la
cantidad ordenada o producida y un trmino que es una constante K para z > 0
y 0 para z = 0.
c(z) =
0
si z = 0
K + cz si z > 0
29
(2.1)
30
2.2
2.2.1
31
MODELOS DETERMINSTICOS
REVISIN CONTINUA, DEMANDA UNIFORME
Y NO SE PERMITEN FALTANTES
(2.2)
Q
El nivel de inventario promedio durante un ciclo es Q+0
2 = 2 unidades por
Q
unidad de tiempo y el costo correspondiente es h 2 por unidad de tiempo. Como
la longitud del ciclo es Q
a entonces tenemos que
hQ2
2a
(2.3)
Por lo tanto
Costo total por ciclo = K + cQ +
hQ2
2a
(2.4)
aK
hQ
K + cQ + hQ2 /2a
=
+ ac +
Q/a
Q
2
(2.5)
32
(2.6)
de manera que
r
2aK
(2.7)
h
que es la familiar frmula del lote econmico. De igual manera, el tiempo que
toma obtener este valor de Q , llmese t , est dado por
r
Q
2K
t =
=
.
(2.8)
a
ah
Q =
2.2.2
Sea
p = costo del f altante por unidad de demanda insatisf echa por unidad de tiempo.
S = nivel de inventario justo despu
es de recibir un lote de Q unidades.
Q S = f altante en inventario justo antes de recibir un lote de Q unidades.
Ahora, el costo total por unidad de tiempo se obtiene a partir de las siguientes
componentes
Costo de producir u ordenar por ciclo = K + cQ
(2.9)
hS S
hS 2
( )=
2 a
2a
(2.10)
33
(2.11)
Por lo tanto
Costo total por ciclo = K + cQ +
hS 2 p(Q S)2
+
2a
2a
(2.12)
=
=
(2.13)
p(Q S)
hS
=0
Q
Q
p(Q S) p(Q S)2
aK
hS 2
+
= 0.
= 2
Q
2Q2
Q
2Q2
=
(2.14)
S =
2aK
h
p
p+h
Q =
2aK
h
p+h
.
p
(2.15)
2K
ah
p+h
p
(2.16)
2aK
p
h
.
p+h
(2.17)
El faltante mximo es
Q S =
34
2.3
2.3.1
MODELOS ESTOCSTICOS
MODELO DE UN PERIODO SIN COSTO FIJO
D
y
si D < y
si D y
(2.18)
(2.19)
35
X
[cy + pmax{0, d y} + hmax{0, y d}]PD (d)
d=0
= cy +
d=y
y1
X
d=0
(2.20)
D () = f unci
on de densidad de probabilidad de D
(a) = f unci
on de distribuci
on acumulada de D
de manera que
(a) =
D ()d.
(2.21)
= cy + L(y)
(2.22)
pc
.
p+h
(2.23)
36
2.3.2
Suponga que el nivel de inventario inicial est dado por x y que la decisin que
debe tomarse es el valor de y, el nivel de inventario despus del reabastecimiento
de la orden (o la produccin) de unidades adicionales (vese [7]). As, deber
ordenarse y x unidades, de manera que:
cantidad disponible(y) = cantidad inicial(x) + cantidad ordenada(y-x).
La ecuacin de costo que se present antes permanece igual excepto que el
trmino cy se convierte ahora en c(y x), de modo que el costo esperado mnimo
est dado por
min{c(y x) +
yx
p( y)D ()d +
h(y )D ()d}
(2.24)
Si x
< y0
y0
(2.25)
en donde y 0 satisface
(y 0 ) =
2.3.3
pc
.
p+h
(2.26)
Se supondr que el nivel de inventario inicial es cero. Para cualesquiera constantes positivas c1 y c2 se define g(, y) como
c1 (y ) si y >
g(, y) =
(2.27)
c2 ( y) si y
y sea
G(y) =
(2.28)
c2 c
.
c2 + c1
(2.29)
Para ver por qu este valor de y 0 minimiza G(y), observe que, por definicin
G(y) = c1
37
(y )D ()d + c2
(2.30)
c2 c
.
c2 + c1
(2.32)
2
G(y)
= (c1 +c2 )D (y)
La solucin de esta ecuacin minimiza G(y) ya que d dy
2
0 para toda y.
Para aplicar este resultado, es suficiente demostrar que
Z
Z y
C(y) = cy +
p( y)D ()d +
h(y )D ()d
0
pc
.
p+h
(2.33)
Para obtener los resultados para el caso en que el inventario inicial sea x > 0,
es necesario resolver la relacin
Z
min{cx + [
yx
p( y)D ()d +
(2.34)
(2.35)
yx
(2.36)
yx
d G(y)
dy2
pc
p+h .
Ms an, G(y)
G(y)
38
G(y0)
y0
dG(y)
dy
dG(y)
lim
y dy
lim
y0
= c p el cual es negativo
= h + c el cual es positivo
(2.37)
2.3.4
39
cy+L(y)
Grfica de cy+L(y)
L(y) = p
( y)D ()d + h
(y )D ()d.
(2.38)
K + c(y x) si y > x
(2.39)
L(x)
si y = x.
Observe que cy + L(y) es el mismo costo esperado que se consider antes
cuando se omiti el costo de preparacin. Si cy + L(y) se bosqueja como una
funcin de y, tendr la forma que se muestra en la Figura 2.2.
Defina S como el valor de y que minimiza cy + L(y) y defina s como el valor
ms pequeo de y para el que cs + L(s) = K + cS + L(S).
Segn la figura anterior, se puede ver que:
si x > S, entonces
K + cy + L(y) > cx + L(x) para toda y > x
40
de manera que
K + c(y x) + L(y) > L(x).
El lado izquierdo de la ltima desigualdad representa el costo total esperado
de ordenar y x unidades para elevar el nivel de inventario a y unidades, y
el lado derecho de esta desigualdad representa el costo total esperado si no se
ordena. La poltica ptima indica que si x > S, no se ordene.
Si s x S, de nuevo se ve de la figura 2.2 que
K + cy + L(y) cx + L(x) para toda y > x,
de manera que
K + c(y x) + L(y) L(x).
Una vez ms, no ordenar es menos costoso que ordenar. Por ltimo, si x < s,
en la Figura 2.2 se ve que
min {K + cy + L(y)} = K + cS + L(S) < cx + L(x)
yk
(S) =
pc
p+h
(2.41)
2.3.5
(2.42)
41
pc
.
p+h
(2.43)
Si x2
< y20
y20
si x2 y20
L(x2 )
C2 (x2 ) =
c(y20 x2 ) + L(y20 ) si x2 < y20
(2.44)
(2.45)
42
asociados a seguir una poltica durante el segundo periodo (vese [5] y[10]). As,
el costo esperado si se sigue una poltica ptima en los dos periodos est dado
por
C1 (x1 ) = min {c(y1 x1 ) + L(y1 ) + E[C2 (x2 )]}
(2.47)
y1 x1
si y1 D1 y20
L(y1 D1 )
0
y1 + D1 ) + L(y2 ) si y1 D1 < y20 .
(2.48)
As, C2 (x2 ) es una variable aleatoria y su valor esperado est dado por
C2 (x2 ) = C2 (y1 D1 ) =
E[C2 (x2 )] =
C(y20
C2 (y1 )D ()d
y1 y20
L(y1 )D ()d
y1 y20
(2.49)
Entonces
Z y1 y20
c(y1 x1 ) + L(y1 ) +
L(y1 )D ()d
0
Z
C1 (x1 ) = min
y1 x1
y1 y20
(2.50)
Se puede demostrar que C1 (x1 ) tiene un mnimo nico y que el valor ptimo
de y1 , denotado por y10 , satisface la ecuacin
y1 y20
Si x1
< y10
y10
2.3.6
43
Si xi
< yi0
yi0
0
yn0 yn1
... y20 y10
(2.54)
2.4
2.4.1
p c(1 )
.
p+h
(2.55)
PROCESOS DE DECISIN
MODELO UTILIZADOS PARA PROCESOS DE
DECISIN MARKOVIANOS
44
2.4.2
45
Al evaluar cada poltica, se puede determinar la solucin ptima. Esto es bsicamente equivalente a un proceso de enumeracin exhaustiva y slo se puede
emplear si el nmero total de polticas estacionarias es razonablemente chico
para realizar operaciones de clculo prcticas.
El segundo mtodo, que recibe el nombre de iteracin de poltica, aligera
las dificultades de clculo que pudieran presentarse en el procedimiento de enumeracin exhaustiva. El nuevo mtodo es eficiente, en general, en el sentido de
que determina la poltica ptima en un nmero pequeo de iteraciones. Ambos
mtodos nos deben llevar a la misma solucin ptima.
Antes de iniciar el anlisis de cada mtodo, expresemos el problema como
un modelo de programacin dinmica de estado finito de la siguiente manera.
Supongamos que el nmero de estados para cada etapa es m y definamos
fn (i) =ingreso esperado ptimo de las etapas n, n + 1, ..., N , dado que el
estado del sistema al inicio de la etapa n es i.
La ecuacin recursiva hacia atrs que relaciona a fn y fn+1 puede escribirse
como
fn (i) = max
k
m
X
j=1
k
pkij [rij
+ fn+1 (j)] ,
n = 1, 2, ..., N
(2.56)
k
Una justificacin para la ecuacin es que el ingreso acumulado, rij
+ fn+1 (j)
que resulta de llegar al estado j en la etapa n + 1 desde el estado i en la
etapa n ocurre con probabilidad pkij . Si vik representa el rendimiento esperado
resultante de una transicin desde el estado i dada la alternativa k, entonces vik
puede expresarse como
vik =
m
X
k
pkij rij
.
(2.57)
j=1
X
pkij fn+1 (j)] ,
fn (i) = max vik +
k
j=1
n = 1, 2, ..., N 1 (2.58)
46
= s
= 1
(2.59)
donde s = ( s1 , s2 , ..., sm )
P aso 3. Determine E s ,el ingreso esperado de la poltica s por paso (periodo) de transicin, mediante el uso de la frmula
Es =
m
X
si si
(2.60)
i=1
E s = max{E s }
(2.61)
m
X
i = 1, 2, ..., m.
(2.62)
j=1
47
definimos como el nmero de tepas que faltan por considerar. Esto sucede en
contraste con n en la ecuacin, que define la nsima etapa. Por lo tanto, la
ecuacin recursiva se escribe como
f (i) = vi +
m
X
pij f1 (j),
i = 1, 2, ..., m.
(2.63)
j=1
etapa, se puede probar que para muy grande, f (i) = E + f (i) donde f (i) es
un trmino constante que representa la interseccin asinttica de f (i) dado el
estado i.
E + f (i) = vi +
m
X
j=1
i = 1, 2, ..., m.
(2.64)
m
X
j=1
i = 1, 2, ..., m
(2.65)
que genera m ecuaciones y m+1 incgnitas, donde las incgnitas son f (1), f (2),
..., f (m) y E.
Nuestro objetivo final es el de determinar la poltica ptima que genere el
valor mximo de E. Como hay m ecuaciones y m + 1 incgnitas, el valor ptimo
de E no se puede determinar en un paso. En cambio se utiliza un enfoque
iterativo que, al comenzar con una poltica arbitraria, determinar entonces
una nueva poltica que genere un mejor valor de E. El proceso iterativo termina
cuando dos polticas sucesivas son identicas.
El proceso iterativo consta de dos componentes bsicas, llamadas paso de
determinacin del valor y paso de mejora de la poltica.
48
1.- Determinaci
on del valor. Eljase una poltica arbitraria s. Mediante
el uso de sus matrices asociadas P s y Rs y suponiendo arbitrariamente que
f s (m) = 0, resulvanse las ecuaciones
E s = vis +
m
X
j=1
i = 1, 2, ..., m
(2.66)
con las incgnitas E s , f s (1), f s (2), ..., f s (m 1). Dirjase al paso de mejora de
la poltica.
2.- M ejora de la poltica. Para cada estado i, determnese la opcin k que
genere
X
i = 1, 2, ..., m.
(2.67)
pkij f s (j) ,
max vik +
k
j=1
m
X
j=1
(2.68)
49
La razn por la que este enfoque es atractivo es que se cuenta con un mtodo
rpido para encontrar una poltica ptima cuando slo quedan n periodos de
operacin, a saber, el de programacin dinmica probabilstica.
En particular, para i = 0, 1, ..., M , sea
Vin =costo descontado total esperado por seguir una poltica ptima, dado
que el proceso comienza en el estado i y le quedan slo n periodos de operacin
Por el principio de optimalidad para programacin dinmica, las Vin se obtienen de la relacin recursiva,
Vin
X
= min Cij +
pij (k)Vjn1 ,
para i = 0, 1, ...., M.
(2.69)
j=0
para i = 0, 1, ...., M
(2.70)
50
CAPTULO 3
APLICACIN
3.1
INTRODUCCIN
3.2
52
CAPTULO 3. APLICACIN
SEMANA, i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
DEMANDA, xi
23
21
12
12
31
28
15
30
41
17
21
24
31
12
18
23
24
P17
i=1
xi
17
= 22.5.
(3.1)
P (Dt = k) = exp(22.5)
(22.5)k
.
k!
(3.2)
P17
i=1
17
xi
= 2.25.
(3.3)
P (Dt = k) = exp(2.25)
(2.25)k
.
k!
(3.4)
53
P (Dt = k)
0.1054
0.2371
0.2668
0.2001
0.1906
(3.5)
Xt < 1 ordenar
, tenemos que la matriz de transicin es
Xt 1 no ordenar
Estado
0
1
2
3
4
y la matriz de costo es
Estado
C1
Si
}|
Xt 1 ordenar
, tenemos que la matriz de transicin es
Xt > 1 no ordenar
Estado
P2
447.3 12.648
0
0
0
0
1
2
3
4
0
1
2
3
4
0.2371 0.1054
0.2371 0.1054
0
0
0.1054
0
0.2371 0.1054
54
CAPTULO 3. APLICACIN
y su matriz de costo es
Estado
C2
Si
Xt 2 ordenar
Xt > 1 no ordenar
Estado
3
0.2371
0.2371
0.2371
0.1054
0.2371
y su matriz de costo es
Estado
C3
0
1
2
3
4
0
1
2
3
4
}|
0
1
2
3
4
}|
0.1054
0.1054
0.1054
0
0.1054
i=1
439.59
439.59
439.59
i=2
401.4877
439.59
439.59
i=3
224.2322
224.2322
439.59
i=4
92.9442
92.9442
92.9442
i=5
39.59
39.59
39.59
55
1
IT ERACI ON
1) Determinaci
on del valor.
Elegimos la poltica s = 1. Utilizando la frmula 2.66 tenemos que.
E
E
E
E
E
=
=
=
=
=
439.59 + 0.1906f (1) + 0.2001f (2) + 0.2668f (3) + 0.2371f (4) + 0.1054f (5) f (1)
401.4877 + 0.8946f (1) + 0.1054f (2) f (2)
224.2322 + 0.6575f (1) + 0.2371f (2) + 0.1054f (3) f (3)
92.9442 + 0.3907f (1) + 0.2668f (2) + 0.2371f (3) + 0.1054f (4) f (4)
39.59 + 0.1906f (1) + 0.2001f (2) + 0.2668f (3) + 0.2371f (4) + 0.1054f (5) f (5)
k=1
727.18
810.24
634.12
465.46
327.18
k=2
727.18
727.18
634.12
465.46
327.18
k=3
727.18
727.18
727.18
465.46
327.18
f (i)
727.18
727.18
634.12
465.46
327.18
k
1, 2 o 3
2o3
1o2
1, 2 o 3
1, 2 o 3
=
=
=
=
=
439.59 + 0.1906f (1) + 0.2001f (2) + 0.2668f (3) + 0.2371f (4) + 0.1054f (5) f (1)
439.59 + 0.1906f (1) + 0.2001f (2) + 0.2668f (3) + 0.2371f (4) + 0.1054f (5) f (2)
224.2322 + 0.6575f (1) + 0.2371f (2) + 0.1054f (3) f (3)
92.9442 + 0.3907f (1) + 0.2668f (2) + 0.2371f (3) + 0.1054f (4) f (4)
39.59 + 0.1906f (1) + 0.2001f (2) + 0.2668f (3) + 0.2371f (4) + 0.1054f (5) f (5)
56
CAPTULO 3. APLICACIN
2) M ejora de la poltica.
Los clculos del paso de mejora de la poltica se da en la siguiente tabla.
i
1
2
3
4
5
k=1
708.96
801.49
614.25
442.39
308.96
k=2
708.96
708.96
614.25
442.39
308.96
k=3
708.96
708.96
708.96
442.39
308.96
f (i)
708.96
708.96
614.25
442.39
308.96
k
1, 2 o 3
2o3
1o2
1, 2 o 3
1, 2 o 3
3.3. CONCLUSIONES
3.3
57
CONCLUSIONES
Los procesos de decisin markovianos son bastantes importantes, ya que aparecen con bastante frecuencia en la prctica. Debido a que stos utilizan muchas
herramientas matemticas para su solucin, fue uno de los motivos que nos
impuls a tomarlos como objetos de estudio para mostrar el alcance de la
matemtica aplicada.
En este trabajo de tesis damos una introduccin sobre la teora de decisiones,
un breve resumen de la herramienta matemtica que se necesita para la solucin de problemas de decisin y resolvimos un problema de stos en el rea de
inventarios. Si bien la teora expuesta aqu se puede encontrar en los libros que
se mencionan en la bibliografa, el mrito en esta tesis (si es que existe) es la
concentracin y el tratar de explicar en forma clara y concisa la interrelacin
entre teora de decisiones, cadenas de Markov y programacin dinmica.
En nuestro pas estos mtodos de solucin no son utilizados actualmente
pero se espera que en un futuro si lo sean, ya que en pases desarrollados han
probado ser efectivos en problemas de minimizacin de costos y maximizacin
de utilidades.
La importancia de la herramienta matemtica se manifiesta en la aplicacin
de las cadenas de Markov en el modelamiento del problema y de la programacin
dinmica en el proceso de solucin para encontrar la mejor alternativa. El
problema resuelto aqu, aunque pequeo, es original y muestra lo que se ha
mencionado. Es as como hemos logrado el objetivo inicial.
58
CAPTULO 3. APLICACIN
BIBLIOGRAFA
[1] Bertsekas, D. P.; Dynamic Programming Deterministic and Stochastic
Models; Pretince-Hall; Englewood clis; NJ; 1987.
[2] Canavos C., George; Probabilidad y Estadstica. Aplicaciones y Mtodos;
Mc Graw Hill; 1988.
[3] Denardo, E. V.; Dinamic Programing. Theory and Applications; PretinceHall; Englewood clis; NJ; 1982.
[4] Feller, William; Introduccin a la Teora de Probabilidades y sus Aplicaciones; 3a. ed. Limusa; 1993.
[5] Hillier, Frederick S. y G. J. Lieberman; Investigacin de Operaciones; Mc
Graw Hill; 2001.
[6] Isaacson L., Dean y Madsen W., Richard; Markov Chains. Theory and
applications; Springer-Verlag; 1975.
[7] Liu, B. y A. O. Esogbue; Decision Criteria and Optimal Inventory Processes; Kluwer Academic Publisher; Boston; 1999
[8] Meyer L., Paul; Probabilidad y Aplicaciones Estadsticas; Fondo Educativo
Interamericano; 1973.
[9] Spiegel R., Murray; Probabilidad y Estadstica; Mc Graw Hill; 1995.
[10] Taha, A. Hamdy; Investigacin de Operaciones; Alfaomega; 1995.
[11] White, D. J.; Real Applications of Markov Decision Processes; interfaces;
15(6): 73-83; November-December; 1985.
59