Está en la página 1de 1

UNIVERSIDAD CESAR VALLEJO HERRAMIENTAS PARA LA TOMA DE DECISIONES

PROGRAMACIÓN DINÁMICA PROBABILÍSTICA-Lieberman


1. Un aficionado al backgamon jugará tres encuentros consecutivos con sus amigos. En cada juego tendrá la oportunidad
de apostar; la cantidad apostada puede ascender a cualquier cantidad entre cero y la cantidad de dinero que le quede
después de las apuestas en los juegos anteriores. En cada encuentro, la probabilidad de que gane el juego y, por lo tanto,
la apuesta, es 1/2, mientras que tiene una probabilidad de 1/2 de perder y, por tanto, perder la apuesta. Comenzará con
$75 y su meta es tener $100 al finalizar los tres juegos. (No intenta acabar con más de $100 porque se trata de un
encuentro amistoso.) El jugador quiere encontrar la política óptima de apuesta —incluidos todos los empates que
maximice la probabilidad de tener exactamente $100 después de los tres juegos.
Utilice programación dinámica para resolver este problema.

2. Imagine que tiene $10 000 para invertir y que tendrá la oportunidad de hacerlo en cualesquiera de dos inversiones
(A o B) al principio de cada uno de los próximos tres años. Existe incertidumbre respecto del rendimiento de ambas
inversiones. Si invierte en A, puede perder todo el dinero u (con probabilidad más alta) obtener $20 000 (una ganancia
de $10 000) al final del año. Si invierte en B, puede obtener los mismos $10 000 o (con probabilidad más baja) $20 000
al terminar el año. Las probabilidades para que sucedan estos eventos son las siguientes:

Se le permite hacer (a lo sumo) una inversión al año y sólo puede invertir $10 000 cada vez. (Cualquier cantidad
adicional de dinero acumulada es inútil.)

a) Utilice programación dinámica para encontrar la política de inversión que maximice la cantidad de dinero que espera
tener después de los tres años.
b) Utilice programación dinámica para encontrar la política de inversión que maximice la probabilidad de tener por lo
menos $20 000 después de los 3 años.

3. Suponga que la situación del problema de la Hit-and-Miss Manufacturing Company (ejemplo 6) ha cambiado
ligeramente. Después de un análisis más cuidadoso, se estima que cada artículo producido tiene una probabilidad de
2/3, de ser aceptable, en lugar de 1/2, de manera que la probabilidad de producir cero artículos aceptables en un lote de
tamaño L es (1/3)L. Aún más, ahora sólo se tiene tiempo para hacer dos corridas de producción. Utilice programación
dinámica para determinar la nueva política óptima para manejar este problema.

4. Reconsidere el ejemplo 7. Suponga que se cambia la apuesta a “si comienza con dos fichas, ella no tendrá cinco
fichas después de cinco jugadas”. Sin perder de vista los resultados que obtuvo antes, efectúe los cálculos adicionales
para determinar cuál es la nueva política óptima para la joven experta en estadística.

5. El producto más importante de la Profit & Gambit Co., ha perdido dinero por un decremento de sus ventas. De hecho,
durante el trimestre actual las ventas estarán 4 millones de unidades abajo del punto de equilibrio. Debido a que el
rendimiento marginal por cada unidad vendida es $5 mayor que el costo marginal, la empresa sufrirá una pérdida de
$20 millones en el trimestre. La administración debe tomar medidas expeditas para rectificar esta situación. Se tiene en
consideración dos alternativas. Una consiste en abandonar el producto de inmediato, con lo que se incurriría en un costo
de $20 millones por cierre. La otra es emprender una campaña publicitaria intensiva para aumentar las ventas y después
abandonar el producto (a un costo de $20 millones) sólo si la campaña no tiene el éxito suficiente.
Se formularon y analizaron planes tentativos para esta campaña que se extendería a los próximos tres trimestres sujeta
a cancelación en cualquier momento, cuyo costo sería de $30 millones por trimestre. Se estima que el aumento
aproximado en ventas sería de 3millones de unidades en el primer trimestre, otros 2 millones en el segundo y otro
millón en el tercer trimestre. Sin embargo, por algunas variables impredecibles del mercado, existe gran incertidumbre
en cuanto al efecto real que tendrá la campaña: un análisis cuidadoso indica que la estimación de cada trimestre puede
estar equivocada hasta en 2 millones de unidades en cualquier dirección. (Para cuantificar la incertidumbre, suponga
que los aumentos adicionales de ventas de los tres trimestres son variables aleatorias independientes con distribución
uniforme entre 1 y 5 millones, entre 0 y 4 millones y entre -1 y 3 millones, respectivamente.) Si los aumentos reales
son demasiado pequeños, se puede interrumpir la campaña publicitaria y discontinuar el producto al final de cualquiera
de los dos próximos trimestres.
Si se emprende la campaña publicitaria intensiva y se continúa hasta terminar, se estima que las ventas seguirán en
aumento por algún tiempo al mismo nivel que en el tercer trimestre (el último) de la campaña. Por tanto, si las ventas
en ese trimestre todavía están por debajo del punto de equilibrio, el producto deberá dejar de producirse. De otra manera,
se estima que la ganancia descontada esperada en adelante será de $40 por cada unidad vendida que esté más arriba del
punto de equilibrio en el tercer trimestre. Utilice programación dinámica para determinar la política óptima que
maximice la ganancia esperada.

También podría gustarte