Está en la página 1de 16

Universidad del Bo-Bo

Facultad de Ingeniera
Depto. Ing. Industrial.
Investigacin Operativa II (430154)
Ingeniera Civil Industrial.
Prof. Milton Ramrez M.
El siguiente apunte resume algunos de los aspectos ms importantes referidos al tema Teora y
Anlisis de Decisiones.
Introduccin: La mayora de las acciones de la vida requieren la eleccin de alternativas bajo
incertidumbre, esto es, elegir entre un conjunto de cursos alternos de accin en condiciones en
donde uno tiene incertidumbre sobre las consecuencias reales de cada curso de accin. A menudo,
sin embargo, debemos elegir una alternativa y frecuentemente nos preocupa que sea la alternativa
mejor u ptima.
Existe una infinidad de situaciones en donde se deben tomar decisiones, por ejemplo en produccin,
en donde se debe decidir sobre algn determinado mtodo o proceso de produccin para un
determinado producto; tambin si se debe alquilar, subcontratar o fabricar o seleccionar un plan de
control de calidad. En finanzas, por ejemplo puede ser necesario decidir si se invierte o no en una
nueva planta, en equipos, en programas de investigacin de mercadeo, etc. Las situaciones
descritas son algunas de las muchas situaciones que se presentan en la realidad.
Los problemas de decisin son caractersticamente complejos por lo que es casi imposible para un
tomador de decisiones (decisor) tener en cuenta todos los factores que inciden en la decisin
simultneamente. Debido a lo anterior es que el proporciona un conjunto Anlisis de Decisiones
generoso de conceptos y tcnicas para ayudar al tomador de decisiones a tratar problemas de
decisin complejos bajo incertidumbre.
El tiene que ver con la toma racional (consistente) de decisiones, Anlisis de Decisiones
principalmente bajo condiciones de incertidumbre, esto es, le ayuda al tomador de decisiones a
contestar la pregunta "cul es la mejor alternativa que puedo seleccionar con base a la
informacin que tengo ahora?", la que normalmente es incompleta e incierta. Tambin le permite
al decisor analizar una situacin compleja con muchos cursos de accin consistentes con los
valores bsicos (gustos) y conocimientos (creencias) del decisor. Se caracteriza por ser un enfoque
de prescripcin ms que uno de descripcin, esto es, presenta los conceptos y mtodos para escoger
pero no pretende describir como la gente piensa.
Los rboles de decisin, la medida y revisin de creencias basados en informacin nueva, la
preferencia al riesgo, valor de la informacin y anlisis de sensibilidad son varios de los conceptos
claves que se discuten en este tema.
En esta parte se discutirn los conceptos y tcnicas del anlisis de decisin cuando se debe tomar
una decisin terminal sencilla con base al estado actual de la informacin por parte del tomador de
decisiones, esto es, las decisiones secuenciales y las oportunidades de adquirir informacin
adicional no se consideran antes de decidir, de ah el nombre de decisin terminal.
Para facilitar nuestra exposicin, adoptaremos tres polticas primarias:
(1) Evitar el uso de las matemticas cuando no haya necesidad real para ello.
(2) Restringir la discusin principalmente a problemas discretos y,
(3) Explicar los diversos mtodos del anlisis de decisin por medio de un ejemplo discreto
discreto simple, que permitirn ilustrar los conceptos, estructuras y tcnicas para tomar
decisiones terminales bajo incertidumbre.
Ejemplo: Aprovisionamiento de tenidas de tenis: Suponga que usted es el propietario de un
almacn de artculos de tenis y debe decidir cuntas tenidas de tenis para hombre debe pedir para la
estacin de verano. Para un tipo particular de tenida, usted debe pedir lotes de 100. Los valores
que se darn a continuacin estn expresados en (U.M.) Si pide 100 tenidas su costo es de 10 por
unidad. Si pide 200 su costo es de 9 y si pide 300 ms su costo es de 8.50. Su precio de venta
es de 12, pero si algunas tenidas se quedan sin vender al final del verano, estas se deben vender a
mitad de precio. Por sencillez, usted cree que la demanda de esta tenida es 100, 150 200. Es
claro que usted no puede vender ms de lo que almacena. Sin embargo, si se queda corto hay una
prdida de buen nombre de 0.50 por cada tenida que una persona desee comprar pero que no puede
hacerlo por no tenerla en el almacn. Adems, usted debe colocar el pedido ahora, para la
estacin de verano venidera; y no puede esperar a observar cmo vara la demanda de esta tenida
antes de pedir, ni se pueden colocar varios pedidos.
Caractersticas de un problema de decisin: El problema descrito anteriormente, y en realidad
cualquier problema de decisin, tiene ciertas caractersticas comunes. Estas caractersticas
constituyen del problema y proporcionan la para la solucin. El la decisin formal estructura
problema de decisin en estudio puede representarse por un en trminos de los siguientes modelo
elementos.
1.- El tomador de decisiones (o decisor): Es el responsable de tomar la decisin. Se le
mira como una entidad y puede ser un solo inidividuo, un comit, una compaa, una
nacin, etc. En nuestro ejemplo, es el propietario del almacn de artculos de tenis.
2.- Cursos alternos de accin: Una parte importante de la tarea del tomador de
decisiones es especificar y describir sus alternativas. La decisin comprende la eleccin
de cursos de accin alternos. Cuando la oportunidad de adquirir informacin est
disponible, el problema del tomador de decisiones es escoger la mejor fuente o fuentes
de informacin y la mejor estrategia total. Una es una regla de decisin estrategia
que indica la accin que debe tomarse contingente o una observacin especfica
recibida de una fuente de informacin elegida. En nuestro ejemplo, tres cursos de
accin estn abiertos, a saber, a : pedir 100, a : pedir, a : pedir 300. 1
2 3
3.- Eventos: Estas son situaciones o estados del ambiente (o de la naturaleza) que pueden
ocurrir y que no estn bajo el control del tomador de decisiones. Bajo condiciones de
incertidumbre, el tomador de decisiones no concoce con certeza qu evento ocurrir
cuando decide.
Los eventos se definen como mutuamente excluyentes y colectivamente exhaustivos lo
que implica que ocurrir uno y solamente uno de todos los eventos posibles
especificados.Los eventos tambin se denominan "estados", "estados de la naturaleza",
"estados del mundo" o "eventos importantes de pago".
La incertidumbre se mide en trminos de probabilidades asignadas a los eventos. Una
de las caractersticas distintivas del anlisis de decisiones es que estas probabilidades
son reflejan el estado de conocimiento o las creencias del tomador de subjetivas (
decisiones) o bien objetivas, esto es, determinadas tcnica o empricamente.
El tomador de decisiones debe identificar y especificar los eventos y tambin evaluar
sus probabilidades de que se presenten.En nuestro ejemplo, los eventos son : cuando
1
la demanda es 100, : cuando la demanda es 150, : cuando la demanda es 200.
2 3
4.- Consecuencias. Las consecuencias, las cuales deben evaluarse por el tomador de
decisiones, son una medida del beneficio neto o pago recibido por l. Las
consecuencias que resultan de la decisin dependen no solamente de la decisin sino
tambin del evento que ocurra. As, hay una consecuencia asociada con cada para
Las consecuencias se denominan tambin accin-evento. "pagos", "resultados",
"beneficios" o "prdidas" "matriz de . Ellas se resumen convenientemente en una
pagos".
En el problema de decisin mostrado en el ejemplo, si el propietario de la tienda de artculos de
tenis pide 100 tenidas y la demanda resulta ser 100 obtendr una ganancia de 200. Cabe hacer
notar que las consecuencias deben reflejar los valores subjetivos del tomador de decisiones, esto es,
deben representar las preferencias del tomador de decisiones o los valores de las consecuencias
objetivas correspondientes. En otras palabras, las consecuencias objetivas tienen que ser
necesariamente transformadas en "utilidades" que reflejen el valor subjetivo de las consecuencias
del tomador de decisiones. Para simplificar la decisin, supondremos, a no ser que se diga lo
contrario, que los valores dados de las consecuencias ya han sido transformados en utilidades.
La matriz de pago. La matriz de decisin de nuestro problema del propietario de la tienda de
artculos de tenis se ilustra en la siguiente tabla, en la que se puede observar, que en tal matriz de
pago, las acciones se listan a la izquierda a lo largo de las filas, los estados se listan en la parte
superior de la matriz a lo largo de las columnas y las consecuencias posibles se listan en las celdas
de la matriz, una consecuencia asociada con cada par accin-evento. Las consecuencias se
determinan de la siguiente funcin de consecuencia:
Si el suministro es mayor que la demanda, esto es, si S>D, entonces la ganancia es igual a D(R-C)-
(C-6)(S-D). Si la demanda es mayor que el suministro, esto es, si D>S, entonces la ganancia es
igual a S(R-C)-(0.50)(D-S). En este caso R es el ingreso unitario por unidad (precio de venta) y C
es el costo unitario. El factor 6 representa el precio mitad o precio de venta al final del verano para
los artculos no vendidos y el factor 0.50 es la prdida de prestigio por quedarse corto.
Matriz o Tabla de Pagos.

: 100 : 150 : 200
a : Pedir 100 200 175 150
a : P
Eventos (Demanda)
Accin
1 2 3
1
2
edir 200 0 300 600
a : Pedir 300 -150 150 450
3
Observacin. Si el evento que ocurre fuera conocido de antemano con certeza por el tomador de
decisiones, por ejemplo (si la demanda fuera 150) entonces el propietario debera mirar para
2
abajo en la columna de la matriz de pago y elegir la accin que produjese el ms alto pago, esto
2
es, max 175,300,150 =300 que indica que debera pedir 200 tenidas, esto es, elige la accin a .

2
Sin embargo, en el mundo real, el contexto de los problemas de decisin es tal que debido a que
los estados de la naturaleza estn fuera del control del tomador de decisiones, el no sabe con
certeza qu evento especfico ocurrir (o ser cierto). La accin del frente curso ptimo de accin
a la incertidumbre es la parte crucial del problema del decisor.
Aunque el trmino "incertidumbre" se refiere a la ignorancia del tomador de decisiones sobre cul
es el evento que ocurrir (o cul evento ser el "verdadero") tambin l puede tener incertidumbre
sobre varios aspectos de las "consecuencias". Por ejemplo, si el propietario de la tienda de artculos
de tenis no estuviera seguro de su prdida de prestigio, entonces algunas de las ganancias de la
matriz de pagos seran inciertas. Estos anlisis lo pueden llevar a uno a expandir la formulacin del
problema para incluir mayor detalle y panorama. El hacer esto o no depende de que tan complejo
(y que tan realista) desee uno que sea el modelo.
Debe notarse que algunos autores distinguen entre lo que ellos llaman "toma de decisiones bajo
riesgo", esto es, toma de decisiones cuando el estado del mundo no es conocido pero se conocen
las probabilidades para los diversos estados posibles y , "toma de decisiones bajo incertidumbre"
esto es, toma de decisiones cuando el estado del mundo no se conoce y las probabilidades de los
diversos estados no se conocen.
Bajo la interpretacin subjetiva de probabilidad, sta siempre la podemos evaluar para cada uno
de los eventos o estados posibles, o estados del mundo. Por lo tanto la dicotoma "riesgo versus
incertidumbre" es extremadamadamente artificial (en realidad no existe acuerdo a la
interpretacin subjetiva de probabilidad) y en esta parte cualquier problema de toma de
decisiones en el que el estado del mundo no se conozca con certeza se le denomina toma de
decisin bajo incertidumbre.
Criterios de eleccin. Habiendo examinado los elementos fundamentales y la estructura de los
problemas de decisin bajo incertidumbre, trataremos ahora diversos criterios que pueden utilizarse
para seleccionar un curso de accin. Primero investigaremos criterios de toma de decisiones que
han sido desarrollados, por lo menos en parte, para evitar Tales la evaluacin de probabilidades.
criterios ignoran la naturaleza probabilstica de la toma de decisiones bajo incertidumbre.
Exploraremos los siguientes criterios de eleccin:
1. Dominacin (inadmisibilidad).
2. Maximin.
3. Maximax.
4. Hurwicz , y
5. Minimax o arrepentido.
Criterios no probabilsticos de eleccin. Este tipo de situacin de toma de decisiones no tiene
distribucin de probabilidad anterior, esto es, se caracteriza por la ignorancia completa de
cualquier distribucin de probabilidad de los estados de la naturaleza. Mientras que uno podra
argumentar que esta situacin es algo rara en una situacin real, diversos eruditos en la toma de
decisiones bajo incertidumbre han propuesto diversos criterios para resolver estos problemas.
1. Dominacin. El principio de dominacin no es tanto una manera de seleccionar una
accin o estrategia sino como una forma de decidir qu acciones o estrategias eliminar.
La dominacin expresa que si una accion a' no es mejor que otra accin a" en
ningn estado del mundo, entonces a' se dice que es una accin dominada o
inadmisible, esto es, a' es dominada por a", luego debiera descartarse. En trminos
simples la dominacin permite eliminar las acciones subptimas. En nuestro ejemplo la
accin a (pedir 300 tenidas) es dominada puesto que no importa cul sea la demanda
3
ya que esta accin resultar siempre en menor ganancia que la que resultara si el
propietario elige la accin a , esto es, pedir 200 tenidas. Por consiguiente la accin a
2 3
es dominada por a , dejando al propietario que decida entre a y a .
2 1 2
2. Maximin: Wald. El criterio maximin (o criterio del pesimismo) fue sugerido por
AbrahamWald. Bajo este principio, el tomador de decisiones supone que una vez que
l ha elegido un curso de accin, la naturaleza sera malevolente (con una probablidad
implcita de 1) y por tanto seleccionara el evento que minimizara el pago del tomador
de decisiones. Wald sugiri que el tomador de decisiones debera elegir un curso de
accin de tal manera que recibiera un pago tan grande como fuera posible bajo estas
circunstancias. En otras palabras, esto equivale a escoger "lo mejor de lo peor" o
maximizar el mnimo.
El resultado de aplicar este criterio al propietario de la tienda de artculos de tenis se
muestra a continuacin (la accin a es dominada, por consiguiente ya no se puede
3
considerar como una accin viable).

a : pedir 100 150
a : pedir 200 0
Accin Pago mnimo
1
2
Por lo tanto, la mejor accin, suponiendo que la naturaleza ser siempre malevolente,
es escoger a1: pedir 100, puesto que esta accin tiene el pago mximo mnimo.
Este criterio es ultraconservador, puesto que descansa sobre lo peor que Observacin.
podra suceder. Un hombre de negocios que siga el maximin preferira dejar los
negocios puesto que en la mayor parte de las cosas perdera dinero. A pesar de los
comentarios negativos que haya sobre el criterio maximin hay situaciones, por ejemplo
en teora de juegos, en donde parece ser un buen mtodo para elegir una estrategia.
3. Maximax. Si el maximin es extremadamente pesimista, el maximax es superoptimista.
Este criterio lo apetecen personas altamente aventureras. El maximax escoge el acto
que es el "mejor de lo mejor". Esto es equivalente a elegir una accin cuya mejor
consecuencia sea tan buena como la mejor consecuencia de cualquier otra accin. En
nuestro ejemplo, el maximax sera elegir a : pedir 200.
2

a : pedir 100 200
a : pedir 200 600
Accin Pago mximo
1
2
Las crticas a este criterio son similares a las del maximin.Nadie recomienda seriamente
el maximin como un buen criterio de eleccin, puesto que ignora las prdidas y no
considera las oportunidades de ocurrencia de los diferentes eventos posibles.
4. Criterio de Hurwicz-Indice . Este criterio introduce lo que se denomina un
coeficiente de optimismo , que no es ms que una percepcin del tomador de
decisiones acerca del valor de probabilidad o peso que l asignara tanto al mayor como
al menor pago que recibe cuando elige una accin. Lo anterior le permite calcular el
valor esperado de cada accin considerando slo los pagos mencionados.
Posteriormente elige aquella accin que resulte con un mayor valor esperado. Por
ejemplo, si el toma un coeficiente de optimismo , implcitamente l tiene asignada una
1
3
probabilidad de a su pago mximo y una probabilidad a su pago mnimo. En
1 2
3 3
general, para elegir la mejor accin bajo estas condiciones se considera
H = C (1 )C
i :aa :i:

y seleccionar el mayor valor de , en donde en el segundo miembro aparecen las H
i
cantidades mxima y mnima referidas a los pagos recibidos. Un valor de cercano a
1 refleja un tomador de decisiones optimista, puesto que cuando =1, Hurwicz es el
mismo mximo. Un valor de cerca de refleja una actitud neutral hacia el destino.
1
2
Los resultados de aplicar el criterio de Hurwicz ( = ) a nuestro problema ejemplo son
1
3
los siguientes:

a : pedir 100 200 150 ( )(200)+( )(150)=167
a : pedir
Accin Pago Esperado

1
1 2
3 3
2
200 600 0 ( )(600)+( )(0) =200
1 2
3 3
As, a : pedir 200 debera elegirse. Las dificultades obvias de este criterio comprenden:
2
(1) la dificultad para asignar un valor especfico de .
(2) el ignorar los valores de las consecuencias intermedias para cada accin cuando
existen ms de dos eventos, y
(3) la inhabilidad para elegir una accin particular cuando todas las acciones tienen las
mismas consecuencias peores y mejores.
5. Pesar minimax o criterio de Savage. Savage sealaba que despus de que se ha
tomado una decisin y de que ha ocurrido un evento, el tomador de decisin puede
experimentar pesar debido a que conoce qu evento ha ocurrido y desea quizs haber
seleccionado una accin diferente. Savage propuso que el tomador de decisiones deba
intentar minimizar su pesar mximo. El criterio de Savage requiere el desarrollo de una
o de y el uso del minimax para seleccionar matriz de pesar prdida de oportunidad
una accin. El pesar se define como la diferencia entre el pago actual y el pago
que uno habra recibido si uno supiera el evento que iba a acurrir.
Para utilizar el criterio del pesar minimax, primero convertimos la en matriz de pago
una Esto se hace quitando en cada entrada de la matriz correspondiente de pesar.
matriz de pago la entrada ms en su columna. La entrada ms grande tendr grande
pesar cero. La matriz resultante se denomina una matriz de pesar o una matriz de
prdida de oportunidad.
Las tablas siguientes muestran la matriz de pago, la matriz de pesar y la conclusin para
nuestro problema ejemplo.
Matriz de Pago. Matriz de Pesar.
Demanda
Accin


1 2 3
: 100 : 150 : 200
a1: pedir 100 200 175 150
a2: pedir 200 0 300 600
: 100 : 150 : 200
a1: pedir 100

Demanda
Accin
1 2 3
0 125 450
a2: pedir 200 200 0 0
Pesar mximo
Accin (Prdida de oportunidad)



a 450
a
1
2
200
Aplicando la definicin de pesar podemos considerar a modo de ejemplo algunos
valores de la matriz de pesar. Si se piden 100 unidades (a ) y la demanda es de 150
1
unidades ( ), entonces su pesar es de 125 puesto que se habran obtenido 125 ms
2
pidiendo 200 unidades si se hubiese sabido de antemano que la demanda sera en
realidad de 150 unidades. Si, sin embargo, se hubiesen ordenado 200 unidades (a ) y la
2
demanda fuera de 150 unidades ( ), su pesar sera cero, puesto que no se habra
2
elegido una accin mejor si se hubiera conocido por adelantado que la demanda sera
de 50 unidades. La accin ptima bajo este criterio es a , esto es, pedir 200.
2
En el caso de que la tabla original estuviera en trminos de , Nota. prdidas (costos)
uno escogera la menor prdida para cada evento y la restara de cada entrada fila.
Cada entrada en la tabla de pesar es ahora, la prdida de oportunidad asociada con la
combinacin acto-evento. Las celdas donde apareca antes la menor prdida, muestran
ahora ceros. Aqu el criterio minimax se aplica como antes.
Criterios de eleccin probabilsticos. Los dos criterios que nos restan por discutir tienen una
distribucin de probabilidad asociada con los eventos. Ambos criterios utilizan el , valor esperado
esto es, en donde se asigna una accin o estrategia se calcula un valor esperado, a partir de las
consecuencias y pagos junto con las probabilidades asignadas a los eventos. Cada mtodo de valor
esperado dice seleccionar una accin, cuyo valor esperado es al menos tan grande (pequeo, si se
trabaja con prdidas) como el valor esperado de otra accin.
Criterio de Laplace. Si ignoramos completamente el evento que ocurrira, podramos proceder
como si , esto es, asignar a cada evento la misma todos los estados fueran igualmente posibles
probabilidad, calcular el pago (prdida) esperado para cada acto y elegir el acto con el mayor
(menor) pago (prdida) esperada. As, trataramos el problema como si tuviramos una
distribucin de probabilidad uniforme sobre los eventos y si los pagos fueran expresados en
trminos de utilidad, resolveramos el problema encontrando una accin que maximiza la utilidad
esperada.
El nombre de este mtodo es debido al matemtico , que present el punto de vista de que Laplace
cuando uno se enfrenta a un conjunto de eventos y tiene suficiente razn para suponer que uno
ocurrir en lugar del otro, los eventos deben considerarse igualmente probables.
Para nuestro problema, las probabilidades asignadas a cada evento seran (tres eventos). Luego,
1
3
el valor esperado VE, para cada accin, es entonces
VE a =( )(200)+( )(175)+( )(150) =175 [ [
1
1 1 1
3 3 3
VE a =( )(0) +( )(300)+( )(600) =300. [ [
2
1 1 1
3 3 3
Por consiguiente, el criterio de Laplace elegira a , pues tiene el valor esperado ms alto.
2
Cuando pensamos en asignar probabilidades a los eventos, es generalmente raro que estemos
ignorando completamente la situacin: por tanto, no le daremos a cada evento la misma
probabilidad de ocurrencia. En estas situaciones, el criterio de Laplace sera inadecuado y uno
naturalmente debe utilizar el mtodo ms general del valor esperado.
Maximizacin del Valor Esperado. (MVE). Como se indic previamente, el criterio del mximo
valor esperado dice lo siguiente:
1. Asigne una probabilidad a cada evento de tal manera que las probabilidades sumen 1.
2. Calcule el valor esperado de cada accin multiplicando cada valor por su
probabilidad correspondiente y sumando estos productos;
3. Elija una accin cuyo valor esperado sea el mayor.
En otras palabras, "el valor esperado de un acto" es el promedio ponderado de los pagos bajo el
acto, en donde los pesos son las probabilidades de los eventos mutuamente excluyentes que pueden
ocurrir. En un problema de decisin realista sera razonable suponer que un tomador de decisiones
tendra alguna idea de la posibilidad de ocurrencia de los diversos eventos y este conocimiento le
ayudara a elegir un curso de accin.
Para ilustrar los clculos utilizando el criterio del MVE supongamos que el propietario de la tienda
de tenis (con base a datos pasados, experiencia e instinto) asigna la siguiente distribucin de
probabilidades subjetiva a los eventos:

: demanda es 100 0.5
: demanda es 150 0.3
: demanda es 200 0.2
Evento Probabilidad, p( )

1
2
3
El valor esperado del propietario para cada acto se muestra en las siguientes tablas. Veremos que
al utilizar el criterio MVE, el propietario de la tienda de tenis elige a : pedir 200 tenidas con un
2
valor esperado de 210.
Acto a : Pedir 100 unidades
Evento
1
Prob. Utilidad Util. Pond.
: demanda es 100 0.5 200
1
100.0
: demanda es 150 0.3 175 52.5
: demanda es 200 0.2 150 30.0
Utili

2
3
dad esperada =182.5
Acto a : Pedir 200 unidades
Evento
2
Prob. Utilidad Util. Pond.
: demanda es 100 0.5 0
1
0
: demanda es 150 0.3 300 90
: demanda es 200 0.2 600 120
Ut

2
3
ilidad esperada = 210
Debe hacerse nfasis que en las consecuencias y probabilidades de los eventos pueden interpretarse
como . Las representan cantidades objetivas o subjetivas consecuencias (valores) objetivas
"fsicas" tales como unidades monetarias, unidades de tiempo, etc. Las consecuencias (valores)
subjetivas representan las preferencias relativas del tomador de decisiones, o los valores de las
consecuencias correspondientes. Se denominan "subjetivas" puesto que sus entradas estn
directamente relacionadas con las preferencias del tomador de decisiones, en la situacin de un
problema particular.
Minimizacin de la Prdida de Oportunidad Esperada. Un concepto til en el anlisis de
decisiones bajo incertidumbre es el de la que se ha descrito "prdida de oportunidad"
previamente cuando se discuti el criterio del pesar minimax de Savage. El clculo de la prdida
de oportunidad esperada, (POE), se hace de manera completamente anloga al clculo del valor
esperado. Esto es, utilizamos las probabilidades de los eventos como ponderadores y determinamos
la prdida de oportunidad promedia para cada acto que tenga el POE. mnimo
El clculo de las POE para las dos acciones del propietario de la tienda de tenis se da en las
siguientes tablas basndose en la Si se tabla de prdida de oportunidad o matriz de pesar.
selecciona el acto que minimiza el POE escoger a : pedir 200 unidades.
2

Prob. Prd. de Oportunidad Prd. Pond. de O
Acto a : Pedir 100 unidades
Evento
1
portunidad
: demanda es 100 0.5 0 0.0
: demanda es 150 0

1
2
.3 125 37.5
: demanda es 200 0.2 450
3
90.0
POE a =127.5 [ [
1

Prob. Prd. de Oportunidad Prd. Pond. de O
Acto a : Pedir 200 unidades
Evento
2
portunidad
: demanda es 100 0.5 200 100.0
: demanda es 150 0.3

1
2
0 0.0
: demanda es 200 0.2 0
3
0.0
POE a =100.0 [ [
2
Observacin. Se puede notar que este el mismo acto que l seleccion bajo el criterio del MVE. Se
ha probado que la mejor accin de acuerdo al criterio del MVE es tambin la mejor utilizando
la minimizacin del POE. Tambin debe notarse que la prdida de oportunidad no son prdidas
contables, sino que representan las oportunidades que se han escapado.
Valor Esperado de la Informacin Perfecta. (VEIP). Hasta este punto, hemos considerado
situaciones en las cuales el tomador de decisiones elige varios cursos de accin con base en la
informacin que posee (esto es, su ) sin intentar adquirir informacin posterior informacin previa
antes de que tome su decisin. Las probabilidades utilizadas para calcular el valor esperado de la
accin, como se mostr en la tabla de utilidades esperadas por ejemplo, se denominan
probabilidades previas (a priori) para indicar que representan probabilidades establecidas antes de
obtener informacin adicional por medio de pruebas, experimentos o muestreo. La eleccin de una
accin ptima basada en el MVE se le denomina a menudo anlisis previo.
Posteriormente consideramos el hecho de decidir si vale la pena o no de reunir informacin
adicional ( la cual si acaso es raramente confiable ) y si es del caso qu informacin recoger y qu
acciones tomar basados en la accin recibida. Antes de
contestar esta pregunta, es primero deseable preguntar "cul es el valor de la informacin
perfecta?". Supongamos que en nuestro problema del dueo de la tienda de tenis, la informacin
perfecta sobre la demanda de una tenida de tenis representa 100 y que la encuesta en consideracin
cuesta 200. En este caso, no realizaramos la encuesta, pues hara irracional pagar 200 por una
informacin que representa 100. Para hacer estos juicios necesitamos determinar el valor
esperado de la informacin perfecta ( VEIP ). Veremos dos maneras de calcular el VEIP.
Mtodo-1. el valor esperado bajo certeza Primero calculamos (esto es, teniendo informacin
perfecta) y se lo restamos (la mejor accin elegida al valor esperado bajo incertidumbre
utilizando MVE). Primero decimos que bajo certeza, tomaramos laccin a en nuestro ejemplo de
2
la tienda de tenis y obtendramos un MVE de
(0.5)(0) +(0.3)(300) +(0.2)(600) =210
de acuerdo con los datos de la tabla de utilidades. Este es el valor esperado bajo incertidumbre.
Para obtener el valor esperado bajo cereteza, nos preguntamos "cul es su valor esperado si
podemos escoger su accin de conocer el evento verdadero (demanda), esto es, despus de despus
obtener informacin perfecta?". Claramente, la disponibilidad de la informacin perfecta nos
permite obtener una ganancia de 200 si se obtiene, puesto que eligiramos la accin a sobre la
1 1
a en esta situacin. Si se obtiene alcanzaramos una ganancia de 300 puesto que la accin a se
2 2 2

prefirira sobre a . Y, similarmente, si supiramos que es la accin que ocurre, obtendramos


1 3

una ganancia de 600 puesto que escogeramos a sobre a . Para entender y calcular el valor
2 1
esperado bajo certeza es necesario adoptar el punto de vista defrecuencia relativa a largo plazo.
Lo anterior indica que debemos ponderar cada una de estas ganancias con las probabilidades
previas de cada uno de estos eventos ocurra. En otras palabras, desde el punto de vista de
frecuencia relativa, estas probabilidades son interpretadas como la proporcin de veces que un
predictor perfecto pronosticara que cada uno de los eventos ocurrira si a la situacin actual nos
enfrentramos repetidamente. Cada vez que el predictor realiza un pronstico el tomador de
decisiones elige la accin de pago ptima.
El clculo de la probabilidad esperada con informacin perfecta se muestra en la siguiente tabla y
es igual a 310. Luego, el VEIP es 310-210=100. esto es, la ganancia esperada (promedio) que se
obtendra si el propietario de la tienda de artculos de tenis tuviera informacin perfecta sobre la
demanda futura.
VEIP = VE(Bajo certeza) - VE(Bajo incertidumbre)
Clculo de la ganancia esperada bajo certeza.
Evento (Demanda)
p( )=0.5 p( )=0.3
1 2
p( )=0.2
: 100 : 150 : 200
a : pedir 100


3
1 2 3
1
Accin


200 * 175 150
a : pedir 200 0
2
300 * 600 *
Ganancia esperada bajo certeza=(200)(0.5) +(300)(0.3) +(600)(0.2)
(*) indica consecuencias ptimas ( y acciones) para un evento dado.
Mtodo-2. La prdida de oportunidad esperada (POE) de elegir la accin ptima bajo condiciones
de incertidumbre en el problema del propietario de la tienda de tenis tambin se mostr
anteriormente que era igual a 100. Esta cantidad representa el valor mnimo entre las prdidas de
oportunidades asociadas con cada accin. Este valor es igual al VEIP.
Para ver intuitivamente esto, consideremos cul sera la POE bajo informacin perfecta; que sera
igual a cero. Esto es, no habra prdida de oportunidad si el tomador de decisiones supiera qu
evento ocurrira y se comportara racionalmente. As, bajo incertidumbre, hara lo mejor que podra,
esto es, minimizar su POE.
Se ha probado matemticamente que VEIP=POE de la acin ptima bajo incertidumbre. Otro
trmino utilizado para el POE de la accin ptima bajo incertidumbre es el costo de la
incertidumbre. Este trmino enfatiza el costo de tomar la mejor decisin bajo incertidumbre, que
sera eliminada si la informacin perfecta se conociera.
As, el costo de la incertidumbre, sera igual al VEIP. En resumen, VEIP, POE de la accin
ptima bajo incertidumbre y el costo de la incertidumbre son equivalentes.
Es interesante notar que es el VE (valor esperado) ms el POE es constante para todos los actos, y
su suma, que es 310 en nuestro ejemplo, es el VE bajo certeza.
Observemos que en la tabla siguiente que la accin a tiene el mximo VE y el mnimo POE.
2

a a
VE 182.5 210
POE 127.5 100 *
310 ** 310 **
Acto
Criterio
1 2
(*) : Mnimo POE, que es igual al VEIP.
: Valor esperado bajo certeza. (**)
Por medio de un razonamiento similar podemos definir lo que entendemos por el trmino ms
general "valor de la informacin".
Especficamente, lo anterior indica que este es el valor esperado de la accin ptima bajo un mejor
estado de la informacin (esto es, despus de recibir informacin adicional) menos el valor
esperado de la accin ptima dado el estado de la informacin presente (previa). Es una medida de
mejoramiento de la decisin como resultado de la nueva informacin. Se puede decir ms sobre
esto cuando se trata el tema de si se compra o no ms informacin. En resumen el VEIP sirve como
una medida burda para determinar si vale o no la pena comprar informacin o de analizar si vale la
pena hacer eso.
Arboles de decisin. Una manera alterna de estructurar un problema de decisin grficamente es
en trminos de un diagrama de rbol o de un rbol de decisin.
Un muestra cronolgicamente la secuencia de acciones y resultados a medida rbol de decisin
que se desenvuelven. Un rbol de decisin para el problema del propietario de la tienda de tenis se
presenta en la Fig.-1.
Fig.-1. Arbol de decisin para el propietario de la tienda de artculos de tenis.
Accin Estado (demanda) Pagos

Nota. cuadrado decisin crculo El nodo sealado con un indica y el nodo sealado con un denota
un evento.
La primera ramificacin (nodo) corresponde a la accin elegida por el tomador de decisiones y la
segunda corresponde al evento. Los nmeros al final de estas ramas terminales son los pagos
correspondientes (en forma alterna, se pueden usar prdidas en
lugar de pagos). Por ejemplo, el propietario puede seguir la rama a o la rama a (recordemos que
1 2
a fue dominada y por consiguiente eliminada). Suponiendo que l siguiera la ruta a , llega a otra
3 1
unin, que es un ramal de posibilidad. La posibilidad determinar si el evento que ocurrir ser ,
1

2 3 1
. Si la posibilidad lo conduce a el pago terminal es 200; los pagos corespondientes se
indican para otras rutas. Una interpretacin anloga es vlida si se escoge la rama a . As, el
2
diagrama de decisin ilustra la esytructura bsica de un problema de decisin en forma
esquemtica. En la figura dada se sobrepone la informacin adicional en el diagrama para
representar al anlisis y la solucin del problema.
El proceso de anlisis de decisin representado en la figura anterior se denomina inducccin
regresiva. Nos imaginamos localizados en el costado derecho del diagrama rbol, en donde estn
los pagos. Cosideremos primero las rutas superiores del rbol denotadas por , y . A la
1 2 3
derecha de estos smbolos entramos las asignaciones de probabilidad respectivas 0.5, 0.3 y 0.2
dadas en el problema original. Estas representan las probabilidades asignadas por azar a estas tres
rutas siguientes, despus que el tomador de decisiones ha seleccionado la accin a . Regresando al
1
nodo de probabilidad del cual emanan estas tres rutas, calculamos el de valor monetario esperado
estar localizado en ese nodo. El valor monetario esperado es 182.5 y se calcula de la manera usual,
esto es,
(0.5)(200) +(0.3)(175) +(0.2)(150) =182.5.
Este valor se entra en el nodo de posibilidad bajo discusin. El representa el valor de permanecer
en el nodo despus de elegir la accin a , pues hay posibilidad de elegir cualquiera de las tres rutas.
1
La figura anloga que se presenta en el nodo de posibilidad inferior es 210. Por tanto,
imaginmonos como si hubiramos vuelto al nodo 1 en donde el representa un nodo en el cuadrado
cual el tomador de decisiones puede tomar una eleccin, tenemos la alternativa de seleccionar la
cin a o la accin a . Cada una de estas acciones nos conduce a una ruta final en la cual existe
1 2
una opcin de riesgo cuya ganancia esperada se ha indicado. Debido a que al seguir la ruta a se
2
obtiene un pago esperado ms alto que a , bloqueamos (utilizando una raya doble) como un curso
1
de accin que no es ptimo. Esto se indica en la figura dada con dos lneas verticales. Por
consiguiente, a es el curso de accin ptimo y tiene el pago esperado indicado de 210.
2
As, el diagrama del rbol de decisin reproduce en forma esquemtica compacta el anlisis de la
tabla de utilidades esperadas. Un diagrama anlogo se puede construir en trminos de la prdida
de oportunidad. Sin embargo, es mucho ms comn utilizar diagramas de rboles para graficar
anlisis en trminos de pagos que por prdidad de oportunidad.
Los diagramas de rboles son particularmente tiles para representar problemas complejos en toma
de decisiones con secuencias de acciones y eventos en el tiempo como se podr ver posteriormente,
pues es ms conveniente adicionar ramas y nodos en el diagrama. Estos problemas complejos son
difciles de representar claramente en forma tabular (matriz).
MRM/mrm
29-Oct-13.-