Está en la página 1de 24

TEORIA DE DECISIONES

UNIDAD V DECISIONES BAJO INCERTIDUMBRE

Prof.: José Alexis Lagos Vivas

UTILIDADES Y DECISIONES BAJO RIESGO

La utilidad es una manera alternativa de medir el aspecto atractivo del


resultado de una decisión. En otras palabras, es una manera alternativa de
encontrar los valores a llenar en una tabla de retribuciones.

La utilidad es una medida de la valía total de un resultado particular; refleja la


actitud del tomador de decisiones hacia una colección de factores, como las
ganancias, las pérdidas y los riesgos.

En la figura se muestra una función de utilidad común U (M) de la cantidad de


dinero M.

La figura indica que un


individuo que tiene esta
función de utilidad valora la
obtención de 30 000 dólares
en el doble que 10.000
dólares y valoraría la
obtención de 100.000
dólares en el doble que
obtener 30.000.

Esta preferencia refleja el


hecho de que las
necesidades de más alta
prioridad de una persona quedarían satisfechas con los primeros 10.000 dólares.
Cuando la pendiente de la función disminuye conforme aumenta la cantidad de
dinero se dice que existe una utilidad marginal decreciente del dinero. Se dice que
este individuo tiene aversión al riesgo.

Sin embargo, no todas las personas muestran una utilidad marginal decreciente
del dinero. Algunas buscan el riesgo en lugar de sentir aversión al riesgo y van
por la vida buscando el “premio mayor”. La pendiente de su función de utilidad
aumenta a medida que la cantidad de dinero crece, de manera que tienen una
utilidad marginal creciente del dinero.

El caso intermedio es un individuo neutral al riesgo, que aprecia el dinero por lo


que vale. La función de utilidad de este individuo es proporcional a la cantidad de
dinero involucrada. Aunque algunas personas parecen neutrales al riesgo cuando
se trata de pequeñas cantidades, no es usual que sean en verdad neutrales al
riesgo con grandes sumas.

También es posible mostrar una mezcla de estos tipos de comportamiento. Por


ejemplo, un individuo puede en esencia ser neutral al riesgo con poco dinero,
convertirse en un buscador de riesgo con cantidades moderadas y sentir aversión
al riesgo ante las grandes sumas. Además, la actitud hacia el riesgo puede
cambiar con el tiempo y las circunstancias.

La actitud de un individuo hacia el riesgo si se trata de las finanzas personales


puede diferir de cuando se toman decisiones dentro de una organización. Por
ejemplo, los administradores de una empresa deben considerar las circunstancias
de la compañía y la filosofía colectiva de la alta administración para determinar la
actitud adecuada ante el riesgo para tomar esas decisiones gerenciales.

El hecho de que distintas personas tienen funciones de utilidad del dinero


diferentes tiene una aplicación importante para el tomador de decisiones frente a
la incertidumbre.

Cuando la función de utilidad del dinero se incorpora en un enfoque de análisis


de decisiones con respecto a un problema, esta función de utilidad debe
construirse de manera que se ajuste a las preferencias y valores del tomador de
decisiones. (Éste puede ser un solo individuo o bien un grupo de personas.)

Esta situación ilustra el hecho de que el criterio del rendimiento esperado no


siempre suele ser el más idóneo o mejor dicho “el más aceptable” porque el
riesgo inherente hace que la decisión deje de lado el rendimiento esperado.

Considere una urna que contenga 99 bolas blancas y 1 bola negra. A usted se
le ofrece la oportunidad de jugar un juego en el que debe sacarse una bola de esta
urna. Cada bola tiene las mismas posibilidades de ser sacada que las demás. Si
se saca una bola blanca, usted debe pagar $10,000. Si se saca la bola negra,
usted recibe $1,000,000. Usted debe decidir si juega o no. La tabla de
retribuciones, basada en el flujo de efectivo neto, aparece en la tabla siguiente:

Ahora utilizaremos la
información de esta
tabla, junto con el
hecho de que las
probabilidades de cada
bola blanca y la bola
negra son,
respectivamente, 0,99 y 0,01, para calcular el rendimiento esperado de cada
decisión (jugar o no jugar) de la manera usual.

Dado que RE (jugar)

> RE (no jugar),

debemos juzgar si
aplicamos el criterio de
maximizar el flujo de efectivo neto esperado.

Ahora pregúntese si usted decidiría jugar este juego. Recuerde que existe una
probabilidad de 0,99 de que usted perderá $10,000. Mucha gente simplemente
encuentra inaceptable este elevado “riesgo hacia abajo”; esto es, no están
dispuestos a aceptar la decisión basada en el criterio de maximizar el flujo de
efectivo neto esperado.

Por lo tanto, una vez más vemos en un ejemplo simple que es necesario tener
cuidado al seleccionar el criterio adecuado. Esto es más válido si se trata con
complicados modelos de la vida real.

En la gráfica contigua
se muestra un
comportamiento típico
de un decisor adverso
al riesgo en la medida
que las cantidades
aumentan su utilidad
obtenida decrece. Vale
la pena observar dos
características de esta función:

1. Es no decreciente, puesto que más dinero siempre es por lo menos igual de


atractivo que menos dinero.

2. Es cóncava. Un enunciado equivalente es que la utilidad marginal del dinero


es no creciente.

Para abundar en este fenómeno, examinemos la figura Primero, suponga que


tiene $100 y alguien le da $100 adicionales. Observe que su utilidad aumenta
según: U (200) - U (100) = 0,680 – 0,524 = 0,156

Ahora, suponga que comienza con $400 y alguien le da $100 adicionales.


Ahora su utilidad aumenta en: U (500) - U (400) = 0,910 – 0,850 = 0,060

En otras palabras, 100 dólares adicionales son menos atractivos para usted si
tiene $400 en la mano que si comienza con $100. Otra manera de describir este
fenómeno es que en cualquier momento, la ganancia correspondiente a una
cantidad específica de dólares incrementa menos las utilidades que una pérdida
de una misma suma de dólares reduce la utilidades

En las gráficas siguientes se muestran dos comportamientos del decisor que


son importantes de analizar:

La primera es una función propensa al riesgo (convexa), donde la ganancia de


una cantidad específica de dólares incrementa la utilidad más de lo que una
pérdida de la misma cantidad la reduce. Por ejemplo, si usted comienza con $200
y aumenta su acervo en $100 para llegar a $300, su utilidad aumenta en

U(300) - U(200) = 0,590 – 0,260 = 0,330, mientras que si empieza con $200 y
reduce su acervo en $100 para llegar a $100, su utilidad se reduce en:

U(200) - U(100) = 0,260 – 0,075 = 0,185

Por lo tanto, con una función de utilidad propensa al riesgo, un incremento de


$100 aumenta su utilidad más de lo que un decremento de $100 la reduce.

Para la función indiferente al riesgo que se muestra en la figura de la izquierda,


una ganancia o pérdida de una cantidad de dólares específica produce un cambio
de la misma magnitud en su utilidad.

CÓMO CREAR Y UTILIZAR UNA FUNCIÓN DE UTILIDAD


Analizaremos dos métodos para crear la función de utilidad. El primero es un
método más exacto, pero tedioso, en tanto que el segundo es más rápido, dado
que asume una forma predeterminada. El primer método para crear una función
de utilidad como la que se muestra en la figura requiere que el administrador, haga
una serie de elecciones entre un rendimiento seguro y una lotería. En lenguaje
más formal, se requiere que el administrador cree una lotería equivalente.

Método de la lotería equivalente

1. Determine el mayor costo potencial, M = máximum y asígnelo a alguna


utilidad, por ejemplo, U(máximum) = 1. Ò 10

2. Determine el menor costo potencial, M = mínimum y asígnelo a alguna


utilidad más pequeña que la del paso 1, por ejemplo, U (mínimum) = 0.

3. Para determinar la utilidad de otro costo potencial M, al tomador de


decisiones se le ofrecen las dos alternativas hipotéticas siguientes:

A1: Obtener un costo de máximum con una probabilidad p,

Obtener un costo de mínimum con una probabilidad 1 - p

A2. Definitivamente obtener un costo de M.

Pregunta para el tomador de decisiones: ¿Qué valor de p lo hace a usted


indiferente entre estas dos alternativas? La utilidad resultante M es, entonces,

U(M) = p U(máximum) + (1 - p) U(mínimum), que se puede simplificar en U(M)


= p, si U(mínimum) = 0, U(máximum) = 1.

Ahora se puede resumir el papel básico de las funciones de utilidad en un


análisis de decisiones. Cuando la función de utilidad del dinero del tomador de
decisiones se usa para medir el valor relativo de los distintos resultados
monetarios posibles, la regla de decisión de Bayes sustituye los pagos monetarios
por las utilidades correspondientes. Por lo tanto, la acción óptima (o serie de
acciones óptimas) es la que maximiza la utilidad esperada.
Otro ejemplo es el siguiente suponga que hay una probabilidad 50-50 de que
una inversión de $20,000 produzca una retribución de $40,000 o que se pierda. La
retribución esperada asociada es de ($40,000 * 0.5) — ($20,000 * 0.5) = $10,000.
Aunque hay una retribución esperada neta, diferentes individuos interpretan de
forma diferente el resultado. Un inversionista que desea correr el riesgo puede
realizar la inversión con 50% de probabilidades de obtener una retribución de
$40,000. Por el contrario, quizás un inversionista conservador no esté dispuesto a
correr el riesgo de perder $20,000. El concepto de función de utilidad se ideó para
reflejar estas diferencias. La función de utilidad ocupa entonces el lugar del dinero
real en el modelo de toma de decisiones.

¿Cómo se cuantifica la actitud subjetiva ante el riesgo en la forma de una


función de utilidad? En la ilustración anterior de inversión, la mejor retribución es
de $40,000, y la peor de - $20,000. Podemos establecer una escala de utilidad, U,
de 0 a 100 que especifique U (- $20,000) = 0 y U ($40,000) = 100. El valor de U
para un rendimiento de la inversión entre - $20,000 y $40,000 se determina como
sigue: Si la actitud del tomador de decisiones hacia el riesgo es neutra
(indiferente), entonces U puede representarse por medio de una línea recta que
une (0, — $20,000) y (100, $40,000). En este caso, tanto el dinero real como su
utilidad conducen a las mismas decisiones. De manera más general, la función U
puede adoptar otras formas que
reflejan diferentes actitudes hacia
el riesgo. La figura 15.6 ilustra los
casos de los individuos X, Y y Z.
El individuo Y es neutro ante el
riesgo, el individuo X es adverso
al riesgo (o precavido), y el
individuo Z es lo opuesto de X, es
un propenso al riego. La figura
demuestra que para el adverso al
riesgo X, la reducción de la utilidad bc correspondiente a una pérdida de $10,000
es mayor que el incremento ab asociado con una ganancia de $10,000. Lo
contrario funciona para el propenso al riesgo Z donde de > ef. Por lo general, un
individuo puede ser tanto propenso como adverso al riesgo, en cuyo caso la curva
de utilidad seguirá una forma de S alargada.

Curvas de utilidad similares a las demostradas en la figura 15.6 se determinan


“cuantificando” la actitud del tomador de decisiones hacia el riesgo, con diferentes
niveles de efectivo. En nuestro ejemplo, el intervalo deseado es (-$20,000 a
$40,000) con U(-$20,000) = 0 y U($40,000) = 100. Para especificar los valores de
U para valores de efectivo intermedio (por ejemplo,-$10,000, $0, $10,000, $20,000
y $30,000), establecemos una lotería para una suma de efectivo x cuya utilidad
esperada es:

Para determinar U(x), el tomador de decisiones debe formular una preferencia


entre una cantidad de efectivo garantizada x y la oportunidad de jugar una lotería
en la que puede haber una pérdida de -$20,000 con probabilidad (1 - p ) y una
utilidad de $40,000 con probabilidad p. El valor de p refleja la neutralidad del
tomador de decisiones (o indiferencia) hacia el riesgo. Por ejemplo, para x =
$20,000, el tomador de decisiones puede pensar que un efectivo garantizado de
$20,000 y la lotería con p = 0.8 son igualmente atractivos. En este caso podemos
calcular la utilidad de x = $20,000 como U ($20,000) = 100 - (100 * 0.8) = 20,
Observe que los altos valores de p con la misma lotería reflejan la búsqueda del
riesgo (en oposición a la aversión al riesgo). Por ejemplo, con p = 0.2,

U ($20,000) = 100 - (100 * 0.2) = 80

Ejercicios:
Otro enfoque para estimar U(M)

El procedimiento anterior para construir U(M) pide al tomador de decisiones que


tome una decisión difícil varias veces acerca de la probabilidad que lo haría
sentirse indiferente entre dos alternativas. Muchos individuos estarían incómodos
con este tipo de decisiones.

Este enfoque se basa en suponer que la función de utilidad tiene cierta forma
matemática, y después ajustar esta forma de manera que refleje la actitud del
tomador de decisiones hacia el riesgo, lo más cercano posible. Por ejemplo, una
forma común que se puede suponer (por su sencillez) es la función de utilidad
exponencial,

Donde R es la tolerancia al riesgo del tomador de decisiones. Esta función de


utilidad muestra una utilidad marginal decreciente del dinero, por lo que está
diseñada para ajustarse a la aversión al riesgo individual. Una gran aversión al
riesgo corresponde a un valor pequeño de R (que ocasiona que la curva de la
función de utilidad se doble en forma brusca), mientras que una aversión pequeña
corresponde a un valor grande de R (que ocasiona un doblez gradual de la curva).

Desafortunadamente, no es posible usar dos valores diferentes de R para la


misma función de utilidad. Una desventaja de la función de utilidad exponencial es
que supone una aversión al riesgo constante (valor fijo de R), sin que importe
cuánto dinero tiene en la actualidad el tomador de decisiones. En situaciones
donde las consecuencias de pérdidas potenciales no son tan severas, el supuesto
de una función de utilidad exponencial puede proporcionar una aproximación
razonable. En ese caso, existe una manera sencilla (aproximada) de estimar el
valor apropiado de R.

Se pide al tomador de decisiones que elija el número R que le haría sentir


indiferente entre las dos alternativas siguientes.

A1: Un juego de 50-50 donde ganaría R dólares con probabilidad 0.5 y perdería

R/2 dólares con probabilidad 0.5.

A2: No perdería ni ganaría nada.

La segunda manera de determinar proviene de evidencia empírica reunida por


un famoso analista de las decisiones, Ron Howard. El doctor Howard ha sido
asesor de muchas empresas y ha encontrado varias reglas prácticas (ver Howard)
sumamente valiosas, que relacionan los ingresos netos de la compañía, el capital
contable y las ventas netas con el grado de aversión al riesgo, r. Por ejemplo,
encontró que r es aproximadamente igual a 124% de los ingresos netos, a 15.7%
del capital contable y a 6.4% de las ventas netas. En otras palabras, una gran
empresa con ingresos netos de $1,000 millones tendrá una r de 1.24 mil millones,
en tanto que una empresa más pequeña con ventas netas de $5 millones tendrá
una r de 320,000. Por supuesto, se trata sólo de grandes lineamientos, pero
pueden ser muy útiles y de seguro indican la tendencia de las empresas más
grandes a tener valores de r más elevados y una menor aversión al riesgo.

Ejemplo

Retomando el ejemplo del repartidor de periódicos y juzguemos su función de


utilidad. Dado que él posee un negocio muy pequeño, opta por utilizar el método
de la función de utilidad exponencial predeterminada y lleva a cabo la apuesta al
50-50 ya analizada para determinar su valor de r ($100).

El uso de esta nueva función de utilidad exponencial para la toma de decisiones


cuando se conocen las probabilidades de los estados de la naturaleza es un
proceso sencillo. Por ejemplo, la fila 3 (ordenar 2), columna 3 (demanda 2) en la
tabla 10.4 muestra un flujo de efectivo neto de 70. Su hoja de cálculo (que se
muestra en la figura 10.8) traduce esto en una utilidad de aproximadamente 0.50,
que se convierte en una nueva entrada en la fila 3, columna 3. El repartidor de
periódicos ahora procede como anteriormente lo hizo; esto es, calcula la utilidad
esperada para cada decisión. Esto se muestra en la columna F de la figura
anterior.

Podemos ver en la columna F de la figura que, basándose en el criterio de


maximización de la utilidad esperada, el repartidor de periódicos debería ordenar
2 periódicos (tiene la utilidad esperada más elevada, de 0.10).
TEORÍA DE JUEGOS

Esta teoría tiene que ver con situaciones de decisión en la que dos oponentes
inteligentes con objetivos conflictivos (en caso de suma cero) compiten
intensamente para superar al otro. Ejemplos típicos incluyen el lanzamiento de
campañas publicitarias de productos que compiten y estrategias de planeación de
batallas en la guerra.

En un conflicto, cada uno de los dos jugadores (oponentes) tiene una cantidad
(finita o infinita) de alternativas o estrategias. Asociada con cada par de
estrategias está la retribución que un jugador recibe del otro. Tal situación se
conoce como juego de suma cero entre dos personas porque la ganancia de un
jugador es igual a la pérdida del otro. Esto significa que podemos representar el
juego en función de la retribución que recibe un jugador. Designando los dos
jugadores A y B con m y n estrategias, respectivamente, el juego se presenta
usualmente en función de la matriz de retribuciones que recibe el jugador A como

La representación indica que si A


utiliza la estrategia i y B utiliza la
estrategia j, la retribución para A es
aij, y la retribución para B es -aij.

Solución óptima de juegos de


suma cero entre dos personas
Debido a que los juegos de suma
cero o constante implican un conflicto
de intereses, la base para la
selección de estrategias óptimas garantiza que ninguno de los jugadores intenta
buscar una estrategia diferente porque el resultado será una retribución peor.
Estas soluciones pueden ser en la forma de una sola estrategia o varias
estrategias combinadas al azar.

Ejemplo 1
Dos compañías, A y B, venden dos marcas de un medicamento para la gripe.
La compañía A se anuncia en radio (A1), televisión (A2) y periódicos (A3). La
compañía B, además de utilizar la radio (B1), la televisión (B2) y los periódicos
(B3), también envía folletos por correo (B4). Dependiendo de la efectividad de
cada campaña publicitaria, una compañía puede capturar una parte del mercado
de la otra. La siguiente matriz resume el porcentaje del mercado capturado o
perdido por la compañía A.

La solución del juego se basa en el principio de asegurar lo mejor de lo peor


para cada jugador.

Si la compañía A selecciona la estrategia A1, entonces, independientemente de


lo que haga B, lo peor que puede suceder es que A pierda 3% del segmento del
mercado ante B. Esto se representa por medio del valor mínimo de las entradas
en la fila 1.Asimismo, con la estrategia A2, el peor resultado es que A capture 5%
de B, y con la estrategia A3, el peor resultado es que A pierda 9% ante B. Estos
resultados aparecen bajo fila mín. Para lograr lo mejor de lo peor, la compañía A
elige la estrategia A2 porque corresponde a un valor maximin.

Luego, para la compañía B, la matriz de retribuciones dada es para A, la mejor


de la peor solución de B está basada en el valor minimax. El resultado es que la
compañía B elegirá la estrategia B2. La solución óptima del juego exige
seleccionar las estrategias A2 y B2, lo que significa que ambas compañías deben
utilizar la publicidad por televisión. La retribución favorecerá a la compañía A
porque su segmento del mercado se incrementará 5%. En este caso decimos que
el valor del juego es 5% y que A y B están utilizando una solución de punto de
silla.

La solución de punto de silla impide seleccionar una mejor estrategia por parte
de cualquiera de las compañías. Si B cambia de estrategia (B1, B3 o B4), la
compañía A puede seguir con la estrategia A2, lo que resultaría en una pérdida
peor para B (6 u 8%). Por la misma razón, A no buscaría una estrategia diferente
porque B puede cambiar a B3 para obtener 9% de ganancia del mercado si se
utiliza A1, y 3% si se utiliza A3.

La solución de punto de silla óptima de un juego no tiene que ser una estrategia
pura. En su lugar, la solución puede requerir combinar dos o más estrategias al
azar, como lo ilustra el siguiente ejemplo.

Ejemplo 2

Dos jugadores, A y B, juegan a tirar la moneda. Cada jugador, sin saberlo el


otro, escoge cara (H) o cruz (T). Ambos jugadores revelan sus elecciones al
mismo tiempo. Si coinciden (HH o TT), el jugador A recibe $1 de B. De lo
contrario, A le paga $1a B. La siguiente
matriz de retribuciones para el jugador
A da los valores de fila mín. y columna
máx. Correspondientes a las
estrategias de A y B, respectivamente.

Los valores MaxiMin y MiniMax de


los juegos son 2 $1 y $1, respectivamente, y el juego no tiene una estrategia pura
porque los dos valores no son iguales. Específicamente, si el jugador A
selecciona AH, el jugador B puede seleccionar BT para recibir $1 de A. Si esto
sucede, A puede cambiar a la estrategia AT para invertir el resultado al recibir $1
de B. La constante tentación de cambiar de estrategia muestra que una solución
de estrategia pura no es aceptable. Lo que se requiere en este caso es que ambos
jugadores combinen al azar sus estrategias puras respectivas. El valor óptimo del
juego ocurrirá entonces en alguna parte entre los valores MaxiMin y MiniMax del
juego; es decir, valor MaxiMin (menor) <= valor del juego <= valor MiniMax
(mayor)

En el ejemplo de tirar la moneda, el valor del juego debe quedar entre - $1 y +


$1.
Solución de juegos con estrategias combinadas o mixtas

Los juegos con estrategias combinadas pueden resolverse por medio de


métodos gráficos o programación lineal. La solución gráfica es adecuada para
juegos con exactamente dos estrategias puras de uno o ambos jugadores. Por
otra parte, la PL (programación lineal) puede resolver cualquier juego de suma
cero entre dos personas. El método gráfico es interesante porque explica la idea
de un punto de silla visualmente.
Ejemplo 3

Considere el siguiente juego de 2 3 4. La retribución es para el jugador A.


La figura 15.7 muestra
una gráfica creada por TORA
de las cuatro líneas rectas
asociadas con las
estrategias puras de B
(archivo toraExl5.4-3.txt).3
Para determinar la mejor de
la peor solución, la
envolvente inferior de las
cuatro líneas (delineada por
franjas verticales) representa
la retribución mínima (peor)
esperada para A,
independientemente de las
elecciones de B. El máximo (mejor) de la envolvente inferior corresponde al punto
de solución maximin Este punto es la intersección de las líneas asociadas con las
estrategias B3 y B4. La solución óptima del jugador A demanda una combinación
50-50 de A1 y A2. El valor correspondiente del juego, v, se determina sustituyendo
x1 = 0.5 en la función o bien de la línea 3, o de la línea 4, lo cual da

La combinación óptima del jugador B se determina por medio de las dos


estrategias que definen la envolvente inferior de la gráfica. Esto significa que B
puede combinar las estrategias B3 y B4 en cuyo caso y1 = y2 = 0 y y4 = 1 - y3.
En consecuencia, las retribuciones esperadas de B correspondientes a estrategias
puras de A son

La mejor de la peor solución


para B es el punto mínimo de la
envolvente superior de las dos
líneas dadas (será instructivo que trace las dos líneas e identifique la envolvente
superior). Este proceso equivale a resolver la ecuación.

4y3 - 1 = -4y3 + 6
Solución de juegos por medio de programación lineal.

La teoría de juegos está estrechamente relacionada con la PL en el sentido de


que cualquier juego de suma cero entre dos personas puede expresarse como un
programa lineal, y viceversa. De hecho, G. Dantzig (1963, pág. 24) expresa que
cuando J. von Neumann, padre de la teoría de juegos, la introdujo por primera vez
al método simplex en 1947, de inmediato reconoció esta relación y además
precisó y recalcó el concepto de dualidad en la programación lineal. Esta sección
explica cómo se resuelven los juegos mediante PL.

Las probabilidades óptimas del jugador A, x1, x2,…, y xm, pueden determinarse
resolviendo el siguiente problema maximin:
Los dos problemas optimizan la misma variable v (irrestricta), el valor del juego.
La razón es que el problema de B es el dual del problema de A (verifique esta
afirmación por medio de la definición de dualidad del capítulo 4). Esto significa que
la solución óptima de un problema da automáticamente la solución óptima del
otro.
FIN DE LA UNIDAD V