Está en la página 1de 57

Utilidad y Teoría de Juego

• El Significado de Utilidad
• La utilidad y toma de decisión
• Utilidad: Otras Consideraciones
• Introducción a Teoría de Juego
• Juegos de Estrategia mixta
Ejemplo: Swofford, Inc.

Para el próximo año, Swofford tiene tres alternativas de


inversión en bienes raíces y el futuro de los precios de bienes
raíces son inciertos. Los beneficios posibles de inversión están
por debajo.
Estados de Naturaleza
Tabla de resultados
Precios de inmueble:
Aumento Estable bajo
Alternativa de decisión s1 s2 s3

Inversión hecha en A, d1 30,000 20,000 -50,000


Inversión hecha en B, d2 50,000 -20,000 -30,000
No Invierte, d3 0 0 0

Probabilidad 0.3 0.5 0 .2


Ejemplo: Swofford, Inc.

Enfoque de valor esperado (EV)


Si el tomador de decisiones es neutral al riesgo, el enfoque de
valor esperado es aplicable..

EV(d1) = .3(30,000) + .5( 20,000) + .2(-50,000) = $9,000


EV(d2) = .3(50,000) + .5(-20,000) + .2(-30,000) = -$1,000
EV(d3) = .3( 0 ) + .5( 0 ) + .2( 0 ) = $0

 Teniendo en cuenta ningún otro factor, la decisión óptima


parece d1, con un valor monetario esperado de $ 9.000 .......
pero que es?
Ejemplo: Swofford, Inc.

Otras consideraciones:

Actual situación financiera de Swofford es débil.


El presidente de la empresa cree que, si los resultados de las
inversiones próximas dan una pérdida sustancial, el futuro de
Swofford va a estar en peligro.

Es muy posible que el presidente seleccione d2 o d3 para


evitar la posibilidad de incurrir en una pérdida de $ 50.000.
Una conclusión razonable es que, si una pérdida de hasta
30.000 dólares podría llevar a la quiebra Swofford, el
presidente seleccionaría d3, en la creencia de que tanto las
inversiones A y B son demasiado arriesgadas para la situación
financiera actual de Swofford.
El Significado de Utilidad

Las utilidades se utilizan cuando los criterios de decisión


deben estar basados en algo más que los valores
monetarios esperados.
La utilidad es una medida del valor total de un resultado en
particular, lo que refleja la actitud de la toma de decisiones
hacia un conjunto de factores.
Algunos de estos factores pueden ser el beneficio, pérdidas
y riesgos.
Este análisis es especialmente apropiado en los casos en
que los pagos pueden asumir valores extremadamente altos
o extremadamente bajos.
Pasos para Determinar la Utilidad
de Dinero

Paso 1:
Desarrollar una tabla de resultados que utilice valores
monetarios.

Paso 2:
Identificar el mejor y el peor valor y asignar a
Cada cual un valor de utilidad, con
U(Mejor resultado) > U(peor resultado).

Paso 3: Definir la lotería. El mejor resultado se ha obtenido


con probabilidad p; el peor se ha obtenido con
probabilidad (1 – p).
Ejemplo: Swofford, Inc.

Paso 1: Desarrollar tabla de resultados.


Tabla de resultado monetario en la anterior diapositiva.

Paso 2: Asignar valores de utilidad a mejores y peores


resultados. Utilidad de - $50,000 = U(50,000) = 0
Utilidad de $50,000 = U(50,000) = 0
Utilidad de $50,000 = U(50,000) = 10

Paso 3: Definir la lotería.


Swofford Obtiene un resultado de $50,000 con
Probabilidad p y un resultado de - $50,000 con
Probabilidad (1  p).
Pasos para Determinar la Utilidad
de Dinero
Paso 4:
Para cada otro valor monetario M en la tabla de resultados:
4a: Determinar el valor de p tal que el que toma las decisiones
es indiferente entre un pago garantizado de M y la lotería se
define en el paso 3.
4b: Calcular la utilidad de M :
U(M) = pU(mejor resultado) + (1 – p)U(peor resultado)
Ejemplo: Swofford, Inc.

Estableciendo la utilidad para el resultado de $30,000:


Paso 4a: Determinar el valor de p .

Supongamos que cuando p = 0,95, el presidente


es indiferente entre la garantía de
recompensa de 30.000 dólares y la lotería.

Paso 4b: Calcular la utilidad de M .


U(30,000) = pU(50,000) + (1  p)U(50,000)
= 0.95(10) + (0.05)(0)
= 9.5
Pasos para Determinar la Utilidad
de Dinero

Paso 5:
Convertir la tabla de resultados de valores monetarios a valores
de utilidad.
Paso 6:
Aplicar la aproximación de utilidad esperada a la tabla de
utilidad desarrollada en el paso 5, y seleccionar la alternativa
de decisión con la utilidad esperada más alta.
Ejemplo: Swofford, Inc.

Paso 5: Convierte la tabla de resultados a valores de utilidad.

Estados de Naturaleza
Tabla de resultados Precios de inmueble:
Aumenta Se mantiene Baja
Alternativa de decisión s1 s2 s3
Inversión hecha en A, d1 9.5 9.0 0
Inversión hecha en B, d2 10.0 5.5 4.0
No Invierte, d3 7.5 7.5 7.5
Probabilidad .3 .5 .2
Aproximación de Utilidad
esperada

Una vez que una función de utilidad ha sido determinada,


la decisión óptima se puede seleccionar con el enfoque de
la utilidad esperada.
Aquí, para cada alternativa de decisión, la utilidad
correspondiente a cada estado de la naturaleza es
multiplicado por la probabilidad de ese estado de la
naturaleza.
La suma de estos productos para cada alternativa de
decisión representa la utilidad esperada para esa
alternativa.
La alternativa de decisión con la mayor utilidad esperada es
la elegida.
Ejemplo: Swofford, Inc.

Paso 6: Aplicar la aproximación de utilidad esperada.


La utilidad esperada para cada una de las alternativas de
decisión en el problema es:

EV(d1) = .3( 9.5) + .5(9.0) + .2( 0 ) = 7.35


EV(d2) = .3(10.0) + .5(5.5) + .2(4.0) = 6.55
EV(d3) = .3( 7.5) + .5(7.5) + .2(7.5) = 7.50

Considerando la utilidad asociada con cada posible resultado,


la decisión optima es d 3 con una utilidad esperada de 7.50.
Ejemplo: Swofford, Inc.

Comparación de resultados de UE y EV

Alternativa de Utilidad Valor


Decisión Esperada Esperado
No Invierte 7.50 0
Inversión A 7.35 9,000
Inversión B 6.55 -1,000
Evasor de riesgo Versus tomador
de Riesgo

• Un evasor de riesgo tendrá una función de utilidad


cóncava cuando la utilidad se mide en el eje vertical y el
valor monetario se mide en el eje horizontal. Las
personas que presentan la compra de seguros de
riesgos con conducta de evasión.
• Una persona que toma riesgos, como por ejemplo un
jugador, paga una prima para obtener el riesgo. Su / su
función de utilidad es convexa. Esto refleja la toma de
decisiones de aumento del valor marginal del dinero.
• Un fabricante de decisión de riesgo neutral tiene una
función de utilidad lineal. En este caso, el enfoque del
valor esperado se puede utilizar.
Evasor de riesgo versus tomador
de riesgo

• La mayoría de las personas son los evasores de riesgo


de algunas cantidades de dinero, riesgo neutral para
otras cantidades de dinero, y los tomadores de riesgo
para otras cantidades fijas de dinero.
• Esto explica por qué la misma persona va a comprar los
seguros y también un billete de lotería.
Ejemplo de utilidad 1

Considere los siguientes tres estados, de tres


decisiones en la tabla siguiente se pago en dólares:

s1 s2 s3
d1 +100,000 +40,000 -60,000
d2 +50,000 +20,000 -30,000
d3 +20,000 +20,000 -10,000

Las probabilidades para los tres estados de naturaleza


son: P(s1) = .1, P(s2) = .3, y P(s3) = .6.
Ejemplo de utilidad 1

• Riesgo-tomador de Decisión Neutral


Si el tomador de decisiones es neutral al riesgo, el
enfoque de valor esperada es aplicable.

EV(d1) = .1(100,000) + .3(40,000) + .6(-60,000) = -$14,000


EV(d2) = .1( 50,000) + .3(20,000) + .6(-30,000) = -$ 7,000
EV(d3) = .1( 20,000) + .3(20,000) + .6(-10,000) = +$ 2,000

la decision optima es d 3.
Ejemplo de utilidad 1

• Tomador de decisión con Utilidades Diferentes


Suponga que dos tomadores de decisión tienen los
siguientes valores de utilidad.

Utilidad Utilidad
Monto Tomador de desicion I Tomador de desicion II
$100,000 100 100
$ 50,000 94 58
$ 40,000 90 50
$ 20,000 80 35
-$ 10,000 60 18
-$ 30,000 40 10
-$ 60,000 0 0
Ejemplo de utilidad 1

• Grafico de las curvas de Utilidad de los Dos tomadores de Decisión

Utilidad

100 Fabricante de decisión I

80

60

40

20 Fabricante de decisión II

-60 -40 -20 0 20 40 60 80 100


Valor monetario (en $1000 )
Ejemplo de utilidad 1

• Tomador de decisión I
• Tomador de decisión tiene una función de utilidad
cóncava.
• Él es un evasor de riesgo.

• Tomador de decisión II
• Tomador de decisión II tiene función de utilidad convexa.
• Él es un tomador de riesgo.
Ejemplo de utilidad 1

Utilidad esperada del tomador de decisión I


Decision utilidad
optima s1 s2 s3 esperada Mayor
Es d 3 d1 100 90 0 37.0 Utilidad
d2 94 80 40 57.4 esperada
d3 80 80 60 68.0
Prob. .1 .3 .6

Nota: d4 es dominada por d2 y por lo tanto no se considera

Tomador de decisión optara por demanda 3


Ejemplo de utilidad 1

• Utilidad esperada: tomador de Decisión II

Utilidad
Decision
optima s1 s2 s3 esperada
Es d 1 d1 100 50 0 25.0 Mayor
Utilidad
d2 58 35 10 22.3 esperada
d3 35 35 18 24.8
Probabilidad .1 .3 .6

Nota: d4 está dominado por d 2 por lo tanto no se concidera.

tomador de decisión II tendría que tomar decisión d1.


Ejemplo de utilidad 2

Supongamos que las probabilidades para los tres


estados de la naturaleza en el Ejemplo 1 se cambió a:

P (s1) = 0.5, P (s2) = 0,3, y P (s3) = 0,2.

¿Cuál es la decisión óptima para un tomador de decisiones


neutral al riesgo?
¿Cuál es la decisión óptima para el tomador de decisión I?
. . . para tomador de decisión II?
¿Cuál es el valor de este problema de decisión para el
tomador de decisión I? . . . para tomador de decisión II?
¿Qué conclusión se puede sacar?
Ejemplo de utilidad 2

• Tomador de decisión neutral al riesgo

EV(d1) = .5(100,000) + .3(40,000) + .2(-60,000) = 50,000


EV(d2) = .5( 50,000) + .3(20,000) + .2(-30,000) = 25,000
EV(d3) = .5( 20,000) + .3(20,000) + .2(-10,000) = 14,000

la decisión optima neutral al riesgo es d 1.


Ejemplo de utilidad 2

• Utilidad esperada: tomador de decisión I

UE(d1) = .5(100) + .3(90) + .2( 0) = 77.0


UE(d2) = .5( 94) + .3(80) + .2(40) = 79.0
UE(d3) = .5( 80) + .3(80) + .2(60) = 76.0

la decisión optima del tomador de decisiones es d 2.


Ejemplo de utilidad 2

• Utilidad esperada: Tomador de decision II

UE(d1) = .5(100) + .3(50) + .2( 0) = 65.0


UE(d2) = .5( 58) + .3(35) + .2(10) = 41.5
UE(d3) = .5( 35) + .3(35) + .2(18) = 31.6

decisión optima tomador de decisiones II d1


Ejemplo de utilidad 2

Valor del Problema de Decisión: Tomador de decisión I

• Tomador de decisión ,utilidad optima esperada es 79.


• Asigne una utilidad de 80 a +$20,000, y una utilidad de
60 a -$10,000.
• Interpolando linealmente en el rango de 1 el valor de
$30,000/20 = $1,500.
• Así una utilidad de 79 tiene un valor de $20,000 - 1,500
= $18,500.
Ejemplo de utilidad 2

• Valor del problema de decisión: Tomador de decisión II

Decisión optima del tomador II utilidad esperada es de


65 .
Se le asigna una utilidad de 100 a 100.000 dólares, y
una utilidad de 58 a 50.000 dólares.
En este rango, 1 punto vale $ 50,000 / 42 = $ 1190.
Así, una utilidad de 65 es un valor de $ 50.000 + 7 (1190)
= $ 58.330.

El problema de decisión es el más valioso de la


Decisión
tomador II (desde $ 58.330> $ 18.500).
Valor Monetario esperado
Versus Utilidad esperada

El valor monetario esperado y la utilidad esperada siempre


dirigirán a recomendaciones idénticas si el tomador de
decisión es neutral al riesgo.
Este resultado es generalmente el caso de la toma de
decisiones es casi neutral al riesgo en todo el rango de
pagos en el problema..
Valor Monetario esperado
Versus Utilidad esperada

Generalmente, cuando las ganancias caen en un rango


"razonable" , quienes toman las decisiones expresan
preferencias que están de acuerdo con el método del valor
monetario esperado.
Los resultados caen en un rango "razonable" cuando el
mejor no es demasiado bueno y lo malo no es tan malo.
Si el tomador de decisiones no siente que los beneficios son
razonables, un análisis de la utilidad debe ser considerada.
Introducción a Teoría de Juego

En el análisis de decisión, el encargado de tomar


decisiones solo busca seleccionar una alternativa
óptima.
En la teoría de juegos, hay dos o más tomadores de
decisiones, son llamados jugadores , que compiten
como adversarios entre sí.
Se supone que cada jugador tiene la misma
información y se seleccionará la estrategia que
proporciona el mejor resultado posible desde su
punto de vista.
Continúa
Introducción a Teoría de
Juegos

Cada jugador elige una estrategia independiente, sin


conocer de antemano la estrategia del otro jugador
(s).
La combinación de las estrategias que compiten
proporciona el valor del juego para los jugadores.
Entre los ejemplos de jugadores que compiten son
los equipos, ejércitos, empresas, candidatos
políticos, y los licitadores de contratos.
Dos-Personas Juego de Suma
Cero

Dos personas significan que hay dos jugadores que


compiten en el juego.
De suma cero significa que la ganancia (o pérdida)
de un jugador es igual a la correspondiente pérdida
(o ganancia) para el otro jugador.
La ganancia y pérdida de equilibrio de modo que
hay una suma cero para el juego.
Lo que un jugador gana, el otro jugador pierde.
Dos-Personas Juego de
Suma Cero Ejemplo

La competencia por las ventas de vehículos


Supongamos que sólo hay dos vehículos en el
concesionario para el envío en una ciudad pequeña.
Cada concesionario está considerando
tres estrategias que se han diseñado para tener
ventas de vehículos nuevos de la concesionaria a
través de un cuatrimestre.
Las estrategias, que se supone la misma para ambas
representaciones, se encuentran en la siguiente
diapositiva.
Dos-Personas Juego de Suma
Cero Ejemplo

Elecciones de estrategia

 Estrategia 1: Oferta reembolso en efectivo para un


vehículo nuevo
 Estrategia 2: Oferta equipamiento opcional libre en un
Vehículo nuevo.
 Estrategia 3: Oferta de un préstamo 0% en un vehículo
nuevo.
Dos-Persona Juego de Cero
Sumas Ejemplo
Matriz de pagos: Número de Ventas de Vehículo
Obtenido por Semana por concesionario A
O Perdido por Semana por el Concesionario B
Concesionario B

Reemb. Equip 0%
efectivo Libre Préstamo
Concesionario A
B1 b2 b3

Reemb. efect. a1 2 2 1
Equipamiento libre a2 -3 3 -1
Préstamo 0% a3 3 -2 0
Dos-Personas Juego de Suma
Cero Ejemplo

Paso 1: Identificar el mínimo resultado para cada


Fila (para Jugador A)
 Paso 2: Para Jugador A, seleccionar la estrategia que
proporciona el máximo de los mínimos de fila
(llamados el máximo).
Dos-Personas Juego de Suma
Cero Ejemplo
Identificando Maximin y mejor estrategia
Jugador B
0 %
Reemb. Eqip.
Préstamo
efectivo Libre b3 Fila
Jugador A b1 b2 Mínimo
Reemb. Efectivo a1 2 2 1 1
Equip. libres a2 -3 3 -1 -3
Préstamo O % a3 3 -2 0 -2

Resultado
Mejor estrategia maximin
Para Jugador A
Dos-Persona Juego de Suma Cero
Ejemplo

Paso 3: Identificar el máximo resultado para cada columna


(Para Jugador B).
Paso 4: Para Jugador B, seleccionar la estrategia que
proporciona el mínimo de los máximos de columna
(Llamado el minimax).
Dos-Personas Juego de Cero
Sumas Ejemplo
Mejor estrategia
Identificando Minimax y mejor estrategia Para Jugador B

Jugador B

Reemb. Equip. Préstamo


efectivo Libre 0%
Jugador A b1 b2 b3
Reemb. efectivo a1 2 2 1
Equip. libres a2 -3 3 -1
Préstamo 0 % a3 3 -2 0
Máximo de columna 3 3 1

Resultado
minimax
Estrategia pura

Siempre que una estrategia pura óptima exista:


el máximo de los mínimos de fila es igual al mínimo de
los máximos de columna (maximin del jugador A es
igual a minimax del jugador B)
el juego se dice que tiene un punto de silla (la
intersección de las estrategias óptimas)
el valor del punto de silla es el valor del juego
ningún jugador puede mejorar su / su resultado al
cambiar estrategias, incluso si él / ella se entera de
antemano de la estrategia del oponente
Ejemplo de Estrategia pura

Punto de silla y Valor del Juego


Jugador B Valor del
El juego es 1
Reemb. Equip. Préstamo
efectivo Libre 0% Fila
Jugador A b1 b2 b3 Mínimo

Reemb. efectivo a1 2 2 1 1
Equip. libre a2 -3 3 -1 -3
Préstamo 0 % a3 3 -2 0 -2
Máximo de columna 3 3 1
Punto de
silla
Ejemplo de Estrategia pura

Resumen de Estrategia pura


Jugador A tendría que escoger Estrategia a1 (oferta
descuento de dinero en efectivo).
Jugador A puede esperar un beneficio de al menos 1
venta de vehículo por semana.
Jugador B tendría que escoger Estrategia b3 (oferta un
0% préstamo).
Jugador B puede esperar una pérdida de 1 vehículo
por semana sin superar esta cifra
Estrategia mixta

Si el valor maximin para el jugador A no es igual al


valor minimax para el jugador B, entonces una
estrategia pura no es óptimo para el juego.
En este caso, una estrategia mixta es mejor.
Con una estrategia mixta, cada jugador cuenta con
más de una estrategia.
Cada jugador debe usar una estrategia de una
parte del tiempo y otras estrategias el resto del
tiempo.
La solución óptima es la frecuencia relativa con la
que cada jugador debe usar sus posibles
estrategias.
Ejemplo de Estrategia mixta

Considerar lo siguiente: juego de dos-personas de suma


cero. El maximin no igual al minimax. no hay una
estrategia optima pura.

Jugador B
Fila
Jugador A b1 b2 Mínimo
Maximin
a1 4 8 4
a2 11 5 5
Columna
11 8
Máximo Minimax
Ejemplo de Estrategia mixta

p = probabilidad que A selecciona estrategia a1


(1  p) = probabilidad que A selecciona estrategia a2

Si Jugador B selecciona b1:

EV = 4p + 11(1 – p)
Si Jugador B selecciona b2:

EV = 8p + 5(1 – p)
Ejemplo de Estrategia mixta

Para resolver las probabilidades óptimas para el jugador A


nos pusimos los dos valores esperados iguales y despejamos
el valor de p.
4p + 11(1 – p) = 8p + 5(1 – p)
4p + 11 – 11p = 8p + 5 – 5p
11 – 7p = 5 + 3p De ahí,
-10p = -6 (1  p) = .4
p = .6

Jugador A tendría que seleccionar:


Estrategia A1 con un 0.6 de probabilidad y la
estrategia A2 con un .4 probabilidad.
Ejemplo de Estrategia mixta

q = probabilidad que B selecciona estrategia b1


(1  q) = probabilidad que B selecciona estrategia b2

Si el jugador A selecciona a1:


EV = 4q + 8(1 – q)
Si Jugador A selecciona a2:
EV = 11q + 5(1 – q)
Ejemplo de Estrategia mixta

Para resolver las probabilidades óptimas para el jugador B


nos pusimos los dos valores esperados iguales y despejar
el valor de q.

4q + 8(1 – q) = 11q + 5(1 – q)


4q + 8 – 8q = 11q + 5 – 5q
De ahí,
8 – 4q = 5 + 6q (1  q) = .7

-10q = -3
q = .3

Jugador B tendría que seleccionar:


Estrategia b1 con un 0.3 de probabilidad y
Estrategia b2 con un 0.7 de probabilidad.
Ejemplo de Estrategia mixta

Valor del Juego


Beneficio esperado
Por juego
Para Jugador A: Para Jugador A

EV = 4p + 11(1 – p) = 4(.6) + 11(.4) = 6.8

Para Jugador B:
Pérdida esperada
Por juego
EV = 4q + 8(1 – q) = 4(.3) + 8(.7) = 6.8 Para Jugador B
Dominó Ejemplo de Estrategias

Supone que la tabla de resultados para un dos-persona


cero-Juego de suma es el siguiente. Aquí no hay estrategia
pura optima
Jugador B
Fila
b1 b2 b3 Mínimo
Jugador A
Maximin
a1 6 5 -2 -2
a2 1 0 3 0
a3 3 4 -3 -3
Columna
Máximo 6 5 3
Minimax
Dominó Ejemplo de Estrategias

Si un juego es más grande que 2 x 2 se tiene una


estrategia mixta, primero buscamos dominó estrategias
para reducir la medida del juego.
Jugador B
Jugador A b1 b2 b3
a1 6 5 -2
a2 1 0 3
a3 3 4 -3

Jugador A es la Estrategia a3 está dominado por


Estrategia a1, así que Estrategia a3 puede ser eliminado.
Dominó Ejemplo de Estrategias

Seguimos la búsqueda de estrategias dominadas


con el fin de reducir el tamaño del juego
Jugador B
Jugador A b1 b2 b3
a1 6 5 -2
a2 1 0 3

El jugador B selecciona la estrategia b2 está dominado por


Estrategia b1, así que la estrategia b2 puede ser eliminado.
Dominó Ejemplo de Estrategias

El juego 3 x 3 ha sido reducido a un 2 x 2. Es ahora


posible de solucionar algebraicamente para el optimo de
estrategia mixta de probabilidades.

Jugador B
Jugador A b1 b3
a1 6 -2
a2 1 3
Otros Modelos de Teoría del
Juego

Juegos de Suma Constante para dos personas


(La suma del resultado es un constante diferente a cero.)
Juegos de Suma variable
(La suma del resultado es variable.)
Juegos para n-personas
(Un juego implica más de dos jugadores.)
Juegos cooperativos
(Los jugadores pueden tener comunicaciones pre juego)
Juegos de Estrategias infinitas
(Un número infinito de estrategias esta disponible para los
jugadores.)

También podría gustarte