Está en la página 1de 50

TERCERA UNIDAD

•Utilidad y Teoría de
Juegos
TEORIA DE LA UTILIDAD

• Hasta ahora pagos en términos de valor monetario.


• Recomendación: alternativa de decisión con el mejor valor
monetario esperado.
• Los tomadores de decisiones que podrían aparentar ser
incongruentes con el criterio de VME
• Las decisiones basadas en el VME no siempre es la mas
deseable.
• Mas deseable: aquella que prefiere el decisor, considera
no solo el valor monetario sino también otros factores
como la posibilidad de tener una utilidad muy grande y/o
incurrir en una perdida muy cuantiosa.
TEORIA DE LA UTILIDAD

• Ejm. Cuando las personas compran seguros, la cantidad


de la prima es mayor que el pago que esperan recibir,
porque la prima incluye el pago esperado, el costo directo
y la utilidad de la Cía. Aseguradora.
• Una persona involucrada en una demanda legal, podría
escoger arreglar las cosas fuera de la corte en lugar de ir
a juicio, incluso si el VME de esta última acción es mayor
que la que podría obtener mediante el arreglo.
• Alguien compra un boleto de lotería incluso si el
rendimiento esperado es negativo.
TEORIA DE LA UTILIDAD

• Una persona de negocios podría descartar una decisión


potencial por que podría llevar a su empresa a la
bancarrota si las cosas salieran mal, incluso si el
rendimiento esperado de esta decisión es mucho mayor
que cualquier otra de las alternativas.
• ¿Por qué las personas toman decisiones que no
maximizan su VME?, lo hacen por que el VME no siempre
es el verdadero indicador del valor general de los
resultados de la decisión.
• El valor general de un resultado particular se conoce
como utilidad y las personas racionales toman
decisiones que maximizan la utilidad esperada.
• Expresar el valor de un resultado en función de su utilidad
permitirá que el uso de la utilidad esperada sea la que
identifique la decisión mas deseable.
Significado de utilidad

• Es la medida de valor total de un resultado en particular.


• Refleja la actitud del decisor hacia un conjunto de factores
como utilidad, perdida y riesgo.
• Cuando los valores monetarios esperados quedan en rango
razonable, para el decisor, de la alternativa de decisión con el
mejor valor monetario esperado por lo general lleva a la
selección de la decisión mas preferida.
• Las personas tiene distintos sentimientos a cerca de buscar o
evitar el riesgo. Utilizar únicamente criterios de VME no es
siempre una buena forma de tomar este tipo de decisiones.
• Cuando los pagos se hacen extremos los decisores no quedan
satisfechos con la decisión que tan solo proporciona el mejor el
mejor valor monetario esperado.
• Una manera de conocer nuestras propias actitudes hacia el
riesgo es a través de la teoría de la utilidad.
Caso Swofford

• Firma de inversiones en bienes raíces, relativamente pequeña,


Tiene dos oportunidades de inversión que requiere mas o menos
el mismo desembolso de efectivo. Los requerimientos de efectivo
necesarios impiden a Swofford hacer mas de una inversión en
esta ocasión. Pueden considerarse tres alternativas de inversión
posibles, d1= n invertir en A, d2 = invertir en B y d3 = no invertir.
• Los resultados monetarios asociados con las oportunidades de
inversión dependen de la decisión de inversión del
comportamiento del mercado de bienes raíces durante los
siguientes seis meses, puede ser que los precios de los bienes
raíces aumentes, permanezcan estables o disminuyan, por lo
tanto los estados de la naturaleza son: S1 = Precios aumentan,
S2 = Precios estables y S3 = Precios disminuyen.
• La mejor estimación de probabilidad de que los precios
aumenten es 0,30, de que permanezcan estables es de 0,50 y
de que disminuyan 0,20
Caso Swofford

Swofford ha estimado las ganancias o resultaos asociados con cada


combinación de alternativa de decisión y estado de la naturaleza

Estados de la naturaleza

Alternativa de Aumentan los Precios estables Disminuyen los


decisión precios S2 precios
S1 S3

d1= invertir en A $ 30,000 $ 20 000 - $ 50 000

d2 = invertir en B $ 50 000 - $ 20 000 - $ 30 000

d3 = no invertir 0 0 0
Caso Swofford

• los valores esperados para las tres alternativas de


decisión son:
• VE (d1) = 0,3 (30000) + 0,5 (20000) + 0,2 (-50000) = 9 000
• VE (d2) = 0,3 (50000) + 0,5(-20000) + 0,2 (-30000) = -1000
• VE (d3) = 0,3 (0) + 0,5 (0) + 0,2 (0) =0

• Usando el enfoque de valor esperado la alternativa de


decisión es seleccionar A con un VME de $ 9000.
• Pero puede suceder que los precios disminuyan Swofford
debe absorber una pérdida de $50000.
• Considerar otros factores: posición financiera débil, tiene
capacidad solo para realizar una inversión, se cree que si
se produce una perdida el futuro de la empresa está en
peligro.
• La forma de resolver el problema es determinar la utilidad
Caso Swofford

• La utilidad de cualquier resultado es el valor total de ese


resultado tomando en cuenta todos los riesgos y
consecuencias implicados.
• Si las utilidades para las diversas consecuencias se
evalúan correctamente, la alternativa de decisión con la
mayor utilidad esperada es la alternativa preferida, la
mejor.
• Asignar un valor de utilidad al mejor y peor pago posibles.
• Cualquier valor es valido siempre que la utilidad asignada
al mejor pago sea superior a la utilidad asignada al peor
pago.
• Utilidad de - $50 000 = U(-50 000) = 0
• Utilidad de $ 50 000 = U(50 000) = 10
Utilidades para pagos monetarios

• Determinar las utilidades asociadas con los demás pagos


• El decisor debe expresar su preferencia entre un pago
garantizado y la oportunidad de entrar en la siguiente
lotería o apuesta.
• Lotería: pago garantizado de $50000 con una
probabilidad p y pago de -$50000 con una
probabilidad de (1 – p)
• Si p es muy cercano a 1, el decisor preferirá la lotería a un
resultado garantizado de $ 30000 debido a que la firma
casi aseguraría un resultado de $ 50000, pero si p es
muy cercano a 0 el decisor preferirá el pago garantizado
de $ 30000.
• En cualquier evento, ya que p cambia en forma continua
de 0 a 1, la preferencia por un pago garantizado de $
30000 cambiara en algún punto a una preferencia por la
Utilidades para pagos monetarios

• En este valor de p, el decisor no tendrá mayor preferencia por el


resultado garantizado de $ 30000 que por la lotería. Por ejemplo
supongamos que p = 0.95, el decisor es indiferente entre un pago
garantizado de $ 30000 y la lotería, para este valor de p, podemos
calcular la utilidad de un resultado de $ 30000 como sigue:
• U(30000) = pU(50000) +(1 – p)U –50000
• = 0,95(10) + 0,05(0)
• = 9,5
• Si hubiéramos comenzado con una asignación de utilidades diferente
para un resultado de $ 50000 y $ -50000, el resultado habría sido una
utilidad diferente para $ 30000. por ejemplo, si hubiéramos comenzado
con una asignación de 100 para $ 50000 y 10 para $ -50000, la utilidad
de un pago de $ 30000 seria:
• U(30000) = pU(50000) +(1 – p)U –50000
• = 0,95(100) + 0,05(10)
• = 95,5
Utilidades para pagos monetarios

• La utilidad asignada a cada pago no es única, depende de la


elección inicial de utilidades para los mejores y peores pagos.
• Consideremos el significado de que el decisor asigne una
utilidad de 9,5 aun resultado de $ 30000, es claro que cuando
• p = 0,95 el valor esperado de la lotería es:
• VE (lotería) = 0,95($50000) + 0,05(-$50000)
• = $ 45000
• Aunque el VME de la lotería cuando p = 0,95 es $ 45000, el
decisor habría tomado con igual prontitud un pago garantizado
de $ 30000. Por tanto, el decisor esta tomando un punto de
vista conservador, es decir que evita riesgos.
• Un tomador de decisiones que elegiría un resultado
garantizado sobre una lotería con un mejor resultado esperado
es un evasor de riesgos.
Utilidades para pagos monetarios

• En nuestro caso el decisor, preferiría $ 30000 seguros que


arriesgar algo mas que el 5 % de probabilidad de incurrir en una
perdida de $ 50000. En otras palabras, la diferencia entre el VE
de $ 45000 y el resultado garantizado de $ 30000 es la prima de
riesgo que el decisor estaría dispuesto a pagar para evitar la
probabilidad de 5 % de perder $ 50000.
• Para calcular la utilidad asociada con un resultado de -$20000,
debemos pedir al decisor que establezca una preferencia entre
un resultado garantizado de -$20000y una oportunidad de
participar de nuevo en la siguiente lotería.
• Lotería: pago garantizado de $50000 con una probabilidad p
• y pago de -$50000 con una probabilidad de (1 – p)
• Esta lotería es exactamente la misma, de hecho usamos esta
lotería para establecer la utilidad para cualquier valor monetario
en la tabla de resultados de Swofford.
Utilidades para pagos monetarios

• Necesitamos determinar el valor de p para todos los pagos que


haría al decisor indiferente, por ejemplo, entre un resultado
garantizado de -$20000 y la lotería, podríamos comenzar por
pedir a Swofford que elija entre una perdida segura de -$20000 y
la lotería con una garantía de $ 50000 con probabilidad p= 0,90 y
una perdida de $ 50000 con una probabilidad de (1–p) = 0,10, de
seguro Swofford elegiría la lotería, a continuación podríamos
preguntar si p = 0,85 daría como resultado indiferencia entre la
perdida segura de $ 20000 y la lotería, de nuevo Swofford
preferiría la lotería. Suponga que continuamos hasta p=0,55
punto en que Swofford es indiferente entre el resultado de -
$20000 y la lotería, esto es que para cualquier valor de p menor
que 0,55 Swofford tomaría una perdida segura de $ 20000, en
lugar de arriesgar una perdida potencial de $ 50000 con la
lotería; y para cualquier valor de p mayor a 0,55 Swofford
elegiría la lotería
Utilidades para pagos monetarios

• La utilidad asignada a un pago de -$20000 es


• U(-$20000) = pU($50000) +(1 – p)U –$50000
• = 0,55(10) + 0,45(0)
• = 5,5
• Comparemos el resultado de esta asignación para el
enfoque de valor esperado. Cuando p = 0,55 el valor
esperado de la loteria es:
• VE(loteria) = 0,55($50000) + 0,45(-$50000)
• = $ 27500 - $22500
• = $5000
Utilidades para pagos monetarios

• Por tanto Swofford estaría dispuesto a absorber una


perdida segura de $20000 como a tomar la lotería, aun
cuando el valor esperado de la lotería es de $50000. Una
vez mas esta preferencia demuestra el punto de vista
conservador o de evasor de riesgos de Swofford.
• Así podemos determinar la utilidad para cualquier pago
monetario M. Primero, debemos encontrar la probabilidad
p para la que, el tomador de decisiones le es indiferente
aceptar un pago garantizado de M o una lotería que
puede tener ganancia de $ 50000 con una probabilidad p
o una perdida de $ 50000 con una probabilidad (1-p), la
utilidad se calcula como sigue:
• U(M) = pU($50000) +(1-p)U(-$50000)
• = p(10) + (1-p)0
• = 10p
Utilidades para pagos monetarios

• Usando este procedimiento encontramos los valores de


utilidad que representa el resto de resultados para el
problema de Swofford, estos resultados son:
Utilidad de los resultados monetarios Tabla de utilidades

Valor de Estados de la Naturaleza


Valor Valor de Alterna-
indiferencia tivas
monetario utilidad S1 S2 S3
de p
$ 50000 No aplica 10,0 d1 9,5 9,0 0
30000 0,95 9,5
d2 10,0 5,5 4,0
20000 0,90 9,0
0 0,75 7,5 d3 7,5 7,5 7,5

-20000 0,55 5.5


-30000 0,40 4,0
-50000 No aplica 0
Enfoque de utilidad esperada

• Se aplica los cálculos de VME a las utilidades de la tabla anterior a fin


de seleccionar la alternativa optima para Swofford.
• el analista deberá calcular la utilidad esperada (UE) para cada
alternativa de decisión y seleccionar la alternativa que produzca la
mayor utilidad esperada.

Utilidad esperada Valor monetario


Alternativas de esperado
decisión P(Sj)Uij ΣP(Sj)Uij

UE (d1) 0,3(9,5) + 0,5(9,0) + 0,2(0) 7,35 9000

UE(d2) 0,3(10) + 0,5(5,5) + 0,2(4,0) 6,55 -1000

UE(d3) 0,3(7,5) + 0,5(7,5) + 0,2(7,5) 7,50 0

• La decisión optima usando el enfoque de Utilidad esperada es d3 , no invertir.


Pasos para determinación de la
utilidad del dinero
Pasos involucrados:
1. Desarrolle una tabla o matriz de pagos utilizando valores
monetarios.
2. Identificar los valores de mejor y peor pago y asignar a cada uno
de ellos un valor de utilidad U.
3. Para cualquiera de los demás valores monetarios de M de la tabla
de pagos original, hacer:
a) Definir la lotería: mejor resultado se obtiene con prob. p y el
peor con (1-p)
b) Determinar el valor de p de forma que quien toma la decisión
resulte indiferente ante un resultado garantizado igual a M y la
lotería.
c) Calcule la utilidad de M
U(M)
4. Convertir la tabla de pagos de valores monetarios a valores de
utilidad.
5. Aplicar el procedimiento de utilidad esperada a la tabla de utilidad
Evasores de riesgos frente a tomadores de
riesgos
• Swofford evaluó las oportunidades de inversión desde un punto de vista conservador,
tratando de evitar riesgos. Si la firma tuviera un excedente de efectivo y un futuro estable,
Swofford podría haber estado buscando alternativas de inversión que contuvieran un
potencial para una ganancia considerable. Este tipo de comportamiento habría hecho a
Swofford un tomador de riesgos.
• Un tomador de riesgos es un tomador de decisiones que elegiría una loteria sobre un
mejor resultado garantizado.
• Para el problema de decisión de Swofford y usando el procedimiento general para calcular
utilidades, un tomador de riesgos podría expresar la utilidad para los diversos resultados de
la siguiente manera:
Utilidad de los resultados monetarios Tabla de utilidades
Valor de
Valor Valor de
indiferencia Estados de la Naturaleza
monetario utilidad Alterna-
de p
tivas S1 S2 S3
$ 50000 No aplica 10,0
30000 0,50 5,0
d1 5.0 4,0 0
20000 0,40 4,0
0 0,25 2,5 d2 10,0 1,5 5,0
-20000 0,15 1,5
-30000 0,10 1,0 d3 2,5 2,5 2,5
-50000 No aplica 0
Evasores de riesgos frente a
tomadores de riesgos
• Nótese la diferencia en el comportamiento de Swofford, es
decir, al determinar el valor de p en el que Swofford es
indiferente entre un resultado garantizado de M y una
loteria.
• El tomador de riesgos esta dispuesto a aceptar un riesgo
mayor de incurrir en una perdida de $50000 a fin de
obtener la oportunidad de lograr una ganancia de $
50000
• La tabla de utilidad para el tomador de riesgos seria:
UE(d1) = 0,3(5,0) + 0,5(4,0) + 0,2(0) = 3,50
UE(d2) = 0,3(10) + 0,5(1,5) + 0,2(1,0) = 3,95
UE(d3) = 0,3(2,5) + 0,5(2,5) + 0,2(2,5) = 2,50
• La decisión que se recomienda es d2 con un VME de -
1000 , Swofford es ahora un tomador de riesgos por
Evasores de riesgos frente a tomadores de
riesgos

• Al comparar el análisis de utilidad para un tomador de riesgos con


las preferencias mas conservadoras de Swofford, vemos que,
diferentes actitudes hacia el riesgo pueden conducir a diferentes
decisiones recomendadas. Nótese que ambas decisiones difieren de
la mejor decisión de VME.
• Podemos obtener otra perspectiva de la diferencia entre un evasor
de riesgos y un tomador de riesgos al elaborar una grafica que
describa la relación entre el valor monetario y la utilidad.
• Usamos el eje horizontal para representar valores monetarios y el
eje vertical para representar la utilidad asociada con cada valor
monetario (tabla de resultados monetarios), la curva resultante es la
función de utilidad del dinero para Swofford y reflejan su
naturaleza conservadora o adversa a los riesgos (función de utilidad
para un evasor de riesgos).
Preferencia por riesgo

gos
ri e
d e
o r
vas
E
g o
ie s
a lr
te
Utilidad

en
if er
d
In ie sgo
e r
ord
m ad
To

Resultado monetario
Evasores de riesgos frente a tomadores de
riesgos
• Para un evasor de riesgos, la función de utilidad del dinero
muestra una disminución en el rendimiento marginal para el
dinero, por ejemplo el incremento en la utilidad que va de -
$30000 a $ 0 es 7,5 – 4,0 = 3,5 , mientras el incremento en la
utilidad que va de $0 a $30000 solo es de 9,5 – 7,5 = 2,0;
Para un tomador de riesgos, la función es contraria a la
anterior, pues muestra un incremento en el rendimiento
marginal para el dinero, por ejemplo, el incremento en la
utilidad que va de -$30000 a 0 es 2,5 – 1,0 = 1,5, mientras el
incremento en la utilidad que va de $0 a $30000 es 5,0 – 2,5 =
2,5, note que la función de utilidad siempre esta en aumento.
• Cuando el rendimiento marginal del dinero ni disminuye ni
aumenta sino que permanece constante, la función de utilidad
describe el comportamiento de un tomador de decisiones que
es neutral respecto al riesgo.
VME vs. UE
En muchos problemas el VME y la UE conducen a recomendaciones idénticas.
Este resultado siempre será verdadero si el tomador de decisiones es neutral
respecto al riesgo.
En general si el tomador de decisiones es casi neutral respecto al riesgo a lo
largo del rango de resultados (del menor al mayor) para un problema particular,
la alternativa de decisión con el mejor VME conduce a la selección de la
alternativa de decisión preferida. El hecho esta en saber reconocer el rango de
valores monetarios sobre el cual la función de utilidad de un tomador de
decisiones es neutral respecto al riesgo.
En general cuando los resultados caen en un rango razonable, el mejor no es
demasiado bueno y el peor no es demasiado malo, los tomadores de
decisiones tienden a expresar preferencias de acuerdo con el enfoque del VME
Se sugiere pedir al tomador de decisiones que considere el mejor y el peor de
los resultados posibles. Si el tomador de decisiones cree que están en un
rango razonable, puede usarse la alternativa de decisión con el mejor VME ,
pero si los resultados parecen irracionalmente grandes o pequeños y si el
tomador de decisiones cree que los valores monetarios no reflejan sus
preferencias debe considerar se el analisis de utilidad.
Introducción a Teoría de
Juego
 En el análisis de decisión, el encargado de
tomar decisiones solo busca seleccionar una
alternativa óptima.
 En la teoría de juegos, hay dos o más
tomadores de decisiones, son llamados
jugadores , que compiten como adversarios
entre sí.
 Se supone que cada jugador tiene la misma
información y se seleccionará la estrategia que
proporciona el mejor resultado posible desde
su punto de vista.
 Continúa
Introducción a Teoría de
Juegos
 Cada jugador elige una estrategia
independiente, sin conocer de antemano la
estrategia del otro jugador (s).
 La combinación de las estrategias que
compiten proporciona el valor del juego para
los jugadores.
 Entre los ejemplos de jugadores que compiten
son los equipos, ejércitos, empresas,
candidatos políticos, y los licitadores de
contratos.
Dos-Personas Juego de Suma
Cero

 Dos personas significan que hay dos jugadores


que compiten en el juego.
 De suma cero significa que la ganancia (o
pérdida) de un jugador es igual a la
correspondiente pérdida (o ganancia) para el
otro jugador.
 La ganancia y pérdida de equilibrio de modo
que hay una suma cero para el juego.
Lo que un jugador gana, el otro jugador pierde.
Dos-Personas Juego de Suma Cero
Ejemplo
 La competencia por las ventas de vehículos
Supongamos que sólo hay dos vehículos en el
concesionario para el envío en una ciudad
pequeña. Cada concesionario está
considerando tres estrategias que se han
diseñado para tener ventas de vehículos
nuevos de la concesionaria a través de un
cuatrimestre.
 Las estrategias, que se supone la misma para
ambas representaciones, se encuentran en la
siguiente diapositiva.
Dos-Personas Juego de Suma Cero
Ejemplo
 Elecciones de estrategia

Estrategia 1: Oferta reembolso en efectivo para un vehículo


nuevo

Estrategia 2: Oferta equipamiento opcional libre en un


Vehículo nuevo.

Estrategia 3: Oferta de un préstamo 0% en un vehículo


nuevo.
Dos-Persona Juego de Cero Sumas
Ejemplo

• Matriz de pagos: Número de Ventas de Vehículo


Obtenido por Semana por concesionario
A (Jugador A)
• O Perdido por Semana para el
Concesionario B (jugador B)
jugador B
Jugador A Reemb. Equipamien- 0%
efectivo b 1 to Libre b2 Préstamo b3
Reemb. efect. a1 2 2 1
Equip. libre a2 -3 3 -1
Préstamo 0 % a3 3 -2 0
Dos-Personas Juego de Suma Cero
Ejemplo

Paso 1: Identificar el mínimo resultado para cada


Fila (para Jugador A)

Paso 2: Para Jugador A, seleccionar la estrategia que


proporciona el máximo de los mínimos de fila
(llamados el máximo).
Dos-Personas Juego de Suma Cero
Ejemplo

• Identificando Maximin y mejor estrategia

Jugador B
Jugador A Reembolso Equipamiento 0% Mínimo de fila
efectivo Libre Préstamo
b1 b2 b3
Reemb. efect. a1
2 2 1 1
Equip. libre a2
-3 3 -1 -3
Préstamo 0 % a3
3 -2 0 0

Mejor estrategia Resultado


Para Jugador A maximin
Dos-Persona Juego de Suma Cero
Ejemplo

Paso 3: Identificar el máximo resultado para cada


columna (Para Jugador B).

Paso 4: Para Jugador B, seleccionar la estrategia que


proporciona el mínimo de los máximos de
columna (Llamado el minimax).
Dos-Personas Juego de Cero Sumas
Ejemplo
 Identificando Minimax y mejor estrategia

Jugador B

Jugador A Reemb.
Equip. Libre Préstamo 0%
efectivo
b2 b3
b1

Reemb. efectivo a1 2 2 1
Equip. libres a2 -3 3 -1
Préstamo 0 % a3 3 -2 -1
Máximo de columna 3 3 11
Mejor estrategia Para
Resultado
Jugador B
minimax
Estrategia pura

 Siempre que una estrategia pura óptima exista:


el máximo de los mínimos de fila es igual al
mínimo de los máximos de columna (maximin del
jugador A es igual a minimax del jugador B)
 el juego se dice que tiene un punto de silla (la
intersección de las estrategias óptimas)
el valor del punto de silla es el valor del juego
 ningún jugador puede mejorar su / su resultado al
cambiar estrategias, incluso si él / ella se entera
de antemano de la estrategia del oponente
Ejemplo de Estrategia pura
Valor del
 Punto de silla y Valor del Juego juego

Jugador B
Reemb. Equip. Libre Préstamo mínimo de fila
Jugador A efectivo b2 0%
b1 b3

Reemb. efectivo a1 2 2 1 1
Equip. libre a2 3 3 -1 1
-3
Préstamo 0 % a3 3 -2 0 -2
Máximo de columna 3 3 1 1
1
Punto de
silla
Ejemplo de Estrategia pura

 Resumen de Estrategia pura


 Jugador A tendría que escoger Estrategia a1 (oferta
descuento de dinero en efectivo).
 Jugador A puede esperar un beneficio de al menos
1 venta de vehículo por semana.
 Jugador B tendría que escoger Estrategia b3 (oferta
un 0% préstamo).
 Jugador B puede esperar una pérdida de 1
vehículo por semana sin superar esta cifra
Estrategia mixta

 Si el valor maximin para el jugador A no es igual al


valor minimax para el jugador B, entonces una
estrategia pura no es óptimo para el juego.
 En este caso, una estrategia mixta es mejor.
Con una estrategia mixta, cada jugador cuenta con
más de una estrategia.
 Cada jugador debe usar una estrategia de una parte
del tiempo y otras estrategias el resto del tiempo.
 La solución óptima es la frecuencia relativa con la que
cada jugador debe usar sus posibles estrategias.
Ejemplo de Estrategia mixta
 Considerar lo siguiente: juego de dos-personas de suma
cero. El maximin no igual al minimax. no hay una
estrategia optima pura.

Jugador B
Jugador A Mínimo de fila
b1 b2

a1
4 8 4
a2
11 5 5
Máximo de
columna 11 8

Maximin
Minimax
Ejemplo de Estrategia mixta

p = probabilidad que A selecciona estrategia a1


(1 - p) = probabilidad que A selecciona estrategia a2

Si Jugador B selecciona b1:

EV = 4p + 11(1 – p)

Si Jugador B selecciona b2:

EV = 8p + 5(1 – p)
Ejemplo de Estrategia mixta

Para resolver las probabilidades óptimas para el jugador A


nos pusimos los dos valores esperados iguales y despejamos
el valor de p.
4p + 11(1 – p) = 8p + 5(1 – p)
4p + 11 – 11p = 8p + 5 – 5p
11 – 7p = 5 + 3p
-10p = -6 De ahí,
(1 - p) = .4
p = .6
Jugador A tendría que seleccionar:
Estrategia A1 con un 0.6 de probabilidad y la
estrategia A2 con un .4 probabilidad.
Ejemplo de Estrategia mixta

q = probabilidad que B selecciona estrategia b1


(1 - q) = probabilidad que B selecciona estrategia b2
Si el jugador A selecciona a1:

EV = 4q + 8(1 – q)

Si Jugador A selecciona a2:

EV = 11q + 5(1 – q)
Ejemplo de Estrategia mixta

Para resolver las probabilidades óptimas para el jugador B


nos pusimos los dos valores esperados iguales y despejar
el valor de q.
4q + 8(1 – q) = 11q + 5(1 – q)
4q + 8 – 8q = 11q + 5 – 5q
8 – 4q = 5 + 6q
De ahí,
-10q = -3 (1 - q) = .7
q = .3

Jugador B tendría que seleccionar:


Estrategia b1 con un 0.3 de probabilidad y
Estrategia b2 con un 0.7 de probabilidad.
Ejemplo de Estrategia mixta
Beneficio esperado
 Valor del Juego Por juego
Para Jugador A

Para Jugador A:
EV = 4p + 11(1 – p) = 4(.6) + 11(.4) = 6.8
Para Jugador B:

EV = 4q + 8(1 – q) = 4(.3) + 8(.7) = 6.8

Pérdida esperada
Por juego
Para Jugador B
Dominó Ejemplo de Estrategias
Supone que la tabla de resultados para un dos-persona EL
Juego de suma cero es el siguiente. Aquí no hay estrategia
pura optima

Jugador B
Jugador Minimo
A b1 b2 b3 de fila Maximin

a1 6 5 -2 -2
a2 1 0 3 0
a3 3 4 -3 -3
Max. De
columna 6 5 3
Minimax
Dominó Ejemplo de Estrategias

Si un juego es más grande que 2 x 2 se tiene una


estrategia mixta, primero buscamos dominó estrategias
para reducir la medida del juego.
Jugador B
Jugador A b1 b2 b3
a1 6 5 -2
a2 1 0 3
a3 3 4 -3

Jugador A es la Estrategia a3 está dominado por


Estrategia a1, así que Estrategia a3 puede ser eliminado.
Dominó Ejemplo de Estrategias

Seguimos la búsqueda de estrategias dominadas con el


fin de reducir el tamaño del juego
Jugador B
Jugador A b1 b2 b3
a1 6 5 -2
a2 1 0
3

El jugador B selecciona la estrategia b2 está dominado por


Estrategia b1, así que la estrategia b2 puede ser eliminado.
Dominó Ejemplo de Estrategias

El juego 3 x 3 ha sido reducido a un 2 x 2. Es ahora


posible de solucionar algebraicamente para el optimo de
estrategia mixta de probabilidades.

Jugador B
Jugador A b1 b3
a1 6 -2
a2 1 3
Otros Modelos de Teoría del Juego

 Juegos de Suma Constante para dos personas


(La suma del resultados es una constante diferente a
cero.)
 Juegos de Suma variable
(La suma del resultados es variable.)
 Juegos para n-personas
(Un juego implica más de dos jugadores.)
 Juegos cooperativos
(Los jugadores pueden tener comunicaciones pre juego)
 Juegos de Estrategias infinitas
(Un número infinito de estrategias esta disponible para
los jugadores.)

También podría gustarte