Está en la página 1de 77

EII 7450

TEORÍA DE JUEGOS PARA


ESTRATEGIAS DE NEGOCIOS

1
Dadivoso o tacaño
• Dos jugadores deciden en secuencia:
• El primer jugador determina cuántos billetes de un
montón retira para sí, dejando el saldo al segundo
jugador.
• Luego, el segundo jugador decide:
• Si acepta lo que el primer jugador le dejó, en cuyo caso cada uno
se queda con lo que aceptó.
• Si rechaza lo que el primer jugador le dejo, en cuyo caso, el
primer jugador debe también devolver la suma que
originalmente retiró.

2
Dilema del Prisionero
• Dos prisioneros deben declarar en privado ante
el alcaide.
• Si ambos se denuncian mutuamente, c/u recibe 7
años de prisión.
• Si ambos callan, ambos salen libres en el plazo de
3 años.
• Si uno calla mientras el otro lo incrimina, quién
calla recibe 10 años, mientras quién lo incrimina
sale libre en un mes.

3
Tipos de juegos
• Cantidad de intereses:
• Singulares
• Duales
• Plurales
• Dinámica
• Estáticos
• De una vez
• Repetitivos
• Dinámicos (secuenciales)
• Finitos
• Infinitos
• Información
• Completa
• Incompleta

4
Formas de representarlos
• Forma:
• Normalizada
• Extensiva

5
Ejemplo: Dilema de los prisioneros
• Dos prisioneros deben declarar en privado ante el alcaide.
• Si ambos se denuncian mutuamente, c/u recibe 7 años de prisión.
• Si ambos callan, ambos salen libres en el plazo de 3 años.
• Si uno calla mientras el otro lo incrimina, quién calla recibe 10 años,
mientras quién lo incrimina sale libre en un mes.

6
Ejemplo: Dilema de los prisioneros

Equilibrio
Prisionero 2
de Nash
Denuncia Calla

Denuncia 7 años 7 años 1 mes 10 años


Prisionero 1
Calla 10 años 1 mes 3 años 3 años

Solución
cooperativa
7
Ejemplo: Capacidad productiva
• Dos compañías navieras deben determinar la frecuencia de sus
respectivas recaladas a un puerto. (Por simplicidad, supongamos sólo dos
opciones: frecuencia alta y frecuencia baja).
• Si ambas optan por frecuencia alta, c/u tiene resultado de USD 81 MM.
• Si ambas optan por frecuencia baja, c/u tiene resultado de USD 112 MM.
• Si una opta por frecuencia alta y otra por frecuencia baja, quién opta por
frecuencia alta tiene resultado de USD 124, y quién opta por frecuencia
baja tiene resultado de 58.

8
Ejemplo: CSAV vs. Maersk
Maersk
F = 128 F = 103
F = 128 81 81 124 58
CSAV
F = 103 58 124 112 112

Hay un equilibrio de Nash en (F=128, F=128)

9
Concepto de estrategias dominantes y
dominadas
• La estrategia A del jugador 1 es dominada por la estrategia B si para
toda opción del contrincante, el jugador 1 obtiene mejor resultado
con B que con A. B domina a A.
• La estrategia C es dominante si es la mejor estrategia que puede jugar
el jugador 1, independientemente de lo que juegue el jugador 2.

10
Qué ocurre si el juego se repite varias veces?
• Depende de los valores de los beneficios.

11
Ejemplo: CSAV vs. Maersk (Cías. navieras)

Maersk Maersk
F = 128 F = 103 F = 128 F = 103
F = 128 81 81 124 58 F = 128 81 81 124 58
CSAV CSAV
F = 103 58 124 89 89 F = 103 58 124 112 112

Aquí conviene Aquí conviene


Jugar 103 y 128 alternando quién gana jugar siempre 103 y probar lealtades
12
Juegos dinámicos y
Estrategias Mixtas
• Si la interacción es única el comportamiento estratégico debe ser
distinto a si ésta es reiterativa.
• Los juegos con interacción repetida se llaman juegos dinámicos, y las
estrategias que a ellos corresponde se llaman estrategias mixtas.

Maersk
F = 128 F = 103
F = 128 91 91 124 58
CSAV
F = 103 58 124 112 112
13
Ejemplo: Par - Impar

Jugador 2
Par Impar
Par 1 0 0 1
Jugador 1 Impar 0 1 1 0

No conviene establecer un patrón de juegos

14
Ejemplo: Precios de promoción
• Supongamos dos empresas competidoras, que cobran dos precios por
su servicio, cuyo costo es de $450:
• $600 (precio normal)
• $500 (precio de promoción)

15
• Supongamos además, que existen dos tipos de clientes:
• Los informados, que compran si y sólo si el precio es menor o igual a $500.
• Los desinformados, que compran si y sólo si el precio es igual o menor a $600.
• Ambos tipos de clientes se reparten por partes iguales en su primera
visita a las empresas.

16
• Hay 120 clientes informados, que:
• Al detectar un precio igual o menor a $500 en la empresa visitada,
compran.
• De lo contrario, visitan la otra empresa.
• Hay 100 clientes desinformados, que:
• Compran en la primera tienda que visitan si el precio es inferior o
igual a $600.

17
• Ambas empresas deben decidir simultáneamente si entran en
promoción o no, y el ejercicio se verifica varias veces sucesivas.

18
Forma normal del juego

Si se jugase una sola vez

Empresa 2
Dos
equilibrios Precio Precio
de Nash normal Promoción
Precio
7500 7500
normal
7500 8500
Empresa 1 Precio 8500 5500
promoción 7500 5500

19
Forma normal del juego
Si se jugase repetidamente

Tasa de juego Empresa 2


r 1-r
Precio Precio
Tasa de juego
normal Promoción
q Precio 7500 7500
normal 7500 8500
Empresa 1 1- q Precio 8500 5500
promoción 7500 5500

20
Estrategia de la Empresa 1:
La empresa 2 no debe optimizar.
Tenga la Empresa 1, tasa de juego (q, 1 - q)
Si la Empresa 2 juega precio normal, le resulta :
7500q + 7500(1 - q) = 7500
Si la Empresa 2 juega precio de promoción, le resulta :
8500q + 5500(1 - q) = 3000q + 5500
Luego, el q que impide optimizar a la Empresa 2 es
el que hace
7500 = 3000q + 5500
Es decir, q = 2/3
21
Estrategia de la Empresa 1:
La empresa 2 no debe optimizar.
• Si q < 2/3, la Empresa 2 puede optimizar, y elige siempre Precio Normal
(r = 1).
• Si q > 2/3, la Empresa 2 también puede optimizar, y elige siempre Precio
Promoción (r = 0).
r
1

0
2/3 1 q
22
Estrategia de la Empresa 2:
La empresa 1 no debe optimizar.
Tenga la Empresa 2, tasa de juego (r, 1 - r)
Si la Empresa 1 juega precio normal, le resulta :
7500r + 7500(1 - r) = 7500
Si la Empresa 1 juega precio de promoción, le resulta :
8500r + 5500(1 - r) = 3000r + 5500
Luego, el r que impide optimizar a la Empresa 1 es
el que hace
7500 = 3000r + 5500
Es decir, r = 2/3
23
Estrategia de la Empresa 2:
La empresa 1 no debe optimizar.
• Si r < 2/3, la Empresa 1 puede optimizar, y elige siempre Precio Normal
(q = 1).
• Si r > 2/3, la Empresa 1 también puede optimizar, y elige siempre Precio
Promoción (q = 0).
r
1

2/
3

0 1 q 24
Hay tres puntos en que ambas estrategias
coinciden (sólo uno es interesante):

r Si ambas empresas
exhiben tasas de
1 juego iguales a 2/3,
optimizan su
respectiva ganancia
2/3

0 2/3 1 q
25
Ejemplo: Papel, piedra, tijeras

Jugador 2
Papel Piedra Tijeras
Papel 0 0 1 -1 -1 1
Jugador 1 Piedra -1 1 0 0 1 -1
Tijeras 1 -1 -1 1 0 0

¿Qué debe jugar el jugador 1, si ocurre que el jugador 2 no puede empuñar la mano para
hacer piedra? (analizar distintas probabilidades).

26
Otros ejemplos de este tipo de juegos
• Introducción simultánea a mercados
• Frecuencia de recalada naves a puerto
• Introducción de nuevos “modelos de productos” o “tipos de
servicios”.
• Pelea agresiva por un cliente o negocio dado

27
Aplicaciones a la teorñia
económica

1
Los equilibrios de Cournot o Bertrand son
soluciones a juegos de interdependencia.
• En un mercado hay tres grandes escenarios:
• El escenario monopólico
• El escenario de competencia perfecta
• El escenario de oligopolio

Mientras la estrategia es innecesaria en un monopolio


e imposible en un mercado perfecto,
es imprescindible en un oligopolio.

2
Ejemplo
• Sea un mercado en que la demanda de un producto está dada por:
P
Q = 130 − P 130

P = 130 − Q D
10
Q
• Y el costo marginal es constante e igual a 10 (no hay costos fijos)
• Veamos las soluciones monopólica, perfecta y duopólica

3
Solución monopólica
P Img = Cmg
130 B = I − G = PQ − Cmg Q = (130 − Q)Q − 10Q
dB d
=0 (130 − Q )Q − 10Q = 0
Pm dQ dQ
130 − 2Q − 10 = 0
Q = 60
Cmg
D

Qm Img Q

4
Solución de mercado perfecto
P
130 Pp = Cmg

dB d
=0 PQ − 10Q = 0
dQ dQ
P − 10 = 0
Pp = Cmg Q = 120
D

Qp Q

5
Solución duopólica tipo Cournot
• Supuesto:
Una vez establecidas las capacidades productivas, los competidores no las variarán

q1 = cantidad producida por competidor 1 


 Q = q1 + q2
q2 = cantidad producida por competidor 2 
El rival 1 persigue maximizar su beneficio neto
BN1 = ( P − Cmg )q1
Derivando con respecto a q1 e igualando a cero
dBN1 dP
= ( P − 10) 1 + q1 =0
dq1 dq1
6
Solución duopólica tipo Cournot

dP
Reemplazan do P por (130 - Q) y por - 1 se tiene
dq1
120 − 2q1 − q 2 = 0
o bien
q1 = 60 − 0.5q 2

7
La función reacción
• Es la reacción del competidor 1 en respuesta a lo que haría el
competidor 2.
q1 = 60 − 0.5q2

• Se puede calcular la función reacción del competidor 2 en respuesta a


lo que haría el competidor 1:

q2 = 60 − 0.5q1

8
Graficando ambas funciones de reacción

120 q1
q1 = 60 − 0.5q2   q1 = 40

q2 = 60 − 0.5q1   q2 = 40
60
40

40 60 120 q2
9
Equilibrio de Cournot y Teoría de Juegos
• Se puede expresar el problema anterior en lenguaje de teoría de
juegos suponiendo que los competidores tienen sólo tres alternativas
de acción (tamaño de plantas):
• q=30
• q=40
• q=60
• Entonces...

10
Rival 2

q=30 q=40 q=60

q=30 1800 1800 1500 2000 900 1800

Rival 1 q=40 2000 1500 1600 1600 800 1200

q=60 1800 900 1200 800 0 0

Los números representan los beneficios de cada empresa,


dadas las decisiones de producción adoptadas por cada una.
11
Forma normal

Equilibrio
Rival 2
de Nash
q=30 q=40 q=60

q=30 1800 1800 1500 2000 900 1800

Rival 1 q=40 2000 1500 1600 1600 800 1200

q=60 1800 900 1200 800 0 0

La solución puede parecer arbitraria dados los tres niveles de


acción escogidos. Compruébese que no es así, agregando q=35 y q=50

12
Ejemplo: solución duopólica tipo Bertrand
• En la solución duopólica tipo Bertrand, la estrategia seleccionada está
definida por el precio. Una vez que los jugadores han definido su
precio, no lo cambiarán en respuesta a las acciones del otro jugador.

13
Equilibrio de Bertrand, forma normal
Rival 2

P=70 P=50 P=11

P=70 1800 1800 0 3200 0 119

Rival 1 P=50 3200 0 1600 1600 0 119

P=11 119 0 119 0 59,5 59,5

Hay dos equilibrios de Nash.


Pero… ¿Hay efectivamente dos equilibrios de Nash? 14
Introducimos una opción intermedia de precio. P=30
Rival 2

P=70 P=50 P=30 P=11

P=70 1800 1800 0 3200 0 2000 0 119

Rival 1 P=50 3200 0 1600 1600 0 2000 0 119

P=30 2000 0 2000 0 1000 1000 0 119

P=11 119 0 119 0 119 0 59,5 59,5

Vemos que los equilibrios de Nash nuevamente son los dos últimos puntos.
¿Y si éstos estuviesen infinitamente cerca?
15
Juegos secuenciales finitos
Inducción Lógica Retrospectiva

1
Concepto clave
en los juegos secuenciales finitos
• Ejemplo:
Un filántropo decide donar hasta $10 millones (M$10) a cualquiera de dos
beneficiarios. Inventa un juego:
Ofrece M$1 al primero, quién puede tomarlo y terminar el juego, o dejarlo.
Si lo deja, el filántropo ofrece M$2 al otro beneficiario, quién tiene las misma
opciones; es decir, puede tomarlos y terminar el juego, o dejarlos.
Y así alternativamente hasta que se vayan los M$10 o uno de los beneficiarios
cierre el juego antes.

2
Suponiendo que es un juego no-cooperativo...
¿Cuál es el resultado?
• El beneficiario Nº 1 tomará el primer millón y cerrará el juego.

3
¿Por qué?
• Está claro que si el filántropo estuviera ofreciendo M$9 (al
beneficiario Nº1), éste los tomaría con certeza, porque después de
esta oportunidad ya no volvería a jugar nuevamente.
• Dado que el benefiario Nº1 tomaría con certeza los M$9, el
beneficiario Nº2 tomaría con certeza los M$8, porque si él llega a
estar en dicha posición, el beneficiario Nº1 no le dejaría jugar una
décima vez.

4
¿Por qué?...(continuación)
• Si el beneficiario Nº2 toma con certeza los M$8, el beneficiacio Nº1
debiera tomar los M$7 cuando el filántropo se los ofrece, por las
mismas razones anteriores...

Y así, concluímos que el primer beneficiario tomará M$1,


porque de lo contrario,
el beneficiario Nº2 tomará los M$2 y cerrará este juego.

5
Inducción lógica retrospectiva
• A esta forma de razonar, en que uno se posiciona hipotéticamente en
una etapa avanzada del juego, y retrocede con razonamientos lógicos,
se le llama “INDUCCIÓN LÓGICA RETROSPECTIVA”

Es una herramienta esencial


del pensamiento estratégico

6
Intercambio de dinero
• Dos concursantes reciben sendos sobres con dinero. Después de
abrirlos, pueden quedarse con él, o invitarse mutuamente a
intercambiarlos.
• Saben que los sobres provienen del siguiente conjunto, y que fueron
escogidos en forma contigua:

M$5 M$10 M$20 M$40 M$80 M$160

7
Intercambio de dinero
• Es decir, si un concursante recibe el sobre con M$20,
sabe que su competidor puede tener en su poder el
sobre con M$10 o el sobre con M$20, ambos con
igual probabilidad.

M$5 M$10 M$20 M$40 M$80 M$160

Suponga que Ud. Es el competidor Nº 1 y


ha recibido el sobre con M$20, qué hace?
8
Intercambio de dinero
• Un ligero análisis diría que, habiendo recibido M$20, el valor esperado del
contenido del otro sobre es:

E(Otro sobre) = 0,50  M$10 + 0,50  M$40


E(Otro sobre) = M$25
• Y similarmente para el otro jugador. Consecuentemente, debiera sugerir cambio,
y el otro jugador, aceptarlo.

9
Aplicando
Inducción Lógica Retrospectiva
• La situación es diferente:
• Está claro que si alguien recibiese el sobre con M$160, no aceptará ni ofrecerá
cambios, porque sabe que no tiene posibilidad de obtener ganancias.
• Por lo tanto, quién obtuviese el sobre con M$80, nunca ofrecerá cambios, porque
sólo serían aceptados por quién haya recibido el sobre de M$40.
• Éste tampoco los aceptará, por la misma razón.

10
Aplicando
Inducción Lógica Retrospectiva
• Por lo tanto, quién recibiese el sobre de M$40 nunca ofrecerá ni aceptará
cambios.
• Y así sucesivamente, hasta el jugador que eventualmente reciba el sobre de M$5.
Pero él sabe que en este caso, nadie aceptará su oferta, porque sería el único que
la haría.

En resumen,
todos los jugadores aceptan el sobre que reciben,
sin intentar cambiarlo.

11
Los sombreros
• Tres prisioneros (uno de ellos, ciego) están sentados en los vértices de un
triángulo, mirando hacia el interior. En estas condiciones, cada uno enfrenta a los
otros dos.
• Sobre sus cabezas llevan sombreros de un cierto color, que puede ser rojo o
verde.
• Cada prisionero vidente puede ver los sombreros de los otros dos, pero no el
suyo.
• Se sabe que en la penitenciaría hay tres sombreros verdes, pero sólo dos rojos.

12
Los sombreros
• A los prisioneros se les ofrece la posibilidad de salir libres si adivinan
el color de su sombrero. El costo de equivocarse es muy alto, (por
ejemplo, la vida), para desincentivar la idea de arriesgarse con una
respuesta aleatoria.
• Después de un largo silencio por parte de los tres prisioneros, el ciego
declara el color de su sombrero y sale libre.
• ¿De qué color era el sombrero del prisionero ciego? Detalle su
razonamiento.

13
El examen sorpresa
• Un profesor dice al curso:
“La próxima semana haré un examen. Ustedes no sabrán qué día
lo haré. Lo único que puedo decirles es que el día será una sorpresa”.

Analice usted la situación y diga qué día será el examen, conociendo al


profesor y sabiendo que nunca jamás ha mentido.

14
El examen sorpresa
• Conocido el profesor, el examen no podrá ser el viernes, ya que es el
último día de la semana y si éste no ha sido tomado antes, tomarlo el
viernes no será sorpresa. Como se sabe que el profesor jamás
miente, sólo quedan como candidatos los días lunes a jueves.
• El jueves tampoco podrá ser, por las mismas razones anteriores.
• Así, se llega a la conclusión de que es imposible que el profesor tome
el examen, condición que se cumple para todos los días de la semana.

Este tema no ha terminado. Hay más que decir al


respecto, y se verá unos capítulos más adelante.
15
Definiciones
• Información perfecta:
Un juego de información perfecta es aquel en que los jugadores conocen todo lo que
podrían desear conocer acerca de lo que ha sucedido desde el principio del juego hasta
el momento en que tienen que realizar un movimiento.
En particular, es aquel en que los jugadores conocen todas las decisiones de juego
del(de los) rival(es), que han conducido el juego al escenario presente.

• Información completa:
Un juego de información completa es aquel en el que el conocimiento acerca de las
opciones que cada participante tiene en cada etapa del juego está disponible para
todos los jugadores. Cada jugador conoce las recompensas y estrategias disponibles
para sí y para los demás.

Información perfecta ➔ Se conoce la dinámica (historia o evolución del juego)


Información completa ➔ Se conocen las reglas del juego (opciones y beneficios disponibles)
16
JSF con información
completa y perfecta
Es la forma más simple y fácil de analizar.

17
Aplicaciones de la ILR
Juegos y subjuegos secuenciales
Guerra fría:
La URSS juega primero y tiene dos
opciones:
Mantiene el status-quo, en cuyo caso gana cero,
igual que su contrintante
Ataca a la OTAN, en cuyo caso, la OTAN puede:
reaccionar con una respuesta convencional o
reaccionar con una respuesta nuclear.
En el primer caso la URSS gana 1 y la OTAN pierde 1. En el
segundo caso, ambos pierden 100.

18
Forma extensiva de presentación

URSS 1er jugador


Subjuego
perfecto
Ataca Status quo
Opciones de juego

OTAN OTAN 2do jugador


Respuesta Respuesta
Status quo
convencional nuclear

(1, -1) (-100, -100) (0, 0)


Resultados

19
Forma extensiva de presentación
Si el juego se jugase una sola vez:
• Aplicando ILR, supóngase que la URSS decide atacar. LA OTAN debe decidir entre
perder 1 y perder 100. Naturalmente elige perder 1, respondiendo
convencionalmente. Así, la URSS gana 1.
• Si la URSS no atacase, ganaría 0.
• Entre atacar y ganar 1, y no atacar ganando 0, la URSS decide atacar.

20
URSS
Forma extensiva de presentación Ataca SQ

OTAN (0, 0)

Conv Nuc

URSS (-100, -100)

Ataca SQ

Si el juego se jugase en forma repetida: OTAN (1, -1)

• Al atacar la URSS, la OTAN debe decidir entre perder Conv Nuc

100 o perder repetidamente 1; una suma mucho URSS (-99, -101)

mayor a 100. Claramente, debe decidir la respuesta Ataca SQ

nuclear. OTAN (2, -2)

• En este caso, su amenaza de respuesta nuclear es Conv Nuc

creíble. URSS (-98, -102)

Ataca SQ

OTAN (3, -3)

.
.
. 21
Aplicación a la industria naviera

Subjuego Maersk
perfecto
Entra No entra

CSAV CSAV

Se acomoda Aplasta Status quo

(2, 2) (0, 0) (1, 5)

22
Movimientos estratégicos
• Considérese la siguiente situación de juego simultáneo:

P&O
Mantener Brindar nuevo
Servicio P/P Servicio D/D
Mantener
Servicio P/P 4 3 2 4
NLL
Brindar nuevo
Servicio D/D 3 2 1 1

23
Movimientos estratégicos
• Se aprecia que si ambas empresas deciden en
forma simultánea dar o no servicio Puerta a
puerta (D/D), la solución dada por el
equilibrio de Nash es que P&O da el servicio
D/D, y NLL sólo brinda servicio Puerto a
puerto (P/P).
• El resultado de esto es particularmente
deventajoso para NLL.

24
Movimientos estratégicos
• Entonces, lo que NLL debe hacer es
transformar el juego simultáneo en NLL
uno secuencial, decidiendo primero y
dar servicio D/D: P/P D/D

P&O P&O

P/P D/D P/P D/D

(4, 3) (2, 4) (3, 2) (1, 1)

25
Movimientos estratégicos
• Para que el paso de NLL sea creíble por parte de P&O, éste
debe ser irreversible.
• Si el paso de NLL no es irreversible, entonces P&O puede
presionar para una reconsideración, tomando P&O la
alternativa de dar servicio D/D también.
• En ese caso, hacen “gallitos” ganando ambos sólo 1, a ver Guerra de
quién soporta la situación por más tiempo. atrición

• La irreversibilidad de la decisión de NLL desincentiva a P&O


a intentar “gallitos”.

26
Movimientos estratégicos
• Se ve también que si P&O se adelanta, también puede
convertir el juego en uno secuencial, escogiendo ella
brindar el servicio D/D, en forma irreversible.
• En este caso, a NLL no le queda otra que conformarse con
el servicio P/P.
• Si la decisión de P&O pareciese reversible a los ojos de NLL,
ésta podría intentar “gallitos”.
• El mensaje de irreversibilidad en la decisión es crucial en
estos movimientos estratégicos.

27
JSF con información
completa e imperfecta
Imperfecta ➔ No se conoce la dinámica, pero se conocen las reglas

1
Forma extensiva de presentación.
Formalización
Cada nodo es asignado a un jugador, Nodo inicial (no tiene entrada, sólo
quién opta por una de las salidas
J1 salidas)

J1O1 J1O2

Nodo de decisiones (tiene una entrada y


J2 J2 una o varias salidas

J2O1 J2O2 J2O1 J2O2

Nodo terminal (tiene una entrada, no


(1, -1) (-1, 1) (1, 1) (-1, -1) tiene salidas y contiene los resultados)

Para cualquier par de nodos, existe una única ruta que los conecta
2
Forma extensiva de presentación
JUEGO CON INFORMACIÓN PERFECTA
J1 En este juego, J2 sabe si J1 optó por J101 o J102.
J1O1 J1O2 Luego, sabe cuánto recibirá al optar por J2O1.

J2 J2

J2O1 J2O2 J2O1 J2O2 Este juego se puede descomponer en subjuegos a ser
resueltos desde abajo hacia arriba
(1, -1) (-1, 1) (1, 1) (-1, -1)

JUEGO CON INFORMACIÓN IMPERFECTA


J1
En este juego, J2 NO sabe si J1 optó por J101 o J102.
J1O1 J1O2
Luego, J2 no sabe si al optar por J2O1 recibirá -1 o 1.
J2 J2

J2O1 J2O2 J2O1 J2O2


Este juego NO se puede descomponer en subjuegos.
NO puede resolverse desde abajo hacia arriba. (1, -1) (-1, 1) (1, 1) (-1, -1)

3
Ejemplo
J1

J1O1 J1O2 J1O3

(-1, 0)
J2 J2

J2O1 J2O2 J2O1 J2O2

(1, -1) (-1, 1) (1, 1) (-1, -1)

En este juego, J2 puede saber que J1 ha jugado J1O1 o J1O2, y no ha jugado J1O3.
Pero J2 no puede saber si J1 ha jugado J1O1 o J1O2.
4
Conjuntos de información
• Conjunto de información es un conjunto de nodos de un juego,
incluidas sus movidas u opciones de juego, tales que:
• Todos los nodos están asignados al mismo jugador
• En todos los nodos del conjunto son factibles las mismas movidas
• Partición de información es la asignación de todos los nodos no
terminales de un juego a algún conjunto de información del juego. El
nodo inicial debe estar solo.
Conjuntos J1
de
información J1O1 J1O2

J2 J2

J2O1 J2O2 J2O1 J2O2

(1, -1) (-1, 1) (1, 1) (-1, -1)

5
Estrategias
Una estrategia de un jugador es un plan que determina qué acción tomará éste en cada
conjunto de información en el cual deba mover (incluidos los conjuntos de información que
no se alcanzarán de acuerdo con esta estrategia).

Es importante tener en cuenta las siguientes tres sutilezas en la definición anterior.


1. El jugador debe elegir un movimiento para cada uno de sus conjuntos de información.
(De lo contrario, no sabríamos qué habría hecho el jugador al alcanzar ese conjunto de
información).
2. El movimiento elegido debe estar disponible en el conjunto de información. (De lo
contrario, el plan no sería factible ya que no podría ejecutarse cuando se alcance ese
conjunto de información).
3. El movimiento elegido debe estar disponible en cada uno de los nodos del conjunto de
información. (Después de todo, el jugador no puede distinguir esos nodos entre sí).
6
Ejemplo
• En este caso cada jugador tiene un conjunto de información:
• J1 tiene S1 = {J1O1, J1O2}
• J2 tiene S2 = {J2O1, J2O2}
Conjuntos J1
de
información J1O1 J1O2

J2 J2

J2O1 J2O2 J2O1 J2O2

(1, -1) (-1, 1) (1, 1) (-1, -1)

• Tanto J1 como J2 tienen dos estrategias cada uno:


• J1 tiene las estrategias E1a = J1O1 y E1b = J1O2
• J2 tiene las estrategias E2a = J2O1 y E2b = J2O2
7

7
• Conjuntos de información J1
S11

• J1 J1O1 J1O2

• S11, S12, S13, S14 J2


S21
J2
S22

• J2 J2O1 J2O2 J2O1 J2O2

S12 S13 S14


• S21, S22 J1 J1 J1 J1

J1O3 J1O4 J1O5 J1O6 J1O5 J1O6 J1O7 J1O8

(1, -1) (-1, 1) (1, -1) (-1, 1) (1, -1) (-1, 1) (1, -1) (-1, 1)

• Estrategias
• J1
• {J1O1, J1O3, J1O5, J1O7}, {J1O1, J1O3, J1O5, J1O8}, {J1O1, J1O3, J1O6, J1O7}, {J1O1, J1O3, J1O6,
J1O8}, {J1O1, J1O4, J1O5, J1O7}, {J1O1, J1O4, J1O5, J1O8}, {J1O1, J1O4, J1O6, J1O7}, …
• J2
• {J2O1, J2O1}, {J2O1, J2O2}, {J2O2, J2O1}, {J2O2, J2O2}
8

También podría gustarte