Está en la página 1de 28

Notas de teorı́a de juegos

Julio Cesar Macı́as Ponce


Aarón Guillén Villalobos
17 de marzo de 2020

Índice
1. Teorı́a de juegos 3
1.1. Estrategias, preferencias y racionalidad . . . . . . . . . . . . . 3
1.2. Juegos en forma extensiva . . . . . . . . . . . . . . . . . . . . 4
1.3. Juegos en forma estratégica . . . . . . . . . . . . . . . . . . . 6
1.4. Un ejemplo importante en la literatura: . . . . . . . . . . . . . 7
1.4.1. El Dilema del prisionero . . . . . . . . . . . . . . . . . 7
1.4.2. Más ejemplos . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3. Cuando hay movimientos del azar: . . . . . . . . . . . 8
1.4.4. Juegos con más de dos jugadores . . . . . . . . . . . . 8
1.5. Juegos estáticos con información completa . . . . . . . . . . . 8
1.5.1. Estrategias dominadas y dominantes . . . . . . . . . . 9
1.5.2. Solución de un juego . . . . . . . . . . . . . . . . . . . 9
1.5.3. Solución por eliminación de estrategias estrictamente
dominadas . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6. Equilibrio de Nash (Estrategias puras) . . . . . . . . . . . . . 10
1.7. Tres modelos clásicos de duopolio . . . . . . . . . . . . . . . . 11
1.7.1. Modelo de Cournot . . . . . . . . . . . . . . . . . . . . 11
1.7.2. Modelo de Bertrand . . . . . . . . . . . . . . . . . . . 12
1.7.3. Modelo de Hotelling . . . . . . . . . . . . . . . . . . . 12
1.7.4. Eficiencia de Pareto . . . . . . . . . . . . . . . . . . . . 14
1.8. Estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 14
1.8.1. Juegos bipersonales de suma cero . . . . . . . . . . . . 15
1.8.2. La programación lineal y los juegos de suma cero . . . 16
1.8.3. Juegos Bipersonales (en general) . . . . . . . . . . . . . 18
1.8.4. Teorema de Nash (juegos en forma estratégica con k
jugadores) . . . . . . . . . . . . . . . . . . . . . . . . . 19

1
2. Juegos dinámicos con información completa 19
2.0.1. Equilibrios de Nash . . . . . . . . . . . . . . . . . . . . 20

3. Juegos estáticos con información incompleta 23


3.1. Juegos Bayesianos . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1.1. Equilibrios bayesianos en estrategias mixtas . . . . . . 25
3.2. Juegos dinámicos con información incompleta . . . . . . . . . 26
3.2.1. Equilibrio bayesiano perfecto . . . . . . . . . . . . . . . 26
3.2.2. Juegos de señalización. . . . . . . . . . . . . . . . . . . . 27
3.2.3. El equilibrio bayesiano perfecto en el juego de señali-
zación . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2
1. Teorı́a de juegos
Teorı́a de juegos es una formal disciplina matemática que estudia situa-
ciones de competencia y cooperación entre varios agentes (jugadores).
Podemos encontrar diversas aplicaciones de la teorı́a de juegos, incluso
en el Talmud se reconocen modelos de la teorı́a de juegos que en la actua-
lidad los identificamos como problemas de bancarrota. Las aplicaciones que
abordaremos en este curso serán relacionados con la economı́a.
Los primeros trabajos reconocidos en la teorı́a de juegos se deben a Emile
Borel y John von Neumann. El libro “Game theory and Economic behavior”
publicado por von Neumann y Oskar Morgenstern establecen los fundamentos
de la teorı́a.
En 1950 John F. Nash desarrolla el concepto de Equilibrio de Nash que
poco después se uso en Teorı́a Económica, Ciencia Polı́tica, Psicologı́a, etc;
en 1970 se uso como herramienta en Biologı́a evolutiva. En 1994 Harsanyi,
Nash y Selten obtienen el Premio Nobel de Economı́a.
Los juegos cooperativos y no cooperativos se distinguen en que en los
primeros hay acuerdos vinculantes entre los agentes. Comenzaremos con el
estudio de los juegos no cooperativos - donde no se permiten acuerdos vin-
culantes -.

1.1. Estrategias, preferencias y racionalidad


Los modelos de teorı́a de juegos que estudiaremos involucra a un conjunto
de jugadores, un conjunto de estrategias que pueden seguir (un conjunto de
estrategias por jugador) y preferencias identificados ante los distintos perfiles
de estrategias de los jugadores., ante dos perfiles de estrategias, cada jugador
identifica cual es lo mejor para él -o si los dos perfiles son indiferentes-.
Además las preferencias son consistentes en el sentido de que si se prefiere
“a” a “b” y “b” a “c” entonces se prefiere “a” a “c”.
Una manera de representar las preferencias es por medio de una función
de pago. La función asigna un número real para cada jugador en cada perfil
de estrategias.

Además se asumirá que los jugadores son racionales: El objetivo de cada


individuo es maximizar su bienestar y no excluye la posibilidad de que el
bienestar de un individuo dependa de la situación de otros individuos y, por
tanto admite la posibilidad de comportamientos altruistas. El hecho de que
los individuos son racionales es de conocimiento público; es decir, todos lo

3
saben, todos saben que todos lo saben, todos saben que todos saben que
todos lo saben...(ad infinitum).

1.2. Juegos en forma extensiva


Los elementos de un juego son:

1. El conjunto de jugadores J = {0, 1, ..., n} cuando ”participa.el azar o la


naturaleza y J = {1, ..., n} en caso contrario.
2. Sea X el conjunto de nodos. Un nodo representa una posible situación
del juego. Entre los nodos se distingue uno que se le llama la raı́z de
juego y que denotaremos por o. Definimos la función:

σ:X→X

En donde σ(o) = o, y para x 6= o, σ(x) es el nodo inmediato predecesor


(iterando σ(x) se obtienen todos los nodos predecesores de x). Sea
s(x) = σ −1 (x), el conjunto de nodos que siguen inmediatamente a x. Un
nodo es terminal si no le sigue ningún otro nodo y en caso contrario se le
llama nodo de decisión. Ası́ pues, definimos y denotamos los conjuntos
de nodos terminales y de decisión como T (X) = {x ∈ X : s(x) = φ} y
D(X) = {x ∈ X : s(x) 6= φ} respectivamente.
3. Denotemos con A al conjunto de todas las posibles acciones, definimos
una función
α : X \ {o} → A
que hace corresponder a cada nodo distinto del origen aquella acción
0 00
α(x) que lleva del nodo σ(x) a x. Se verifica que si x , x ∈ s(x),
0 00 0 00
siendo x 6= x , entonces α(x ) 6= α(x ). Para cualquier x ∈ D(X),
representamos el conjunto de acciones disponibles a partir de x por
n 0 0
o
A(x) = a ∈ A : ∃x ∈ s(x) con a = α(x )

4. Para cada i ∈ J sea Xi el conjunto de nodos de decisión en los que el


jugador i tiene que elegir una acción.
S En cada nodo de decisión solo
“mueve” un jugador. Se tiene que Xi = D(X). ∀i, j ∈ J, con i 6= j
i∈J
se verifica que Xi ∩ Xj = φ. Ası́ {Xi }i∈J constituye una partición del
conjunto D(X).

4
5. Una familia de conjuntos de información H, y una función h : D(X) →
H que asigna a cada nodo x un conjunto de información h(x) al que per-
tenece. Los conjuntos de información forman una partición de D(X).
Todos los nodos de decisión que tienen a un mismo conjunto de infor-
mación tienen las mismas acciones disponibles, es decir:

A(x) = A(x0 ) si h(x) = h(x0 )

Sea
A(h(x)) = {a ∈ A : a ∈ A(y) para y ∈ h(x)}
A(h(x)) es el conjunto de acciones disponibles para el conjunto de in-
formación h(x). Con Hi denotaremos al conjunto de todos los conjuntos
de información del jugador i; y con H al conjunto que contiene a todos
los conjuntos
S de información contenidos en los Hi , para i ∈ J. Es decir
H= Hi .
i∈J

6. Una función ρ : H0 × A → [0, 1] que asigna probabilidades a acciones


en conjuntos de información donde .el movimientoçorresponde al azar
o a la naturaleza. Se tiene que verificar que:

ρ(h, a) = 0 ∀a ∈
/ A(h(0))
X
ρ(h, a) = 1 ∀h ∈ H0
a∈A(h(o))

7. Una función de pagos


r : T (X) → Rn
donde ri (x) indica el pago o utilidad que recibe el jugador i si se ha
alcanzado el nodo x.

Definición 1.2.1. Un juego en forma extensiva Γ viene especificado por los


siguientes elementos

Γ = J, (X, σ) , (A, α) , {Xi }i∈J , {Hi }i∈J , A(h(x))h∈H , ρ, r

Nota 1.1. Cuando no hay “jugador cero” (no existen movimientos de azar)
se omite la función ρ.

5
1.3. Juegos en forma estratégica
Definición 1.3.1. Una estrategia pura para el jugador i ∈ J es una función
que
si : Hi → A
con si (h) ∈ A(h).
Sea Si el conjunto de todas las estrategias puras del jugador i y supon-
gamos que no existen movimientos de azar; dada una estrategia si ∈ Si para
cada i ∈ J queda determinado un desarrollo completo del juego, llegándose
a un nodo terminal. Se dice que s = (s1 , ..., sn ) ∈ S1 × ... × Sn = S es un
perfil o una combinación de estrategias puras.
Sea η(s) el nodo terminal que se alcanza con el perfil s y sea ui (s) =
ri (η(s)) el pago que recibe el jugador i en η(s)
Definición 1.3.2. Un juego en forma estratégica (o en forma normal) G se
define con una terna:

G = J, (Si )i∈J , (ui )i∈J
Ejercicio 1.1. En el siguiente juego encuentre el conjunto de estrategias
puras para cada uno de los jugadores, ası́ como los pagos que recibe cada uno
de los jugadores para cada combinación de estrategias puras.

Nota 1.2. Cuando se tienen dos jugadores, con un número finito de estrate-
gias para cada jugador la representación estratégica del juego se puede hacer
mediante una matriz:

J = {1, 2}
S1 = s11 , . . . , sl1


S2 = s12 , . . . , sm

2

Jug 2
s12 s22 ··· sm2
s11 u1 (s1 , s2 ), u1 (s1 , s2 ) u1 (s11 , s22 ), u1 (s11 , s22 )
1 1 1 1
··· u1 (s11 , sm 1 m
2 ), u1 (s1 , s2 )
Jug 1 s21 u1 (s21 , s12 ), u1 (s21 , s12 ) u1 (s21 , s22 ), u1 (s21 , s22 ) ··· u1 (s21 , sm 2 m
2 ), u1 (s1 , s2 )
.. .. .. ... ..
. . . .
sl1 u1 (sl1 , s12 ), u1 (sl1 , s12 ) u1 (sl1 , s22 ), u1 (sl1 , s22 ) · · · u1 (sl1 , sm l m
2 ), u1 (s1 , s2 )

6
Para el ejercicio anterior tenemos...

1.4. Un ejemplo importante en la literatura:


1.4.1. El Dilema del prisionero
Dos sospechosos de un crimen mayor son separados e interrogados en
celdas diferentes. A ello se les encontró haciendo un delito menor pero con
los interrogatorios se quiere involucrarlos en el crimen mayor (que sólo los
delincuentes saben que lo cometieron). En el interrogatorio se les promete
disminuir las sentencias si cooperan con las autoridades. Cada uno de ellos
tiene dos opciones: confesar o quedarse callado.
La siguiente tabla muestra la utilidad que se les asignarán de acuerdo a
si confiesan o no.

Sospechoso 2
Callar Conf esar
Sospechoso 1 Callar (−1, −1) (−5, 0)
Conf esar (0, −5) (−4, −4)

1.4.2. Más ejemplos


Dos empresas automovilı́sticas deciden lanzar al mercado al mismo
tiempo un modelo de coche de gama intermedia. Cada una de ellas
se está planteando si ofrecer o no financiación a los clientes, lo cual le
supondrı́a captar mayor cuota de mercado, pero llevarı́a consigo ciertos
costos. Ambas empresas prefieren no ofertar dicha financiación, pero ca-
da una teme que la otra la ofrezca y, por tanto, acapare mayor número
de compradores. Supongamos que los beneficios esperados por las em-
presas son los siguientes. Si ambas ofrecen financiación, 400 millones
para cada una; si ninguna lo hace, 600 para cada una, y si una la ofrece
y la otra no, la primera gana 800 y la segunda 300.

La Guerra de los sexos

7
MUJER
Fútbol Concierto
HOMBRE Fútbol (2,1) (0,0)
Concierto (0,0) (1,2)

1.4.3. Cuando hay movimientos del azar:


En este caso la utilidad del i-ésimo jugador para cada perfil de estrategias
ui (s1 , ..., sn ) es un valor esperado.
Ejemplo:

1.4.4. Juegos con más de dos jugadores


Ejemplo: (el problema de la tv de paga)

1.5. Juegos estáticos con información completa


Estos juegos se representan de manera natural en forma estratégica, ya
que los jugadores realizan sus jugadas de manera simultanea.
Además se supone que es de dominio público el conocimiento de la es-
tructura del juego: Todos los jugadores conocen las estrategias o acciones
disponibles para cada jugador y las ganancias resultantes de cada combina-
ción de acciones y además todos saben que todos las conocen, y todos saben
que todos saben que todos las conocen. . . y ası́ sucesivamente.

Notación: Dado un perfil de estrategias s = (s1 , ..., sn ) ∈ S1 ×...×Sn = S


denotaremos con

s−i = (s1 , . . . , si−1 , si+1 , . . . , sn ) ∈ S1 × · · · × Si−1 × Si+1 × · · · × Sn

A la combinación de estrategias de los n − 1 (jugadores diferentes a i)


para el perfil s. Y

S−i = S1 × . . . × Si−1 × Si+1 × ... × Sn

será el conjunto de todas las combinaciones de estrategias de los n − 1 juga-


dores.
Dado un juego G = {J, (Si )i∈J , (ui )i∈J } si los conjuntos J, S1 , . . . , Sn son
finitos decimos que G es un juego finito.

Ejemplos:

8
El dilema del prisionero
La guerra de los sexos
Halcón-Paloma
La caza del ciervo

1.5.1. Estrategias dominadas y dominantes


Sea G = J, (Si )i∈J , (ui )i∈J un juego y sean s0i y s00i dos estrategias para


el jugador i.
Decimos que s00i domina débilmente a s0i si la desigualdad
ui (s1 , . . . , si−1 , s0i , si+1 , . . . , sn ) ≤ ui (s1 , . . . , si−1 , s00i , si+1 , . . . , sn )
se cumple para toda combinación de estrategias s−i de los otros ju-
gadores, y para alguna de esas combinaciones se cumple de manera
estricta.
Decimos que s00i domina estrictamente a s0i si la desigualdad
ui (s1 , . . . , si−1 , s0i , si+1 , . . . , sn ) < ui (s1 , . . . , si−1 , s00i , si+1 , . . . , sn )
se cumple para toda combinación de estrategias s−1 de los otros juga-
dores.
Decimos que s0i es no dominada débilmente si no existen estrategias del
jugador i que la dominen débilmente y decimos que s0i es no dominada
estrictamente si no existen estrategias del jugador i que la dominen.

1.5.2. Solución de un juego


A diferencia de los problemas de optimización, donde hay una decisión
individual, en los juegos (problemas de decisión de varios agentes) el con-
cepto de solución involucra utilidades o pagos de todos los agentes y en este
sentido no es sencillo definir “la mejor solución”-¿para quién?-.

Podemos llamar solución a un conjunto de perfiles de estrategias tal que


es razonable esperar que los jugadores decidirán perfiles pertenecientes a
dicho conjunto. Ası́ púes, buscaremos procedimientos que permitan obtener
los perfiles razonablemente esperados. Cada procedimiento será una solución
-un concepto de solución-.

9
1.5.3. Solución por eliminación de estrategias estrictamente do-
minadas
Se trata de ir eliminado estrategias estrictamente dominadas, la impor-
tancia de que sean “estrictas” se justifica en el hecho de que si procedemos
a eliminar estrategias estricta y débilmente dominadas puede ocurrir lo si-
guiente:

(ejemplo de clase)

1.6. Equilibrio de Nash (Estrategias puras)


Definición 1.6.1. Dado un juego G = J, (Si )i∈J , (ui )i∈J , un perfil s∗ =


(s∗1 , . . . , s∗i , . . . , s∗n ) es un equilibrio de Nash (EN) si para cada jugador i se


verifica que
ui (s∗1 , . . . , s∗i−1 , s∗i , s∗i+1 , . . . , s∗n ) ≥ ui (s∗1 , . . . , s∗i−1 , si , s∗i+1 , . . . , s∗n )
para toda si ∈ Si .

Funciones de mejor respuesta

El concepto de equilibrio de Nash identifica los perfiles de estrategias que


son estables, en el sentido de que ningún jugador quiera desviarse, si espera
que los demás adopten las acciones que se prescribe para ellos. El equilibrio
de Nash indica el desenlace predecible del juego y puede interpretarse como
un “acuerdo” o una “norma” que tiene la propiedad de que es autosostenible:
una vez aceptado, ningún jugador tiene incentivos para modificarlo unilate-
ralmente. Otra interpretación interesante contempla al concepto de equilibrio
de Nash como perfiles de expectativas que se “auto confirman”, en el sentido
de que si los jugadores esperan que los demás se comporten de acuerdo con
lo prescrito, entonces estas acciones ocurren como consecuencia de la con-
ducta óptima de los jugadores; es decir, las expectativas de los jugadores son
“racionales” porque son consistentes con la conducta racional.
Un equilibrio de Nash se caracteriza porque cada jugador responde ópti-
mamente a las estrategias de los demás jugadores. Esta interpretación per-
mite reformular el concepto de equilibrio de Nash como una solución a un
sistema de ecuaciones.

Definición 1.6.2. Dado un juego G = J, (Si )i∈J , (ui )i∈J , para cada juga-
dor i, y para cada perfil s−i (para los demás jugadores) definimos la función
de mejor respuesta Ri (s−i ) como sigue:
Ri (s−i ) = {si ∈ Si : ui (s1 , ...si−1 , si , si+1 ..., sn ) ≥ ui (s1 , ...si−1 , si , si+1 ..., sn )∀si ∈ Si }

10
Lemma 1.2. Un perfil de estrategia s∗ = (s∗1 , . . . , s∗n ) es un equilibrio de
Nash si, y solo si para cada i, s∗i ∈ Ri (s−i )

1.7. Tres modelos clásicos de duopolio


A continuación se presentan juegos donde los jugadores son empresas,
cada empresa toma una decisión sin conocer la decisión de su rival y a conti-
nuación obtiene beneficios que dependen de las decisiones de ambas empresas
involucradas, lo que marca el final del juego.

1.7.1. Modelo de Cournot


Dos empresas producen bienes idénticos y deben decidir cuantas unida-
des producir –hay una infinidad de estrategias–. El costo para la firma i de
producir qi unidades es Ci (qi ) = cqi donde c es el costo unitario de pro-
ducción. Sea Q = q1 + q2 la cantidad de productos en el mercado y sea
P (Q) el precio en el mercado; P es llamada la función inversa de demanda;
ası́, los ingresos de la empresa i es qi P (q1 + q2 ) y por tanto la utilidad es
ui (q1 , q2 ) = qi P (q1 + q2 ) − cqi .
La función P se define como

α − Q si Q ≤ α
P (Q) =
0 si Q > α
donde α > 0 y c > 0 son constantes. Se supone que c < α. Luego

q1 (α − c − q1 − q2 ) si q1 + q2 ≤ α
u1 (q1 , q2 ) =
−cq1 si q1 + q2 ≥ α
y 
q2 (α − c − q1 − q2 ) si q1 + q2 ≤ α
u2 (q1 , q2 ) =
−cq2 si q1 + q2 ≥ α
Encontraremos los equilibrios de Nash por medio del argumento “la mejor
respuesta”.
Si el jugador 2 produce q2 entonces se quiere máx{u1 (q1 , q2 )}. Si q2 = 0
q1 ∈R
la función a maximizar es

q1 (α − c − q1 ) si q1 ≤ α
g(q1 ) =
−cq1 si q1 ≥ α
α−c
Y el máximo se da en q1 = y
2
   
α−c α−c (α − c)
u1 ,0 = g =
2 2 2

11
.
Si q2 > 0 tenemos que el máximo se alcanza en 12 (α − c − q2 ) si q2 ≤ α − c
y 0 si q2 > α − c.
La función de mejor respuesta para el jugador 2, es la misma a la firma
1, luego para obtener el equilibrio de Nash resolvemos el siguiente sistema:
1
q1 = (α − c − q2 )
2
1
q2 = (α − c − q1 )
2
cuya solución es q1∗ = q2∗ = α−c
3

1.7.2. Modelo de Bertrand


Dos empresas producen bienes idénticos y deben decidir qué precio cobrar
por su producto. Cada empresa fija su precio sin conocer el precio fijado de
su rival. El precio que se puede cobrar es cualquier número real – hay una
infinidad de estrategias –.
El costo para la firma i de producir qi unidades es Ci (qi ) = cqi donde c
es el costo unitario de producción. Ahora tenemos una función de demanda
que depende del precio: D(p) = α − p para p ≤ α y D(p) = 0 si p > α, y
c < a. Luego

 (pi − c)(α − pi ) si pi < pj
(pi −c)(α−pi )
ui (p1 , p2 ) = 2
si pi = pj
0 si pi > pj

donde j = 2 si i = 1 y j = 1 si i = 2.
¡ El único equilibrio de Nash es (c, c)!

1.7.3. Modelo de Hotelling


Al igual que en el modelo anterior, se trata de que las empresa fijen
precios pero desde el punto de vista del consumidor los productos pueden ser
diferentes. Por ejemplo, aunque las dos empresas vendan el mismo producto
la distancia de las tiendas o la facilidad de compra los diferencia ante el
consumidor.
En este sentido, el siguiente modelo considera la demanda como función
de los precios y localización de las empresas.
Supongamos que las empresas se sitúan en una avenida en linea recta de
longitud 1, la empresa 1 se sitúa en α y la empresa 2 en β con 0 ≤ α ≤ β ≤ 1.

12
Si ambas empresas ofrecen el mismo producto al mismo precio, el con-
sumidor elige la tienda más cerca. Suponemos que los consumidores están
distribuidos de manera uniforme en la avenida y que cada consumidor decide
tomando en cuenta el precio que tendrá que pagar por el bien y el costo por
tener que trasladarse.
Ası́, un consumidor que esté a una distancia di de la empresa i tendrá un
costo td2i . Sea S el beneficio que proporciona el producto, luego la utilidad
del consumidor será de S − td2i − pi . Por tanto, un consumidor situado en un
punto x preferirá comprar en la tienda 1 si

S − t (x − α)2 − p1 > S − t (x − β)2 − p2

Luego el punto de indiferencia para el consumidor es


β−α p 2 − p1
x∗ = α + +
2 2t(β − α)

Ası́, ya que los consumidores a la izquierda de x∗ preferirán la empresa 1


a la 2, entonces la función de utilidad está dada por:
 
β−α p2 − p1
u1 (p1 , p2 ) = (p1 − c) α + +
2 2t (β − α)
 
β−α p1 − p2
u2 (p1 , p2 ) = (p2 − c) 1 − β + +
2 2t (β − α)
El Equilibrio de Nash se obtiene de resolver el sistema de ecuaciones:
β − α p2 − 2p1 + c
α+ + =0
2 2t (β − α)
β + α p1 − 2p2 + c
1− + =0
2 2t (β − α)
cuya solución es

t (β − α) (α + β + 2)
p1 = c +
3
t (β − α) (4 − α − β)
p2 = c +
3

13
1.7.4. Eficiencia de Pareto
Nota 1.3. Mientras no se especifique lo contrario, el número de jugadores
(diferentes a la naturaleza) será n. Es decir J = {1, ..., n}.

Dado un juego G = {J, (Si )i∈J , (ui )i∈J } definimos lo siguiente:

Un perfil s = (s1 , ..., si , ..., sn ) está dominado en el sentido de Pareto


por el perfil s0 = (s01 , ..., s0i , ..., s0n )si y sólo si se verifica lo siguiente:

ui (s0 ) ≥ ui (s) ∀i ∈ J
y existe un k ∈ J tal que

uk (s0 ) > uk (s) ∀i ∈ J

Un perfil s = (s1 , . . . , si , . . . , sn ) es un óptimo de Pareto (o eficiente


en el sentido de Pareto) si y sólo si no está dominado en el sentido de
Pareto por ningún otro Perfil. Diremos que s es ineficiente de Pareto si
algún otro lo domina.

En un equilibrio de Pareto ningún jugador puede mejorar sin perjudicar


a otro.

Ejemplo 1.3. El Equilibrio de Nash no es óptimo de Pareto en el dilema


del prisionero pero los Equilibrios de Nash en la guerra de los sexos si
son óptimos de Pareto.

1.8. Estrategias mixtas


Definición 1.8.1. Una estrategia mixta para el jugador i, es una distribución
de probabilidad sobre el conjunto de estrategias puras Si . Es decir, si Si =
{s1i , . . . , ski }, llamamos estrategia mixta del jugador i a cada k-tupla σi =
(σi1 , . . . , σik ). Cuyas componentes son números reales no negativos que suman
1. Se interpreta σi como la estrategia que consiste en que la estrategia pura
sli se juega con probabilidad σil para l ∈ {1, ..., k} .

Al conjunto de estrategias mixtas del jugador i lo denotaremos por ∆(Si ).


( k
)
X
∆(Si ) = σi = (σi1 , . . . , σik ) : σil con l ∈ {1, . . . , k} y σil = 1
l=1

14
Definición 1.8.2. La utilidad esperada para el jugador i para el perfil de
estrategias mixtas σi = (σ1 , . . . , σn ) es:
X
E [ui (σ1 , . . . , σn )] = ui (s) · σ1 (s) · · · σn (s)
s=(s1 ,...,sn )∈S

Definición 1.8.3. Un perfil de estrategias mixtas σ ∗ = (σ1∗ , . . . , σn∗ ) es un


Equilibrio de Nash en estrategias mixtas si

E [ui (σ1∗ , . . . , σn∗ )] ≥ E [u(σ1∗ , . . . , σi , . . . , σn∗ )]

para cada i ∈ J = {1, ..., n} y para toda estrategia mixta σi .


Ejercicio 1.4. ....
Teorema 1.5. (Principio de indiferencia) Dado un juego G = {J, (Si )i∈J , (ui )i∈J },
si σ ∗ = (σ1∗ , . . . , σn∗ ) es un equilibrio de Nash y supongamos que para el juga-
dor i existen dos estrategias ski , sli con σi∗ (ski ) · σi∗ (sli ) > 0 entonces
∗ ∗
E ui (ski , σ−i ) = E ui (sli , σ−i
   
)

1.8.1. Juegos bipersonales de suma cero



Definición 1.8.4. Dado un juego G = J, (Si )i∈J , (ui )i∈J si J = {1, 2} y

u1 (s1 , s2 ) = −u1 (s1 , s2 ) ∀ (s1 , s2 ) ∈ S1 × S2

decimos que G es un juego bipersonal de suma cero.


En los juegos de suma cero, denotaremos con A a la matriz de recompensa
del jugador 1 (la matriz B correspondiente a la recompensa del jugador 2 no
se escribe, obsérvese que A = −B).
Si |S1 | = m y |S2 | = n entonces A es una matriz de m × n.
Definición 1.8.5. Dado un juego bipersonal de suma cero, decimos que un
vector p = (p1 , . . . , pm ) ∈ ∆(S1 ) es una estrategia maximin para el jugador 1
si

mı́n{pAq q = (q1 , . . . , qn ) ∈ ∆(S2 )} ≥ mı́n{p0 Aq q = (q1 , . . . , qn ) ∈ ∆(S2 )}


para cada p0 ∈ ∆(S1 ). Y decimos que un vector q = (q1 , ..., qn) ∈ ∆(S2 ) es
una estrategia minimax para el jugador 2 si

máx{pAq q = (q1 , . . . , qn ) ∈ ∆(S2 )} ≤ máx{pAq 0 p = (p1 , . . . , pm ) ∈ ∆(S1 )}


para cada q 0 ∈ ∆(S2 ).

15
Von Neumann mostró que para todo juego bipersonal de suma cero G
(con matriz A) existe un numero real v(A) con las siguientes propiedades:

Una estrategia p del jugador 1 garantiza un pago de al menos v para


el jugador 1 si y solo si p es una estrategia maximin.

Una estrategia q del jugador 2 garantiza un pago de a lo mas v para el


jugador 1 si y solo si q es una estrategia minimax.

A v se le llama el valor del juego (y u1 (p, q) = v si p y q son estrategias


maximin y minimax respectivamente;nótese que (p, q) ≈ equilibrio de Nash).

Definición 1.8.6. Dado un juego bipersonal G decimos que aij es un punto


silla si se verifica que

aij ≥ akj ∀k ∈ {1, . . . , m}

y
aij ≤ aik ∀k ∈ {1, . . . , n}
Es claro que si aij es un punto silla entonces las estrategias puras i y j son
estrategias maximin y minimax respectivamente y v(A) = aij .

Ejercicios

1.8.2. La programación lineal y los juegos de suma cero


Sea G un juego bipersonal de suma cero entonces tenemos el siguiente
resultado

Teorema 1.6. Sea Zp el valor optimo del siguiente modelo de programación


lineal
máx Z
s.a.
m
X
pi u1 (si , sj ) ≥ Z ∀j ∈ {1, ..., n}
i=1
m
X
pi = 1 pi ≥ 0
i=1

Entonces Zp es el valor del juego G.

16
Demostración. Sea v el valor del juego, mostraremos primero que Zp ≥ v.
Por ser v el valor del juego, entonces existe un p∗ tal que
E [u1 (p∗ , q)] ≥ v ∀q ∈ ∆(S2 )
en particular
E [u1 (p∗ , s2 )] ≥ v ∀s2 ∈ S2
Pero Zp es el valor máximo para el que se cumplen las desigualdades, luego
Zp ≥ v. Ahora mostraremos la desigualdad Zp ≤ v. Primero mostraremos
que la solución del modelo de programación lineal es acotada: Sean p1 , . . . , pm
y z una solución factible del modelo de programación lineal.
Entonces m
X
Z≤ pi u1 (si , sj ) ∀j ∈ {1, . . . , n}
i=1
y
m
X
pi = 1
i=1
luego,

m
X
Z≤ pi u1 (si , sj )
i=1
≤ máx máx |u1 (si , sj )| × (p1 + · · · + pm )
s1 ∈S1 s2 ∈S2

= máx máx |u1 (si , sj )| < ∞


s1 ∈S1 s2 ∈S2

y como Zp es el valor optimo entonces existe un p∗ tal que


m
X
p∗i u1 (si , sj ) ≥ Zp ∀j ∈ {1, . . . , n}
i=1

pero por la propiedad de multilinealidad de la utilidad (ejercicio de tarea)


tenemos que
Xm
p∗i u1 (si , q) ≥ Zp ∀q ∈ ∆(S2 )
i=1
luego v ≥ Zp .
Definición 1.8.7. Dado un juego bipersonal G decimos que la estrategia pura
i (ei ) del jugador 1 es estrictamente dominada si existe p = (p1 , . . . , pm ) ∈
∆(S1 ) con pi = 0 tal que
pAej > ei Aej ∀j ∈ {1, . . . , n}

17
Similarmente, la estrategia pura j (ej ) del jugador 2 es estrictamente
dominada si existe q = (q1 , . . . , qm ) ∈ ∆(S2 ) con qj = 0 tal que

ei Aq < ei Aej ∀i ∈ {1, . . . , m}

Ejemplo 1.7. Para  


6 0 2
A = 0 5 4
3 2 1
7 5
la estrategia 3 del jugador 1 está dominada por p = ( 12 , 12 , 0) ya que pA =
7 25 17 3
( 2 , 12 , 6 ) y e A = (3, 2, 1). Eliminando dicha estrategia tenemos
 
6 0 2
B=
0 5 4
1 3

pero ahora la estrategia 3 del jugador 2 está dominada por q = 4
, 4
, 0 ya
3
  
2
que Bq t = 2
15 y Be3 = Eliminando dicha estrategia tenemos
4
4
 
6 0
C=
0 5

¡El problema está resuelto !

1.8.3. Juegos Bipersonales (en general)


Sea G un juego (no necesariamente de suma cero) y sean A y B las matri-
ces correspondientes a las utilidades de los jugadores 1 y 2 respectivamente.
Entonces podemos caracterizar los Equilibrios de Nash como sigue:
Sea (p∗ , q ∗ ), es un equilibrio de Nash si

p∗ Aq ∗ ≥ p0 Aq ∗ ∀p0 ∈ ∆(S1 )

y
p∗ Bq ∗ ≥ p∗ Bq 0 ∀q 0 ∈ ∆(S2 )
¡p∗ es la mejor respuesta ante q ∗ y q ∗ es la mejor respuesta ante p∗ !
Nota 1.4. Un juego bipersonal de suma constante es aquel que satisface que

aij + bij = c ∀(i, j) ∈ {1, . . . , m} × {1, . . . , n}

y se puede trasformar a un juego de suma cero (o tratar como un juego


bipersonal en general)

18
Dado un juego bipersonal G decimos que la estrategia pura i (ei ) del
jugador 1 es estrictamente dominada si existe p = (p1 , . . . , pm ) ∈ ∆(S1 ) con
pi = 0 tal que
pAej > ei Aej ∀j ∈ {1, . . . , n}
Similarmente, la estrategia pura j (ej ) del jugador 2 es estrictamente domi-
nada si existe q = (q1 , . . . , qm ) ∈ ∆(S2 ) con qj = 0 tal que

ei Bq > ei Bej ∀i ∈ {1, . . . , m}

1.8.4. Teorema de Nash (juegos en forma estratégica con k juga-


dores)
Teorema 1.8. Todo juego G en forma estratégica con un numero finito de
jugadores y cada jugador con un numero finito de estrategias puras tiene al
menos un E.N. (en estrategias mixtas “o puras”).

2. Juegos dinámicos con información comple-


ta
Ahora estudiaremos juegos en los que los jugadores pueden tomar deci-
siones en distintos instantes del tiempo y donde cada jugador conoce con
certeza las funciones de pagos de todos los jugadores. La forma natural de
representar a estos juegos es la forma extensiva.
Recordemos que en un juego de forma extensiva se debe precisar:
1. Quiénes son los jugadores.

2. Cuando tiene que jugar cada jugador.

3. Qué cosas puede hacer cuando le toca jugar (acciones factibles)

4. Qué sabe dicho jugador, cuando le toca jugar, acerca del desarrollo
previo del juego.

5. A cuánto asciende la ganancia de cada jugador para cada posible desa-


rrollo del juego.
Definición 2.0.1. Sea G un juego de información completa (la estructura y
los pagos del juego son de dominio público). Decimos que G es de informa-
ción perfecta si cada conjunto de información de cualquiera de los jugadores
tiene un único elemento. En caso contrario decimos que es de información
imperfecta.

19
Ejemplo 2.1. Consideremos el siguiente juego: Una empresa nueva quiere
entrar al mercado para hacerle competencia a la única empresa establecida.
Está ultima amenaza con bajar los precios (aunque ambas pierdan) para per-
judicar a la empresa entrante. El siguiente árbol representa al juego. . .
Ejemplo 2.2. Juego de confianza. . .

2.0.1. Equilibrios de Nash


Para el juego de la empresa única que amenaza a una posible competencia,
la forma estrategica de este juego estarı́a representada por:

Vieja empresa
Guerra Aceptar
Nueva Empresa Entrar (0,-10) (10,10)
No Entrar (0,20) (0,20)

Observemos que (No Entrar, Guerra) y (Entrar, Aceptar) son Equilibrios


de Nash. Sin embargo desde una “perspectiva temporal”, (Entrar, Aceptar)
es más razonable.
Definición 2.0.2. Dado un juego G con información completa en forma
extensiva y un nodo de decición x, decimos que G∗ es es un subjuego de G
con inicio en x si G∗ es una parte de G que cumple lo siguiente:
1. Contiene al nodo x y a todos los nodos que siguen a x, y sólo a ellos.

2. El nodo x es un conjunto de información unitario.

3. Si el nodo y pertenece a G0 , también pertenecen a G0 todos los nodos


del conjunto de información al que pertenece y, es decir, G0 no rompe
ningún conjunto de información.
Observaciones:

Es evidente que el propio G es siempre un subjuego de G. Llamamos


subjuegos propios de G a aquellos subjuegos que no coinciden con G.

Si G es de información perfecta, cualquier parte que comience en un


nodo de decisión y contenga todos los nodos que le siguen es un sub-
juego.

Un subjuego puede empezar en un nodo de azar, porque dicho nodo es


un conjunto de información unitario.

20
También se consideran subjuegos aquellos en los que ya sólo va a in-
tervenir uno de los jugadores.

Los juegos estáticos representados en forma extensiva no tienen ningún


subjuego propio, ya que el único conjunto de información unitario que
tienen es el nodo inicial.

Definición 2.0.3. Sea s un perfil de estrategias de G que es un equilibrio de


nash. Decimos que s es un Equilibrio de Nash Perfecto en Subjuegos (ENPS)
de G si la restricción de s a cualquier subjuego de G es un EN de dicho
subjuego.
Definición 2.0.4. Sea r un resultado o desarrollo posible de G. Decimos que
r es un Resultado Perfecto en Subjuegos (RPS) de G si r puede obtenerse
como realización de un perfil s que es un ENPS.

En el juego de la empresa única que ameza a una posible competencia


solo hay un subjuego propio que comienza en el nodo de decisión de la vieja
empresa. En dicho subjuego con jugador único el equilibrio de nash corres-
ponde a que la vieja empresa acepte la competencia y por tanto serán ENPS
del juego global aquellos equilibrios de nash del juego global cuya restricción
al juego propio sea “aceptar la competencia”.

Algoritmo de inducción hacia atrás

1. Se identifican todos los subjuegos que se producen en último lugar (es


decir,aquellos que comienzan en los nodos de decisión que sólo preceden
a nodos terminales. Estos subjuegos tienen un único jugador, y su EN
es por definición la acción óptima de dicho jugador). A continuación
se elimina cada uno de esos subjuegos, salvo su nodo de comienzo, y
se considera que dicho nodo pasa a ser nodo terminal del juego global,
y se le atribuyen los pagos que se habrı́an hecho efectivos de haberse
jugado la acción óptima correspondiente a ese nodo. De esta manera se
han podado las últimas ramas del árbol del juego global inicial, y nos
encontramos con un árbol más corto.

2. Se repite con el árbol reducido lo dicho en la etapa anterior, y se con-


tinúa con este proceso hasta que se llega al nodo inicial del juego de
partida.

21
Nota 2.1. En caso de que en algún nodo de decisión haya varias acciones
óptimas, el proceso sólo cambia en el hecho de que habrı́a que considerar
todas las posibilidades. Es decir, habrı́a que formar tantos árboles reducidos
para la etapa siguiente del análisis (anterior en el tiempo) como combinacio-
nes hubiera de acciones óptimas en la etapa actual. Al final, obtendrı́amos
varios resultados perfectos en subjuegos posibles y varios equilibrios de Nash
perfectos en subjuegos, uno por cada proceso de poda diferente.
Por otra parte, si en algún nodo de decisión hay un número infinito de ac-
ciones, pero manteniendo finita la longitud de cualquier desarrollo posible del
juego, el proceso sigue siendo válido siempre que, en cada nodo de decisión,
exista alguna acción factible óptima.
Teorema 2.3. Cada juego finito con información completa y perfecta G tiene
un Equilibrio de Nash Perfecto en Subjuegos (ENPS) en estrategias puras que
se obtiene por el método de inducción hacia atrás. Además, si ningún jugador
tiene más de una acción óptima en cada nodo de decisión, tal ENPS es único.

Algoritmo de inducción hacia atrás para juegos con información


imperfecta

1. Se identifican todos los subjuegos que se producen en último lugar (es


decir, aquellos que comienzan en los nodos de decisión lo más cercanos
posible a los nodos terminales). Estos subjuegos pueden tener uno o
varios jugadores. Se calculan los EN de dichos subjuegos.
2. A continuación, si sólo existe un único EN en estrategias puras en cada
subjuego, se elimina cada uno de esos subjuegos, salvo su nodo de
comienzo que es reemplazado por el nodo terminal del juego global al
que se habrı́a llegado de haberse jugado el perfil EN correspondiente a
ese subjuego, y se le atribuyen los pagos de dicho perfil. De esta manera
se han podado las ramas del árbol correspondientes a los subjuegos
finales del juego global inicial, y nos encontramos con un árbol más
corto. En el caso de que existan EN en estrategias mixtas, le asignamos
al nodo de comienzo de los subjuegos con EN en estrategias mixtas los
pagos esperados correspondientes a ese EN. Si existen múltiples EN en
alguno o varios de los subjuegos, el proceso sólo cambia en que hay que
considerar todas las posibilidades, es decir, se forman tantos árboles
reducidos como combinaciones haya de EN en la etapa actual. Al final,
obtendremos resultados perfectos en subjuegos (todos) y equilibrios de
Nash perfectos en subjuegos.

22
Teorema 2.4. Si un juego admite la inducción hacia atrás generalizada, y
todos y cada uno de sus subjuegos finales (tanto en el juego global como en los
reducidos) admiten un EN único, el resultado mediante inducción del juego
es el único resultado perfecto en subjuegos y las estrategias generadas a partir
de las acciones tomadas por cada jugador en cada uno de sus conjuntos de
información constituyen el único equilibrio de Nash perfecto en subjuegos.

3. Juegos estáticos con información incom-


pleta
Ahora estudiaremos juegos donde los jugadores toman decisiones de ma-
nera simultánea pero algubas informaciónes relacionadas con los pagos es de
caracter privado, es decir, están al alcance de algunos jugadores pero no de
todos.
Por ejemplo en una subasta, un jugador conoce la valoración del objeto
subastado pero no la de los demás.
Ejemplo 3.1. Batalla de los sexos modificada. . .
Ejemplo 3.2. Por amor o por dinero. . .

3.1. Juegos Bayesianos


Un juego bayesiano estático, consiste (adicionalmente de que cada juga-
dor i tiene un conjunto de acciones) un conjunto de tipos Ti y una suposición
o conjetura pi sobre el tipo de los otros jugadores. Donde cada tipo ti es una
variable aleatoria, y la distribución de probabilidad conjunta de los tipos vie-
ne dada por la función p(t1 , . . . , tn ) y ası́, la conjetura pi es una probabilidad
condicionada, denotada pi (t−i |ti ), que depende de cuál sea el tipo efectivo ti
del jugador i. Por último, la función de pagos de cada jugador depende de
las acciones decididas y de los tipos efectivos de todos los jugadores. Ası́,

ui (a1 , . . . , ai , . . . , an ; t1 , . . . , ti , . . . , tn )

Ası́, un juego bayesiano lo podemos denotar como sigue

GB = {J; A1 , . . . , An ; T1 , . . . , Tn ; p1 , . . . , pn ; u1 , . . . , un }

La estructura temporal del juego es:


El azar determina un vector de tipos t = (t1 , ..., tn ) donde ti ∈ Ti , de
acuerdo con una probabilidad a priori p(t) que es de dominio público.

23
El jugador i, y ningún otro observa su tipo efectivo ti , y se forma una
conjetura pi (t−i |ti ) a partir de su tipo efectivo y la distribución a priori.

Los jugadores toman simultáneamente sus decisiones y el jugador i


recibe un pago de ui (a1 , . . . , an ; t1 , . . . , tn )

Ejemplo 3.3. Consideremos el siguiente juego

Jugador 2
L R
Jugador 1 X (3, θ) (0, 0)
Y (2, 2θ) (2, θ)
Z (0, 0) (3, −θ)

donde θ ∈ {−1, 1} es un parámetro conocido para el jugador 2. El jugador 1


cree que θ = 1 con probabilidad 12 (y con probabilidad 21 para θ = −1. En este
caso tenemos que
J = {1, 2}
A1 = {X, Y, Z} ; A2 = {L, R}
T1 = {t1 } ; T2 = {θ = −1, θ = 1}
1
P1 (θ = −1|t1 ) = P1 (θ = 1|t1 ) =
2
P2 (t1 |θ = −1) = P1 (t1 |θ = −1) = 1
u1 (X, L;t1 , θ = −1) = 3; u2 (X, L;t1 , θ = −1) = −1
u1 (X, L;t1 , θ = 1) = 3; u2 (X, L;t1 , θ = 1) = 1
u1 (X, R;t1 , θ = −1) = 0; u2 (X, R;t1 , θ = −1) = 0
u1 (X, R;t1 , θ = 1) = 0; u2 (X, R;t1 , θ = 1) = 0
u1 (Y, L;t1 , θ = −1) = 2; u2 (Y, L;t1 , θ = −1) = −2
u1 (Y, L;t1 , θ = 1) = 2; u2 (Y, L;t1 , θ = 1) = 2
u1 (Y, R;t1 , θ = −1) = 2; u2 (Y, R;t1 , θ = −1) = −1
u1 (Y, R;t1 , θ = 1) = 2; u2 (Y, R;t1 , θ = 1) = 1
u1 (Z, L;t1 , θ = −1) = 0; u2 (Z, L;t1 , θ = −1) = 0
u1 (Z, L;t1 , θ = 1) = 0; u2 (Z, L;t1 , θ = 1) = 0
u1 (Z, R;t1 , θ = −1) = 3; u2 (Z, R;t1 , θ = −1) = 1
u1 (Z, R;t1 , θ = 1) = 3; u2 (Z, R;t1 , θ = 1) = −1

24
Definición 3.1.1. Dado un juego bayesiano estático
GB = {J; A1 . . . , An ; T1 , . . . , Tn ; p1 , . . . , pn ; u1 , . . . , un } (GB = {J; A; T ; p; u})
una estrategia pura del jugador i es una regla de decisión que especı́fica una
acción de Ai por cada elemento de Ti .
En el ejemplo anterior
S1 = {X, Y, Z}
y
S2 = {L (θ = −1) , L (θ = 1) , L (θ = −1) , R (θ = 1) ,
R (θ = −1) , L (θ = 1) , R (θ = −1) , R (θ = 1)}
Si especificamos que para el jugador 2 θ = −1 y θ = 1 son respectivamente
el primer y segundo tipo entonces S2 = {LL, LR, RL, RR}.
Definición 3.1.2. Sea GB = {J; A; T ; p; u} un juego bayesiano estático,
dado un perfil de estrategias puras s∗ = (s∗1 , . . . , s∗n ); decimos que la estrategia
s∗i es una respuesta óptima del jugador i a la combinación s∗−i si para cada
ti ∈ Ti ; s∗i (ti ) es una solución del problema
X
máx pi (t−i |ti )ui (s∗1 (t1 ), . . . , s∗i−1 (ti−1 ), ai , s∗i+1 (ti+1 ), . . . , s∗n (tn ); t1 , . . . , ti , . . . , tn )
ai ∈Ai
t−i ∈Ti

y decimos que s∗ es un equilibrio bayesiano de Nash si para cada jugador i, s∗i


es una respuesta optima para s∗−i .

3.1.1. Equilibrios bayesianos en estrategias mixtas


Definición 3.1.3. Sea GB = {J; A; T ; p; u} un juego bayesiano estático.
Una estrategia mixta del jugador i es una regla de decisión que asigna una
aplicación σi : Ti −→ ∆(Ai ) (para cada tipo ti se asigna una |Ai |-tupla σi ).
Definición 3.1.4. Un perfil de estrategias mixtas σ ∗ = (σ1∗ , . . . , σn∗ ) es un
equilibrio de nash en estrategias mixtas si para cada i, σi∗ es la mejor respuesta

a σ−i .
Ejemplo 3.4. . . .

Aplicaciones a susbastas
Subastas de primer precio
Subastas de segundo precio

25
3.2. Juegos dinámicos con información incompleta
3.2.1. Equilibrio bayesiano perfecto
Hemos visto algunos ejemplos de juegos dinámicos con información com-
pleta (pero imperfecta) donde los EBPS no son satisfactios en el sentido de
que hay jugadores que sin importar el nodo (de un conjunto no trivial de
información) su jugada optima no corresponde con la jugada indicada en el
EBPS.
Luego entonces, surge la necesidad de formular otro concepto de equilbrio
que refine al EBPS de manera que evite equilibrios “no satisfactorios”. Este
refinamiento se le llama equilibrio bayesiano perfecto EBP y describiremos a
continuación:
Un EBP consiste en estrategias y conjeturas que satisfacen las siguientes
4 condiciones:
Conjeturas
En cada conjunto de información, el jugador que decide debe formarse
una conjetura sobre el nodo del conjunto de información al que se ha llegado
en el juego. Una conjetura es una distribución de probabilidad sobre los nodos
del conjunto de información.
Estrategias sucesivamente racionales
En cada conjunto de información, la acción tomada por el jugador al que le
toca tirar y sus estrategias subsiguientes (plan de acción completo) deben de
ser óptimas.
Las siguientes dos condiciones se relacionan con la trayectoria de equi-
librio: Un conjunto de información está en la trayectoria de equilibrio (EN,
ENPS, EB, EBP) si se alcanza con probabilidad positiva cuando el juego
se desarrolla según la estrategias de equilibrio, y fuera de la trayectoria de
equilibrio si es seguro que no se alcanza cuando el juego se desarrolla según
las estrategias de equilibrio.
Regla de Bayes en la trayectoria de equilibrio
En conjuntos de información sobre la trayectoria de equilibrio las conje-
turas se determinan de acuerdo con la regla de Bayes y las estrategias de los
jugadores: Sea σ un perfil estratégico, h un conjunto de información y x un
p(x|σ )
nodo entonces P (x) = p(h|σ )
.
Regla de Bayes fuera de la trayectoria de equilibrio
En conjuntos de información fuera de la trayectoria de equilibrio, las conje-
turas se determinan según la regla de Bayes y las estrategias de los jugadores
donde sea posible.

26
3.2.2. Juegos de señalización. . .
Nótesé que en los juegos de señalización donde hay por lo menos dos tipos
- para el emisor- no tienen subjuegos propios.

3.2.3. El equilibrio bayesiano perfecto en el juego de señalización


Dado un perfil σ ∗ = (σE∗ , σR∗ ) y un sistema de creencias µ = {µm }m∈M un
EBP está determinado por las siguientes condiciones:
Conjeturas
Después de observar cualquier mensaje m ∈ M, el receptor debe formarse
una conjetura sobre qué tipos podrián haber enviado m :
µm (t) ≥ 0
y X
µm (t) = 1.
t∈T

Estrategias sucesivamente racionales


Para cada tipo t de E, σE∗ (t) debe verificar que
UE (σE∗ (t), σR∗ (σE∗ (t)); t) ≥ UE (m, σR (m)); t) ∀m ∈ M
y
X X
∀m ∈ M : µm (t) · UR (m, σR (m)); t) ≥ µm (t) · UR (m, a); t)∀a ∈ A.
t∈T t∈T

Regla de Bayes en la trayectoria de equilibrio


En conjuntos de información sobre la trayectoria de equilibrio las conje-
turas son consistentes con las estrategias σE∗ en el sentido de que las pro-
babilidades de cada conjetura están determinadas con la reglas de Bayes
(por dichas estrategias). Ası́ para cada hm en la trayectoria de equilibrio
p(hm |σE ) 6= 0. Luego

p(t|σE ) p(t)σE (m|t)


µm (t) = = P
p(h|σE ) p(t0 )σE (m|t0 )
σE (m|t0 )>0

en el caso en que σE sea una estrategia pura, la conjetura estipula para


cualquier tipo t ∈ T,
p(t)
µm (t) = P
p(t0 )
σE (t0 )=m

27
Nota 3.1. En un conjuntos de información hm fuera de la trayectoria no
existe un tipo t tal que σE (t) = m. Luego el requisito de Regla de Bayes fuera
de la trayectoria de equilibrio de EBP para juegos se cumple de manera trivial
(cualquier conjetura es válida).

Definición 3.2.1. Sea G un juego de señalización.

Una estrategia pura sE es una estrategia de agrupación si todos los tipos


de emisor deciden el mismo mensaje, es decir, si existe un mensaje
m ∈ M tal que sE (t) = m,∀t ∈ T.

Una estrategia pura sE es una estrategia de separación si tipos distintos


de E deciden mensajes distintos, es decir, t 6= t0 implica que sE (t) 6=
sE (t0 ).

Un perfil de equilibrio σ ∗ = (σE∗ , σR∗ ) es un equilibrio agrupador si σE∗


es una estrategia de agrupación y σE∗ es un equilibrio separador si σE∗
es una estrategia de separación.

28

También podría gustarte