Teoria de Juegos

Notas de teorı́a de juegos
Julio Cesar Macı́as Ponce

Aarón Guillén Villalobos
17 de marzo de 2020
Índice
1. Teorı́a de juegos 3
1.1. Estrategias, preferencias y racionalidad . . . . . . . . . . . . . 3
1.2. Juegos en forma extensiva . . . . . . . . . . . . . . . . . . . . 4
1.3. Juegos en forma estratégica . . . . . . . . . . . . . . . . . . . 6
1.4. Un ejemplo importante en la literatura: . . . . . . . . . . . . . 7
1.4.1. El Dilema del prisionero . . . . . . . . . . . . . . . . . 7
1.4.2. Más ejemplos . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3. Cuando hay movimientos del azar: . . . . . . . . . . . 8
1.4.4. Juegos con más de dos jugadores . . . . . . . . . . . . 8
1.5. Juegos estáticos con información completa . . . . . . . . . . . 8
1.5.1. Estrategias dominadas y dominantes . . . . . . . . . . 9
1.5.2. Solución de un juego . . . . . . . . . . . . . . . . . . . 9
1.5.3. Solución por eliminación de estrategias estrictamente
dominadas . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6. Equilibrio de Nash (Estrategias puras) . . . . . . . . . . . . . 10
1.7. Tres modelos clásicos de duopolio . . . . . . . . . . . . . . . . 11
1.7.1. Modelo de Cournot . . . . . . . . . . . . . . . . . . . . 11
1.7.2. Modelo de Bertrand . . . . . . . . . . . . . . . . . . . 12
1.7.3. Modelo de Hotelling . . . . . . . . . . . . . . . . . . . 12
1.7.4. Eficiencia de Pareto . . . . . . . . . . . . . . . . . . . . 14
1.8. Estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 14
1.8.1. Juegos bipersonales de suma cero . . . . . . . . . . . . 15
1.8.2. La programación lineal y los juegos de suma cero . . . 16
1.8.3. Juegos Bipersonales (en general) . . . . . . . . . . . . . 18
1.8.4. Teorema de Nash (juegos en forma estratégica con k
jugadores) . . . . . . . . . . . . . . . . . . . . . . . . . 19
1
2. Juegos dinámicos con información completa 19
2.0.1. Equilibrios de Nash . . . . . . . . . . . . . . . . . . . . 20
3. Juegos estáticos con información incompleta 23

3.1. Juegos Bayesianos . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1.1. Equilibrios bayesianos en estrategias mixtas . . . . . . 25
3.2. Juegos dinámicos con información incompleta . . . . . . . . . 26
3.2.1. Equilibrio bayesiano perfecto . . . . . . . . . . . . . . . 26
3.2.2. Juegos de señalización. . . . . . . . . . . . . . . . . . . . 27
3.2.3. El equilibrio bayesiano perfecto en el juego de señali-
zación . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2
1. Teorı́a de juegos
Teorı́a de juegos es una formal disciplina matemática que estudia situa-
ciones de competencia y cooperación entre varios agentes (jugadores).
Podemos encontrar diversas aplicaciones de la teorı́a de juegos, incluso
en el Talmud se reconocen modelos de la teorı́a de juegos que en la actua-
lidad los identificamos como problemas de bancarrota. Las aplicaciones que
abordaremos en este curso serán relacionados con la economı́a.
Los primeros trabajos reconocidos en la teorı́a de juegos se deben a Emile
Borel y John von Neumann. El libro “Game theory and Economic behavior”
publicado por von Neumann y Oskar Morgenstern establecen los fundamentos
de la teorı́a.
En 1950 John F. Nash desarrolla el concepto de Equilibrio de Nash que
poco después se uso en Teorı́a Económica, Ciencia Polı́tica, Psicologı́a, etc;
en 1970 se uso como herramienta en Biologı́a evolutiva. En 1994 Harsanyi,
Nash y Selten obtienen el Premio Nobel de Economı́a.
Los juegos cooperativos y no cooperativos se distinguen en que en los
primeros hay acuerdos vinculantes entre los agentes. Comenzaremos con el
estudio de los juegos no cooperativos - donde no se permiten acuerdos vin-
culantes -.
1.1. Estrategias, preferencias y racionalidad

Los modelos de teorı́a de juegos que estudiaremos involucra a un conjunto
de jugadores, un conjunto de estrategias que pueden seguir (un conjunto de
estrategias por jugador) y preferencias identificados ante los distintos perfiles
de estrategias de los jugadores., ante dos perfiles de estrategias, cada jugador
identifica cual es lo mejor para él -o si los dos perfiles son indiferentes-.
Además las preferencias son consistentes en el sentido de que si se prefiere
“a” a “b” y “b” a “c” entonces se prefiere “a” a “c”.
Una manera de representar las preferencias es por medio de una función
de pago. La función asigna un número real para cada jugador en cada perfil
de estrategias.
Además se asumirá que los jugadores son racionales: El objetivo de cada

individuo es maximizar su bienestar y no excluye la posibilidad de que el
bienestar de un individuo dependa de la situación de otros individuos y, por
tanto admite la posibilidad de comportamientos altruistas. El hecho de que
los individuos son racionales es de conocimiento público; es decir, todos lo
3
saben, todos saben que todos lo saben, todos saben que todos saben que
todos lo saben...(ad infinitum).
1.2. Juegos en forma extensiva

Los elementos de un juego son:
1. El conjunto de jugadores J = {0, 1, ..., n} cuando ”participa.el azar o la

naturaleza y J = {1, ..., n} en caso contrario.
2. Sea X el conjunto de nodos. Un nodo representa una posible situación
del juego. Entre los nodos se distingue uno que se le llama la raı́z de
juego y que denotaremos por o. Definimos la función:
σ:X→X
En donde σ(o) = o, y para x 6= o, σ(x) es el nodo inmediato predecesor

(iterando σ(x) se obtienen todos los nodos predecesores de x). Sea
s(x) = σ −1 (x), el conjunto de nodos que siguen inmediatamente a x. Un
nodo es terminal si no le sigue ningún otro nodo y en caso contrario se le
llama nodo de decisión. Ası́ pues, definimos y denotamos los conjuntos
de nodos terminales y de decisión como T (X) = {x ∈ X : s(x) = φ} y
D(X) = {x ∈ X : s(x) 6= φ} respectivamente.
3. Denotemos con A al conjunto de todas las posibles acciones, definimos
una función
α : X \ {o} → A
que hace corresponder a cada nodo distinto del origen aquella acción
0 00
α(x) que lleva del nodo σ(x) a x. Se verifica que si x , x ∈ s(x),
0 00 0 00
siendo x 6= x , entonces α(x ) 6= α(x ). Para cualquier x ∈ D(X),
representamos el conjunto de acciones disponibles a partir de x por
n 0 0
o
A(x) = a ∈ A : ∃x ∈ s(x) con a = α(x )
4. Para cada i ∈ J sea Xi el conjunto de nodos de decisión en los que el

jugador i tiene que elegir una acción.
S En cada nodo de decisión solo
“mueve” un jugador. Se tiene que Xi = D(X). ∀i, j ∈ J, con i 6= j
i∈J
se verifica que Xi ∩ Xj = φ. Ası́ {Xi }i∈J constituye una partición del
conjunto D(X).
4
5. Una familia de conjuntos de información H, y una función h : D(X) →
H que asigna a cada nodo x un conjunto de información h(x) al que per-
tenece. Los conjuntos de información forman una partición de D(X).
Todos los nodos de decisión que tienen a un mismo conjunto de infor-
mación tienen las mismas acciones disponibles, es decir:
A(x) = A(x0 ) si h(x) = h(x0 )
Sea
A(h(x)) = {a ∈ A : a ∈ A(y) para y ∈ h(x)}
A(h(x)) es el conjunto de acciones disponibles para el conjunto de in-
formación h(x). Con Hi denotaremos al conjunto de todos los conjuntos
de información del jugador i; y con H al conjunto que contiene a todos
los conjuntos
S de información contenidos en los Hi , para i ∈ J. Es decir
H= Hi .
i∈J
6. Una función ρ : H0 × A → [0, 1] que asigna probabilidades a acciones

en conjuntos de información donde .el movimientoçorresponde al azar
o a la naturaleza. Se tiene que verificar que:
ρ(h, a) = 0 ∀a ∈
/ A(h(0))
X
ρ(h, a) = 1 ∀h ∈ H0
a∈A(h(o))
7. Una función de pagos

r : T (X) → Rn
donde ri (x) indica el pago o utilidad que recibe el jugador i si se ha
alcanzado el nodo x.
Definición 1.2.1. Un juego en forma extensiva Γ viene especificado por los

siguientes elementos

Γ = J, (X, σ) , (A, α) , {Xi }i∈J , {Hi }i∈J , A(h(x))h∈H , ρ, r
Nota 1.1. Cuando no hay “jugador cero” (no existen movimientos de azar)
se omite la función ρ.
5
1.3. Juegos en forma estratégica
Definición 1.3.1. Una estrategia pura para el jugador i ∈ J es una función
que
si : Hi → A
con si (h) ∈ A(h).
Sea Si el conjunto de todas las estrategias puras del jugador i y supon-
gamos que no existen movimientos de azar; dada una estrategia si ∈ Si para
cada i ∈ J queda determinado un desarrollo completo del juego, llegándose
a un nodo terminal. Se dice que s = (s1 , ..., sn ) ∈ S1 × ... × Sn = S es un
perfil o una combinación de estrategias puras.
Sea η(s) el nodo terminal que se alcanza con el perfil s y sea ui (s) =
ri (η(s)) el pago que recibe el jugador i en η(s)
Definición 1.3.2. Un juego en forma estratégica (o en forma normal) G se
define con una terna:

G = J, (Si )i∈J , (ui )i∈J
Ejercicio 1.1. En el siguiente juego encuentre el conjunto de estrategias
puras para cada uno de los jugadores, ası́ como los pagos que recibe cada uno
de los jugadores para cada combinación de estrategias puras.
Nota 1.2. Cuando se tienen dos jugadores, con un número finito de estrate-
gias para cada jugador la representación estratégica del juego se puede hacer
mediante una matriz:
J = {1, 2}
S1 = s11 , . . . , sl1

S2 = s12 , . . . , sm

2
Jug 2
s12 s22 ··· sm2
s11 u1 (s1 , s2 ), u1 (s1 , s2 ) u1 (s11 , s22 ), u1 (s11 , s22 )
1 1 1 1
··· u1 (s11 , sm 1 m
2 ), u1 (s1 , s2 )
Jug 1 s21 u1 (s21 , s12 ), u1 (s21 , s12 ) u1 (s21 , s22 ), u1 (s21 , s22 ) ··· u1 (s21 , sm 2 m
2 ), u1 (s1 , s2 )
.. .. .. ... ..
. . . .
sl1 u1 (sl1 , s12 ), u1 (sl1 , s12 ) u1 (sl1 , s22 ), u1 (sl1 , s22 ) · · · u1 (sl1 , sm l m
2 ), u1 (s1 , s2 )
6
Para el ejercicio anterior tenemos...
1.4. Un ejemplo importante en la literatura:

1.4.1. El Dilema del prisionero
Dos sospechosos de un crimen mayor son separados e interrogados en
celdas diferentes. A ello se les encontró haciendo un delito menor pero con
los interrogatorios se quiere involucrarlos en el crimen mayor (que sólo los
delincuentes saben que lo cometieron). En el interrogatorio se les promete
disminuir las sentencias si cooperan con las autoridades. Cada uno de ellos
tiene dos opciones: confesar o quedarse callado.
La siguiente tabla muestra la utilidad que se les asignarán de acuerdo a
si confiesan o no.
Sospechoso 2
Callar Conf esar
Sospechoso 1 Callar (−1, −1) (−5, 0)
Conf esar (0, −5) (−4, −4)
1.4.2. Más ejemplos

Dos empresas automovilı́sticas deciden lanzar al mercado al mismo
tiempo un modelo de coche de gama intermedia. Cada una de ellas
se está planteando si ofrecer o no financiación a los clientes, lo cual le
supondrı́a captar mayor cuota de mercado, pero llevarı́a consigo ciertos
costos. Ambas empresas prefieren no ofertar dicha financiación, pero ca-
da una teme que la otra la ofrezca y, por tanto, acapare mayor número
de compradores. Supongamos que los beneficios esperados por las em-
presas son los siguientes. Si ambas ofrecen financiación, 400 millones
para cada una; si ninguna lo hace, 600 para cada una, y si una la ofrece
y la otra no, la primera gana 800 y la segunda 300.
La Guerra de los sexos
7
MUJER
Fútbol Concierto
HOMBRE Fútbol (2,1) (0,0)
Concierto (0,0) (1,2)
1.4.3. Cuando hay movimientos del azar:

En este caso la utilidad del i-ésimo jugador para cada perfil de estrategias
ui (s1 , ..., sn ) es un valor esperado.
Ejemplo:
1.4.4. Juegos con más de dos jugadores

Ejemplo: (el problema de la tv de paga)
1.5. Juegos estáticos con información completa

Estos juegos se representan de manera natural en forma estratégica, ya
que los jugadores realizan sus jugadas de manera simultanea.
Además se supone que es de dominio público el conocimiento de la es-
tructura del juego: Todos los jugadores conocen las estrategias o acciones
disponibles para cada jugador y las ganancias resultantes de cada combina-
ción de acciones y además todos saben que todos las conocen, y todos saben
que todos saben que todos las conocen. . . y ası́ sucesivamente.
Notación: Dado un perfil de estrategias s = (s1 , ..., sn ) ∈ S1 ×...×Sn = S

denotaremos con
s−i = (s1 , . . . , si−1 , si+1 , . . . , sn ) ∈ S1 × · · · × Si−1 × Si+1 × · · · × Sn
A la combinación de estrategias de los n − 1 (jugadores diferentes a i)

para el perfil s. Y
S−i = S1 × . . . × Si−1 × Si+1 × ... × Sn
será el conjunto de todas las combinaciones de estrategias de los n − 1 juga-

dores.
Dado un juego G = {J, (Si )i∈J , (ui )i∈J } si los conjuntos J, S1 , . . . , Sn son
finitos decimos que G es un juego finito.
Ejemplos:
8
El dilema del prisionero
La guerra de los sexos
Halcón-Paloma
La caza del ciervo
1.5.1. Estrategias dominadas y dominantes

Sea G = J, (Si )i∈J , (ui )i∈J un juego y sean s0i y s00i dos estrategias para

el jugador i.
Decimos que s00i domina débilmente a s0i si la desigualdad
ui (s1 , . . . , si−1 , s0i , si+1 , . . . , sn ) ≤ ui (s1 , . . . , si−1 , s00i , si+1 , . . . , sn )
se cumple para toda combinación de estrategias s−i de los otros ju-
gadores, y para alguna de esas combinaciones se cumple de manera
estricta.
Decimos que s00i domina estrictamente a s0i si la desigualdad
ui (s1 , . . . , si−1 , s0i , si+1 , . . . , sn ) < ui (s1 , . . . , si−1 , s00i , si+1 , . . . , sn )
se cumple para toda combinación de estrategias s−1 de los otros juga-
dores.
Decimos que s0i es no dominada débilmente si no existen estrategias del
jugador i que la dominen débilmente y decimos que s0i es no dominada
estrictamente si no existen estrategias del jugador i que la dominen.
1.5.2. Solución de un juego

A diferencia de los problemas de optimización, donde hay una decisión
individual, en los juegos (problemas de decisión de varios agentes) el con-
cepto de solución involucra utilidades o pagos de todos los agentes y en este
sentido no es sencillo definir “la mejor solución”-¿para quién?-.
Podemos llamar solución a un conjunto de perfiles de estrategias tal que

es razonable esperar que los jugadores decidirán perfiles pertenecientes a
dicho conjunto. Ası́ púes, buscaremos procedimientos que permitan obtener
los perfiles razonablemente esperados. Cada procedimiento será una solución
-un concepto de solución-.
9
1.5.3. Solución por eliminación de estrategias estrictamente do-
minadas
Se trata de ir eliminado estrategias estrictamente dominadas, la impor-
tancia de que sean “estrictas” se justifica en el hecho de que si procedemos
a eliminar estrategias estricta y débilmente dominadas puede ocurrir lo si-
guiente:
(ejemplo de clase)
1.6. Equilibrio de Nash (Estrategias puras)

Definición 1.6.1. Dado un juego G = J, (Si )i∈J , (ui )i∈J , un perfil s∗ =

(s∗1 , . . . , s∗i , . . . , s∗n ) es un equilibrio de Nash (EN) si para cada jugador i se

verifica que
ui (s∗1 , . . . , s∗i−1 , s∗i , s∗i+1 , . . . , s∗n ) ≥ ui (s∗1 , . . . , s∗i−1 , si , s∗i+1 , . . . , s∗n )
para toda si ∈ Si .
Funciones de mejor respuesta
El concepto de equilibrio de Nash identifica los perfiles de estrategias que

son estables, en el sentido de que ningún jugador quiera desviarse, si espera
que los demás adopten las acciones que se prescribe para ellos. El equilibrio
de Nash indica el desenlace predecible del juego y puede interpretarse como
un “acuerdo” o una “norma” que tiene la propiedad de que es autosostenible:
una vez aceptado, ningún jugador tiene incentivos para modificarlo unilate-
ralmente. Otra interpretación interesante contempla al concepto de equilibrio
de Nash como perfiles de expectativas que se “auto confirman”, en el sentido
de que si los jugadores esperan que los demás se comporten de acuerdo con
lo prescrito, entonces estas acciones ocurren como consecuencia de la con-
ducta óptima de los jugadores; es decir, las expectativas de los jugadores son
“racionales” porque son consistentes con la conducta racional.
Un equilibrio de Nash se caracteriza porque cada jugador responde ópti-
mamente a las estrategias de los demás jugadores. Esta interpretación per-
mite reformular el concepto de equilibrio de Nash como una solución a un
sistema de ecuaciones.

Definición 1.6.2. Dado un juego G = J, (Si )i∈J , (ui )i∈J , para cada juga-
dor i, y para cada perfil s−i (para los demás jugadores) definimos la función
de mejor respuesta Ri (s−i ) como sigue:
Ri (s−i ) = {si ∈ Si : ui (s1 , ...si−1 , si , si+1 ..., sn ) ≥ ui (s1 , ...si−1 , si , si+1 ..., sn )∀si ∈ Si }
10
Lemma 1.2. Un perfil de estrategia s∗ = (s∗1 , . . . , s∗n ) es un equilibrio de
Nash si, y solo si para cada i, s∗i ∈ Ri (s−i )
1.7. Tres modelos clásicos de duopolio

A continuación se presentan juegos donde los jugadores son empresas,
cada empresa toma una decisión sin conocer la decisión de su rival y a conti-
nuación obtiene beneficios que dependen de las decisiones de ambas empresas
involucradas, lo que marca el final del juego.
1.7.1. Modelo de Cournot

Dos empresas producen bienes idénticos y deben decidir cuantas unida-
des producir –hay una infinidad de estrategias–. El costo para la firma i de
producir qi unidades es Ci (qi ) = cqi donde c es el costo unitario de pro-
ducción. Sea Q = q1 + q2 la cantidad de productos en el mercado y sea
P (Q) el precio en el mercado; P es llamada la función inversa de demanda;
ası́, los ingresos de la empresa i es qi P (q1 + q2 ) y por tanto la utilidad es
ui (q1 , q2 ) = qi P (q1 + q2 ) − cqi .
La función P se define como

α − Q si Q ≤ α
P (Q) =
0 si Q > α
donde α > 0 y c > 0 son constantes. Se supone que c < α. Luego

q1 (α − c − q1 − q2 ) si q1 + q2 ≤ α
u1 (q1 , q2 ) =
−cq1 si q1 + q2 ≥ α
y
q2 (α − c − q1 − q2 ) si q1 + q2 ≤ α
u2 (q1 , q2 ) =
−cq2 si q1 + q2 ≥ α
Encontraremos los equilibrios de Nash por medio del argumento “la mejor
respuesta”.
Si el jugador 2 produce q2 entonces se quiere máx{u1 (q1 , q2 )}. Si q2 = 0
q1 ∈R
la función a maximizar es

q1 (α − c − q1 ) si q1 ≤ α
g(q1 ) =
−cq1 si q1 ≥ α
α−c
Y el máximo se da en q1 = y
2

α−c α−c (α − c)
u1 ,0 = g =
2 2 2
11
.
Si q2 > 0 tenemos que el máximo se alcanza en 12 (α − c − q2 ) si q2 ≤ α − c
y 0 si q2 > α − c.
La función de mejor respuesta para el jugador 2, es la misma a la firma
1, luego para obtener el equilibrio de Nash resolvemos el siguiente sistema:
1
q1 = (α − c − q2 )
2
1
q2 = (α − c − q1 )
2
cuya solución es q1∗ = q2∗ = α−c
3
1.7.2. Modelo de Bertrand

Dos empresas producen bienes idénticos y deben decidir qué precio cobrar
por su producto. Cada empresa fija su precio sin conocer el precio fijado de
su rival. El precio que se puede cobrar es cualquier número real – hay una
infinidad de estrategias –.
El costo para la firma i de producir qi unidades es Ci (qi ) = cqi donde c
es el costo unitario de producción. Ahora tenemos una función de demanda
que depende del precio: D(p) = α − p para p ≤ α y D(p) = 0 si p > α, y
c < a. Luego

 (pi − c)(α − pi ) si pi < pj
(pi −c)(α−pi )
ui (p1 , p2 ) = 2
si pi = pj
0 si pi > pj

donde j = 2 si i = 1 y j = 1 si i = 2.
¡ El único equilibrio de Nash es (c, c)!
1.7.3. Modelo de Hotelling

Al igual que en el modelo anterior, se trata de que las empresa fijen
precios pero desde el punto de vista del consumidor los productos pueden ser
diferentes. Por ejemplo, aunque las dos empresas vendan el mismo producto
la distancia de las tiendas o la facilidad de compra los diferencia ante el
consumidor.
En este sentido, el siguiente modelo considera la demanda como función
de los precios y localización de las empresas.
Supongamos que las empresas se sitúan en una avenida en linea recta de
longitud 1, la empresa 1 se sitúa en α y la empresa 2 en β con 0 ≤ α ≤ β ≤ 1.
12
Si ambas empresas ofrecen el mismo producto al mismo precio, el con-
sumidor elige la tienda más cerca. Suponemos que los consumidores están
distribuidos de manera uniforme en la avenida y que cada consumidor decide
tomando en cuenta el precio que tendrá que pagar por el bien y el costo por
tener que trasladarse.
Ası́, un consumidor que esté a una distancia di de la empresa i tendrá un
costo td2i . Sea S el beneficio que proporciona el producto, luego la utilidad
del consumidor será de S − td2i − pi . Por tanto, un consumidor situado en un
punto x preferirá comprar en la tienda 1 si
S − t (x − α)2 − p1 > S − t (x − β)2 − p2
Luego el punto de indiferencia para el consumidor es

β−α p 2 − p1
x∗ = α + +
2 2t(β − α)
Ası́, ya que los consumidores a la izquierda de x∗ preferirán la empresa 1

a la 2, entonces la función de utilidad está dada por:

β−α p2 − p1
u1 (p1 , p2 ) = (p1 − c) α + +
2 2t (β − α)

β−α p1 − p2
u2 (p1 , p2 ) = (p2 − c) 1 − β + +
2 2t (β − α)
El Equilibrio de Nash se obtiene de resolver el sistema de ecuaciones:
β − α p2 − 2p1 + c
α+ + =0
2 2t (β − α)
β + α p1 − 2p2 + c
1− + =0
2 2t (β − α)
cuya solución es
t (β − α) (α + β + 2)
p1 = c +
3
t (β − α) (4 − α − β)
p2 = c +
3
13
1.7.4. Eficiencia de Pareto
Nota 1.3. Mientras no se especifique lo contrario, el número de jugadores
(diferentes a la naturaleza) será n. Es decir J = {1, ..., n}.
Dado un juego G = {J, (Si )i∈J , (ui )i∈J } definimos lo siguiente:
Un perfil s = (s1 , ..., si , ..., sn ) está dominado en el sentido de Pareto

por el perfil s0 = (s01 , ..., s0i , ..., s0n )si y sólo si se verifica lo siguiente:
ui (s0 ) ≥ ui (s) ∀i ∈ J
y existe un k ∈ J tal que
uk (s0 ) > uk (s) ∀i ∈ J
Un perfil s = (s1 , . . . , si , . . . , sn ) es un óptimo de Pareto (o eficiente

en el sentido de Pareto) si y sólo si no está dominado en el sentido de
Pareto por ningún otro Perfil. Diremos que s es ineficiente de Pareto si
algún otro lo domina.
En un equilibrio de Pareto ningún jugador puede mejorar sin perjudicar

a otro.
Ejemplo 1.3. El Equilibrio de Nash no es óptimo de Pareto en el dilema

del prisionero pero los Equilibrios de Nash en la guerra de los sexos si
son óptimos de Pareto.
1.8. Estrategias mixtas

Definición 1.8.1. Una estrategia mixta para el jugador i, es una distribución
de probabilidad sobre el conjunto de estrategias puras Si . Es decir, si Si =
{s1i , . . . , ski }, llamamos estrategia mixta del jugador i a cada k-tupla σi =
(σi1 , . . . , σik ). Cuyas componentes son números reales no negativos que suman
1. Se interpreta σi como la estrategia que consiste en que la estrategia pura
sli se juega con probabilidad σil para l ∈ {1, ..., k} .
Al conjunto de estrategias mixtas del jugador i lo denotaremos por ∆(Si ).

( k
)
X
∆(Si ) = σi = (σi1 , . . . , σik ) : σil con l ∈ {1, . . . , k} y σil = 1
l=1
14
Definición 1.8.2. La utilidad esperada para el jugador i para el perfil de
estrategias mixtas σi = (σ1 , . . . , σn ) es:
X
E [ui (σ1 , . . . , σn )] = ui (s) · σ1 (s) · · · σn (s)
s=(s1 ,...,sn )∈S
Definición 1.8.3. Un perfil de estrategias mixtas σ ∗ = (σ1∗ , . . . , σn∗ ) es un

Equilibrio de Nash en estrategias mixtas si
E [ui (σ1∗ , . . . , σn∗ )] ≥ E [u(σ1∗ , . . . , σi , . . . , σn∗ )]
para cada i ∈ J = {1, ..., n} y para toda estrategia mixta σi .

Ejercicio 1.4. ....
Teorema 1.5. (Principio de indiferencia) Dado un juego G = {J, (Si )i∈J , (ui )i∈J },
si σ ∗ = (σ1∗ , . . . , σn∗ ) es un equilibrio de Nash y supongamos que para el juga-
dor i existen dos estrategias ski , sli con σi∗ (ski ) · σi∗ (sli ) > 0 entonces
∗ ∗
E ui (ski , σ−i ) = E ui (sli , σ−i

)
1.8.1. Juegos bipersonales de suma cero

Definición 1.8.4. Dado un juego G = J, (Si )i∈J , (ui )i∈J si J = {1, 2} y
u1 (s1 , s2 ) = −u1 (s1 , s2 ) ∀ (s1 , s2 ) ∈ S1 × S2
decimos que G es un juego bipersonal de suma cero.

En los juegos de suma cero, denotaremos con A a la matriz de recompensa
del jugador 1 (la matriz B correspondiente a la recompensa del jugador 2 no
se escribe, obsérvese que A = −B).
Si |S1 | = m y |S2 | = n entonces A es una matriz de m × n.
Definición 1.8.5. Dado un juego bipersonal de suma cero, decimos que un
vector p = (p1 , . . . , pm ) ∈ ∆(S1 ) es una estrategia maximin para el jugador 1
si
mı́n{pAq q = (q1 , . . . , qn ) ∈ ∆(S2 )} ≥ mı́n{p0 Aq q = (q1 , . . . , qn ) ∈ ∆(S2 )}

para cada p0 ∈ ∆(S1 ). Y decimos que un vector q = (q1 , ..., qn) ∈ ∆(S2 ) es
una estrategia minimax para el jugador 2 si
máx{pAq q = (q1 , . . . , qn ) ∈ ∆(S2 )} ≤ máx{pAq 0 p = (p1 , . . . , pm ) ∈ ∆(S1 )}

para cada q 0 ∈ ∆(S2 ).
15
Von Neumann mostró que para todo juego bipersonal de suma cero G
(con matriz A) existe un numero real v(A) con las siguientes propiedades:
Una estrategia p del jugador 1 garantiza un pago de al menos v para

el jugador 1 si y solo si p es una estrategia maximin.
Una estrategia q del jugador 2 garantiza un pago de a lo mas v para el

jugador 1 si y solo si q es una estrategia minimax.
A v se le llama el valor del juego (y u1 (p, q) = v si p y q son estrategias

maximin y minimax respectivamente;nótese que (p, q) ≈ equilibrio de Nash).
Definición 1.8.6. Dado un juego bipersonal G decimos que aij es un punto

silla si se verifica que
aij ≥ akj ∀k ∈ {1, . . . , m}
y
aij ≤ aik ∀k ∈ {1, . . . , n}
Es claro que si aij es un punto silla entonces las estrategias puras i y j son
estrategias maximin y minimax respectivamente y v(A) = aij .
Ejercicios
1.8.2. La programación lineal y los juegos de suma cero

Sea G un juego bipersonal de suma cero entonces tenemos el siguiente
resultado
Teorema 1.6. Sea Zp el valor optimo del siguiente modelo de programación

lineal
máx Z
s.a.
m
X
pi u1 (si , sj ) ≥ Z ∀j ∈ {1, ..., n}
i=1
m
X
pi = 1 pi ≥ 0
i=1
Entonces Zp es el valor del juego G.
16
Demostración. Sea v el valor del juego, mostraremos primero que Zp ≥ v.
Por ser v el valor del juego, entonces existe un p∗ tal que
E [u1 (p∗ , q)] ≥ v ∀q ∈ ∆(S2 )
en particular
E [u1 (p∗ , s2 )] ≥ v ∀s2 ∈ S2
Pero Zp es el valor máximo para el que se cumplen las desigualdades, luego
Zp ≥ v. Ahora mostraremos la desigualdad Zp ≤ v. Primero mostraremos
que la solución del modelo de programación lineal es acotada: Sean p1 , . . . , pm
y z una solución factible del modelo de programación lineal.
Entonces m
X
Z≤ pi u1 (si , sj ) ∀j ∈ {1, . . . , n}
i=1
y
m
X
pi = 1
i=1
luego,
m
X
Z≤ pi u1 (si , sj )
i=1
≤ máx máx |u1 (si , sj )| × (p1 + · · · + pm )
s1 ∈S1 s2 ∈S2
= máx máx |u1 (si , sj )| < ∞

s1 ∈S1 s2 ∈S2
y como Zp es el valor optimo entonces existe un p∗ tal que

m
X
p∗i u1 (si , sj ) ≥ Zp ∀j ∈ {1, . . . , n}
i=1
pero por la propiedad de multilinealidad de la utilidad (ejercicio de tarea)

tenemos que
Xm
p∗i u1 (si , q) ≥ Zp ∀q ∈ ∆(S2 )
i=1
luego v ≥ Zp .
Definición 1.8.7. Dado un juego bipersonal G decimos que la estrategia pura
i (ei ) del jugador 1 es estrictamente dominada si existe p = (p1 , . . . , pm ) ∈
∆(S1 ) con pi = 0 tal que
pAej > ei Aej ∀j ∈ {1, . . . , n}
17
Similarmente, la estrategia pura j (ej ) del jugador 2 es estrictamente
dominada si existe q = (q1 , . . . , qm ) ∈ ∆(S2 ) con qj = 0 tal que
ei Aq < ei Aej ∀i ∈ {1, . . . , m}
Ejemplo 1.7. Para  

6 0 2
A = 0 5 4
3 2 1
7 5
la estrategia 3 del jugador 1 está dominada por p = ( 12 , 12 , 0) ya que pA =
7 25 17 3
( 2 , 12 , 6 ) y e A = (3, 2, 1). Eliminando dicha estrategia tenemos

6 0 2
B=
0 5 4
1 3

pero ahora la estrategia 3 del jugador 2 está dominada por q = 4
, 4
, 0 ya
3

2
que Bq t = 2
15 y Be3 = Eliminando dicha estrategia tenemos
4
4

6 0
C=
0 5
¡El problema está resuelto !
1.8.3. Juegos Bipersonales (en general)

Sea G un juego (no necesariamente de suma cero) y sean A y B las matri-
ces correspondientes a las utilidades de los jugadores 1 y 2 respectivamente.
Entonces podemos caracterizar los Equilibrios de Nash como sigue:
Sea (p∗ , q ∗ ), es un equilibrio de Nash si
p∗ Aq ∗ ≥ p0 Aq ∗ ∀p0 ∈ ∆(S1 )
y
p∗ Bq ∗ ≥ p∗ Bq 0 ∀q 0 ∈ ∆(S2 )
¡p∗ es la mejor respuesta ante q ∗ y q ∗ es la mejor respuesta ante p∗ !
Nota 1.4. Un juego bipersonal de suma constante es aquel que satisface que
aij + bij = c ∀(i, j) ∈ {1, . . . , m} × {1, . . . , n}
y se puede trasformar a un juego de suma cero (o tratar como un juego

bipersonal en general)
18
Dado un juego bipersonal G decimos que la estrategia pura i (ei ) del
jugador 1 es estrictamente dominada si existe p = (p1 , . . . , pm ) ∈ ∆(S1 ) con
pi = 0 tal que
pAej > ei Aej ∀j ∈ {1, . . . , n}
Similarmente, la estrategia pura j (ej ) del jugador 2 es estrictamente domi-
nada si existe q = (q1 , . . . , qm ) ∈ ∆(S2 ) con qj = 0 tal que
ei Bq > ei Bej ∀i ∈ {1, . . . , m}
1.8.4. Teorema de Nash (juegos en forma estratégica con k juga-

dores)
Teorema 1.8. Todo juego G en forma estratégica con un numero finito de
jugadores y cada jugador con un numero finito de estrategias puras tiene al
menos un E.N. (en estrategias mixtas “o puras”).
2. Juegos dinámicos con información comple-

ta
Ahora estudiaremos juegos en los que los jugadores pueden tomar deci-
siones en distintos instantes del tiempo y donde cada jugador conoce con
certeza las funciones de pagos de todos los jugadores. La forma natural de
representar a estos juegos es la forma extensiva.
Recordemos que en un juego de forma extensiva se debe precisar:
1. Quiénes son los jugadores.
2. Cuando tiene que jugar cada jugador.
3. Qué cosas puede hacer cuando le toca jugar (acciones factibles)
4. Qué sabe dicho jugador, cuando le toca jugar, acerca del desarrollo
previo del juego.
5. A cuánto asciende la ganancia de cada jugador para cada posible desa-

rrollo del juego.
Definición 2.0.1. Sea G un juego de información completa (la estructura y
los pagos del juego son de dominio público). Decimos que G es de informa-
ción perfecta si cada conjunto de información de cualquiera de los jugadores
tiene un único elemento. En caso contrario decimos que es de información
imperfecta.
19
Ejemplo 2.1. Consideremos el siguiente juego: Una empresa nueva quiere
entrar al mercado para hacerle competencia a la única empresa establecida.
Está ultima amenaza con bajar los precios (aunque ambas pierdan) para per-
judicar a la empresa entrante. El siguiente árbol representa al juego. . .
Ejemplo 2.2. Juego de confianza. . .
2.0.1. Equilibrios de Nash

Para el juego de la empresa única que amenaza a una posible competencia,
la forma estrategica de este juego estarı́a representada por:
Vieja empresa
Guerra Aceptar
Nueva Empresa Entrar (0,-10) (10,10)
No Entrar (0,20) (0,20)
Observemos que (No Entrar, Guerra) y (Entrar, Aceptar) son Equilibrios

de Nash. Sin embargo desde una “perspectiva temporal”, (Entrar, Aceptar)
es más razonable.
Definición 2.0.2. Dado un juego G con información completa en forma
extensiva y un nodo de decición x, decimos que G∗ es es un subjuego de G
con inicio en x si G∗ es una parte de G que cumple lo siguiente:
1. Contiene al nodo x y a todos los nodos que siguen a x, y sólo a ellos.
2. El nodo x es un conjunto de información unitario.
3. Si el nodo y pertenece a G0 , también pertenecen a G0 todos los nodos

del conjunto de información al que pertenece y, es decir, G0 no rompe
ningún conjunto de información.
Observaciones:
Es evidente que el propio G es siempre un subjuego de G. Llamamos

subjuegos propios de G a aquellos subjuegos que no coinciden con G.
Si G es de información perfecta, cualquier parte que comience en un

nodo de decisión y contenga todos los nodos que le siguen es un sub-
juego.
Un subjuego puede empezar en un nodo de azar, porque dicho nodo es

un conjunto de información unitario.
20
También se consideran subjuegos aquellos en los que ya sólo va a in-
tervenir uno de los jugadores.
Los juegos estáticos representados en forma extensiva no tienen ningún

subjuego propio, ya que el único conjunto de información unitario que
tienen es el nodo inicial.
Definición 2.0.3. Sea s un perfil de estrategias de G que es un equilibrio de

nash. Decimos que s es un Equilibrio de Nash Perfecto en Subjuegos (ENPS)
de G si la restricción de s a cualquier subjuego de G es un EN de dicho
subjuego.
Definición 2.0.4. Sea r un resultado o desarrollo posible de G. Decimos que
r es un Resultado Perfecto en Subjuegos (RPS) de G si r puede obtenerse
como realización de un perfil s que es un ENPS.
En el juego de la empresa única que ameza a una posible competencia

solo hay un subjuego propio que comienza en el nodo de decisión de la vieja
empresa. En dicho subjuego con jugador único el equilibrio de nash corres-
ponde a que la vieja empresa acepte la competencia y por tanto serán ENPS
del juego global aquellos equilibrios de nash del juego global cuya restricción
al juego propio sea “aceptar la competencia”.
Algoritmo de inducción hacia atrás
1. Se identifican todos los subjuegos que se producen en último lugar (es

decir,aquellos que comienzan en los nodos de decisión que sólo preceden
a nodos terminales. Estos subjuegos tienen un único jugador, y su EN
es por definición la acción óptima de dicho jugador). A continuación
se elimina cada uno de esos subjuegos, salvo su nodo de comienzo, y
se considera que dicho nodo pasa a ser nodo terminal del juego global,
y se le atribuyen los pagos que se habrı́an hecho efectivos de haberse
jugado la acción óptima correspondiente a ese nodo. De esta manera se
han podado las últimas ramas del árbol del juego global inicial, y nos
encontramos con un árbol más corto.
2. Se repite con el árbol reducido lo dicho en la etapa anterior, y se con-

tinúa con este proceso hasta que se llega al nodo inicial del juego de
partida.
21
Nota 2.1. En caso de que en algún nodo de decisión haya varias acciones
óptimas, el proceso sólo cambia en el hecho de que habrı́a que considerar
todas las posibilidades. Es decir, habrı́a que formar tantos árboles reducidos
para la etapa siguiente del análisis (anterior en el tiempo) como combinacio-
nes hubiera de acciones óptimas en la etapa actual. Al final, obtendrı́amos
varios resultados perfectos en subjuegos posibles y varios equilibrios de Nash
perfectos en subjuegos, uno por cada proceso de poda diferente.
Por otra parte, si en algún nodo de decisión hay un número infinito de ac-
ciones, pero manteniendo finita la longitud de cualquier desarrollo posible del
juego, el proceso sigue siendo válido siempre que, en cada nodo de decisión,
exista alguna acción factible óptima.
Teorema 2.3. Cada juego finito con información completa y perfecta G tiene
un Equilibrio de Nash Perfecto en Subjuegos (ENPS) en estrategias puras que
se obtiene por el método de inducción hacia atrás. Además, si ningún jugador
tiene más de una acción óptima en cada nodo de decisión, tal ENPS es único.
Algoritmo de inducción hacia atrás para juegos con información

imperfecta
1. Se identifican todos los subjuegos que se producen en último lugar (es

decir, aquellos que comienzan en los nodos de decisión lo más cercanos
posible a los nodos terminales). Estos subjuegos pueden tener uno o
varios jugadores. Se calculan los EN de dichos subjuegos.
2. A continuación, si sólo existe un único EN en estrategias puras en cada
subjuego, se elimina cada uno de esos subjuegos, salvo su nodo de
comienzo que es reemplazado por el nodo terminal del juego global al
que se habrı́a llegado de haberse jugado el perfil EN correspondiente a
ese subjuego, y se le atribuyen los pagos de dicho perfil. De esta manera
se han podado las ramas del árbol correspondientes a los subjuegos
finales del juego global inicial, y nos encontramos con un árbol más
corto. En el caso de que existan EN en estrategias mixtas, le asignamos
al nodo de comienzo de los subjuegos con EN en estrategias mixtas los
pagos esperados correspondientes a ese EN. Si existen múltiples EN en
alguno o varios de los subjuegos, el proceso sólo cambia en que hay que
considerar todas las posibilidades, es decir, se forman tantos árboles
reducidos como combinaciones haya de EN en la etapa actual. Al final,
obtendremos resultados perfectos en subjuegos (todos) y equilibrios de
Nash perfectos en subjuegos.
22
Teorema 2.4. Si un juego admite la inducción hacia atrás generalizada, y
todos y cada uno de sus subjuegos finales (tanto en el juego global como en los
reducidos) admiten un EN único, el resultado mediante inducción del juego
es el único resultado perfecto en subjuegos y las estrategias generadas a partir
de las acciones tomadas por cada jugador en cada uno de sus conjuntos de
información constituyen el único equilibrio de Nash perfecto en subjuegos.
3. Juegos estáticos con información incom-

pleta
Ahora estudiaremos juegos donde los jugadores toman decisiones de ma-
nera simultánea pero algubas informaciónes relacionadas con los pagos es de
caracter privado, es decir, están al alcance de algunos jugadores pero no de
todos.
Por ejemplo en una subasta, un jugador conoce la valoración del objeto
subastado pero no la de los demás.
Ejemplo 3.1. Batalla de los sexos modificada. . .
Ejemplo 3.2. Por amor o por dinero. . .
3.1. Juegos Bayesianos

Un juego bayesiano estático, consiste (adicionalmente de que cada juga-
dor i tiene un conjunto de acciones) un conjunto de tipos Ti y una suposición
o conjetura pi sobre el tipo de los otros jugadores. Donde cada tipo ti es una
variable aleatoria, y la distribución de probabilidad conjunta de los tipos vie-
ne dada por la función p(t1 , . . . , tn ) y ası́, la conjetura pi es una probabilidad
condicionada, denotada pi (t−i |ti ), que depende de cuál sea el tipo efectivo ti
del jugador i. Por último, la función de pagos de cada jugador depende de
las acciones decididas y de los tipos efectivos de todos los jugadores. Ası́,
ui (a1 , . . . , ai , . . . , an ; t1 , . . . , ti , . . . , tn )
Ası́, un juego bayesiano lo podemos denotar como sigue
GB = {J; A1 , . . . , An ; T1 , . . . , Tn ; p1 , . . . , pn ; u1 , . . . , un }
La estructura temporal del juego es:

El azar determina un vector de tipos t = (t1 , ..., tn ) donde ti ∈ Ti , de
acuerdo con una probabilidad a priori p(t) que es de dominio público.
23
El jugador i, y ningún otro observa su tipo efectivo ti , y se forma una
conjetura pi (t−i |ti ) a partir de su tipo efectivo y la distribución a priori.
Los jugadores toman simultáneamente sus decisiones y el jugador i

recibe un pago de ui (a1 , . . . , an ; t1 , . . . , tn )
Ejemplo 3.3. Consideremos el siguiente juego
Jugador 2
L R
Jugador 1 X (3, θ) (0, 0)
Y (2, 2θ) (2, θ)
Z (0, 0) (3, −θ)
donde θ ∈ {−1, 1} es un parámetro conocido para el jugador 2. El jugador 1

cree que θ = 1 con probabilidad 12 (y con probabilidad 21 para θ = −1. En este
caso tenemos que
J = {1, 2}
A1 = {X, Y, Z} ; A2 = {L, R}
T1 = {t1 } ; T2 = {θ = −1, θ = 1}
1
P1 (θ = −1|t1 ) = P1 (θ = 1|t1 ) =
2
P2 (t1 |θ = −1) = P1 (t1 |θ = −1) = 1
u1 (X, L;t1 , θ = −1) = 3; u2 (X, L;t1 , θ = −1) = −1
u1 (X, L;t1 , θ = 1) = 3; u2 (X, L;t1 , θ = 1) = 1
u1 (X, R;t1 , θ = −1) = 0; u2 (X, R;t1 , θ = −1) = 0
u1 (X, R;t1 , θ = 1) = 0; u2 (X, R;t1 , θ = 1) = 0
u1 (Y, L;t1 , θ = −1) = 2; u2 (Y, L;t1 , θ = −1) = −2
u1 (Y, L;t1 , θ = 1) = 2; u2 (Y, L;t1 , θ = 1) = 2
u1 (Y, R;t1 , θ = −1) = 2; u2 (Y, R;t1 , θ = −1) = −1
u1 (Y, R;t1 , θ = 1) = 2; u2 (Y, R;t1 , θ = 1) = 1
u1 (Z, L;t1 , θ = −1) = 0; u2 (Z, L;t1 , θ = −1) = 0
u1 (Z, L;t1 , θ = 1) = 0; u2 (Z, L;t1 , θ = 1) = 0
u1 (Z, R;t1 , θ = −1) = 3; u2 (Z, R;t1 , θ = −1) = 1
u1 (Z, R;t1 , θ = 1) = 3; u2 (Z, R;t1 , θ = 1) = −1
24
Definición 3.1.1. Dado un juego bayesiano estático
GB = {J; A1 . . . , An ; T1 , . . . , Tn ; p1 , . . . , pn ; u1 , . . . , un } (GB = {J; A; T ; p; u})
una estrategia pura del jugador i es una regla de decisión que especı́fica una
acción de Ai por cada elemento de Ti .
En el ejemplo anterior
S1 = {X, Y, Z}
y
S2 = {L (θ = −1) , L (θ = 1) , L (θ = −1) , R (θ = 1) ,
R (θ = −1) , L (θ = 1) , R (θ = −1) , R (θ = 1)}
Si especificamos que para el jugador 2 θ = −1 y θ = 1 son respectivamente
el primer y segundo tipo entonces S2 = {LL, LR, RL, RR}.
Definición 3.1.2. Sea GB = {J; A; T ; p; u} un juego bayesiano estático,
dado un perfil de estrategias puras s∗ = (s∗1 , . . . , s∗n ); decimos que la estrategia
s∗i es una respuesta óptima del jugador i a la combinación s∗−i si para cada
ti ∈ Ti ; s∗i (ti ) es una solución del problema
X
máx pi (t−i |ti )ui (s∗1 (t1 ), . . . , s∗i−1 (ti−1 ), ai , s∗i+1 (ti+1 ), . . . , s∗n (tn ); t1 , . . . , ti , . . . , tn )
ai ∈Ai
t−i ∈Ti
y decimos que s∗ es un equilibrio bayesiano de Nash si para cada jugador i, s∗i

es una respuesta optima para s∗−i .
3.1.1. Equilibrios bayesianos en estrategias mixtas

Definición 3.1.3. Sea GB = {J; A; T ; p; u} un juego bayesiano estático.
Una estrategia mixta del jugador i es una regla de decisión que asigna una
aplicación σi : Ti −→ ∆(Ai ) (para cada tipo ti se asigna una |Ai |-tupla σi ).
Definición 3.1.4. Un perfil de estrategias mixtas σ ∗ = (σ1∗ , . . . , σn∗ ) es un
equilibrio de nash en estrategias mixtas si para cada i, σi∗ es la mejor respuesta
∗
a σ−i .
Ejemplo 3.4. . . .
Aplicaciones a susbastas
Subastas de primer precio
Subastas de segundo precio
25
3.2. Juegos dinámicos con información incompleta
3.2.1. Equilibrio bayesiano perfecto
Hemos visto algunos ejemplos de juegos dinámicos con información com-
pleta (pero imperfecta) donde los EBPS no son satisfactios en el sentido de
que hay jugadores que sin importar el nodo (de un conjunto no trivial de
información) su jugada optima no corresponde con la jugada indicada en el
EBPS.
Luego entonces, surge la necesidad de formular otro concepto de equilbrio
que refine al EBPS de manera que evite equilibrios “no satisfactorios”. Este
refinamiento se le llama equilibrio bayesiano perfecto EBP y describiremos a
continuación:
Un EBP consiste en estrategias y conjeturas que satisfacen las siguientes
4 condiciones:
Conjeturas
En cada conjunto de información, el jugador que decide debe formarse
una conjetura sobre el nodo del conjunto de información al que se ha llegado
en el juego. Una conjetura es una distribución de probabilidad sobre los nodos
del conjunto de información.
Estrategias sucesivamente racionales
En cada conjunto de información, la acción tomada por el jugador al que le
toca tirar y sus estrategias subsiguientes (plan de acción completo) deben de
ser óptimas.
Las siguientes dos condiciones se relacionan con la trayectoria de equi-
librio: Un conjunto de información está en la trayectoria de equilibrio (EN,
ENPS, EB, EBP) si se alcanza con probabilidad positiva cuando el juego
se desarrolla según la estrategias de equilibrio, y fuera de la trayectoria de
equilibrio si es seguro que no se alcanza cuando el juego se desarrolla según
las estrategias de equilibrio.
Regla de Bayes en la trayectoria de equilibrio
En conjuntos de información sobre la trayectoria de equilibrio las conje-
turas se determinan de acuerdo con la regla de Bayes y las estrategias de los
jugadores: Sea σ un perfil estratégico, h un conjunto de información y x un
p(x|σ )
nodo entonces P (x) = p(h|σ )
.
Regla de Bayes fuera de la trayectoria de equilibrio
En conjuntos de información fuera de la trayectoria de equilibrio, las conje-
turas se determinan según la regla de Bayes y las estrategias de los jugadores
donde sea posible.
26
3.2.2. Juegos de señalización. . .
Nótesé que en los juegos de señalización donde hay por lo menos dos tipos
- para el emisor- no tienen subjuegos propios.
3.2.3. El equilibrio bayesiano perfecto en el juego de señalización

Dado un perfil σ ∗ = (σE∗ , σR∗ ) y un sistema de creencias µ = {µm }m∈M un
EBP está determinado por las siguientes condiciones:
Conjeturas
Después de observar cualquier mensaje m ∈ M, el receptor debe formarse
una conjetura sobre qué tipos podrián haber enviado m :
µm (t) ≥ 0
y X
µm (t) = 1.
t∈T
Estrategias sucesivamente racionales

Para cada tipo t de E, σE∗ (t) debe verificar que
UE (σE∗ (t), σR∗ (σE∗ (t)); t) ≥ UE (m, σR (m)); t) ∀m ∈ M
y
X X
∀m ∈ M : µm (t) · UR (m, σR (m)); t) ≥ µm (t) · UR (m, a); t)∀a ∈ A.
t∈T t∈T
Regla de Bayes en la trayectoria de equilibrio

En conjuntos de información sobre la trayectoria de equilibrio las conje-
turas son consistentes con las estrategias σE∗ en el sentido de que las pro-
babilidades de cada conjetura están determinadas con la reglas de Bayes
(por dichas estrategias). Ası́ para cada hm en la trayectoria de equilibrio
p(hm |σE ) 6= 0. Luego
p(t|σE ) p(t)σE (m|t)

µm (t) = = P
p(h|σE ) p(t0 )σE (m|t0 )
σE (m|t0 )>0
en el caso en que σE sea una estrategia pura, la conjetura estipula para

cualquier tipo t ∈ T,
p(t)
µm (t) = P
p(t0 )
σE (t0 )=m
27
Nota 3.1. En un conjuntos de información hm fuera de la trayectoria no
existe un tipo t tal que σE (t) = m. Luego el requisito de Regla de Bayes fuera
de la trayectoria de equilibrio de EBP para juegos se cumple de manera trivial
(cualquier conjetura es válida).
Definición 3.2.1. Sea G un juego de señalización.
Una estrategia pura sE es una estrategia de agrupación si todos los tipos

de emisor deciden el mismo mensaje, es decir, si existe un mensaje
m ∈ M tal que sE (t) = m,∀t ∈ T.
Una estrategia pura sE es una estrategia de separación si tipos distintos

de E deciden mensajes distintos, es decir, t 6= t0 implica que sE (t) 6=
sE (t0 ).
Un perfil de equilibrio σ ∗ = (σE∗ , σR∗ ) es un equilibrio agrupador si σE∗

es una estrategia de agrupación y σE∗ es un equilibrio separador si σE∗
es una estrategia de separación.
28

Teoria de Juegos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoria de Juegos

Cargado por

Copyright:

Formatos disponibles

Notas de teorı́a de juegos

Julio Cesar Macı́as Ponce

3. Juegos estáticos con información incompleta 23

1.1. Estrategias, preferencias y racionalidad

Además se asumirá que los jugadores son racionales: El objetivo de cada

1.2. Juegos en forma extensiva

1. El conjunto de jugadores J = {0, 1, ..., n} cuando ”participa.el azar o la

En donde σ(o) = o, y para x 6= o, σ(x) es el nodo inmediato predecesor

4. Para cada i ∈ J sea Xi el conjunto de nodos de decisión en los que el

A(x) = A(x0 ) si h(x) = h(x0 )

6. Una función ρ : H0 × A → [0, 1] que asigna probabilidades a acciones

7. Una función de pagos

Definición 1.2.1. Un juego en forma extensiva Γ viene especificado por los

1.4. Un ejemplo importante en la literatura:

1.4.2. Más ejemplos

La Guerra de los sexos

1.4.3. Cuando hay movimientos del azar:

1.4.4. Juegos con más de dos jugadores

1.5. Juegos estáticos con información completa

Notación: Dado un perfil de estrategias s = (s1 , ..., sn ) ∈ S1 ×...×Sn = S

s−i = (s1 , . . . , si−1 , si+1 , . . . , sn ) ∈ S1 × · · · × Si−1 × Si+1 × · · · × Sn

A la combinación de estrategias de los n − 1 (jugadores diferentes a i)

S−i = S1 × . . . × Si−1 × Si+1 × ... × Sn

será el conjunto de todas las combinaciones de estrategias de los n − 1 juga-

1.5.1. Estrategias dominadas y dominantes

1.5.2. Solución de un juego

Podemos llamar solución a un conjunto de perfiles de estrategias tal que

1.6. Equilibrio de Nash (Estrategias puras)

(s∗1 , . . . , s∗i , . . . , s∗n ) es un equilibrio de Nash (EN) si para cada jugador i se

Funciones de mejor respuesta

El concepto de equilibrio de Nash identifica los perfiles de estrategias que

1.7. Tres modelos clásicos de duopolio

1.7.1. Modelo de Cournot

1.7.2. Modelo de Bertrand

1.7.3. Modelo de Hotelling

S − t (x − α)2 − p1 > S − t (x − β)2 − p2

Luego el punto de indiferencia para el consumidor es

Ası́, ya que los consumidores a la izquierda de x∗ preferirán la empresa 1

Dado un juego G = {J, (Si )i∈J , (ui )i∈J } definimos lo siguiente:

Un perfil s = (s1 , ..., si , ..., sn ) está dominado en el sentido de Pareto

uk (s0 ) > uk (s) ∀i ∈ J

Un perfil s = (s1 , . . . , si , . . . , sn ) es un óptimo de Pareto (o eficiente

En un equilibrio de Pareto ningún jugador puede mejorar sin perjudicar

Ejemplo 1.3. El Equilibrio de Nash no es óptimo de Pareto en el dilema

1.8. Estrategias mixtas

Al conjunto de estrategias mixtas del jugador i lo denotaremos por ∆(Si ).

Definición 1.8.3. Un perfil de estrategias mixtas σ ∗ = (σ1∗ , . . . , σn∗ ) es un

E [ui (σ1∗ , . . . , σn∗ )] ≥ E [u(σ1∗ , . . . , σi , . . . , σn∗ )]

para cada i ∈ J = {1, ..., n} y para toda estrategia mixta σi .

1.8.1. Juegos bipersonales de suma cero

u1 (s1 , s2 ) = −u1 (s1 , s2 ) ∀ (s1 , s2 ) ∈ S1 × S2

decimos que G es un juego bipersonal de suma cero.

mı́n{pAq q = (q1 , . . . , qn ) ∈ ∆(S2 )} ≥ mı́n{p0 Aq q = (q1 , . . . , qn ) ∈ ∆(S2 )}

máx{pAq q = (q1 , . . . , qn ) ∈ ∆(S2 )} ≤ máx{pAq 0 p = (p1 , . . . , pm ) ∈ ∆(S1 )}

para cada q 0 ∈ ∆(S2 ).

Una estrategia p del jugador 1 garantiza un pago de al menos v para

Una estrategia q del jugador 2 garantiza un pago de a lo mas v para el

A v se le llama el valor del juego (y u1 (p, q) = v si p y q son estrategias

Definición 1.8.6. Dado un juego bipersonal G decimos que aij es un punto

aij ≥ akj ∀k ∈ {1, . . . , m}

1.8.2. La programación lineal y los juegos de suma cero

Teorema 1.6. Sea Zp el valor optimo del siguiente modelo de programación

Entonces Zp es el valor del juego G.