Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Índice
1. Teorı́a de juegos 3
1.1. Estrategias, preferencias y racionalidad . . . . . . . . . . . . . 3
1.2. Juegos en forma extensiva . . . . . . . . . . . . . . . . . . . . 4
1.3. Juegos en forma estratégica . . . . . . . . . . . . . . . . . . . 6
1.4. Un ejemplo importante en la literatura: . . . . . . . . . . . . . 7
1.4.1. El Dilema del prisionero . . . . . . . . . . . . . . . . . 7
1.4.2. Más ejemplos . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3. Cuando hay movimientos del azar: . . . . . . . . . . . 8
1.4.4. Juegos con más de dos jugadores . . . . . . . . . . . . 8
1.5. Juegos estáticos con información completa . . . . . . . . . . . 8
1.5.1. Estrategias dominadas y dominantes . . . . . . . . . . 9
1.5.2. Solución de un juego . . . . . . . . . . . . . . . . . . . 9
1.5.3. Solución por eliminación de estrategias estrictamente
dominadas . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6. Equilibrio de Nash (Estrategias puras) . . . . . . . . . . . . . 10
1.7. Tres modelos clásicos de duopolio . . . . . . . . . . . . . . . . 11
1.7.1. Modelo de Cournot . . . . . . . . . . . . . . . . . . . . 11
1.7.2. Modelo de Bertrand . . . . . . . . . . . . . . . . . . . 12
1.7.3. Modelo de Hotelling . . . . . . . . . . . . . . . . . . . 12
1.7.4. Eficiencia de Pareto . . . . . . . . . . . . . . . . . . . . 14
1.8. Estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . . 14
1.8.1. Juegos bipersonales de suma cero . . . . . . . . . . . . 15
1.8.2. La programación lineal y los juegos de suma cero . . . 16
1.8.3. Juegos Bipersonales (en general) . . . . . . . . . . . . . 18
1.8.4. Teorema de Nash (juegos en forma estratégica con k
jugadores) . . . . . . . . . . . . . . . . . . . . . . . . . 19
1
2. Juegos dinámicos con información completa 19
2.0.1. Equilibrios de Nash . . . . . . . . . . . . . . . . . . . . 20
2
1. Teorı́a de juegos
Teorı́a de juegos es una formal disciplina matemática que estudia situa-
ciones de competencia y cooperación entre varios agentes (jugadores).
Podemos encontrar diversas aplicaciones de la teorı́a de juegos, incluso
en el Talmud se reconocen modelos de la teorı́a de juegos que en la actua-
lidad los identificamos como problemas de bancarrota. Las aplicaciones que
abordaremos en este curso serán relacionados con la economı́a.
Los primeros trabajos reconocidos en la teorı́a de juegos se deben a Emile
Borel y John von Neumann. El libro “Game theory and Economic behavior”
publicado por von Neumann y Oskar Morgenstern establecen los fundamentos
de la teorı́a.
En 1950 John F. Nash desarrolla el concepto de Equilibrio de Nash que
poco después se uso en Teorı́a Económica, Ciencia Polı́tica, Psicologı́a, etc;
en 1970 se uso como herramienta en Biologı́a evolutiva. En 1994 Harsanyi,
Nash y Selten obtienen el Premio Nobel de Economı́a.
Los juegos cooperativos y no cooperativos se distinguen en que en los
primeros hay acuerdos vinculantes entre los agentes. Comenzaremos con el
estudio de los juegos no cooperativos - donde no se permiten acuerdos vin-
culantes -.
3
saben, todos saben que todos lo saben, todos saben que todos saben que
todos lo saben...(ad infinitum).
σ:X→X
4
5. Una familia de conjuntos de información H, y una función h : D(X) →
H que asigna a cada nodo x un conjunto de información h(x) al que per-
tenece. Los conjuntos de información forman una partición de D(X).
Todos los nodos de decisión que tienen a un mismo conjunto de infor-
mación tienen las mismas acciones disponibles, es decir:
Sea
A(h(x)) = {a ∈ A : a ∈ A(y) para y ∈ h(x)}
A(h(x)) es el conjunto de acciones disponibles para el conjunto de in-
formación h(x). Con Hi denotaremos al conjunto de todos los conjuntos
de información del jugador i; y con H al conjunto que contiene a todos
los conjuntos
S de información contenidos en los Hi , para i ∈ J. Es decir
H= Hi .
i∈J
ρ(h, a) = 0 ∀a ∈
/ A(h(0))
X
ρ(h, a) = 1 ∀h ∈ H0
a∈A(h(o))
Nota 1.1. Cuando no hay “jugador cero” (no existen movimientos de azar)
se omite la función ρ.
5
1.3. Juegos en forma estratégica
Definición 1.3.1. Una estrategia pura para el jugador i ∈ J es una función
que
si : Hi → A
con si (h) ∈ A(h).
Sea Si el conjunto de todas las estrategias puras del jugador i y supon-
gamos que no existen movimientos de azar; dada una estrategia si ∈ Si para
cada i ∈ J queda determinado un desarrollo completo del juego, llegándose
a un nodo terminal. Se dice que s = (s1 , ..., sn ) ∈ S1 × ... × Sn = S es un
perfil o una combinación de estrategias puras.
Sea η(s) el nodo terminal que se alcanza con el perfil s y sea ui (s) =
ri (η(s)) el pago que recibe el jugador i en η(s)
Definición 1.3.2. Un juego en forma estratégica (o en forma normal) G se
define con una terna:
G = J, (Si )i∈J , (ui )i∈J
Ejercicio 1.1. En el siguiente juego encuentre el conjunto de estrategias
puras para cada uno de los jugadores, ası́ como los pagos que recibe cada uno
de los jugadores para cada combinación de estrategias puras.
Nota 1.2. Cuando se tienen dos jugadores, con un número finito de estrate-
gias para cada jugador la representación estratégica del juego se puede hacer
mediante una matriz:
J = {1, 2}
S1 = s11 , . . . , sl1
S2 = s12 , . . . , sm
2
Jug 2
s12 s22 ··· sm2
s11 u1 (s1 , s2 ), u1 (s1 , s2 ) u1 (s11 , s22 ), u1 (s11 , s22 )
1 1 1 1
··· u1 (s11 , sm 1 m
2 ), u1 (s1 , s2 )
Jug 1 s21 u1 (s21 , s12 ), u1 (s21 , s12 ) u1 (s21 , s22 ), u1 (s21 , s22 ) ··· u1 (s21 , sm 2 m
2 ), u1 (s1 , s2 )
.. .. .. ... ..
. . . .
sl1 u1 (sl1 , s12 ), u1 (sl1 , s12 ) u1 (sl1 , s22 ), u1 (sl1 , s22 ) · · · u1 (sl1 , sm l m
2 ), u1 (s1 , s2 )
6
Para el ejercicio anterior tenemos...
Sospechoso 2
Callar Conf esar
Sospechoso 1 Callar (−1, −1) (−5, 0)
Conf esar (0, −5) (−4, −4)
7
MUJER
Fútbol Concierto
HOMBRE Fútbol (2,1) (0,0)
Concierto (0,0) (1,2)
Ejemplos:
8
El dilema del prisionero
La guerra de los sexos
Halcón-Paloma
La caza del ciervo
el jugador i.
Decimos que s00i domina débilmente a s0i si la desigualdad
ui (s1 , . . . , si−1 , s0i , si+1 , . . . , sn ) ≤ ui (s1 , . . . , si−1 , s00i , si+1 , . . . , sn )
se cumple para toda combinación de estrategias s−i de los otros ju-
gadores, y para alguna de esas combinaciones se cumple de manera
estricta.
Decimos que s00i domina estrictamente a s0i si la desigualdad
ui (s1 , . . . , si−1 , s0i , si+1 , . . . , sn ) < ui (s1 , . . . , si−1 , s00i , si+1 , . . . , sn )
se cumple para toda combinación de estrategias s−1 de los otros juga-
dores.
Decimos que s0i es no dominada débilmente si no existen estrategias del
jugador i que la dominen débilmente y decimos que s0i es no dominada
estrictamente si no existen estrategias del jugador i que la dominen.
9
1.5.3. Solución por eliminación de estrategias estrictamente do-
minadas
Se trata de ir eliminado estrategias estrictamente dominadas, la impor-
tancia de que sean “estrictas” se justifica en el hecho de que si procedemos
a eliminar estrategias estricta y débilmente dominadas puede ocurrir lo si-
guiente:
(ejemplo de clase)
10
Lemma 1.2. Un perfil de estrategia s∗ = (s∗1 , . . . , s∗n ) es un equilibrio de
Nash si, y solo si para cada i, s∗i ∈ Ri (s−i )
11
.
Si q2 > 0 tenemos que el máximo se alcanza en 12 (α − c − q2 ) si q2 ≤ α − c
y 0 si q2 > α − c.
La función de mejor respuesta para el jugador 2, es la misma a la firma
1, luego para obtener el equilibrio de Nash resolvemos el siguiente sistema:
1
q1 = (α − c − q2 )
2
1
q2 = (α − c − q1 )
2
cuya solución es q1∗ = q2∗ = α−c
3
donde j = 2 si i = 1 y j = 1 si i = 2.
¡ El único equilibrio de Nash es (c, c)!
12
Si ambas empresas ofrecen el mismo producto al mismo precio, el con-
sumidor elige la tienda más cerca. Suponemos que los consumidores están
distribuidos de manera uniforme en la avenida y que cada consumidor decide
tomando en cuenta el precio que tendrá que pagar por el bien y el costo por
tener que trasladarse.
Ası́, un consumidor que esté a una distancia di de la empresa i tendrá un
costo td2i . Sea S el beneficio que proporciona el producto, luego la utilidad
del consumidor será de S − td2i − pi . Por tanto, un consumidor situado en un
punto x preferirá comprar en la tienda 1 si
t (β − α) (α + β + 2)
p1 = c +
3
t (β − α) (4 − α − β)
p2 = c +
3
13
1.7.4. Eficiencia de Pareto
Nota 1.3. Mientras no se especifique lo contrario, el número de jugadores
(diferentes a la naturaleza) será n. Es decir J = {1, ..., n}.
ui (s0 ) ≥ ui (s) ∀i ∈ J
y existe un k ∈ J tal que
14
Definición 1.8.2. La utilidad esperada para el jugador i para el perfil de
estrategias mixtas σi = (σ1 , . . . , σn ) es:
X
E [ui (σ1 , . . . , σn )] = ui (s) · σ1 (s) · · · σn (s)
s=(s1 ,...,sn )∈S
para cada p0 ∈ ∆(S1 ). Y decimos que un vector q = (q1 , ..., qn) ∈ ∆(S2 ) es
una estrategia minimax para el jugador 2 si
15
Von Neumann mostró que para todo juego bipersonal de suma cero G
(con matriz A) existe un numero real v(A) con las siguientes propiedades:
y
aij ≤ aik ∀k ∈ {1, . . . , n}
Es claro que si aij es un punto silla entonces las estrategias puras i y j son
estrategias maximin y minimax respectivamente y v(A) = aij .
Ejercicios
16
Demostración. Sea v el valor del juego, mostraremos primero que Zp ≥ v.
Por ser v el valor del juego, entonces existe un p∗ tal que
E [u1 (p∗ , q)] ≥ v ∀q ∈ ∆(S2 )
en particular
E [u1 (p∗ , s2 )] ≥ v ∀s2 ∈ S2
Pero Zp es el valor máximo para el que se cumplen las desigualdades, luego
Zp ≥ v. Ahora mostraremos la desigualdad Zp ≤ v. Primero mostraremos
que la solución del modelo de programación lineal es acotada: Sean p1 , . . . , pm
y z una solución factible del modelo de programación lineal.
Entonces m
X
Z≤ pi u1 (si , sj ) ∀j ∈ {1, . . . , n}
i=1
y
m
X
pi = 1
i=1
luego,
m
X
Z≤ pi u1 (si , sj )
i=1
≤ máx máx |u1 (si , sj )| × (p1 + · · · + pm )
s1 ∈S1 s2 ∈S2
17
Similarmente, la estrategia pura j (ej ) del jugador 2 es estrictamente
dominada si existe q = (q1 , . . . , qm ) ∈ ∆(S2 ) con qj = 0 tal que
p∗ Aq ∗ ≥ p0 Aq ∗ ∀p0 ∈ ∆(S1 )
y
p∗ Bq ∗ ≥ p∗ Bq 0 ∀q 0 ∈ ∆(S2 )
¡p∗ es la mejor respuesta ante q ∗ y q ∗ es la mejor respuesta ante p∗ !
Nota 1.4. Un juego bipersonal de suma constante es aquel que satisface que
18
Dado un juego bipersonal G decimos que la estrategia pura i (ei ) del
jugador 1 es estrictamente dominada si existe p = (p1 , . . . , pm ) ∈ ∆(S1 ) con
pi = 0 tal que
pAej > ei Aej ∀j ∈ {1, . . . , n}
Similarmente, la estrategia pura j (ej ) del jugador 2 es estrictamente domi-
nada si existe q = (q1 , . . . , qm ) ∈ ∆(S2 ) con qj = 0 tal que
4. Qué sabe dicho jugador, cuando le toca jugar, acerca del desarrollo
previo del juego.
19
Ejemplo 2.1. Consideremos el siguiente juego: Una empresa nueva quiere
entrar al mercado para hacerle competencia a la única empresa establecida.
Está ultima amenaza con bajar los precios (aunque ambas pierdan) para per-
judicar a la empresa entrante. El siguiente árbol representa al juego. . .
Ejemplo 2.2. Juego de confianza. . .
Vieja empresa
Guerra Aceptar
Nueva Empresa Entrar (0,-10) (10,10)
No Entrar (0,20) (0,20)
20
También se consideran subjuegos aquellos en los que ya sólo va a in-
tervenir uno de los jugadores.
21
Nota 2.1. En caso de que en algún nodo de decisión haya varias acciones
óptimas, el proceso sólo cambia en el hecho de que habrı́a que considerar
todas las posibilidades. Es decir, habrı́a que formar tantos árboles reducidos
para la etapa siguiente del análisis (anterior en el tiempo) como combinacio-
nes hubiera de acciones óptimas en la etapa actual. Al final, obtendrı́amos
varios resultados perfectos en subjuegos posibles y varios equilibrios de Nash
perfectos en subjuegos, uno por cada proceso de poda diferente.
Por otra parte, si en algún nodo de decisión hay un número infinito de ac-
ciones, pero manteniendo finita la longitud de cualquier desarrollo posible del
juego, el proceso sigue siendo válido siempre que, en cada nodo de decisión,
exista alguna acción factible óptima.
Teorema 2.3. Cada juego finito con información completa y perfecta G tiene
un Equilibrio de Nash Perfecto en Subjuegos (ENPS) en estrategias puras que
se obtiene por el método de inducción hacia atrás. Además, si ningún jugador
tiene más de una acción óptima en cada nodo de decisión, tal ENPS es único.
22
Teorema 2.4. Si un juego admite la inducción hacia atrás generalizada, y
todos y cada uno de sus subjuegos finales (tanto en el juego global como en los
reducidos) admiten un EN único, el resultado mediante inducción del juego
es el único resultado perfecto en subjuegos y las estrategias generadas a partir
de las acciones tomadas por cada jugador en cada uno de sus conjuntos de
información constituyen el único equilibrio de Nash perfecto en subjuegos.
ui (a1 , . . . , ai , . . . , an ; t1 , . . . , ti , . . . , tn )
GB = {J; A1 , . . . , An ; T1 , . . . , Tn ; p1 , . . . , pn ; u1 , . . . , un }
23
El jugador i, y ningún otro observa su tipo efectivo ti , y se forma una
conjetura pi (t−i |ti ) a partir de su tipo efectivo y la distribución a priori.
Jugador 2
L R
Jugador 1 X (3, θ) (0, 0)
Y (2, 2θ) (2, θ)
Z (0, 0) (3, −θ)
24
Definición 3.1.1. Dado un juego bayesiano estático
GB = {J; A1 . . . , An ; T1 , . . . , Tn ; p1 , . . . , pn ; u1 , . . . , un } (GB = {J; A; T ; p; u})
una estrategia pura del jugador i es una regla de decisión que especı́fica una
acción de Ai por cada elemento de Ti .
En el ejemplo anterior
S1 = {X, Y, Z}
y
S2 = {L (θ = −1) , L (θ = 1) , L (θ = −1) , R (θ = 1) ,
R (θ = −1) , L (θ = 1) , R (θ = −1) , R (θ = 1)}
Si especificamos que para el jugador 2 θ = −1 y θ = 1 son respectivamente
el primer y segundo tipo entonces S2 = {LL, LR, RL, RR}.
Definición 3.1.2. Sea GB = {J; A; T ; p; u} un juego bayesiano estático,
dado un perfil de estrategias puras s∗ = (s∗1 , . . . , s∗n ); decimos que la estrategia
s∗i es una respuesta óptima del jugador i a la combinación s∗−i si para cada
ti ∈ Ti ; s∗i (ti ) es una solución del problema
X
máx pi (t−i |ti )ui (s∗1 (t1 ), . . . , s∗i−1 (ti−1 ), ai , s∗i+1 (ti+1 ), . . . , s∗n (tn ); t1 , . . . , ti , . . . , tn )
ai ∈Ai
t−i ∈Ti
Aplicaciones a susbastas
Subastas de primer precio
Subastas de segundo precio
25
3.2. Juegos dinámicos con información incompleta
3.2.1. Equilibrio bayesiano perfecto
Hemos visto algunos ejemplos de juegos dinámicos con información com-
pleta (pero imperfecta) donde los EBPS no son satisfactios en el sentido de
que hay jugadores que sin importar el nodo (de un conjunto no trivial de
información) su jugada optima no corresponde con la jugada indicada en el
EBPS.
Luego entonces, surge la necesidad de formular otro concepto de equilbrio
que refine al EBPS de manera que evite equilibrios “no satisfactorios”. Este
refinamiento se le llama equilibrio bayesiano perfecto EBP y describiremos a
continuación:
Un EBP consiste en estrategias y conjeturas que satisfacen las siguientes
4 condiciones:
Conjeturas
En cada conjunto de información, el jugador que decide debe formarse
una conjetura sobre el nodo del conjunto de información al que se ha llegado
en el juego. Una conjetura es una distribución de probabilidad sobre los nodos
del conjunto de información.
Estrategias sucesivamente racionales
En cada conjunto de información, la acción tomada por el jugador al que le
toca tirar y sus estrategias subsiguientes (plan de acción completo) deben de
ser óptimas.
Las siguientes dos condiciones se relacionan con la trayectoria de equi-
librio: Un conjunto de información está en la trayectoria de equilibrio (EN,
ENPS, EB, EBP) si se alcanza con probabilidad positiva cuando el juego
se desarrolla según la estrategias de equilibrio, y fuera de la trayectoria de
equilibrio si es seguro que no se alcanza cuando el juego se desarrolla según
las estrategias de equilibrio.
Regla de Bayes en la trayectoria de equilibrio
En conjuntos de información sobre la trayectoria de equilibrio las conje-
turas se determinan de acuerdo con la regla de Bayes y las estrategias de los
jugadores: Sea σ un perfil estratégico, h un conjunto de información y x un
p(x|σ )
nodo entonces P (x) = p(h|σ )
.
Regla de Bayes fuera de la trayectoria de equilibrio
En conjuntos de información fuera de la trayectoria de equilibrio, las conje-
turas se determinan según la regla de Bayes y las estrategias de los jugadores
donde sea posible.
26
3.2.2. Juegos de señalización. . .
Nótesé que en los juegos de señalización donde hay por lo menos dos tipos
- para el emisor- no tienen subjuegos propios.
27
Nota 3.1. En un conjuntos de información hm fuera de la trayectoria no
existe un tipo t tal que σE (t) = m. Luego el requisito de Regla de Bayes fuera
de la trayectoria de equilibrio de EBP para juegos se cumple de manera trivial
(cualquier conjetura es válida).
28