Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teorı́a de Juegos
El Concepto de Juego 2
Teorı́a de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Historia de la Teorı́a de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Objetivos de la Tª de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Ejemplo: Juego de la caza del ciervo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Ejemplo: Chicken Game . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ejemplo: Matching Pennies (Los chinos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Ejemplo: El Dilema del Prisionero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
¿Hay Cooperación en DPs de la vida real? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ejemplo: Juego del Examen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Definición de Juego en Forma Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Equilibrio de Nash 20
Equilibrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Estrategias Dominadas 23
Estrategias Dominadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Equilibrio de Nash y Estrategias Dominadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1
Juegos en Forma Normal
El Concepto de Juego
Equilibrio de Nash
Estrategias Dominadas
Teorı́a de Juegos
◮ ¿Que es un Juego?
♦ Se trata de una descripción completa de una
situación estratégica
♦ Juegos de tablero
♦ Mercados, Subastas... (Economı́a)
♦ Conflictos (polı́tica, militares)
2
Historia de la Teorı́a de Juegos
◮ Nació durante (y a causa) de la II Guerra Mundial.
◮ Desarrollada por John von Neumann (1903-1957),
matemático Húngaro-Americano.
♦ Creador del primer sistema operativo (“Padre
del PC”)
♦ Miembro del Proyecto Manhattan (creadores de
la bomba atómica)
◮ Coautor: Oskar Morgenstern (1902-1977),
economista Aleman-Austriaco
◮ Concepto de Solución: Equilibrio de Nash (∼ 1950)
◮ Existencia demostrada por John Nash (1928-2015)
◮ Premio Nobel en 1994 (junto con John Harsanyi y Rein-
hard Selten)
¡Si!, el de la peli “Una Mente Maravillosa”, pero la peli está llena de errores
Objetivos de la Tª de Juegos
◮ Aproximación Normativa
♦ Determinar como deberı́an comportarse los agentes racionales en situaciones estratégicas
♦ “Agentes” pueden ser empresas, organizaciones, gobiernos, etc.
◮ Aproximación Positiva (o experimental)
♦ Describe como se comportan efectivamente las personas en esas interacciones estratégicas
♦ Se basa en datos. Se apoya en métodos experimentales, y por tanto, está cercana a la psicologı́a
◮ Este curso:
♦ Nos centramos en la aproximación Normativa a la Tª de Juegos.
♦ Ocasionalmente haremos mención a resultados importantes de la aproximación “Positiva”
(experimental)
3
Ejemplo: Juego de la caza del ciervo
◮ SITUACIÓN:
♦ En el bosque hay 4 conejos y un ciervo. Un ciervo = 10 conejos.
♦ Hay 2 cazadores (llamados 1 y 2)
♦ Si un cazador va solamente a por conejos, puede conseguir 4. Si los dos van a por conejos, cada
uno puede conseguir solamente 2.
♦ Un solo cazador no puede conseguir un ciervo. Si ambos van a por el ciervo, lo consiguen y se lo
reparten.
◮ Lo mejor para un jugador, dado lo que cree que el resto de jugadores van a hacer, es una “mejor
respuesta”. Aquı́ están subrayados los (mejores) pagos resultantes.
◮ Un resultado estable es un equilibrio. Este juego tiene dos.
◮ En equilibrio, todos los jugadores deciden una mejor respuesta a las estrategias decididas por los
demás.
4
Ejemplo: Chicken Game (1)
◮ SITUACIÓN::
♦ Basado en la peli Rebelde sin Causa de James Dean.
♦ Dos conductores aceleran hacia un precipicio. Antes
del punto de no retorno, pueden Parar o Continuar.
♦ Si uno para, es tachado de cobarde. El otro puede
detenerse justo en el punto de no retorno y volver
andando aclamado como ganador
♦ Si ambos “continúan,” tendrán que saltar del coche.
Pueden incluso quedar atrapados y morir.
5
Ejemplo: Matching Pennies (Los chinos)
◮ Cada jugador saca simultáneamente un número de de-
dos (Pares or Nones)
◮ El J. 1 gana si la suma es par
El J. 2 gana si la suma es impar (nones)
◮ El perdedor paga un euro al ganador.
◮ Situación alter. con monedas (Cara/Cruz)
◮ Este es un juego asimétrico.
◮ Si J. 1 piensa que J. 2 decide par, su mejor respuesta
(MR) es Nones.
◮ Pero si J. 2 piensa que J. 1 juega par, su MR es Nones
◮ Y si J. 1 piensa que J. 2 juega nones, su MR es Nones
1\2 Pares Nones
◮ Pero si J. 2 piensa que J. 1 juega nones, su MR es
Pares...
Pares 1,-1 -1,1
◮ Tenemos un cı́rculo de mejores respuestas Nones -1,1 1,-1
◮ No podemos encontrar ningún equilibrio en este juego
(de momento)
6
Ejemplo: Prisoner’s Dilemma (2)
◮ Los prisioneros son interrogados por
separado. Juegan simultáneamente.
◮ Si J. 1 piensa que J. 2 le va a de-
latar, para J. 1 es mejor delatar (−5 >
−10).
◮ Si J. 1 piensa que J. 2 va a coop-
erar, para J. 1 es también mejor de- 1\ 2 Cooperar Delatar
latar (−1 > −2). Cooperar -2,-2 -10,-1
◮ Lo mismo para el J. 2.
Delatar -1,-10 -5,-5(∗)
◮ Entonces (Delatar, Delatar) es el
único “resultado estable”.
◮ Si una estrategia es siempre mejor (estrictamente) que otra, decimos que esta última está
dominada por la primera. Aquı́ Cooperar está dominado por Delatar.
◮ Un jugador/a racional nunca deberı́a jugar una estrategia dominada.
◮ Una estrategia dominada nunca es parte de un equilibrio.
◮ Este juego tiene un solo equilibrio, y no es Pareto-eficiente.
e IS
T:
ET g
wi
th d
l
fo et
M
z PM lin
ea d "t e m
en
He isoM E THAEN O N W
7
bando. 5 :5 rd e b
t fo call w ill
,a gy en ck th
06 bo
Pr G A -LEB
te e ta
20 tra as b at ful tely
3, s s
h y e a e s
g. el' lah A n forc tun , th lah'
N L or d A u ra ":
Is zbol nce ore nfoFR
r
es
e
bo
l
C A R A E H a r f s d a y, H e erre r m ck.
U an E H ez
erE P
b
IS i m h u r Le
militarmente. W
Bis
m YS
Da ord Ct m i NN
im I ou n
gL ist
o m F
m
eba cal
HO ht s to o
ee
RE
ffe
re
tes ate
n lerC cnot:
i
h e
2 MA E for Pri
♦ Si el otro bando las tiene, evitaré ser dom-
DE s rys 36
ed
fo
r ce
on TRO
ca popu IT --
ler |
Co
mp
NS
TA
FF SU ce W
ar
m
or on
n teg
o lar Ge
an
ies
RE
PO Vs ar
ba
ra
el
i Le In
ca the m
ry. spo nera
rt-u l M
Fe
atu
RT
ER Wi
red
th
inado militarmente. Is tility oto OF
De sh dis ove
in TH
ve rs C Th EW
arb co , Fo hic orp is A
AL
orn un rd les rtic
, M ts to add , e . and le: LS
ich e s ca Fo Ge TR
., .. $2,5 d a lati rd
n M
ne
ral
EE
TJ
. 00 $5 g a oto Mo OU
on 00 d r tors RN
e Th h e
ew itio stin
Ga m v o lv g
se s and w v ir
u e
V ir u in h o s
t in g e x p la fi t n e s
h e a e s ca n n a ry
C gam o lu t io
♦ Si los demás atletas no las usan, es más theo
ry o f s t o f e v
T h e e r in a t
e
h
a n ot
probable que gane. r Security M atters
rn e
E. Tu Com m entary by Bruce Schneier
P au l Politics : Security
forma de evitar perder con certeza. issues surrounding the issue ofdoping in professionalsports.
D rug testing is a security issue.Various sports federations around the w orld do their bestto detectillegaldoping,and players do their bestto evade
7
¿Soluciones?
Esto ha llevado a una amplia literatura que examina posibles soluciones al Dilema de los Presos y
como mantener a los jugadores alejados del único resultado estable.
Esas “soluciones,” lo que hacen es esencialmente cambiar el juego. Por ejemplo, el juego cambia si
◮ Hay intervenciones institucionales (control, castigos, etc) 7→ esto cambia los pagos
◮ El juego se repite (reputación, vanganza,... juegan un rol) 7→ juegos repetidos (más adelante en
este curso).
◮ Sin embargo, varios experimentos muestran que la gente tiende a cooperar más en situaciones
donde la gente “juega” repetidamente.
El juego es entonces distinto: un juego repetido (que abordaremos más tarde en este curso).
Factores como reputación, castigo, venganza, etc, pueden tener importancia.
Parece que incluso en esas situaciones hay gente que coopera. ¿Por qué?
8
¿Hay Cooperación en DPs de la vida real?
◮ Altruismo: La gente podrı́a preocuparse de los pagos de los otros jugadores, además de los suyos
propios.
How selfish soever man may be supposed to be, there are evidently some principles in his nature,
which interest him in the fate of others, and render their happiness necessary to him, though he
derive nothing from it, except the pleasure of seeing it. Adam Smith, The Theory of Moral Sentiments, 1759
◮ “Hacer lo Correcto” es la razón que aducen algunas personas: apelar a los estándares y a las
normas sociales. Esto significa que ven su comportamiento como parte de un juego continuado... o
que de nuevo, tienen internalizados algunos motivos en sus preferencias que no se corresponden
con los pagos monetarios.
I would rather be the person who bought the Brooklyn bridge than the one who sold it. Similarly,
I feel better spending $ 3 gained by cooperation than $ 10 gained by defection. Daniel C.
Dennett, quoted in Dawes and Thaler, J.Econ.Persp., 1986.
◮ PERO: en ambos casos, ¡no están jugando el Dilema del Prisionero! Las preferencias no están
representadas por los pagos del juego. Por tanto se está jugando un juego distinto, y en ese juego
“Delatar” no es “dominante.”
9
Definición de Juego en Forma Normal (1)
Definición. Un Juego en Forma Normal es una tripleta
s = (si |s−i ).
y
(si |s−i ) = (s1 , . . . , si , . . . , sn ). Mi estrategia contra todas las
demás (otros jugadores)
πi (si |s−i ).
Por ejemplo, π3 (A|x,Top,Yes) es el pago que obtiene el jugador 3 cuando juega la estrategia A, J. 1
juega x, J. 2 juega Top, y J. 4 juega Yes.
10
Equilibrio de Nash 20 / 25
Equilibrio de Nash
Jugadores, estrategias y pagos
Definición. Sea Γ = (I, {Si }i∈I , {πi }i∈I ) un Juego en Forma Normal. Sea i ∈ I y s−i ∈ S−i .
Decimos que s∗i ∈ Si es una mejor respuesta del jugador i a s−i si
para todo si ∈ Si .
Definición. Un perfil de estrategia s∗ = (s∗i )i∈I es un NE estricto de un Juego en F-Normal Γ si, para
cada i ∈ I, s∗i es una mejor respuesta estricta a s∗−i ,esto es,
11
Estrategias Dominadas 23 / 25
Estrategias Dominadas
Definición. Sea Γ = (I, {Si }i∈I , {πi }i∈I ) un Juego en Forma Normal
◮ si ∈ Si está estrictamente dominada por s∗i ∈ Si , si 6= s∗i si
12