Juegos en Forma Normal

Juegos en Forma Normal
Teorı́a de Juegos
Dr. Jaume Garcı́a-Segarra

Departamento de Economı́a, Universitat Jaume I de Castelló
El Concepto de Juego 2
Teorı́a de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Historia de la Teorı́a de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Objetivos de la Tª de Juegos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Ejemplo: Juego de la caza del ciervo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Ejemplo: Chicken Game . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ejemplo: Matching Pennies (Los chinos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Ejemplo: El Dilema del Prisionero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
¿Hay Cooperación en DPs de la vida real? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ejemplo: Juego del Examen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Definición de Juego en Forma Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Equilibrio de Nash 20
Equilibrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Estrategias Dominadas 23
Estrategias Dominadas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Equilibrio de Nash y Estrategias Dominadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1
Juegos en Forma Normal
El Concepto de Juego
Equilibrio de Nash
Estrategias Dominadas
Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 1 / 25
El Concepto de Juego en Forma Normal 2 / 25
Teorı́a de Juegos
◮ Teorı́a de Juegos: ¿solo juegos?

♦ Teorı́a de la toma de decisiones cuando existe in-
teracción estratégica.
♦ Es la intersección entre Economı́a, Matemáticas y
Psicologı́a
♦ Nació durante (y a causa) de la II Guerra Mundial
◮ ¿Que es un Juego?
♦ Se trata de una descripción completa de una
situación estratégica
♦ Juegos de tablero
♦ Mercados, Subastas... (Economı́a)
♦ Conflictos (polı́tica, militares)
2
Historia de la Teorı́a de Juegos
◮ Nació durante (y a causa) de la II Guerra Mundial.
◮ Desarrollada por John von Neumann (1903-1957),
matemático Húngaro-Americano.
♦ Creador del primer sistema operativo (“Padre
del PC”)
♦ Miembro del Proyecto Manhattan (creadores de
la bomba atómica)
◮ Coautor: Oskar Morgenstern (1902-1977),
economista Aleman-Austriaco
◮ Concepto de Solución: Equilibrio de Nash (∼ 1950)
◮ Existencia demostrada por John Nash (1928-2015)
◮ Premio Nobel en 1994 (junto con John Harsanyi y Rein-
hard Selten)
¡Si!, el de la peli “Una Mente Maravillosa”, pero la peli está llena de errores
Objetivos de la Tª de Juegos
◮ Aproximación Normativa
♦ Determinar como deberı́an comportarse los agentes racionales en situaciones estratégicas
♦ “Agentes” pueden ser empresas, organizaciones, gobiernos, etc.
◮ Aproximación Positiva (o experimental)
♦ Describe como se comportan efectivamente las personas en esas interacciones estratégicas
♦ Se basa en datos. Se apoya en métodos experimentales, y por tanto, está cercana a la psicologı́a
◮ Este curso:
♦ Nos centramos en la aproximación Normativa a la Tª de Juegos.
♦ Ocasionalmente haremos mención a resultados importantes de la aproximación “Positiva”
(experimental)
3
Ejemplo: Juego de la caza del ciervo
◮ SITUACIÓN:
♦ En el bosque hay 4 conejos y un ciervo. Un ciervo = 10 conejos.
♦ Hay 2 cazadores (llamados 1 y 2)
♦ Si un cazador va solamente a por conejos, puede conseguir 4. Si los dos van a por conejos, cada
uno puede conseguir solamente 2.
♦ Un solo cazador no puede conseguir un ciervo. Si ambos van a por el ciervo, lo consiguen y se lo
reparten.
◮ LA REPRESENTACIÓN: 1\ 2 Conejos Ciervo

♦ Cazadores son los jugadores Conejos 2,2 4,0
♦ Cada uno tiene 2 estrategias: ir a Ciervo 0,4 5,5
por conejos o a por el ciervo
♦ Deciden a la vez, tras la decisión, 1 Jugador 1 decide la FILA,
de 4 posibles resultados se realiza. Jugador 2 decide la COLUMNA.
♦ Cada resultado supone un determi- Los resultados son las celdas de la
nado pago a cada jugador. tabla.
Tenemos una tabla de pagos. primer número: pago de J. 1;
segundo número: pago de J. 2.
Ejemplo: Juego de la caza del ciervo (2)

◮ Los cazadores están solos y separados en el
bosque (deciden simultáneamente).
◮ Si J1. piensa que J. 2 va a por conejos,
para J.1 es mejor ir también a por conejos
(2 > 0). 1\ 2 Conejos Ciervo
◮ Lo mismo para J. 2 Conejos 2,2(∗) 4,0
◮ Entonces (Conejos, Conejos) es un “resul- Ciervo 0,4 5,5(∗)
tado estable”.
◮ También (Ciervo, Ciervo) es un “resultado
estable”
◮ Cualquier otro resultado no es estable.
◮ Lo mejor para un jugador, dado lo que cree que el resto de jugadores van a hacer, es una “mejor
respuesta”. Aquı́ están subrayados los (mejores) pagos resultantes.
◮ Un resultado estable es un equilibrio. Este juego tiene dos.
◮ En equilibrio, todos los jugadores deciden una mejor respuesta a las estrategias decididas por los
demás.
4
Ejemplo: Chicken Game (1)
◮ SITUACIÓN::
♦ Basado en la peli Rebelde sin Causa de James Dean.
♦ Dos conductores aceleran hacia un precipicio. Antes
del punto de no retorno, pueden Parar o Continuar.
♦ Si uno para, es tachado de cobarde. El otro puede
detenerse justo en el punto de no retorno y volver
andando aclamado como ganador
♦ Si ambos “continúan,” tendrán que saltar del coche.
Pueden incluso quedar atrapados y morir.
◮ REPRESENTACIÓN: 1\ 2 Continuar Parar

♦ Los conductores son los jugadores. Continuar 0,0 4,2
♦ Cada uno tiene 2 estrategias: Parar 2,4 3,3
Parar o Continuar.
♦ Los pagos están en la tabla. El 1er número es el pago de J. 1. El se-
gundo número es el pago de J. 2.
Ejemplo: Chicken Game (2)

◮ Deciden simultáneamente (a la vez).
◮ Si J. 1 piensa que J. 2 va a parar, para J.
1 es mejor continuar (4 > 3).
◮ Si J. 1 piense que J. 2 va a continuar,
para J. 1 es mejor parar (2 > 0). 1\2 Continuar Parar
◮ Lo mismo sucede para J. 2 Continuar 0,0 4,2(∗)
◮ Entonces (Parar, Continuar) y (Contin- Parar 2,4(∗) 3,3
uar, Parar) son equilibrios.
◮ ¿Cúal sucederá?. No lo podemos prede-
cir.
◮ Pero otros resultados no son estables.
◮ Pagos de las mejores respuestas están subrayados.

◮ Este juego tiene dos equilibrios.
◮ El juego es simétrico (los jugadores son idénticos), pero los equilibrios son asimétricos.
5
Ejemplo: Matching Pennies (Los chinos)
◮ Cada jugador saca simultáneamente un número de de-
dos (Pares or Nones)
◮ El J. 1 gana si la suma es par
El J. 2 gana si la suma es impar (nones)
◮ El perdedor paga un euro al ganador.
◮ Situación alter. con monedas (Cara/Cruz)
◮ Este es un juego asimétrico.
◮ Si J. 1 piensa que J. 2 decide par, su mejor respuesta
(MR) es Nones.
◮ Pero si J. 2 piensa que J. 1 juega par, su MR es Nones
◮ Y si J. 1 piensa que J. 2 juega nones, su MR es Nones
1\2 Pares Nones
◮ Pero si J. 2 piensa que J. 1 juega nones, su MR es
Pares...
Pares 1,-1 -1,1
◮ Tenemos un cı́rculo de mejores respuestas Nones -1,1 1,-1
◮ No podemos encontrar ningún equilibrio en este juego
(de momento)
Ejemplo: El Dilema del Prisionero (1)

◮ SITUACIÓN:
♦ Dos criminales son detenidos. La policı́a tiene poca evidencia.
♦ Son interrogados en salas separadas.
♦ Si ambos mantienen silencio (Cooperan), les caen solamente 2 años de cárcel a cada uno. Si
ambos acusan al otro (Delatan), la policı́a obtiene toda la evidencia y les caen 5 años a cada
uno.
♦ Si uno delata confesando y el otro se mantiene en silencio, el acusador obtiene rebaja y solo le
cae 1 año, al otro le caen 10.
1\ 2 Cooperar Delatar
◮ REPRESENTACIÓN: Cooperar -2,-2 -10,-1
♦ Los prisioneros son jugadores. Delatar -1,-10 -5,-5
♦ Cada uno tiene 2 estrategias:
J. 1 decide FILA, J. 2 decide
Cooperar o Delatar.
COLUMNA.
♦ Ambos deciden simultáneamente;
cuatro posibles resultados. Resultados están en las celdas de la
♦ Cada resultado supone un pago a tabla.
cada jugador. 1er número: el pago de J. 1;
2ª número: el pago de J. 2.
6
Ejemplo: Prisoner’s Dilemma (2)
◮ Los prisioneros son interrogados por
separado. Juegan simultáneamente.
◮ Si J. 1 piensa que J. 2 le va a de-
latar, para J. 1 es mejor delatar (−5 >
−10).
◮ Si J. 1 piensa que J. 2 va a coop-
erar, para J. 1 es también mejor de- 1\ 2 Cooperar Delatar
latar (−1 > −2). Cooperar -2,-2 -10,-1
◮ Lo mismo para el J. 2.
Delatar -1,-10 -5,-5(∗)
◮ Entonces (Delatar, Delatar) es el
único “resultado estable”.
◮ Si una estrategia es siempre mejor (estrictamente) que otra, decimos que esta última está
dominada por la primera. Aquı́ Cooperar está dominado por Delatar.
◮ Un jugador/a racional nunca deberı́a jugar una estrategia dominada.
◮ Una estrategia dominada nunca es parte de un equilibrio.
◮ Este juego tiene un solo equilibrio, y no es Pareto-eficiente.
El Dilema del Prisionero está en todas partes

IC
OM
◮ Proliferación Nuclear durante la Guerra Frı́a: TH

E
EC
ON
e IS
T:
Es mejor tener (más y más) armas nucleares, N

O
th ma
M
O
EC E.
d
an ilem
R L IF
V E IL Y
CO DA
ER F
h
independientemente de lo que haga el otro N
E ER
T H YST
D SO
U IE
lla s DV E TH
bo nerO'R Y SOALR ?
E
ET g
wi
th d
l
fo et
M
z PM lin
ea d "t e m
en
He isoM E THAEN O N W
7
bando. 5 :5 rd e b
t fo call w ill
,a gy en ck th
06 bo
Pr G A -LEB
te e ta
20 tra as b at ful tely
3, s s
h y e a e s
g. el' lah A n forc tun , th lah'
N L or d A u ra ":
Is zbol nce ore nfoFR
r
es
e
bo
l
C A R A E H a r f s d a y, H e erre r m ck.
U an E H ez
erE P
b
IS i m h u r Le
♦ Si el otro bando no las tiene, lo dominaré

t fa
T
B y te d
T de h a atta nd det
t r Fo a RE
La rd, G
t
s w i nte elis no VaInE
Po c o u ra
s yd id
fo esW
r e
rI e
fo ateg .
r tes M
s ng
ra ven
th
st sile
t R Es st
militarmente. W
Bis
m YS
Da ord Ct m i NN
im I ou n
gL ist
o m F
m
eba cal
HO ht s to o
ee
RE
ffe
re
tes ate
n lerC cnot:
i
h e
2 MA E for Pri
♦ Si el otro bando las tiene, evitaré ser dom-
DE s rys 36
ed
fo
r ce
on TRO
ca popu IT --
ler |
Co
mp
NS
TA
FF SU ce W
ar
m
or on
n teg
o lar Ge
an
ies
RE
PO Vs ar
ba
ra
el
i Le In
ca the m
ry. spo nera
rt-u l M
Fe
atu
RT
ER Wi
red
th
inado militarmente. Is tility oto OF
De sh dis ove
in TH
ve rs C Th EW
arb co , Fo hic orp is A
AL
orn un rd les rtic
, M ts to add , e . and le: LS
ich e s ca Fo Ge TR
., .. $2,5 d a lati rd
n M
ne
ral
EE
TJ
. 00 $5 g a oto Mo OU
on 00 d r tors RN
◮ Doping en deportes: Los atletas tenı́an in-

d
the ire is co C
un o. sla ,F AL
Ex ct-to ti ord
plo ng ppe
rer -con wa d la
Mo
on e
tor,
an sum r in
in s t
d to er rg
the er in
$2 re
,00 bate ligh cena g a
centivos a tomar sustancias dopantes, sin e or y

0 o on
n th Sc
e y
n t h Expeds, boo
e UoV
e
m p uck es
t
t- tr
e ti v
e Th h e
ew itio stin
Ga m v o lv g
importar lo que hicieran el resto.

n.
se s e
Th
se s and w v ir
u e
V ir u in h o s
t in g e x p la fi t n e s
h e a e s ca n n a ry
C gam o lu t io
♦ Si los demás atletas no las usan, es más theo
ry o f s t o f e v
T h e e r in a t
e
h
a n ot
probable que gane. r Security M atters
rn e
E. Tu Com m entary by Bruce Schneier
P au l Politics : Security
D r ugs: Spor ts' Pr isoner 's D ilem m a

♦ Si los demás también las usan, es la única 08.10.06 |2:00 AM
The big new s in professionalbicycle racing is thatFloyd Landis m ay be stripped ofhis Tour de France title because he tested positive for a banned
perform ance-enhancing drug.Sidestepping the issues ofw hether professionalathletes should be allow ed to take perform ance-enhancing drugs,how
dangerous those drugs are,and w hatconstitutes a perform ance-enhancing drug in the firstplace,I'd like to talk aboutthe security and econom ic
forma de evitar perder con certeza. issues surrounding the issue ofdoping in professionalsports.
D rug testing is a security issue.Various sports federations around the w orld do their bestto detectillegaldoping,and players do their bestto evade
7
¿Soluciones?
Esto ha llevado a una amplia literatura que examina posibles soluciones al Dilema de los Presos y
como mantener a los jugadores alejados del único resultado estable.
Esas “soluciones,” lo que hacen es esencialmente cambiar el juego. Por ejemplo, el juego cambia si
◮ Hay intervenciones institucionales (control, castigos, etc) 7→ esto cambia los pagos
◮ El juego se repite (reputación, vanganza,... juegan un rol) 7→ juegos repetidos (más adelante en
este curso).
¿Hay Cooperación en DPs de la vida real?

◮ A menudo se dice que “la gente no es tan malvada” y que se observa cooperación en situaciones
reales del Dilema de los Presos.
◮ Sin embargo, varios experimentos muestran que la gente tiende a cooperar más en situaciones
donde la gente “juega” repetidamente.
El juego es entonces distinto: un juego repetido (que abordaremos más tarde en este curso).
Factores como reputación, castigo, venganza, etc, pueden tener importancia.
◮ ¿Qué pasa en situaciones donde se juega una sola vez?
Parece que incluso en esas situaciones hay gente que coopera. ¿Por qué?
8
¿Hay Cooperación en DPs de la vida real?
◮ Altruismo: La gente podrı́a preocuparse de los pagos de los otros jugadores, además de los suyos
propios.
How selfish soever man may be supposed to be, there are evidently some principles in his nature,
which interest him in the fate of others, and render their happiness necessary to him, though he
derive nothing from it, except the pleasure of seeing it. Adam Smith, The Theory of Moral Sentiments, 1759
◮ “Hacer lo Correcto” es la razón que aducen algunas personas: apelar a los estándares y a las
normas sociales. Esto significa que ven su comportamiento como parte de un juego continuado... o
que de nuevo, tienen internalizados algunos motivos en sus preferencias que no se corresponden
con los pagos monetarios.
I would rather be the person who bought the Brooklyn bridge than the one who sold it. Similarly,
I feel better spending $ 3 gained by cooperation than $ 10 gained by defection. Daniel C.
Dennett, quoted in Dawes and Thaler, J.Econ.Persp., 1986.
◮ PERO: en ambos casos, ¡no están jugando el Dilema del Prisionero! Las preferencias no están
representadas por los pagos del juego. Por tanto se está jugando un juego distinto, y en ese juego
“Delatar” no es “dominante.”
Ejemplo: Juego del Examen

◮ J. 1 (jugador FILA) es el profesor. Él
decide la dificultad del examen: Fácil, 1\2 Duro Poco
Justo, o Difı́cil. Fácil 4,4 0,5
◮ J. 2 (jugador COLUMNA) es un es-
Justo 5,3(∗) 1,2
tudiante, que puede estudiar Duro o
solamente un Poco.
Difı́cil 3,1 2,0
◮ Los pagos están reflejados en la tabla.
◮ Este es un juego asimétrico.
◮ Si el profesor piensa que el estud. estudiará Duro, su MR es un examen Justo.
◮ Si el profesor piensa que el estud. estudiará Poco, su MR es un examen Difı́cil.
◮ Si el estudiante piensa que el examen será Fácil, su MR es estudiar Poco.
◮ Si el estudiante piensa que el examen será Justo, su MR es estudiar Duro.
◮ Si el estudiante piensa que el examen será Difı́cil,su MR es estudiar Duro.
◮ Por tanto hay un único equilibrio: (Justo, Duro)
◮ Nota: “Fácil” está dominado por “Justo” para el profesor, y por tanto, no se juega en equilibrio.
9
Definición de Juego en Forma Normal (1)
Definición. Un Juego en Forma Normal es una tripleta
Γ = (I, {Si }i∈I , {πi }i∈I ),

donde
◮ I 6= ∅ es el conjunto de jugadores,
◮ Si el conjunto de estrategias (puras) del jugador i, y
◮ πi : S → 7 R es la función de pagosQdel jugador i, definida sobre el conjunto de perfiles de
estrategias (i. e. resultados) S = i∈I Si .
Gibbons usa ui para las funciones de pagos.
Ejemplo. Dilema del Prisionero: I = {1, 2}, S1 = S2 = {Cooperar, Delatar},
π1 (Coop, Delatar) = −10, π1 (Delatar, Delatar) = −5, . . ..
Ejemplo. Juego del Examen: I = {1, 2}, S1 = {Fácil,Justo,Difı́cil}, S2 = {Duro, Poco}, π1 (Fácil,
Duro) = 4, . . ..
Si I, Si son finitos (∀i ∈ I), el juego se denomina juego finito.
En un juego finito, las tablas de pagos pueden ser representadas como matrices (como hemos visto en
los ejemplos). Juntando todas las matrices, obtenemos la tabla de pagos.
Definición de Juego en Forma Normal

Q
(2)
Notación. Dado i ∈ I, denotamos S−i = j6=i Sj y escribimos un perfil de estrategia como
s = (si |s−i ).
Por ejemplo, si I = {1, . . . , n}, entonces
s−i = (s1 , . . . , si−1 , si+1 , . . . , sn ) El s-i es la estrategia de todos los

demás jugadores que no soy yo
y
(si |s−i ) = (s1 , . . . , si , . . . , sn ). Mi estrategia contra todas las
demás (otros jugadores)
Entonces podemos escribir los pagos como
πi (si |s−i ).
Por ejemplo, π3 (A|x,Top,Yes) es el pago que obtiene el jugador 3 cuando juega la estrategia A, J. 1
juega x, J. 2 juega Top, y J. 4 juega Yes.
10
Equilibrio de Nash 20 / 25
Equilibrio de Nash
Jugadores, estrategias y pagos
Definición. Sea Γ = (I, {Si }i∈I , {πi }i∈I ) un Juego en Forma Normal. Sea i ∈ I y s−i ∈ S−i .
Decimos que s∗i ∈ Si es una mejor respuesta del jugador i a s−i si
πi (s∗i |s−i ) ≥ πi (si |s−i )
para todo si ∈ Si .
La mejor respuesta no tiene porque ser única. Denotamos como

Best response contra cada estrategia de los demás
BRi (s−i )
el conjunto de mejores respuestas de i a s−i .

◮ Considere este Juego de dos jugadores.
1 \ 2 Left Right
◮ Compute las mejores respuestas del jugador 1.
Ejemplo. Top 1,3 2,4
◮ BR1 (Left) = {Top,Bottom}
◮ BR1 (Right) = {Top} Bottom 1,4 0,0
Equilibrio de Nash (2)

Definición. Sea Γ = (I, {Si }i∈I , {πi }i∈I ) un Juego en Forma Normal. Un perfil de estrategias
s∗ = (s∗i )i∈I es un Equilibrio de Nash de Γ si, para cada i ∈ I, s∗i es una mejor respuesta a s∗−i ,esto es,
Juego mi mejor respuesta contra las mejores respuestas de los demás
πi (s∗i |s∗−i ) ≥ πi (si |s∗−i ) ∀ si ∈ Si , ∀i ∈ I.
Cuando mi pago jugando mi mejor respuesta es mayor o igual que otro pago respecto a la mejor respuesta de los demás.
SE DA EL EQUILIBRIO DE NASH
◮ Ası́ llamado tras el premio Nobel en Economı́a de John Nash, en 1994.
◮ En otras palabras, s∗ es un Equilibrio de Nash (NE) iff (si y solo si) s∗i ∈ BRi (s∗−i ) para todo i ∈ I.
◮ En un Equilibrio de Nash ningún jugador tiene incentivo a desviarse.
◮ Si un resultado no es un NE, no es una predicción razonable.
Definición. Un perfil de estrategia s∗ = (s∗i )i∈I es un NE estricto de un Juego en F-Normal Γ si, para
cada i ∈ I, s∗i es una mejor respuesta estricta a s∗−i ,esto es,
πi (s∗i |s∗−i ) > πi (si |s∗−i ) ∀ si ∈ Si , si 6= s∗i , ∀i ∈ I.
iff= a implica b y b implica a

ejemplo: los iPhone’s son teléfonos de apple y los teléfonos de apple son iPhone’s (si y solo si)
11
Estrategias Dominadas 23 / 25
Estrategias Dominadas
Definición. Sea Γ = (I, {Si }i∈I , {πi }i∈I ) un Juego en Forma Normal
◮ si ∈ Si está estrictamente dominada por s∗i ∈ Si , si 6= s∗i si
πi (si |s−i ) < πi (s∗i |s−i )
para todo s−i ∈ S−i .

◮ La estrategia si ∈ Si está débilmente dominada por la estrategia s∗i ∈ Si , si 6= s∗i , para el jugador i,
si
πi (si |s−i ) ≤ πi (s∗i |s−i )
para cada perfil de estrategias de los oponentes de i, s−i ∈ S−i y

existe al menos un s′−i ∈ S−i tal que πi (si |s−i ) < πi (s∗i |s−i )
Un jugador racional no debe jugar nunca estrategias estrictamente dominadas.

Remark. Una estrategia estrictamente dominada nunca puede ser una mejor respuesta.
Equilibrio de Nash y Estrategias Dominadas

Por tanto, si una estrategia es una mejor respuesta contra el perfil de estrategias de los oponentes, esta
estrategia no puede estar estrictamente dominada.
Sea s* es un perfil de estrategia
Proposición. Sea s∗ un NE de un Juego en F-Normal Γ. Entonces, s∗i no está estrictamente dominada para
ningún jugador i ∈ I.
Proof. By contradiction (por contradicción).

Suponga que s∗i está estrictamente dominada por ŝi .
Entonces πi (ŝi |s∗−i ) > πi (s∗i |s∗−i ), lo que contradice la definición de NE.
NE es el Nash Equilibry
◮ Para encontrar los NE, podemos eliminar las estrategias estrictamente dominadas.
◮ Pero en general no podemos eliminar las estrategias débilmente dominadas.
◮ Considere este Juego de dos jugadores.
◮ Compute las mejores respuestas. 1\2 A B
Ejemplo. ◮ A está débilmente dominada por B para ambos A 0,0(∗) 0,0
jugadores (pero no estrictamente dominada). B 0,0 1,1(∗)
◮ Sin embargo, (A, A) es un NE. El jugador 1 escoge la fila y el jugador B la columna
Las estrategias no estrictamente dominadas significa que no se pueden eliminar
12

Juegos en Forma Normal

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Juegos en Forma Normal

Cargado por

Copyright:

Formatos disponibles

Juegos en Forma Normal

Dr. Jaume Garcı́a-Segarra

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 1 / 25

El Concepto de Juego en Forma Normal 2 / 25

◮ Teorı́a de Juegos: ¿solo juegos?

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 3 / 25

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 4 / 25

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 5 / 25

◮ LA REPRESENTACIÓN: 1\ 2 Conejos Ciervo

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 6 / 25

Ejemplo: Juego de la caza del ciervo (2)

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 7 / 25

◮ REPRESENTACIÓN: 1\ 2 Continuar Parar

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 8 / 25

Ejemplo: Chicken Game (2)

◮ Pagos de las mejores respuestas están subrayados.

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 9 / 25

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 10 / 25

Ejemplo: El Dilema del Prisionero (1)

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 11 / 25

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 12 / 25

El Dilema del Prisionero está en todas partes

◮ Proliferación Nuclear durante la Guerra Frı́a: TH

Es mejor tener (más y más) armas nucleares, N

♦ Si el otro bando no las tiene, lo dominaré

◮ Doping en deportes: Los atletas tenı́an in-

centivos a tomar sustancias dopantes, sin e or y

importar lo que hicieran el resto.

D r ugs: Spor ts' Pr isoner 's D ilem m a

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 13 / 25

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 14 / 25

¿Hay Cooperación en DPs de la vida real?

◮ ¿Qué pasa en situaciones donde se juega una sola vez?

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 15 / 25

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 16 / 25

Ejemplo: Juego del Examen

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 17 / 25

Γ = (I, {Si }i∈I , {πi }i∈I ),

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 18 / 25

Definición de Juego en Forma Normal

Por ejemplo, si I = {1, . . . , n}, entonces

s−i = (s1 , . . . , si−1 , si+1 , . . . , sn ) El s-i es la estrategia de todos los

Entonces podemos escribir los pagos como

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 19 / 25

πi (s∗i |s−i ) ≥ πi (si |s−i )

La mejor respuesta no tiene porque ser única. Denotamos como

el conjunto de mejores respuestas de i a s−i .

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 21 / 25

Equilibrio de Nash (2)

πi (s∗i |s∗−i ) > πi (si |s∗−i ) ∀ si ∈ Si , si 6= s∗i , ∀i ∈ I.

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 22 / 25

iff= a implica b y b implica a

πi (si |s−i ) < πi (s∗i |s−i )

para todo s−i ∈ S−i .

para cada perfil de estrategias de los oponentes de i, s−i ∈ S−i y

Un jugador racional no debe jugar nunca estrategias estrictamente dominadas.

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 24 / 25

Equilibrio de Nash y Estrategias Dominadas

Proof. By contradiction (por contradicción).

Tª de Juegos Juegos en Forma Normal Dr. Jaume Garcı́a-Segarra – 25 / 25

También podría gustarte