Toi 08 13

Teora de la organizacin industrial
Teora de Juegos Clase 13 Equilibrio secuencial Juegos repetidos
Equilibrio en subjuegos
Dilema del prisionero Ronda I: simultneo Elecciones reveladas Ronda II: simultneo Pagos: suma de pagos en las dos rondas
-5,-5 c B nc c 0,-15 c B nc
c nc c nc c nc c nc c nc c nc c nc c nc
-10,-10 -5,-20 -20,-5 -6,-6 -5,-20 0,-30 -15,-15 -1,-16 -20,-5 -15,-15 -30,0 -16,-1
nc C B c nc C -1,-1 c nc B nc C -15,0 c B nc C
-6,-6 -1,-16 -16,-1 -2,-2
Votacin
Preferencias:
AfNfB BfAfN NfAfB
A vs. B AB A B vs. N
1 A 2 A B 3 A 1
A N
B
A
A 1
N
B 1
A
2
A N A N
3
A N
1
A N
* ** *
A
A
* ** *
*A gana: 1,0,0
Votacin
Preferencias:
1. 2. 3.
3 2 A
A N A
1,0,0 1,0,0 1,0,0
AfNfB BfAfN NfAfB 3

2 A A
A B 1
N A
N 0,-1,1 A N 1,0,0 0,-1,1 0,-1,1 0,-1,1
N N
A N
A 1 B
A A B A B B Estrategia dominante: AAN AAB BNN
Votacin
Preferencias:
1. 2. 3.
AfNfB BfAfN NfAfB 3

2 A A
A 2 B B 1 N B
B N B
-1,1,-1 -1,1,-1 -1,1,-1
N B
N 0,-1,1 B N -1,1,-1 0,-1,1 0,-1,1 0,-1,1
A 1 B
A A B A B B
B N
Estrategia dominante: AAN AAB BNN
Informacin imperfecta y equilibrio perfecto en subjuegos

Informacin perfecta: Induccin regresiva (Kuhn): todos los jugadores maximizan pagos siempre que sea su turno Informacin imperfecta: Equilibrio perfecto en subjuegos
No todos los equilibrios tienen sentido
Equilibrio perfecto en subjuegos

1 L 0 5 l M x r 2 R
p( x) + p ( y ) = 1 E[u (l )] = 0 * p( x) + 4 * p( y ) = 4 p ( y ) E[u (m)] = 1* p( x) + 1* p ( y ) = 1

y
E[u (r )] = 4 * p( x) + 0 * p( y ) = 4 p( x) estrategia
r
m -1 1
p(m) = 0, p (l ) = p (r ) =
m -1 1
1 2
4 0
0 4
0 4
4 0
1 1 1 1 EU = p ( x) * ( (0) + (4)) + p( y ) * ( (4) + (0)) 2 2 2 2 EU = 2 m nunca se alcanza
(L,m) no es un equilibrio sensato
porqu falla el equilibrio perfecto en subjuegos?

1 L R M
0 5 l
r m
l m
No es un subjuego
4 0 -1 1 0 4 0 4 -1 1 4 0
Estrategias y creencias
x : nodo (historia) p ( x) : probabilidad que i asigna a x dado que alcanz I(x)
iI ( y )
I(x) 1 L 0 5 l M x r 0 4 2 l R y r 4 0
p( x) = 1
p () : sistema de creencias dada una estrategia b, cules p( ) son sensatos? (p,b) : creencias que tienen los jugadores, dado que se juega b (par (p,b) es estimacin) Regla de Bayes : P ( x | b) p( x) = si p ( y | b) > 0 p ( y | b)
yI
m -1 1
m -1 1
4 0
0 4
Restricciones a creencias
Deben derivarse con la regla de Bayes (si es posible) Independencia
los jugadores eligen independientemente
Creencias comunes
creencias idnticas para jugadores con idntica informacin
Regla de Bayes
1 (1) (0) 2
Dadas las estrategias de 1 y 2 no se alcanza el conjunto de informacin de 3
(1/3) [a]
(2/3) [1-a]
Independencia
1 (0) (0) 2 (1) (0) (0) (1)
a=b
(1) (0) (0)
[a]
[1-a]
[b]
[1-b]
Creencias compartidas
1 (0) [a] 2 (0) (1) (0) [1-a]
a=b
(0)
(1)
(1)
[b]
[1-b]
Estimacin consistente
(p,b) es consistente si satisface: Regla de bayes Independencia Creencias comunes
Racionalidad secuencial
Estimaciones: creencias acerca de la historia del 1 juego en cada turno L
0 5 M R 2 y
I(x)
pago de i dado que alcanz I vi ( p, b | I ) p ( x)ui (b | x)

xI
valor esperado de los pagos en el sistema de creencias
l 4 0
m -1 1
r 0 4 0 4
m r -1 1 4 0
Racionalidad secuencial
(Selten, 1975 Kreps y Wilson, 1982)
(p,b) es secuencialmente racional si, para cada jugador i, cada conjunto de informacin I de i, y cada estrategia de comportamiento bi de i:
vi ( p, b | I ) > vi ( p, (b'i , bi ) | I )
Ningn jugador, en ningn punto del juego quiere cambiar de estrategia
Equilibrio secuencial*
Racionalidad secuencial no siempre lleva a un equilibrio de Nash. Una estimacin secuencial que es:
Consistente Secuencialmente racional
Es un Equilibrio Secuencial
*Equilibrio Bayesiano Perfecto
Juegos Repetidos
Juego componente (etapa) que se juega muchas veces Interaccin repetida Prospecto de reciprocidad
Premio Castigo
Repeticin infinita del dilema del prisionero

B B C C C C B C C B B C C C B C C Etapa 1 B Etapa t C C B C C C
Juegos repetidos infinitamente

Maximice la suma descontada de los pagos en cada etapa
pagos : = 0 , 1 ,..., t ,... PV ( , ) =
t t = 0 + 1 + ... + t t + ...
t =0
(0,1)
promedio : (1 ) PV ( , ) (1 ) t t
t =0
Juegos repetidos infinitamente

Perfil de estrategias s= s1, s2,, sn si= a1, a2,, at,..., funciones at: estrategia del juego etapa que se tomar en t dependiendo de las acciones que cada jugador tom en el pasado
Repeticin infinita del dilema del prisionero, estrategia GRIM

Estrategia (grim) {nc,nc}: comportamiento deseado Juegue {nc,nc} al comienzo Si alguien confiesa, juegue {c,c} Una vez iniciado, el castigo no se revoca Pagos: {nc,nc} (5,5) {c,c} (0,0) {c,nc} (7,-2) {nc,c} (-2,7)
c nc
C C C C C C C C
c nc c nc c nc c nc c nc c nc c nc c nc
nc B
c nc
B c c nc C nc B c nc Etapa 1-t: (nc,nc) Etapa t-oo: (c,c) B nc
Ej. Repeticin infinita del dilema del prisionero, estrategia GRIM

Empiece jugando amablemente: {nc, nc} hasta t Pago 5 VP1:=5+5+52+.+ 5t+.) =5/(1-) Cambio de estrategia en t? {c, nc} Pago 7 para el delator en t, -2 para el otro Retaliacin: {c, c} de t hasta Pago 0 hasta VP2:=0/(1-) Delatar si: VP1< VPt+ VP2 : 5/(1-)<7. (siempre que <2/7) Si el factor de descuento no es muy alto, >2/7, no hay incentivos para delatar (el futuro importa).
Equilibrio perfecto en subjuegos, juegos infinitos

Fundenberg y Maskin (86). The Folk theorem in repeated games under discounting and incomplete information Ciclo de comportamiento: secuencia de acciones que se repite: (nc,nc) durante t periodos, (c,nc) en t, (c,c) durante T, y (nc,nc) despus Ciclo racional individualmente si cada jugador recibe pagos positivos
Equilibrio perfecto en subjuegos, dilema del prisionero infinito

Cualquier ciclo individualmente racional puede alcanzarse como el juego de un equilibrio perfecto en subjuegos si el factor de descuento es cercano a 1 La estrategia grim es un equilibrio en el dilema del prisionero.
En general:
Al repetir un juego bsico infinitamente, podemos encontrar todos los ciclos de comportamiento racionales individualmente como parte de un equilibrio perfecto en subjuegos.

Toi 08 13

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Toi 08 13

Cargado por

Copyright:

Formatos disponibles

Teora de la organizacin industrial

Teora de Juegos Clase 13 Equilibrio secuencial Juegos repetidos

-6,-6 -1,-16 -16,-1 -2,-2

1,0,0 1,0,0 1,0,0

AfNfB BfAfN NfAfB 3

N 0,-1,1 A N 1,0,0 0,-1,1 0,-1,1 0,-1,1

A A B A B B Estrategia dominante: AAN AAB BNN

AfNfB BfAfN NfAfB 3

-1,1,-1 -1,1,-1 -1,1,-1

N 0,-1,1 B N -1,1,-1 0,-1,1 0,-1,1 0,-1,1

Estrategia dominante: AAN AAB BNN

Informacin imperfecta y equilibrio perfecto en subjuegos

Equilibrio perfecto en subjuegos

p( x) + p ( y ) = 1 E[u (l )] = 0 * p( x) + 4 * p( y ) = 4 p ( y ) E[u (m)] = 1* p( x) + 1* p ( y ) = 1

1 1 1 1 EU = p ( x) * ( (0) + (4)) + p( y ) * ( (4) + (0)) 2 2 2 2 EU = 2 m nunca se alcanza

(L,m) no es un equilibrio sensato

porqu falla el equilibrio perfecto en subjuegos?

Dadas las estrategias de 1 y 2 no se alcanza el conjunto de informacin de 3

(1) (0) (0)

pago de i dado que alcanz I vi ( p, b | I ) p ( x)ui (b | x)

valor esperado de los pagos en el sistema de creencias

*Equilibrio Bayesiano Perfecto

Repeticin infinita del dilema del prisionero

Juegos repetidos infinitamente

pagos : = 0 , 1 ,..., t ,... PV ( , ) =

Juegos repetidos infinitamente

Repeticin infinita del dilema del prisionero, estrategia GRIM

B c c nc C nc B c nc Etapa 1-t: (nc,nc) Etapa t-oo: (c,c) B nc

Ej. Repeticin infinita del dilema del prisionero, estrategia GRIM

Equilibrio perfecto en subjuegos, juegos infinitos

Equilibrio perfecto en subjuegos, dilema del prisionero infinito

También podría gustarte