Está en la página 1de 29

Teora de la organizacin industrial

Teora de Juegos Clase 13 Equilibrio secuencial Juegos repetidos

Equilibrio en subjuegos
Dilema del prisionero Ronda I: simultneo Elecciones reveladas Ronda II: simultneo Pagos: suma de pagos en las dos rondas

-5,-5 c B nc c 0,-15 c B nc

c nc c nc c nc c nc c nc c nc c nc c nc

-10,-10 -5,-20 -20,-5 -6,-6 -5,-20 0,-30 -15,-15 -1,-16 -20,-5 -15,-15 -30,0 -16,-1

nc C B c nc C -1,-1 c nc B nc C -15,0 c B nc C

-6,-6 -1,-16 -16,-1 -2,-2

Votacin
Preferencias:
AfNfB BfAfN NfAfB

A vs. B AB A B vs. N

1 A 2 A B 3 A 1
A N

B
A

A 1
N

B 1
A

2
A N A N

3
A N

1
A N

* ** *
A
A

* ** *

*A gana: 1,0,0

Votacin
Preferencias:
1. 2. 3.

3 2 A

A N A

1,0,0 1,0,0 1,0,0

AfNfB BfAfN NfAfB 3


2 A A

A B 1

N A

N 0,-1,1 A N 1,0,0 0,-1,1 0,-1,1 0,-1,1

N N

A N

A 1 B

A A B A B B Estrategia dominante: AAN AAB BNN

Votacin
Preferencias:
1. 2. 3.

AfNfB BfAfN NfAfB 3


2 A A

A 2 B B 1 N B

B N B

-1,1,-1 -1,1,-1 -1,1,-1

N B

N 0,-1,1 B N -1,1,-1 0,-1,1 0,-1,1 0,-1,1

A 1 B

A A B A B B

B N

Estrategia dominante: AAN AAB BNN

Informacin imperfecta y equilibrio perfecto en subjuegos


Informacin perfecta: Induccin regresiva (Kuhn): todos los jugadores maximizan pagos siempre que sea su turno Informacin imperfecta: Equilibrio perfecto en subjuegos
No todos los equilibrios tienen sentido

Equilibrio perfecto en subjuegos


1 L 0 5 l M x r 2 R

p( x) + p ( y ) = 1 E[u (l )] = 0 * p( x) + 4 * p( y ) = 4 p ( y ) E[u (m)] = 1* p( x) + 1* p ( y ) = 1


y

E[u (r )] = 4 * p( x) + 0 * p( y ) = 4 p( x) estrategia
r

m -1 1

p(m) = 0, p (l ) = p (r ) =

m -1 1

1 2

4 0

0 4

0 4

4 0

1 1 1 1 EU = p ( x) * ( (0) + (4)) + p( y ) * ( (4) + (0)) 2 2 2 2 EU = 2 m nunca se alcanza

(L,m) no es un equilibrio sensato

porqu falla el equilibrio perfecto en subjuegos?


1 L R M

0 5 l

r m

l m

No es un subjuego
4 0 -1 1 0 4 0 4 -1 1 4 0

Estrategias y creencias
x : nodo (historia) p ( x) : probabilidad que i asigna a x dado que alcanz I(x)
iI ( y )

I(x) 1 L 0 5 l M x r 0 4 2 l R y r 4 0

p( x) = 1

p () : sistema de creencias dada una estrategia b, cules p( ) son sensatos? (p,b) : creencias que tienen los jugadores, dado que se juega b (par (p,b) es estimacin) Regla de Bayes : P ( x | b) p( x) = si p ( y | b) > 0 p ( y | b)
yI

m -1 1

m -1 1

4 0

0 4

Restricciones a creencias
Deben derivarse con la regla de Bayes (si es posible) Independencia
los jugadores eligen independientemente

Creencias comunes
creencias idnticas para jugadores con idntica informacin

Regla de Bayes
1 (1) (0) 2

Dadas las estrategias de 1 y 2 no se alcanza el conjunto de informacin de 3

(1/3) [a]

(2/3) [1-a]

Independencia
1 (0) (0) 2 (1) (0) (0) (1)

a=b

(1) (0) (0)

[a]

[1-a]

[b]

[1-b]

Creencias compartidas
1 (0) [a] 2 (0) (1) (0) [1-a]

a=b

(0)

(1)

(1)

[b]

[1-b]

Estimacin consistente
(p,b) es consistente si satisface: Regla de bayes Independencia Creencias comunes

Racionalidad secuencial
Estimaciones: creencias acerca de la historia del 1 juego en cada turno L
0 5 M R 2 y

I(x)

pago de i dado que alcanz I vi ( p, b | I ) p ( x)ui (b | x)


xI

valor esperado de los pagos en el sistema de creencias

l 4 0

m -1 1

r 0 4 0 4

m r -1 1 4 0

Racionalidad secuencial
(Selten, 1975 Kreps y Wilson, 1982)

(p,b) es secuencialmente racional si, para cada jugador i, cada conjunto de informacin I de i, y cada estrategia de comportamiento bi de i:

vi ( p, b | I ) > vi ( p, (b'i , bi ) | I )
Ningn jugador, en ningn punto del juego quiere cambiar de estrategia

Equilibrio secuencial*
Racionalidad secuencial no siempre lleva a un equilibrio de Nash. Una estimacin secuencial que es:
Consistente Secuencialmente racional

Es un Equilibrio Secuencial

*Equilibrio Bayesiano Perfecto

Juegos Repetidos
Juego componente (etapa) que se juega muchas veces Interaccin repetida Prospecto de reciprocidad
Premio Castigo

Repeticin infinita del dilema del prisionero


B B C C C C B C C B B C C C B C C Etapa 1 B Etapa t C C B C C C

Juegos repetidos infinitamente


Maximice la suma descontada de los pagos en cada etapa

pagos : = 0 , 1 ,..., t ,... PV ( , ) =

t t = 0 + 1 + ... + t t + ...
t =0

(0,1)
promedio : (1 ) PV ( , ) (1 ) t t
t =0

Juegos repetidos infinitamente


Perfil de estrategias s= s1, s2,, sn si= a1, a2,, at,..., funciones at: estrategia del juego etapa que se tomar en t dependiendo de las acciones que cada jugador tom en el pasado

Repeticin infinita del dilema del prisionero, estrategia GRIM


Estrategia (grim) {nc,nc}: comportamiento deseado Juegue {nc,nc} al comienzo Si alguien confiesa, juegue {c,c} Una vez iniciado, el castigo no se revoca Pagos: {nc,nc} (5,5) {c,c} (0,0) {c,nc} (7,-2) {nc,c} (-2,7)

c nc

C C C C C C C C

c nc c nc c nc c nc c nc c nc c nc c nc

nc B

c nc

B c c nc C nc B c nc Etapa 1-t: (nc,nc) Etapa t-oo: (c,c) B nc

Ej. Repeticin infinita del dilema del prisionero, estrategia GRIM


Empiece jugando amablemente: {nc, nc} hasta t Pago 5 VP1:=5+5+52+.+ 5t+.) =5/(1-) Cambio de estrategia en t? {c, nc} Pago 7 para el delator en t, -2 para el otro Retaliacin: {c, c} de t hasta Pago 0 hasta VP2:=0/(1-) Delatar si: VP1< VPt+ VP2 : 5/(1-)<7. (siempre que <2/7) Si el factor de descuento no es muy alto, >2/7, no hay incentivos para delatar (el futuro importa).

Equilibrio perfecto en subjuegos, juegos infinitos


Fundenberg y Maskin (86). The Folk theorem in repeated games under discounting and incomplete information Ciclo de comportamiento: secuencia de acciones que se repite: (nc,nc) durante t periodos, (c,nc) en t, (c,c) durante T, y (nc,nc) despus Ciclo racional individualmente si cada jugador recibe pagos positivos

Equilibrio perfecto en subjuegos, dilema del prisionero infinito


Cualquier ciclo individualmente racional puede alcanzarse como el juego de un equilibrio perfecto en subjuegos si el factor de descuento es cercano a 1 La estrategia grim es un equilibrio en el dilema del prisionero.

En general:
Al repetir un juego bsico infinitamente, podemos encontrar todos los ciclos de comportamiento racionales individualmente como parte de un equilibrio perfecto en subjuegos.

También podría gustarte