Está en la página 1de 23

26- 09

Clase 7. Juegos Dinámicos.

Introducción a la Teorı́a de Juegos

Ingenierı́a Civil Industrial


Universidad Diego Portales

1 / 21
¿Qué sabemos? ¿Quiénes somos? ¿Por qué estamos aquı́?

I Sabemos lo que es un juego.

I Entendemos el concepto clásico de solución: Equilibrio de Nash (puros


y mixtos).

no lo nimos
*
I Vimos también una noción un poco distinta: Equilibrio Correlaciona-
do.

Observación importante
Un elemento clave que ha estado presente en todo nuestro análisis es que
los jugadores toman sus decisiones de forma “simultánea”.

2 / 21
Plan para hoy

I “Relajar” ese supuesto de simultaneidad (información).

I Introducir el concepto de juegos dinámicos.

I ¿Cómo resolver? ! Inducción reserva.

I Modelo de Stackelberg.

3 / 21
Juegos Dinámicos

Antes de empezar a ver juegos dinámicos propiamente tal, es necesario


formalizar una idea que hemos estado utilizando.

Definición
Un juego es de información completa si todos los jugadores conocen los
pagos de los otros. Es decir, las funciones de pago son de conocimiento
común.

Observación
Todos los juegos que hemos visto hasta ahora son ası́ y los juegos dinámicos
que veremos en adelante también.

4 / 21
Juegos Dinámicos

Hay otra clasificación relevantes respecto de la información en juegos


dinámicos.

Definición
Un juego dinámico se dice de información perfecta si es que cada jugador,
cuando debe tomar una decisión, conoce toda la historia de jugadas/de-
cisiones/acciones previas. Si esto no ocurre, se dice que el juego tiene
información imperfecta.

5 / 21
Juegos Dinámicos
El elemento clave de los juegos dinámicos es la credibilidad.

Consideremos el siguiente juego de dos etapas y dos jugadores.

I Primero, el jugador 1 debe elegir entre darle 10000 al jugador 2, o


bien darle 0.

I Segundo, el jugador 2 ve la decisión del jugador 1 y luego decide si


hacer explotar o no una granada que matarı́a a los dos jugadores. La
hace explotar si no le dan la plata.

Si el jugador 1 cree en la amenaza, entonces su mejor respuesta es darle


la plata. Sin embargo, la amenaza es bastante no creı́ble y, por lo tanto,
el jugador 1 deberı́a decidir no darle nada.

6 / 21
Información perfecta: dos jugadores
Analizaremos juegos dinámicos con dos jugadores e información completa
y perfecta. La estructura general es la siguiente:

I Jugador 1 toma una acción.

I Jugador 2 observa la acción tomada por 1.

I Jugador 2 toma una acción.

I Los jugadores reciben los pagos determinados por sus acciones y el


juego termina.

Una pregunta natural que podrı́a surgir es cómo cambia nuestra idea de
solución (y la manera de encontrarla) en estos juegos.

7 / 21
Información perfecta: dos jugadores
Formalmente, lo de la diapo anterior es que:

I [1. ] El jugador 1 elige una acción a1 de su conjunto de acciones


factibles A1 .

I [2. ] El jugador 2 observa a1 y luego elige una acción a2 de su conjunto


de acciones factibles A2 .

I [3. ] Los pagos son u1 (a1 , a2 ) y u2 (a1 , a2 ).


Esto es lo que se denomina “Forma extensiva” de un juego. Ya lo veremos
más adelante.

Observación
Esta estructura podrı́a extenderse y permitir una mayor secuencia de ac-
ciones. Por ejemplo, agregando más jugadores o bien permitiendo que los
jugadores tomen decisiones más de una vez.

8 / 21
Información perfecta: dos jugadores

Los elementos cruciales de un juego con información completa y perfecta


son tres:

I Las decisiones son secuenciales.

I Todas las decisiones previas son conocidas al momento que se toma


la decisión actual.

I Los pagos de todos los jugadores son de conocimiento común (para


cualquier perfil de acciones).

9 / 21
Inducción reversa

¿Cómo resolver estos juegos?

Ver pizarra.

10 / 21
Paso 1 : entender
que debe hacer el ja para adquier accion
que haya tamado es Ja
Paso z :

Máx Un(anical buscamos su

Az función de
mejor Ra(a .
)
respuesta
·
Paso 3 : Ahora el J, debe incorporar esa info .

Máx Un(a ,; R2(a))


al
el (a ; Rala) es la solución
la interseccion par
Perfecto
a,
A J encentra y
de Nach
,

Equilibrio
er Subjreges(SPNE)

11 / 21
Inducción reversa

I El jugador 2, usando como dato la acción a1 2 A1 que tomó el jugador


1, debe resolver:

máx u2 (a1 , a2 ).
a2 2A2

Si tiene solución única, la denotamos R2 (a1 ) (mejor respuesta o reac-


ción).

I El jugador 1 anticipa esto y resuelve:

máx u1 (a1 , R2 (a1 )) .


a1 2A1

Supongamos que tiene solución única a1⇤ .

12 / 21
Inducción reversa

Definición
El par (a1⇤ , R2 (a1⇤ )) se denomina backwards induction outcome del juego.

I Esta idea de solución no involucra amenazas no creı́bles.

I El jugador 1 anticipa que 2 responderá de forma óptima a cualquier


cosa que haga.

I Es decir, 1 jamás tomarı́a en cuenta amenazas de 2 que no son en


realidad factibles.

13 / 21
Inducción reversa

Más adelante formalizaremos la idea de solución de un juego dinámico


con información completa y perfecta: el Equilibrio de Nash perfecto en
subjuegos.

Intuitivamente
Un NE será además “perfecto en subjuegos” si no involucra amenazas no
creı́bles (en un sentido que se debe precisar).

Observación
Veremos que un juego dinámico de esta forma puede tener muchos NE,
pero el NE perfecto en subjuegos será aquél asociado con el backwards
induction outcome del juego. Esto va en la lı́nea de que un juego puede
tener muchas soluciones posibles, pero no tantas que sean convincentes.

14 / 21
Inducción reversa
El procedimiento de inducción reversa trae asociada una racionalidad inhe-
rente que merece ser destacada. Consideremos el siguiente juego dinámico
de dos jugadores.

I [1. ] El jugador 1 elige L o R. Si elige L, el juego termina con los


siguientes pagos: 2 para el jugador 1 y 0 para el jugador 2.

I [2. ] El jugador 2 observa la elección de 1. Si 1 eligió R, entonces 2


elige L0 o R 0 . Si eligió L0 , entonces el juego termina y ambos jugadores
reciben como pago 1.

I [3. ] El jugador 1 observa la elección de 2 (y recuerda su propia elec-


ción en la primera etapa). Si las elecciones anteriores fueron R y R 0 ,
entonces 1 elige L00 o R 00 . En ambas opciones el juego termina. Si es
L00 , los pagos son 3 para el jugador 1 y 0 para 2; y si es R 00 , son 0
para 1 y 2 para 2.

15 / 21
Inducción reversa deberes

n
* Sibanes

colocaues en la altima etapa



("
0 eligira

.
sobenes
que
el Ja
L
la Ja
Luego subimes
y
elecció del

L *

0
S 2 será .

L R
(2 0 51 eligirá L A

⑪5 Hasta el
el fral
.

(1 ,)
la solución en las heckes es
que
el J1


i
primera etapa
el
L e lo y
elige
11

R tereina
juego
.


* tatar de escribirlo
0
(3 ,
como matriz

2)
10 ,
Duopolio de Stackelberg (1934)

El modelo de competencia duopólica de Stackelberg considera una firma


dominante (lı́der), que toma una decisión primero, y luego una firma su-
bordinada (seguidor) ve esa acción y toma su propia decisión.

I El modelo se podrı́a extender para que haya más seguidores.

I Asumiremos aquı́ que las firmas elijen cantidad a producir (como en


el modelo de Cournot).

I Queda propuesto el análisis cuando eligen precio.

16 / 21
Duopolio de Stackelberg (1934)

El timing del juego es como sigue:

I La firma 1 elige una cantidad q1 0.

I La firma 2 observa q1 y luego elige una cantidad q2 0.

I El pago de la firma i = 1, 2 es

⇧i (qi , q i ) = qi [P(Q) c] .

Donde P(Q) = a Q=a q1 q2 .

17 / 21
⑩las sa :
Impaciendo DO
pages
E 2 7 0


=

q2] q ,
-
-
=
0 =

92) [A c q,
-
- -

H , 19 ,;
-

Lider
=

*
q ,
=

q
(A f, q2] 7a
i2(q , q2)
c
- .
-
-
=

Haciendo Inducción Reversa q24 fa(q P) =

Laen e
=>
=

, -

firma 2 resuelve :

Máx a (G ,; 92) Sezivanos


~>

q2
eseguidae
=2 en
la cadición de 1 ader
Imponiendo
en

292
0 simulte
+2
=

A c q
-

0
-
=
-

,
=

mucho saturas
lides
producir pare

Gra
en e q <q q)
mercado
y que
la
seguidora
produzca nevos

=
4
H, (q , ; q(4) H, > #2

Ahora la firma 1 incorpora ese

en e
condimiento

Tagged
Hi H, T > i2
Max in (q ,; q2(q )) .

Para cournot ↓ hacer con estrand


qu

max A E
=>
e

18 / 21
Duopolio de Stackelberg (1934)
El backwards induction outcome de este juego es:

a c a c
q1⇤ = y q2⇤ = .
2 4

Lo que trae como pagos

(a c)2 (a c)2
⇧⇤1 = y ⇧⇤2 = .
8 16

¿Cómo se compara esto a Cournot?

19 / 21
Duopolio de Stackelberg (1934)
El hecho de que a la firma seguidora le vaya peor en Stackelberg (versus
Cournot) refleja un elemento crucial de los problemas multi agentes.

20 / 21
Duopolio de Stackelberg (1934)
El hecho de que a la firma seguidora le vaya peor en Stackelberg (versus
Cournot) refleja un elemento crucial de los problemas multi agentes.

I En un problema unipersonal, tener más información jamás empeora


la situación para quien debe tomar decisiones.

I En Teorı́a de Juegos, en cambio, tener más información (en realidad,


que los otros sepan que uno tiene más información) puede empeorar
la situación para el jugador.

I En este caso, la firma 2 tiene información sobre la cantidad q1 . Más


importante aún, la firma 1 sabe que 2 tiene esta información.

“Tarea”
¿Cómo cambia el análisis si consideramos que la firma 2 debe elegir su
cantidad después de 1, pero no puede observar lo que 1 eligió antes de
decidir?

20 / 21
To take away

I No todas las interacciones estratégicas se dan de forma “simultánea”


(con la misma información), sino que algunas pueden ser dinámicas.

I En particular, hoy estudiamos juegos dinámicos con información com-


pleta (todos los jugadores conocen los pagos de todos y saben que
todos saben) y perfecta (cada decisión se toma conociendo todas las
decisiones anteriores).

I La idea de solución que tenemos hasta ahora es la de backward in-


duction outcome. Esto impone racionalidad secuencial, es decir, no se
aceptan amenazas no creı́bles.

I En competencia duopólica en cantidades, ser lı́der es mejor que com-


petir simultáneamente, y esto último es mejor que ser seguidor.

21 / 21

También podría gustarte