Juegos Dinamicos

4.
4.1.
Informaci on imperfecta
Amenazas no cre bles
El concepto de estrategia de inducci on hacia atr as no se generaliza de forma inmediata al caso de juegos de informaci on imperfecta. La generalizaci on requiere la introducci on del concepto de subjuego.
Denici on 9 (Subjuegos) Un subjuego de un juego en forma extensiva es un juego tal que (1) Comienza con un nodo que dene un conjunto de informaci on que es un singleton. (2) Contiene todos los nodos sucesores y solo estos. (3) Si un nodo est a en el subjuego entonces todo nodo en su conjunto de informaci on tambi en est a (es decir, no hay conjuntos de informaci on divididos por el subjuego). Denici on 10 (Equilibrio perfecto en subjuegos) Una estrategia conjunta s es un equilibrio perfecto en subjuegos si induce un equilibrio de Nash Cournot de todo subjuego.5 La anterior denici on se extiende de forma natural al caso de estrategias de comportamiento. Ejemplo 8 Figura (a). En este juego existen dos equilibrios de Nash en el u nico subjuego (propio): (L, l) y (R, r) y dos en subjuegos: ((O, L)), l) y ((I, R), r) Ejemplo 9 En el siguiente juego (gura 5) vemos como el concepto de equilibrio perfecto en subjuegos selecciona un u nico equilibrio de Nash de dos equilibrios de Nash que existen.
5 Dada
una estrategia de un juego, la estrategia inducida en un subjuego es la restricci on de
14
El concepto de equilibrio perfecto en subjuegos en un renamiento estricto del concepto de equilibrio de Nash - Cournot y generaliza el concepto de inducci on hacia atr as. El ejemplo cl asico es el juego de entrada de una rma. V ease el juego de la gura 5 para el caso de juegos de informaci on imperfecta. Ahora, es interesante que el concepto de equilibrio perfecto en subjuegos puede seleccionar un equilibrio que es dominado por otro equilibrio de Nash. El siguiente ejemplo ilustra esta situaci on. Ejemplo 10 (Ineciencia del equilibrio perfecto en subjuegos) En el siguiente juego, gura D, la estrategia ((B, C ) , a) es el u nico equilibrio perfecto en subjuegos. Sin embargo, ((A, D) , b) es un equilibrio de Nash que domina el equilibrio perfecto en subjuegos. Teorema 4 En un juego nito de informaci on perfecta, el conjunto de estrategias de inducci on hacias atr as coincide con los equilibrio perfectos en subjuegos. El an alogo del teorema de Nash para juegos de informaci on imperfecta es el siguiente teorema de Selten. Teorema 5 (Selten) Todo juego nito en forma extensiva de memoria perfecta tiene un equilibrio perfecto en subjuegos (posiblemente en estrategias de comportamiento). Ejercicio 3 (Necesidad de memoria perfecta) El siguiente juego ilustra la necesidad de la hip otesis de memoria perfecta en el teorema de Selten. Demostrar que el juego de la gura no tiene un equilibrio en estrategias de comportamiento.
la estrategia al subjuego. Esta puede denir un camino que en el juego original nunca hubiera sido alcanzado al utilizar la estrategia original. V eanse los ejemplos de equilibrios perfectos en subjuegos.
15
having no strict follower in Y . 7.32 Provide an example of a nite game of imperfect information and perfect recall in which there is no last information set. That is, for every information set, there is a node, x, within it such that (x, a) X is not an end node for some action a. 7.33 Find all subgame perfect equilibria in the game of Fig. 7.17. 7.34 Prove that for every extensive form game, the game itself is a subgame. 7.35 Show that if s is a pure strategy Nash equilibrium of an extensive form game, then s induces a Nash equilibrium in every subgame that is reached by s. 7.36 Argue that in every game of perfect information, every node denes a subgame. 7.37 Answer the following questions. (a) Prove that every nite extensive form game with perfect information possesses at least one pure strategy subgame perfect equilibrium. (b) Provide an example of a nite extensive form game having no pure strategy subgame perfect equilibrium. 7.38 Complete the proof of Theorem 7.6 on the existence of subgame perfect equilibrium. 7.39 Find all subgame perfect equilibria of the game in Fig. 7.26(a). 7.40 Answer the following questions for the game shown in Fig. 7.39. (a) Calculate a Nash equilibrium for the game. (b) Show that this game has no Nash equilibrium in behavioural strategies.
1
4 1
0 1
0 1
1 0
1 0
0 1
0 1
4 1
Figure 7. 39.
16
Si bien el concepto de equilibrio perfecto en subjuegos llama la atenci on sobre la necesidad de enfocarse en estrategias conjuntas que sean optimas din amicamente (a lo largo de todos los subjuegos). Desafortunadamente no logra eliminar todas las amenzas no creibles porque el concepto de equilibrio no distingue entre nodos que pueden ser alcanzados con probabilidad positiva y aquellos con probabilidad cero de ser alcanzados. Los dos ejemplos siguientes ilustran el problema. Ejemplo 11 El siguiente juego, gura C, no tiene subjuegos propios. Los equilibrios de Nash (A, b) y (B, a) son equilibrios perfectos en subjuegos. Sin embargo el primero no es cre ble. En particular, no es cre ble que el segundo jugador jugar a b en caso de tener que jugar. Ejemplo 12 El siguiente juego (gura G) tiene un equilibrio perfecto en subjuegos ((L, m)) que no es cre ble. Una vez el jugador 1 decide no entrar, independientemente de si el jugador 2 cree estar en el nodo x o en el nodo y la estrategia mixta para 2, (0,5, 0, 0,5) domina la estrategia m para el jugador 2. Ejercicio 4 En el juego de la gura G mostrar que el u nico equilibrio en el que el jugador 2 juega m con probabilidad cero es cuando el jugador 1 juega L con probabilidad cero. La necesidad de introducir un sistema de expectativas como parte integral de la evaluaci on que de un juego hace los jugadores la ilustra la siguiente modicaci on del juego de la gura C. La gura C1 muestra que ((A, b) es un equilibrio de Nash pero que este sea o no sea cre ble depende de con qu e probabilidad cree el jugador que, en caso de que le toque jugar, estar a haciendolo en uno u otro nodo.
17
18
hHi
Denamos el conjunto de todas las expectativas del agente i como i = (h) donde (h) denota el conjunto de distribuciones de probabilidad
sobre el conjunto de informaci on h. Denici on 11 (Sistema de expectativas) Un sistema de expectativas de un juego es un conjunto funciones {pi }i=1,...N , pi : Hi i tal que pi (h) (h). La interpretaci on es: pi (h) es la expectativa que tiene el jugador i de estar en cada uno de los nodos de su conjunto de informaci on h. Denici on 12 (Estimaci on) Una estimaci on del juego es {pi }i=1,...N , {bi }i=1,...N donde (pi )i=1,...N es un sistema de expectativas y (bi )i=1,...N son estrategias de comportamiento. Dada una estimaci on existe una forma natural de denir si las estrategias de comportamiento son optimas dadas las expectativas de los jugadores (i.e., secuencialmente racionales). Fijemos una estimaci on del juego: {pi }i=1,...N , {bi }i=1,...N . Sea k un nodo cualquiera, k Ki ; denimos ui (b k ) como la utilidad del jugador i cuando suponemos que este se encuentra en este nodo y las estrategias de comportamiento utilizadas por los jugadores son {bi }i=1,...N . Obs ervese que esta utilidad la podemos interpretar como una funci on: ui (b ) : Ki R. Denimos la utilidad del jugador i en el conjunto de informaci on h Hi cuando el perl de estrategias de comportamiento es {bi }i=1,...N y las expectativas del jugador son pi (h) i (h) como: vi (b h) = Epi (h) [ui (b )] . Ejemplo 13 Calculemos v1 (b I ) para el siguiente juego, gura F, (jugador 1, conjunto de informaci on I como aparece en la gura): Analizamos separadamente los 3 subjuegos con ra z x, y y z (dejando de lado el hecho de que est an en el mismo conjunto de informaci on I ). Es f acil ver que u1 (b x) = 4, u1 (b y ) = 3 y u1 (b z ) = 6. Supongamor que las expectativas del jugador 1 1 1 son px = 2 , py = 1 3 , pz = 6 . Luego, dadas las expectativas del jugador 1 en I obtenemos: v1 (b) = 4. Denici on 13 (Racionalidad secuencial) Una estimaci on de un juego {pi }i=1,...N , {bi }i=1,...N es secuencialmente racional si para todo jugador i, conjunto de informaci on h Hi y estrategia de comportamiento bi del jugador i tenemos: vi (bi , bi h) vi ((bi , bi ) h). Intuitivamente, dada esa estimaci on del juego, ning un jugador tiene incentivos unilaterales a desviarse. 19
En la gura gura G, el equilibrio prefecto en subjuegos que no es creible no es racionalmente secuencial. Desafortunadamente, una estimaci on secuencialmente racional no es necesariamente un equilibrio perfecto en subjuegos. Ni siquiera un equilibrio de Nash. Ejemplo 14 (Racionalidad secuencial en el juego de cara y sello) Considere el siguiente juego (Cara y sello): Figura G Este juego tiene un u nico equilibrio de Nash en estrategias de comportamiento: la estrategia mixta de jugar cara con probabilidad 1 on: px = 0, py = 1, ((1, 0), (1, 0)) es 2 . Sin embargo la estimaci secuencialmente racional pero no es un equilibrio de Nash. Vamos a introducir algunas restricciones de compatibilidad entre las expectativas y estrategias de comportamiento de los jugadores. Denici on 14 (Consistencia con regla de Bayes) Una estimaci on de un juego {pi }i=1,...N , {bi }i=1,...N es consistente con la regla de Bayes si la expectativa que tiene cada jugador de estar en un nodo espec co es igual a la probabilidad condicional a alcanzar el conjunto de informaci on al que pertenece el nodo, inducida por las estrategias de comportamiento de todos los jugadores en cada nodo del conjunto de informaci on. Obs ervese que esto no impone ninguna restricci on sobre las expectativas que puede tener un jugador de estar en un nodo particular cuando la probabiliad de llegar al conjunto de informaci on que contiene ese nodo es cero. Denici on 15 (Equilibrio perfecto d ebil Bayesiano) Una estimaci on de un juego es un equilbrio perfecto Bayesiano si es secuencialmente racional y si la estimaci on es consistente con la regla de Bayes. 20
La estimaci on del juego de cara y sello del ejemplo anterior no es consistente con la regla de Bayes por lo tanto no es un equilibrio perfecto d ebil Bayesiano. Un equilibrio perfecto d ebil Bayesiano no tiene que ser necesariamente un equilibrio perfecto en subjuegos como lo demuestra el siguiente ejemplo. Ejemplo 15 (Equilibrio perfecto d ebil Bayesiano que no es perfecto en subjuegos) En el juego de la gur 4.5, (B, X, D) es un equilibrio perfecto d ebil Bayesiano que lo sustenta la creencia del jugador 3 de estar en el nodo superior de su conjunto de informaci on con probabilidad 0. Sin embargo, este no es un equilibrio perfecto en subjuegos porque en el u nico subjuego propio, la estrategia inducida no es un equilibrio de Nash (el jugador 3 tiene incentivos unilaterales a desviar120 se).Renements of Nash equilibrium: theory
C
3 (2, 2, 2)
X
2
D C Y
3
(0, 2, 0) (0, 1, 0)
A
1
D B
(1, 0, 3)
(2, 1, 2)
Figure 4.5: An extensive-form game with a weak perfect Bayesian equilibrium that is not subgame perfect.
Denition 4.2. Furthermore, given these beliefs, we have = 2 > 3 C ; B , X | , = 0, 3 D ; B , X | , h h

La consistencia con la regla de Bayes deja indeterminadas las expectativas
. Thus, the strategy prole where D and C are the two possible choices in h (part (a) of considered satises the optimality required 21at the information set h Denition 4.2). It is straightforward to check that it is satised as well at all other information sets, thus conrming that ( B , X , D ) is indeed a WPBE. The above example illustrates a substantial drawback of the WPBE concept. Its attempt to introduce explicit beliefs into the analysis of multistage games appears to backre. Even though WPBE achieves some sort of belief-based rationality at every information set, it fails to guarantee the equilibrium features ensured by SPE at proper subgames. It is easy to see that this problem cannot arise in very simple
(0)
(0)
l (0)
[ ]
[1 ]
A restriction implied ence.

(0)
(1) (0)
2 (1) (0) (0) (0) (1) (0)
[ ]
3 [1 ]
[ ]
3 [1 ]
eed this equality follows from two additional principles that we intentionally ly informally. They are as follows. en los conjuntos de informaci on que no tiene una probabilidad positiva de
ser alcanzados.
reect that players choose strategies independently. 4.2. their Creencias no cre bles
Dos restricciones adicionales que ayudan a restringir el universo de creencias son las siguientes. have identical beliefs. Denici on 16 (Independencia) Las expectativas deben reejar que los jugadores escogen sus estrategias de forma independiente.
h identical information
e how these two principles lead to = , consider Fig. 7.30. When player 2s La siguiente gura muestra un juego en el que la restriccion de indepenset is reached, is the probability that player 2 places on player 1 having dencia sobre la expectativas implica que = . Now, although this is not represented in the diagram, the principle of common n 17 (Simetr a) con id informaci on deben lies that player 3 also Denici placesoprobability Jugadores on player 1entica having chosen L tener at las mismas expectativas. n the game (i.e., when given exactly the same information as player 2). But La siguiente gura muestra unstrategy juego en elchoice que la restriccion de independence of the players strategies, nding out the of player 2 dencia y simetr a sobre la expectativas implica que = . ayer 3 with no information whatever regarding the strategy chosen by player
Se puede demostrar que las hip otesis de consistencia con la regla de Bayes, independencia y simetr a son equivalentes a que la evaluaci on de un juego sea consistente en el sentido de la siguiente denici on. 22
CHAPTER 7
A restriction implied by fs and independence.

(0) [ ] r (1) (0) l L
1 R 2 (0) [1 ]
OUT (1)
r (1) (0) l (0)
[ ]
[1 ]
A restriction implied ce.

(0)
(1) (0)
2 (1) (0) (0)

23
(1) (0) (0)
[ ]
3 [1 ]
[ ]
3 [1 ]
Denici on 18 (Evauluaciones Consistentes) Decimos que una evaluaci on de un juego {pi }i=1,...N , {bi }i=1,...N es consistente si existe una sucesi on de estrategias de comportamiento conjuntas {bn i }n tal que: 1. Para todo n y para todo i, bn i es de soporte completo o completamente mixta (i.e., toda estrategia pura tiene probabilidad estrictamente positiva de ser elegida). 2. Para cada i, la sucesi on {bn i }n converge a bi . 3. Para cada i las espectativas que induce la sucesi on {bn i }n de acuerdo a la regla de Bayes convergen a las espectativas pi . Denici on 19 (Equilibrio Secuencial) Una evaluaci on de un juego es un equilibrio secuencial si es consistente y secuencialmente racional. Intuitivamente, en ning un momento del juego (a un en conjunto de informaci on con probabilidad cero de ser visitados) un jugador tiene incentivos unilaterales a desviarse. En la gura gura G, el equilibrio prefecto en subjuegos que no es creible no es un equilibrio secuencial (no es secuencialmente racional). Ejercicio 5 Dar dar un ejemplo de un equilibrio perfecto en subjuegos que sea secuencialmente racional pero no sea un equilibrio secuencial. El an alogo al teorema de Nash o al teorema de Selten para equilibrios secuenciales es el teorema de Krep y Wilson. Teorema 6 (Kreps y Wilson) Todo juego en forma extensiva con memoria perfecta tiene un equilibrio secuencial (posiblemente en estrategias de comportamiento) y todo equilibrio secuencial es un equilibrio perfecto en subjuegos. Ejemplo 16 Equilibrio perfecto d ebil Bayesiano que es perfecto en subjuegos pero no equilibrio secuencial. Considere el juego de la gura 4.10 de Vega Redondo. Las estrategias (A, b, U ) son un equilibrio perfecto d ebil Bayesiano siempre y cuando el jugador 3 crea esta en x31 con probabilidad superior a 2 3 . Este equilibrio no es creible y no es un equilibrio secuencial. Soportar este equilibrio requerir a una sucesi on de expectativas convergiendo a cero en el nodo x31 . Ahora (B, b, U ) es un equilibrio secuencial y es cre ble.
24
Quite interestingly, we shall see that the outcome of this iterative process contrasts sharply with the seemingly similar process of elimination of (strongly) dominated strategies that was studied in Section 2.1. 4.6 Sequential equilibrium
The important shortcomings exhibited by the WPBE concept were illustrated in Section 4.4. There, we showed that this equilibrium notion does not even guarantee subgame perfection; i.e., it may allow for nonequilibrium behavior in some proper subgames. To tackle the problem, the main issue concerns nding natural conditions that suitably narrow down the unrestricted off-equilibrium beliefs permitted by the WPBE concept. Of course, one of the primary objectives in this respect must be to guarantee that the induced equilibria satisfy the basic requirement of subgame perfection. But more generally, the objective should be to rule out all awkward (thus, arguably untenable) belief imputations off the equilibrium path. To illustrate some of the considerations involved in this task, consider the game represented in Figure 4.10. In this game, the strategy prole ( A , b, U ) denes a Nash equilibrium. This equilibrium is weak perfect Bayesian for any belief pattern that satises (x31 ) 2(1 (x31 )) (4.5) or (x31 ) 2/3. Clearly, any assessment (recall Section 4.4) that involves a belief pattern consistent with (4.5) and the strategy prole ( A , b, U ) satises both (a) and
(0, 0, 1)
U x 31
(1, 0, 0)
a x 21
3
V
(0, 0, 0) (0, 0, 0)
A B
b x 32
V
(2, 2, 2)
C a x 22 b
(0, 0, 0)
(0, 1, 0)
Figure 4.10: An extensive-form game with a WPBE that is not a sequential equilibrium.
25

Juegos Dinamicos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Juegos Dinamicos

Cargado por

Copyright:

Formatos disponibles

4.

una estrategia de un juego, la estrategia inducida en un subjuego es la restricci on de

Denition 4.2. Furthermore, given these beliefs, we have = 2 > 3 C ; B , X | , = 0, 3 D ; B , X | , h h

A restriction implied ence.

2 (1) (0) (0) (0) (1) (0)

A restriction implied by fs and independence.

r (1) (0) l (0)

A restriction implied ce.

2 (1) (0) (0)

(1) (0) (0)

También podría gustarte