Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Juegos Dinamicos
Juegos Dinamicos
:
0
= :
1
, :
0
2
:
00
= :
0
1
, :
0
2
:
000
= :
0
1
, :
2
Para que cualquiera de ellos sea Equilibrio de Nash cada uno de los dos
elementos del perl debera dar la mayor utilidad (o pago) dado el otro compo-
nente. Es decir, si por ejemplo : es Equilibrio de Nash, tiene que ocurrir que
n
1
(:
1
p :
2
) _ n
1
(:
0
1
p :
2
) y al mismo tiempo, n
2
(:
2
p :
1
) _ n
1
(:
0
2
p :
1
), o en
trminos de los pagos j
1
(:
1
p :
2
) _ j
1
(:
0
1
p :
2
) y j
2
(:
2
p :
1
) _ j
1
(:
0
2
p :
1
).
2.2 Juegos dinmicos
La idea de juego dinmico se sigue directamente del concepto de juego anteri-
ormente expuesto, slo es necesario agregar que la evolucin del juego se da en
el tiempo.
Denicin 9 Un juego dinmico es aqul en el que las decisiones de los
jugadores son tomadas en el tiempo.
Los juegos que presentan una marcada estructura dinmica suelen ser repre-
sentados en su forma extensiva, esta descripcin detalla la estructura secuencial
de los problemas de decisin a los que se enfrentan los agentes, adems hace
explcito el orden en el que el juego se lleva a cabo y la informacin que poseen
los agentes cuando toman cada una de sus decisiones.
Denicin 10 La forma extensiva de un juego contiene la siguiente in-
formacin:
i) Un conjunto de jugadores, = 1, 2, ..., :.
ii) El orden de los movimientos, esto es, quin mueve y cundo.
iii) Los pagos de los jugadores, como funcin de los movimientos que sigu-
ieron los individuos, j
i
(:
i
p :
i
) \ i .
iv) Cules son las acciones que toman los jugadores cuando mueven,
i
\
i .
v) Cul es la informacin que poseen los individuos cuando toman sus deci-
siones,
i
\ i .
As como a la forma normal de un juego era posible asociarle una matriz, la
forma extensiva puede ser representada por un diagrama de rbol, que es una
coleccin nita de nodos ordenados.
Sobre este tipo de diagramas se pueden denir dos funciones especiales.
Imagine que A es el conjunto de todos los nodos de los que se compone el
rbol, entonces la funcin j : A A+ ? asigna a cada nodo del juego (excepto
al inicial al que le asigna el conjunto vaco ?) uno y slo un nodo predecesor,
as j(r) = r
0
se lee r
0
est antes de r.
Para el mismo conjunto A, se puede denir o : A A + ?, que asigna a
todos los nodos en A (excepto a los terminales que les asigna el conjunto vaco
?) nodos sucesores. Por lo anterior, o(r) = r
0
se lee r
0
es un sucesor de r.
Ejemplo 3
5
En la Figura 1 se presenta un juego en el que el conjunto de nodos es A =
r0, r1, ..., r8
Figura 1
La funcin j() toma los siguientes valores:
j(r0) = ?
j(r1) = j(r2) = r0
j(r3) = j(r4) = r1
j(r5) = j(r6) = r2
j(r7) = j(r8) = r4
y la funcin o() los siguientes:
o(r3) = o(r3) = o(r3) = o(r3) = o(r3) = ?
o(r0) = (r1, r2)
o(r1) = (r3, r4)
o(r2) = (r5, r6)
o(r4) = (r7, r8)
La relacin o() no es precisamente una funcin, pero lo que se intenta decir
presentndola como tal, es que los diagramas de rbol permiten ver, para todo
nodo no terminal, los nodos que lo suceden.
Existe una relacin entre la forma normal y la extensiva de los juegos, en
particular, es posible cambiar un juego que est en su forma extensiva a su
forma normal. Este hecho quedar ms claro con un ejemplo.
Ejemplo 4
Imagine una situacin parecida a la que se estableci en el Ejemplo 3, en
la que dos individuos, 1 y 2, interactan de la siguiente manera: el jugador
6
1 mueve primero y elige entre dos acciones posibles a y b, despus de que el
jugador 1 eligi, el jugador 2 es llamado a jugar, ste puede elegir entre dos
opciones posibles, si el jugador 2 observa que 1 eligi a, 2 puede escoger A o B,
si el jugador 2 elige B el individuo 1 vuelve a jugar, y elige entre las acciones a
y b. Si el jugador 1 escogi b, el 2 puede elegir C o D. Esta situacin puede
ser entendida como un juego, y por lo tanto, representada con el diagrama de
la Figura 2, en el que se especican los pagos:
Figura 2
El juego anterior puede ser representado en su forma normal, para lograrlo,
es necesario considerar que las estrategias son un plan completo para cualquier
accin posible del otro jugador, as que simplemente A no es una estrategia del
individuo 2 porque si el individuo 1 eligiera b, A no especica qu hacer. Una
vez considerado eso, la matriz de pagos y estrategias es:
AC AD BC BD
aa (1, 1) (1, 1) (2, 1) (2, 1)
ab (1, 1) (1, 1) (1, 2) (1, 2)
b (3, 1) (1, 3) (3, 1) (1, 3)
Matriz 2
en donde se observa claramente que las estrategias cumplen con la propiedad
de ser planes enteros para cualquier contingencia que el juego presente. El
conjunto de las estrategias del individuo 1 es o
1
= aa,ab,b y el del individuo
2 es o
2
= AC,AD,BC,BD.
A partir de la Denicin 9 se obtiene el conjunto de Equilibrios de Nash,
1 = aa, AD, aa, BD, b, AD.
Una estrategia en un juego en forma extensiva es un plan que especica la
accin a tomar en cada nodo del juego en el que el individuo sea llamado a
7
jugar. Tambin se puede decir que es una funcin que utiliza la informacin que
el individuo tiene y que asigna a cada nodo del juego (excepto a los terminales)
una accin.
En los juegos dinmicos surge el concepto de estrategias no crebles, en [6]
se asegura que el Equilibrio de Nash no es capaz de capturar enteramente este
hecho, por lo que se introdujo el concepto de Equilibrio de Nash Perfecto en
Subjuegos, para denirlo, es necesario establecer qu es un subjuego.
Denicin 11 Un subjuego de algn juego , es un subconjunto de que
consiste en un nodo, que no es el inicial para , en todos los nodos que le siguen
a ese nodo y en los pagos asociados a esos nodos.
Ejemplo 5
Si suponemos que es el juego expuesto en el ejemplo anterior, un subjuego
posible es el que se presenta en la Figura 3:
Figura 3
Denicin 12 Un perl de estrategias es un Equilibrio de Nash Perfecto
en Subjuegos (SGNE) si satisface dos condiciones:
i) Es Equilibrio de Nash para todo el juego.
ii) Es Equilibrio de Nash para cada subjuego.
La condicin i) puede ser considerada de necesidad, porque para ser SGNE
es necesario ser primero Equilibrio de Nash, y la ii) como de suciencia, porque
no basta ser Equilibrio de Nash para ser un SGNE.
Ejemplo 6
De la Matriz 2 se obtuvo el conjunto de equilibrios de Nash, 1 = aa,AD, aa,BD, b,AD,
si ese juego tiene algn SGNE tiene que ser uno de estos. Aqu se demostrar que
el nico Equilibrio de Nash que es perfecto en subjuegos es el perl aa,BD,
un ejercicio interesante es demostrar que los otros perles, aa,AD y b,AD,
no lo son.
Una vez que aa,BD es un Equilibrio de Nash, slo queda demostrar que
lo es para todos los subjuegos posibles, pero slo son tres los subjuegos posibles,
el que parte del nodo r4 y termina en r7 y en r8, el que parte de r1 y termina
en r3, r7 y r8 (Figura 3) y el que inicia en r2 y termina en r5 y r6. Llamemos
oJ
1
al primero, oJ
2
al segundo y oJ
3
al tercero. A partir de aa,BD en el
oJ
1
el individuo 1 elige a que efectivamente es creble, pues si as lo hace, recibe
un pago mayor, en el oJ
2
el jugador 2 elige B, que de nuevo es una decisin
8
correcta pues sin importar lo que elija el jugador 1 terminar mejor o igual con
respecto a si hubiera decidido A. Por ltimo, en el oJ
3
el jugador 2 elige la
accin D que efectivamente signica un pago mayor para 2. Queda demostrado
que es un SGNE.
3 Aplicaciones
En este punto conviene exponer una aplicacin econmica comn de la teora
de los juegos dinmicos; el modelo de Stackelberg.
3.1 Descripcin de la economa
Existen dos empresas, 1 y 2. Estas empresas compiten en cantidades en un
mercado con las siguientes caractersticas:
La empresa 1 toma sus decisiones de produccin primero, y la empresa 2
slo se ajusta a lo que haya decidido la empresa 1. Por simplicidad se puede
suponer que la demanda de mercado es lineal, en particular, j = 12, en donde
=
1
+
2
. Otro intento por simplicar puede ser suponer los costos marginales
constantes e iguales al costo medio, por ejemplo, CT
1
=
1
y CT
2
= 2
2
, donde
CT
i
es el costo total de la empresa i, i = 1, 2.
3.2 Equilibrio
Del modelo duoplico de Cournot se sabe que la curva de reaccin de la empresa
2, bajo estas condiciones, es
2
=
10q1
2
, que surge de resolver el problema de
maximizacin de benecios de la empresa 2 tomando en cuenta que la demanda
es j = 12
1
2
, esto es:
max
2
= j
2
2
2
:.a j = 12
1
2
La empresa 1, que sabe que la empresa 2 es un agente racional (ms an, la
empresa 2 sabe que la empresa 1 la considera racional, la empresa 1 sabe que la
empresa 2 sabe que la considera racional, y as en un innito de iteraciones)
8
,
maximizar sus benecios considerando dos cosas: que el precio de mercado se
determina a travs de la siguiente funcin de demanda j = 12
1
2
y que
la empresa 2 elegir
2
=
10q1
2
, se puede expresar lo anterior como sigue:
max
1
= j
1
1
1
:.a j = 12
1
2
=
10q1
2
Que se puede reescribir como sigue:
8
El trmino anglosajn para ese innito de iteraciones es Common knowledge. En estos
modelos se supone implcitamente que la racionalidad de los agentes es common knowledge,
es decir, que los individuos la conocen, los individuos saben que los otros la conocen, los
individuos saben que los otros saben que estos la conocen, y as hasta el innito.
9
max
1
=
12
1
10q1
2
1
1
1
= (7
q1
2
)
1
1
El problema de la empresa 1 es ahora uno de optimizacin libre y de una
variable. La condicin de primer orden es:
@1
@q1
= 0 == 7
1
1 = 0
Que implica que
1
= 6, una vez que la empresa 2 observa esto decide
producir
2
=
106
2
= 2
Dado lo anterior el precio es j = 12 6 3 = 3.
3.3 El modelo de Stackelberg como un juego
En este punto es importante establecer claramente el vinculo que existe entre
este modelo de competencia monopolista y la teora de juegos, para lograrlo con
mayor claridad se va a preservar la notacin de la seccin anterior.
Primeramente hay que notar que el comportamiento de las dos empresas
se da en un ambiente de interdependencia estratgica, porque lo que haga una
empresa afectar a la otra y porque el propio comportamiento de las empresas
involucra la anticipacin del comportamiento de la otra.
Sea
1
el conjunto de cantidades (acciones) que la empresa 1 puede elegir,
y
2
el conjunto de cantidades posibles para la empresa 2. Por lo anterior tiene
que ocurrir que
1
1
y
2
2
.
Queda por demostrar que el el perl : = :
1
, :
2
, donde
:
1
= arg max
1
= j
1
1
1
:.a j = 12
1
2
=
10q1
2
y
:
2
= arg max
2
= j
2
2
2
:.a j = 12
1
2
es un equilibrio de Nash. Se puede ver que tanto :
1
como :
2
son, respecti-
vamente, estrategias de la empresa 1 y de la empresa 2 porque dictan un plan
entero de comportamiento para cualquier eleccin de su contraparte, por lo que
: = :
1
, :
2
es efectivamente un perl de estrategias.
Si se interpretan los benecios de las empresas como los pagos del juego
ocurre que, dado :
1
, ninguna cantidad da un benecio mayor a la empresa 2
que :
2
. Igualmente, dado :
2
, :
1
maximiza las ganancias de 1, por lo que :
1
es
la mejor respuesta de 1 a :
2
, y :
2
es la mejor respuesta que puede dar 2 a :
1
,
entonces, se observa que el vector (
1
,
2
) = (6, 3) es un equilibrio de Nash.
10
3.4 Esttica comparativa
Ahora cabe preguntarse qu ocurre con el equilibrio si cambiamos la estructura
de costos, en particular, si se introduce un costo jo o de entrada.
Imagine que para entrar al mercado se exige a la empresa 2 un costo jo de
1, ahora, los costos de la empresa 2 sern CT
2
= 2
2
+1, y el problema que
resuelve es:
max
2
= j
2
(2
2
+1)
:.a j = 12
1
2
No parece difcil ver que la curva de mejor respuesta para esta empresa no
cambia, y sigue siendo:
2
=
10q1
2
Dado lo anterior, la decisin ptima de la empresa 1 tampoco cambia,
1
= 6,
y de nuevo, una vez que la empresa 2 observa esto, decide producir
2
=
106
2
=
2, y el precio sigue siendo j = 3.
Lo que cambia es el pago de la empresa 2,
1
= 3(6) 6 = 12, mientras que
2
= 3(2) 2(2) 1 = 2 1.
De lo que se concluye que si 1 (0, 2) la empresa 2 estar dispuesta a
entrar, porque
2
0, si 1 = 2, entonces
2
= 0, por lo que es indiferente,
pues
2
= 0 es lo que obtendra si no entrara, y si 1 2 no entra, pues
2
< 0.
References
[1] Aumann, R., 1976. Agreein to Disagree. The Annals of Statistics. Vol. 4,
Num. 6.
[2] Fudenberg, D., y J. Tirole 1991. Game Theory. MIT Press.
[3] Kuhn, H. W., y A. W. Tucker, editores, 1950. Contributions to the Theory
of Games. Vol. I. Princeton University Press.
[4] Kuhn, H. W., y A. W. Tucker, editores, 1953. Contributions to the Theory
of Games. Vol. II. Princeton University Press.
[5] Osborne, M., y A. Rubinstein 1994. A Curse in Game Theory. MIT Press.
[6] Mas-Colell, A. et al, 1995. Microeconomic Theory. Oxford university Press.
[7] Myerson, R., 1999. Nash Equilibrium and the History of Economic Theory.
Journal of Economic Literature. Vol. 37, Num. 3.
[8] Rasmusen, E., 1996. Juegos e Informacin, Una Introduccin a la Teora de
Juegos. FCE.
[9] von Neumann, J., y O. Morgenstern 1944. Theory of Games and Economic
Behavior. Princeton University Press.
11