Gibbons - Un Primer Curso de Teoría de Los Juegos Cap2

,',
52/ JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e. 1) '.'.'
COURNOT,A. 1838. l\echerches Sllr les Principes Mathématiques de la Théorie

des Richesses. Edición inglesa: Researches into the Mathematical Principies of
2. JUEGOS DINÁMICOS
theon) of Wealth. Publicado por N. Bacon. New York: Macmillan, 1897.
CON INFORMACIÓN COMPLETA
DASGUPTA, P, y E. MASKIN,1986. "The Existence of Equilibrium in Discon-
tinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.
c\
'.','.
FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal of Con-

flict Resolution 35:683-705.
FRIEDMAN,J. 1971. "A Noncooperative Equilibrium for Supergames."

Review of Economic Studies 28:1-12. Ijnestecapítulo presentamos los juegos dinámicos. De nuevo, limi~a-
mas nue~tra atención a los juegos con información completa. (es dédr; (,
GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." Ame-
juegos en los que las fundones de ganancias de los jugadores so~ Wor-
rieclrlEconomic Review 78:896-912.
maciónqel doriúnio público); véase una introducción a 10s'juégOs con
HARDIN,G. 19613."The Tragedyof the Commons." Science 162:1243-48. información incompleta en el capítulo 3. En la sección 2.1 analiZarnos
los juegos dinámicos no sólo con información completa, sino tambiéÍi:co~
HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A New
información perfecta, lo que significa que en cada momentodeI'jí1ego;~1
Rationale for Mixed Strategy Equilibrium Points." International Journal of
jugador a quien le corresponde decidir conoce la historia cómple'fá:de
Came Theory 2:1-23.
todas las decisiones tornadas hasta ese momento. En las seccióries'i;2'¡;
HOTELLING,H. 1929. ';Stability in Competition." Economic JournaI39:41-57. 2.4, considercunos los juegos con información completa pero imperfeét~:
en algún momento ~~l juego el jugador a quien le corresponde decidirno
HUME, D. 1739. A Treatise of Human Nature. Reedición. Londres: J. M.
conoce toda lahistoria del juego. .
Dent. 1952.
El tema central en todo juego dinámico es el de la credibilidad. Como
KAKUTANl,S. 1941. "A Generalization of Brouwer' s Fixed Point Theorem." ejemplo de una amenaza que no resulta creíble, consideremos el siguiente
Dllke Mathematieal Joumal 8:457-59. juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets 1",'
al jugador 2 () no darle nada, Én segundo lugar, el jugado.r2 observa la

KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Ber-
decisióridel jugador 1 y de~ide si hacer estallar o no una granada que
trand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics
los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer
4:326-37.
estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si
MONTGOMERY, J. 1991. "Equilibrium Wage Dispersion and Interindustry el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es
Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79. la de pagar las 1.000 pesetas. Pero el jugador 1 no debería creerse una
amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar :',
'..
NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the
dicha amenaza, escogería no hacerlo., Por tanto, el jugador 1 no debería'
National Aeademy of Sciences 36:48-49.
pagar nada al jugador 2.1
PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of En la sección 2.1 analizamos los siguientes casos de juegos dinámicos
Perfection." Econometrica 52:1029-50. con información completa y perfecta: el jugador 1 decide primero, acto
seguido el jugador 2 observa la decisión dél jugador 1 y finalmente el juga-
STACKELBERG,
H. VON, 1934, Marktfonn L/nd Cleichgewicht. Viena: Julius
Springer. 1. El jugador 1 podría preguntarse si un o?>n~nie que amenaza con hacer explotar una'
granada está loco. Este tipo de dudas se modelali como información incompleta, porque el
jugador 1 no está seguro de la función dé ganancias del jugador 2 (véase capítulo 3).
-,
1
Juegos dillámicos COI¡ ¡'¡formación completa y perfecta / 5.5

54 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
l presentada en el capítulo 1. Definimos también el equilibrio de

dar 2 toma su decisión con lo que concluye el juego. Eljuego de la granada norm a ., ., 1
pertenece a esta clase, como el modelo de duopolio de Stackelberg (1934) y Nash perfecto en subjuegos para juegos en general. La cuestlOn pnl~clpa
. el modelo de Leontief, (1946) de determinación de salarios y nivel de em- (tan to de esta sección como del capítulo en su cODjunto)es
h
que un Juego
'l'b' d
pleo en una empresa con fuerte implantación de un sindicato. Definimos dinámico con información completa puede tener muc os equt J nos e
.' el resultado por inducción hacia atrás y consideramos brevemente su relación Nash, pero algunos de ellos pueden incluir amenazas.o promesas que no
'" con el equilibrio de Nash (posponiendo la discusión de esta relación hasta son creíbles. Los equilibrios de Nash perfectos en subluegos son aquellos
la sección 2.4). Resolvemos los modelos de Stackelberg y Leontief, uti- que pasan la prueba de credibilidad.
lizando este criterio. Derivamos también un resultado a~álogo para el
modelo de negociación de Rubinstein (1982), aun cuando ese juego tiene
una sucesión potencialmente infinita de tiradas y, por tanto, no pertenece 2.1Juegos dinámicos con información completa y perfecta
ala cl~se de juego,s considera~a, '.
. En la sección 2.2 ampliamos la clasé de juegos analizada en la sección 2.1.A Teoría: induccÍón hacia atrás
anterior: primero ambos jugadores 1 y2 deciden simultáneamente, acto
seguido los jugadores 3 y 4 observanlas decisiones de 1 y 2y finalmente, El juego de la granada es un representante de la siguiente clase de juegos
los jugadores 3 y 4 deci~fensimultáneámente'c!Jn lo que concluye el juego. sencillos con información completa y perfecta:
Como ya se explicará en la sección 2.4, la simultaneidad de las decisiones
significa en este contexto que estos juegos son de información imperfecta, 1. El jugador 1 escoge una acción al del conjunto factible Al'
Definimos el resultado perfecto en subjuegos dé tales juegos, que es la ex- 2. El jugador 2 observa 0'1 y escoge una acción o,z del conjunto factible
tensión natural de la inducción hacia atrás. Resolvemos los modelos de Az.
Diamond. y Dybvig (1983) de pánico bancario" un modelo de aranceles y
3. Las ganancias son 1J,1 (a1,o.z) y'Uz(al,o,z).
de competencia internacional imperfecta y el modelo de los torneos de
LazearyRosen (1981), utilizandoeste.criterio. z
Muchos problemas económicos se ajustan a esta descripción. Dos ejem-
En la sección 2.3 estudiamos los juegos repetidoS"; en los cuales un plos (que más adelante discutiremos con mayor detalle) so~ el mo~elo d,e
grupo determinado de participantes juegan repetidamente un determi- duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de
nado juego, habiendo observado los resultados de las anteriores rondas empleo en una empresa con fuerte implantación ~~ un smdIcato .. ?lros
del juego antes de iniciar la siguiente. El tema del análisis es que las ame- problemas económicos pueden modelarse si permItimOS una suce:J7n de
nazas y las promesas (creíbles) sobre el comportamiento futuro pueden movimientos más amplia, ya sea añadiendo más jugadores o penmllendo
afectar el comportamiento presente. Definimos el equilibrio de Nash perfecto q~e los jugadores tiren más de una vez. (El modelo de negoci~ci.ónde Ru-
en subjuegos para juegos repetidos y lo relacionamos con los resultados de binstein discutido en la sección 2.1.0 es un ejemplo de este ultImo caso.)
la inducción hacia atrásy de la perfección en subjuegos definidos en las Las característi~as clave de un juego dinámico con información completa
secciones 2.1 y 2.2. Enunciamos y demostramos el teorema de tradición y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)
oral para juegos repetidos infinitamente y analizamos el modelo de Fried- todas las decisiones anteriores son conocidas antes de tomar la deOSlon
man (1971) de colusión entre duopolistas de Coumot, el de Shapiro y
Stiglitz (1984) de salarios de eficiencia y el de política monetaria de Barro 2 Se podría permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la acción
y Cardan (1983). del jugador 1, al' Tal dependencia podría d~notarse con AZ(aI) O podna Incorporarse en la
En la sección 2.4 presentamos las herramientas necesarias para anali- función de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) = -ex:
para valores de a2
que no son fac ti'bles d al'.'
do a Algunos movimientos del Jugador 1 podnan mcluso poner . An
zar en general un juego dinámico con información completa, ya sea con al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto
informaci9n. perfecta o imperfecta. Definimos la representacipn de un de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene
juego enformaextensivaylárelacionamos con la representación en forma elección posible.
",.'.
56 / JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA (c. 2) Juegos dinámicos con información completa y perfecta / 57
siguiente y (3) las ganancias de los jugadores para cada combinación po- en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora
sible de jugadas son información del dominio público. las amenazas que no son creíbles en un sentido que definiremos con más
Resolvemos un juego por inducción hacia atrás de la siguiente forma: precisión. Veremos que pueden existir múltiples equilibrios de Nash en
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego, un juego de la clase definida por (1)-(3)" pero que el único equilibrio de
se enfrentará al siguiente problema, dada la acción al previamente adop- Nash perfecto en subjuegos es el equilibrio asociado con el resultado ob-
tada por el jugador 1: tenido por inducción hacia atrás. Éste es un ejemplo de la observación,
hecha en la sección 1.1.C, de que algunos juegos tienen múltiplesequili"
max 'u2(á.l,az). brios de Nash pero tienen un equilibrio que destaca como la soluciónmás
azEAz
llamativa del juego.
Supongamos que para cada ajen Al, el problema de optimización del Concluirnos esta sección explorando los supuestos de racionalidad
jugador 2 tiene una única solución que podemos denotar con Rz(al)' Ésta inherentes en los argumentos de inducción hacia atrás. Considere~os
es la reacción (o mejor respuesta) a la acción del jugador 1. Dado que para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos
el jugador 1 puede resolver el problema de maximización del jugador 2 veces:
tanto como el propio jugador 2, el jugador 1 debería prever la reacción del
jugador 2 a cada acción al que 1 pudiera tomar, de forma que el"problema
1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2
de 1 en la primera etapa se concreta en
para el jugador 1 y Opara el jugador 2. c.
2. El jugador 2 observa la elección de 1. Si 1 escoge D entonces 2 escoge
max 'Ul (al,Rz(al»).
alEA] J' o D', donde l' finaliza el juego con ganancias de 1 para ambos
Supongamos que este problema de optimización del jugador 1 tiene jugadores.
también una solución úlúca que podemos denominar aj. Llamaremos 3. El jugador 1 observa la elección de 2(y recuerda su propia decis~~t:J:
~
a (aj,Rz(aj» el resultado por inducción hacia atrás de este juego. El resultado la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es
por inducción hacia atrás ignora las amenazas no creíbles: el jugador 1 1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3
prevé que el jugador 2 responderá óptimamente a cualquier acción que 1 para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2
pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte respectiv~mente.,; ,
del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda ,_.; _~ : . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~¿'
etapa. Esta descripción verbal puede trélducirse al siguiente,juego en fempª.dg
Recordemos que en el capítulo 1 usamos la representación en forma árbol. (Ésta es la representación en forma extensiva que definiremos. de
. normal para estudiar juegos estáticos con información completa y hos forma más general en la sección 2.4.) La ganancia superior en el par .
concentramos en la noción del equilibrio de Nash como concepto para so- de ganancias que aparecen en el extremo de cada rama del árbol es la
lucionar tales juegos. Sin embargo, en la discusión sobre juegos dinámicos ganancia del jugador 1; la inferior es la del jugador 2, ~;,'
de esta sección no hemos hecho mención alguna ni de la representación Para calcular el resultado por inducc:ión hacia atrás de este' juego
en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una empezamos por la tercera etapa (es dear,la segunda decisión deLjugador
descripción verbal de un juego en (1)-(3) y hemos definido el resultado 1). Aquí el jugador 1 se enfrenta a una elección entre una ,ganancia de.3
por inducción hacia atrás como solución del juego. En la sección 2.4.A por medio de 1" o una ganancia de Oa trayés de 'J)"; de forma que!" ~
veremos que la descripción verbal en (1)-(3) es la representación en forma óptimo. Por tanto, en la segunda etapa, el jugador2 prevé que si él júego (,
...
,
extensiva del juego. En esta sección estableceremos la relación entre las llega a su te;cera etapa el jugador 1 escogerá J", lo que le proporcionaría
representaciones en forma extensiva y normal, y veremos que para juegos una ganancia de O.Por tanto,~n la ¡¡egunda etapala decisión del jugador 2
dinámicos la representación en forma extensiva es a menudo más con- es entre una ganancia de 1 por medio dé l' o una ganancia de Oa través de
veniente. En la sección 2.4.B definiremos el equilibrio perfecto de Nash D', de forma que l' es óptimo. Consecuentemente, eh la primera etapa el
58 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dil1tÍmicos COI1 il1formacióll completa y perfecta / 59
. dor 2 lo sea: si 1piensa que 2 podría no ser racionill,

jugador 1 prevé que si el juego llega a la segunda etapa el jugador 2 elegirá ro no que el Juga 1" O'
1', lo que le proporcionará una ganancia de 1. La elección del jugador 1 pe . ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO '. ' I" 1 tercera
en la primera etapa es, por tanto, entre una ganancia de 2 por medio de I se nda, dando con ello la oportunida~.a 1 de Jug~r. ~n.8
o una ganancia de 1 a través de D, de forma que I es óptimo. la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podría no ser racional, 1 podna. escoger /) en
pero pIensa . l
. ' tapa confiando en que 2 pensara que 1 no es raClona, y, por
, ::~:: la pnmera e "1 t El
. DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara 1 '. d D r 'parte
USO de la inducción.hacia atrás presupone que la e eCClOn e po.
eda explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu . l' . D arque 1
sin embargo, podría ser más razonable suponer que J~go ~.' .
. .'
es, efectivamente, lrraClOna . 1 En tales J'uegosel uso
, . .• de la mducClon
.. hacla
atrás pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p .'
proporclOna una solución única y no cabe esperar acuerdo alguno enbe
los jugadores.
2.1.B El mod~lo de duopolio de Stackelberg
Este argumento establece que el resultado por inducción hacia atrás Stackelberg (1934) pr!Jpuso un modelo dinámico de duopolio en el cu~l
es que el jugador 1escoge I en la primera etapa y séacaba el'juegb: Aun unae'mpresa dominante (o líder) decide primero y una empresa subordI-
cuando el uso de la inducción hacia atrás establece que el juego sé acaba nada (o seguidora) decide en segundo lugar. En al~nosmome~üos de
en la primera etapa, UIlaparte importante del'afgUiriento ftáhl dé 10 que la historia de la industria automovilística estadourudense: por ~Jel1lplo,
ocurriría si el juego no se acabase en esta primera etapa. En la segunda General Motors parece haber jugado este papel de líder. Es mmedlat.o am-
etapa, por ejemplo, cuando el jugador 2 prevé que si el juego llega a la pliar esta des~ripción al caso en que haya más de una empresa segUidora,
terc;era etapa el jugador 1 elegirá I"¡ 2 está suponiendo que 1es racional. como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos el
Este supuesto puede parecer inconsistente coil el hecho de qué 2 tiene modelo bajo el supuesto de que las empresas escogen cantidades, como en
,.'0
la oportunidad de decidir en la segunda etapa sólo si 1 se desVÍa del el modelo de Coumot (donde las empresas deciden simultáneamente en
resultado obtenido por inducción hacia atrás. Es decir, puede parecer que . ente como aqUlO. DeJ'amos como ejercicio el desarrollo
veZ d e suceSlvam ,
si 1juega D en la primera etapa, 2 no puede suponer en la segunda etapa de un modelo de tomas de decisiones sucesivas en el que las empresas
que 1 sea racional, pero 'esto no es, así: si 1 juega D, en la primera etapa . s tal como
escogen 1os preclO " lo hacen (simultáneamente)
' ' . en el modelo ele
está claro que no puede ser información del dominio público que los dos
Bertrartd. ,
jugadores sean racionales; pero existen razones para que 1escogietaD El desarrollo temporal del juego es el sig'uiente: (1) La empresa 1
que no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidad
1 a d ql >
escoge una can t'd _ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
es que sea información del dominio público que el jugador 1 es racional una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
3 Recordemos deI a discusión sobre l~elimiración itera tiva de las,.•"~tr~tegiasest:ric~~~ente

función de beneficio
dominadas (eIlla sección 1.1.,B),que es Ílúormación del domirti9pÚblicó que Io~ jug-adores
son racionales si todos los jugadores son ráciomiiés, y si todos los jugadófes S¡¡Í5~ft'qUe'tódos '7ri(q;,qj) = qi[P(Q) - el,
los jugadore,s son racionales y si todoS los jugadores saben que,todoslos jugadores sálJeñ que
lodos los jugadores son racionales, etc; adinjiilÍtum. , . ':! ",' donde P(Q) a - Q es el precio de equilibrio de mercado cuando la
60 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos dinámicos con información completa y perfecta I 61
cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de Recordemos que en el equilibrio de Nash del juego de Cournot del
producción (siendo cero los costes fijos). capítulo 1, cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregada
Para hallar el resultado por inducción hacia atrás de este juego, calcu- obtenida por inducción hacia atrás en el juego de Stackelberg, 3(a - e)/4,
lamos en primer lugar la reacción de la empresa 2 a una cantidad arbitra- es mayor que la cantidad agregada en el equilibrio de Nash del juego de
riamente fijada por la empresa 1. R2(ql) es una solución de Cournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado es
inferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelberg
maX7r2(ql,q2)==maxq2[a - ql - q2 - el, la empresa 1 podía haber escogido la cantidad correspondiente al juego
Q22:0 qz 2:0
de Coumot, (a - e)/3, en cuyo caso la empresa 2 habría respondido con su
lo que resulta en
cantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1
a-ql-e podría haber alcanzado el nivel de beneficios de Coumot, pero escogió no
R2(ql) ==" 2 ' hacerlo, por lo que los beneficios de la empre~a 1 en el juego de Stackelberg
siempre, queql < a-e .. La misma' ecuación pár_aR2(ql) apareCiÓ en deben'ser mayores que sus beneficios en el juego de Cournot. Pero el
nuestro aniilisisdél' juego de Coumot con' qecisiones sinlultáneas en la precio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que ros
sección D.A. La diferencia' es que aquí R2(iJ.~)e~~eal~e~:lte la reacción beneficios agregados son menores. Por tanto, el hecho de que la empresa
por parte de la~mpresa 2:á la cailtidadobservad~ que fijala empresa i, 1 esté mejor implica que la empresa 2 está peor en el juego de Stackelberg
mientras que en el análisis de Coumot R2(qI) es la mejor respuestacle h:i queen el jueg() de Coumot.
empresa 2 a una cantidad hipotética que'será sil!lultáneamenteescogida La observación de que la empresa 2 se encuentra en peor situación en ..
' ,"
por la empresa 1. '." el juego de Stackelberg que en el juego de Coumot ilustra una diferencia
Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa importante que existe entre los. problemas de decisión uni cimultiperL
2 tantoc0fi.lo,.l.a,propia e~p¡'~~a 2, I~, e0presá 1debería prever q~e ia sonale~:. En la teoría de la decisión con un único agente, eltenermás .
elección:'del~éantidad ql coinCidirá co"nla reaéciónR2(ql)' Por tanto, el información nunca puede hacer que el agente decisor esté peor. En teorÍa
problema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en de juegos, sin embargo, tener más información (o más precisamente, que ".
otros jugadores sepan que uno tiene más información) puede hacer que un
"maX7fl (ql,R2(ql») ==maxqIfa - ql - R2(qi) -:- el jugador esté peor. '
'_Q¡2:0, ,.' ,.' Ql2:0 • . . '. .
.. a- ql.""'"C Eil el juego de Stackelberg, la información en cuestión es la cantidad
==maxql '2 . ,.
de la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)
Q¡2:0 .
lo que resulta' en la empresa 1 sabe que la empresa 2 conoce ºl' Para ver el efecto que'
esta información tiene, consideremos un,juego de decisión suc~siva algo
a-c a-c distinto, en el que la empresa 1 escoge qr, después de lo cual la empresa
qi == -. -2- Y R2(qi) ==-4-
2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 cree
que es el resultado por inducción hacia atrás del juego del duopolio de que la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, la
Stackelberg.4 '.. '. mejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si la
empresa 1 prevé que la empresa 2 creerá que ello vaya a ser así y, por tanto,
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren típicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mención escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en (a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg
vez de ~u:nultáneas. Sin embargo, como se ha constatado en la secciÓ'nanterior, los juegos (a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1
con deaslones sucesivas poseen a menudo múltiples equilibrios de Nash, de los cuales sólo
uno está asociado can el resultado obtenido por inducción hacia atrás del juego, Por tanto, el
escoja su cantidad de Stackelberg. Más bien, el único equilibrio de Nash de
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al este juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,
uso de unrnterio de solución más poderoso que el mero equilibrio de Nash. precisamente el equilibrio de Nash del juego de Cournot, en el que las dos
62 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dinámicos con infonlwción completa y perfecta / 1\3
empresas deciden simu1táneamente.5 Por lo tanto, que la empresa 1 sepa cuya condición de primer orden es
que la empresa 2 conoce q¡ va en contra' de la empresa 2.
R'(L) - w = O.
2.1.C Salarios y nivel de empleo en una empresa con fuerte
implantación sindical / Pendiente = w
R
En el modelo de Leontief, (1946) de relación entre una empresa y un
único sindicato (es decir, un sindicato que tiene el poder de monopolio de R(L)
ofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vo
sobre los salarios, pero la empresa tiene el ¿Ónrrolexclusivo del nivel de
empleo. (Conclusiones cualitativamente similares emergen en un modelo
más realista en el cual la empresa y el sindicato negocian los salarios,
pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) La
función de utilidad del sindicato es U(7JJ,L), donde w es el salario que el
sindicato pide a la empresa y L es el nivel de empleo. Supongamos que
U(w,L) es creciente en los dos argumentos w y L. La función de beneficios
L * (w) L
de la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos que
la empresa obtiene si emplea L trabajadores (y toma de forma óptima las
correspondientes decisiones de producción y de estrategia de mercado). Figura 2.1.1
Supongamos que R(L) es creciente y cóncava;
Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato Para garantizar que la condición de primer orden R'(L) -w =. O ~enga
efectúa una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yes- solución, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
coge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L). figura 2.1.1.
Podemos decir bastantes cosas sobre el resultado por inducción hacia atrás La figura 2.1.2 representa L * (w) en función de tu (pero ~tiliza l~s e!es
de este juego, aun sin haber supuesto ninguna forma funcional concreta de forma que faciliten la comparación con gráficos postenores) e lnchca
de U(w,L) y R(L), pero no podemos calcular el resultado explícitamente. que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
. En primer lugar caracterizamos la mejor respuesta de la empresa en la en su punto máximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
etapa (2), L*(w), a una demanda salarial arbitraria por parte del sindicato mejor cuanto menor sea w, de forma que las curvas :sobenefIClo ¡Dfenores
en la etapa (1), w. Dado w, la empresa escoge el nivel L*(w) que soluciona representan niveles de beneficio más altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato está tanto mejor cuanto más alto sea w, de forma que las curvas
max7r(w,L) =maxR(L) - wL, de indiferencia más altas corresponden a niveles de utilidad mayores del
L2:0 L2:0
sindicato.
6 Esta última propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
5 Esto es un ejemplo de la afirmación hecha en la sección 1.1.A:en';,n Juego en forma normal dado 'UJ. Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
los jugadores escogen sus estrategias simultáneamente, pero ello no implica necesariamente' concreta en la elección de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
que actúen simultáneamente; es suficiente con que cada uno tome su decisión sin conocer las beneficio posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
decisiones de los demás. Véase la sección 2.4.A para más discusión sobre esta cuestión. (L,u/) sea tangente a la restricción 'UJ = 1J)'.
64 / JUEGOS DfNAMICOS CON INFORÑ1ACIÓN COMPLETA (c. 2)
Juegos dinámicos con información completa y perfecta / 65
w L *(w)
' ...'
w Curva de indiferencia
del sindicato
w*
L*(w)
L
Curvas de isobeneficio de la empresa
L* (w*) L
Figura 2.1.2
'Figura 2.1.4.
,
'.
w En términos de las curvas de indiferencia representadas en la figura
2.1.3, al sindicato le gustarla escoger la demanda salarial w que propor- ',.,.,'
cione un resultado (w,L * (w» que esté en la curva de indiferencia más alta
posible; La soluciÓn al problema del sindicato es w*, la demanda salarial
que hace que la curva de indiferencia del sindicato que pasa por el punto
(w*,L*(w*» sea tangente a L*(w) en ese punto (véase la figura 2.1.4)'- Por
lo tanto, (w* ,L*(w*» es el resultado por inducción hacia atrás de este juego "~o
de salarios y nivel de empleo.
Es fácil ver que (w* ,L * (w*» es ineficiente: tanto la utilidad del sindi-
L
cato como los beneficios de la empresa aumentarían si w y L estuvieran en
Curvas de indiferencia del sindicato la región sombreada de la figura 2.1.5. Esta ineficiencia hace que resulte
difícil de entender que en la práctica las empresas parezca que retienen
Figura 2.1.3 el control exclusivo sobre el nivel de ocupación. (Si permitimos que la
empresa y el sindicato negocien los salarios pero mantenemos el control
exclusivo de la empresa sobre el nivel de empleo obtenemos un resultado
Consideremos ahora el problema del sindicato en la etapa (1). Dado igualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicación
que el sindicato puede resolver el problema de la.empresa en la segunda a este enigma basada en el hecho de que el sindicato yla empresa negocian
etapa, tanto como la propia empresa, el sindicato deberla prever que la repetidamente a lo largo del tiempo (normalmente cada tres años en Esta-
reacción por parte de la empresa a su demanda salarial w será escoger el dos Unidos). En ese juego repetido, siempre que la elección de.w por parte
nivel de empleo L*(w). Por tanto, el problema del sindicato en la primera del sindicato y la elección de L por parte de la empresa caigan en la región
etapa se concreta en
sombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esos
'.: .'
valores de w y L no pueden ser el resultado por inducción hacia atrás de

maxU (w,L*(w»).
lU~O
un~ única negociación. Consúltese la sección 2.3 sobre juegos repetidos y
el ejercicio 2.16 sobre el modelo de Espinosa-Rhee.
66 1 JUEGOS OlNÁMIC05 CON INFORMACIÓN COMPLETA (e. 2)
luegos dilllím.icos con información completa y I",rleeta i 67
w Una descripción más detallada de la secuencia temporal del juego de

Curva de beneficio tres periodos es la siguiente:
w* de la empresa
(la) Al principio del primer periodo el jugador 1 propone quedarse con
una fracción SI de una peseta, dejando 1 - SI para el jugador 2.
(lb) El jugador 2 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias SI y 1 - 81 inmediatamente) o
rechazarla (en cuyo caso el juego pasa al segundo periodo).
(2a) Al principio del segundo periodo el jugador 2 propone que el juga-
L * (w*) L dor) se quede con una fracción 82 de una peseta, dejando 1 ~ 82 para
el jtÍgador 2. (Nótese la convención de que 8t corresponde s_iempre
al jugádor 1, sea quien sea quien hace la oferta.)
Figura 2.1.5
(2b) El jugador 1 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias 82 y 1 - 82 inmediatamente) o
2.1.D Negociación secuencial
rechazarla (en cuyo caso el juego pasa al tercerperiodo).
(3) Al principio del tercer periodo el jugador 1 recibe una fracción 8 de
Empezamos con un modelo de negociación de tres periodos perteneciente
una peseta, dejando 1 - S para el jugador 2, donde O < s < 1.
a la clase de juegos estudiada en la sección 2.1.A. Pasamos luego a dis-
cutir el modelo de Rubinstein (1982), en el que. él número de periodos En este modelo de tres periOdos, el acuerdo a:Lque se llega en el tercer
. es (potencialmente) infinito. En ambos modelos se llega a un acuerdo periodo (s,1 - s) está fijado exógenamente. En el modelo con horizonte
inmediatamente, no hay negociaciones prolongadas (como huelgas). En infinito que consideraremos más tarde, la ganancia 8 del tercer periodo
el modelo de Sobel y Takahashi (1983) de negociación secuencial con representa la ganancia del jugador 1 en lo que queda del juego si se llega
información asimétrica, en cambio, pueden ocurrir huelgas en el único al tercer periodo (esto es, si las dos primeras ofertas son rechazadas).
equilibrio (bayesiano perfecto) con probabilidad positiva (véase la sección Para calcular el resultado por inducción hacia atrás de este juego de
4.3.B). tres periodos, calculamos en primer lugar la oferta óptima por parte del
Los jugadores 1 y 2 negocian el reparto de una peseta. Hacen ofertas se
jugador 2 si llega al segundo periodo. El jugador 1 puede recibir .5en el
alternativamente: primero el jugador 1 hace una propuesta que el jugador tercer periodo rechazando la oferta S2 del jugador 2 en este periodo, pero
2 puede aceptar o rechazar; si 2la rechaza, hace una propuesta que 1 puede el valor en este periodo de recibir s en el periodo siguiente es sólo 8s. Por
aceptar o rechazar, y así sucesivamente. Una vezqúe una oferta ha sido tanto, el jugador 1 aceptará S2 si y sólo si 82 :::::ós: (Suponemos gue cada
rechazada, deja de ser vinculante y es irrelevante en las siguientes rondas jugador aceptará una oferta si es indiferente entre aceptarla o rechazarla.)
del juego. Cada oferta corresponde a UIÍ. periodo y los jugadores son El problema de decisión del jugadOr 2 en el segundo periodo, por tanto,
impacientes: desCuentan las ganancias obtenidas en periodos posteriores se concreta en escoger entre 1 - ós en este periodo (ofreciendo 82 = ós al
de acuerdo con el factor Ó, donde O <ó < 1.7 - jugador 1) o recibir 1 - s en el siguiente periodo (ofreciendo al jugador 1
cualquier S2 < ós). El valor descontado de la última opción es ó(l - s),
7 El factor de descuento Ó reflejá el' valór temporal del dinero. Una peseta: recibida al que- es menor que 1 -Os obtenible por medio de la primera opción, de
principio deun periodopúede ingresarse en un bancoy proporcionar intereses, digamos-que
a-un tipo r por periodó y, por tanto, tendrá ún válor de 1 + r pesetas al principio deÍ periodo
forma quela oferta óptima del jugador 2 en el segundo periodo es 8i = ,)8.
siguiente, De forma equivalente, una peseta que se reciba al principio del periodo siguiente Por tanto, si el juego llega al segundo periodo, el jugador 2 ofrecerá si y
tiene ahora un valor de sólo 1/0 + r) pesetas. Sea Ó =' 1/0 + r); entonces úna ganancia el jugador 1 aceptará .
.". obterlida en el próximo periodo tiene ahora ahora un valor de sólo 6.".; una ganancia 7f
obtenida dentro de dos periodos tiene ahora un valor de s6lo 62."., yasísucesivaI'nente. El
Dado que el jugador 1 puede resolver el problema del jugador 2 en
valor actual de una ganancia futura recibe el nombre de valor futuro de esa ganancia._ el segundo periodo tan bien como el propio jugador 2, el jugador 1 sabe
68/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos en dos etapas de información / 69
que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando por inducción hacia atrás, el jugador 1 ofrecerá el acuerdo (j(s),l- f(s»
'"
la oferta S] del jugador 1 en este periodo, pero el valor en este periodo de en el primer periodo y el jugador 2 aceptará, donde fes) = 1 - 50 - os)
1',
recibir 1 - si el periodo siguiente es sólo de 50 - si). Por tanto, el jugador es la fracción del jugador 1 en el primer periodo del juego anterior de tres
2 aceptará 1 - s] si y sólo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). El periodos cuando el acuerdo (s,1 - s) se imponía exógenamente en el tercer
problema de la decisión del jugador 1 en el primer periodo, por tanto, se
periodo.
concreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo
Sea s A la ganancia más alta que el jugador 1 puede recibir en cualquier
1- SI = 50-si) al jugador 2) o recibir si en el próximo periodo (ofreciendo
resultado por inducción hacia atrás del juego completo. Consideremos el
cualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la última
uso de SA como la ganancia del jugador1 en el tercer periodo, tal como
opción es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obtenible
lo hemos descrito anteriormente; esto producirá un nuevo resultado por
por medio de la primera opción, de forma que la oferta óptima del jugador
inducción hacia atrás en el que" la ganancia en el primer penado del
1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58).'Por tanto, en
jugador 1 es fCsA).Dado que fes) = 1- 5 + 02Ses creciente'en s; f(sA)
el resultado por inducción hacia atrás de este juego de tres periodos, el
es la ganancia en el primer periodo más alta posible; ya quesA es la
jugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.
ganancia más alta posible en el tercer periodo. Pero SA es también la
Consideremos ahora el caso en que el horizonte es infinito. El desarro- ganancia más alta posible en el primer periodo; de forma que!(sA) =
llo temporal es el mismo que hemos descrito anterio~ente, excepto que el SAo Argumentos similares demuestran que f(sB) = SB, donde SB es la
acuerdo exógeno del paso (3) esreemplazado por una sucesión infinita de ganancia más baja posible que el jugador 1 puede obtener en cualquier
pasos (3a), (3b), (4á), (4b) yasísuéesivamerite. El jugador 1 hacela"oferta resultado por inducción hacia atrás del juego completo. El único valor de
en los peripdiJsÍII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:ión con~ s que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;
tinúa hasta que un9 elelos dos jugadore~ acepta,un¡t9f~rta. Nos gustaría sA = SE 0= s. de forma que, existe un único resultado por inducción hacia
hallar el resultado PO! inducción pacia atrás de esteJuego pe horizonte atrás d~l juego completo: en el primer periodo el jugador 1 ofrece un
infinito moviél}-dcmoshacia atrás, tal como lo hemos hecho en los casos acuerdo (s' = 1/(1+0),1- s'" = 5/0 + o» al jugador 2, quien acepta. \.'
analizados hasta ahora. Sin embargo, co~oel jueg~podría continuar
,é
hasta el infinito, no existe un último momento a partir del cual iniciar tal '" ,
análisis. Afo~nadamente, la,siguiente idea (aplicada.()riginalmente por 2.2 Juegos en dos etapas con información completa
Shaked y Sutton [1~84])nos permité truncar el juego de horizonte infinito .pero imperfecta :, -
y aplicar la lógica del Giso'en el que ell10rizonte ~. fuíi:to:el juego q~e
empieza en el,tercer periopo (si se alcanza) es idéntico al jueg~ completo
2.2.A.Teoña: Perfección en subjuegos .
(empezando desde el primer periodo); en ambos cas~s el jugador 1 hace
la primera oferta, los jugadores se alternan haciendo las siguientes ofertas
Enriquecemos ahora la clase de juegos analizacia eIlla sección anterior: ,~ "
y la .negociación continúa hasta que un jugador acepta una oferta.

Como en los juegos dinámIcos con información completa y perfecta, conti-
Dado que no hemos definido formalmente el resultado por inducción nuamos suponiendo que el jUego sigue una sucesión de etapas, habiendo
hacia atrás de este juego 'de negociación con horizonte infinito, nuestros én
los jugadores observado las decisiones formadás~ las etapas previas an-
argumentos serán informales (pero pueden formalizarse). Supongamos tes del comienzo de una nueva etapa. Sin embargo, a diferencia de los
que existe un resultado por inducción hacia atrás del juego completo en juegos analizados en la sección anterior, peImit:iritos qúe haya decisiones
el que los jugadores- 1 y 2 reciben las ganancias s y 1 - s respectivamente. simultáneas en cada etapa ..¡ t:omo explicaremos ,en la sección 2.4; esta
Podemos utilizar estas ganancias en el juego que empieza en el tercer simultaneidad de decisiones significa que los juegos analizados en esta
periodo, si se alcanza, y proceder entonces hacia atrás hasta el priíner pe- sección tienen información imperfecta. Noobstante, estos juegos compar-
nodo (como en el juego de tres periodos) para calcular un nuevo resultado "ten características importantes con los"juegos con irLformación perfecta
por inducción hacia atrás del juego completo. En este nuevo resultado considerados en la secclónanterior.
'70 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos elldos etapas de illfomwciólI I TI
Analizaremos el siguiente juego sencillo, al cual (sin mucha inspi- 1. Los jugadores 1 y 2escogen simultáneamente las acciones 1/,1 y "-z de
ración) llamaremos juego en dos etapas con información perfecta pero los conjuntos factibles Al Y Az respectivamente.
incompleta: 2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z» parai = 1,2.
1. Los jugadores 1 y 2 escogen simultáneamente las acciones al y az de

Supongamos que (0.1,0.2) es el único equilibrio de Nash de este juego de
los conjuntos factibles Aly Az respectivamente.
decisiones simultáneas. Llamaremos a (o,i,0,2'0.; (al' 0.2),0,4 (al ,(1,2» resultado
2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), y
perfecto en subjuegos de este juego en dos etapas. Este resultado es el
escogen entonces simultáneamente las acciones 0.3 y 0.4 de los conjuntos
ánalogo natural del resultado por inducción hacia atrás en los juegos con
factibles A3 y A4 respectivamente. . ~
información completa y perfecta, y esta analogía se refiere tanto a sus
3. Las ganancias sonui(al,az,a3,a4) para i = 1,2,3,4.
canieterísticas atractivas como a las que no lo son tanto. Los jugadores 1 y
Muchos problemas económicos se ajustan a esta descripción.8 Tres ejem- 2 no deberían creer ninguna amenaza por parte de los jugadores 3 y 4 que
plos (que discutiremos más adelante con mayor detalle) son los pánicos correspondiera a acciones que no fueran el equilibro de Nash del juego
bancarios, los aranceles y la competencia internacional imperfecta y los que queda en la segunda etapa, ya que cuando el juego llegue realmente a
torneos (por ejemplo, la lucha entre varios vicepresidentes de una empresa la segunda etapa, al menos uno de los jugadores 3 o 4 no querrá cumplir su
por ser el próxüno presidente). Otros problemas e~xJl1ómicospueden mo- amenaza (precisamente porque no es un equilibrio de Nash del juego que
delarse si permitimos una mayor complejidad, ya sea añadiendo más queda en la segunda etápa).Por otra parte, supongamos que el jugador
jugadores o permitiendo que los jugadores jueguen en más de una etapa. 1 es también el jugador 3, y que el jugador 1 no juega 0'1 en la primera
Podría incluso hab~r~enos jugadores: en algunas aplicaciones.los juga- etapa: el jugador 4 puede querer entonces reconsiderar el supuesto de que
dores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 no el jugador 3 (es decir, el jugador 1) jugará a;(0,1,o.Z) en la segunda etapa.
aparece.
Resolvemos un juego de esta clase utiÍizando un enfoque parecido 2.2.B Pánico bancario
~!_qe la inducción haci~ atrás, pero est~ vez, el primer paso quedamos
cuando nos movemos hacia atrás desde el final del juego exige la reso- Dos inversores han depositado cada uno de ellos una cantidad D en un
lución de un juego real(el juego siinultáneoentre los jugadores 3 y 4 en banco. El banco ha invertido estos depósitos en un proyecto a largo plazo.
la segUnda etapa, dado el resultado de la primera etapa) en vez de re- Si el banco se ve obligado a liquidar su inversión antes de que el proyecto
solver un problema de optünización para un único individuo como en la venza, puede recuperar un total de 2r, donde D > r > D /2. Sin embargo,
sección anterior. P.arano complicar las cosas; supondremos en esta sección si el banco deja que la inversión llege a su vencimiento, el proyecto rendirá
que para cada resultado factible de la primera etapa, (0.1,0.2), el juego que un total de 2R, donde R > D.
queda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene un Existen dos fechas en las cuales los iiwersores pueden sacar dinero del
único equilibrio de Nash que denominam()s (a;(al,az),a¡(al,az». É~ la banco: la fecha 1 es anterior al vencimiento de la inversión del banco, la
sección 2.3.A (sobre juegos repetidos) consideramos las consecuencias de fecha 2 es posterior. Para simplificar, supondremos que no hay descuento.
prescindir de este supuesto. Si ambos inversores sacan dinero en la fecha 1, cada uno recibe r y el juego
Si los jugadores 1 y 2 prevén que el comportamiento en la, segunda se acaba. Si sólo un inversor saca dinero en la fecha 1, ese inversor recibe
etapa de los jugadores 3 y 4 vendrá dado por (a;(al,a2~,-a¡(al,az», la in- D, el otro recibe 2r - D Y el juego se acaba. Finalmente, si ninguno de
teracción entre los jugadores 1 y 2 en la primera etapa se concreta en el los inversores saca dinero en la fecha 1, el proyecto JJega a su vencimiento
siguiente juego de decisiones simultáneas: y los inversores deciden si sacar el dinero o no en la fecha 2. Si los dos
inversores sacan el dinero en la fecha 2, cada rula de ellos recibe R y el
8 Como en la sección anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 en
la segunda etap~, A:>! A4, podrían depender del resultado de la primera etapa (al,a2)' En
juego se acaba.' Si sólo un inversor saca el dinero en la fecha 2, ese inversor
particular, podnan eX1stirvalores (al,a2) que finalizaran el juego. recibe 2R - D, el otro recibe D y el juego se acaba. Finalmente, si ninguno
•.. ,:'
-
72 / JUEGOS DINÁMICOS CON INFOJ<MAClÓN COMPLETA (c. 2)
JlIegos en dos etapas de infonnación / 73
de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha
inversor y el juego se acaba. 1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) en
En la sección 2.4 discutiremos cómo representar formalmente este la fecha 2.
juego. Sin embargo, por ahora procederemos de modo informal. Repre-
sentemos las ganancias de los dos inversores en las fechas 1 y 2 (en función
de sus decisiones sobre sacar dinero en esas fechas) con el siguiente par Sacar No sacar
de juegos en forma normal. Nótese que el juego en forma normal co- Sacar r,r D,2r - D
rrespondiente a la fecha 1 no es típico: si ambos inversores escogen no
No Sacar 2r - D,D R,R
sacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que los
inversores pasan al juego en forma normal correspondiente a la fecha 2.
Figura 2.2.1
Sacar No sacar
Sacar T,T D,2r-'--D El primero de estos resultados puede interpretarse. como el de un
pánico bancario. Si el inversor 1 cree que el inversor 2 sacará su dinero
No Sacar 2r - D,D siguiente etapa
en la fecha 1, su mejor respuesta es sacar también el dinero, aun cuando
Fecha 1 a ambos les iría mejor si esperasen a la fecha 2 para sacar el dinero. Este
juego del pánico bancario difiere del dilema de los presos discutido en el
. capítulo 1 en un aspecto importante: ambos juegos poseen un equilibrio de:
Sacar No sacar Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.a
de los presos éste es el único equilibrio (y loes en estrategias dominantes),
Sacar R,R 2R- D,D
mientras que en este juego existe también un segundo eqUilibrio qúe
NoSacar D,2R - D, R,R es eficiente. Por tanto, este modelo no predíce cuándo va a ocurrir un
pánico bancario, pero muestra que es un fenómeno que'p~~de ocurrir en
Fecha 2
equilibrio. Véase un modelo más rico en Diamond y DybVig (1983):.
Para analizar este juego procedemos hacia atrás. Considérese el juego
/, -,
en forma normal correspondiente a la fecha 2. Como R > D (y por 2.2.C Aranceles y competencia internacional imperfecta
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un único equilibrio de Nash de este juego: ambos inversores Nos ocupamos ahora de una aplicación de economía internacional. Con-
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay sideremos dos países idénticos, que denominamos con i = 1,2. Cada país
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en tiene un gobierno que escoge un arancel, una empresa que produce tanto
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1. para el consumo interno como para la exportación y unos consumidores
Dado que r < D (y por tanto 2r - D < 1'), esta versión de un periodo del que compran en el mercado interno, ya sea de la empresa nacional o efe
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras: la extranjera. Si la cantidad total en el mercado del país i es Qir el precio
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias de equilibrio del mercado es Pi(Qi) = a - Q.¡. La empresa del país i (que
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a en adelante llamaremos empresa ~)produce hi para el consumo interior
unas ganancias de (R,R). Por tanto, el juego original del pánico bancario y ei para la exportación. Por tanto, Qí = hí + ej. Las empresas tienen
de dos periodos tiene dos resültados perfectos en subjuegos (y, por tanto, un coste marginal constante e y no tienen costes fijos. Por tanto, el coste
no se ajusta totalmente a la clase de juegos definida en la sección2.2.A): total de producción de la empresa i es Cí(hí,ei) = c(hí + eí). Las empresas
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas también incurren en un coste arancelario sobre las exportaciones: si la
.,
74 I JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA Ce. 2) fllegos eH dos etapas de ill{omlOcíó/I I 75
empresa iexporta ei al país ,7 cuando el gobierno j ha establecido una tasa Suponiendo que e; :::;a - c, tenemos que
arancelaria de tj, la empresa i debe pagar tjei al gobierno j,
• 1( ,,)
, El desarrollo temporal del juego es el siguiente: Primero, ambos go- 11,; = '2 a - ej - e , (22,1)
bIernos escogen simultáneamente las tasas arancelarias tI y t2. En se-

gundo lugar, las empresas observan las tasas arancelarias y escogen si- y suponiendo que 11,; :::; a - e - tj, tenemos que
m~:áneamente las cantidades para el consumo interno y para la expor-
tacIOn, (hI,eI) y (h2,e2). En tercer lugar, las ganancias son los beneficios ei• = '2
1('o, - 1*
tj - e - tj ) . (2.22)
..... de la empresa i y el bienestar total del gobie.r:noi, donde el bienestar total

...,.' (Los resultados que derivamos son coherentes con ambos supuestos,) Las
,
del país i es la suma de los excedentes de los consumidor~s9 del país i,
dos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse para
los ~eneficios recibidos por la empresa i y el ingreso arancelario que el
cada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incógnitas
gobIerno ~recauda de la empresa j:
(hi,ei,hi,ei). Afortunadamente, este sistema de ecuaciones puede simpli-
1r'i(tútj,hi,eúhj,ej) =[0. - (hi+ ej)Jhi + [a - (ei + hj)Jei
ficarse dividiéndose en dos grupos de dos ecuaciones con dos incógnitas,
Las soluciones son
- c(hi + e;) - tjeú
", 1 h~ = + ti • 0.- C - 2tj
Wi(tútj,h"e"hJ,ej) ='2Qf + 1r'i(ti¡tj¡hi,ei,hj,ej) + tiej,
0.- C
y ei = 3 (2,23)
, '3
Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si Recordemos (en la sección 1.2.A) que la cantidad de equilibrio escogida
es un equilibrio de Nash del juego (de dos mercados) restante
(hj,ej,hi,ei) por las dos'empresas en el juego de Cournot es (a - c)/3, pero que este
entrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar resultado se obtuvo bajo el supuesto de costes marginales simétricos. En
el equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelarias
de los gobiernos hacen que los costes marginales sean asimétricos (como
'!'~ en el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal ele
Como 1r'i(t"tj,h"e"h;,e;) puede escribi~e como la sum~ de los benefi- la empresa i .es c, pero el delaempresa j es c + ti. Como el coste de la
~io,sde la empresa i en ~l.mercado i (los cuales son función de hi y e; empresa j es más alto, ésta quiere producir menos .. Pero si la empresa j
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cua- va a producir menos, el precio de ,equilibrio será'.Il~J~al~~,deforma que la
les son función, de ei, h;.y tj. únicamente), el problema de optimización empresai querrá producir más, en cuyo caso la empresa j querrá producir
en los dos mercados para la empresa i se simplifica al separarse en dos menos todavía. Por tanto, en equilibrio, hi crece con ti y e; decrece (a un
problemas, uno para cada mercado: hi debe solucionar ritIno más rápido) con ti, como indica (2.2.3).
Una vez resuelto el juego entre las dos empresas que queda en la
, max hi[a - (hi + eJ~)- cL segunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,
.-~ h,::::O ' ,
podemos ahora representar la interacción entre los dos gobiernos en la
y ei debe solucionar primera etapa con el siguiente juego de decisiones simultáneas. Primero,
los gobiernos escogen las tasas aran,celarias tI y t2 simultáneamente. En
maxei[a - (ei + 11,*) - el - te'. segundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei) para el gobierno
<,::::0 J J '
i = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),
Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.
9 S' .
1 un consUffildor compra un bien a un, precio,p cua~dohab'ríá estado dispuesto a Para simplificar la notación, suprimiremos la dependencia de 11.; de f'i
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deináilcla inversa
y de ei de tj: con W;(ti,tj)genotamos a Wi(ti,tj,hi,ei,hi,ei), la ganancia
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr del gobierno i cuando eS.<;9ge1a tasa arancelaria ti, el gobierno .i escoge t j
/,-.
76/ JUEGOS DINÁJVlICOS CON INFORMACIÓN COMPLETA Ce. 2) Juegos en dos etapas de información / 77
y las empresas i y jse comportan según el equilibrio de Nash dado por del libre comercio). (Si es factible tener aranceles negativos, es decir,
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos, subsidios, el óptimo social consiste en que los gobiernos escojan tI =
entonces, para cada i, ti debe solucionar t2 = -(a - e), lo que hace que la empresa nacional no, produzca nada
para el consumo interior y exporte la cantidad de competencia perfecta
max W;*(ti,t*). al otro país.) Por lo tanto, dado que las empresas i y j se comportan
ti~O )
según el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,
Pero W;*(t¡,tiJ es igual a
la interacción entre los gobiernos en la primera etapa es un dilema de los
presos: el único equilibrio de Nash lo es en estrategias dominantes, y es ... ".
(2(a - e) - ti? + (a - e + ti)2 + (a - e - 2t~?
1 + t(a
t
- e - 2t)1 socialmente ineficiente.
18 9 9 3'
por tanto 2.2.0 Torneos
a-e
t~ =--
, 3 Consideremos a dos trabajadores y su capataz. El producto del trabaja-
dor i (i = 1 o 2) es Yi = ei + Eú donde ei es esfuerzo y Ei es ruido. El
para cada i, independientemente de tj. En consecuencia, en este modelo
proceso de producción es el siguiente: Primero, los trabajadores escogen
escoger una .tasa arancelaria de (a - e)j3 es una estrategia dominante
simultáneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
de cada gobIerno. (En otros modelos, por ejemplo cuando los costes
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
margInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos no
de acuerdo con una función dedensidad f(E) con media cero. Entercer
son domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3) obtenemos
lugar, el producto de los trabajadores es obsen:ado pe~ono su e~fu~i~o~
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
hi = 4(a -:-e) e~ = a - e
9 y , 9 han producido, pero no (directamente) de su esfuerzo.
como las cantidades escogidas por las empresas en la segunda etapa. Por Supongamos que el capataz decide inducir a los trabajadores a esfor-
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es zarse más y para ello les hace competir en un torneo;.tal y como origi-
(ti =5 =(a - e)j3,hj=hi= 4(u-:- e)j9,ej = ei = (a --' e)j9)~ ' nalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
En el resultado perfecto en subjuegos, la cantidad agregada en cada vencedor del torneo (es decir, el trabajador quemás:produica)eswA;"el
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido salario recibido por el perdedor es WB. La ganancia:deun trabajador que
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mer- reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
cado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cour- desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
not. Por tanto, el excedente de los consumidores en el mercado i (el cual, g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
como hemos visto anteriormente, es simplemente la mitad del cuadrado Transcribimos ahora esta aplicación'a lostérininos de la clase de juegos
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos discutida en la sección 2.2.A. El capat~~'~"eIRíg~dor 1~cuya acción al es
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que escoger lbs salarios W A y W B que se pagarán en el torneo. No hay jugador
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles 2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
Iguales a cero son socialmente óptimos en el sentido de escogidos en la primera etapa y deci~e,!-1~n.t,?~cessünultáneamente sus
acciones a3 Y a4, es decir los esfuér~o~'~l'y'é~:(Consideraremos más áde-
max W¡(t],t2) + Wi(t2,tl),
tl,t2~O lO Para no complicar la exposición de esta aplicación; ignoramos varios detalles técnicos,
tales como las condiciones bajo las cuales la 'condición de primer orden del trabajador es
de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdo
suficiente. No obstante, el análisis eXige illI mayor cálculo de probabilidades que en los casos
en el que se comprometan a eliminar los aranceles (es decir, en favor anteriores. Esta aplicación puede saltarse sin pérdida de continuidad. '
Juegos el1 das etapas de ¡,¡[anuacirÍu ! 79
78 / ]VEGaS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
Prob{Yi(e;) > Yj(ej)} =Prob{Ei > ej + éj - e;}
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por , ' =1 Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
tanto también los salarios) es función no sólo de las decisiones de los ju- . €j
gadores sino también de los términos de ruido El y (.2,operaremos con las

ganancias esperadas de los jugadores.
= /[1 - J
F(ej - ei + Ej)JJ(Ej)dEj,
,',' Supongamos que el capataz ha elegido los salarios WA y WB. Si el

-_:;,' de forma que la condición de primer orden de (2.2.5) se convierte en
par de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entre
los trabajadores, para cada i, ei ha de maximizar el salario esperado del
trabajador i menos la desutilidad del esfuerzo: ei debe ser una solución
dell
(WA - WB) LJ
J(e; - ei + Ej)f(Ej)dEj = g'(ei)'
En un equilibrio de Nash simétrico (es decir, ei = ei = e') tenemos que
max WA Prob{Yi(ei) >

e,,,=O
, = (WA - WB)
Yj(e;)} + 1)1B Prob{Yi(ei) ::; YjCe;)}
Prob{Yi(ei) > Yj(e;)} + WB

,,',
~ g(ei),
-' g(ei)
(2.2.4)
(WA - WB)
1
. €j
J(Ej) 2 dEj -- 9 '(')e .
(2.26)
Como g(e) es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valor
::. mayor d eWA-WB ) I'nduce a un mayor
'
esfuerzo, cosa harto
,
mtU.lliva. Por
"',1::'" donde Yi(ei) = ei + Ei',La condición de primer orden de (2.2.4) es' tra parte con un mismo premio, no vale tanto la pena esforzarse cuando
-,,) :
"
)8Prob{Yi(ei) >
:1 ruido e~ muy fuerte, porque es probable que elresultado del to:neo se
;:\
,-,~~tl
(WA _ WB 8
Yj(e;)} _
- 9
'( ,)
e,. (2.2.5) determine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,
ei
si Ese distribuye normalmente con varianza a2, entonces
~~~, .'
.,:¡:- ..'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
~:', un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
.",.!:.'
adicional, que es el producto de lo que se gana en salario por venCer en el
--");
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar. que decrece en a, de forma que E' efectivamer:te decrece en a..
"
__
,~i
Por la regla de Bayes,12 Procedemos ahora hacia atrás, hasta la pnmera etapa del Juego. Su-
pongamos que SI,. 1os trabaJ'adores ' acuerdan
' ' participar
, en el torneo
. (en
11 Al escribir (2.2.4),supusimos que la función de densidad del ruido ¡(e) es tal que el t
vez d e acep ar un e, mpleo a lternativo) responderan, a. los salanos ',I! A
:;
~~',' suceso en el qU€ lostrabaj~dores producen exactamente lo mismo OCurr€con probabilidad . d 1
y W B lugan ,o e eqw, 'libn'o de Nash simétrico caractenzado
.. ' . .,. por (2.2.6).
cero y, por tanto;no es necesario considerarlo en la función de utilidad esperada del trabajador
"o,}' i. (Más formalmente, suponemos que la función de densidad ¡(E) es no atómica) En una (1gnoramos, por t anto , la posibilidad de equihbn, os asrmetncos y,de un ,
descripción completa del torneo, sería natural (pero innecesario) especificar que el ganador se equilibrio en el que la elección de los es~erzos por parte de los trabaJa-
,)~
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA +wB)/2 .
dores venga dada por la solución de esquma el = e2 = en vez de por la ?:
.~} condición de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlu-
l2La regla de Bayes proporciona una fórmula para P(AIB), la probabilidad (condicional)
,",.l~ de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B) nI'd a d d e emp 1ea alternativo proporcionan' a una utilIdad Un' Como , en' el .
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan equilibrio de Nash simétrico cada jugador gana el tor~eo con probal:lh-
'. '-,' tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente. La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
dad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI capataz qUJ~re :1
..../
inducir a los trabajadores a participar en el torneo debera escoger salanos
'
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra. que satisfagan
~_l.>t'
80 / JUEGOS DlNAMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos repetidos / 81
(
1 1 ganancias del juego completo son simplemente la suma de las ganancias

-w,
2 ,~ + 2-wB - g(e*) >- Ua. (2.2.7) de cada etapa (es decir, no hay descuento).
(
Suponiendo que Ua sea lo suficientemente pequeña corno para que el Jugador 2
capataz quiera inducir a los trabajadores a participar en el torneo, éste (
Iz D2
escogerá los salarios que maximicen el beneficio esperado, 2e* -"illA - WB,
sujeto a (2.2.7). En el óptimo, (2.2.7) se satisface con igualdad: h 1,1 5,0
Jugador 1
WB = 2Ua + 2g(e*) - WA. (2.2.8) 0,5 4,4
El beneficio esperado es entonces 2e* - 2Ua - 2g(e*), de forma que el ('.
capataz quiere escoger unos salarios tales que el esfuerzo inducido, e*, Figura 2.3.1
maximice e* - g(e*). El esfuerzo inducido óptimo, por tanto, satisface
la condición de primer orden l(e') = 1. Sustituyendo esto en (2.2.6) se Jugador 2
obtiene que el premio óptimo, WA - WB, es una solución de Iz D2 (
(WA - WB) l
J
f(Ój)2dój = 1,
Jugador 1
2,2 6,1
Y (2.2.8)determina entonces WA Y"illB. 1,6 5,5
Figura 2.3.2
2.3Juegos repetidos
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
En esta sección analizarnos si las amenazas y promesas sobre el comporta- Este juego pertenece a la clase de los juegos analizada en la sección 2.2.A.
miento futuro pueden influir en el comportamiento presente en situacio- Aquí los jugadores 3 y 4 son idénticos a los jugadores 1 y 2, los espaCios
nes que se repiten en el tiempo. Buena parte de lo que hay que entender de acciones A3 y A4 son idénticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas son simplemente la suma de las ganancias en la'pnmera etapa (ái.;a2)
nuevas se requieren para entender los juegos con un horizonte infinito. y en la segunda etapa (a3,a4)' Además, el dilema de los presos en d.ós
Hemos definido también el equilibrio de Nash perfecto en subjuegos. Esta etapas satisface el supuesto que hicimos en la sección 2.2.A: para cada
defirüción tiene una expresión más sencilla para el caso especial de los jue- resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
gos repetidos que en el general de los juegos dinámicos con információn en la segunda etapa entre los jugadores 3 y 4 tiene un único equilibrio
completa que considerarnos en la sección 2.4.B. La introducirnos aquí para de Nash, que denotamos por (a3(al,a21,a,i(al,a2»' De hecho, el dilema .~'.
tacilitar la exposición posterior. . '.
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la sección 2.2.A peTInitini.osla posibilidad de
2.3.A Teoría: Juegos repetidos en dos etapas
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aquí la notación (a; (al ,a2) ,a¡ (al ,a2»
Consideremos el dilema de los presos dado en forma normal de la figura en vez de simplemente (aj,a¡). (En el juego de los aranceles, por ejemplo;
2.3.1. Supongamos que hay dos participantes en este juego que deciden las cantidades de equilibrio escogidas por las empresas en la segunda
simultáneamente en dos ocasiones, habiendo observado el resultad"ode li,'l etapa dependían de los aranceles escogidos por los gobiernos en la primera
primera decisión antes de decidir por segunda vez, y supongamos que las etapa.) Sin embargo, en el dilema de los presos en dos étapas, el único
• [IleSOS repef idos / 83
82 / JuEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
equilibrio del juego de la segunda etapa es (I¡,h), independientemente lora al caso de dos periodos, pero consideramos la posi-
del resultado de la primera etapa. .. vodlvdemqo:::1 J'uego de etapa G tenga múltiples equilibrios :le ..NilSh,¡
blhda e . d . d [y C ll1utan é1
Siguiendo el procedimiento descrito en la sección 2.2.A para calcular el 3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 .., . 1
resultado perfecto en subjuegos de tal juego, analizamos la primera etapa como
. de los presos d e l a fi gura 23.. I , pero las estrategias enOJ1Unal
. 'b .ilS
del dilema de los presos en dos etapas teniendo en cuenta que el resultado dIlem; sido añadidas al juego de forma que ahora existen dos eqUlh nos
Di ha '. (1 J) como en el dilema de los presos, y
del juego restante en la segunda etapa será el equilibrio de Nash de ese N h en estrategIas puras. ¡,2 . "1' I
de as d ' (D D) Natura men te, es artl' f)' cial añadir un eqUllt mo a
1
juego, es decir, (IIJú con ganancias de (1,1). Por tanto, la interacción en
la primera etapa entre los jugadores en el dilema de los p~esos en dos a~ora a de~as pr~~os2de esta manera, pero nuestro interés en este juego
dIlema, e os 't'vo que sustan h' va. En la próxima sección veremos que
etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que es mas exposll , 'h d uilibrios
las ganancias 0,1) de la segunda etapa se han sumado á' cada par de . tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe '1' d etapa que se repiten infinitamente tienen
ganancias de la primera etapa. El juego de la figura 23.2 tiene también un u'Iti les mc1uso SI os Juegos e . "
único equilibrio de Nash: (IIJZ). Por tanto, el único resultado perfecto en m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq. . de etapa artificial en el contexto Sl1nple
subjuegos del dilema de los presos en dos etapas es (¡¡Jz) en la primera . , n analIZamos un Juego
etapa, seguidC? de (I¡Jz) en ¡la segunda etapa. No se puede conseguir est~::cC1:riodos, y nos preparamos con ello para el análisis poster~or de
de p ..' 'co en un contexto con honzonte
cooperación, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en un juego de etapa con mteres economl ,
subjuegos. infinito.
Este argumento continúa siendo válido en situaciones más generales.
(Aquí nos apartamos momentáneamente del caso de dos periodos para
permitir cualquier número finito de repeticiones, T.) Denotemos con
G = {A¡, ... , An; Ul; ... ,un} un juego estático con información completa 1,1 5,0 0,0
en el que los jugadores 1 a n escogen simultáneamente las acciones a¡ a an 0,5 4,4 0,0
de los espacios de acciones A¡ a An respeftivamente, siendo las ganancias 0,0 0,0 3,3
U¡(al;', . ,an) a un(a¡, ... ,an). Llamaremos al juego G, juego deetapadel
juego repetido.
Figura 2.3.3
Definición. Dado un juego de etapa G, G(T) denota el juego r.epetido fini-

Supongamos que el juego de etapa de la figura 2.3.3 s.ejuega dos veces,
tamente en el que G se juega T veces, habiendo los jugadores observado los
h b' do los J'ugadores observa d o e1 resu lt a d o de la .pnmera etapa antes
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las a len . l d Demostraremos que existe. un único resultado
... }: de que empIece a segun a. . (c c)
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
erfecto en subjuegos de este juego, en el que el par de estrategIas 1, 2
etapa.
P . l'
se Juega en a pnmera etapa .14 Corno en la sección 2.2.A, supongamos que
Proposición. Si el juego de etapa G .tiene un únicQequilibrio de Nash, entonces, . . .. 22 A Si G tiene un único resultado perfecto en
dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se
para cualquier T finito, el juego repetido G(T) tiene un ú~ico resultado perfecto subjuegos, entonces G(T) hene un unlCOres
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3 juega .el resultado perfecto en subjuegOdsfide.~. la nodón de resultado perfecto en subjuegos
14E '-' tamente hablando hemos e ni o
S'HC ' '. 'd l .. 22 A El dilema de los presos en dos etapas
13 Se ~btienen resUltados análogos si el juego de etapa G es un júego dinámicó con in- ól 1 1 se de juegos defim a en a seccJOn . . . .
s o para a e a da resultado factible del juego de la primera eta pa eXlste
formadón completa. Supongamos que G es un juego dinámico con inJonnádón completa y pertenece a esta clase, porque para ca d l gunda etapa Sin embarg0. el
perfecta de la clase definida en la secdón 21.A. Si G tiene un úr¡jco resultado por inducdón Tb' d N sh en el juego que que a en a se .
un único eqU11 no e ~ . n el . e o de e~apa de la figura 2.3.3 no pertenece a
hada atrás, G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender
resultado por inducdón hacia atrás de G. Sinillarmente, supongamos que G es un juego en tIque el ¡U.ego de etapa ene m. . 11
es a c ase, por b' os de forma que sea apiJea ) e a
formalmente la definición del resultado perfecto en su Jueg
84 / JUEGOS DlNÁ,vllCOS CON INFORfvIAC¡ÓN COMPLETA (e. 2)
Juegos rq;elidos / 85
en la primera etapa los jugadores prevén que el resultado de la segunda 2.3.4 corresponde al resultado perfecto en subjuegos «Cl,Cz),(D],D2») del
etapa será un equilibrio de Nash del juego de etapa. Puesto que este juego repetido, puesto que el resultado previsto en la segunda etapa es
Juego de etapa tiene más de un equi.librio de Nash, ahora es posible que (Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
los Jugadores prevean que a resultados diferentes en la primera etapa anteriormente, se puede alcanzar la cooperación en la primera etapa de
les sIguen equilibrios diferentes del juego de etapa en la segunda etapa. un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
Supongamos, por ejemplo, que los jugadores prevén que (Dl,Dz) será el de un resultado más general: si G = {Al,'" ,An; uI- ... ,un} es un juego
resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero estático con información completa que tiene múltiples equilibrios, pueden
que (II,1z) será el resultado de la segunda etapa si el resultado de la existir resultados perfectos en subjuegos del juego repetido G(T) en los
primera etapa es cualquiera de los ocho restantes. La interacción entre que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
los jugadores en la primera etapa se concreta entonces en el juego de una de Nash de G. Volveremos sobre esta idea en el análisis de un juego con
etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1) horizonte infinito en la próxima sección.
se ha sumado a las otras ocho casillas.
La conclusión principal que debemos sacar de este ejemplo es que
las amenazas o las promesas creíbles sobre el comportamiento futuro
pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra
2,2 g,1 1,1 perspectiva, puede que quizás el concepto de perfección en subjuegos
! 1-:'" --
no utilice una definición de credibilidad lo suficientemente fuerte. Al
1,6 ]1 1,1 derivar el resultado perfecto en subjuegos «C],CZ),(D1,Dz», por ejemplo,
1,1 1,1 hemos supuesto que Jos'jugadores prevén q~e (DI,Dz) s~rá el resultaclü,
~''!.
de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~
Figura 2.3.4 (I¡'!z) será el resultado en la segunda etapa si eIde la primera ronda es
cualquiera de los ()chorestantes. Pero jugar (11,!2)enléi.se~da etapa, con
Existen tres equilibrios de Nash con estrategias puras en el juego unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2, con una ganancia de (3, 3), está también disp¿nible cci~oe'luilibrio de
los equilibrios de Nash de este juego de una etapa corresponden a los Nash del juego de etapa que queda. Dicho en términos poco preciSos.
resultados perfectos en subjuegos del juego repetido original. Denotemos parecería natural que los jugadores renegociiü-an:15.SiJC1,cz) no es'~i
con «w,x),(y,z) un resultado del juego repetido: (w,x) en la primera etapa resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~á
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4 (I¡'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;
corresponde al resultado perfecto en subjuegos «(1],[Z),(1],[2» del juego pasado está, y que se debe jugar el eqüilibriodel juegbdeetapa (Dl,D~)
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z) unánimemente preferido. Pero si (DI,Dz)va a serelr~sÚltado de la
como consecuencia de cualquier resultado en la primera etapa excepto de segunda etapa independientemente de cuál sea el rescltadoenla primera
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura ronda, el incentivo para jugar (Cl,Cz) en ia prirñ~~áet~p.a_desaparece: la
~.3.4 corresponde al resultado perfecto en subjuegos «Dl,Dz),(11'!Z» del interacción entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce
al juego
Juego repetido. Estos dos resultados perfectos en subjuegos del juego de una etapa en el que la gánancia (3, 3Yse'ha~stÜÍ1adóacada casilla del
repehdo simplemente enlazan los resultados de los equilibrios de Nash juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura Cj del jugador i. ' '. . ."._.. '.
','
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadón (o incluso
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es negodadón) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debería añadirse a
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones la descripdón y análisis del jue¡;¡m.'Aquí súpimemos que no es así, de forma que lo que
mduso mas generales.
entendemos por "renegodar" no-esotra cosa que un ejerddo de introspección.
86 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e 2)
seguido de Di peros~lo 5 +1/~ a.ljugar Ji en :a primera ~tapa (e i.ncluso

menos con otras deCISIOnes).Mas Importante aun, el problema del eJemplo
, terior no aparece aquí. En el juego repetido en dos etapas basado en la
JI 1,1 5,0 0,0 0,0 0,0 an
figura 2.3.3, la única forma de castigar a un jugador por desviarse en la
Cl 0,5 4,4 0,0 0,0 0,0 , primera etapa era jugar ~n equilibrio .~ominado en :1 sentido de Par,eto
DI 0,0 0,0 3,3 0,0 0,0 en la segunda etapa, cashgandotamblen con ello al Jugador que casllga,
Aquí, en cambio, existen tres equilibrios en la frontera de Pareto -uno
/:;~ PI 0,0 0,0 0,0 4,! 0,0 para recompensar el buen comportamiento de ambos jugadores en la
Ql 0,0 0,0 0,0 0,0 !,4 primera etapa y los otros dos para ser utilizados no sólo para castigar al
~Ti;;~):Jugador que se desvía en la primera etapa, sino también para recom pensar
'."'2E::.aiillgádor que castiga. Por tanto, si se requiere una penalización en la
Figura 2.3.5
Y';~">Segunda ronda, no existe otro equilibrio del juego de etapa preferido por
!-F ' ., .eljugador que castiga, de forma que no se puede persuadir al jugador que
Para acercamos a la solución de este problema de renegociación,-con~
castiga de que renegocie la penalización.
sideremos el juego de la figura 2.3.5, que es aún más artificial qué él j\.tego
de la figura 2.3.3. Una vez más, huestro interés en este juego' ~s más
expositivo que económico. Las lciJ~ásquééstamosdesarrollándó pái~-tTa: 2.3.B Teoría:Juegos repetidos infinitamente
tar él tema de la renegociación en esté juego artificial se pueden aplicar

también a la renegociación en juegos infinitamente repetidos; véase Fairell Pasamos ahora a los juegos repetidos' infinitamente. Como en el caso
y Maskin (1989),por ejemplo. " de un horizonte finito, el tema principal es el de que las amenazas o las
Eneste juego de etapa se añaden las estrategi~s Pi y Qia1juego de promesas, creíbles sobre el comportamiento futuro pueden influir en el
etapa de la figUra 2.:5.3.Existen cuatro equilibrios de Nash con estrategias comportamieritopresente\ En el caso de un horizonte finito vimos que si
purasdeljuego de etapa: (IJ,h)' (Dr,1J2) Y ahora también (Pl,P2) y (Ql,Q2)' existen equilibrios de Nash múltiples del juego de etapa G, pueden existir
Como antes, los)ugadores prefieren unánimemente\D1,D2) a (h,h). Más resultados perfedos en subjuegos del juego repetido G(T) en los que, para
importante aún, no hay ningún equilibrio de Nash (x,y) en lélfigUra 2.3.5 ,rualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G.
t~l que los jugadores prefieran unánimemente (x,y) a (Pl,P2); (Q1;Q2) o .;~ Untesultado más poderoso se da en los juegos repetidos infinitamente:
(Dl;D2). Decimos entonces que (Dl,D2) domina en el sentidO de PÚeto' a intruso si el juego de etapa tiene un único equilibrio de Nash, pueden
(IJ,h), y que (P1,P2),(Ql,Q2) y (Dl,D2) están en Ía fronterade Paretode las ','e3dstir muchos resultados perfectos en subjuegos en los que ning'uno de
ganancias de los equilibrios de Nash del juego de etapa de la figtira2.3.5. los resultados en cada etapa sea un equilibrio de Nash de G,
Supongamos que el juego de etapa de la figura 2.3.5 se'juega dos _ Empezamos con el estudio del dilemá de los presos repetido in rinita-
veces, habiendo los jugadores observado el resultado de la prirnéfa\511da mente. Consideramos a continuación la clase de juegos repetidos infini-
antes de que empiece la segunda. Supongamos adicion~J~erit~gue los , tamente análoga a la clase de juegos repetidos finita mente definida en la
o" :,'sécción anterior:' un juego estático con información completa, G, se repi te
jugadores prevén' que el resultado de la segundaétapa será el sigUi~nte:
(DJ,D2) si el resultado dela primera etapa es (Cl,C2); (PI ,P2) sieiiés'U1tadü t:r;~LIfullutamente, habiendo los jugadores observado 10s'resultados de todas
de la primera etápa es (Cj,w), donde 1JJ puede ser cualquierco~amE:Ílos , las rondas anteriores antes de que empiece la etapa siguiente. Para esta
C2; (Ql,Q2) si el resultado de la primera etapa eS (x,C2), donde x puede ser . "cIase de juegos repetidos finita e infinitamente, definimos los conceptos
cualquier cosa menos Cl y (DJ,D2) si el resultado de la primera etapa es de estrategia de un jugador, de subjuego y de equilibrio dé Nash perfecto
(y,z), donde y puede ser cualquier cosa menos ely zpuedes~;, ctialquier el).,"súbjuegos.(En la sección 2.4.B definimos estos conceptos para juegos
, dinámicos con información completa en general, no sólo para esta clase
cosa menos C2. Entonces «Cl,C2),(Dl,D2» es un result<l:dópeaésto'en
subjuegosdeljuego repetido porque cada jugador obtiene 4+3ál jugare; de juegos repetidos.) Utilizamos después estas definiciones para enuncia r
(
''-.-
(,
~
..
1'.
~, .'
~8 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) ]¡¡egos repetidos /89
y demostrar el teorema de Friedman (1971) (también llamado teorema de el valor presente de las ganancias, es decir, la ganancia total que podría
tradición oral o teorema folk).I6 ingresarse en un banco ahora de forma que produjera el mismo saldo al
final de la sucesión.
Jugador 2 Definición. Dado un factor de descuento 5, el valor presente de la sucesión

h D2 infinita de pagos 7f¡,7f2,7f3,'
.. es
1,1 5,0 00
Jugador 1 7fi+ 57f2+ 527f3+ ... = L 5 l7f

t
- t.
t=I
0,5 4,4
También podemos utilizar 5 para reinterpretar lo que l~amamos un
juego repetido infinitamente como un juego repetido que se acaba después
de un número aleatorio de repeticiones. Supongamos que al finalizar cada
c..
Figura 2.3.6
etapa se lanza una moneda (trucada) para determinar si el juego se acaba ';-',
~ no. Si la probabilidad de que el juego se acabe inmediatamente es p y,

Supongamos que el dilema de los presos de la figura 2.3.6 se repite por tanto, 1 - p es la probabilidad de que el juego continue al menos una
infinitamente y que, para cada t, los resultados de las t - 1 jugadas ante- etapa más, una ganancia de,7f a recibir en la siguiente etapa (si se juega)
riores del juego de etapa se han observado antes de que la t-ésima etapa tiene un valor de sólo O-p)7f /0 +1')antes de efectuar el lanzamiento del~
empiece. Sumar simplemente las ganancias de esta sucesión infinita de moneda correspondiente a esta etapa. Del mismo modo, una gan~cia de
"'~'-
juegos de etapa no proporciona una medida útil de la ganancia de un 7fa recibir dentro en dos etapas (si ambas etapas se juegan) tiene un:valor
jugador en el juego repetido infinitamente. Recibir una ganancia de 4 en de sólo 0- p)27f/0 + 1')2antes de efectuar el lanzamiento de la moneda
cada periodo es mejor que recibir una ganancia de 1 en cada periodo, por correspondiente a esta etapa. Sea 5 = O - p)/O + 1'). Entonces el valor ,,",
ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recor- presente 7f1+ 57f2+ 527f3+ ... refleja tanto el valor temporal del dinero como
demos (en el modelo de negociación de Rubinstein <;lela sección 2.1.D) la posibilidad de que el juego se acabe. '.'
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta Consideremos el dilema de los presos repetido infinitalIlente en elque
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de interés el factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugador
por periodo. Dados un factor de descuento y las ganancias de un jugador en el juego repetido es el valor presente de las ganan.ciasdel jugad()f,ep
obtenidos de una sucesión infinita de juegos de etapa, podemos calcular los juegos de etapa. Demostraremos que la cooperación, es decir,(D1,D2),
puede ocurrir en cada etapa de un resultado perfecto en subjuegos del
juego repetido infinitamente, aun cuando el único equilibrio de Nash
del juego de etapa es la no cooperación, es decir, (1},h) El argumerlto
es del mismo estilo que nuestro análisis del juego repetido en dos etapas
16 El teorema de tradición oral original se referia a las ganancias en todos los equilibrios basado en la figura 2.3.3 (el juego de etapa en el que añadimos un segundo
de Nash de un,juego repetido infinitamente. A este resultado se le llamó teorema de tradición equilibrio de Nash al dilem,! de los presos): si los jugadores cooperan
oral por ser ampliamente conocido entre los teóricos de juegos de íos "años cincuenia, aun
hoy entonces juegan un equilibrio con ganancias altas mañana; en caso
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgánancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y, contrario juegan un equilibrio Con ganancias bajas mañana. La diferencia
por tanto, refuerza el teorema de tradición oral original al utilizar un criterio de solución más entre el juego repetido en dos etapas y el juego repetido infinitamente es
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo, que aquí el equilibrio con gananciéls áltasquepodría jugarse mañana no
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradición oral, aun cuando' no hayan sido ampliamente
se ha añadido artificialmente, sirlOque representa continuar cooperando
conocidos entre los teóricos de juegos antes de ser publicados. a partir de mañana y en lo Sucesivo.
Juegos repetidos ! 91
90 I JUEGOS Dú'\JÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Supongamos que el jugadori empieza el juego repetido infinitamente ue el jugador j recibe por realizar esta elección de forma óptima (ahora
cooperando y sigue cooperando en cada juego de etapa siguiente si y sólo q cada vez que aparezca). Si jugar Dj es óptimo entonces
y ,
si ambos jugadores han cooperado en cada ronda previa. Formalmente,
.Ia estrategia, del jugador i es: V=4+ól/,
o V = 4/(1- ó), ya que jugar Dj conduce a la misma decisión en la sig"uiente

Jugar Di en la primera etapa. En la t-ésima etapa, si
etapa. Si jugar Ij es óptimo entonces
el resultado de todas las t - 1 etapas anteriores ha sido
(Dl,D2) entonces jugar Di; en caso contrario, jugar h . ó
V =5+ 1_ o'
Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel disparador(trigger strategy);. coma obtuvimos antes. Por tanto, jugar Dj es óptimo si y sólo si
'llamadaasÍ p'orque el jugadÓ~i coopera hastaquealguieridefa de Cooperar,
4 o
lo qu~Aesencadena' la;décislón'de. rtovóivéi '~'.'cooperairí.Utlcaffiás: Si 1_ o ~ 5 + 1 _ ó' (2.3.1)
ambos jugadores adoptánla, estrat~gia derdlsparador, el resUltado d~l"
o ó ~ 1/4. Por tanto, en la primera etapa, y en cualquier ronda tal que
juegorepeti~o inffuitamertte será (Dl,D~)enCádaetapa.' Yerembs pnmeio
todos los resultados anteriores hayan sidoCDl,D2), la decisión óptima del
que si o está' lo suficientemente Cerca de uno, el hecho de que los dos
jugador j (dado que el jugador i ha adoptado láestrategia del disparador)
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
es Dj si y sólo si ó ~ 1/4. Combinando esta observación con el hecho
juegorepetidó infinitamente. Veremos a contiriu~ción que este equilibrio
de que la m~jor respuesta de j es jugar siempre Ij cuando el resultado
de Nash es'perfecto en subjuegos, en un sentido que se precisará más
de alguna etapa difiera de (Dl,D2), tenemos que el que los dos jugadores
adelante.
jueguen la estrategia del disparador es un equilibrio de Nash si y sólo si
Para demostrar que la adopción de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido Ó ~ 1/4.
Vamos a ver ahora que este equilibrio de Nash es perfecto en sub-
infinitamente, supondremos que el jugador i ha adoptado la estrategia
.juegos. Para hacerlo, definimos el concepto de estrategia en un juego
del disparador ydemostraremos a'continuación, siempre que o esté lo
repetido, de subjuego en un juego repetido y de equilibrio de Nash per-
suficientemente cerca de uno, que adoptar esta estrategia es también la
fecto en subjuegos en un juego repetido. Para ilustrar estos conceptos
mejor respuesta del jugador j. Dado que el jugador i jugará I¡ para
con ejemplos sencillos de las secciones anteriores, los definiremos para
siempreeuandó el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el juegos repetidos tanto finita como infinitamente. En la sección anterior
definimos el juego repetido finitamente G(T) basado en un juego de etapa
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal G = {Al,'" ,An; 'ul,' .. ,un), un juego estático con informaéión completa
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionaría en el que los jugadores 1 a n eligen simultáneamente las acciones al a (1."
una ganancia de 5 en esta etapa, pero desencadenaría la riocooperación de los espacios de acciones Al a An respectivamente, y las ganancias son
del jugador"i (y, por tanto, también del jugador j) enio sucesivo, de forma Ul (al, ... ,an) a Un (al, ... ,O'n)' Definimos ahora el juego análogo repetido
que la ganancia en cada etapa futUra sería 1: Comd'1+ó+ó2+:. /=1/(1-0), infinitamente.17

el valor presente de esta:sucesión de ganancias es
Definición. Dado un juego de etapa G, denominamos G(co,o) al juego repetido
.0 .infinitamente en el que G se repite por siempre y los jugadores tienen el mismo
5 + 0.1 + o 2 .
.1 + ... = 5 + -"-.
1-0
17 Naturalmente se puede definir también un juego repetido basado en un juego de etapa
Alternativamente, jugarD j proporcionaría una gananCiade 4 enéitá'etapa
diháInico, En esta sección limitamos nuestra atención a juegos de etapa estáticos para poder
y conduciría a exactamente lafuis~a elecciórtentre Ijy Dj en lasigtiiente presentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y
etapa. Llamemos V al val,or ptesert!e de la sucesión infinIta degahán¿ia's
. _. . _ '. . . . "'.~ •. ~,.~- ;.0 . < - ,"
2.3.E son juegos repetidos basados en juegos de etapa dinámicos.
.::
..,'
92 I JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)
Juegos repetidos I 93
¡áclor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
juego repetido en dos etapas consideramos una estrategia en la que la
jllego de etapa son conocidos antes de que empiece la t-ésima etapa. La ganancia
decisión del jugador .¡ en la segunda etapa era contingente del resultado
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesión infinita de juegos de etapa. de la primera etapa: jugar Ci en la primera etapa y jugar li en la segunda
a menos que el resultado de la primera sea (C¡,Cz), en cuyo caso jugar Di
en la segunda etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
En el juego repetido finitamente G(T) o en el repetido infinitamente
plan completo de acción, es decir, especifica una acción factible del jugador
G(co/i), la historia de! juego hasta la etapa t es el registro de las decisiones
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
de los jugadores desde la etapa 1 hasta la t. Los jugadores podrían ha-
forma algo más frívola, si un j~ga_dordejara una estrateg!a a su abogado
ber escogido (un, ... ,un¡) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y
anles de que el juego empezase, el abogado podría sustituir al jugador
(U¡u ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapa
en el juego, sin necesitar en ningún caso de instrucciones adicionales
s la acción Uis pertenece al espacio de acciones Ai.
sobre cómo jugar. En un juego estático con información completa, por
ejemplo, una estrategia es simplemente una acción. (Por esto describimos
Definición. En e! juego repetido finitamente G(T) o en el juego' repetido infini-
lal juego como G = {S¡,,,,,Sn;'U¡, ... ,un} en el capitulo t pero aquí
tamente G(co,8), la estrategia de un jugador determina la acción que el jugador
pu:de describirse también como G = {A], ... ,An; U¡, '" ,un}: en un juego
realizará en cada etapa para cada posible historia de/juego hasta la etapa anterior.
estallco con información 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinámico, una estrategia es más complicada. Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,
la parte que queda por jugar empezando en cualquier momento en el que
Consideremos el dilema de los presos en dos etapas analizado en la
la historia completa del juego hasta entonces sea información deI'doIÍúrÜo
sección anterior. Cada jugador acruados veces, de forma que podría
público entre los jugadores. (Más adelante en esta sección damos una
pensarse que una estrategia es simplemente un par dé irIstrucciones (b,c),
definición precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(i
donde b es la decisión en la primera etapa y e es la decisión en la segunda
sección 2.4.B damos una definición precisa para juegos dinámicos con in-
elapa. Pero existen cuatro resultados posibles de la prÍ11leraetapa, (1¡,1z),
formación completa en general.) En el dilema de los presos en dos etapas,
U¡,Dz),(D1,1ú y (D¡,Dú, que representan cuatro contingencias diferentes
por ejemplo, hay cuatro subjuegos que corresponden a los juegos de la
en las que al jugador l~ podría corresponder actuar. Por tanto, la estrategia
segunda etapa que siguen a los cuatro resultados posibles de la primera
de cada jugador consta de cinco instrucciones, que indicamos mediante
etapa. Del mismo modo, en el juego repetido en dos etapas basado en
(V¡W,x,y,z), donde v es la decisión en la primera etapa y w,x,y y zson''!as
la figura 2.3.3, hay nueve subjuegos que corresponden a los nueve re-
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (D¡Jz) y
sultados posibles en el juego de la primera etapa. En el juego repetido
(D¡,Dz) respectivamente. Usando esta notación, las instrucciones "jugar b
finita mente G(T) yen el juego repetido infinitamente G(co,8)la definición
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
de estrategia está íntimamente ligada a la definición de subjuego: la es-
se describen como (b,c,c,c,c), pero esta notación también puede expresar
trategia de un jugador determina las acciones que el jugador realizará en
estrategias en las que la decisión de la segunda etapa es contingente del
la primera etapa del juego repetido y enla primera etapa de cada uno de
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
sus subjuegos.
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
Definición. En e/juego repetido finitamente G(T), un sllbjllego que empieza en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
la etapa t + 1 es e! juego repetido en e! que G se juega T - t veces y que designamos
de cada Jugador consta de diez instrucciones, una decisión en la primera
por G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t + 1, uno para
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
cada una de las posibles historias de! juego hasta la etapa t. En e! juego repetido
resultado posible de la primera etapa. Recordemos que al analizar el
infinitamente G(co,8), cada subjuegoque empieza en la etapa t + 1 es idéntico
94 / JUEGOS DINÁMICOS CON INFOI~MAClÓN COMPLETA (e. 2) ¡liegos "e¡'e/idos / qs
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos (Dl,Dz). Si el jugador adopta la estrategi~ del disparador p~ra el juego
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del entonces (i) las estrategias del Jugador en un subluego de la
comp leto , 1
juego hasta la etapa t. . era clase son de nuevo la estrategia del disparador, que ya 1e11l0S
nm
Pd strado que es un equilibrio de Nash del juego completo, y (H) la,s
emo . 1 t
Obsérvese que la t-ésima etapa de un juego repetido no es por sí misma estrategias del jugador en un juego de la segunda clase son slmp eme:1.e
un subjuego del juego repetido (suponiendo que t < T en el caso finito). repetir en lo sucesivo el equilibrio del juego de etapa (1¡,1z), que e: ~a,~blen
Un subjuego es una parte del juego original que no sólo empieza en un un equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. de
momento en que la historia del juego hasta entonces es información del Nash en las estrategias del disparador del dilema de los presos repetido
domino público entre todos los jugadores, sino que también incluye todas infinitamente es perfecto en subjuegos.
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-ésima etapa aisladamente sería equivaierit~a considerar la t-ésima etapa Ganancia al jugador 2
corno la etapa final del juego repetido .. Tal análisis podría llevarse a cabo
pero no sería relevante para el juego repetido original.
Estamos ahora preparados para la definición de equilibrio de Nash (0,5)
perfecto en subjuegos, la cual depende a su vez de la definición de equili-

brio de Nash. Esta última no 11acambiado desde el capítulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinámico: en cualquier juego, un equilibrio de Nash es una co-
lección de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los demás jugadores.
Ganancia al
jugador 1
(5,0)
Definición. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego. ' , Figura 2.3.7
, '
El equilibrio de Nash perfecto en subjuegos es un refinamiento del Aplicamos seguidamente argumentos análogos al juego repetí.do infi-
equilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategias 'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
de los jugadores deben ser primero un equilibrio de Nash y pasar luego (1971) para juegos repetidos infinitamente. Para enunciar' el teorema, ne-
una prueba adicionaL cesitarnos dos últimas definiciones. Primero, llamamos factIbles a las ga-
Para demostrar que el equilibrio de Nash en las estrategias del dis- nanCIas. (Xl,"" x n ) en ell'uego de etapa G si son una combinación
.
convexa
parador deLdilema de los presos repetido infinitamente es perfecto en (es decir, una media ponderada donde las ponderaciones son no-negativas
subjuegos, debernos demostra'r que las estrategias del disparador cons- y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
tituyen un equilibrio de Nash en cada subjuego de este juego repetido de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
infinitamente. Recordemos que cada subjuego de un juego repetido infi- región sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
nitamente es idéntico al juego completo. En el equilibrio de Nash en las (1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
estrategias del disparador del dilema de los presos repetido infinitamente, , ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que 1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
todos los resultados de las etapas anteriores han sido (D¡,D2), y (ii) sub- las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
juegos en los que el resultado de al menos una etapa anterior difiere de de) la región sombreada de la figura 2.3.7 son medIas ponderadas de las
96 / JUEGOS DfNÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
ganancias de más de dos estrategias puras. Para conseguir una media

cada jugador 'í y si (j está lo suficientemente cerca de uno, existe UI1 equilibrio de
ponderada de las ganancias de estrategias puras, los jugadores podrían
Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza
ulilizar un mecanismo aleatorio público: jugando U],D2) o (D],h) de-
(X], ... ,xn) como ganancia media. '
pendiendo del lanzamiento de una moneda (no trucada), por ejemplo,
consiguen ganancias esperadas de (2,5,2,5).
La segunda definición que necesitamos para poder enunciar el teo- Pago al jugador 2
rema de Friedman es un reajuste de las ganancias a los jugadores: Con-
tinuamos definiendo las ganancias de cada jugador en el juego repetido
infinitamente G(oo,ti) como el valor presente de la sucesión infinita de (0,5)
ganancias del jugador en el juego de etapa, pero es más conveniente ex-

presar este v.alor en términos de la ganancia media de la'misma sucesión
infinita de juegos de etapa, la ganancia que se tendría que recibir en cada
etapa de forma que resultara en el mismo valor presente. Sea 8 el factor de (.
descuento. Supongamos que la sucesión infinita de ganancias 7f¡'1f2,1f3, ...
tiene un valor presente de V. Si se recibiese una ganancia 7f en cada etapa,
el valor presente sería 1fjO - 8). Para que, 1f sea la ganancia media de Ganancia-al
jugador 1
la sucesión infinita 7f1,1f2,7f3, ... con un factor de descuento 8, estos dos (5,0)
valores presentes han de ser iguales, por tanto 1f = VO - 8). Es decir, la
ganancia media es O - 8) veces elv~lOr presente:
Figura 2.3.8
Definición. Dado el factor de descuento 8, la ganancia media de la sucesión

infinita de ganancias 1f],1f2,1f3,' .. es La demostración de este teorema repite los argumentos ya dados para ,, .:.
el dilema de los presos repetido infinitamente, de forma que la relegamos
00
al apéndice, Es conceptualmente inmediato pero algo complicado de no-
O - 8) ¿ 8t-]7ft._
tación extender el teorema a los juegos de etapa de buen comportamiento
t=1
que'~~ ~~~ni,finitosni ~iáticos (veremos algunos ejemplos ~n las apli7
La ventaja de la ganancia media con respecto del valor presente es que caciones dé las tres próximas secciones). En el contexto del dilema de
el primero es directamente comparable con las ganancias del juego de lo~p~sos de la fiísuril 2.3.6.- el teorema de Friedman garantiza que puede
etapa. En el dilema de los presos de la figura 2.3.6, por ejemplo, ambos alcanzarse cualquier punto en la región más oscura de la figura 2.3.8como
jugadores podrían recibir una ganancia de 4 en cada periodo. Tal sucesión ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego
infinita 0e ganancias tiene una ganancia media de 4 pero un valor presente rep~tido, siempre y cuando el factor de descuento esté lo suficientemente
de .4/0 - 8). Sin embargo, como la ganancia media no esmás que un cerca de uno.
reajuste del valor presente, maximizar la ganancia media es equivalente a , Concluimos esta sección esbozando dos derivaciones adicionales de la <,'
maximizar el valor presente.

teoría de juegos repetidos infinitamente, que se complican al añadírseles
Estamos finalmente preparados para enunciar el resultado principal la siguiente característica especial del dilema de los presos. En el dilema
en nuestra discusión sobre juegos repetidos infinitamente.
de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar
seguro de recibir,como mínimo la ganancia de 1 del equilibrio de Nash,
leorema. (Friedman 1971): Sea G un juego finito, estátic~y con información
jugando 1;. En un juego de duopolio de Cournot de una etapa (como
completa. Denominemos (e], ... ,en) a las ganancias en un equilibrio de Nash de
el descrito en la sección 1.2.A), por el contrario, una empresa no puede
G, y (x 1, ... ,xn) a otras ganancias factibles cualesquiera de G. Si Xi > ei para estar segura de obtener los beneficios del equilibrio de Nash produciendo
, .~t~;
'b:
~t::
Juegos I'qJef idos I 99
98 I JUEGOS DlNMIICOS CON INFORMACIÓN COMPLETA (e. 2)
, 'o'n creíble más fuerte' por tanto, utilizando el enfoque de

la cantidad del equilibrio de Nash; más bien, el único beneficio que una la pena 1IzaCI ' ", '.,
a!1Zarse ganancias medIas que no podnan alcanzill se
empresa puede estar segura de recibir es cero, produciendo cero, Dado Abreu pue den alc ' ,
un juego de etapa arbitario G, denotamos con Ti la ganancia de reserva del 'l' do el enfoque de la estrategia del disparador. En el ddema de
utl Izan " , .
jugador 'Í -la ganancia más alta que el jugador 'Í puede estar seguro de . os SI'n embargo el equilibrio de Nash del Juego de etapa genera
los pies , '
cias de reserva (esto es, ei = T;) tales que los dos enfoques son
recibir, hagan lo que hagan el resto de los jugadores, Debe ser el caso que unas g anan , ,
Ti :::; ei (donde eí es la ganancia del jugador 'Í en el equilibrio de Nash
equivalentes, En la próxima sección damos ejemplos de los dos enfoques.
utilizado en el teorema de Friedman), ya que si Ti fuera mayor que eú no
sería la mejor respuesta del jugador 'Í jugar su estrategia dl:iJ equilibrio de Apéndice
Nash, En el dilema de los presos, Ti = ei, pero en el juego del duopolio de
Co1irnot (y típicamente), Ti < ei. " '-"")': . ste
Ene apéndice demostramos el teorema de Friedman, Sea (ael,'" ,o'e,,)
d 'l'b'
el equilibrio de Nash de G que proporciona las ganancias e equJ 1 no
Fudenberg yMaskin (1986) demuestt~Il,qyeenjuegos con dos Jugado~
res, las ganancias de reserva (Tl,T2)'pi.led~~réerripla'zaia las gananCias de (el,-'"' e)TI. • Del mismo modo, sea (0.",1,' .. ,0,,,,,,) la colección de acciones
que proporciona las ganancias factibles,(xl, ... ,xn), ,(La:U~a ~o.tación es
equilibrio (q,éú'en el enunciado del te¿terna.deFriedman. Es decir, si
sólo indicativa porque ignora el mecamsmo aleatono publIco l1plCamente
(Xl,X2) es una ganancia factible deO, C011Xi' > Ti para cada 'Í, para 5 lo
necesario para alcanzar cualquier ganancia factible.) Consideremos la
suficIentemente cerca de uno, existe un equilibrio de Nash perfecto en
siguiente estrategia del disparador en el caso del jugador 'Í:
subjuegos de 0(00,5) que al~ania (Xl,X2) como ganancia media, incluso si
Xi < ei para alguno de los jugadores, En juegos con más de dos jugadores,
Jugar axi en la primera etapa. En la t-ésima etapa, si
Fudenberg y Maskin ofrecen una condición débil bajo la cual las ganancias el resultado de todas las t - 1 etapas anteriores ha sido
de reserva (TI," "Tn) pueden reemplazar a I",sganancias de equilibrio en
(O.xl" .. ,0.",,,) jugar an; en caso contrario jugar o.ei'
el enunciado del teorema.
También tiene interés la siguiente pregunta complementaria: ¿qué Si ambos jugadores adoptan esta estrategia, el resultado en cada etar,Jé1 del
ganancias medias pueden alcanzarsetoh un equilibrio de Nash perfecto juego repetido infinitamente será (0,,,,1,' .. ,0,,,,,,). Argu~1entaJllOs pnmero
en subjuegos cuando el factor de descuénto no está 10 "suficientemente que si ti está lo suficientemente cerca de uno, el que lo~Jugadores ~d()pten
cerca de Uno"? Una manera de abordar esta cuestión es considerar un esta estrategia constituye un equilibrio de Nash del Jueg~ re~eltdo, Ar-
valor fijode5 y determinar las gánaitciás medias que pueden alcanzarse gumentamos a continuación que esta estrategia es un equillbno de Nash
si los jugadores usan las estrategias del dísparador qué se desplazan para perfecto en subjuegos. , '
siempre al equilibrio'de Nashdel juego de'etapa despuéS de cualquier Supongamos que todos los jugadores excepto el J~g~dor ¡,han, adop-
desviación. Valores menores de 5 hacen queuna penalización que empiece tado la estrategia del disparador. Dado que los demas Jugaran Stempl.e
en el próximo periodo sea menos efectiva para evitar una desviación en (o.el,'" ,o.e i-l,ae i+l, ... ,aen) siempre si el resultado de alguna etapa dI-
este periodo ..'No obstante;lós jugadores pueden tlpicamernte hacer algo fiere de (a~l,' .. ,~xn), la mejor respuesta del jugador 'Í esjugar siempre (J'e;
mejor que simplemente jugar un equilibrio de Nash del juego de etapa. si el resultado en alguna ronda difiere de (a"l,' .. ,o.xn)' Queda por deter-
Un segundo enfoque, iniciado por Abreu (1988), se basa en la idea de minar la mejor respuesta del jugador 'Í en la primera ronda yen cualquier
que la forma más: efectiva de evitar que jm jugador- se desVÍe de una etapa en la que todos los resultados anteriores hayan sido (a",l, . ' . ,().",,,),
estrategia propuesta es amenazarlo con administrar la penalización creíble Sea adi la mejor desviación de (0.",1, ... ,0.",") que puede adoptar el jugador
más dura en el caso que se desVÍe (es decir, amenazar con responder a 'Í. Esto es, adi es una solución de
una desviación jugando el equilIbrio de Nash perfecto en subjuegos del
juego repetido infinitamente que proporciona la ganancia menor entre max lLi(o.xl, - -' ,o,x,i_l,ai,o..T:¡i+l,'" ,o.xn).
todos esos equilibrios al jugador que se desvía). En la mayoría de juegos, a,EA,
Sea di la ganancia a -i con esta desviación: di = v,;(axl,' , . ,o,,,,,i-l ,0.di,0'x,;+1
... ,-,'
. "
'
.
,', desplazarse para siempre al equilibrio de Násh del juego de etapa no es
100/ JUECOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
(Ignoramos de nuevo el papel del'
.. , el",.,.,). .
. . 'i - . " mecamsmo aleatorlO'la me- (dado que los demás jugadores han adoptado la estrategia del disparador)
JOIl eSVlaClOny su ", ~ .
ganancIa puellen depender de que' estr t .
es axi si y sólo si {¡ ?: (di - xi)/(di - ei).
hay
"/L(a.
l .
a.
d
°
a se eCClOna el mecanismo aleatorio)
.
.,...
a egIa pura
lenemos que di ?: x.; = Combinando esta observación con el hecho de que la mejor respuesta
, .eL ... , x '-1
I I
a XlI. a X¡'l+
. 1I ... I
a)xn > e,¡ = Ui
((le]" ... ,aen).
de 'i es jugar aei para siempre si el resultado de alguna etapa difiere de
Jugar adi proporcionará una ganancia de di en esta etapa pe d
cadena (ael,' .. ,a. a. . ro esen- (axIJ' .. ,axn), conc'¡uimos que jugar la estrategia del disparador por parte
. e,,-I, e,-.+L ... ,ae.,.,)en lo sucesIvo por parte de los d ' de todos los jugadores es un equilibrio de Nash si y sólo si
Jugadores, ante lo cual la mejor respuesta del J' d' emas
l' uga or z es ae;, de forma
que a,gadnanClaen. cada etapa futura será e'i. El valor presente de esta , d,; - Xi
SuceSlOn e gananCIas es u ?: max -d--'
1 i - ei
.
d".,+ u . e.,' + u,2 . e. +
' '"
= d., + 1 _o oei. Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foimá que eI~valormáximo de esta fracción para cualquier jugador sea
(Dad~ ~ue cualquier desviación desencadena la mismarespuest. d 1 también estrictamente menor que 1.
demas Jugad 1" d . '.' , a e os Queda por demostrar que este equilibrio de Nash es perfecto en sub-
. ores, a umca esviación que necesitamos considerar es la '
ventaJosa) Alt ti .' mas juegos. Es deCir,'que las estrategias del disparador deben constituir un
" . ema vamente, Jugar axi proporcionará una ganancia de x.
en esta et~pa y conducirá a exactamente la misma elección entre a. a' equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
,~I:/~sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~
(e Juego de etapa que el Jugador i recibe por elegir óptimament (h
es
subjuegode 0(00,0) idéntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
Ycada vez t . e a ora clases: (i) subjuegos en los que los resultados de las etapas anteriores han
que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti' ':,.,
entonces " X> P mo, sido (axl, .. -: ;a~n), y (ji) subjuegos'en losqué
el resultado de al menoSú.ri¡{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
Vi = Xi + oVi, disparador en el juego completo, (i) las estrategias'dé los jugadores ériun'
,/0 ,) S"1Jugar subjuego de la primera etapa son de nuevo las estrategias del disparador
o V,-,- x - u. adi es. óptimo, entonces
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
Vi = di + --e.
o del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle . ....... '
1-0'" la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiiegÓ
como obtuvimos p' ( . de etapa (ael,' .. ,aen), lo que también es un equilibrio de Nash d~l jrieg;;~"
rio no está co 1 ~eVl~ment~. Supongamos que el mecanismo aleato- completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
' . rre aClOna o senalmente. Es suficiente entonces que d. sea
la ganancIa mayor a la . d . ., d ' del juego repetido infinitamente es perfecto en subjuegOs.
. '. . meJor. eSVlaClOn el jugador i entre las difere _ ':.." ,
:~:a~:~:;n~clOnes de es~at~gias puras seleccionadas por el mecanismno

. n consecuencIa, Jugar axi es óptimo si y sólo si 2.3.C Colusión entre duopolistas de Coumot
Xi {¡ Friedman (971) fue el primero en demostrar que podria alcanzarse la

-->d+--
1 - {¡ - " 1 _ o e,,,. cooperación en un juego repetido infinitamente utilizando estrategias que
o
consistieran en elegir para siempre el equilibrio de Nash del juego de etapa
después de cualquier desviación. Originalinente se aplicó a los casos de
o> d; - Xi
colusión en un oligopolio de Cmimot, del siguiente modo:
- di - ei'
Por tanto, en la pri.. ' . Recordemos el juego deCoumot estático de la sección 1.2.A: Si la
. . m.ra etapa, y en cualqwer etapa tal que todos los resul- cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,
•.
tal:los antenores hayan 'd ( '" , .
. SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene
--------
102 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Jllegos repel idos / 103
costes fijos. Las empresas escogen sus cantidades simultáneamente, En el También podemos preguntarnos qué pueden conseguir las empresas si
único equilibrio de Nash, cada empresa produce una cantidad (a - c)/3; 6< 9/17. Exploraremos los dos enfoques descritos en la sección ante.rior.
a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado Determinamos en primer lugar, para un valor dado de ó, la cantIdad
que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad
más rentable que las empresas pueden producir si ambas siguen una
de monopolio, qm == (a- c)/2, ambas empresas estarían mejor si cada una
produjera la mitad de la cantidad de monopolio, q¡ = qm/2. ~ trategia del disparador que transforman para siempre en la cantidad .de
Cournot después de cualquier desviación. Sabemos que estas estrategIas
Consideremos el juego repetido infinitamente basado en este juego no pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dad
de etapa de Cournot, cuando las dos empresas tienen el mismo factor de de monopolio, mientras que para cualquier valor de 6, repetIr la cantIdad
descuento 6. Calculemos ahora los valores de 6 para los <fue,cuando las de Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.
"
",', dos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de ' Por tanto, la cantidad más rentable que puede darse con las estrategias del
Nash perfecto en subjuegos de este juego repetido infinitamente: ' clispáradoresfáentre q;,{/2 y qc. Para calcular esta cantidad, consideramos
la estrategia del disparador siguiente:
Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~n
e! primer periodo. En el t-ésim,o periúdo~producir qm/"Z Producir q* en el primer periodo. En el t-ésimo periodo,
SI ambas empresas han producido qm/2 en cada uno d~
producir q* si ambas empresas han producido q* en cada
los t- 1 periodos anteriores; en caso éúntnirio¡ producir, uno de los t ~,1 periodos anteriores; en caso contrario,
la cantidad de Cournot, qc. ,
producir la cantidad de Coumot, k
Puesto,qu~ e,!argumento e~ paralelo al dado para eldilem~de los pres;s El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, que
de la sección anterior, seremos breves en la discusión. '"
denotaremos mediante 11"*. Si la empresa i va a producir q* en este periodo,
El beneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es la cantidad que maximiza los beneficios de la empresa j en este periodo
(a - c)2/8,.que denotaremos por 1r m/2. ~l beneficio deuna empresa cuando es una solución de
ambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, si
la empresa i vaa producir qm/2 en este periodo, la cantidad que maximiza
max (a, - qj - q* - c)qj.
los beneficios de la empresa j en este periodo es uria sohición de ' _. qj
La solución es qj = (a. - q* - e)/2, con un beneficio de (a - q* - c)2/4, que

max
qj
(a - q'
J
_l,q
2'
~ c)q,
m - J de nuevo denotamos por 11" d. Que las dos empresas jueguen las estrategias
del disparador dadas anteriormente es un eql,tilibriode Nash siempré que
La solución es qj = 3(0. - c)/8, con un beneficio de 9(0. - c)2/64, que
denotamo~ mediante 11"d ("d" por desviaciÓn). ' Por tanto, que las dos! 1 8
-- '11"* > 7rd + --' 7rc,
empresas Jueguen la estrategia del disparador expuesta anteriormente es 1-8 - 1-6
un equilibrio de N ash siempre que ' ,
Despejando q* en la ecuación de segundo grado resultante se obtiene que
el valor menor de q* para el que las estrategias del disparador dadas
116
1- 6 ' 2"11"m ::: 7rd + 1 _ 6 . 11"c, '(2.3.2) ant~riormente son un equilibrio de Nash perfecto en subjuegos es
análoga a (2.3.1)en el análisis del dilema de los pr~~9S; S~stitu~e~do los 9 - 56

q* = 3(9 _ ó) (a - e),
',':.'
valores de11"m, -rrd y 11"cen (2.3.2)obtenemos que 6::: 9/1'1. Poi-Ías mi;mas
razones que en la sección anterior, este equilibrio d~ Nash es perfecto en
que decrece monótonamente con Ó, tiende a qm/2 cuando ó tiende a 9/17
subjuegos. "..,' ' "
y tiende a qc cuando 6 tiende a cero.
-":
10'1.1 JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) J !legos repetidos / 105
Exploramos ahora el segundo enfoque, que incluye la amenaza de perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash en
hacer efectiva la penalización más fuerte creíble. Abreu (1986) aplica esta cada clase de subjuegos. En los subjuegos de colusión, cada empresa
Idea a unos modelos de Cournot más generales que el nuestro, utilizando debe preferir recibir la mitad del beneficio de monopolio en lo sucesivo a
un factor de descuento arbitrario; nosotros simplemel1te demostramos recibir 7f d este periodo y el valor presente por penalización en el periodo
que el enfoque de Abreu permite que en nuestro modelo se obtenga el siguiente:
resultado de monopolio cuando f¡ = 1/2 (que es menor que 9/17). Consi-
1 1 (2.3.3)
deremos la siguiente estrategia del "palo y la zanahoria"): -- . -7r > 7rd + 8V(x).
1-5 2 m_
Producir la mitad de la cantidad de monopolio, qm/2, en En los subjuegos de penalización, cada empresa debe preferir administrar
el primer periodo. En el t-ésimo periodo, producir qm/2 el castigo a recibir 71" dp este periodo y empezar de nuevo la penalización
si ambas empresas produjeron qm/2 en el periodo t - 1, en el siguiente periodo:
qm/2 si ambas empresas produjeron x en el periodo t - 1,
Y x en cualquier otro caso. V(x) ?: 7r dp(X) + 5V(x). (2.3.4)
Sustituyendo V(x) en (2.3.3) obtenemos

Esta estrategia incluye una fase de penalización (de un periodo) en la que
la empresa produce x y una fase de colusión (potencialmerite infinita) en la
5 G7rm -7r(X») ?: 7rd - ~7fm.
que la empresa produce qm/2. Si cualquiera de las dos empresas se desvía
de la fase de colusión, empieza la fase de penalización. Si cualquiera de las Es decir, lo que se gana en este periodo por desviarse no debe ser mayor
d~)sempresas se desvía de la fase de penalización, ésta vuelve a empezar. que el valor descontado de la pérdida en el periodo siguiente debida a
SInmguna empresa se desvía de la fase de penalización, empieza de nuevo la penalización. (Siempre y cuando ninguna de las empresas .se desvié
la fase de colusión.
de la fase de penalización, no hay ninguna pérdida a parlii dél si~ente
El beneficio de una empresa si ambas producen x es (a - 2x - e)x, que periodo, ya que la fase de penalización termina y las empresas vüelven
denotaremos mediante 7f(x). Sea V(x) el valor presente de recibir 7f(x) en al resultado de monopolio, como si no hubiera habido desviación.) Dél
este periodo y la mitad del beneficio de monopolio en 16 sucesivo: mismo modo, (2.3.4) puede reescribirse como .
f¡ 1
V(x) = 7f(x) + -- . -7f
1- f¡ 2 m. 5 G7fm - 7r(x») ?: 7rdP ~ 7f(x?:: .
Si la empresa 'i va a producir x en este periodo, la cantidad que maximiza
el beneficio de la empresa j este periodo es la solúción de con una interpretación análoga. Para 5 = 1/2, (2.3.3)se cumple siémp~e y
cuando x/(a - e) no esté entre 1/8 y3/8, Y (2.3.4)se'C{unplesix/(a - e)
max (a - qj - x - e)qj.
está entre 3/10 y 1/2. Por tanto, pa~a 5 = 1/2, la,estrafégia del palo y la
qj zanahoria consigue que el resultado de mOÍ1.<)polio" sea un equilibrio de
Esta solución es qj = (a - x - e)/2, con un beneficio de (a - x - c)2/4, que Nash perfecto en subjuegos, siempre y cuando 3/Ss x/(a - e) S 1/2.
deno~amos por 7r dp(X), donde dp significa desviarse de la penalización. Existen otros muchos modelos de oligopolio dinámico que enriquecen
SI arr:ba.s .empresas juegan esta estrategia, los subjuegos del juego el modelo simple desarrollado aquÍ. Concluirnós esta sección discutiendo
.. ',
repet~~o mfulltamente pueden agruparse en dos clases: (i) subjuegos de brevemente dos clases de estos modelos: los modelos con variables de es-
coluslon:.en los que el resultado del periodo anterior fue (qm/2,qm/2) o tado y los modelos con supervisión imperfecta. Las dos clases de modelos
(x,x),y (n) subjuegos de penalización, en los que el resultado del periodo tienen muchas aplicaciones que trascienden el ámbito del oligopolio;por
~ntenor no fue ni (qm/2,qm/2) ni (x,x). Para que el que las dos empresas ejemplo, el modelo de salaribs de eficiencia de la próxima sección es un
jueguen la estrategia del palo y la zanahoria sea un equilibrio de Nash caso de supervisión imperfecta. ','
106 / JuEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2) Jllegos repel ido< / 107
Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusión en el W10S salarios más altos podrían inducir a que los trilbajado-
desarro 11ildos , , . .
ciclo económico, permitiendo que la intersección con el eje de abci~as de .' preparados solicitasen empleo en la empresa que los ofrecIelil,
res mejor . ,.
la función de demanda fluctúe aleatoriamente de un periodo al otro. En o podrían inducir a los trabajadores ya empleados a trabajar mas mtensa-
cada periodo, todas las empresas observan la intersección con el eje de ab- mente.
cisas de la función de demanda en ese periodo antes de tornar decisiones; Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inámico en el q.ue
en otras aplicaciones,los jugadores observan otras variables de estado l empresas inducen a los trabajadores a trabajar mas pagando salanos
al principio de cada periodo. El incentivo a desviarse de una estrategia :r:os y amenazando con despedir a los que sean descubiertos trabajando
pactada depende tanto del valor de la demanda en este periodo corno poco. Como consecuencia de estos salarios altos, las empresas reducen su
de los posibles valores de la demanda en periodos futuros. (Rotemberg demanda de trabajo, de forma que a1g1.mostrabajadores tendrán empleo
y Salonersuponen que la demanda no está correlacionada serialmente n salarios altos mientras que otros estarán (involuntariamente) parados.
de forma que esta última consideración ,es independiente del valor pre~ ca d ,. 1
Cuanto mayor sea el número de trabajadores para os, mas tIempo e
sente de la demanda, pero otros autores posteriormente han relajado este llevará a un trabajador que haya sido despedido encontrar un nuevo
supuesto.)
empleo, de forma que la amenaza de despido resulta más. efectiva. En
Green y Porter (1984) estudian la colusión cuando las desviaciones el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
no se pueden detectar perfectamente: en vez de observar las cantidades trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
escogi~~s ~or la otra empresa, cada empresa observa tan sólo el precio empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
de eqwlibno del mercado, que cada periodo recibe sacudidas debidas a Vamos a estudiar los aspectos de este modelo que tienen que ver co~
una perturbación aleatoria inobservable. En este contexto, las empresas los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
no puede,n distinguir cuándo un precio de equilibrio bajo se debe a que competitivo) analizando el caso de una empresa y un trabajador.
una ~ ,mas empresas se han desviado de la estrategia pactada o a que , Consideremos el siguiente juego de etapa. En primer lugar, la empresa
oc:un0 una perturbación adversa. Green y Porter examinan los equili- ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
bnos con estrategias del disparador tales que c~alquier precio por debajo rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
de un nivel crítico dispara un periodo de penalización durante el cual un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
las empresas juegan sus cantidades de Coumot. En equilibrio, ninguna escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
empresa se desvía. No obstante, una perturbación especialmente mala (lo que no le produce desutilidad). La decisión tornada por el traba~ador
puede hacer que el precio caiga por debajo del nivel crítico, desencade- sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
na~do un periodo de penalización. Como algunas penalizaciones ocurren produce es observado tanto por la empresa como por el.!!abajador. La
acc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en el producción puede ser alta o baja; para simplificar, suponemos que el
anahSls de las estrategias del disparador no son óptimas. Estrategias de nivel bajo de producción es cero y escribimos, eLnivel~1to como y > O.
dos ~ases del tipo ,analizado por, Abreu podrían parecer prometedoras; Supongamos que si el trabajador realiza un esfuerzo, la producción es ~J,ta
efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que pueden con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
ser optimas.
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de producción es signo inequívoco de falta de
2.3.D Salarios de eficiencia esfuerzo. .tI
Si la empresa emplea al trabajador con un salario w, las gananciils a

En los modelos de salariOs de eficiencia, lo que producen los trabajadores lbs jugado~es si el trabajador realiza un esfuerzo ~ la pro~ucción e: alta
de una empresa depende del salario que la empresa paga. En el con- son y - w para la empresa y w -'- e para el trabajador. SI el trabaJildor
texto. de lo: países en vías de desarrollo, esto se explicaría porque unos no se esfuerza, e es cero; si la producción es baja, y es cero. Suponemos
salan os mas altos podrían conducir a una mejor nutrición; en los países que y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr
108/ JUEGOSDINÁMICOS CON INFOI~lyIACIÓNCOMPLETA (c. 2) Jllegos repetidos / 109
empleado en la empresa y realizar un esfuerzo, aunque también le resulta es también análoga a estas estrategias del disparador, pero es ligeramente
m~jor ponerse de independiente a estar empleado en la empresa y no más sutil ya que el trabajador decide en segundo lugar en el juego de etapa
estorzarse. de decisión sucesiva. En un juego repetido basado en un juego de etapa de
El resultado perfecto en subjuegos de este juego de etapa es más decisión simultánea, las desviaciones se detectan sólo al final de la ronda;
bien poco prometedor: dado que la empresa pagaw por adelantado, el sin embargo, cuando el juego de etapa es de decisión sucesiva, una des-
trabajador no tiene ningún incentivo para esforzarse, de forma que la viación del primer jugador se detecta (y debería ser contestada) durante
empresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajar la misma ronda. La estrategia del trabajador es jugar cooperativamente
como independiente. Sin embargo, en el juego repetido infinitamente, la siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
empresa puede inducir un esfuerzo pagando un salario wsupérior a Wo y pero responder de forma óptima a cualquier desviación de la empresa,
amenazando con despedir al trabajador en cuanto la producción sea baja. sabiendo que el resultado perfecto en subjuegos del juego de etapa se
Demostramos que para algunos valores de los parámetros, la empresa jugará en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,
encuentra que vale la pena inducir un esfuerzo pagando ese salario. el trabajador acepta la oferta de la empresa pero no se esfuerza.
Uno podría preguntarse por qué la empresa y el trabajador no pueden Derivamos ahora las cond,iciones bajo las cuales estas estrategias son
firmar un contrato c-6mpensatorio que dependa de la producción, deforma un equilibrio de Nash perfecto en subjuegos. Como en las dos secciones
que induzca al esfuerzo. Una razón por la que estos contratos podrían anteriOres, el argumento consta de dos partes: (i) la derivación de las
no ser viables es que a un tribunal le resulta muy dificil. hacer que se condiciones bajo las cuales estas estrategias son un equilibrio de Nash, y '\."
cumplan, quizás porque una medida adecuada de la producción incluye (ü) la demostración de que es perfecto en subjuegos.
la calidad, las dificultades inesperadas en las condiciones de producción, Supongamos que la empresa ofrece w. en el primer periodo. Dada
etc. De un-aforrÍ1.amás general, es probable que loscontf?tos contingen~ la estrategia de la empresa, es óptimo para el trabajador aceptar. Si el
tes a determinadOs volú.menes de producción sean imperfectos (más que trabajador realiza un esfuerzo, está seguro que producirá al nivel alto,
completamente inviables), aunque los incentivos todavía pueden jugar un de forma que la empresa volverá a ofrecer w' yel trabajador volverá a
papel en el juego repetido estudiado aquí. enfrentarse en el periodo siguiente a la misma decisión sobre el esfuerzo
Consideremos las siguientes estrategias en el juego r~petido infinita- a realizar. Por tanto, si la decisión óptima dél trabajador es esforzarse, el
mente, que incluyen el salario 'W. >wo que se determinará más adelante. valor presente de las ganancias del trabajador es
Diremos que la historia del juego es de salarió álto y prod~c2ión alta si todas
las ofertas anteriores han sido 'W., todas las ofertas anteriores han sido Y.: = (w' - e) + 8y':,
aceptadas y todos los niveles de producción anteriores han sido altos. La
o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,
estrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecer
producirá al nivel alto con probabilidad p, en cuyo caso la misma decisión
w = 'W. en cada periodo siguiente siempre y cuando la historia del juego
con respecto al esfuerzo se dará en el próximo periodo, pero el trabajador
sea de salario alto, producción alta, pero ofrecer w = Oen caso contrario.
producirá el nivel bajo con probabilidad 1- p,en cuyo caso la empresa
La estrategia del trabajador es aceptar la oferta de la empresa si w ~_ Wo
ofrecerá w = O en lo sucesivo, de forma que en adelante el trabajador
(decidiendo trabajar como independiente en caso contrario) y realizar un
será independiente. Por tanto, si no esforzarse es la decisión óptima del
esfuerzo si la historia del juego, incluyendo la oferta presente, es de salario
trabajador, el valor presente (esperado) de las ganancias del trabajador es
alto y producción alta (no esforzándose en caso contrario).
La ~trategia de la empresa es análoga a las estrategias del dispara-
dor analIzadas en las dos secciones anteriores: jugar cooperativamente V. = w' + {j { pV.+ O -p\. wa_ }
{j'
siempre y cuando todas las jugadas anteriores hayan sido cooperativas,

pero escoger en lo sucesivo el resultado perfecto en subjuegos del juego o V. = [0- 8)'W' + {jO - p)71Jo]/(l - {jp)O - 8). Realizar un esfuerzo es
de etapa si alguna vez se rompe la cooperación. La estrategia del jugador óptimo para el trabajador si Ve ~ V., O
Juegos repelidos / 111
que puede interpretarse como la restricción f~~liar de que fj debe ser lo
w
*
2: Wo + '(1
1- p{j
p .
)e == Wo
(1 -
+ 1 + ---
(j
[jO - p)
e
)
(2.3.5)
suficientemente alta para lograr una cooperaclOn sostenIda.
. (j -
Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las
Por tanto, para inducir un esfuerzo, la empresa debe pagar no sólo Wo + e .estrategias que estamos considerando son un equilibrio de Nash: .Para
para compensar al trabajador por renunciar a la oportunidad de trabajar demostrar que estas estrategias son perfectas en subjuegos, defJmmos
como independiente y por la desutilidaddel esfuerzo, sino también por primero los subjuegos del juego repetido. Recordemos que cuan~'¡o el
la prima salarial O - {j)e/ [jO - p):NaturaImente, si p está cerca de uno (es juego de etapa obliga a decisiones simultáneas, lo~ subJuegos ~el Juego
',1'
decir, si no esforzarse es difícilmente detectable), la prima salarial debe repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode
ser extremadamente alta para inducir un esfuerzo. Si p == O, por otra parte, etapa de decisiones sucesivas considerado aquí, los subjuegos empIezan
esforzarse es la decisión óptima del trabajador si no sólo entre etapas sino también dentro de cada etapa, después de que el
trabajador observa el salario que la empresa ofrece. Dadas las estrategias
1 (* ) .,. fj de los jugadores, podemos agrupar los subjuegos en dos clases: los que
1 _ 6 w - e 2: w + 1- 6 wo, (2.3.6)
empiezan después de una historia de salario alto y producción alta, y los
análogamente a (2.3.1) y (2.3.2) en los casos con supervisión perfecta de que empiezan después de todas las demás historias. Hemos demosb'ado
las dos secciones anteriores, (2.3.6) es equivalente a ya que las estrategias de los jugadores son un equilibrio de Nash dada
una historia de la primera clase. Queda por hacer lo mismo cor~una
W* >
_wo+ '(1 1- 6)
.+-/5-. e,
historia del segundo tipo: como el trabajador no se esforzará l1\1nca,es
una decisión óptima de la empresa inducir al trabajador a trabajar como
queefectivamenfe es (2.3.5) con p == O. independiente; dado que la empresa ofrecerá V) == O en la siguiente etapa y
Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajador en lo sucesivo, el trabajador no debería esforzarse en esta etapa y debería
sea la mejor respuesta a la estrategia de la empresa, a la empresa tiene aceptar lá oferta presente sólo si 'w 2: O.
también que merecerle la pena pagar w::
Dada la estrategia del trabajador, En este equilibrio, trabajar como independiente es permanente: si se
el problema de la empresa en el primer periodo se c(;mcreta en escoger descubre al trabajador no esforzándose, la empresa ofrece 1J) == O en lo
entre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazando sucesivo; si la empresa se desvía alguna vez de ofrecer w ==. w*, el t.ra-
co~ ~espedir al trabajador si en algún momento la producción es baja, y bajador nunca volverá a esforzarse, de fiJrma quela empresa no puede
~eclbl~ndo por tanto la ganancia y - w* en cada periodo; y (2) pagar w == O, permitirse emplear al trabajador. Hay varias razC?naspara preguntarse
mdu~l~ndo con ello al trabajador a escoger trabajar como independiente, si es razonable que el trabajo como independiente sea permanente. En
y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Por nuestro modelo de una empresa y un trabajador, ambos jugadores pre-
tanto, la estrategia de la empresa es una mejor respuesta a la del traba- ferirían volver al equilibrio de salario alto y producción alta del juego
jador si repetido infinitamente, antes que jugar para siempre el resultado perfecto
en subjuegos del juego de etapa. Éste es el problema de la renegociación
y - w* 2: O. (2.3.7)
presentado en la sección 2.3.A. Recordemos que si los jugadores saben que
no se podrán hacer cumplir las penalizaciones, la cooperación inducida
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador por la amenaza de estas penalizaciones ya no es un equilibrio.
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una En el contexto del mercado de trabajo, la empresa puede preferir no
condición más fuerte si estas estrategias han de formar un equilibrio de renegociar si emplea muchos trabajadores, ya que renegociar con un tra-
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican bajador puede estropear el equilibrio de salario alto y producción alta que
1-/5 se está todavía jugando (o aún sé ha de empezar a jugar) con los otros
Y-e>
- 'tilo + ---e
60 - p) , trabajadores. Si hay muchas empresas, la cuestión es si ~aempresa .i con-
,'.
'112 í JUEGOS DlNÁMJCOS CON INFORMACJÓN COMPLETA (c. 2) fllegos repetidos / 113
tratará a trabajadores empleados anteriormente en la empresa .¡. Pudiera la autoridad monetaria observa esta expectativa y escoge el nivel real de
ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de inflación, -¡r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,
salario alto y producción alta logrado con sus trabajadores, como en el los empresarios quieren simplemente prever correctamente el nivel de
caso de una única empresa. Algo así puede explicar la falta de movilidad inflación; alcanzan su ganancia máxima (que es cero) cuando -¡r= 7[e. A la .'
~:;,,
de los administrativos jóvenes y varones entre las grandes empresas en autoridad monetaria, por su parte, le gustaría que la inflación fuera cero
Japón. . pero que la producción estuviera en su ruvel de eficiencia (y*). Escribimos
Alternativamente,si los trabajadores despedidos pueden siempre enla ganancia de la autoridad monetaria como
contrar nuevos empleos que sean preferibles a trabajar como independien-
tes, el salario en esos nuevos empleos (neto de cualquier desutilidad del U(-¡r,y),= ::-C'Tr2 _ (y _y*)2,
esfuerzo) es el que aquí juega el papel del salario en el trabajo por libre
lUo. En el caso extremo en el que un trabajador despedido no sufra nin-
donde el pªiá,meti-o c > O refleja el dilema de laaú,-t?I1d~dITl();l1~;~ria
~n~,~
S115 dos ~lJjeti~os'?llPo!;ga.mos q';le el verdad~!(): !ÚyeI d~ pr,c)~}lc.ción
guna pérdida, no existirán penaliza'ciones por no esforzarse en el juego
repetido infinitamente y, por consiguiente, no existirá ningún equilibrio es i~sigule;tefuIíd¿n del ~velde producción deseado'y de la in£l.ac.i~~
' iIDpfevista'; " , , ,
de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe
una aplicación elegante de estas ideas en el contexto de la deuda pública
y =by* + d(-¡r - -¡re),
externa en Bulow y Rogoff (1989): si un país endeudado puede conseguir
el importe de los créditos a largo plazo que recibe de los paíSes acreedores donde b < 1refleja ,la presencia de un poder de monopolio en los mer~
mediante transacciones a corto plazo por adelantado en el mercado inter- cados de productos (de forma. que si no hubiera inflación imprevista; se
nacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento produCiría a un nivel por debajO del de eficiencia) y d >' O mide el efecto de
de los términos de la deuda en el juego repetido infinitamente entre paíSes la iriflaciQrlin1prevista sobre.la producción a través de los salarios reales;
deudores y acreedores. tal ycomo se describió en el párrafo anterior. Podemos entonces reescribrr
la ganancia de la autoridad monetaria como. .
2.3.E Política monetaria estable en el tiempo
W(-¡r,7[e) = _c-¡r2 - [(b - l)y* +d(-¡r - 7[e)]2.
Consideremos un juego de decisiones sucesivas en el que empresarios y
trabajadores renegocian los salarios nominales, después de lo rualla auto- Para h~llar el resultadop;d~to en subjuego~A~:'~!~'jt;~~9. d~¿~~tp.J~
calculambs primero la elección óptima de-n: por Bme~ela,aut0!fd~9
ridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a
monetari~¡-a.adas l~s exp~étativas de los einpresarib~ -¡re.MaximiZando
de inflación. Si los contratos salariales no pueden' ser automáticamente
W(-¡r,-¡re) obtenemos
achlalizables, empresarios y trabajadores tratarán de prever la inflaCión
antes de fijar los salarios. Sin embargo, una vez se ha fijado el sala- d '
1l'*(-¡re)
= --:J?[(l - b)y* + d-¡re]. (2.3.8)
rio nominal, un nivel real de inflación superior al previsto erosionará el c+ u-
salario real, haciendo que los empresarios aumenten el empleo y la pro-
Dado qJle.los empresarios prevén que la autoridad monetaria escogerá
ducción. La autoridad monetaria, por tanto, se enfrenta aun dilema al -¡r*(-¡re),
i~$'empresarios escogerán la -¡reque maximice _[-¡r*(7[e)- -¡re]2,lo
tener que escoger entre los costes de la inflación y las ventajas de reducir
que da1r*(-¡re)= -¡re,o,.,
el paro y aumentar la producción ante una evolución impreVista del nivel
de inflación.
-¡re = ---y
d(1 - b) *' = ,-¡r.,
Como en Barro y Cardan (1983), analiZamos una versión en forma c
reducida de este modelo en el siguiente juego de etapa. Primero, los donde el subíndice s denota, "juego de etapa". De forma similar, podría
empresarios forman sus expectativas de inflación, -¡re.En segundo lugar, deCirse que la expectativa' niCiomilque los empresarios deben mantener
~
, ;:~;~~\:i!~W;Ú.;,~,\ ••~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;¡,,:,;1;'r,,,,l..l.'~I'
.••.,,.:.,,••;"" ••.:.:"'J.._~' ...•.•.•...•.
~-...:..!...~...:..-'~~L~,I _ •.~I;.l...;.'--:'<'~. ---.---------
Juegos dil1ámicos COll il1fOI'llWÓÓI1 completa pero illlpe,.[eda / 115

114 / JUEGOS DINÁMICOS CON TNFORMAClÓN COMPLETA (c. 2)
<... es la que será confirmada en lo sucesivo por la autoridad monetaria, de (2,39)

form~ que "*("e) =: ".e, y por tanto ".e = "'s' Cuando los empresarios
_l_W(O O) > w (".+(0),0) + _rS_vV("',""'s),
1-b '- 1-15
mantIenen esta expectativa ".e =: "'s, el coste marginal en que incurre la
autoridad monetaria al fijar". ligeramente por encima de ".s compensa que es análoga a (2.3.6). 2
Simplificando (2.3.9) obtenemos b 2: c/(2e + d ). Cada u~o de los pa-
exactamente el beneficio marginal de la inflación imprevista. En este
rámetros c Y d tiene dos efectos. Un aumento en d, por ejemplo, hace
resultado perfecto en subjuegos, se espera que la autoridad monetaria
que la inflación imprevista sea más efectiva de cara al aumento de ~a
".-,: cree inflación y así lo hace, pero estaría mejor si pudiera comprometerse a
producción, y resulta por tanto más tentador para la autondad mon:tana
no ~rear inflación. Efectivamente, si los empresarios tuvieran expectativas
ser indulgente con la inflación imprevista, aunque por la mIsma razon, un
racIOnales (esdecir, rr =: ".e), una inflación cero maximiza la ganancia de la
aumento en d también aumenta el resultado del juego de etapa"" lo que
autoridad monetaric:.(es;decir, W(". ,'" e) = _c".2 - (b - 1)2y*2 cuando". = ".e,
hace que la penalización sea más dolorosa para la autoridad monetária,
defonna que"..==O~só1'5tiroo)., ... .. .
Dél mismo modo, un aumento de c hace que la inflación sea más dolorosa,
.. . C6risi~~r~n10sah~ra!erjüeg() rer'etidO infinitam,ente en el que ambos
por lo que la inflación imprevista resulta m~n~s tentadora, pero ~ambién
. Jugadores tienen el rmsmo factor de descuento Ó. Derivaremos condicio-
hace que".. disminuya. En ambos casoS, el ultImo efecto pesa mas que :1
nes bajo las cuales". = ".e.=: Oen cada periodo de un equilibrio de Nash
primero, de forma que el valor crítico del factor de descuento necesarIO
per~ecto en subjuegos que incluya las siguientes estrategias. En el primer
para mantener este e.quilibrio, c/(2c + d2), decrece c~n d y crece c.onc.
penado, los empresarios mantienen la expectativa ".e =: O. En periodos
Hasta ahora hemos demostrado que la estrategIa de la autondad mo-
sucesivos.mantienen1a expectativane =;'O siempre y cuandó todas las
netaria es una mejor respuesta a la estrategia de los empresarios si (2.3.9)s~
expectativas anteriores hayan sido ne=: ó.}' todos los niveles de inflación
cumple. Para demostrar que éstas estrategias son un equilibrio ~e Nash,
a~teriores.hayan sido e0ctivamente ". =: O;en caso contrario, los empresa-
queda por demostrar que la última es una mejor resp.uesta ~ la pnmera,.lo
nos.mantienenJa'exp'ectativaie =:".. (la expectativa racional en el juego cual se deriva de la observación de que los empresanos obtIenen su mejor
de etapa), De forma similar, la autoridad monetaria fija". = Osiempre
ganancia posible (que es cero) e.\lcada periodo. Demostrar q~e :stas es-
. ,~.;. y cuando la expectativa presente sea ne,.", O;todas las expectativas ante-
trategias son perfectas en subjuegos requiere argumentos analogos a los
~ores hay.an sido ".e = OY todos los niveles de inflación anteriores hayan
'.":.' sIdo efectIvamente". = O;en caso contrario, laautorid'ad monetaria fija de la sección anterior.
".=: ".*(nC}(sumejor respuesta a las expectativas de l()s empresarios, tal
como se indica en (23.8». .. ',.' "; . . .
2.4 Juegos dinámicos con infoIDlación completa pero imperfecta
Supongamo~que los empresarios mantienen la eXpectativa ".e = O
en el primer periodo. Dada la estrategia de los empresarios (es decir,
2.4.A Representación de los juegos en fonna extensiva
la forma en que los empresarios actualizan sus expectativas después de
obse~a~ el nivel verdadero de inflación), la autoridad monet~riapuede
En el capítulo 1 estudiamos juegos estáticos representándolos en forma
restrmg¡r su atención a dos decisiones: (1)". =: O, lo que conducirá a
normaL Analizamos ahora juegos dinámicos representándolos en forma
ne = Oe~periodo siguiente y, por tanto, a la misma decisión por. parte de
extensiva.19 Este enfoque expositivo puede hacer que parezca que los
la autondad monetaria en el siguiente periodo; y (2) n = ".*(0)utilizando
(2.3.8),10 que conducirá a".e en lo su~esi~o,'en cuyo caso la autoridad =".. juegos ~státicos tienen que representarse en fo~a nom:al y los juegos
dinámicos en forma extensiva, pero esto no es asI. CualqUJer Juego puede
monetaria encontrará que es óptimo en lo sucesivo escoger n =: ". •. En
representarse tanto en forma normal como extensiva, aunque para algu-
con~ecuen~ia, fijar". =: Oen este periodo resulta en la ganancia W(O,O) por
p~n~do, mIentras que fijar" =: ".*(0)eneste periodo resulta en la ganancia
W (". (O),O)eneste periodo, pero W(". .,".) en lo sucesivo. Parlo tanto, la 19 Damos una descripción ü;'formaJ de la forma extensiva; p'ara un tratamienTo preciso
est:rategia de la autoridad monetaria es la mejor respuesta consúltese Kreps y Wilson (1982).
116/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos dinámicos con información completa pero imperfecta / 117
nos juegos una de las dos formas es más apropiada que la otra. Vamos a Este árbol empieza con un nodo de decisión correspondiente al jugador
ver cómo los juegos estáticos pueden representarse utilizando la forma ex- 1, donde 1 escoge entre 1 y D. Si el jugador 1 escoge 1,se llega a un nodo
tensiva y cómo los juegos dinámicos pueden ser representados utilizando de decisión del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,
la forma normal. si el jugador 1 escoge D, se llega a otro nodo de decisión del jugador 2,
Recordemos de la sección l.1.A que la representación en forma normal donde 2 escoge entre l' y D'. Después de cada una de las decisiones de
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles 2 se llega a un nodo terminal (es decir, el juego termina) y se reciben las
de cada jugador y (3) las ganancias recibidas por cada jugador para cada gan¡mc;iasindicadas ..
combinación de estrategias posibles. Es inmediato extender el árbol de la figura 2.4.1 para representar
cualquier juego dinámiCo con información completa y perfecta, es decir,
Definición. La representación en fanna extensiva de un juego exige preci~ar: cualquier juego en el queros jugadores toman sus decisiones uno después
(1) los jugadores, (2a) cuándo tiene que jugar cada jtigador,(2b) lo qt{e cada del otro, todas las decisiones previas son información del dominio público
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada antes de realizar el siguiente movirnientoy las ganancias a los jugadores
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida con cada combinación factible ,de decisiones son información del domi-
por cada jugador para cada combinación posible de jugadas. nio público. (Los espacios. de-acciones continuos, como en el modelo de
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos 5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,
analizado varios j~egos representados en forma extensiva. La contri- presentan dificultades gráficas pero no conceptuales) Deriva~os segui-
bución de esta sección consi~te elldescribir estos juegos en forma deárbol d¡mWl1teJareprese~tfición.en forma ,normal del juego:de la figura 2.4.1.
en vez de utiliZár' palabr~s, porqtie el uso deárbo~es,.~ menudo'facilita C:0l1clpimospOI\últiIIÍ.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!á~cosc
tanto la explicaci6n co~o el análisis. ' .. , .> .,. - ' .. Plledel1represerÚarse enfofI!la extensiva y descnbiend() cómo represen~ .
Como ejemplo de un juego en formaextensiva, consideremóseI si- tar en formaext~nsiva l()s juegos dinámicos con información ~9rnpleta
glliente representante dé la clase de juegos en dos etapas 'con información pero imperfecta.
completa y perfecta presentada en la sección 2.1.A: Tal como parecen indicar las convenciones sobre nmneración ~l~)as
definiciones de las-formas no,rmaly extensiva, existe una íntiIna relaC;ión
1. El jugador 1 escoge una acción al del conjunto factible Al = {J,D}.
entre las estrategias f¡;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~
2. El jugador 2 observa al y escoge entonces una acción a2 del conjunto
nornal y la descripcipl1 de cu'ándo dec.ide un jugadorrcqu~'p:ll.~doe'):¡a<;£ú
,42 = {J',D'}.
qp.ésabe(apartados 2ª,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.tiñ
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el árbol de
juego dinámico en forma normal, necesitamos.h"aducirJ~Wof!!laciónen:
la figura 2.4.1.
forma e?'tensiva en términos de la descripción del espacio de estrategías'
<.. 2,') de cada jugador en la fórma~normal. Para hacer esto, recordemos la
definición de estrategia dada (formalmente) en la sección 2.3.B:
Definición. Una estrategia de un jugador es un plan de acción completo, es

decir, e~pecifica una acción factible de/jugador en cada contingenCia en la que al
jugador le pudiera corresponder actuar.
l'
-.'
Ganancia al jugador 1: 2 o . Puede parecer innecesario exigir que la estrategia de un jugador es-
Ganancia al jugador 2: 1 O
-p~tmque una acción factible, para cada contingencia en la que al juga-
db~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no
Figura 2.4.1 . ,poarí¡¡qlOs aplicar lanocióri de equilibrio de Nash a los juegos dinámicos
118/ JUEGOS DINÁMICOS CON INFORMACfÓN COMPLETA (c. 2)
Juegos dinámicos COI! informaciá,¡ comFleta Fero imFerfecta / 119
con información completa si permitiéramos que las estrategias de un ju-
, ., forma extensiva. Denominemos las filas de la forma normal
gador ~epran sin especificar sus acciones en algunas contingencias. Para entaClonen . I d
sd aCuerd oc on las estrategias factibles del Jugador 1 y las ca umnas e
que el Jugador j calcule una mejor respuesta a la estrategia del jugador i,
puede que j necesite considerar cómo,actuaría i en todas y cada una de las, ' e d o con las estrategias factibles del jugador.. 2, y calculemos las gana 11-
euer
contingencias, no sólo en las contingencias que i o j creen que es posible' ~aoo 1 J'ugadores
a. ' en cada combinación posIble de estrategIas, " como se
~~~. . dica en la figura 2.4.2.
111 Una vez mostrado que un juego dinámico puede rep~esentars: .en
En el juego de la figura 2.4.1, el jugador 2 puede tomar dos acciones, ,'c:
pero ppsee cuatro estrategias, puesto que hay dos contingencias diferentes' formano,rmal pasemos, seguidamente a demostrar cómo un Juego , estatIco
(concretamente, después de observar que el jugador 1 ~scoge Iy después ' . de
(es d eClr, , decisiones simultáneas)
' puede representarse
., en
'. forma , exten-
de observar que el jugador 1 escoge D) en las que podría corresponder siva. Para ello, nos basamos len la observaoon hecha en la sec~IOn ] .l.A
actuar al jugador 2. ,_. -.e., . '" ", , (en conex¡'o'ncon el dilema de los presos) de que , no es necesano que los .
, 'dores actúen simultáneamente: es suficiente con que cada uno escoJa
'. ~'
¡ugaestrateoia sin conocer la decisión del otro, como sería el caso en el
,!strategial: Si el jugador 1 juega [,entonces jugar!'; si el jugado~l una o~ d .. Id
Juega D, entonces jugar !', 10que denotamos por (JI,!'). , dilema de los presos silos presos tomaran sus eC¡SlO~eSen cea: :epa-
.. radas. Por tanto, podemos representar un juego de (d¡gamos) deosJOnes
, o.'. ,!strategia 2: Si el jugador 1 juega 1, entonces jugar 11; si el jugador 1
, Juega D, entonces jugar DI, 1() que denotamos por (JI,DI). simultáneas entre los jugadores 1 y 2 como sigue:
o,!strategiíl3: Si el jugador 1juega!, entonces jugar DI; si el jugador T
Juega D, entoncesjugar !', lo que denotamos por (DI,!I). , 1. El jugador 1 escoge una acción al del conjunto factible Al'
2. El jugador 2 no observa la decisión del jugador 1, pero escoge una
''!strategía 4: Si elJugador 1 juegaI, Emtonce~jugar DI; si el jugador 1
Juega D,entonces jugar DI; lo que denotamos por (DI,DI). acción az del conjunto factible Az-
3. Las ganancias son tI'l (aj,az) y uz(al,az).
~l jugad~r 1, sin embargo, tiene dos acciones pero sólo dos estrategias:
Alternativamente, el jugador 2 podría jugar primero y el jugador 1 podría
Jugar 1 yJugar D. La razó~ por la cual el jugador 1sólo tiene dos estrategias
decidir sin obervar la acción de 2. Recordemos que en la sección 2.1.B
:s que solo hay una contingencia en la que pudiera torresponder jugar al
demostramos que un juego consiste en escoger cantidades con esta f.or111a
Jugador 1 (concretamente, la primera jugada, que corresponde al jugador
temporal y estructUra informativa difiere significativa,mente del J~Jego
1), de.forma que el espacio de estrategias del jugador1 es equivalente al
espacIO de acciones Al == {1,D}. ,. . de Stackelberg, que tiene la misma forma temporal pero, una estructura
informativa taL quedacempresa 2 observa la decisión de la empresa ?_
Jugador 2 Hemos visto que el juego de decisiones sucesivas y ac~ón del contrano
no observada tiene el mismo equilibrio de Nash que el Juego de COUlnot
(JI,!') (J';DI) (DI,!') (DI,DI)
de decisión simultánea.
1 3,1 3,1 1,2 1,2 Para represen:tar este tipo de ignorancia sobre los mo~i~ientos ante-
Jugador 1 "
',---.../
/
riores en un juego en forma extensiva, introducimos la nOC1On de conjunto
D 2,1 0,0 2,1 0,0
de información de un jugador.
')
"",.;
Figura 2.4.2
Defuliciónó Un conju~to de itlfonnación de un jugador es una colección de
nodos de decisió~ que satisface:
.Dados estos espacios dl7estrategias de los dos jugadores, eSÍnil1ediató
",.,' denvar la representación ,en forma normal del juego a partir de surepre- W al jugador le corresponde jugar ett-cada nodo del conjunto de informacióny.
(ii) cuarido en el transcu'rso del juego se llega a 11/1 nodo del conjunto de 111fOl-
¿
120/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos dinámicos con información completa pero imperfecta / 121
mación, el jugador al que le corresponde decidir no sabe a qué nodo dentro del Como segundo ejemplo del uso de un conjunto de información para
conjunto de infonnación se ha (o no se ha) llegado. representar la ignorancia de las jugadas anteriores, consideremos el si-
guiente juego dinámico con información completa pero imperfecta:
La parte (ii) de esta definición significa que, en un conjunto de información,
el jugador debe tener el mismo conjunto de acciones factibles en cada nodo
de decisión; en caso contrario el jugador seria capaz de inferir a partir del 1. El jugador 1 escoge una acción al del conjunto factible Al = {l,D}.,
conjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s) 2. El jugador 2 observa al y escoge a continuación una acción a2 del
nodo(s). conjunto factible A2 = {J',D'}.
3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuación
Preso 1
una acción a3 del conjunto factible A3 = {I",D"}. -1
La representación en forma extensiva de este juego (ignoramos las ganan-

cias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;
el jugador 3 tiene dos conjuntos de información: uno con un único ele-
mento que sigue a D por parte del jugador 1 y DI por parte del jugador
2 y otro con más de un elemento que incluye los demás nodos en los que
le corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3
observa es si (al,a2) = {D,D'} o no ..
4 o 5 1 1 D
4 5 O 1 ':."'
Figura 2.4.3
3
En un juego el! forma extensiva, indicaremos que una colección de
nodos de decisióneonstituye un-conjunto de información con una línea
discontinua, como en la representación en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qué jugador- le corres-
ponde mover en los nodos del conjunto de información por medio de una
Figura 2.4.4
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la línea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretación del conjunto de información del preso 2 en la fi- Ahora que hemos definido la noción de conjunto de información, po-
gura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe demos ofrecer una definición alternativa de la distinción entre información
es que se ha llegado al conjunto de información (es decir, que el preso 1 perfecta e imperfecta. Definimos previamente la información perfecta di-
ha decidido), pero no a qué nodo se ha llegado (es decir, lo que ha hecho). ciendo que en cada jugada, el jugador al que le corresponde jugar conoce
Veremos en el capítulo 4 que el preso 2 puede tener una opinión de lo que toda la historia del juego hasta ese momento. Una definición equivalente
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta es que cada conjunto de información contiene un único elemento: Por
cuestión hasta entonces. el contrario, la información imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2) Juegos dinlÍmicos COI1infonl1nóón completa pero imperfecto / 123
cO~j~ntode informaci~n con má~ de un elemento,19Por tanto, la represen- (a) empieza en un nodo de decisión n que sea un conjunto de información con 1111
t~ClQnen forma extensiva de un Juego de decisiones simultáneas (como el único elemento (pero que no sea el primer nodo de decisión del juego),
~lle~a de l~s presos) es un juego con información imperfecta. De forma (b) incluye todos los nodos de decisión y terminales que siguen a n en el árbol
~lml1ar, l~: J~egos en dos etapas estudiados en la sección 2.2.A poseen. (pero no los nodos que no siguen a n) y
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son (e) no intersecta a ningún conjunto de información (es decir, si 1m nodo de
slmultaneas~ como también lo son las decisiones de los jug~dofes 3 y 4.. decisión n' sigue a n en el árbol, todos los otros nodos en el conjunto de
?e forma mas general, un juego dinámico con información co'mpleta pero información que contiene a n' deben también seguir a -n y, por tanto, deben
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos incluirse en el subjuego).
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la Debido al comentario entre paréntesis de la parte (a), no contamos el
figura 2.4.4. ." .... ,_. ..", .... ", "
juego completo como un subjuego, pero esto es sólo una cuestión de
" .: '. -- ". - ~
.
estiló: eliirtinar ese comentario entre paréntesis de la definición no tendría
2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~" ningúri efecto.
~ '-..:. Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
En la secció~ 2.3.B di~ós la définición generalder'eqtiilibriOdé~~shper: ~.". de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definición. En la
fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6í:lsóloa jueg(Js' . figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
repetido~ porque defimmos' los conceptos de estrategia' ysubjuego sólo' . decisión del jugador 2. En el dilema de los presos (o cualquier otro juego
para los Juego~repetidos. En la secCión2AA dimos la.definición gene" de decisión simultánea) no hay subjuegos. Para ilustrar la parte (c) de la
ral de ,estrategIa. Presentamos ahora la definieióngeneral de subjuego, definición', consideremos el juego de la figura 2.4.4. Sólo hay un subjuego,
despues de lo cual podremos aplicar la definición de equilibrio de Nash el que empieza en el nodo de decisión del jugador 3 que sigue a D por
perfecto en subjuegos a los juegos dinahúcos con inforinación completa parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
en general. este juego ningún subjuego empieza en ninguno de los nodos de decisión
del jugador 2, aun cuando estos dos nodos son conjuntos de información
, Recordemos que en la sección 2.3.Bdefinimos inforinalmertte un sub-
jue.go como la parte del ju~g,?que'q\teda'pórjugatecipeZáIldbeit cual- . de un único elemento.. .
"Vná trtanera de motivar la parte (c) consiste en áfumar que queremos
qUl~r momento en el que lá.~~storia éOrripletadeljuego has~a eritonces
poder ari~liiar ili1subju~gcipor sí mismo y que qti~rem6s que el a'náiisi's
sea mfo~~.c!6n deldoiriinióp~b~C~ entretbdosiosjugádor~tydiinós
un~ defimclOn formal en el caso de los juegos répetidos,que"eht6nces searei~vaiít~pai~el juego completo. En la figura 2.4.4, si intentáramos
definir un:'subjuego que empezara en el nodo de decisión del jugador 2
~stabam~s, co~sideran.do',Ofrecemos ahora una. definicióh fdrmál' para
Juegos dmarrucos con mformación completa en genera], en téI111iri6sdé la qué sigue a la decisión I del jugador 1, estaríamos creando un subjuego en
representación e.nforma extensiva del juego. el que el jugador 3 ignora la decisión del jugador 2 pero conoce la deeislón
del jugador.1. Tal subjuego no sería relevante para el juego completo
porque en ~ste lÍltimó el jugador 3 no conoce la jugadade 1, sino que tan
Definición. Un subjuego en un juego énforina extensiva
-~.--:': sólo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleEÚ-fsimojuego de etapa de 1.111 juego repetido no es en sí mismo
19 . '. ":.~:;C >0 ••••••••
, Est~ ~aracterización de la informaaón perfecta e imperfecta en términos de 20njuntos de un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
informaaon con ~o o más elementos está restringida a los juegos cón info~ació" complet; Otra m'anerade motivar la parte (c) es dándonos cuenta de que la
~~~te, com~.veremos en el c~pítulo,4, la ,repre~:,n;a,~ón.."n fonTlae.x.\é~~~~<'l'd{~ ju~i¿. parte (a) sólo garantiza que el jugador al que le corresponde jugar en el
formaclOn perfecta pero Incompleta tiene un conjunto de informaciÓn cóf(inái; dé' uti .
elemento. En este capítulo, sin embargo, restringimos nuestra atención a la infbrmacióh nodo n conoce la historia completa del juego hasta ese momento, no que
completa. ., los demás jugadores también conozcan la historia. La parte (c) garantiza
12~ / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) JlIegos dinámicos con información completa pero imperfecta / 125
que la historia completa del juego hasta ese momento sea información del Hemos encontrado ya dos ideas íntimamente ligadas al equilibrio de
dominio público en el siguiente sentido: en cualquier nodo que sigue a Nash perfecto en subjuegos: el resultado por inducción hacia atrás defi-
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el nido en la sección 2.1.A y el resultado perfecto en subjuegos definido en
juego llegó al nadan. Por tanto, incluso si ni pertenece a un conjunto de la sección 2.2.A. En términos informales, la diferencia es que un equili-
información con más de un elemento, todos los nodos en ese conjunto de brio es una colección de estrategias (y una estrategia es un plan completo
información siguen a n, de forma que el jugador al que le corresponde de acción), mientras que un resultado describe lo que pasará sólo en las
decidir en ese conjunto de información sabe que el juego ha llegado a un contingencias que se espera que se den, no en cada posible contingencia.
nodo que sigue a n. (Si las dos últimas afirmaciones parecen difíciles es en Para ser más precisos sobre esta diferencia entre equilibrio y resultado, .....
"
parte porque la representación en forma extensiva de un juego especifica y para ilustrar.la noción de equilibrio de Nash perfecto en subjuegos,
lo que el jugadori sabe en cada uno de sus nodos de, decisión, pero no !econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.
hace explícito lo que el jugador i sabe en los nodoséfe decisión de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de Definición. En el juego en dos etapas con información completa y perfecta
cómo podría no cumplirse la parte (c). Podemos ahora reinterpretar este definido en la sección 2.1.A, el resultado por inducción hacia atrás es (aj',R2(aj'»
ejemplo: si caracterizásemos (informalmente)1o que el jugador 3 sabe pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al».
en el nodo de decisión del jugador 2 que sigue a la decisión 1 por parte
del jugador 1, diríamos que 3 no conoce la: historia del juego .hast~ ese .C;.,
En este juego, la acción aj' es una estrategia del jugador 1 porque sólo
momento, ya que 3 tiene otros nodos de decisión en lasque 3no sabe sil -hay una contingencia en la que le puede corresponder actuar, el principio
jugó 1 o D. ~;.
del juego. Sin embargo, del jugador 2, R2 (aj') es una acción (concretamente
Dada la definición general de subjuego, podemos;ahora aplicar la la mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~
definición de equilibrio de Nash perfecto en subjuegosde la sección 2,3.B. gia para el jugador 2 debe especificar la acción que 2 tomará después' de
cualquier posible decisión de 1 en la primera ronda. La función de mejor "
1',.,
Definición. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las respuesta R2(al), por otro lado, es una estrategia del jugador 2. En este
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego. juego, los subjuegos empiezan (y terminan) con el moVimiento del juga-
dor 2 en la segunda etapa. Hay un subjuego para cada acciónfactible,'al
Es inmediato demostrar que cualquier juego dinárrlicü:finito con.infor-
en Al, del jugador L Para demostrar que (aj',R2(al» esUILequilibrio de
mación completa (es decir, cualquier juego dinámico en él q~~ iffi ~&nero
Nash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at»"
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jéné
es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
yen un equilibrio de Nash en cada uno de estos subjuegos ... Como los
mixtas. El argumento procede por: construcción, utilizando un procedi-
subjuegos no son más que problemas de decisión unipersonales, se trata
miento parecido a la inducción hacia atrás, y está basad~. en dos o~stTrva-
de exigir que la decisión del jugador 2 sea óptima en cada subjuego, que
ciones. Primero, aunque presentamos el teorema de Nash en el contexto
es exactamente el problema que la función de mejor respuesta, R2(al),
de juegos estáticos con información completa, éste se extiend~ a'todo
juego finito en forma normal con informaciÓn complef~, y hemos visto
(donde un subjuego es un subjuego menor si na contiene más subjuegos). Sustituyamos
que estos juegos pueden ser estáticos o dinámicos. En segundo lugar, un entonces cada t¡no de estos ~up¡I.l~¡;'?~,!??rl~~ g~~S~!ls.de. uno d~7~ equilibrios de Nash. i"
juego dinámico finito con información completa tiene llÍl nÓínerq)lnito Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales en .'
~.'. '
de subjuegos, cada uno de los cuales cumple las hipótesisdelte~r~riía dé una versión truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores de
Nash.20 . -. - '. este juego truncado que contengan estas nadas' ~e~es Y: sustituyamos cada uno de estos
subjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta forma
:~
hacia atrás a lo largo del árbol, s<;9~tje,'!t¡ur ~qUlli~~o ~e Nash perfecto en sub¡uegos,porque
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos primero las estrategias de los jugadores con~tit;uY~)l, uneqllilibno de Nash (de hecho, un eqUlhbno de
t"dos los subjuegos menores que contienen nodos terminales en el árbol del. juego original Nash perfecto en subjuegosl en cada subjuego.- .
'<.;'
JlIegos di17ál17icos C017 i17forl17aeió17 completa pero imf,,:rfeela /127
y D (que conduce a una ganancia de 2 por parte del jugador] después

soluciona. Finalmente, (ai,R:z(al)) es un equilibrio de Nash porque las
de que 2 juege 1'). Por tanto, la mejor respuesta de. 1 al comportamiento
estrategias de los jugadores son mejor respuesta la una a la otra: o.i es una
previsto del jugador 2 es jugar D en la primera etapa, de forma que el
mejor respuesta a R2(al), es decir, o.i maximiza 1J,1 (0.1,R2(0.1)), y R2(0.1) es
resultado por inducción hacia atrás del juego es (D,1'), como se indica con
,',una mejor respuesta a ai, es d~dr,R2(ap maximiza ¡do.i ,0.2)'
la trayectoria en negrita que empieza en el nodo de decisión del jugador
Los argumentos son análogos' para los juegos considerados en la
1 en la figura 2.4.5. Hay una trayectoria en negrita adicional que emana
,/,' sección 2.2.A, de forma que nos ahorramos los detalles.
del nodo de decisión del jugador 2 que sigue a la de~isión 1 del jugildor 1.
Esta trayectoria parcial a lo largo del árbol indica que el jugador '2 habría
Definición. En el juego en dos etapas con infonnación'completa pero imperfecta
escogido D' sise hubiera llegado a ese nocla de decisión.
definido en la sección 2.2.A, el resultado perfecto en subjuegos es {o.i ,o.i,0.3 (0.1' o.i),
0.4:(a1,ai)), pero el equilibrio de Nnshperfeeto en subjuegos es (o.i,0.2;0.; (al ,0.2),
'a4:(aT~0.2)).
En este juego, el par de acciones (a3(ai,a2),o,4:(a1,0.2 »

es el equili-
brio de Nash del subjuego que juegan por separado los jugadores 3 y
4 (concretamente, el juego que queda después de que los jugadores 1 y
"'-:,'
~.escogen (ai,ai)), mientras que (aj(aJ,a2},a4:(al,0.i)) es una estrategia del
jugador 3 y una estrategia para el jugador 4, es decir unos planes de.acción
2ompletos que describen una respuesta a cada par de movimientos fac-
Fblesde los jugadores 1 y 2. En este juego, los subjuegos consisten en
3 1 2 o
la interacción en la segunda etapa entre los jugadores 3 y 4, dadas las 2 1 O
1
acciones tomadas por los jugadores 1 y 2 en la primera ronda. Tal y como
exige.el equilibrio de Nash perfectO'en subjuegos, el par de estrategias Figura 2.4.5
(a;(al,aú,a'¡(al,aú) especifica un equilibrio de Nash,en cada uno de esto
subjuegos.
Recordemos que la representación en forma normal de este juego se
'Coriduim~sesta sección (y esté:~apítulo) con un ejemplo que ilustra
dio en la figura 2.4.2. Si hubiéramos encontrado este juego en forma
el tema~principal del capítulo: la perfección en los subjuegos elimina
normal en la sección 1.1.C, habríamos hallado sus equilibrios de Nash
los equilibrios de Nashque.sé basan en'promesas o amenazas que no
(con estrategias puras). Éstos son (D/D',!'» e (!,(D',D')). Podemos
son creíbles. Recordemos el juego en forma extensiva de lá figura 2.4.1.
ahora comparar estos equilibrios de Nash en el juego en forma norIllal de
Si hubiéramos encontrado este juego en la sección 2.1.A, lo habríamos
la figura 2.4.2 con los resultados del procedimiento por inducción hacia
resuelto poririducción hacia atrás del siguíente;nodo: si el jugador 2
atrás en el juego en forma extensiva de la figura 2.4.5: el equilibrio de Nash
alcanza el riada de decisión que sigue a la decisión 1 del jugador 1, la
(D,(D',J')) en la representación en forma normal corresponde a todas las
mejor respuesta de 2 es jugar D' (lo que proporciona una ganancia de 2)
trayectorias en negrita de la figura 2.4.5. En la sección 2.1.A llamamos
en vez de jugar l' (que proporciona tina ganancia de 1). Si 2alcanza el nodo
a (D,J') el resultado por inducción hacia atrás del juego. Sería natural
de decisió.nque sigue alá decisí~nD..del jugador 1, la mejor respuesta de 2
llamar a (D,(D',1') el equilibrio de Nash por inducción hacia atrás del
es jugar l' (lo qué proporciotui\ciéi gahancia de l)'en vez de jugar Di (que
juego, pero utilizaremos una terminología más general y lo lJamaretnos el
proporciona una ganancia de O). Dado que el jugador 1 puede resolver
equilibrio de Nash perfecto en subjuegos. La diferencia entre e1resultado
el problema del jugador 2 tanto como el propio jugador 2, el problema
y el equilibrio es que el resultado sólo especifica la trayectoria en negrita
de 1 ,~I11a prírn~ra nmdas~ c~~Cre.ta en eséoger entré r (que conduce a
que empieza en el primer nodo de decisión del juego y acaba en un nodo
una gananCia. de 1 por parte del jugador 1 después de que 2 juege D')
Lecturas adicionales / 129
128 / JUEGOS DIN.Á.MICOS CON INFORMACIÓN COMPLETA (e. 2)
terminal, mientras que el equilibrio también especifica la trayectoria en es equivalente a forzar al jugador a considerar una posible con~ngencia
negrita adicional que emana del nodo de decisión del jugador 2 que sigue a en la que le correspondería jugar, ya que si en el transcurso del Juego se
la decisión 1del jugador 1. Es decir, el equilibrio especifica una estrategia llega a ese conjunto de información, el jugador no sabe si se ha ~~~ado ~
completa del jugador 2. ese nodo de decisión o no, precisamente porque el nodo de deClslOnesta
contenido eh un conjunto de información con más de un elemento.
Pero, ¿qué pasa con el otro equilibrio de Nash, (/(D',D'»? En este
equilibrio, la estrategia del jugador 2 es jugar D' no sólo si el jugador 1 Una forma de tratar él problema de los conjuntos de información co~
escoge I (como también ocurría en el primer equilibrio) sino también si el más de un elemento cuando se utiliza inducción hacia atrás, es proce'-
der hacia atrás a lo largo de la forma extensiva hasta que se encuentre ::.:',,,
jugador 1 escoge D. Dado que D' (si sigue a D) conduce a una ganancia
de Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte del un conjunto de información con más de un elemento, pero saltándoselo
Jugador 2 es jugar I, consiguiendo con ello una ganancia de 1 (después de y siguiendo haóh arriba"en el árbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.
que el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguaje formación con unúniw elemento. Uegados ahíhabra que consIdera::'.
vago pero sugerente, podría decirse que el jugador 2 está amenazando no sólo lo que el jugador al que le corresponde jugar ené~ecónjUrit'ó"
con jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tiene de información con unúnicQ elemento haría'si sealCanzase:ésé itodó"de
la ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja una decisión, sino también la acción que tomaría el í~ga:dár al que le'córres~
acclOn. SI la tuviera, estaría incluida en la forma extensiva.) Si esta ame- ponde jugar en cada ~o de los conjuntos de informacióIl.c'o~.'~~~~e.~
naza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad de elemento que se han saltadO. "En térininospoco foIirlálés, este procedi~
llevar a cabo su amenaza. Sin embargo, la amenaza no debería funcionar miento proporciona un ~qiiilibrio de NashI'erféctd'en~subjuego~::}:J-:iíá
ya que no es creíble: si al jugador 2 se le diera la oportunidad de llevarl~ segunda manera de tratar el problema 'es proceder' haCi~atrás:<¡Íiló"Ya:rIfó
a cabo (es decir, si el jugador 1 jugara D), 2 decidiría jugar I' antes que D'. de la forma extensiva hasta 'encontrar un conjÜrito'dé-infomúiéioIi:'con ','.'
De un modo más formal, el equilibrio de Nash U,(D',D'» no es perfecto más de un elemento; Forzar entcmces al jugador'alqüe're"corrésp6fiCI~
(: '
en su.bjuegos, porque las estrategias de los jugadores no constituyen un jugar en ese conjunto' de illforma'cióna considerarlo qiieha'riiaellegarsi~
a ese conjunto de inforinádón:(Hacer esto requiere que eljugadot.tengá: .;:'
eqUlhbno de Nash en uno de los subjuegos. En particular, la elección de
D' por parte del jugador 2 no es óptima en el subjuego'que empieza (y una valoración probabilisticá'con reSpecto a:que'nodoseha;lle'g~d~e~:el
acaba) en el nodo de decisión del jugador 2 que sigue a la decisión D del conjunto de información.,Tal~ valoración dependerá Il.a~~eri~é~é,rá~
jugador 1. posibles decisiones de lo~ jugadores 'queestán pór~Círiia'~J:l!.:ékªf:tt~Y.,';g~'~
forma que una pasada de abajo arriba a.la lárgo deláTbol1ÍtiliZáhá:(l~st~:é.; " ,•....
En un juego con información completa y perfecta, la inducción hacia
método no puede proporcionar una solución-),~n.t~os'inf()iin~~I
atr~s elimina las amenazas que no son creíbles. I?ado que cada conjunto ,,'" -,
este procedimiento proporciona un equilibrio bayesiano perfedo.{véáse
de mformación contiene un único elemento, cada nodo de decisión del
árbol representa una contingencia posible en la que podría corresponderle capítulo 4).
actuar a un jugador. El proceso de moverse hacia atrás a lo largo de la
forma extensiva, nodo a nodo, se concreta por tanto en forzar a cada
2.5 Lecturas adicionales
jugador a considerar llevar a cabo todas y cada una de las amenazas que
.•..-•.,
el Jugador pudiera hacer. En un juego con información imperfecta, sin
Sección 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
embargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenal
tación sindical, véase ~ m~d~k, de negociación repetida en.Espinosa y
men~s ~n conjunto de información con más de un elem'ento. Aquí se
Rhee (1989; ejercicio 2,lO}y un'modelo de tina única negociación en el que
podna mtentar el mismo enfoque: proceder hacia atrás a lo largo de la
las empresas pueden escoger negociar sobre salarios y empleo o sólo sobre
forma extensiva y alcanzar eventualmente un nodo de decisión contenido
salarios, en Staiger (199¡), Sobre la negociación sucesiva, véase un modelo
en un conjunto de información con más de un elemento. Pero forzar al
al estilo de Rubinstein de negóciación entre una empresa y un sindicato en
jugador a considerar lo que haría si se llegase a ese nodo de decisión no
Ejercicios / 131
ingresOs [A e Ip y escoge una herencia,B, que dejar al hijo. La gananciél

Fernández y Glazer (1991), con la característica nueva de que el sindicato
del hijo es UUR + B); la del padre es VUp - 13)+ /,;UUR + B), donde /,;> O
debe decidir si convocar o no una huelga después de que el sindicato o
refleja la preocupación del padre por el bienestar del hijo. Supongamos
la empresa rechacen una oferta. Existen múltiples equilibrios perfectos
que la acción es un número no negativo, A ::::0, que las funciones de
en subjuegos efi~ientes que incorporan, ~ su vez, equilibrios perfectos en
ingreso I H(A) e Ip(A) son estrictamente cóncavas Y tienen un Imíximo
subjuegos ineficientes (es decir, que incluyen huelgas), aun cuañdohaya "
información completa. El libro de Osborney Rubinstein (1990) examina'
en AH > ° Y Ap > ° respectivamente, que la herencia B puede ser
positiva o negativa y que las funciones de utilidad U y V son crecientes
muchos modelos de negociación en teoría de juegos, los relaciona con el
y estrictamente cóncavas. Demuéstrese el teorema del "nif1o mimado":
enfoque axiomático de Nash sobre la negociaci6n y utiliza los modelos de
en el resultado por inducción hacia atrás, el hijo escoge la acción LJue
negociación como base de la teoría del mercad~. ',~
maximiza elingreso agregado de la familia fH(A) + Ip(A), a pesilr de que
Sección 2.2: Sobr~ los pánicos. bancarios, véa~e JaCkJiny ,Bhattacharyá
sólo la función de ganancias del padre es de alguna forma altruista,
(1988). El libro de, McJ\.1illan(1986)e.xámina lé;ls.prjmeré;lsapliciK~Qries-'-
dé teoría de juegos a la economíainternaciolv~i;:véaseuntrabajo'thás
2.2 Supongamos ahora que padre e hijo juegan un juego diferente, ana-
rec~ente sobre la deuda exterior en Bu19W..y Rogóff(1989) .. Sobre los
lizado originalmente por Buchanan (1975). Los ingresos IH e Ip están
torneos, consúltese un modelo en el qué lbs trabajadores pueden tanto
fijados exógenamente. Primero, el hijo decide qué parte del ingreso If{
",
aumentar su producción como sabotear la de los demás, en Lazéar (1989;
.',.-. ahorrará (S) para el futuro, consumiendo el resto UR - S) hoy. En se-
ejerc~cio2.8). Véaseen Rosen (1986) el tem.ade los premios necesarios
gundo lugar, el padre observa la elección de S por parte del hijo y es-
paraIT)antener los incentivos en Una,sucesi8n de torneos en los' que los
coge una herencia, B. La ganancia del hijo es la suma de las utilidades
perdedores en una etapa no pasan a la siguiente. .
presente y futura: Ul UR - S) + U2(S + B). La ganancia del padre es
Sección 2.3: Benoit y Krishna (1985)analizan juegos repetidos finitos,
V(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones de
Sobre larenegociación en los juegos repetidos finitos, consúltese Benoit
utilidad Ul, U2, y V son crecientes yestrictamente cóncavas. Demuéstrese
y Krishna (1989), y en los juegos repetidos infinitos véase el artículo pa-
que hay un "dilema del samaritano": en el resultado por inducción hacia
norámico de Farrell y Maskin (1989). :Tirole(1988, capítulo 6) examina
atrás, el hijo ahorra demasiado poco, para inducir al padre a dejarle una
modelos dinámicos de oligopolio. El libro de Akerlof y Yellen (1986) re-
herencia mayor (es decir, tanto las ganancias del padre corno las del hijo
coge algunos de los tra~ajos más importantes sobre salarios de eficiencia
podrían aumentar si S fuera convenientemente más alto y B convenien-
y ófrece una introducción integradora. Sobre política monetaria, véase
temente más bajo).
en Ball (1990) un resumen de los hechos estilizados, una revisión de los
modelos existentes y un modelo que explica la trayectoria temporal de la
2.3 Supongamos que los jugadores en el juego de la negociación con ho-
inflación.
rizonte infinito de Rubinsteintienen factores de descuento diferentes: 81
Sección 2.4: Véase un tratamiento formal de los juegos en forma exten-
corresponde al jugador 1 y {j2 al jugador 2. Adóptese el argumento dado
siva en Kreps y Wilson (1982), y un enfoque más verbal en Kreps (1990,
en el texto para demostrar que en el resultado por inducción hacia atrás,
capítulo 11).
el jugador 1 ofrece el acuerdo
2.6 Ejercicios
2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,

anahzado originalmente por Becker (1974). Primero el hijo toma una al jugador 2, quien lo acepta.
acción, A, que.resulta en un ingreso para él, IR (A), yen un ingreso para
2.4 A dos socios les gustaría completar un proyecto. Cada socio recibe la
el padre;Jp(A). (Pensemos en I H(A) corno el ingreso dél hijo, neto de
ganancia V una vez el proyecto ha sido completado, pero ninguno de ellos
cualquier coste de, la acciÓn A.) En segundo lugar, el padre óbservá los
132/ JUEGOSDINÁMICOS CON I~JFOR¡\'IACIÓNCOMPLETA (c. 2) Ejercicios I 133
recibe ganancia alguna antes de que el proyecto se haya podido terminar. otro difícil (D), y que la preparación es útil en los dos empleos, pero más
El coste que queda hasta que el proyecto se complete es R. Ninguno de . en el difícil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
los socios puede comprometerse a hacer aportaciones futuras de cara a produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
completar el proyecto, de forma que deciden establecer el siguiente juego preparación de j (~ O o S). Supongamos que la empresa puede compro-
de dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de cara meterse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
a completar el proyecto. Si esta contribución es suficiente para completar ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
el proyecto, el juego se acaba y cada socio recibe V. Si esta contribución no del trabajador, que normalizamos a cero.
es suficiente para completar el proyecto (es decir, Cl < R), en el periodo El desarrollo temporal del juego es el siguiente: En el momento O la
2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto. empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~-
Si la suma (sin descontar) de las dos contribuciones es suficiente para mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
completar el proyecto, el juego acaba y cada socio recibe V. Si la suma el nivel de preparación S a un coste C. (Ignoramos laproducción'y los
es insuficiente para completar el juego, éste termina y ningún socio recibe salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
nada. aún la preparación, lo eficiente es que se le asigne el trabajo E.) Suponga-
Cada socio debe obtener el dinero con el que contribuye a financiar mos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
el proyecto de otras actividades lucrativas. La forma óptima de hacerlo la preparación. En el momento 2 la empresa observa si el trabajador ha
es sacar primero dinero de las alternativas menos rentables. El coste (de adquirido o no la preparación y decide entonces si concederle el ascenso
oportunidad) que resulta de una contribución es, por tanto, convexo con al trabajo D o no durante el segundo (y último) periodo de empleo qel
respecto al tamaño de la contribución. Supongamos que el coste de una trabajador.. "".':-
contribución e es e2para cada socio. Supongamos que el socio 1 descuenta Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
los beneficios del segundo periodo de acuerdo con el factor de descuento donde el trabajador realiza el trabajo 'i y tiene un nivel de preparación j.
5. Calcúlese el único resultado por inducción hacia atrás de este juego La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
de contribuciones de dos periodos para cada trío de parámetros (V,R,5); es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
véase el caso con horizonte infinito en Admati y Perry (1991). primer periodo. Hállese el resultado por inducción hacia atrás, Véase un
modelo más complejo en Prendergast (1992).
2.5 Supongamos que una empresa quiere que un trabajador adquiera !.:::' .
0'- .~.
la preparación necesaria para desarrollar una determinada tarea, pero 2.6 Tres oligopolistas operan en un mercado con una demanda inversa
dicha tarea eS tan inconcreta que ningún tribunal podría verificar si el dada por P(Q) = a - Q, donde Q = ql + q2 + q3 Y qj es la cantidad producida:.
trabajador ha adquirido o no la preparación necesaria. (Por ejemplo, por la empresa j. Cada empresa tiene un coste margipal de producción
la empresa podría pedir al trabajador que se familiarizase con "nuestra constante, e, sin costes fijos. Las empresas escogen sus cantidades de la
forma de h¡lCerlas cosas", o se hiciera un experto en "este nuevo mercado siguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3
en el que podríamos entrar".) La empresa,. por tanto, no puede firmar observanql y escogen entonces simultáneamente q2 y q3 respectivamente.
un contrato para reembolsar al trabajador el coste de esta preparación: ¿Cuál es el resultado perfecto en subjuegos?
incluso si el trabajador adquiere esta preparación, la empresa puede decir
que el trabajador no lo ha hecho, y ningún tribunal podría decidir quién 2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerza
tiene razón. Del mismo modo, el trabajador no puede firmar un contrato de trabajo de todas las empresas de un oligopolio, comO el. Sindicato
para adquirir esta preparación si se le ha pagado por adelantado. .Unido de Trabajadores del Automóvil en el caso de la General Motors,
La empresa podría utilizar, como incentivo para que el trabajador Ford, Chrysler y otras. Sea la sucesión temporal de las jugadas análog~ al
adquiera la preparación, promesas (creíbles) de ascenso de la siguiente modelo de la sección 2.1.C: (1) el sindicato realiza una demanda salanal,
forma. Supongamos que hay dos trabajos en la empresa, uno fácil (E) y "", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las
¡
ti:! I
134 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Eje,.cici()~ / 135
ganancias del sindicato escogen simultáneamente los niveles de empleo, resultado perfecto en subjuegos. Demuéstrese que los salarios, nivel de
.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa empleo y beneficios (y, por tanto, también la utilidad del sindicalo y el
es el salario que los miembros del sindicato podrían ganar en un empleo excedente del consumidor) aumentan cuando los aranceles desapilrecen.
alternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas, Véase otros ejemplos en la misma línea, en Huizinga (1989).
y los beneficios de la empresa i son i(w,Lí). A continuación se describen
. losdeterminantes de los beneficios de dicha empresa: todas las empresas 2.10 El juego de decisión simultánea que a continuación se describe se
..tienen la siguiente función de producción: el nivel de producción es igual juega dos veces, habiéndose observado el resultado de la primera etapa
al nivel de empleo; qí = Lí. El precio de equilibrio es P(Q) = Q, - Q antes de que empiece la segunda. No hay descuento. La variable T
cuando la cantidad agregada en el mercado es Q = q] + ... ' + qn. Para no es mayor que 4, de forma que (4, 4) no es una ganancia de equilibrio
complicar las cosas, supongamos que las empresas no tienen más costes del juego jugado una sola vez. ¿Para qué valores de x es la siguiente
que los salariales. ¿Cuál es el resultado petfeéto en subjuegos de este estrategia (jugada por ambos jugadores) un equilibrio de Nash perfecto
juego? ¿Cómo (y por qué) afecta el mimero de empresas a la utilidad del ensubjuegos?
sindicato en el resultado perfectb ..en subjuegos?
Jugar Qí en la primera etapa. Si el resultado de la primera etapa es
(Ql,Q2), jugar Pí en la segunda etapa. Si el resultado de la primera
2.8 Modifiquemos el modelo de torneos dé la sección 2.2.D de forma
.que la producción del trabajadori sea Yí == eí -'- (1/2)8j +Eí, donde Sj 2': ° etapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si el
resultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si en
representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo la segunda etapa. Si el resultado de la primera etapa es (y,z)donde
(productivo y destructivo) del jugador i es g(eí) + g(8í), como en Lazear
y =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.
(1989). Demúéstrese que elpremio óptimo WA -W13 es menor que cuando
no hay posibilidad de sabotaje (como en el texto).
2,2 x,O -1,0 0,0

2.9 Consideremos dos países. En la fec;l1a1, ambos países tienen aranceles
.tan altos que no hay comercio entre ellos. Dentro de cada país, los salarios O,x 4,4 -1,0 0,0
y el nivel de empleo se determinan como en el modelo de monopolio y 0,0 0,0 0,2 0,0
sindicato de la sección 2.l.C. En la fecha 2, todos los aranceles desaparecen, 0, -1 0, -1 -1, -1 2,0
ahora cada sindicato fija el salario en su país, pero cada empresa produce
para los dos mercados. 2.11 El juego de decisión simultánea que a continuación se describe se
Supongamos que en cada país la demanda inversa es P(Q) = Q, - Q, juega dos veces, habiéndose observado el resultado de la primera etapa
donde Q es la cantidad agregada en el mercado de ese país. Sea q = L la antes de que empiece la segunda. No hay descuento. ¿Puede alcanzarse
función de producción de cada empresa, de forma que los sálariosson el en la primera etapa la ganancia (4,4) en un equilibrio de Nash perfecto en
único coste dela empresa, y sea U(w,L) = (w -wo)L la funci6n de utilidad subjuegos con estrategias puras? En caso afirmativo, especifíquense las
del sindicato, donde 71Jo es un salario alternativo para los trabajadores. estrategias que lo pem1Íten. En caso negativo, demuéstrese por qué no.
Calcúlese el resultado por inducción hacia atrás en la fecha l.
Considérese ahora el siguiente juego en la fecha 2. Primero, los dos 1 e D
.".,;.,' sindicatos escogen simultáneamente los salarios, 1J)] y 1J)2. Las empresas
A 3,1 0,0 5,0
observan los salarios y escogen los niveles de producción para los mer-
cados interior y exterior, que denotamos mediante hí y eí en el caso de lvI 2,1 1,2 3,1
la empresa del país i. Toda la producción de la empresa se realiza en B 1,2 0,1 4,4
su propio país, de fo.rma que el coste total es Vií(hí + eí). Calcúlese el
136 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA Ce. 2) Ejercicios I 137
2.12 ¿Qué es una estrategia en un juego repetido? ¿Qué es un subjuego en producción de monopolio, ¿cuál es el equilibrio de Nash perfecto en sub-
un juego repetido? ¿Qu¿ es un equilibrio de Nash perfecto en subjuegos? juegos simétrico más rentable al que puede llegarse utilizando estrategias
del disparador?
2.13 Recuérdese el modelo de duopolio de Bertrand estático (con pro-
j'.'
duetos homogéneos) del ejercicio 1.7: las empresas fijan los precios si- 2.16 En el modelo de salarios y nivel de empleo analizado en la sección
multáneamente; la demanda del producto de la empresa i es a - Pi si 2.1.C, el resultado por inducción hacia atrás no es socialmente eficiente.
Pi < Pj, es Osi Pi > Pj y es (a - p¡)/2 si Pi = Pj; los costes marginales son En la práctica, sin embargo, una empresa y un sindicato negocian hoy los
e < a:-Considérese el juego repetido infinitamente basado en este juego términos de un contrato por tres años, renegocian al cabo de tres años
de etapa. Demuéstrese que las empresas pueden utilizar estrategias del los términos de un segundo contrato y así sucesivamente. Por tanto, esta
disparador (que significan jugar para siempre el equilibrio de Nash del . relación se puede caracterizar con más o menos exactitud como un juego
juego de etapa después de cualquier desviación) para mantener--~lnivel repetido, como en Espinosa y Rhee (989)..,-'-"
de precios de monopolio de un equilibrio de Nashperfecto en subjuegos' En este problem~ se denvan condiciones bajo las cuales un eqUilibrio
si ys~lo si O ~ 1/2.' _ de Nash perfecto en subjUegos dél juego repetido infinitamente es superior:
en el, sentido de Paretoal resultado por inducción hacia atrás del juego
2.14 Supongamos que léldemanda fluctúa de formélaleatoria en el juego jugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidad
de Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada del sindicato y los beneficios de la empresa en el resultado por inducción
.periodo, el punto de interacción de la fu~ciónde dema;nda con el eje de hacia atrás del juego jugado una sola vez. Consideremos un par utilidad"-, ,
abcisas es aA. con probabilidad 'Ir.y aB « aA) co~ probabilidad 1 -::'Ir; las beneficio alternativo (U,'Ir) asociado con un par salariá-empleo alteíriatlvó :
demandas en los diferentes perlados son indep~nciientes. Supongamos (w,L). Supongamos que ambas partes tienen elmisinofador de descu~ií.to:
que en cada periodo el nivel de demanda es revelado a ambas empresas O (para cada periodo de tres años). Derívense condiciones sobre (w,L)
antes de que éstas escojan los precios de ese periodo. ¿Cuáles son los tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)
niveles de precios de monopolio (P.4 y PB) para los dos niveles de de- sea el resultado de un equilibrio de Nash perfecto en subjuegos del juego
manda? Calcúlese 0*, el fi1enor valorde 8 tal que las empresas pueden repetido infinitamente, donde se juega (U* ,'Ir*) para siempre después de
utilizar estrategias del disparador para mantener estos niveles de precios cualquier desviación. '.- -~
de monopolio (es decir, jugar Pi cuando la demanda es aú para i = A,E) '':'''. ":/."
en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de O 2.17 Consideremos el siguiente juego con horizonte infinIto entre una
entre 1í2 y 0* hállese el precio máximo p(o) tal que las empresas puedan única empresa y una sucesión de trabajadores, cada uno de los cuales vive
utilizar estrategias del disparador para mantener el precio p(o) cuando la durante un periodo del juego. En cada periodo, el trabajador decide. sí
demanda es alta y el precio P B cuando la demanda es baja en lln equilibrio esforzarse y producir por tanto a un nivel y con un coste por elesfuerzo
de Nash perfecto en subjuegos. (Véase Rotemburg y Saloner 1986.) de c, o no esforzarse, no producir nada y no incurrir en ningún coste. Lo
que se produzca es propiedad de la empresa, peto ésta puede compartirlo
2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. La con el trabajador pagándole un salario como se describe a continuación:
demanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,.. supongamos que al principio del periodo el trabajador dispone de una
Consideremos el juego repetido infinitamente basado en este juego de oportunidad alternativa con un valor de cero (neto del coste por el es-
etapa. ¿Cuál es el valor menor de -O tal que las empresas pueden utilizar fuerzo) y que no se puede obligar al trabajador a aceptar un salario por
estrategias del disparador para mantener el nivel de producción de mo- debajo de cero. Supongamos también que y > c de forma que esforzarse
nopolio en un equilibrio de Nash perfecto en subjuegos? ¿Cómo varía la es eficiente.
respuesta al cambiar -n? ¿Por qué? Si (j es demasiado pequeño para que Dentro de cada periodo, el desarrollo temporal es el siguiente: pri-
las empresas utilicen estrategias del disparador para mantener el nivel de mero el trabajador escoge un nivel de esfuerzo, a continuación tanto la (;::-:-'
:~
138 / JUEGOS OlNÁMICOS CON INFORMACIÓN COMPLETA (c. 2) Refrrencias /\39
empresa corno el trabajador observan el nivel de producción y finalmente de Nash en estrategias puras? ¿Cuál es el resultado por inducción hacia
la empresa escoge un salario para pagar al trabajador. Supongamos que , 7 'Cuál es el equilibrio deNash perfecto en subJuegos?
atraso ¿
no existe manera de hacer cumplIr los contratos salariales: no hay nin-
guna restricción sobre la elección del salario por parte de la empresa. 2.22Proporciónense las representaciones en for~~ae;xtensiva y,nonnal del
En el juego de un periodo, sin embargo, perfección en subjuegos implica . d 1 pánico bancario discutido en la seCCIOn2.2.B. ¿Cuales son Jos
que la empresa ofrecerá un salario de cero produzca lo que produzca e! Juego e .. 7
equilibrios de Nash perfectos en subjuegos en estrategIas puras.
trabajador, de forma que el trabajador no se esforzará.
Consideremos ahora el problema con horizonte infinito. Recordemos
2.23Un comprador y un vendedor desearían realizar un intercambio. An-
que cada trabajador vive sólo por un periodo. Supongamos, sin embargo,
tes de hacerlo, el comprador puede efectuar una inversión que aumenta
que al principio del periodo t, la historia del juego hasta el periodo t - 1 es
el valor que asigna al objeto a intercanlbiar. Esta inversión no pued: ser
conocida por el trabajador que trabajará eh el periodo t. (Pensemos como'
observada por el comprador y no afecta el valor que el vendedor aSIgna
si esta información.setransrnitiese de generación a generación entre los
al objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.
trabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdo
empresa que compra otra. En algún momento antes de la [uslon, el com-
con el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:
prador podría haber actuado en el sentido de cambiar los productos que
la empresa y de cada trabajador en un equilibrio perfecto en subjuegos
su empresa planea introducir en el mercado de forma que se complemen~
del juego cOllhorizonte infinito en las que en equilibrio cada trabajador
ten después de la fusión con los productos de la ~mpr~sa comprada. SI
se esfuerza y produce por tanto a un niyely, siempre y cuando el factor
el desarrollo de un producto lleva tiempo y el CIclovItal del producto
de descuento sea lo suficientemente alto. Dése una condición necesaria y
es corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~o
suficiente para ,que su equilibrio exista.
esta inversión después de la fusión.) Para el comprador el valor IIllClal
del objeto es v > O; una inversión de 1 aumenta est~ v~lor a '/)+ 1, ?ero
2.18 ¿Qué es una estrategia (en un juego arbitrario)? ¿Qué es un conjunto cuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmer
de información? ¿Qué es unsubjuego (eh un juego arbitrario)?
lugar, el comprador escoge un nivel de inversión 1e incurre en el cosle
12, En segundo lugar, el comprador no observa 1pero ofrece vender el
2.19En la versión de tres periodos del modelo de la negociación de Rubins- objeto por un precio p. En tercer lugar, el comprador a~epta o rechaza la
tein analizada en la sección 2.1.D, calculamos el resultado por inducción oferta del vendedor: si el comprador acepta, la ganancIa del comprador
hacia atrás. ¿Cuál es el equilibrio de Nash perfecto en subjuegos? es v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, é~tas
ganancias son _12 y cero respectivamente. Demuéstrese que .no eXIste
2.20 Consideremos las siguientes estrategias.en la versión de horizonte ningún equilibrio de Nash perfecto en subjuegos con estrate?las puras
infinito del modelo de la negociación de Rubinstein. (Recordemos la en este juego. Calcúlese el equilibrio de Nash perfecto en SUbJ1,legos. con
convención notacional de que la oferta (s,1 - s) significa que 'el jugador 1 estrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna
obtendrá s y el jugador 2 obtendrá 1 - s, independientemente de quien . probabilidad positiva a dos niveles de inversión y la e~trategla mIxta del
haga la oferta.) Sea s. = 1/(1 + ó). El jugador 1 siempre ofrece (s" ,1 - s.) vendedor sólo asigna probabilidad positiva a dos precIOS.
y acepta una oferta (s,l - s) sólo si s ~ ós •. El jugador 2 siempre ofrece
(1 - s. ,s*) y acepta una oferta (.s,l - s) sólo si 1 - s ~ 5s.: Demuéstrese
que estas estrategias son un equilibrio de Nash. Demuéstrese que este
equilibrio es perfecto en subjuegos.
2.7 Referencias
2.21 Proporciónense las representaciones en forma extensiva y normal del ABREU, D. 1986. "Extremal Equilibria of Oligopolistic Supergames." JOlll'1wl
juego de la granada descrito en la sección 2.1. ¿Cuáles son los equilibrios of Economic Theory 39:191-225.
".Ij
"'",'

Gibbons - Un Primer Curso de Teoría de Los Juegos Cap2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Gibbons - Un Primer Curso de Teoría de Los Juegos Cap2

Cargado por

Copyright:

Formatos disponibles

,',

52/ JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e. 1) '.'.'

COURNOT,A. 1838. l\echerches Sllr les Principes Mathématiques de la Théorie

FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal of Con-

FRIEDMAN,J. 1971. "A Noncooperative Equilibrium for Supergames."

al jugador 2 () no darle nada, Én segundo lugar, el jugado.r2 observa la

Juegos dillámicos COI¡ ¡'¡formación completa y perfecta / 5.5

l presentada en el capítulo 1. Definimos también el equilibrio de

. dor 2 lo sea: si 1piensa que 2 podría no ser racionill,

2.1.B El mod~lo de duopolio de Stackelberg

3 Recordemos deI a discusión sobre l~elimiración itera tiva de las,.•"~tr~tegiasest:ric~~~ente

valores de w y L no pueden ser el resultado por inducción hacia atrás de

w Una descripción más detallada de la secuencia temporal del juego de

y la .negociación continúa hasta que un jugador acepta una oferta.

1. Los jugadores 1 y 2 escogen simultáneamente las acciones al y az de

bIernos escogen simultáneamente las tasas arancelarias tI y t2. En se-

..... de la empresa i y el bienestar total del gobie.r:noi, donde el bienestar total

gadores sino también de los términos de ruido El y (.2,operaremos con las

,',' Supongamos que el capataz ha elegido los salarios WA y WB. Si el

En un equilibrio de Nash simétrico (es decir, ei = ei = e') tenemos que

max WA Prob{Yi(ei) >

Prob{Yi(ei) > Yj(e;)} + WB

1 1 ganancias del juego completo son simplemente la suma de las ganancias

Y (2.2.8)determina entonces WA Y"illB. 1,6 5,5

Definición. Dado un juego de etapa G, G(T) denota el juego r.epetido fini-

seguido de Di peros~lo 5 +1/~ a.ljugar Ji en :a primera ~tapa (e i.ncluso

tar él tema de la renegociación en esté juego artificial se pueden aplicar

~8 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) ]¡¡egos repetidos /89

Jugador 2 Definición. Dado un factor de descuento 5, el valor presente de la sucesión

Jugador 1 7fi+ 57f2+ 527f3+ ... = L 5 l7f

~ no. Si la probabilidad de que el juego se acabe inmediatamente es p y,

o V = 4/(1- ó), ya que jugar Dj conduce a la misma decisión en la sig"uiente

que la ganancia en cada etapa futUra sería 1: Comd'1+ó+ó2+:. /=1/(1-0), infinitamente.17

perfecto en subjuegos, la cual depende a su vez de la definición de equili-

ganancias de más de dos estrategias puras. Para conseguir una media

ganancias del jugador en el juego de etapa, pero es más conveniente ex-

Definición. Dado el factor de descuento 8, la ganancia media de la sucesión

maximizar el valor presente.

, 'o'n creíble más fuerte' por tanto, utilizando el enfoque de

:~:a~:~:;n~clOnes de es~at~gias puras seleccionadas por el mecanismno

Xi {¡ Friedman (971) fue el primero en demostrar que podria alcanzarse la

La solución es qj = (a. - q* - e)/2, con un beneficio de (a - q* - c)2/4, que

análoga a (2.3.1)en el análisis del dilema de los pr~~9S; S~stitu~e~do los 9 - 56

Sustituyendo V(x) en (2.3.3) obtenemos

Si la empresa emplea al trabajador con un salario w, las gananciils a

siempre y cuando todas las jugadas anteriores hayan sido cooperativas,

que puede interpretarse como la restricción f~~liar de que fj debe ser lo

Juegos dil1ámicos COll il1fOI'llWÓÓI1 completa pero illlpe,.[eda / 115

<... es la que será confirmada en lo sucesivo por la autoridad monetaria, de (2,39)

Definición. Una estrategia de un jugador es un plan de acción completo, es

La representación en forma extensiva de este juego (ignoramos las ganan-

y D (que conduce a una ganancia de 2 por parte del jugador] después

En este juego, el par de acciones (a3(ai,a2),o,4:(a1,0.2 »

ingresOs [A e Ip y escoge una herencia,B, que dejar al hijo. La gananciél

2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,

2,2 x,O -1,0 0,0

También podría gustarte