Está en la página 1de 142

GO./lhJ.o 11trnt.f.vt! .s~~iD '.

e 11:1. O:J1J

ROBERf GIBBONS
Universidad de Cornell

t
UN PRIMER CURSO
DE TEORÍA DE JUEGOS
I
I
&

,~-
TraducCión de
Paloma Calvo.
y Xavier ViJa
.i Universidad de Northwestern

Antoni Bosch O editor


I
.J
¡:¡', 'lb
'1'(
I,

~/"" l.i5

CONTENIDO

"':'
,','
":.

Prefacio IX

Juegos estáticos con información completa 1


1.1 Teoría básica: Juegos en'forma normal y equilibrio de Nash 2V
(.
1.1.A Representación de los juegos en forma normal 2
ly}:-U Eliminación iterativa de las estrategias
estrictamente dominadas 4
2Jr,éFundamentación y definición del equilibrio de Nash 8 v""
1.2 Aplicaciones 15
1.2.A Modelo de duo polio de Coumot 15
Publicado por Antoni Bosch, editor
!vIanuel Cimna, 61 - 08034 Barcelona 1.2.B Modelo de duo polio de Bertrand 21
T"i. (-134)93 206 0730 - Fax (+34) 93 206 0731 1.2.C Arbritraje de oferta final 23
E-mai1: info@antonibosch.com / 1.2.D El problema de los ejidos
http://www.antonibosch.com 27 (
/3 Teoría avanzada: Estrategias mixtas y existencia de
Título original de la obra: equilibrio 29/
A Primer in Game Theory 1.3.A Estrategias mixtas 29
1.3.B Existencia del equilibrio de Nash 33/
@ 1992 by Robert Gibbons
1.4 Lecturas adicionales 47
<9de b edición en castellano: Antoni Bosch, editor, S.A
1.5 é:jercicios "
~:.
48
ISBN: 84-85855-69-8 1.6 Referencias
Depósito legal: B-13.841-2003 51 r;~

Diseño de la cubierta: Facing-bcn 2 Juegos dinámicos con información completa 53


2.1 Juegos dinámicos con información completa y perfecta 55';/ /
Impresión y encuadernación: Liberdúplex 2.1.A Teoría: Inducción hacia atrás 55./
[mpreso en España / Prinled i/1 Sl'aill 2.1.B El modelo de duopolio de Stackelberg 59
2.1.C Salarios y nivel de empleo en una empresa con fuerte
No se permite la reproducción total o parcial de este libro, ni su incorporación a un implantación salarial 62
:,st,ema Illformático, ni su transmisión en cualquier forma o por cualquier medio sea 2.1,D Negociación secuencial
este electn ' . ,_ " _ '. ' 66
. l mco, mecaruco, reprogranco, gramofolllco u otro, sm el permiso previo y
por escn to del editor. 2.2 Juegos en dos etapas con información completa pero
imperfecta 69

I
I

a.J
t
VI I
t
i
CONTENIDO CONTENIDU / Vll

2.2.A Teoría: Perfección en subjuegos 69 ' 4.2.B Señalización en el mercado de trabajo 192
2.2.B Pánico bancario 71 4.2.C Inversión empresarial y estructura de capital 207
2.2.C Aranceles y competencia internacional imperfecta 73 4.2.D Política monetaria 2JO
2.2.D Torneos 77 4.3 Otras aplicaciones del equilibrio bayesiano perfecto 213
2.3 Juegos repetidos 80 4.3.A Juegos con parloteo (cheap-talk games) 213
2.3.A Teoría: Juegos repetidos en dos etapas 80 4.3.B Negociación sucesiva bajo información asimétrica 221
2.3.B Teoría: Juegos repetidos infinitamente 87 4.3.C La reputación en el dilema de los presos repetido
2.3.C Colusión entre duopolistas de Cournot 101 finita mente 227
2.3.D Salarios de eficiencia 106 4.4 Refinamientos del equilibrio bayesiano perfecto 236
2.3.E Política monetaria estable en el tiempo 112 4.5 Lecturas adicionales 248
2.4 Juegosdinámicos con información completa pero 4.6 Ejercicios 249
imperfecta 11.5 / 4.7 Referencias 257
2.4.A Representación de losjuegos en forma extensiva 115
2.4.B Equilibrio de Nash perfecto en subjuegos 122 Índice analítico 261
2.5 Lecturas adicionales 129:/
2.6 Ejercicios 130
2.7 Referencias 139

3 Juegos estáticos con informacion incompleta 143


3.1 Teoría: juegos bayesiános estáticos y equilibrio bayesiano
de Nash 144
3.l.A Un ejemplo: Competencia a la Cournot bajo
información asimétrica' 144
....•...
~ 3.1.B Representación en forma normal de juegos
bayesianos estáticos 146
3.l.C Definición del equilibrio ~~siaI1() <:leNas!Í. 150
3.2 Aplicaciones - - .--.----.- 152
'3.2.A Revisión de las estrategias mixtas 152
3.2.B Una subasta 155
3.2.C Una subasta doble 159
3.3 El principio de revelación 164
3.4 Lecturas adicionales 169
3.5 Ejercicios 169
3.6 Referencias 172

4 Juegos dinámicoscon información incompleta 175


4.1 Introducción al equilibrio bayesiano perfecto 177
4:2 Juegos de señalización 185
,- 4.2.A EqUilibrio bayesiano perfecto en juegos de
señalización 185

~, .."
PREFACIO

j, •
La teoría de juegos es el estudio de problemas de decisión multipersona-
les. Tales problemas se plantean frecuentemente en economía. Como,es
bien sabido, por ejemplo, en situaciones de oligopolio se dan típicamente
problemas de este tipo (cada empresa debe tener en cuenta lo que harán
las demás). Pero muchas otras aplicaciones de teoría de juegos surgen
en campos ajenos a la organización industrial. A nivel micro económico,
. muchos modelos de intercambio (como los de negociación y de subasta)
utilizan teoría de juegos. A un nivel de agregación intermedio, y en el
campo de la economía laboral o de la economía financiera se utiliza lél
teoría de juegos en mode!os cJ.ecomportamiento de las empresas en los
mercados de factores, o pai~' dilucidar problemas de decisión multiperso~
nales dentro de ellas: varios trabajadores compitiendo por un ascenso,v~~
rios departamentos compitiendo por unos mismos recursos. Finalmente,
al nivel más alto de agregación, en el campo de la economía internacional,
se utiliza en modelos en los que los países compiten (o coluden) en sus
decisiones arancelarias y, en general, en una política económica exterior;
o en macroeconomía, para analizar los resultados de la política monetari!l
cuando el gobierno y los agentes que determinan los salaribs o los precios
se comportan estr,atégicamente.
Este libro está conc~bido para presentar la teoría de juegos a quienes
mástarde construirán (o, al menos, consumirán) los modelos de la teoría
de juegos en los ámbitos aplicados de la economía. Se han procurado
resaltar en él las aplicaciones de la teoría, tanto al menos .como la propia
,'.,
teoría, por tres razones. En primer lugar, porque las aplicaciones ayudan
a enseñar la teoría. En segundo lugar, porque las aplicaciones ilustran el
proceso de construcción de modelos; es decir, el proceso de traducción
de la descripción informal de una determinada situación a un problema
formal de teoría de juegos para ser analizado. En tercer lugar, porque
las diversas aplicaciones permiten comprobar que problemas similares
surgen en áreas diferentes del análisis económico, y que los mismos ins~
trumentos de teoría de juegos pueden apliCarse en cada sih¡ación."Para :..
x/ PREFACIO Prefacio / XI

subrayar el amplio alcance potencial delos juegos los ejemplos habituales Aprendí teoría de juegos con David Kreps, John Roberts y Bob Wilson
de organización industrial han sido sustituidos en gran medida por apli- durante mis estudios de doctorado, y con Adam Brandemburger, Drew
caciones en el ámbito de la economia laboral, de la macroeconomía y de
Fudenberg y Jean Tirole más adelante. A ellos debo la parte. teórica el: e:te
otros campos aplicados detanálisis económico] libro. El énfasis en las aplicaciones y otros aspectos del estIlo pedagoglco
Discutiremos cuatro tipos de juegos: juegos estáticos con información del libro, en cambio, se los debo en gran parte a los estudiantes del de-
completa, juegos dinámicos con información completa, juegos estáticos partamento de economía del M.l.I. quienes, de 19~5 a 1990, inspiraron y
con información incompleta y juegos dinámicos con información incom- moldearon los cursos que han culminado en este lIbro. Estoy muy agra-
pleta. (Un juego tiene información incompleta si un jugador no conoce las decido a todos estos amigos por las ideas que han compartido conmigo
ganancias de otro jugador, como ocurre en una subasta cuando uno de los y el estímulo que siempre me han otorgado, así com? ~or los numerosos
licitadores no sabe cuánto está dispuesto a pagar otro licitador por el bien comentarios útiles al borrador del libro que he reCIbIdo de Joe Farrell ,
subastado.) Correspondiendo a estas cuatro clases de juegos habrá cuatro Milt Harris, George Mailath, Matthew Rabin, Andy Weiss y varios éríticos
nociones de equilibrio: equilibrio de Nash, equilibrio de Nash perfecto en anónimos. Finalmente, me complace reconocer los consejos y apoyo que
subjuegos, equilibrio bayesiano de Nash y equilibrio bayesiano perfecto. he recibido de Jack Repcheck de Princeton University Press y la ayuda fi-
Existen dos maneras (relacionadas) de entender estos conceptos' de nanciera de una beca Olin en economía del National Bureau of EconOlnic
equilibrio. Primero, se puéden entender como sucesIones de conceptos
Research.
de equilibrio cada vez más poderosos, donde las definiciones más podero-
sas {es decir, más restrictiva.s) constituyen intentos de eliminar equilibrios
poco plausibles permitida'spor nociones de equilibrio más débiles. Ve-
remos, por ejemplo, que el equilibrio de Nash perfecto en subjuegos es
más poderoso que el equilibrio de Nash, y que 'el equilibrio bayesiano
perfecto es a su vez más poderoso que el eqUilibrio de Nash perfecto en
subjuegos. Segundo, puede afirmarse que el concepto de equilibrio rele-
vante es siempre el equilibrio bayesiano perfecto (o quizás un concepto
de solución aún más poderoso), aunque éste es equivalente al equilibrio
de Nash en juegos estáticos con información completa, equivalente a la
perfección en subjuegos ~n juegos dInámi~os con información completa (y
perfecta) y equivalente al equilibrio bayesiano de Nash en juegos estáticos
con información incompleta ..
Este libro puede utilizarse de dos formas. A los estudiantes de eco-
nomía de primer año de doctorado, muchas de las aplicaciones les serán
ya familiares, por lo que la parte de teoría de juegos se puede cubrir en
medio semestre, dejando muchas de las aplicaciones para ser estudiadas
fuera de clase. A los estudiantes de lIcenciatura, conviene presentarles
la teoría un poco más despacio, y clibrir en clase virtualmente todas las
aplic1l;ciones. El prerrequisito matemático fundamental es el cálculo di-
ferEáici!il"en"una variable; los rudimeJ1tos de probabilidad y análisis se
introéIucen'a.'medida que se necesitan.
"~';".~,:.'k:::~:t;;;::,~.::-::,:~:~;~~'~,-;
" -
'c,,}' Un~,btÍena fuente de aplicaciones de leoría de juegos en el ámbito de la organización
industrial,es TC9rfa.d~la. organización industrial, de Tirole (Ariel, 1990).
';',J •.~;I.~, -~':. : •..~.¥>-.-'~;.~,-.~~."..:\~.~-
\'

1. JUEGOS ESTÁTICOS
CON INFORMACIÓN COMPLETA

:";

"
En este capítulo consideramos juegos simples de la siguiente forma::pri- ;".
mero los jugadores forman decisiones simultáneamente; abjntfutiációñ
reciben sus ganancias, que depénden de la combinación de,ac.ciones'que ,
acaban de elegir, Dentro de la clase de estos juegos estáticos (o'de(fecrsióh
simultánea), restringimos nuestra atención a los jueg~s 'ton :iri¡oi-mai:íó~ '".,' (
completa. Es decir, la' ftrnciórr.de ganancias de cadajugá~bi";:~k).fiif¡cip~~'jt\~c~~~I¿t.r
que determina la ganancia de cada jugador a partir déIaéoinbiíiáé:t:cr'Lc:. '.?(.,
de acciones elegidas por los jugadores) es corú)dd'áfp6í:'10s'íJg'aq , '
Estudiamos los juegos dinámicos (o de toma'de. dedsioIi.eS'~ticeSivlfJ,',
los capítulos 2 y 4, Y los' j~egos con' informaci6riiriéOmpl~ti'(jt~gt~J'¡J¡:c"~.,
los cuales aI~n' jugáaorno esta segUro' de la funCión,:de:g'aniiliCi~',"'... , ," ,;<"fL
otr~ j~gador, como ocurre en ~I1asubasta en.la cual lo q~e ca~~Ii?t~~~~fo;:~fi:,,:.;:~:¡fi.;.
esta dIspuesto a pagar por el bIen subastacl.oes desconoCldo'pOr:rbS:0tro.S,:.'7,;~':;,;;,::~::}
licitadores) en los capítulos 3 y 4. 'ú;~;:jJ1.j;:)1:;~i\i;<~\':~.':~.j.~t.
En la sección 1.1 entramos en las dos cuestiones básicas de la tebrí~~de':i:.\.;i:.t"~t'
juegos: cómo describir un j~~g9,tsó,mo res~fYrE,~tR[?,bJ?~~4iJ~~~ttg£""
de juegos resultante. Con este fin describimos los instrumentos que,t,ití::~::~\i ..,;::i
lizaremos para analizar los juegos estáticos con informacióncompletáJ;,y!<:'
sentaremos las' bases de la teoría que utilizaremos para analizar jue'gos
más ricos en capítulos posteriores. Definimos tambiénJa repre.se:r¡tacÍljn,e11
forma normal de un juego y la noción de estrategia estrictamerzteti9mi.~
Demostramos ,que algunos juegos pueden resolverse mediq,nteja.; ªR1i;'
cación de la idea de que los jugadores racionales no utiUzarlestr~te~ '
estrictamente dominadas, pero también que en otros 'juegos' est~',e&:~
que da lugar a predicciones muy imprecisas sobre el desarrollode1jÍj~o '
(algunas veces tan imprecisa como la afirmación de q\le,"cuaIquiercqsª,
puede ocurrir"), Después, definimos el equilibrio de Nash,un concept2i.d~':",,~.,
solución que da pie a predicciones mucho más precisas,en una clase:j:l~:'>';
juegos muy amplia. - ",,:, .. " >::c~':~~'
2 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1) 7eoría básica: luegos en {arma/normal y equilibrio de Nas/¡ I 3

En la sección 1.2, utilizando los instrumentos desarrollados en la serán sentenciados a seis meses de cárcel. Finalmente, si uno confiesa y el
sección previa, analizamos cuatro aplicaciones: el modelo de competencia otro no, el que confiesa será puesto en libertad inmediatamente y el otro
imperfecta de Coumot (1838), el modelo de competencia imperfecta de será sentenciado a nueve meses en prisión, seis por el delito y tres más
,
¡<
y.
,

Bertrand (1883), el modelo de arbitraje de oferta final de Farber (1980) por obstFUcción a la justicia.
y el problema de los ejidos (discutido por Hume [1739] y otros). En El problema de los presos puede representarse mediante la siguiente
cada aplicación, en primer lugar traducimos la descripción informal del matriz binaria. (Como matriz, una matriz binaria puede tener un núrnero
problema a una representación en la forma normal del juego y después arbitrario de filas y columnas; binaria se refiere al hecho de que en un
hallamos su equilibrio de Nash. (Cada una de estas aplicaciones tiene un juego de dos jugadores hay dos números en cada casilla, las ganancias de
único equilibrio de Nash, pero discutimos ejemplos en los cuajes esto no los dos jugadores).
ocurre.)
En la sección 1.3 volvemos a la teoría. En primer lugar definimos la
Preso 2
noción de estrategia mixta, que interpretamos en términos d.-ela falta de cer-
Callarse Confesar
teza de un jugador con respecto a lo que otro jugador hará. Seguidamente,
enunciamos y discutimos el teorema de Nash (1950),el cual garantiza que Callárse -1,-1 -J,Q
un equilibrio de Nash (que puede incluir estrategias mixtas) existe en una Preso 1 - .',
amplia clase de juegos. Puesto que presentamos primero la teoría bá-
sica en la sección 1.1, las aplicaciones en la sección 1.2 y, finalmente, más
Confesar (Ü,'--c 9
"..
(6'-6
"\ -~'-
teoría en la sección 1.3, resulta evidente que el conocimiento de la teoría
incluida en la sección 1.3 no constituye un requisito para entender las El dilema de los presos
aplicaciones de la sección 1.2. Por otra parte, la idea de estrategia mixta y
la exis'tencia de equilibrio aparecen (ocasionalmente) en capítulos poste- En este juego, cada jugador cuenta con dos estrategias posibles: confe~
riores. sar y no confesar. Las ganancias de los dos jugadores cuando eligen un par
Cada capítulo concluye con ejercicios, sugerencias de ,lectura adicional concreto de estrategias aparecen en la casilla correspondiente-de la ma~
y referencias. triz binaria. Por convención, la ganancia del llamado jugador-fila (aquí el.
.~ , • preso,l) es la primera, ganancia, seguida, po~:la.gananciadeL jugador:,:
columna (aquí el preso 2). Por eso, si por.ejemp~o;el pre~oJ elige caUar.y.
1.1 Teoría básica: Juegos en forma normal y equilibrio de Nash
el preso 2 elige confesar, el preso 1 recibe una ganancia de-9(que repre,
1.1.A Representación de los juegos en forma normal senta nueve, meses en prisión) y el preso 2 recibe una gananCia de O (que
representa la inmediata puesta en libertad),
En la representación de un juego en forma normal cada jugador elige de Ahora abordamos el caso generaL .La representación en forma normal
forma simultánea una estrategia, y la combinación de las estrategias ele~ de un juego especifica: (1) los jugadores en el juego, (2) las estrategias
gidas por los jugadores determina la ganancia de cada jugador. Vamos de que dispone cada jugador y (3) la ganancia de cada jugador en cada
a ilustrar la representación en forma normal con un ejemplo clásico; el combinación posible de estrategias. A menudo discutiremos juegos con
,-.:.,'
del dilema de los presos. Dos sospechosos son arrestados y acusados de un número n de jugadores, enlos cuales los jugadores están numerados de
un: delltoo"rta policía no tiene evidencia suficiente para condenar a los 1 a n y ~ jugadºL~bitrari~~s denominad.o_p;.g;do:r-i:)SeGei~onjunto
sósp€éh:osOs,a menos que uno confiese.. La policía encierra a los sospe::' de estrategias con que cuenta el jugador i (llamado espacio de estrategia1
;~osCJse!t"~~Idasseparadas y les explica las consecuencias derivadas de las de i), y sea Si un elemento arbitrario de este conjunto. (Ocasionahnetí'ie
. \Íedsionés" que formen. Si ninguno confiesa, ambos serán condenados por escribiremos si E Si rara indicar que la estrategia Si es uh elemento
un delito menor sentenciados a un mes de cárcel. Si ambos, confiesan~ del conjunto Si.)Sea (sI,'" ,sn) una combin'ación de estrategias, una para;
<l/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1)
Teoría básica: Jllegos en formal normal y eqllilibrio de Nash I 5

cada jugador, y seaUi la función de ganancias del jugador i: '!ti(sl, ,sn) es siempre que T > R > P > I, para plasmar las ideas de ganancias de
la ganancia del jugador i si los jugadores eligen las estrategias (SI, ,sn)' tentación, recompensa, penalización e ingenuidad. De forma más general:
Compilando toda esta información tenemos:

Definición. En el juego en forma normal G = {SI, ... ,Sn;Ul, ... ,lln}, sean s;
Definición. La representación en forma nonnal de un juego con n jugadores
y s;' posibles estrategias del jugador i (por ejemplo, s; y s;' son elementos de Si).
especifica los espacios de estrategias de los jugadores SI,' .. ,Sn y sus funciones
La estrategia s; está estrictamente dominada por la estrategia s;' si para cada
de ganancias '!tI, ... ¡Un. Denotamos este juego con G = {SI, ... ,SIl;Ul, ... ¡Un}. ..
combinación posible de las estrategias de los restantes jugadores la ganancia de i "::':.'
por utilizar si es estrictamente menor que la ganancia de i por utilizar s;':
Aunque hemos indicado que en un juego en forma norm~llos juga-
dores eligen sus estrategias de forma simultánea, esto no significa que las
partes actúen necesariamente de fonna simultánea. Es suficiente que cada
para cada (sIr' .. ,Si-l,Si+l,' .. ,sn) que puede ser construida a partir de los espa-
parte elija la acción a seguir sin conocer las decisiones de los demás, como
cios de estrategias de los otros jugadores SI,'" ,Si~l,Si+l, ... ,Sn'
sería aquí el caso si los presos tomasen una decisión en momentos arbitra-
TÍosen sus celdas separadas. Además, aunque en este capítulo utilizamos
juegos en forma normal para representar solamente juegos estáticos en Los jugadores racionales no utilizan estrategias estrictamente domina-
los cuales los jugadores actúan todos sin conocer las decisiones de los das, puesto que bajo ninguna conjetura que un jugador pudiera formarse
demás jugadores, veremos en el capítulo 2 que las representaciones en sobre las estrategias que elegirán los demás jugadores sería óptimo utili-
forma normal pueden darse en juegos con tomas de decisión sucesivas, zar tales estrategias. 1. Así, en el dilema de los presos, un jugador racional
pero también que una alternativa, la representación en fonna extensiva del elegirá confesar, por lo que (confesar, confesar) será el resultado alque lle-:
juego, es a menudo un marco de trabajo más conveniente para analizar gan dos jugadores racionales, incluso cuando (confesar, confesar) supone
los aspectos diná,IIri,cosde los juegos. unas ganancias peores para ambos jugadores que (callar, callar). Como
el dilema de los presos tiene múltiples aplicaciones (que incluyen la ca-
1.1.B EliminaciÓn iterativa de estrategias estrictamente dominadas t l '::
~ rrera de armamentos y el problema del polizón en la provisión de bienes
públicos) trataremos variantes del juego en los capítulos 2 y 4. Por ahora
nos centraremos más bien en si la idea de que jugadores racionales no uti-
Después de describir un modo de representar un juego, ahora vamof? a
lizan estrategias estrictamente dominadas puede conducir a la solución
esbozar una forma de resolver un problema de-teoríadejuegos. Empe-
de otros juegos.
zamos con el dilemá de los presos, porque es fácil de resolver utilizando
únicamente la idea de que un jugador racional no utilizará una estrategia Consideremos el juego abstracto de la figura 1.1.1.2 El jugador 1 tiene
estrictamente dominada .. dos estrategias y el jugador 2 tiene 3: Sr = {alta, baja} y S2 = {izquierda,
centro, derecha}. Para el jugador 1, ni alta ni baja están estrictamente
En el dilema de los presos, si un sospechoso va a confesar, sería mejor
para el otro confesar y con ello ir a la cárcel seis meses, en lugar de callarse
1 Una cuestión complementaria también tiene interés: si no existe una conjetura que'el
y pasar nueve meses en prisión. Del mismo modor'siun sospechoso va a jugador i pueda formarse sobre las estrategias de los demás jugadores, que haga óptimo elegir
1:::.-
callarse, para el otro sería mejor confesarycon el~os~r puesto en libertad la estrategia Si, ¿podemos concluir que debe existir otra estrategia que domine estrictamente a
inmediatamente en lugar de callarse y permanecer en prisión durante s.;? L;'respuésta es afirmativa, siempre que adoptemos definidones adecuadas de "conj~tura';
y de "otra estrategia", términos que incluyen la idea de estrategias mixtas que introduciremos
un mes. Así, para el preso i, la estrategia de callarse está dominada en la secdón 1.3.A.
por la de confesar: para cada estrategia que el preso j puede elegir, la 2 La mayor parte de este libro considera aplicaciones económicas más:que ejemplos
ganancia del pnsionero i es menor si se calla que si cónfiesa. (Lo mismo abstractos, tanto porque las aplicaciones Son de interés por sí mismas como porque, pa~~..
ocurriría en cualqUier matriz binaria en la cual las ganancias 0, "--:1; -6 múchos lectores, las aplicaciones son a menudo un modo útil de explicar la teoría subyacente:;',
Sin embargo, cuando introduzcamos algunas ideas teóricas básicas, recurriremos a.eJe~p]' .. ,
Y -9 fueran reemplazadas por las ganancias T,R,P ePiespectivamente, abstractos sin una interpretación económica directa. ¡. ,".t,l"

:::--
1:
6 / JUEGOS ESTÁTICOS CON INFOR.MAClÓN COMPLETA (e. 1) Teoría básica: fuegos en formal nonnal y equilibrio de Nas/¡ / 7

dominadas: alta es mejor que baja si 2 elige izquierda (porque 1 es mayor


Jugador 2
que O),pero baja es mejor que alta si 2 elige derecha (porque 2 es mayor
que cero), Izquierda Centro

Jugador 2 Jugador 1 Alta 1__ 1_,0 1_,2_


Izquierda' Centro Derecha Figura 1.1.3
"
:¡Alta 1,0 12 , 0,1 Este proceso se denomina eliminación iterativa de las estrategias estric-
Jugador1 tamente dominadas. Aunque está basado en la atractiva idea de que los
Baja 0,3 0,1 20 jugadores racionales no, utilizan estrategias estrictamente dominadas, el
proceso presenta dos inconvenientes. En primer lugar, cada paso requiere
", Figura Í.1.1 un supuesto adicional sobre lo que los jugadores saben acerca de la ra-
í'
\~,' cionalidad del otro. Si queremos ser capaces de aplicar el proceso pata
Sin embargo, para el jugador 2, derecha está estrictamente dominada un ntÍmero arbitrario de pasos, neceSitamos suponer que es informació11
por centro (porque 2 es mayo~ que 1 y 1 es mayor que O),por laque un del dominio público que los jugadores son racionales. Esto es, necesitamos
jugador racional 2 n{) elégiiá,:derecJ:¡.a. Así, si el jugador 1 sabe que el suponer no sólo que todos los jugadores son racionales, sino también que
jugador 2 es racionatjjúedeeliminar derecha del espacio de estrategias todos lbs jugadores saben que todos los jugadores son racionales, y que
del jugador 2., Esto. es, si el jugador 1 sabe que el jugador 2 es ~~cional, todos los jugadores saben que todos los jugadores saben que todos I~s
puede comportarse en eLjuegode la figura 1.1.1 como si estuviera ell el jugadores son racionales, y así ad infil1itUt1l (véase la defihición fomiaI de
juego de la figura 1.1.2. ..1l información del dominio público en Aumaim [1976]). ;
']iigadór2 La segunda desventaja de la eliminación iterativa de estrategias estric-
¡
tamente dominadas es que el proceso conduce a menudo a una prediCdó'ri j
Izquierda Centro
imprecisa sobre el desarrollo del juego. Por ejemplo~ consideremos el
Aita "'1,0 '1,2' juego de la figura 1.1.4. En-estejuego no hay estrategias estrictamente do-
!~gador 1 minadas para ser eliminadas. (Puesto que no hemos fun'darnéltado esté
juego en absoluto, al lector puede parecerle' arbitrario 'oinclusopafokígico.
,"

Baja' 0,3 0,1


Para una aplicación económica en el mismo sentido, véase el caso de tres
o más empresas en el modelo de Cournot incluido en la sección 1.2.A)
Figura 1.1.2 Puesto que todas las estrategias en el juego sobreviven a la eliminación
iterativa de las estrategias estrictamente dominadas, el proceso no permite
En lafigur~ 1.1.2, baja está ahora estrictamente dominada: por alta
ninguna predicción sobre el desarrollo del juego.
BaJ;il,eljugadoiJ,.así que si el jugador 1 es rac,ional(y.eljugador lsabe
que el jugador 2es racional, parlo que se aplica el juego de la figura 1:12) ,I (j D
hóceIegfr~baja~ Por eso; si el jugador 2 sabe que el fugador1, es :aciortal;
:y~'~]ug~5t?Fi sabe que el jugador 1 sabe qt]e. el jugador 2 es racional 'A 0.4. ,0 .~\3
(pÓt'16~ueeí]tigador 2sabe que se aplica la figura 1.1.2),,el jugador 2 M .1!i) 0,.4',5,3
,':.~'
. p€eae:~~arl)aja delespacio de estrategias del jugador 1, quedando el
';":'~'. '
.:.••...P.t~6"c8ffi'o'ii1dicálafigura 1.1:3:Péro ahora, izquüú\:la 'está estrictamente
B. 3,5 3,5 6.6
'::;.;;" :~,r,.\~:,;,:"=t:_(dr"!'i-'~~d'tlt-;N~;t':-/:¡;..¡:-__. ,." : ,:',' , , . , 1-
,~,"'. '
"': .."";.;~£l~J?¿f¡;~~!Ip,.parael jugador 2, quedando (alta, centro) como el Figura 1.1.4

,.ó"~';~;"~~V
.. J~~r~~#ft."'
.
:,f.~,•..
. -'~;. x" ,l'"
8/ jUECOS ESTATICOS CON INFORMACIÓN COMPLETA (e. 1)
Teoría básica: Juegos en formal nonnai y equilibrio de Nash / 9

A continuación abordamos el equilibrio de Nash, un concepto de so-


Para relacionar esta definición con su fundamerltación anterior, su-
lución que da lugar a predicciones mucho más precisas en una clase de
pongamos que la teoría de juegos ofrece las estrategias (s~, ,s~) como
juegos muy amplia. Demostramos que el equilibrio de Nash es un cOn-
la solución al juego en forma normal G =: {SI, ... ,Sn; 'Ul, , un}' Decir
cepto ~iesoluc(ónmás poderoso que la_e.liminacióniterativa de las.estra~
que (s~, ... ,s~) no constituyen un equilibrio de Nash de G es equivalente
tegias estrictamente.dominadas, en el sentido 'de que las estrategias de los
a decir que existe algún jugador 'i tal que si no es la mejor respuesta a
jugadores en un equilibrio de Nash siempre sobreviven a la eliminación (sl,/ ... ,si_l,si+I,
/ / /') Esto es," eXIstea 1guna S'i en S,italque,.,
11 ,.
... ,sn'
iterativa de las estrategias estrictamente domin<).das,~osa que no ocurre
a la inversa. En los capítulos siguientes argmnentareinos que, en juegos
más dcos, incluso el equilibrio de N ash da lugar p. predicciones demasiado ,\'
"', I

impn;cjsas sobre el desarrollo. del juego, por lo que definiIemos nociones


de equilibdo aún más poderosas, más adecuadas para estos casos. ,," Así, si la teoría ofrece las estrategias (s~, ... ,s~) como la solttdón pero estas
estrategias no constituyen un equilibrio de Nash, al menos un jugador
", ..
tendrá un incentivo para desviarse de la predicción de la teoría, con lo
1.1.C Fundamentación y definición del equilibrio de Nash
que la teoría quedará desin~~tida por el desarrollo conCreto del juego.
Otra fundamentación muy parecida del equilibrio de Nash incorpora la
Una manera de fundamentar la definición del equilibrio de Nas1:l.~~el
idea de convenio: si surge un acuerdo sobre cómo comportarse en un
argumento de q~e silateoría de juegos ofrece un~ solu<:iÓIlúrlica a un
determinado juego, las estrategias fijadas por el convenio deben formar
determinado P\9plerna" esta solución debe ser,un equilibJ:i<;> 9-c~._~a~!:u~n
un equil~bri~ de Nash;si no,-habrá al menos un jugador que no se regirá
el,siguiel1te sellti4o:, Supongamos que la Jeona de jlleg~~ h~~ ~,~!:lÍ,~~
por ~l,i:onv~nio. '. ' .
predicción sobre las estrategias elegidas por los jllgadores. Pilr<).que eSta
Para concretar, vamos a resolver unos cuantos ejemplos. COrisider~
predicción sea correcta es necesario que cadajug?!~oresté d~puesto a
elegir la'estrat~g¡a.p~edicha por la teoría. Por ello, la estrategiapredi~
moslos tr~-~eg~s en forma normal ya descritos: el dileIT;,adelos p~es~~
y los de ia~j{iuras 1.1.1. y 1.1.4. Una forma torpe de hallar los équili~
cha de cada jugador, debe ser la mejor respuesta de cada jugador. a)as f •.•.. , . , ""

brios de Nash en un juego consiste simplemente en comprobar si cada


estrategias pre~ichas. de los otros jugadores. Tal predicc~ón puede d~~o-
combinación p~sible.de estTat~gias satisface la condición'(EN) en la defi~
minarse estratégicame~teestable o self-enforcing, puesto que ningún jugador
nicióI1} En un juego de dos jugadores, esta forma dehélllarlos eqtrilibrios
va a qUeJ;erdesviarse de la estr¡itegi.apredicha paril é}. Llamaremosatal
predicción equilib.rio de Nash: co~~~ádel y
modo siguiente: para cada jugador pa"rac~da estrate¡pá
posible ~onla que cuenta cada j"ugador se determina la mejo~ resp~ésta
del 'otro 'juga.dor a-ésa estrategia. En la figura 1.1.5 se representa esto en
Definición. En el juego en forma normal de n jugadores, G,=J SI,.~. ,Sn; Ul,
el caso del juego definido en 1.1.4, subrayando la ganancia de la mejor
... ,un}, las fstrategías(;}, ... ,s;,) forman un equilibrio de Nasft si, para cada
respuesta del jugador j a cada una de las posibles estrategias del jugador
jllgadrri, sr~es.la mejor respuesta del jugador i (o al menos una di?:ell(ls) {das
estrategias de los otros n - 1jugadores, (si, ... ,S7_1,s7+1' '" ,s~):
i: Sj el jugador columna fuera a jugar 1, por ejemplo, la mejor respuesta
del jugador fila sería M, puesto que 4 es mayor que 3 y que O; por eÚo,
la gananCia q~e 4)é proporciona al jugador fila en la casilla (M,I) de lá
matriz binaria está subrayada.
(EN)

para cada posible estrategia Si en Si; esto es, si es l/na solución de


3 En la sección 1.3.A vamos a distinguir entre estrategias puras, y mixtas. Después vamos
a ver que la definición dada aquí describe equilibrios de Nash en estrategias puras, pero
que también puede haber equilibrios de Nash en estrategias mixtas. A menos que se.señale'
explícitamente de otro modo. todas las referencias'a los equilibrios de Nash en esta secció~.,~~C
refieren a equilibrios de Nash en estrategias puras.
la/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (el)
TeorIa básica: Jllegos ell forma/Ilormal y equilibrio de Nas" / ]]

Un par de estrategias satisface la condición (EN) si la estrategia de equilibrio de Nash. Para ver esto último recordemos que en la figura 1.1.4,
cada jugador es la mejor respuesta a la del otro, es decir, si ambas ganan- el equilibri.? de Nash ofrece una única predicción C8,D), mientrélS que la
cias estáÍr subrayadas en la casilla correspondiente de la matriz binaria. eliminación iterativa de las estrategias estrictamente dominadas ofrece
. Por ello C8,D) es el único par de estrategia~ que satisface (EN). Lo mismo una predicción con el mayor grado de imprecisión posible: no se elimina
:, ocurre para (confesar, confesar) en el dilema de los presos y para (alta, cen- ninguna.estrategia; puede ocurrir cUéllquiercosa.
.,,>' Tras demostrar que el equilibrio de Nash es un concepto de solución
tro)en la figura'1.1.1. Estos pares de estratégias son los únicos equilibrios
de Nash dé estos juegos.4 más poderoso que la eliminación iterativa de las estrategias estrictamente
dominadas tenemos que preguntarnos si el equilibrio de Nash no es un
concepto de solución demasiado poderoso. Esto es ¿podemos estar se-
1 e D guros de que el equilibrio de Nash existe? Nash (1950) dem\Jstiá que en
lA 0,1- 1-;0 5,3 cualquier juego finito (por ejemplo, un juego en el cual el nun1ero n de
jugadores y los conjuntos de estrategias SI,' .. ,Sn son todos finitos) existe
M 1,0 0,1- 5,3 al menos un equilibrio de Nash. (Este equilibrio puede~!1Cluirestréltegias
B 3,5 3,5
º'~ mixtas, que discutiremos en la sección 1.3.A. Paraun J~unciado preciso
del teorema de Nash véase la sección 1.3.B.) COUlnot (1838) propuso la
Figura 1.1.5 misma noción de equilibrio en el contexto deÍlJ1 modelo particular de
duo polio y demostró (por construcción) que existe un equilibrio en este
A continuación tratamos larel~dón entre el equili1:Jri2=c1..~ l':fª-sh y la modelo; véase la sección 1.2.A. En cada aplicación anaÜzada en este libro,
, eliminación iterativa de las estrategias estrictamente dominadas. Recor- seguiremos el ejemplo de Cqumot: demostraremo~ q~e existe un equi-
demos que las estrategias de equilibrio de Násh én el dilema de los presos Jibrio de Nash (o más poderoso) mediante la construcéión de uno. En
y
yen1a figUra1.P -:-(col1fesar,confésar) (álta, éentro)respectivamenfee- .algunas secciones teóricas, no obstante, utilizaremo~ el teorema de Nash
sorilas únicas estrategias 'que sobreviven a la eliminación iterativa de las (o su análogo para conceptos de equilibrio más poderosos) y simplemente
estrategias estrictamente dominadas. Este resultado puecl.egeneralizarse: diremos que existe un equilibrio. .,
si la ~lirniÍ1.aciónih;;rativa de las estrategias estrictamente dominadas eli- Conclullnos esta sección con otro ejemplo clásico, la bat~lla de los sexos.
mina tbdas las estrategias ~'enos las estrategias' (si, ... ,<), estas esfrate- Este ejemplo muestra que un juego puede tener múltipl~~equl1i'Griosae
giasconstituyen el único equilibrio de Nash del juego. (Véase el apéndice Násh, y también será útil en las discusiones sob~~~stTategias mixtas de las
para'una demostració'n de esta aflnnación.) Sin embargo, puesto que la secciones 1.3.B y 3.2.A. En la exposición tradicionáldel juego (que, quede
eliminación iterativa de las estrategias estrictamente dominadas éoÍl fre- claro, data de los años cincuenta), un hombre y una mujer están tratando
no
cuencia elimina más que una combinación de estrategias, es del máximo de decidir qué harán esta noche; nosotros analizarnos uha versión del
in~erés el hecho de que elequilibno déNáshsea un concepto de soluCión juego que no tiene en cuenta el sexo de los participantes} En lugares
más poderoso que la eliminaCi6n iterativa de las estrategias estrictamente de trabajo sep¡:¡rados, Paty Chris deben elegir entre ir a.'la ópera' o élun
dominadas en el siguiente sentido: si las estrategias si, ... ,s~ constituyen combate de boxeo.. Arn,bos(as) jugéldores(as) preferirían pasar la noche
iÚl"equilibrio de Nash, sobreviven a la eliminación iterativa de las estra- juntos(as), pero Pat preferiría estar juntos(as) en el boxeo, mientras que
tegias,estrictamenté dominadas (véase apéndiee para una demostración), Chris preferiría estar juntos(as) en la ópera, tal como representamos en la
. ,~' matriz binaria que sigue:
'..:::;:; pero pueden existir estrategias que sobrevivan a la eliminación iterativa de
elitrategi~s,estrictamente dominadas pero que no formen parte de ningún
"t;Ut~{'~,\~J~~~t.:h~~\1i'\~~;;-\:c:
..', -, . :' ".
, .
..;"",4:EstÍlafumadón es correcta incluso si no limitamos nuestra atendón al equilibrio de Nash
,'en:estx:~tegiaspuras; puesto que en estOs juegos no existen equilibrios de Nash en estrategias s En inglés, los diminutivos Pat y Chris pueden referirse tanto a nombres masculinos
i>''''fuíXta&:Yéasee! ejercido 1.10. :. ','. . (Patrick y Christopher) como femeninos (Patricia y Christinal. (N. de los T.)
'-';)';".;' '.'
12/ JUEGOS ESr,\rICOS CON INFOIUvlACJÓN COMPLETA (e. 1)
Teoría básica: fuegos en jonnalnol'mal y equilibrio de Nash / 13

Apéndice
Pat
Ópera Boxeo
Este apéndice contiene d~ll1ostraciones de las dos proposiciones siguientes,
que fueron enun<;:iadasde manera informal en la sección 1.1.C. Saltarse
Ópera ?,l 0,0
estas demostraciones )1.0 jmpedirá de forma sustancial la comprensión
Chris
del resto d~l libro. Sin embargo, para aquellos lectores no acostumbra~
Boxeo 0,01,~
dos a la manipulación de definiciones formales y a la construcción de
demostraciones, el dominio de estas demostraciones constituye un va-
La batalla de los sexos lioso ejercicio.

Ambos, (ópera, ópera) y (boxeo, boxeo) son equilibrios de Nash: Proposición A. En el juego en forma normal con njugadores G= {Sr. ... ,
Hemos argumentado antes que"si la teorladejuegos ofrece una única Sn; Ul,,; . ,Un L si la eliminación iterativa de las estrategias estrictamente domi-
solución a un juego, ésta debe ser un equilibiio de Nash. Este argumento nadas elimina todas las estrategiqs menos las (s1'" . ;s~),estas últimas estrategias
ignora la posibilidad de juegos en los cuales la teoría de juegos no' ofrece constituyen el único equilibrio de Nash del juego.
una solución única. También hemos argumentado que si se llega a un
ª<;:ut:!"¡jg._~º.º!~_~~mo
comportarse en un juego, las éstrategias establecidos Proposición B. En el juego en forma normal con n jugadores G = {SI,' .. ,Sn;
.t:!l tiªmergQ _d~~~~_se¡:-ú~. t:g~lliPJi~2=~~:~E!' I?~!~._e?t~.a~~~~~h>7al Ul, ... ,Un}, si las estrategias (S1' ... ,s~) forman un equilibrio de Nash; entonces
ig~~! que eLª~t~r.i~!,ignoral~ p_~~i!?ili9.él~.~e
juegospara los cuaiés7~se- sobreviven a la eliminación iterativa de las estrategias estrictamente dominadaS}'
_a!cance un -élc.~~~'!.<:¡Eña[gÚnSJsj~~g~~~º~múItipl~s'éCiciiil)riós~~f~"'Ñasl1'. ,.• .'.::t. ;'~-~~::~'li;r"
s()~~~sa!e_~~_~9,~~~Lb!2~.~o..mo)asol~.~ión más atT'a5.~Yª.9~lj~o:l'C¥an Puesto que la proposición B es más fácil de demostrar, comeriZalli~s
parte de la teoría de los capítulos posterl.oresci:mstÜuye'u~ esfu';Z'opa;á . por ella para entrar en materia. El argumenta "es
por<co¡{tradlédÓhí
identificar este equilibrio más atractivo en diferentes clases de juegos.) Esto es, vamos a suponer que una de las estrategias,en unequiIíbri~
Así, la existe.n.ciade múltiples equilibrios de Nash no es un problema en de Nash es eliminada por eliminación iterativa de las estrategias'~stri'c-'
sí mismo. Sin embargo, en la batalla de los sexos, (ópera, ópera) y (boxeo, tamente dominadas, y después demostraremos que llegaríamos a urta
boxeo) parecen iguahnente atractivos, lo que indica quepuééien eXistir conqadicc~ón si este supuesto ocurriera, demostrando así que el ~U:pti~sto
debe ser falso.' . .., -..i~.K•.,.... - ,.• ' ",.,L '"-
juegos para los cuales la teoría de juegos no ofrece una"soluciÓr{única y
en los que no se llegará a ningún acuerdo.6 En tales juegos, el equilibrio Supongamos que las estrategias (si,. e, e ,s;;') forman un equilibriCld~
de Nash pierde gran parte de su atractivo como predicción del juego. Nash del juego en forma normal G= {SI," "Sn;Ui~¿; ;,un}, pero sÜ:pon:
gamos también que (tal vez después de que algunas estrategias distintas
de (s1" .. ,s~) hayan sido eliminadas) si es la primera de las estrat~gias
(s1' ... ,s~) en ser eliminada por ser estrictamente'dominada. Entonces,
debe existir una estrategia S~' que no ha sido aún eliminada de Si que
domina estrictamente a si. Adaptando (DE) tenemos ., .'
6 E l .-
. n a secaon 1.3.B describimos un tercer equilibrio de Nash (que incluye estrategias
nuxtas) en la batalla de los sexos. Al contrario que (ópera,ópera) y (boxeo,boxeo), este tercer.
eqUlhbno ofrece ganandas simétricas, como se podria esperar de la solución única a un juego
sunetnco. Por otro lado, el tercer equilibrio es también ineficiente, lo cual puede influir en (Li.l)
contra de que se llegue a un acuerdo para alcanzarlo. Cualquiera que sea nuestro juicio sobre
los eqUllibnos de Nash en la batalla de los sexos, la cuestión sigue en pie: pueden existir para cada (sI;' .. ,si-l,Si+l,' .. ,Sn) que puede ser construida a partir de las
Juegos para l~s cuales la teoría de juegos no ofrezca una soluciÓn única y para los que no se estrategias que no han sido aún eliminadas de los espacios de estrategias
llegue a rungun acuerdo ..
de losatros jugadores. Puesto que si es la primera delas estrategias de
,', .
'~:'~ I

14/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1) AplicaciO/leE' / 15

equilibrio en ser eliminada, las estrategias de equilibrio de otros jugadores Si s; = si (es decir, si si es la estrategia que domina estrictamente a s;)
no han sido eliminadas, por lo que una de las consecuencias de (1.1.1) es (1.1.5) contradice a (1.1.3),en cuyo caso la demostración está completa. Si
s; I si alguna otra estrategia s;' debe más tarde dominar estrictamente a
(1.1.2)
s;, ya que s; no sobrevive al proceso. Por eSO, las desigualdades análogas
a (1.1.4) y (1.1.5) se cumplen para s; y s;', que sustituyen a Si y -< respec-
Pero (1.1.2) es contradicha por (EN): si debe ser una mejor respuesta a . tivamente. Una vez más, si s;' = si la demostración está completa; si no,
(si, ... ,s:~1,s:+l"" ,s~), por lo que no puede existir una estrategia <' que pueden construirse otras dos desigualdades análogas. Puesto que es .<
domine estrictamente a si. Esta contradicción completa la demostración. la única estrategia de Sí que sobrevive al proceso, la repetición de este
Después de haber demostrado la proposición Bhemos ya demostrado argumento (en un juego finito) completa finalmente la demostración.
parte de la proposición A; lo único que nos queda demostrar es que si
la eliminación iterativa de estrategias estrictamente dominadas elimina
1.2 Aplicaciones
todas las estrategias excepto (si, ... ,s~), estas estrategias forman un equi-
librio de Nash. Por la proposición B cualesquiera otros equilibrios de
Nash habrían sobrevivido también, por lo que este equilibrio debe ser 1.2.A Modelo de duopolio de Cournot
único. Suponemos aquí que G es finito.
El argumento es nuevamente por contradicción. Supongamos que Como hemos indicado en la sección previa, Cournot (1838) se anticipó
la eliminación iterativa de estrategias estrictamente dominadas elimina a la definición de equilibrio de Nash en más de un siglo (pero sólo en
todas las estrategias excepto (si, ... ,si'), pero estas estrategias no forman el contexto de un modelo concreto de duopolio). Por ello, no es sor-
un equilibrio de Nash. Entonces debe existir un jugador i y alguna estra- prendente que el trabajo de Cournot constituya uno de los clásicos deía
tegia factible Si en Si tal que (EN) no se cumpla, pero Sí debe haber sido teoría de juegos y una de las piedras angulares en organización industriaL
estrictamente dominada por alguna otra estrategia s; en algún punto de] Consideramos aquí una versión muy simple del modelo de Cournot y
proceso. Los enunciados formales de estas dos observaciones son: existe presentaremos variaciones del modelo en los capítulos siguientes. En esta
Sí en Si tal que
sección utilizamos el modelo para ilustrar: (a) la traducción del enunciado
informal de un problema a.la forma normal de un juego; (b) los cálculos
necesarios para hallar el equilibrio de Nash del juego y (c) la eliminación
(1.1.3) iterativa de las estrategias estrictamente dominadas.
y existe s; en el conjunto de estrategias del jugador i que queda en algún Sean q1 y q2 las cantidades (de un producto homogéneo) producid~~
punto del proceso tal que . por las empresas 1 y 2 respectivamente. Sea P(Q) = a - Q el precio
de equilibrio de mercado cuando la cantidad agregada en el mercado es
Q = q1 + q2. (Más precisamente, P(Q) = a - Q para Q < a. y P(Q) = Opara
(1.1.4) Q 2: a.) Supongamos que el coste total de producción de la cantidad qi
para cada (S1,", ,Sí-1,Si+1," . ,sn) que puede ser construida a partir de las por la empresa i es Cí(qí) = eqí. Es decir, no existen costes fijos y el coste
estrategias que quedan en los espacios de estrategias de los otros jugadores marginal es constante e igual a e, donde suponemos que e < D.. Siguiendo
en ese punto del proceso. Puesto que las estrategias de los otros jugadores a Cournot, suponemos que las empresas eligen sus cantidades de forma
(si, ... ,si_1,s:+1'" . ,s~) nunca son eliminadas, una de las implicaciones de simultánea?
(1.1.4) es
. 7 En la sección 1.2.B discutimos el modelo de Bertrand (1883), en el cual las empres"s
ehgen preaos en vez de cantidades, y en la sección 2.1.B el modelo de Stackelberg (J 934), en
el cual las empresas eJ:gen cantidades, pero una empresa eHge antes que (y es observada por)
(1.1.5) la otra. Finalmente, discutimos en la sección 2.3.C el modelo de Friedman (1971). en el cual la
interacción descrita en el modelo de Coumot ocurre repetidamente en el tiempo .
16,' JUECOS EST.S.TICOS CON INFORMACIÓN COMPLETA' (e. 1) Aplicaciones / 17

Para encontrar el equilibrio de Nash en el juego de Cournot, primero En el modelo de duopolio de Cournot, el enunciado análogo es que el par
traducimos el problema a un juego en forma normal. Recordemos de de cantidades (qj,qi) forma un equilibrio de Nash si, para cada empresa
la sección anterior que la representación en forma normal de un juego i, q7 es una solución de
exige precisar: (1) los jugadores en el juego; (2) las estrategias de que
dispone cada jugador y (3) las ganancias recibidas por cada jugador con
cada combinación de estrategias posibles. Hay dos jugadores en un juego "
"
de duopolio: las dos empresas. En el modelo de Cournot las estrategias Suponiengo que qj < (bc(<;:omo demostraremos que ocurre), la condición
de que dispone cada empresa son las diferentes cantidades que puede de primer orden del problema de optimización dela empresa i es necesaria
producir, Vamos a suponer que el producto es continuamente divisible. y suficiente, con lo que se obtiene
Naturalmente, no puede haber producción negativa. Por ello, el espacio
1
de estrategias de cada empresa puede ser representado com? Si ':"[O,OO)! qi = 2(a - qj - e).
los números reales no negativos, en cuyo caso una estrátegiaÍípica'~i es
Así, si él phrdecantidades (qj,qi) ha de formarun'equilibrlo de Nash,Jas
la elección de una cantidad q.¡ 2': O.Se podría argumentar que no se puede
canhdadeselegidas por las ettípresas deben cumplir ' "
disponer de cantidades demasiado grandes, por 10 que éstas 'no debé'rían
incluirse en el espacio de estrategias de una empresa. No obstante, puesto
°
que P(Q) = para Q 2: a, ninguna empresa producirá una cantidad qi > a. ql* = 21(a - q2• - e)
Quedan por concretar las ganancias de la empresa .í en función de las y
estrategias elelsidas por dicha empresa y por la otra empresa, y definir
y hallar el equilibrio. Suponemos que las ganancias de la empresa son •
q2 = 21( a - • )
ql - e .
i~~.,

simplemente su beneficio. Por ello, la ganancia lli(Si,Sj) en u:r'tjuego ge-


neral en forma normal de dos jugadores puede expresarse de la sigÜiente Resolviendo este par de ecuaciones obtenemos
forma:8
>1< 'a - e
,..

ql = q2 = -3-'
.
lri(qi,qj) = q¡[P(q¡ + qj) - el = gira - (qi + qj) - c]. que es ciertamente menor que a - e, como habíamos supuesto.
La interpretación de este equilibrio es simple. Cada empresa quema
Recordemos de la sección previa que, en un juego en forma normal de
por supuesto tener el monopolio del mercado, en cuyo caso elegiría qi para
dos jugadores, el par de estrategias (si ,si) forn'1.a. un equilibrio de Nash si,
para cada jugador i, maximizar 1f'i(qi,O), produciría la cantidad de monopolio q';'= (a - e)/2 y
alcanzaría un beneficio de monopolio 1f'i(qm,O) = (a - e)2 / 4. Dado que hay
dos empresas, los beneficios agregados del duopolio se verían maximiza-
(EN)
dos fijando una cantidad agregada ql + q2 igual a la cantidad de monopolio
para cada posible estrategia S¡ en Si. De la misma forma, para cada qm, como ocurrirla si qi = qm/2 para cada i, por ejemplo. El problema de
jugador i, 87debe ser una solución del problema de optimización este arreglo es que cada empresa tiene un incentivo para desviarse de él,
puesto que la cantidad de monopolio es baja, el precio correspondiente
P(qm) es alto y, a este precio, cada empresa quema aumentar su cantidad,
max 'lLi(8i,8j)'
',ES, pese a que tal incremento en la producción bajaria el precio de equilibrio
de mercado. (Formalmente, utilícese (1.2.1) para comprobar que qm/2 no
8 Obsérvese que hemos cambiado ligeramente la notación al escribir Ui(Si,Sj) en vez
de 'l/.¡(SI,s2)' Ambas expresiones representan las ganancias del'jugador i en función de las
es la mejor respuesta de la empresa 2 a la elección de qm/2 por parte de la
estrategias elegidas por todos los jugadores, Vamos a utilizar estas expresiones (y sus análogas empresa 1.) En el equilibrio de Cournot, al contrario, la cantidad agregada ,'-
,
con 11 jugadores) indistintamente. es más alta, por lo que el precio correspondiente es más bajo, con lo que la'

.,'
i.:,.
18 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1) Aplicaciones I 19

tentación de aumentar la producción queda reducida justo lo preciso para Como se muestra en la figura 1.2.1 estas dos funciones de mejor respuesta
que cada empresa decida no hacerlo, al darse cuenta de que con ello caerá se cortan sólo una vez, en el par de cantidades de equilibrio (qi ,q;).
el precio de equilibrio de mercado. Véase el ejercicio 1.4 para un análisis Un tercer modo de hallar este equilibrio de Nash es aplicar el proceso
de cómo la presencia de un número n dé oligopolistas afecta al dilema de eliminación iterativa de las estrategias estrictamente dominadas. Este
planteado en equilibrio por la tentacióri de aumentar la producción y el proceso ofrece una única solución que, por la proposición A del apéndice
temor a reducir el precio de equilibrio de mercado. de la sección anterior, debe ser un equilibrio de Nash (qj',qi). El proceso
En vez de hallar de forma algebraica el equilibrio de Nash del juego completo requiere un número infinito de pasos, cada uno de los cuales
de Cournot, se podría hallar gráficamente del modo siguiente: la ecuación elimina una fracción de las cantidades que quedan en el espacio de es-
(1.2.1) proporciona la mejor respuesta de la empresa i a la estrá'tegia de trategias de cada empresa. Vamos a discutir solamente los dos primeros
equilibrio de la empresa j, q;. Un razonamiento análogo conduce a la mejor pasos. En primer lugar, la cantidad de monopolio qm = (a. - c)/2 domina
respuesta de la empresa 2 a cUalquier estrategia arbitraria de la empresa estrictamente a cualquier cantidad más alta. Es decir, para cada :/; > 0,
1, y la mejor respuesta de la empresa 1 a cualquier estrategia arbitraria 'lri(qm,qj) > 'lri(qm + x,qj) para toda qj ~ o. Para comprobarlo, nótese que

de la empresa 2. Suponiendo que la estrategia de la empresa 1 cumple Q = qm + X + qj < a, por lo que


ql < a - c, la mejor respuesta de la empresa 2 es

del mismo modo, si q2 es menor que a. - c, la mejor respuesta de la empresa


les -

"',
",! y si Q = qm + X + qj ~ a, entonces P(q) = O, por lo que producir una
cantidad menor aumenta el beneficio. En segundo lugar, puesto que
las cantidades mayores que qm han sido eliminadas, la cantielad (a -
' ..::; q, c)/4 domina estrictamente a cualquier cantidad más baja. Esto es, para
cualquier x entre cero y (a - c)/4,'lri [(a. - c)/4,qj] > 'lri[(o. - c)/4- x,qjJ para
cualquier qj entre cero y (a - c)/2. Para comprobarlo, nótese que

(O, a - e) 'Ir- (~ _) _ a - e [3(0_ - c) _ _]


, 4 ,q] - 4 4 q]

y
(O, (a - e)/2)
o.-c ) = [a-c
-4- - x ] [3(a-C)
---4-- + x ]
7fi ( -4- - x,qj - qj
',-
.•..
a. - e ]
.¡)~
.- ='lri ( qm,qj ) - X [ -2- +x - qj -

.• «a - c)/2, O) (a e c, O)' q, Tras estos dos pasos, las cantidades que quedan en el espacio de estrategias
de cada empresa sonlas contenidas en el intervalo entre (0.-c)/4 y (a-c) /2 .
.,): -; Figura 1.2.1 La repetición de estos argumentos conduce a intervalos cada vez menores
20/ JUECOS ESrÁrlCOS CON INfORMACIÓN COMPLETA (e. 1) Aplicaciones / 21

de las cantidades que quedan. En el límite, estos intervalos convergen al Como en el caso anterior, la repetición de estos argumentos conduce a la
único punto IJ.; = (a -c)/3. cantidad qi = (a - c)/3.
La eliminación iterativa de las estrategias estrictamente dominadas Concluimos esta sección cambiando el modelo de Coumot, de forma ".

también se puede representar en forma gráfica utilizando la observación que la eliminación iterativa de las estrategias estrictamente dominadas no
(incluida en la nota 1; véase también la discusión en la sección 1.3.A) de ofrezca una solución única. Para hacerlo, añadimos simplemente una o
,
que una estrategia es estrictamente dominada si y sólo si no existe ninguna más empresas al duopolio existente, Vamos a comprobar que el primero .•.... :

conjetura sobre las decisiones posibles de los demás jugadores para la cual de los dos pasos discutidos en el caso del duo polio continúa cumpliéndose,
sea la mejor respuesta. Puesto que sólo hay dos empresas en este modelo, pero el proceso termina ahí. Por eso, cuando hay más de dos empresas,
podemos reformular esta observación del siguiente modo: una cantidad la eliminación iterativa de las estrategias estrictamente dominadas ofrece
q¡ es estrictamente dominada si y sóJo si no hay ninguna conjetura sobreqj sólo la predicción imprecisa de que la cantidad de cada empresa no ex-
tal que q¡ sea la mejor respuesta de la en1presa i. Nuevamente"discutimos 'cederá a la cantidad de monopolio(como enla figura 1.1.4, donde no se
sólo los dos primeros pasos del pr,?ceso iterativo. En primer lugar,:n1¥1~a eliminaba ninguna ~strategia durante el proceso).
es una respuesta mejor para la empresa i producir más que la canti~~d de Para ser más concretos, consideramos el caso de tres empresas. Sea
monopolio qm = (a - c)/2. Para comprobarlo, consideremos, por ejemplo, Q-¡ la suma de las cantidades elegidas por las empresas distintas de i, y
la función de mejor respuesta de la empresa 2: en la figura 1.2.1, R2(q¡) sea 1ri(qúQ -i) = q.¡(a - qi - Q -i - e) siempre que qi + Q -i < a (mientras que (

es igual a qm cuando q¡ = 0, y disminuye cuando q] aumenta. AsÍ, para 7fi(qi,Q-i) =-Cqi si qi + Q-i 2: a). Nuevamente es cierto que la cantidad \ ..
cualquier qj 2: 0, si la empresa i cree que la empresa j elegirá qj, la mejor de monopolio qm = (a - e)/2 domina estrictamente cualquier cantidad
respuesta de la empresa .¡ es menor que o igual a qm. No existe qj tal que más alta. Es decir, para cualquier x > 0, 1ri(qm,Q-i) > 1ri(qm + ;,Q-D
la mejor respuesta de la empresa i sea' mayor que qm. En segundo lugar, para todo Q-i 2: 0, C0Il10 en el prime~ paso delcaso de duopolio.'sik
dada esta cota superior para la cantidad de la empresa j, podemos derivar embargo, puesto que hay dos empresas además de la empresa i, lo único
una cota más baja a la mejor respuest~ de la empresa i: si qj ::; (a - e)/2, que podemos decir acerca de Q_; es que está entre cero y(a - e), porque q/ ,o,.
entonces R;(qj) 2: (a - c)/4, como mostramos para la mejor respuesta de y qk están entre cero y (a - c)/2. Pero esto implica.que ninguna cantidad
la empresa 2 en la figura 1.2.2.9 °
qi 2: es estrictamente dominada en el caso de la empresa i, porque para
q, cada qi entrecero y (a -c)/2 existe un valor de Q-i entre cero y (a ~ e)
(concretamente;Q_i= a - e - 2qi), tal que qi es lamejor respuesta de la
(0, (a - e) /2) emp;esa i a Q~i. Poi- ello, en lo sucesivo ya no se puede eliminar rtingUIl~'
estrategia. . .'.
R,(q)
(O, (a - e)/4)

1.2.BModelo de duopolio de Bertrand


", ...
((a - e) /2,0) (a - e, O)
A continuación consideramos un modelo diferente de la relación que
Figura 1.2.2 puede ~xistir entre dos duopolistas, basado en la sugerencia de Bertrand
(1883) de que, de hecho, las empresas eligen precios, y no cantidades
como en el modelo de Coumot. Es importante observar que el modelo de
9 Estos dos argumentos son ligeramente incompletos, puesto que no hemos analizado Bertrand constituye un juego difererite ¡¡(Ínódelo de Coumot: los espacios
la mejor respuesta de la empresa i cuando no tiene la certeza de cuál sea la cantidad qj' de estrategias son diferentes, las funciones de ganancias son diferentes
Supongamos que la empresai no está segura de qj pero cree que el valoresper<ldo,de qj y (como se verá) el comportamiento de los equilibrios de Nash en los '," .
es E(q.i)' Puesto que 1ri(Qi,Qj) es lineal en qj,!a mejor respuesta de la empresa -tdentrode
su incertidumbre es igual a su mejor respüesta cuando tiene la certeza dé que la "empresa j dos modelos es diferente.' Algunos autores resumen estas diferencias ha-
elegirá E(qj), caso' que hemos desarrollado en el texto. .".. c....':~c.'""':'" blando de los equilibrios de Coumot y de Bertrand. Pero esto puede crear
,..:
22/ JUEGOS ESTÁTICOS CON JNFORNIACJÓN COMPLETA (c. 1) Aplicaciones! 23

confusiones, puesto que existen diferencias entre los juegos de Bertrand empresai, pi es una solución de
y Cournot y en el comportamiento de equilibrio en estos juegos, pero /10
existe diferencia en el concepto de equilibrio utilizado en ambos juegos. max "i(pi'));) = max [u, -]Ji + upj](Pi - eJ,
O::;Pi <00 O::;Pi <00
En ambos el concepto de equilibrio utilizado es el equilibrio de Nash definido en
la sección anterior. La solución al problema de optimización de .ies
Consideremos el caso de productos diferenciados. (Para el caso de
+ bp*¡. + e).
pi = ~(iJ,
productos homogéneos véase el ejercicio 1.7.) Si las empresas 1 y 2 eligen . 2
los precios PI y P2 respectivamente, la cantidad demandada a la empresa Por 10 tanto, si el par de precios (pi ,pi) ha de ser un equilibrio de Nash,
i por los consumidores es las decisiones de precios de las empresas deben cumplir

qi(PúPj) = a - Pi + bpj, pi = ~(a + 0¡/2 + c)


donde o > O refleja hasta qué punto el producto de la empresa i es un y
sustituto del producto de laempresaj.(Ésta esuilafuiH:ión de demanda
irreal, puesto que la cantidad demandada dei piodtict~ de la empresa pi = ~(a+opi +c)
2
i es positiva incluso cuando la empresa i fija un preció arbitrariamente
Resolviendo este par de ecuaciones obtenemos
alto, siempre que la empresa j también fije un precio suficientemente
alto. Como se verá, el problema sólo tiene sentido si b < 2.) Como en * * a+c
la discusión del modelo de Cournot, suponemos que no existen costes
p} = P2 = 2 - b'
fijos de producción y que los costes marginales son constantes e iguales
a c, donde c < a y las empresas deciden (por ejemplo: eligen los precios) 1.2.C Arbitraje de oferta final
simultáneamente.
Como antes, la primera tarea en el procéso de hallar el equilibrio de A ciertos trabajadores del sector público no les está permitido declararse
Nash es traducir el problema a un juego en forma norni.al. Tenemos en huelga; en su lugar, las disputas salariales se resuelven mediante una
dos jugadores nuevamente: Sin embargo, esta vez las estrategias de que decisión arbitral vinculante. (La liga defú tbol es un ejemplo más llamativo
dispone cada empre~ason los diferentes precios que' pueden fijar, en que el del sector público, pero es sustancialmente menos importante desde
vez de las diferentes cantidades que pueden producir. Vamos a suponer un punto de vista económico.) Otras muchas disputas, entre las que
que los precios negativos no son factibles, pero que cualquier precio no se encuentran los casos de negligencia médica y las denuncias de los
negativo lo es; por ejemplo, no existe ninguna restricCÍón a los precios inversores contra sus agentes de bolsa, también suelen resolverse por
expresados en céntimos. AsÍ, el espacio de estrategias de cada empresa decisión arbitral. Las dos formas principales de arbitraje son el arbilraje
puede ser nuevamente representado como Si.~[~ff,2),)?~ n.úmeros reales convencional y el de oferta final. En el arbitraje de oferta final las dos partes
no negativos, y una estrategia típica Si es ahora Jil decisión de un precio hacen ofertas salariales yel árbitro decide entre una de las ofertils. Por
Pi ~ O. . ' .. ,, . el contrario, en un arbitraje convencional el árbitro tiene libertad pnra
Vamos a suponer nuevamente que la fu~ci6n'dega;¡ariCÍas de cada imponer cualquier salario. A continuación, vamos a derivar las ofertils
empresa es simplemente su beneficio. El berÍeficfc)de lÚIbprei>a i cuando salariales de equilibro de Nash, en un modelo de arbitraje de oferta final
eli~~';l precio Pi y su rival elige el precio pI~ .,.,'~:'~!;"~',"rr;:.',,';' desarrollado por Farber (1980).10
10 Esta aplicación incluye algunos conceptos básicos de probabilidad: función de distri.
<',;,;:'f:f'F~;(Pi,Pj)= qi(Pi,Pj)[Pi - c] =[a ~ ~i./b;j][;~~'fr' , bución de probabilidad, función de densidad de probabilidad y valor esperado. Daremos
definiciones sucintas cuando sean necesarias; para más detalles, consúltese cualquier texto ele
Así;:el par depreaos (pi ,pi) constituye un equilibriddeN~~~sr'para cada introducción a la probabilidad.
,. :.::, -
\",

'.'

24/ JUEGOS ESTÁTICOS CON INFOR,'vIACIÓN COMPLETA (e. 1)


:.',
Aplicaciones / 25
Supongamos que las partes en disputa son una empresa y un sindicato,
y que la disputa es acerca de los salarios. Supongamos que el juego se
Prob { weelegido} =
1/Je +'W.}
Prob { x < --2- . (We
= F --2-
+Ws) ';-

desarrolla de la siguiente manera: primero, la empresa yel sindicato rea-


lizan simultáneamente ofertas, denominadas 'We y w •. En segundo lugar, y
el árbitro elige una de las dos ofertas. (Como' en muchos de los llama- f:':.'

dos juegos estáticos, esto es en realidad un juego dinámico del tipo que Prob {. weelegldo} = 1- F (1/J--2-
e+ws)
.
discutiremos en el capítulo 2, pero aquí lo reducimos a un juego estático
Así, el acuerdo salarial esperado es
enlre la empresa y el sindicato al suponer una determinada conducta del
árbitro en la segunda etapa.) Supongamos que el árbitro tiene un acuerdo
ideal que le gustaría imponer, que denominamos x. Supongamos además We . Prob{ 'Weelegido}+w •. Prob{ wselegido} =
que, tras observar las ofertas de las partes, 'We y 'W., el árbitro elige sim-
plemente la oferta más cercana a x: siempre que 'We < 'W. (una intuición 'We . F CUe;'Ws) + w •. [1 _ F (We; Ws)] .
que demostraremos que se cumple) el árbitro elige 'We si x < ('We + 'W.)/2 Y
elige 1/J. si]; > (-we + 'W.)/2, como vemos en la figura 1.2.3. (Lo que ocurre Suponemos que la empresa quiere minimizar el salario esperado impuesto
si 1; = (tue + 'W.)/2 es irrelevante; supongamos que el árbitro lanza una por el árbitro y el sindicato quiere maximizarlo.
moneda.) Si el par de ofertas (w:,w';) ha de constituir un equilibrio deNash del
w:
juego entre la empresa y el sindiéato, debe ser una 'solución dé~ .

IV, es elegida W, es elegida . F(we+w;)


~:nwe' --2-'-" +ws',[ 1- F(we+w;)]
-'-2--

y w;debe ser una~oluc~ól1 de


x
W, •

Así, el par de ofertas salariales (w:,w;) debe ser una solución de las con-
(W,+W,) /2 dici~nes de primer orden de estos problemas de optimización: (!:,

Figura 1.2.3
(w;' - w:) . ~!(w: ; w;) = F (w; ; w;)
(
y
El valor de x es conocido por el árbitro, pero no por las partes. Las par- (....
les creen que x se distribuye aleatoriamente según una distribw,:ión de pro-
babilidad F(x), con la correspondiente función de densidad !(x).l1Dada
(w; - w:).~! ('W:; W;). [1- (w; ;w;)]. F

nuestra especificación acerca del comportamiento del árbitro, si las ofertas


(Posponemos la consideracióp..de si estas condiciones de primer orden son
son UJe y w., las partes creen que las probabilidades Prob{we sea elegida}
suficientes.) Puesto que los términos de la izquierda de estas condiciones
y Prob{'Wssea elegida} pueden ser expresadas de la siguiente forma:'
de primer orden son iguales, los términos de la derecha deben asimismo
ser iguales, lo que implica que
11 Esto es, la probabilidad de que x sea menor que un valor arbitrario x' es F(x'),
y la derivada de esta probabilidad con respecto a x" es ¡(x').
Puesto q\le F(x') es una
12 Al formular los problemas de optimización de la empresa y el sindicato hemos supuesto
probabilidad, tenemos que O ~ F(x') ~ 1 para cualquier x'. Además, si. "," >. x',
H
F(x ) 2: F(x'); entonces ¡Cc') 2: Opara cada x'. que la oferta de la empresa es menor que la oferta del sindicato. Es inmediato demostrar que
esta desigualdad se debe cumplir en equilibrio.

e
26/ JUEGOS ESTÁTICOS CON INFOIUvlAClÓN COMPLETA (e ]) Aplicacío/les / Z7

La interpretación de este equilibrio es simple. Cada parte se enfrenta


F(W;+W;)
2
=~.
2' (1.2.2) a un dilema. Una oferta más agresiva (es decir, una oferta más baja
por parte de la empresa o una oferta más alta por parte del sindicato)
esto es, la oferta media debe ser igual a la mediana del acuerdo preferido genera unas ganancias mayores si es elegida por el árbitro, pero es menos
por el árbitro. Sustituyendo (1.2.2) en cualquiera de las condiciones de probable que sea elegida. (Veremos en el capítulo 3 que un dilema similar
primer orden obtenemos aparece en una licitación a pliego cerrado y al precio más alto: una puja
más baja genera unas ganancias mayores si es la puja ganadora, pero
W *
s
-1)) * =
e f
1
C,,;;w; r o
(1.2.3)
reduce probabilidad de ganar.) Cuando hay más incertidumbre sobre el
acuerdo preferido por el árbitro (es decir, (J2 es más alta), las partes pueden
permitirse ser más agresivas, puesto que una oferta agresiva tiene menos
esto es, la distancia entre las ofertas debe serigual a la inversa del valor probabilidades de ser muy diferente del acuerdo preferido por el árbitro.
de la función de densidad evaluada en la mediana del acuerdo preferido Por el contrario, cuando apenas hay incertidumbre, ninguna parte puede
por el árbitro .. permitirse hacer una oferta alejada de la media, porque es muy probable
Consideremos el siguiente ejemplo, que ofrece un resultado de estatica que el árbitro prefiera acuerdos cercanos a '/1];
comparativa que resulta intuitivamente atractivo. Supongamos que el
acuerdo preferido por el árbitro se distribuye normalmente con media m
y varianza a2, en cuyo caso la función de densidad es 1.2.D El problema de los ejidos

f(x) = _1_
V2rra2
exp { __ l_(x _
2a2
m)2}. Al menos desde Hume (1739), los filósofos políticos Y los economistas
han entendido que si los ciudadanos responden únicamente a incentivos
(En este ejemplo, se puede demostrar que las condiciones de primer orden privados, habrá un déficit en la provisión de bienes públicos y los recursos
anteriormente dadas son suficientes.) Puesto que una distribución normal públicos estarán sobreutilizados. Hoy en día, basta con fijarse en el medio
es simétrica con respecto a su media, la mediana de la distrjbuCÍón es igual ambiente para constatar la fuerza de esta idea. Fue el trabajo ampliamente
a su media, m. Por lo tanto, (1.2.2) se convierte en citado de Hardin (968) el que fijó la atención de los no economistas sobre
el problema. A continuación analizam.os un ejemplo bucólico.
W: 'w;
+
--2--=m C.onsideremos los n habitantes de una aldea. Cada verano todos los
aldeanos llevan sus cabras a pastar en el ejido de la aldea. Denominamos
Y0.2.3) se convierte en
gi el número de cabras que el i-ésimo campesino posee y el número total
de cabras en la aldea G = .rJ] + ... + gn' El coste de comprar y cuidar una
*_ * __ 1__ ~
we - f(m) - v2rra L

Ws , cabra es e, independientemente de cuántas cabras se posean. El valor de


criar una cabra en el ejido cuando allí se concentra un total de G cabras es
por lo que las ofertas de equilibrio de Nash son v(G) por cabra. Puesto que una cabra necesita al menos una cierta cantidad
de pasto para sobrevivir, existe Ull número máximo de cabras que pueden
w',= m
s' 'ff
+~, 2
y w*=m
e
'-
ff' 2
rra .'
2 ,-
pastar en el ejido, Gmax:v(G) > O para G < Gmax, pero 11(G) = O para
G::: Gmax. Por otra parte, puesto que las primeras cabras disponen de un
Así, en equilibrio, las ofertas de las partes se centran alrededor de la amplio espacio para pastar, añadir una más no afecta a las que ya está n alJi,
esperanza del acuerdo preferido por el árbitro (esdédr, m), y la distancia pero cuando hay tantas cabras pastando que apenas pueden sobrevivir
~~tre las .ofertas aumenta con la incertidumbre de ias partes acerca del (es decir, G está justo por debajo de Gmor), añadir una cabra más afecta i1
acuerdo preferido por el árbitro (es decir, ~2). las demás de forma dramática. Formillmente: para G < Gmor., 1)'«;') < IJ
28/ JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e. )), Teoría avanzada: Estrategias mixtas 1j existencia de equilibrio / 29

yul/(G) < 0, como muestra la figura 1.2.4.,


max Gv(G) - Ge, .
O$G<oo
v ',.:,.
para la cual la condición de primer orden es

v(C**) + G**v'(C**) - e= ° (1.2.7)

La comparación entre (1.2.6) y (1.2.7) muestra13 que G* > G**: en el <: "',

equilibrio de Nash se crían demasiadas cabras comparado con el óptimo


sociaL La condición de primer orden (1.2.5) refleja los incentivos que tiene
un aldeano que Y'il está criando 9i eabr<;ispero considera añadir una más
G
(o, de fOnn.amás precisa, una pequeña fracción de una más). El valor de
la cabra adicional es V(9i + 9~i) ysu coste es e. El daño a las cabras ya
ex.jstelltesdel aldeano es V'(9i +9"-;> por cabra, o 9iV'(9i + 9,,-Jén totaL Los
Figura 1.2.4 ( ;.
recursos comunales están sobreutilizados porque cada aldeano considera
sólosu-propia situación, y no el efecto de sus decisiones sobre los otros
Durante la primavera, los aldeanos eligen simultáneamente cuántas
aldeanos; de aquíla presencia de G*v'(C*) In en (1.2.6), pero de G"*v'(G**)
cabras van a tener. Supongamos que las cabras son continuamente divisi- en (1.2.7).
bles. Una estrategia del aldeano i es la decisión sobre el número de cabras
que llevará a pastar en el ejido, 9.¡. Suponer que el espacio de estrategias
es [0,00) cubre todas las opciones' del aldeano; [O,Gmax) también bastaría.
1.3 Teoría avanzada: Estrategias mixtas y existencia de equilibrio
Las ganancias del aldeano oípor criar 9i cabras cuando el número de cabras
criadas por otros aldeanos es 91,' .. ,9';-1,9i+l .. o,9", es
,':
'. ~'.'

1.3.A Estrategias mixtas


9iV(91,'" ,9i-l,9i + 9i+],'" + 9,,) - e9i. (1.2.4)

Así, si (9í, ... ,g~) ha de constituir un equilibrio de Nash, para cada i, 9i En la sección 1.1.C hemos déinido Si como el conjunto de estrategias con-
debe maximizar (1.2.4) dado que los otros aldeanos eligen (9í, ... ,97-1' que cuenta el jugador i, y la combiriacion de estrategias (si, ... ,s~) coíno
un equilibrio deNash si, para cada jugador i,'.s7es la mejor respuesta' dét
97H'" .,9~)o La condición de primer orden de este problema de optimi-
zación es jugador i a las estrategias de los otros n - 1jugadores:
(.

v(9'¡ + 9~¡) + 9(U'(9í + 9~) - e = 0, (1.2.5)


(EN)
donde 9"-i denota 9í + ... + 97-1 + 97+1+ ... + 9~. Sustituyendo 9i en
0.2.5), sumando tod~s lascondicionesde primer orden de los n aldeanos para cada estrategia Sí en Si. Según esta definición no existe ningún
y dividiendo luego por n se obtiene equilibrio de Nash en el siguiente juego conocido como el juego de las
monedas (matchíng pennies). . .,
v(G*) + ~C'u'(G*) - e = 0, (1.2.6) 13 Supongamos, a la inversa,que,q:"::$ C*~. ,Entoncesv(C*) ::::'v(C**), puesto que v' <O.
n
Del mismo modo, O > v'(C~) ::::v'<O*~),pu~sto que v" <O. Finalmente, C* /n < C**. Así,
donde C* denota 91'+ o.. + 9~. Por el contrario, el óptimo social, denotado elténnino de la izquierda de d.í.6) es~slridamente mayor que elténnin~ de la izquierda de
con G**, es una solución de (1.2.7), lo cual es imposible dado 'que ambos son iguales a cero.

:::
'~~.
".'
30/ JUEGOS ESTÁTICOS CON JNFORJYIAClÓN COMPLETA (c. 1) Teoría avanzada: Estrategias mixtas y existencia de equililnio / 31

un elemento de incertidumbre sobre lo que harán los jugadores. A conti-


Jugador 2 nuación, introducimos la noción de estrategia mix/:a, que interpretamos en
Cara Cruz términos de la incertidumbre de un jugador respecto a lo que otro jugador
hará. (Esta interpretación fue avanzada por Harsanyi [1973];la discutire-
Cara -1,1 1,~1
mos con más detalle en la sección 3.2.A,) En la próxima sección vamos a
Jugador 1
"', ~
'. ampliar la definición de equilibrio de Nash para que incluya estrategias
Cruz 1, -1 -1,1
mixtas, incorporando con ello el elemento de incertidumbre inherente a la
solución de juegos como el juego de las monedas, del póquer, del béisbol
El juego de las mOlledas y de las batallas.
Formalmente, para el jugador i una estrategia mixta es una distri-
En e~tej~ego el espacio~e estrategias de cada jugador es {cata, cruz}.
<~.•' ~a hl~tona que explica las ganancias en la matriz binaria es
lasiguiente: bución de probabilidad sobre (algunas o todas) las estrategias en Si' De
aquí en adelante nos referiremos a las estrategias en Si como estrategias
rmagmemos que cada jugador tiene una moneda y debe elegir ihostrar
una cara de la moneda. Si las dos monedas (:t)mciden, esto es; ambas puras del jugador i. En los juegos con decisión simultánea e información
muestran la misma célra,71 jugador 2 gana la moneda del jugador]. Si las completa analizados en este capítulo, las estrategias puras de un jugador
caras de las monedas no coinciden entonces el jugador 1 gana la moneda son las diferentes decisiones que el jugador puede tomar. En el juego de
del jugador 2. No existe nihgún par de estrategias que pueda 'cumplir las monedas, por ejemplo, Si consiste en las dos estrategias puras cara y
(EN), puesto que si las estrategias de los jugadóres coinciden (cara;cara) cruz, así que una estrategia mixta para el jugador i es la distribución de
probabilidad (q,1 - q), donde q es la probabilidad de elegir cara, 1 - q es
o (cruz, cruz), el jugador 1 prefiere cambiar su estrategia, mientras que si
las e.strategias no coinciden (cara,cruz) o (cruz, cara), es el jugador 2 quien °
la probabilidad de elegir cruz, y S q S 1. La estrategia mixta (0,1) es
prefiere cambiar su estrategia. , .', simplemente la estrategia pUra cruz; del mismo modo, la estrategia mixta
. ~l rasg~ distintivo de este juego es que. a cada ju~ad~r le gustaría (1,0) es la estrategia pura cara.
adIvmar la Jugada del otro y que el otro no' adivinase la suya. Versiones Como un segundo ejemplo de estrategia mixta, recordemos la figura
de este juego también se dan en el póquer, el béisbol, en las;ba.taBas y en 1.1.1, en la que el jugador 2 cuenta con las estrategias puras izquierda,
~tras situaciones. En el póquer, la cuestión análoga es con qué frecuencia centro y derecha. En este caso, para el jugador 2 una estrategia mixta es la
tirarse un farol: si se sabe que el jugador i nunca; se tira,-fároles, sus distribución de probabilidad (q,r,l - q - r), en la que q es la probabilidad
oponentes pasarán siempre que i apueste de formaagr~¥:i,j;~ci~~4o de elegir izquierda, r es la probabilidad de elegir centro y 1 - q - 7" es la
que a i le convenga tirarse un farol de cuando en cuando" .. Por;'otra °
probabilidad de elegir derecha. Como antes, S q S 1, Y ahora también
parte, tirarse faroles con demasiada frecuencia cons~!Uye,~~';~~tr~t:egia ° S r S 1 Y O S q + r S 1. En este juego la ~strategia mixta 0/3,1/3,1/3)
perdedora. En béisbol, supongamos que el lanzador puede lanzar la bolil asigna la misma probabilidad a izquierda, centro y derecha, mientras que
o bien de forma rápida o bien describiendo una curva, y que 'el bateador (1/2,1/2,0) asigna la misma 'probabilidad a izquierda y centro, pero no
puede darle a cualquiera de ellas si (y sólo si) la prevé CO~IIlente. De asigna ninguna probabilidad a derecha. Como siempre, las estrategias
forma similar, en una batalla, podemos suponer que los ,a,tac,~~e~pueden puras de un jugador son simplemente los casos límite de sus estrategias
elegir entre dos objetivos (o dos rutas, como por tierrap;p!Jf}nár),yque mixtas (por ejemplo, aquí la estrategia pura izquierda del jugador 2 es la
la defensa puede rechazar cualquiera de los dos ataqué; si (Y;.l>61QLsijés.te estrategia mixta (1, 0, O», ,á,'

es previsto de forma correcta. ' , ''':I;,¡¡~,toJü~1ié\B~;,'.',;¡¿;" De forma .más general, supongamosq~e el jugador i cuenta con [(
(En cualquier juego en el cual a cada jugador le co~;~gá)di~ l~ estrategias puras: Si = {Sil,:" ,.me}. En este caso, para el jugadori
jugada del otro y que el otro no adivine la~uya;l:liJ1~~f~)\:tii~¡:~~~ una estrategia mixta es una distribución de probabilidad (Pi]" .. ,]J;f(), en
brio de Nash (al menos tal como este conc~Pt\\g~," .11!-.-:::r,W;'ii<:'>'-''''.,.c~~ la que Pik es la probabilidad,A~: <J~eél jugador i elija la estrategia 8;b
la sección l.1.C), porque la solución de tal juegó~1gªW .. :eñi:e' para k = 1, ... ,J(. Puesto que Pik'es una probabilidad, es necesi1rio que
. 7.~';'\f,-:1~~>7 ~~~:;t~f~;
,
32 / JLECOS EST.ÜJCOS CON INFORtvJAClÓN COMPLETA (c. 1)
Teoría avanzada: Estrategias mixtas y existencia de eqllil ¡brio / 33

o :S Pi, :S 1 para k = 1, ... ,Jo( Y ¡Ji] + ... + Pi!,' = 1. Vamos a utilizar La figura 1.3.1 muestra que una estrategia pura dada puede estar es'-
¡Jipara denotar una estrategia mixta del conjunto de distribuciones de trictamente dominada por una estrategia mixta, incluso si la estrategia
probabilidad sobre Si, del mismo modo que utilizamos Si para denotar pura no está estrictamente dominada por ninguna otra estrategia pura.
una estrategia pura de Si. En este juego, para cualquier conjetura (q,l- q) que el jugador 1 pudiera
formarse sobre el juego del jugador 2, la mejor respuesta de 1 es o A
Definición. En el juego en forma normal G '= {S], ... ,Sn; U], . , , /un} supon- (si q ::::1/2) o !vI (si q ::; 1/2), pero nunca B. Sin embargo, B no está
gamos que Si = {Si], ... ,SiK }. En este caso para el jugador .í una estrategia estrictamente dOIIÚnada ni por A ni por 1'1'1. La clave es que B está es-
mixta es lIna distribución de probabilidad Vi = (P'i1" .. ,PiK), dónde °::;
Pi, ::; 1 trictamente dominada por una estrategia mixta: si el jugador 1 elige A
para k = 1, . , . ,K Y Pi] + . , , + Vil, = 1. con probabilidad 1/2 y !vI con probabilidad 1/2, la ganancia esperada de
1 es 3/2, independientemente de qué estrategia (pura o mixta) utilice 2,y
Concluimos esta sección volviendo brevemente a la noción de es-
3/2 es mayor que el pago a 1 que produce con certeza la elección de!?;
trategias estrictamente dominadas que introdujimos en la sección 1.1.B,
Este ejemplo ilustra el papel de las estrategias mixtas para encontrar "otra
con objeto de ilustrar el papel potencial de las estrategias mixtas en los
estrategia que domine estrictamente a s/'.
argumentos allí utilizados. Recordemosque si una estrategia Si es estric-
tamente dominada, no existe ninguna conjetura que el jugador 'í pueda Jugador 2
formarse (sobre las estrategias que elegirán los demás jugadores) tal que
1 D
hiciera óptimo elegir S¡". El argumento inverso también se cumple, siem-
pre que permitamos estrategias mixtas: si no existe ninguna conjetura que A 3,- 0,-
el jugador i pueda formarse (sobre las estrategias que elegirán los demás Jugador 1 !vI O~- 3,-
jugadores) tal que hiciera ,óptimo elegir Si, existe otra estrategia que do-
B 2,- 2~
,
mina estrictamente a S¡.]4 Los juegos de las figuras 1.3.1 y 1.3.2 muestran
que este argumento inverso sería falso si limitáramos nuestra atención a
estrategias puras. Figura 1.3.2

i~ I

Jugador 2 La figura 1.3.2 muestra que una estrategia pura dada puede ser una
1 D mejor respuesta a una estrategia IIÚxta,incluso si la estrategia pura no 'es
una mejor respuesta a ninguna otra estrategia pura. En este juego,'Bno
. A 3,- 0,-
es una mejor respuesta para el jugador 1 a IoD deljugador 2, pero B E!s lá
Jugador 1 !vI 0,- 3,- mejor respuesta del jugador 1 a la estrategia mixta (q,1 - q) del jugador 2,
B 1,- 1,- siempre que 1/3 < q < 2/3. Este ejemplo ilustra el papel de las estrategias
mixtas en la "conjetura que se puede formar el jugador 'í".
Figura 1.3.1
1.3.B Existencia del equilibrio de Nash
I~ Pearce (l984) demuestra este resultado en el caso de dos jugadores, e indica que se
cumple para el caso de n jugadores siempre que las estrategias mixtas de los jugadores puedan En esta sección discutimos varios temas relacionados con la existencia del
estar correlacionadas. Es decir, siempre que lo que suponga el jugador .¡ sobre lo que hará equilibrio de Nash. En primer lugar, ampliamos la definición de equili-
el jugador j pueda estar correlacionado con lo que suponga el jugador i sobre lo que hará el
brio de Na'sh dada en la sección 1.1.C para inéluir las estrategias mixtas.
jugador k. Aurnann (1987)sugiere que tal correlación en los supuestos de i es completamente
natural, incluso si j, i Y k toman sus decisiones de fomla totalmente independiente: por En segundo lugar, aplicamos esta definiCión ampliada al juego de las mo-
ejemplo, i puede saber que tanto j como k fueron a una escuela de dirección de empresas, o nedas y a la batalla de los sexos. En tercer lugar, utilizamos un argumento
incluso a la misma escuela, pero puede no saber lo que se enseña en ella. gráfico para deIl10strar que cualquier juego de dos jugadores en el cual
e~
\¿, ¡
A_
34/ JUEGOS ESTÁTICOS CON [N FORMACIÓN COMPLETA (c. 1) Teoría avanzada: Estmtegil1S mixtas y existencia de c'1,lÍlibrio / 3.5

cada jugador cuenta con dos estrategias puras tiene un equilibrio de Nash (cara, cruz), y así sucesivamente.iS Puesto que la ganancia esperada del
(que posiblemente incluya estrategias mixtas). Finalmente; enunciamos y jugador 1 es creciente en .,.si 2 - 4'1 > OYdecreciente en .,.si 2 - 41} < O,
discutimos el teorema de Nash (1950), que garantiza que cualquier juego la mejor respuesta del jugador 1 es T = 1 (es decir, cara) si r¡ < 1/2 Y T = O
finito (es decir, cualquier juego con un número finito de jugadores, cada (es decir, cruz) si '1 > 1/2, como indican los dos segmentos horizontales
uno de los cuales cuenta con unnúmero ñnito de estrategias puras) tiene de ,*('1) en la figura 1.3.3. Esta afirmación es más poderosa que la afir-
un equilibrio de Nash (que posiblemente iricluya estrategias mixtas), mación del párrafo anterior con la que está estrechamente relacionada:
Recordemos que la definición de equilibrio de Nash dada en la sección en aquélla considerábamos solamente estrategias puras y encontrábamos
1.1.C garantiza que la estrategia pura de cada jugadoI: consti,tuye una que si '1 < 1/2, cara era la mejor estrategia pura, y que si '1 > 1/2, cruz
mejor respuesta a las estrategias puras dé los restantes jugaddres. Para era la mejor estrategia pura. En ésta consideramos todas las estrategias,
ampliar la definición de modo que incluya estrategias mixtas, necesita- puras y mixtas, pero encontramos nuevamente que si r¡ < 1/2, cara es la
mos simplemente que la e"strateiPaI"nixtade cada jugador sea.una mejor mejor estrategia de todas (puras o mixtas), y que si '1 > 1/2, cruz es la
respuesta a las estrategias mixtas de los otros jugadores. Puesto que cUale mejor estrategia de todas.
quier estrategia pura puede ser representada <:'0#10 la estiit~gia que asigna ,
~a probabilidad cero a todas sus otras estrategias puras, esta definición
ampliada incluye a la ari'terior. ,*('1)
(Cara) 1
. La forma de hallar la mejor respuesta del jugador i a una estrategia
mIXtadel jugador j se basa en la interpretación de la estrategia mixta del
jugador j como representación de la incertidumbre d~l Jugador i sobre lo
que hará el jugador j. Continuamos con el juego de las monedas como
ejemplo. Supongamos que el jugador 1 cree que el jugador 2 elegirá cara
con probabilidad '1 y cruz con probabilidad 1 - '1; esto es, 1 supone que
2 elegirá la estrategia mixta ('1,1 - '1). Bajo,este supuesto, las ganancias
esperadas del jugador 1 son '1. (-1) + O - '1) . 1 = 1 - 2'1 eligiendo cara y
'1' 1 + 0- '1) . (-1) = 2'1 - 1 eligiendo cruz. Puesto que 1 - 2'1 > 2'1 -1 si (Cruz)
.1
Ysólo si '1 < 1/2, la mejor respuesta en estrategias puras del jugador.1 es 1/2 '1
cara si '1 < 1/2 Ycruz si '1 > 1/2, Yel jugador 1 será indiferente en.tre cara (Cruz) (Cara)
y cruz si.'1 = 1/2. Nos quedan por considerar las estrategias mixtas del
jugador 1. .
Figura 1.3.3
Sea (,,1 - ,) la estrategia mixta en la cual el j~gador 1 elige ~ara con
probabilidad ,. Para cada valor de '1 entre cero y uno, cakulamos.el(los) La naturaleza de la mejor respuesta del jugador 1 a ('1,1 - '1) cambia
,*
valor(es) de" denotado(s) por ('1) tal que (,,1-,) sea una mejor respuesta cuando '1 = 1/2. Como indicamos anteriormente, cuando r¡ == 1/2 el
del jugador 1 a ('1,1 - '1) del jugador 2. Los resultados se r~cogen"~n la jugador 1 es indiferente entre las estrategias puras cara y cruz. Además,
figura 1.3.3. La ganancia esperada del jugador 1 al elegir (,,1-' ,) cuand~ puesto que la ganancia esperada del jugador 1 en (1.3.1)es independiente
2 elige ('1,1 - '1) es ;';"",1;',"1",: 1, ,.1
15 Los sucesos A y B son indepimdientes'si rrob{A y B} =Prob{A}.Prob{B). Así, ,1
escribir rq como la probabilidad de que r elijá cara y 2 elija cara, estamos suponiendo que
1 y 2 toman sus decisiones de formá independjente, como corresponde a la deso"ipci611 que
''1.(-1)+,0- '1).1+(1-')'1,1 +(1-1')0 - '1).(-1) = (2'1-1)+,(2-4'1)" 0.3.1) . dimos de los juegos de decisión Sill:'.\!Jtá!\e.a.Consúltese Aumann (1974) para la d"finicióu de
equilibrio correlacionado, que se'-!.tY~:;;T¡',it1:,gos en los cuales las decisiones de Jos jugadores
~_ .~,~ 'c~~'
pueden estar correlacionadas, puest?,;qtifó!js:rvan el resultado de un suceso ale"lorio. como
donde ''1 es la probabilidad de (cara, cara), f(1 -'1} la probábil~daadé el lanzamiento de una moneda, antes de elegIr sus respectivas estrategias.

'0.':
36/ JuEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)
Teoría avanzada: Estrategias mixtas y existencia de equilibrio / 37

der cuando q := 1/2, el jugador 1 es también indiferente entre todas las


estrategias mixtas (,.,1 - r). Es decir, cuando q := 1/2 la estrategia mixta K K

(r,1 - T) es la mejor respuesta a (q,1 - q) para cualquier valor de T entre LP2k'Ul(Slj,S2k) ~ LP2kUl(S¡j~S2k)
k;l k;1
cero y uno. Así, r* O /2) es todo el intervalo [O,1L como indica el segmento
vertical de r*(q) en la figura 1.3.3. En el análisis del modelo de Coumot para cada Slj' en SI' Esto es, para que una estrategia mixta sea una mejor
en la sección 1.2.A, llamamos a Ri(q) la función de mejor respuesta de la respuesta a P2 debe asignar una probabilidad positiva a una estrategia
empresa i. AqUÍ, puesto que existe un valor de q tal que r*(q) tiene más pura concreta sólo si ésta es una mejor respuesta a P2. De forma inversa,
de un valor, llamamos a r*(q) la correspondencia de mejor respuesta del si el jugador 1tiene varias estrategias puras que son mejores respuestas a
~~dm1. J P21 cualquier estrategia mixta que asigna toda su probabilidad a algunas

Para derivar de forma más general la mejor respu~sta del jugador o ~ todas estas mejores respuestas en estrategias puras (y probabilidad
i a la estrategia mixta del jugador j, así como para dar un enunciado cero al resto de las estrategias puras) es también una mejor respuesta del
formal de la definición ampliada del equilibrio de Nash, limitamos ahora jugador 1 a P2.
nuestra atención al caso de dos jugadores, que permite presentar las ideas Para dar un enunciado fonnal de la definición ampliada del equilibrio
principales de modo más sencillo. Sea J el número de estrategias puras de Nash necesitamos calcular'la ganancia esperada del jugador 2 cuando
en .eh y J( el número de estrategias puras en S2. Vamos a escribir SI := los jugadores 1 y 21;1tilizanlas estrategias mixtas PI y P2. Si el jugador 2 cree
{ SI j, , , . ,S1] } y S2 := {S21, ... ,S2K }, y vamos a utilizar Slj y S2k para denotar que el jugad m 1 utilizará las estrategias (Sl1,' .. ,S1]) con probabilidades
las estrategias puras arbitrarias de SI y S2 respectivamente. (p11,' .. ,PIJ), la ganancia esperada del jugador 2 por utilizar las estrategias

Si el jugador 1 cree que el jugador 2 utilizará las estrategias (S21, ... ,S2K) (S21,' .. ,S2K) con probabilidades (p21," . ,P2K) es

con probabilidades (p21,' .. ,P2K), la ganancia esperada del jugador 1 por


utilizar la estrategia pura Slj es c

K [ J ]
V2(Pl,PÚ:= f;P2k ~PljU2(S1j,S2k)
K

L P2kUI (Slj,S2k), 0,3.2) J K


k;1 := L L Plj . P2k U2(Slj,S2k).
j;1 k;l
y la ganancia esperada del jugador 1 por utilizar la estrategia mixta PI :=

(Pll, ... ,Pu) es Dadas VI (Pl,P2) Y V2(Pl,PÚ podemos refommlar el requisito del equilibrio
de Nash de que la estrategia mixta de cada jugador tenga que ser una
mejor respuesta a la estrategia mixta de los demás jugadores: para que
J [ K ]
VI (Pl,P2) := L Plj c L P2kU¡ (Slj,S2k) el par de estrategias mixtas (pi ,pi) forme un equilibrio de Nash, pi debe
j;l k;l
(1.3.3) cumplir
J K

:= L L Plj . P2k'Ul Cslj,S2k),


j;l k;l
(1.3.4)

donde Plj . P2k es la probabilidad de que 1 utilice Slj y 2 utilice S2k. La para cada distribución de probabilidad PI sobre SI, y pi debe cumplir
ganancia esperada del jugador 1 con la estrategia mixta PI, dado en (1.3.3),
es la Suma ponderada de las ganancias esperadas con cada ~~a de las C
vhi,pi) ~ v2(pi,P2) 0.3.5)
";:,-
estrategias puras {Sl1," . ,S1]} dada en (1.3.2), donde las ponderaciones para cada distribución de probabilidad P2 sobre 52.
son las probabilidades (Pll,'" ,PIJ)' AsÍ, para que la estratégia 'mixta
(Pll, ... ,PI J) sea una mejor respuesta del jugador 1 a la estrategia mixta P2 Definición. En el juego en forma normal de dos jugadores G := {S¡,S2; 'Ul/U2} las
del jugador 2, debe cumplirse que Plj > Osólo si C c'

estrategias mixtas (pi ,pi) fonnan un equilibrio de Nash si la estrategia r¡¡ixta


38/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. ]) Teoría avanzada: Estrategias mixtas y existencia de eqllilil".jrJ / 39

de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador: mejor respuesta del jugador.í a la estrategiamixla del jugador j presellt~Ja
(1.3.4) y (1.3.5) deben cumplirse. en la figura 1.3.3. Para complementar la figura 1.3.3 calculamos el(los)
valor(es) de '1, denotado(s) por '1*(1'), tal(es) que ('1,1 - '1) es una mejor
q . respuesta del jugador 2 a (r,l - r) del jugador 1. Los resultados se recogen
q*(r)
en la figura 1.3.4. Si r < 1/2, la mejor respuesta de 2 es cruz, de forma que
(Cara) 1 q*(r) = O.Del mismo modo, si r > 1/2, la mejor respuesta de 2 es cara, de
forma que q*(r) = 1. Si r = 1/2, el jugador es indiferente no sólo entre cara
y cruz sino también entre todas las estrategias mixtas ('1,1 - '1), de forma
que '1*0/2) es todo el intervalo [O,1].

Girando 90 grados la figura 1.3.4 y dándole la vuelta, obtenemos la


. figura 1.3.5. Ésta es menos adecuada que la figura 1.3.4 como represen-
tación de la mejor respuesta del jugador 2 a la estrategia mixta del jugador
-------- ..-...'
1, pero puede combinarse conla figura 1.3.3 para obtener la figura 1.3.6.
(Cruz)
:'~:, 1/2 1
r
(Cruz) . (Cara)

(Cara) 1
Figura 1.3.4

q*(r)
r
1/2 ---_._---j ..... _------------------'
(Cara) 1

q*(r)
(Cruz)
1/2 1/2 1 q
(Cruz) (Cara)

Figura 1.3.6
(Cruz)
q
(Cruz) (Cara) La figura 1.3.6 es análoga a la figtira 1.2.1 del análisis de Cournot
de la sección 1.2.A. Igual que la intersección de las funciones de mejor
Figura 1.3.5 respuesta R2(ql) y RI ('12) dio el equilibiio de. Nash del juego de Cournol,
la intersección de las correspond~ncia,s d~ mejor respuesta r*(q) y q*(r)
nos da el equilibrio de Nash (ertestiategias mixtas) en el juego de las
A continuación, aplicamos esta definición al juego de las monedas y a monedas: si un jugador i elige 0./2,1 /2), (1/2,1/2) es la mejor respuesta
la batalla de los sexos. Para ello, utilizamos la representación gráfica de la del jugador j, tal como lo exige eléquilibrio de Nash.
40 I JUEGOS ESTÁTICOS CON INfORMACIÓN COMPLETA (c. 1) Teoría avanzada: Estrategias mixtas y existencia de equilibrio I 41

Conviene resaltar que el equilibrio de Nash en estrategias mixtas no se de las correspondencias de mejor respuesta de los jugadores, existen en la
basa en que ningún jugador lance una moneda al aire, arroje unos dados o figura 1.3.7 tres intersecciones de r*(q) y q*(r): (q = 0,1' = O), (q = 1,r = 1)
elija de forma aleatoria una estrategia. Más bien, interpretamos la estrate- Y (q = 1/3,1' = 2/3). Las dos primeras intersecciones representan los
gia mixta del jugador j como una representación de la incertidumbre del equilibrios de Nash en estrategias puras (boxeo, boxeo) y (ópera, ópera)
jugador i respecto a la decisión del jugador j sobre la estrategia (pura) que descritos en la sección 1.1.c.
va a seguir. En béisbol, por ejemplo, el lanzador puede decidir si lanzar
una bola rápida o una curva basándose en cómo le salieron los lanzamien- l'

tos durante el entrenainiento. Si el bateador conoce el razonamiento del r*(q)


lanzador pero no sabe qué ocurrió durante su entrenamienfo, puede ser (Ópera) 1
que crea que existen las mismas posibilidades de que el lanzador lance
una bola rápida o Curva. Representaríamos entonces la conjetura del ba- q*(r)
2/3
teador como la estrategia mixta del lanzador (1/2,1/2), cuando en realidad
el lanzador elige una estrategia pura basándose en la información que no
dispone el bateador.
Enunciado de un modo más general, la idea consiste en dotar al juga-
dor j de una cierta información privada de manera que, dependiendo de
cómo el jugador j entienda dicha información, se incline por una de las
(Boxeo)
estrategias puras posibles. Sin eh1bargo, puesto que el jugador i no dis- 1/3 l:, .
pone de la información privada de j,i continúa con la incertidumbre de
(Boxeo)'
no saber cuál será la decisión de j, y representamos dicha incertidumbre
de i como una estrategia mixta de j.' Ofrecemos un enunciado más formal
de esta interpretación de las estrategias mixtas en la sección 3.2.A. Figura 1.3.7
Consideremos la batalla de los sexos, de la sección 1.1.c, como un _.:,'

segundo ejemplo de equilibrio de Nash con estrategias mixtas. Sea (q,1- q) En cualquier juego, un equilibrio de Nash (que incluya estrategias pu- (
la estrategia mixta en la cual Pat elige la ópera con probabilidad q y sea ras o mixtas) aparece como una intersección:,dJUas:.c.QITespon.dencias,de
(1',1 - 1') la estrategia mixta en la cual Chris elige ópera con probabilidad 'r. mejor respuesta de los jugadores, induso cuando:háymás de dosjugá-
Si Pat elige (l},l-q), 'las ganancias esperadas de Chris son q.2+(1-q)'0 = 2q dores y también cuando algunos o todos lósjugadores tienen más de dos
al elegir ópera y q'O + (1 - q) . 1 = 1- q al elegir boxeo. AsÍ, si q > 1/3, estrategias puras. Por desgracia, los únicos juegos en los que las co~es-
la mejor respuesta de Chris es ópera (es decir, l' = 1); si q < 1/3 la mejor pondencias de mejor respuesta de los jugadores tienen representaciones'
respuesta de Chris es boxeo (es decir, l' = O) y, si q = 1/3, cualquier valor gráficas sencillas son los juegos de dos jugadores en:lasque cada jugador
de l' es una mejor respuesta. De modo similar, si Chris elige (1',1 - 1') sólo tiene dos estrategias. Discutimos ahora con un argumento gráfico que (

las ganancias esperadas de Pat son l' . 1 + O - 'r) . O = l' al elegir ópera y cualquier juego de ese tipo tiene un equilibrio de Nash (que posiblemente
1'.0+(1 -1').2 = 20-r) al elegir boxeo. AsÍ, si l' > 2/3, la mejor respuesta de incluya estrategias mixtas).
Pat es ópera (es decir, q = 1); si l' < 2/3 la mejor respuesta de Pat es boxeo Consideremos las g¡mancias del jugador) representadas en la figura
(es decir, q = O) y, si r = 2/3 cualquier valor de q es una mejor respuesta. 1.3.8. Hay dos comparacionesfu:1portantes:' x con z e y con w. Basándonos
Como muestra la fig'ura 1.3.7, las estrategias mixtas (q,1 - q) = 0/3,2/3) en estas comparaciones, podemosdefi.iur cuatro casos principales: (i)
de Pat y (-1',1 - 1') = (2/3,1/3) de Chris forman, por lo tanto, un equilibrio x > z e y > w; (ii) :É < z e y < w; (iii) x > z e y < w, y (iv) x < z
de Nash.
e y > w. Discutimos primero estos cuatro casos y luego abordamos los
Al contrario que en la figura 1.3.6, donde sólo existía una intersección casos restantes en los qliex '=z' y o =w, '
,~.

'i~i..
,-----
,

42/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1) Teoría avanzada: Estrategias. mixtas y existencia de equilibrio / 43

En los casos (iii) y (iv), ni alta ni baja son estrictamente dominadas.


Así, alta debe ser óptima para algunos valores de q y baja óptima pilfa los
Jugador 2
demás. Sea ql = (w - y) /(x - Z + w - y). En el caso (iii) alta es óptima para
Izquierda Derecha q> q' y baja para g < ql, mientras que en el caso (iv) ocurre lo contrario.
En ambos casos, cualquier valor de r es óptimo cuando q = q'. Estas
Alta x,--..:. y,-
.- correspondencias de mejor respuesta se representan en la figura 1.3.10.
Jugador 1
Baja Z,- 10,-

, ~.,',
.. ,' (Alta) (Alta)
r*( q) r*( q)

Figura 13.8

En el caso (i) para el jugador 1 alta,domi~a estrictamente a baja, y en


el caso (ii) baja domina estrictamente a alta ...Recordemos de la sección (Baja) (Baja) ._. __ .
previa que una estrategia es estrictamente dornin~da si y sólo si no existe q' 1 q q'l q
una conjetura que el jugador i pudiera ~onrtaise(sobre las estrategias que (Izquierda) (Derecha) (Izquierda) (Derecha)
elegirán los demás jugadores) tal quehicierá óptimo elegir Si. ASÍ, si Caso (iv)
Caso (iii)
(g,l - g) es una estrategia mixta del jugador 2, donde g es la probabilidad
de que 2 elija izquierda, en el caso (i) no existe un valor de g tal que baja
Figura 1.3.10
sea óptima para el jugador 1, y en el caso (ii)no existe un valor de g tal
que alta sea óptima. Si (r,l- r) denota una estrategia mixta del jugador 1
en la que r es la probabilidad de que 1 elija alta, podemos representar las Puesto que ql = 1 si x = Z y ql = Osi y = w, las correspondencias de
correspondencias de mejor respuesta para los casos (i) y (ii) como en la mejor respuesta en los casos en que ocurra x = Z o y = w tienen forma de
figura 1.3.9.(En estos dos casos las correspon<:ienciasde mejor respuesta L (es decir, dos caras adyacentes del cuadrado unitario), como ocurriría
son de hecho funciones: de mejorrespuesta, puesto que no existe un valor en la figura 1.3.10 si ql = Oo 1 en los casos (iij) y (iv).
de g tal que el jugador 1 tenga múltiples mejores respuestas.) Añadiendo ganancias arbitrarias del jugador 2 a la figura 1.3.8 y rea-
r -r lizando cálculos análogos obtenemos la mismas cuatro correspondencias
(Alta) 1 f-c_=._=
... 7::"".__=.__=.__=._~_._-_ -~. (Alta) 1 f------~ de mejor respuesta, con la salvedad de que en el eje horizontal se mide
r*(q) r y en el vertical se mide q, como en la figura 1.3.4. Girando 90 grados
y dando la vuelta a esas cuatro figuras, como hicimos para obtener 1.3.5,
obtenemos 1.3.11 y 1.3.12. (En estas figuras r' se define de forma análoga
a q' en la figura 1.3.10.)
La cuestión crucial es que, dada cualquiera de estas cuatro corres-
r*(q)
<Baja) (Baja) pondencias de mejor respuesta del jugador 1, r'(q) de las figuras 1.3.9 o
1 q 1 q 1.3.10, y cualquiera de las cuatro del jugador 2, q'(r) de las figuras 1.3.11
(Izquierda) (Derecha) (Izquierda) (Derecha) o 1.3.12, el par de correspondencias de mejor respuesta tiene al menos
Caso (i)
una intersección, por lo qtieel juego tiene al menos un equilibrio de Nash.
Caso (ii)
Comprobarlo para los di~ciséis pares posibles de correspondencias de me-
Figura 1.3.9 jor respuesta se deja como ejercicio. En lugar de ello, nosotros vamos a
.H I JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e 1)
Teorla avanzada: Estrategias mixtas y existencia de equilibrio I 45

describir las características cualitativas que pueden resultar. Puede darse: Concluimos esta sección con una discusión sobre la existencia del
(l) un único equilibrio de Nash en estrategias puras; (2)un único equilibrio equilibrio de Nash en juegos más generales. Si formularnos los argumen-
de Nash en estrategias mixtas; o (3) dos equilibrios en estrategias puras y tos anteriores para juegos de dos por dos en forma matemática en vez de
un único equilibrio en estrategias mixtas. Recordemos el caso de la figura gráfica, podernos generalizarlos para aplicarlos a juegos con n jugadores
1.3.6, el juego de las monedas, que constituye un ejemplo del caso (2) y con espacios de estrategias finitos y arbitrarios.
el de la figura 1.3.7, la batalla de los sexos, que constituye un ejemplo del
caso (3). El dilema de los presos es un ejemplo del caso (1); se obtiene de
Teorema. (Nash (1950): En el juego en forma normal de n jugadores G :o
la combinación del caso (i) o (ii) de T*(q) con el caso (i) o (ii) de q*(r).16
{S1,'" ,Sn; 'U1,'" ,un}, si n es un número finito y 9i es finito para cada i, existe
(Alta) 1 1-------" al menos un equilibrio de Nash, que posiblemente incluye estrategias mixtas.
(Alta) 1 f-.--"--_-----~

L~ dem¿str~ciÓn del t~orema de Nash utiliza un teorema de p~ntofij~.


q*(I) q*(r)
Como ejemplo simple de un teorema de punto fijo,supongamos que f(x)
es un~funciÓn c¿ñtirma con"dominio [O, 1] Y recOrTid6[O, ir. El teorema
de punto fijo de Brouwer garantiza que existe al menos Un punto fijo, es
(Baja) decir, existe al'~eno~' unv¡¡lot x* en [O, 1] tal que f(x*) = x*: Tenernos un
1 q
(Baja) -

1 q
en
ejeiriplo 'de eIIcí' l~figura}.3~ 13.' . . .
(Izquierda) (Derecha) (Izquierda). (Derecha) .-La apÍi~ación d.eU~.~r~~~de punto fijo p~ademosi:rar. el ~~.oJ:~m~ ~4~
Caso (i) Caso (ii) Nfl;~hs~,h~ceen dos~~ap?s: (1) mostJ:ando que, cualquier PJP1.to,fijo.,:,~,~
una cierta corr~sponder:ciaes lll1 equilibrio,de Nash y (2}u~~aIlclp,l},I1
Figura 1.3.11 teorema de punto fijo ildecuado para demostrar que esta corresponden~a
debe tener un punto fijo. La correspondencia apropiada es la correspon-
r r
(Alta) 1 dencia de mejor respuesta de n jugadores, El teorema de punto fijo rele-
(Alta) 1
vante se debe é\KaJ~utani"(194l),quien generé\lizó el teorema de Brom":er
r' co~ '~'lfin déiÍlcIuir c'orr~sp~ndéncias (de bueIl comportamiento) adei1{ás
q*(r)
de funciones. Lacprresp()ndénciade mejor'r~spuesta de n jugadores se
q*(r) obtiene a partir de laséorr~sponqencias individuales de mejor respuest~

(Baja) (Baja)
1 q 1 q
¡(x)
(Izquierda) (Derecha) (Izquierda) (Derecha)
Caso (iii~ Caso (iv)
x*
Figura 1.3.12

16 Los casos que incluyen x ~ z o y ~ w no contradicen la afirmación de que el par de


correspondencias de mejor respuesta tiene al menos una intersección. _Al contrario, además 1"
',',.

de las características cualitativas descritas en el texto, pueden ahora darse dos equilibrios de x* 1 x
Nash en estrategias puras sin un equilibrio de Nash en estrategias mixtas, y un continuo de
equilibrios de Nash en estrategias mixtas.
Figura 1.3.13

L
Lecturas adicíol1alfs I 47
46 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)

de los n jugadores del modo siguiente: consideramos una combinación de la figura 1.3.10: para q == q', r*(q') incluye cero, uno y todo el intervé1lo
arbitraria de estrategias mixtas (Pl,' .. ,Pn)' Para cada jugador i derivamos entre ellos. (De modo un poco más formal, r*(q') incluye el límite ele I"(q)
la mejor respuesta(s) de i a las estrategias mixtas de los otros jugadores cuando q tiende a q' por la izquierda, el límite de r*(q) cuando q liende a
(Pl,'" ,Pi-l,P'i+l,' .. ,Pn)' Construimos a continuación el conjunto de todas q' por la derecha, y todos los valores de r entre ambos lúnites:) Si ¡(:¡;I)
las combinaciones posibles de dicha mejor respuesta para cada jugador. en la figura 1.3.14 se comportara de forma análoga a la correspondencia
(Formalmente derivamos la correspondencia de mejor respuesta de cada de mejor respuesta del jugador 1, ¡(x') incluiría no sólo el círculo negro
jugador y luego construimos el producto cartesiano de estas n correspon- (como en la figura), sino también el círculo blanco y todo el intervillo entre
dencias individuales.) Una combinación de estrategias mixtas (pi, ... ,p~) ellos, en cuyo caso ¡(x) tendría un punto fijo en x'.
es un punto fijo de esta correspondencia si (pi, ... ,p~) pertenece al con- La correspondencia de mejor respuesta de cada jugador se com.portil
junto de todas las combinaciones posibles de las mejores respuestas de los siempre como r*(q') en la figura 1.3.14: siempre incluye (las generalizil-
jugadores a (pi, ... ,p~). Es decir, para cada i, pi debe ser la mejor (o una ciones adecuadas de) el límite por la izquierda, el límite por la derecha
de las mejores) respuesta(s) del jugador i a (pi, ,Pi-l,pi+l' ... ,p~), pero y los valores intermedios. El motivo de esto es que, como demostramos
esto es precisamente la afirmación de que (pi, ,p~) es un equilibrio de anteriormente en el caso de dos jugadores, si el jugador i tiene varias es-
'Nash. Con ello, completamos la primera etapa. ; : trategias puras que son mejores respuestas a las estrategias mixtas de los
La segunda etapa utiliza el hecho de que la correspondencia de me- demás jugadores, cualquier estrategia mixta Pi que asigna toda su pro-
jor respuesta de cada jugador es continua, en un sentido adecuado del babilidad a algunas o a todas las mejores respuestas en estrategias puras
término. El papel de la continuidad en el teorema de punto fijo de Brou- deljugador i (y probabilidad cero al resto de las estrategias puras de i.) es
wer puede observarse modificando ¡(x) en la figura 1.3.13: si ¡(x) es también una mejor respuesta del jugador i. Puesto que la corresponden-
discontinua, no tiene necesariamente un punto fijo. En la figura 1.3.14, ci¡l.de mejor respuesta de cada jugador se comporta siempre delmisll10
por ejemplo, ¡(x) > x para toda x < x', pero ¡(x') < x' para x 2: x',17 modo, io mismo ocurre con la correspondencia de mejor respuesta de
los TI, jugadores. Estas propiedades cumplen las hipótesis del teoremil de
Kakutani, por lo que esta última correspondencia tiene un pu.nto fijo.
1
El teorema de Nash garantiza que existe un equilibrio en una ampliil
clase de juegos, pero ninguna de las ilplicaciones analizadas en la sección
¡(x) 1.2 pertenece a esta clase (porque cada aplicación tiene espacios de estrate-
gias infinitos). Esto demuestra que lils hipótesis del teorema de NilSh son
condiciones suficientes pero no necesarias para que exista un equilibrio;
existen muchos juegos que no cumplen las hipótesis del teorema pero, no
obstante, tienen uno o más equilibrios de Nash.
x' x

1.4 Lecturas adicionales


Figura 1.3.14
Consúltese Brandenburger (1992) sobre los supuestos en que se fundamen-
Para ilustrar las diferencias entre ¡(x) en la figura 1.3.14y la corres-
tan la eliminación iterativa de las estrategias estrictamente dominadils y
pondencia de mejor respuesta de un jugador, consideremos el caso (iii)
el equilibrio de Nash, y también sobre la interpretación de las estré1tegias
mixtas en términos de las conjeturas de los jugadores. Sobre la relación
17 El valor de ¡(x') se indica conel círculo 'negro. El circulo blanco indica qué ¡(X') no
incluye este valor. La línea discontinua se incluye únicamente para indicar que ambos círculos
entre los modelos (tipo Coumot),en los que las empresas eligen cantidil-
se dan cuando x = x'; no indica valores adicionales de ¡(x'). des y los modelos (tipo Bertrand), en los que las empresas eligen precios,
~8 / JUEGOS ESTÁTICOS CON INFOIUVIACJÓN COMPLETA (c. 1)
Ejercicios / 49
consúJtese Kreps y Scheinkman (1983), quienes demuestran que en algu-
por P(Q) = a - Q (suponiendo que Q < a; en el caso contrario P = O).
nas circunstancias el resultado de Cournot se da en un modelo de tipo
Supongamos que para la empresa .i el coste total de producir la cantidad qi
Bertrand en el cual las empresas se enfrentan a restricciones de capaci-
es Ci(qi) = cqi. Es decir, no hay costes fijos y el coste marginal es constante e
dad (que escogen a un cierto coste antes de elegir los precios). Sobre
. igual a c, donde suponernos que e < a. Siguiendo a Coumot, supongamos
el arbitraje, consúltese Gibbons (1988), quien demuestra que el acuerdo
que¡as empresas eligen sus volúmenes de producción simultáneamente. (.
preferido por el árbitro puede depender del contenido informativo de las
ofertas de las partes, tanto en el arbitraje convencional como en el de oferta
¿(:uál es el equilibrio de Nash? ¿Qué ocurre cuando n tiende a infinito? e..
final. Finalmente, consúltese Dasgupta y Maskin (1986) sobre la existen-
1.5 Consideremos las dos versiones finitas siguientes del modelo de duo-
cia del equilibrio de Nash en juegos con espacios de estrategias continuos,
polio de Coumot. En primer lugar, supongamos que cada empresa debe
incluyendo equilibrios en estrategias puras.
elegir o la mitad de la cantidad de monopolio, qm/2= (a -c)j4,o la-can~
tidad de equilibrio de Coumot, !Je = (a -c)/3. No pueden darse otras
cantidades, Demuéstrese que este juego con dos alternativas es, equiva-
1.5 Ejercicios
lente. al dilellla de los preso;>: cada eIIlpresa tiene una estrategia estric-
tamente dominada, y ambas están peor en equilibrio que si cooperasen.
1.1 ¿Qué es un juego en fonna normal? ¿Qué es una estrategia estricta-
En segundo lugar, supongamos que cada empresa puede elegir o qm/2 o
men te dominada en un juego en forma normal? ¿Qué es un equilibrio de qe, () una tercera cantid\idq' .. Hállese un valor de q' tal que el juego sea
Nash con estrategias puras en un juego en forma normal?
equivél.1ehteal modelo de Coumot de la sección 1.2.A, en el sentidq'de
que (qe,qe) sea un equilibrio de Nash único y ambas empresas estén .pem;
1.2 En el siguiente juego en fonna normal, ¿qué estrategias sobreviven en equilibrio de lo que estarían si cooperasen, pero ninguna de ellas tiene
a una elirnin'.lcián iterativa de las estrategias estrictamente dominadas? una estrategia estrictamente dominada.
¿Cuáles son los equilibrios de Nash con estrategias puras?'
1.6 Considérese el modelo de duopolio de Coumot en el que la demanda
[ C D inversa es P(Q) = a - Q pero las empresas tienen costes marginales
A 2,0 1,1 4,2 asimétricos, Cl para la empresa 1 y C2para la empresa 2. ¿Cuál es el
equiJibrio de Nash si O < e.; < a/2 para cada empresa? ¿Qué ocurre si
M 3,4 1,2 2,3
el < C2< a pero 2C2 > a + Cl?
B 1,3 0,2 3,0 ..,;.

1.7 En la sección 1.2.Banalizamos el modelo de duopolio de Bertrand con


1.3 Los jugadores 1 y 2 están negociando cómo repartirse mí! pesetas. productos diferenciados. En el caso de productos homogéneos se obtiene
Ambos jugadores indican simultáneamente la parte de las mil pesetas un resultado poderoso. Supongamos que la cantidad que demandan los
que querrían conseguir, SI y s2,donde O ~ 81,S2 ~ 1. Si SI + S2 ~ 1, consumidores a la empresa i esa - Pi cuando Pi < Pj, Ocuando Pi > Pj,
los jugadores ven cumplidos sus deseos; si SI + S2 > 1, ambos jugadores y (a - Pi)/2 cuando Pi =Pj. Supongamos también que no hay costes
reciben cero pesetas. ¿Cuáles son 105 equilibrios de Nash con estrategias fijos y que los costes marginales son constantes e iguales a c, donde c < a.
puras de este juego?
Demuéstrese que si las empresas eligen precios simultáneamente, el único
equilibrio de Nash consiste en que ambas empresas fijen un precio c.
1.4 Supongamos que existen n empresas en el modelo de oligopolio de
Cournot. Sea qi la cantidad producida por una empresa i, y sea Q = 1.8 Considérese una población votante uniformemente distribuida en el
!JI + ... + qn-la cantidad agregada .en el mercado. Sea P el precio de espectro ideológico que va de la izquierda (x = O)a la derecha (x = 1).
equilibrio de mercado"ysupongamos.que laderriandainversa viene dada Cada uno de los candidatos para un único puesto elige simultáneamente
SO/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1) Referellcins / 51

un programa electoral (es decir, un punto eh la línea entre x = O Y x = 1). solicitar trabajo en una de las empresas. Los trabajadores deciden si-
Los votantes observan el programa de los candidatos y luego cada votante multáneamente si solicitar el trabajo de la empresa 1 o de la empresa 2.
vota por el candidato cuyo programa se acerque más a su posición en el Si sólo un trabajador solicita trabajo en una de las empresas, dicho tra-
espectro. Si, por ejemplo, hay dos cahdidatos y eligen programas x] = 0,3 bajador obtiene el trabajo. Si ambos trabajadores solicitan trabajo en la
Y X2 = 0,6, todos los votantes a la izquierda de x = 0,45 votan al candidato misma empresa, la empresa contrata a uno de ellos aleatorialnente, y el
1, y todos los que están a la derecha votan al candidato 2, y el candidato 2 otro queda desempleado (lo que significa una ganancia cero). Hállense
gana la elección con un 55 por ciento de los votos. Supongamos que a los los equilibrios de Nash del juego en forma normal. (Para más información
~andidatos sólo les importa ser elegidos; en realidad, su progr?ma no les sobre los salarios que fijarán las empresas, consúltese Montgomery [1991J.)
mteresa para nada. Si hay dos candidatos, ¿cúaJ es el equilibrio de Nash
.'/} con estrategias puras? Si hay tres caIldidatos,indíquese un equilibrio de Trabajador 2
Nash con estrategias puras. (Supongamos qué cuarido vanos candidatos Solicitar a Solicitar a
eligen el mismo programa, los votos obtenidos por ese programa se divi- empresa 1 empresa 2
den apartes iguales, y quelos empates entré'l?sq¡je~onsiguen más votos
se resuelven a cara o,cruz.) VéaseHotelling (1929)pa.ra un primer modelo Solicitar a ] ]
empresa 1 2:7/11'2:W] 'UJl,W2
similar. ... " "~o " '1,;
. J':
Trabajador 1
Solicitar a 1 1
1.9¿Qué es una estrategia mixta en un juego enfórma normal? ¿Qué es Un empresa 2 W2,1.v] 2: 'UJ2, 2: 'UJ2
equilibrio de Nash con estrategias mixtas en un juego en forma normal?
Fecha 2
1.10 Demuéstrese que no existen equilibrios de Nash con estrategias mix-
1.14 Demuéstrese que la proposición B en el apéndice a la sección 1.l.C
tas en los tres juegos en forma normal analizados en la sección 1.1: El
se cumple tanto para equilibrios de Nash con estrategias puras como con
dilema de los presos, el de la figura 1.1.1 y,el de la figura 1.1.4.
estrategias mixtas: las estrategias utilizadas con probabilidad positiva en
un equilibrio de Nash con estrategias mixtas sobreviven al proceso de
1:11 ~állese el equilibrio de Nash con estrategias mixta~ del juego del
eJerCICIO1.2. €liminación iterativa de las estrategias estrictamente dominadas.

1.12 Hállese el equilibrio de Nash con estrategias mixtas del siguiente


juego en forma normal: 1.6 Referencias

AUMANN,R. 1974, "Subjectivity and Correlation in Randomized Strate-


1 D
gies" Journal of Mathematical Ecol1omícs 1:67-96.
A 2,1 0•.2 -. 1976. "Agreeing to Disagree." Al1l1als of Statístics 4:1236-39.
B 1,~ 10 -. 1987. "Correlated Equilibrium as an Expression of Bayesian Rationa-
" ' f

lity." Ecol1ometrica 55:1-18.


1.13 Dos empresas ofrecen un puesto de trabajo cada una. Supongamos
BERTRAND,T 1883. "Théorie Mathématique de la Richesse SociaJe."]oumal
que (por razones que no discutimos aquí, pero que se refieren al grado
des Saval1ts 499-508.
de importancia de que se ocupe el puesto) las empresas ofrecen salarios
dife~ntes: la empresa i ofrece el salario Wi, donde (1/2)w] < 'UJ2 < 2w] .. BRANDENBURGER, A. 1992. "Knowledge and Equilibrium in Carnes." De
Imagmemos que hay dos trabajadores, cada uno de los cuales sólo puede próxima aparición en Journal of Ecol1omic Perspectives.
,',
52/ JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e. 1) '.'.'

COURNOT,A. 1838. l\echerches Sllr les Principes Mathématiques de la Théorie


des Richesses. Edición inglesa: Researches into the Mathematical Principies of
2. JUEGOS DINÁMICOS
theon) of Wealth. Publicado por N. Bacon. New York: Macmillan, 1897.
CON INFORMACIÓN COMPLETA
DASGUPTA, P, y E. MASKIN,1986. "The Existence of Equilibrium in Discon-
tinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.
c\
'.','.

FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal of Con-


flict Resolution 35:683-705.

FRIEDMAN,J. 1971. "A Noncooperative Equilibrium for Supergames."


Review of Economic Studies 28:1-12. Ijnestecapítulo presentamos los juegos dinámicos. De nuevo, limi~a-
mas nue~tra atención a los juegos con información completa. (es dédr; (,
GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." Ame-
juegos en los que las fundones de ganancias de los jugadores so~ Wor-
rieclrlEconomic Review 78:896-912.
maciónqel doriúnio público); véase una introducción a 10s'juégOs con
HARDIN,G. 19613."The Tragedyof the Commons." Science 162:1243-48. información incompleta en el capítulo 3. En la sección 2.1 analiZarnos
los juegos dinámicos no sólo con información completa, sino tambiéÍi:co~
HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A New
información perfecta, lo que significa que en cada momentodeI'jí1ego;~1
Rationale for Mixed Strategy Equilibrium Points." International Journal of
jugador a quien le corresponde decidir conoce la historia cómple'fá:de
Came Theory 2:1-23.
todas las decisiones tornadas hasta ese momento. En las seccióries'i;2'¡;
HOTELLING,H. 1929. ';Stability in Competition." Economic JournaI39:41-57. 2.4, considercunos los juegos con información completa pero imperfeét~:
en algún momento ~~l juego el jugador a quien le corresponde decidirno
HUME, D. 1739. A Treatise of Human Nature. Reedición. Londres: J. M.
conoce toda lahistoria del juego. .
Dent. 1952.
El tema central en todo juego dinámico es el de la credibilidad. Como
KAKUTANl,S. 1941. "A Generalization of Brouwer' s Fixed Point Theorem." ejemplo de una amenaza que no resulta creíble, consideremos el siguiente
Dllke Mathematieal Joumal 8:457-59. juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets 1",'

al jugador 2 () no darle nada, Én segundo lugar, el jugado.r2 observa la


KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Ber-
decisióridel jugador 1 y de~ide si hacer estallar o no una granada que
trand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics
los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer
4:326-37.
estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si
MONTGOMERY, J. 1991. "Equilibrium Wage Dispersion and Interindustry el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es
Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79. la de pagar las 1.000 pesetas. Pero el jugador 1 no debería creerse una
amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar :',
'..
NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the
dicha amenaza, escogería no hacerlo., Por tanto, el jugador 1 no debería'
National Aeademy of Sciences 36:48-49.
pagar nada al jugador 2.1
PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of En la sección 2.1 analizamos los siguientes casos de juegos dinámicos
Perfection." Econometrica 52:1029-50. con información completa y perfecta: el jugador 1 decide primero, acto
seguido el jugador 2 observa la decisión dél jugador 1 y finalmente el juga-
STACKELBERG,
H. VON, 1934, Marktfonn L/nd Cleichgewicht. Viena: Julius
Springer. 1. El jugador 1 podría preguntarse si un o?>n~nie que amenaza con hacer explotar una'
granada está loco. Este tipo de dudas se modelali como información incompleta, porque el
jugador 1 no está seguro de la función dé ganancias del jugador 2 (véase capítulo 3).
-,
1

Juegos dillámicos COI¡ ¡'¡formación completa y perfecta / 5.5


54 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

l presentada en el capítulo 1. Definimos también el equilibrio de


dar 2 toma su decisión con lo que concluye el juego. Eljuego de la granada norm a ., ., 1
pertenece a esta clase, como el modelo de duopolio de Stackelberg (1934) y Nash perfecto en subjuegos para juegos en general. La cuestlOn pnl~clpa
. el modelo de Leontief, (1946) de determinación de salarios y nivel de em- (tan to de esta sección como del capítulo en su cODjunto)es
h
que un Juego
'l'b' d
pleo en una empresa con fuerte implantación de un sindicato. Definimos dinámico con información completa puede tener muc os equt J nos e
.' el resultado por inducción hacia atrás y consideramos brevemente su relación Nash, pero algunos de ellos pueden incluir amenazas.o promesas que no
'" con el equilibrio de Nash (posponiendo la discusión de esta relación hasta son creíbles. Los equilibrios de Nash perfectos en subluegos son aquellos
la sección 2.4). Resolvemos los modelos de Stackelberg y Leontief, uti- que pasan la prueba de credibilidad.
lizando este criterio. Derivamos también un resultado a~álogo para el
modelo de negociación de Rubinstein (1982), aun cuando ese juego tiene
una sucesión potencialmente infinita de tiradas y, por tanto, no pertenece 2.1Juegos dinámicos con información completa y perfecta
ala cl~se de juego,s considera~a, '.
. En la sección 2.2 ampliamos la clasé de juegos analizada en la sección 2.1.A Teoría: induccÍón hacia atrás
anterior: primero ambos jugadores 1 y2 deciden simultáneamente, acto
seguido los jugadores 3 y 4 observanlas decisiones de 1 y 2y finalmente, El juego de la granada es un representante de la siguiente clase de juegos
los jugadores 3 y 4 deci~fensimultáneámente'c!Jn lo que concluye el juego. sencillos con información completa y perfecta:
Como ya se explicará en la sección 2.4, la simultaneidad de las decisiones
significa en este contexto que estos juegos son de información imperfecta, 1. El jugador 1 escoge una acción al del conjunto factible Al'
Definimos el resultado perfecto en subjuegos dé tales juegos, que es la ex- 2. El jugador 2 observa 0'1 y escoge una acción o,z del conjunto factible
tensión natural de la inducción hacia atrás. Resolvemos los modelos de Az.
Diamond. y Dybvig (1983) de pánico bancario" un modelo de aranceles y
3. Las ganancias son 1J,1 (a1,o.z) y'Uz(al,o,z).
de competencia internacional imperfecta y el modelo de los torneos de
LazearyRosen (1981), utilizandoeste.criterio. z
Muchos problemas económicos se ajustan a esta descripción. Dos ejem-
En la sección 2.3 estudiamos los juegos repetidoS"; en los cuales un plos (que más adelante discutiremos con mayor detalle) so~ el mo~elo d,e
grupo determinado de participantes juegan repetidamente un determi- duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de
nado juego, habiendo observado los resultados de las anteriores rondas empleo en una empresa con fuerte implantación ~~ un smdIcato .. ?lros
del juego antes de iniciar la siguiente. El tema del análisis es que las ame- problemas económicos pueden modelarse si permItimOS una suce:J7n de
nazas y las promesas (creíbles) sobre el comportamiento futuro pueden movimientos más amplia, ya sea añadiendo más jugadores o penmllendo
afectar el comportamiento presente. Definimos el equilibrio de Nash perfecto q~e los jugadores tiren más de una vez. (El modelo de negoci~ci.ónde Ru-
en subjuegos para juegos repetidos y lo relacionamos con los resultados de binstein discutido en la sección 2.1.0 es un ejemplo de este ultImo caso.)
la inducción hacia atrásy de la perfección en subjuegos definidos en las Las característi~as clave de un juego dinámico con información completa
secciones 2.1 y 2.2. Enunciamos y demostramos el teorema de tradición y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)
oral para juegos repetidos infinitamente y analizamos el modelo de Fried- todas las decisiones anteriores son conocidas antes de tomar la deOSlon
man (1971) de colusión entre duopolistas de Coumot, el de Shapiro y
Stiglitz (1984) de salarios de eficiencia y el de política monetaria de Barro 2 Se podría permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la acción
y Cardan (1983). del jugador 1, al' Tal dependencia podría d~notarse con AZ(aI) O podna Incorporarse en la
En la sección 2.4 presentamos las herramientas necesarias para anali- función de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) = -ex:
para valores de a2
que no son fac ti'bles d al'.'
do a Algunos movimientos del Jugador 1 podnan mcluso poner . An
zar en general un juego dinámico con información completa, ya sea con al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto
informaci9n. perfecta o imperfecta. Definimos la representacipn de un de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene
juego enformaextensivaylárelacionamos con la representación en forma elección posible.
",.'.

56 / JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA (c. 2) Juegos dinámicos con información completa y perfecta / 57

siguiente y (3) las ganancias de los jugadores para cada combinación po- en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora
sible de jugadas son información del dominio público. las amenazas que no son creíbles en un sentido que definiremos con más
Resolvemos un juego por inducción hacia atrás de la siguiente forma: precisión. Veremos que pueden existir múltiples equilibrios de Nash en
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego, un juego de la clase definida por (1)-(3)" pero que el único equilibrio de
se enfrentará al siguiente problema, dada la acción al previamente adop- Nash perfecto en subjuegos es el equilibrio asociado con el resultado ob-
tada por el jugador 1: tenido por inducción hacia atrás. Éste es un ejemplo de la observación,
hecha en la sección 1.1.C, de que algunos juegos tienen múltiplesequili"
max 'u2(á.l,az). brios de Nash pero tienen un equilibrio que destaca como la soluciónmás
azEAz
llamativa del juego.
Supongamos que para cada ajen Al, el problema de optimización del Concluirnos esta sección explorando los supuestos de racionalidad
jugador 2 tiene una única solución que podemos denotar con Rz(al)' Ésta inherentes en los argumentos de inducción hacia atrás. Considere~os
es la reacción (o mejor respuesta) a la acción del jugador 1. Dado que para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos
el jugador 1 puede resolver el problema de maximización del jugador 2 veces:
tanto como el propio jugador 2, el jugador 1 debería prever la reacción del
jugador 2 a cada acción al que 1 pudiera tomar, de forma que el"problema
1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2
de 1 en la primera etapa se concreta en
para el jugador 1 y Opara el jugador 2. c.
2. El jugador 2 observa la elección de 1. Si 1 escoge D entonces 2 escoge
max 'Ul (al,Rz(al»).
alEA] J' o D', donde l' finaliza el juego con ganancias de 1 para ambos
Supongamos que este problema de optimización del jugador 1 tiene jugadores.
también una solución úlúca que podemos denominar aj. Llamaremos 3. El jugador 1 observa la elección de 2(y recuerda su propia decis~~t:J:
~
a (aj,Rz(aj» el resultado por inducción hacia atrás de este juego. El resultado la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es
por inducción hacia atrás ignora las amenazas no creíbles: el jugador 1 1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3
prevé que el jugador 2 responderá óptimamente a cualquier acción que 1 para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2
pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte respectiv~mente.,; ,
del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda ,_.; _~ : . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~¿'
etapa. Esta descripción verbal puede trélducirse al siguiente,juego en fempª.dg
Recordemos que en el capítulo 1 usamos la representación en forma árbol. (Ésta es la representación en forma extensiva que definiremos. de
. normal para estudiar juegos estáticos con información completa y hos forma más general en la sección 2.4.) La ganancia superior en el par .
concentramos en la noción del equilibrio de Nash como concepto para so- de ganancias que aparecen en el extremo de cada rama del árbol es la
lucionar tales juegos. Sin embargo, en la discusión sobre juegos dinámicos ganancia del jugador 1; la inferior es la del jugador 2, ~;,'
de esta sección no hemos hecho mención alguna ni de la representación Para calcular el resultado por inducc:ión hacia atrás de este' juego
en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una empezamos por la tercera etapa (es dear,la segunda decisión deLjugador
descripción verbal de un juego en (1)-(3) y hemos definido el resultado 1). Aquí el jugador 1 se enfrenta a una elección entre una ,ganancia de.3
por inducción hacia atrás como solución del juego. En la sección 2.4.A por medio de 1" o una ganancia de Oa trayés de 'J)"; de forma que!" ~
veremos que la descripción verbal en (1)-(3) es la representación en forma óptimo. Por tanto, en la segunda etapa, el jugador2 prevé que si él júego (,
...
,

extensiva del juego. En esta sección estableceremos la relación entre las llega a su te;cera etapa el jugador 1 escogerá J", lo que le proporcionaría
representaciones en forma extensiva y normal, y veremos que para juegos una ganancia de O.Por tanto,~n la ¡¡egunda etapala decisión del jugador 2
dinámicos la representación en forma extensiva es a menudo más con- es entre una ganancia de 1 por medio dé l' o una ganancia de Oa través de
veniente. En la sección 2.4.B definiremos el equilibrio perfecto de Nash D', de forma que l' es óptimo. Consecuentemente, eh la primera etapa el
58 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dil1tÍmicos COI1 il1formacióll completa y perfecta / 59

. dor 2 lo sea: si 1piensa que 2 podría no ser racionill,


jugador 1 prevé que si el juego llega a la segunda etapa el jugador 2 elegirá ro no que el Juga 1" O'
1', lo que le proporcionará una ganancia de 1. La elección del jugador 1 pe . ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO '. ' I" 1 tercera
en la primera etapa es, por tanto, entre una ganancia de 2 por medio de I se nda, dando con ello la oportunida~.a 1 de Jug~r. ~n.8
o una ganancia de 1 a través de D, de forma que I es óptimo. la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podría no ser racional, 1 podna. escoger /) en
pero pIensa . l
. ' tapa confiando en que 2 pensara que 1 no es raClona, y, por
, ::~:: la pnmera e "1 t El
. DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara 1 '. d D r 'parte
USO de la inducción.hacia atrás presupone que la e eCClOn e po.
eda explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu . l' . D arque 1
sin embargo, podría ser más razonable suponer que J~go ~.' .
. .'
es, efectivamente, lrraClOna . 1 En tales J'uegosel uso
, . .• de la mducClon
.. hacla
atrás pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p .'
proporclOna una solución única y no cabe esperar acuerdo alguno enbe
los jugadores.

2.1.B El mod~lo de duopolio de Stackelberg

Este argumento establece que el resultado por inducción hacia atrás Stackelberg (1934) pr!Jpuso un modelo dinámico de duopolio en el cu~l
es que el jugador 1escoge I en la primera etapa y séacaba el'juegb: Aun unae'mpresa dominante (o líder) decide primero y una empresa subordI-
cuando el uso de la inducción hacia atrás establece que el juego sé acaba nada (o seguidora) decide en segundo lugar. En al~nosmome~üos de
en la primera etapa, UIlaparte importante del'afgUiriento ftáhl dé 10 que la historia de la industria automovilística estadourudense: por ~Jel1lplo,
ocurriría si el juego no se acabase en esta primera etapa. En la segunda General Motors parece haber jugado este papel de líder. Es mmedlat.o am-
etapa, por ejemplo, cuando el jugador 2 prevé que si el juego llega a la pliar esta des~ripción al caso en que haya más de una empresa segUidora,
terc;era etapa el jugador 1 elegirá I"¡ 2 está suponiendo que 1es racional. como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos el
Este supuesto puede parecer inconsistente coil el hecho de qué 2 tiene modelo bajo el supuesto de que las empresas escogen cantidades, como en
,.'0
la oportunidad de decidir en la segunda etapa sólo si 1 se desVÍa del el modelo de Coumot (donde las empresas deciden simultáneamente en
resultado obtenido por inducción hacia atrás. Es decir, puede parecer que . ente como aqUlO. DeJ'amos como ejercicio el desarrollo
veZ d e suceSlvam ,
si 1juega D en la primera etapa, 2 no puede suponer en la segunda etapa de un modelo de tomas de decisiones sucesivas en el que las empresas
que 1 sea racional, pero 'esto no es, así: si 1 juega D, en la primera etapa . s tal como
escogen 1os preclO " lo hacen (simultáneamente)
' ' . en el modelo ele
está claro que no puede ser información del dominio público que los dos
Bertrartd. ,
jugadores sean racionales; pero existen razones para que 1escogietaD El desarrollo temporal del juego es el sig'uiente: (1) La empresa 1
que no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidad
1 a d ql >
escoge una can t'd _ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
es que sea información del dominio público que el jugador 1 es racional una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la

3 Recordemos deI a discusión sobre l~elimiración itera tiva de las,.•"~tr~tegiasest:ric~~~ente


función de beneficio
dominadas (eIlla sección 1.1.,B),que es Ílúormación del domirti9pÚblicó que Io~ jug-adores
son racionales si todos los jugadores son ráciomiiés, y si todos los jugadófes S¡¡Í5~ft'qUe'tódos '7ri(q;,qj) = qi[P(Q) - el,
los jugadore,s son racionales y si todoS los jugadores saben que,todoslos jugadores sálJeñ que
lodos los jugadores son racionales, etc; adinjiilÍtum. , . ':! ",' donde P(Q) a - Q es el precio de equilibrio de mercado cuando la
60 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos dinámicos con información completa y perfecta I 61

cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de Recordemos que en el equilibrio de Nash del juego de Cournot del
producción (siendo cero los costes fijos). capítulo 1, cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregada
Para hallar el resultado por inducción hacia atrás de este juego, calcu- obtenida por inducción hacia atrás en el juego de Stackelberg, 3(a - e)/4,
lamos en primer lugar la reacción de la empresa 2 a una cantidad arbitra- es mayor que la cantidad agregada en el equilibrio de Nash del juego de
riamente fijada por la empresa 1. R2(ql) es una solución de Cournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado es
inferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelberg
maX7r2(ql,q2)==maxq2[a - ql - q2 - el, la empresa 1 podía haber escogido la cantidad correspondiente al juego
Q22:0 qz 2:0
de Coumot, (a - e)/3, en cuyo caso la empresa 2 habría respondido con su
lo que resulta en
cantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1
a-ql-e podría haber alcanzado el nivel de beneficios de Coumot, pero escogió no
R2(ql) ==" 2 ' hacerlo, por lo que los beneficios de la empre~a 1 en el juego de Stackelberg
siempre, queql < a-e .. La misma' ecuación pár_aR2(ql) apareCiÓ en deben'ser mayores que sus beneficios en el juego de Cournot. Pero el
nuestro aniilisisdél' juego de Coumot con' qecisiones sinlultáneas en la precio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que ros
sección D.A. La diferencia' es que aquí R2(iJ.~)e~~eal~e~:lte la reacción beneficios agregados son menores. Por tanto, el hecho de que la empresa
por parte de la~mpresa 2:á la cailtidadobservad~ que fijala empresa i, 1 esté mejor implica que la empresa 2 está peor en el juego de Stackelberg
mientras que en el análisis de Coumot R2(qI) es la mejor respuestacle h:i queen el jueg() de Coumot.
empresa 2 a una cantidad hipotética que'será sil!lultáneamenteescogida La observación de que la empresa 2 se encuentra en peor situación en ..
' ,"

por la empresa 1. '." el juego de Stackelberg que en el juego de Coumot ilustra una diferencia
Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa importante que existe entre los. problemas de decisión uni cimultiperL
2 tantoc0fi.lo,.l.a,propia e~p¡'~~a 2, I~, e0presá 1debería prever q~e ia sonale~:. En la teoría de la decisión con un único agente, eltenermás .
elección:'del~éantidad ql coinCidirá co"nla reaéciónR2(ql)' Por tanto, el información nunca puede hacer que el agente decisor esté peor. En teorÍa
problema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en de juegos, sin embargo, tener más información (o más precisamente, que ".
otros jugadores sepan que uno tiene más información) puede hacer que un
"maX7fl (ql,R2(ql») ==maxqIfa - ql - R2(qi) -:- el jugador esté peor. '
'_Q¡2:0, ,.' ,.' Ql2:0 • . . '. .
.. a- ql.""'"C Eil el juego de Stackelberg, la información en cuestión es la cantidad
==maxql '2 . ,.
de la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)
Q¡2:0 .

lo que resulta' en la empresa 1 sabe que la empresa 2 conoce ºl' Para ver el efecto que'
esta información tiene, consideremos un,juego de decisión suc~siva algo
a-c a-c distinto, en el que la empresa 1 escoge qr, después de lo cual la empresa
qi == -. -2- Y R2(qi) ==-4-
2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 cree
que es el resultado por inducción hacia atrás del juego del duopolio de que la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, la
Stackelberg.4 '.. '. mejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si la
empresa 1 prevé que la empresa 2 creerá que ello vaya a ser así y, por tanto,
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren típicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mención escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en (a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg
vez de ~u:nultáneas. Sin embargo, como se ha constatado en la secciÓ'nanterior, los juegos (a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1
con deaslones sucesivas poseen a menudo múltiples equilibrios de Nash, de los cuales sólo
uno está asociado can el resultado obtenido por inducción hacia atrás del juego, Por tanto, el
escoja su cantidad de Stackelberg. Más bien, el único equilibrio de Nash de
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al este juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,
uso de unrnterio de solución más poderoso que el mero equilibrio de Nash. precisamente el equilibrio de Nash del juego de Cournot, en el que las dos
62 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dinámicos con infonlwción completa y perfecta / 1\3

empresas deciden simu1táneamente.5 Por lo tanto, que la empresa 1 sepa cuya condición de primer orden es
que la empresa 2 conoce q¡ va en contra' de la empresa 2.
R'(L) - w = O.
2.1.C Salarios y nivel de empleo en una empresa con fuerte
implantación sindical / Pendiente = w

R
En el modelo de Leontief, (1946) de relación entre una empresa y un
único sindicato (es decir, un sindicato que tiene el poder de monopolio de R(L)
ofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vo
sobre los salarios, pero la empresa tiene el ¿Ónrrolexclusivo del nivel de
empleo. (Conclusiones cualitativamente similares emergen en un modelo
más realista en el cual la empresa y el sindicato negocian los salarios,
pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) La
función de utilidad del sindicato es U(7JJ,L), donde w es el salario que el
sindicato pide a la empresa y L es el nivel de empleo. Supongamos que
U(w,L) es creciente en los dos argumentos w y L. La función de beneficios
L * (w) L
de la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos que
la empresa obtiene si emplea L trabajadores (y toma de forma óptima las
correspondientes decisiones de producción y de estrategia de mercado). Figura 2.1.1
Supongamos que R(L) es creciente y cóncava;
Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato Para garantizar que la condición de primer orden R'(L) -w =. O ~enga
efectúa una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yes- solución, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
coge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L). figura 2.1.1.
Podemos decir bastantes cosas sobre el resultado por inducción hacia atrás La figura 2.1.2 representa L * (w) en función de tu (pero ~tiliza l~s e!es
de este juego, aun sin haber supuesto ninguna forma funcional concreta de forma que faciliten la comparación con gráficos postenores) e lnchca
de U(w,L) y R(L), pero no podemos calcular el resultado explícitamente. que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
. En primer lugar caracterizamos la mejor respuesta de la empresa en la en su punto máximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
etapa (2), L*(w), a una demanda salarial arbitraria por parte del sindicato mejor cuanto menor sea w, de forma que las curvas :sobenefIClo ¡Dfenores
en la etapa (1), w. Dado w, la empresa escoge el nivel L*(w) que soluciona representan niveles de beneficio más altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato está tanto mejor cuanto más alto sea w, de forma que las curvas
max7r(w,L) =maxR(L) - wL, de indiferencia más altas corresponden a niveles de utilidad mayores del
L2:0 L2:0
sindicato.

6 Esta última propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
5 Esto es un ejemplo de la afirmación hecha en la sección 1.1.A:en';,n Juego en forma normal dado 'UJ. Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
los jugadores escogen sus estrategias simultáneamente, pero ello no implica necesariamente' concreta en la elección de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
que actúen simultáneamente; es suficiente con que cada uno tome su decisión sin conocer las beneficio posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
decisiones de los demás. Véase la sección 2.4.A para más discusión sobre esta cuestión. (L,u/) sea tangente a la restricción 'UJ = 1J)'.
64 / JUEGOS DfNAMICOS CON INFORÑ1ACIÓN COMPLETA (c. 2)
Juegos dinámicos con información completa y perfecta / 65

w L *(w)
' ...'
w Curva de indiferencia
del sindicato

w*

L*(w)

L
Curvas de isobeneficio de la empresa
L* (w*) L

Figura 2.1.2
'Figura 2.1.4.

,
'.
w En términos de las curvas de indiferencia representadas en la figura
2.1.3, al sindicato le gustarla escoger la demanda salarial w que propor- ',.,.,'

cione un resultado (w,L * (w» que esté en la curva de indiferencia más alta
posible; La soluciÓn al problema del sindicato es w*, la demanda salarial
que hace que la curva de indiferencia del sindicato que pasa por el punto
(w*,L*(w*» sea tangente a L*(w) en ese punto (véase la figura 2.1.4)'- Por
lo tanto, (w* ,L*(w*» es el resultado por inducción hacia atrás de este juego "~o
de salarios y nivel de empleo.
Es fácil ver que (w* ,L * (w*» es ineficiente: tanto la utilidad del sindi-
L
cato como los beneficios de la empresa aumentarían si w y L estuvieran en
Curvas de indiferencia del sindicato la región sombreada de la figura 2.1.5. Esta ineficiencia hace que resulte
difícil de entender que en la práctica las empresas parezca que retienen
Figura 2.1.3 el control exclusivo sobre el nivel de ocupación. (Si permitimos que la
empresa y el sindicato negocien los salarios pero mantenemos el control
exclusivo de la empresa sobre el nivel de empleo obtenemos un resultado
Consideremos ahora el problema del sindicato en la etapa (1). Dado igualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicación
que el sindicato puede resolver el problema de la.empresa en la segunda a este enigma basada en el hecho de que el sindicato yla empresa negocian
etapa, tanto como la propia empresa, el sindicato deberla prever que la repetidamente a lo largo del tiempo (normalmente cada tres años en Esta-
reacción por parte de la empresa a su demanda salarial w será escoger el dos Unidos). En ese juego repetido, siempre que la elección de.w por parte
nivel de empleo L*(w). Por tanto, el problema del sindicato en la primera del sindicato y la elección de L por parte de la empresa caigan en la región
etapa se concreta en
sombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esos
'.: .'

valores de w y L no pueden ser el resultado por inducción hacia atrás de


maxU (w,L*(w»).
lU~O
un~ única negociación. Consúltese la sección 2.3 sobre juegos repetidos y
el ejercicio 2.16 sobre el modelo de Espinosa-Rhee.
66 1 JUEGOS OlNÁMIC05 CON INFORMACIÓN COMPLETA (e. 2)
luegos dilllím.icos con información completa y I",rleeta i 67

w Una descripción más detallada de la secuencia temporal del juego de


Curva de beneficio tres periodos es la siguiente:
w* de la empresa
(la) Al principio del primer periodo el jugador 1 propone quedarse con
una fracción SI de una peseta, dejando 1 - SI para el jugador 2.
(lb) El jugador 2 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias SI y 1 - 81 inmediatamente) o
rechazarla (en cuyo caso el juego pasa al segundo periodo).
(2a) Al principio del segundo periodo el jugador 2 propone que el juga-
L * (w*) L dor) se quede con una fracción 82 de una peseta, dejando 1 ~ 82 para
el jtÍgador 2. (Nótese la convención de que 8t corresponde s_iempre
al jugádor 1, sea quien sea quien hace la oferta.)
Figura 2.1.5
(2b) El jugador 1 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias 82 y 1 - 82 inmediatamente) o
2.1.D Negociación secuencial
rechazarla (en cuyo caso el juego pasa al tercerperiodo).
(3) Al principio del tercer periodo el jugador 1 recibe una fracción 8 de
Empezamos con un modelo de negociación de tres periodos perteneciente
una peseta, dejando 1 - S para el jugador 2, donde O < s < 1.
a la clase de juegos estudiada en la sección 2.1.A. Pasamos luego a dis-
cutir el modelo de Rubinstein (1982), en el que. él número de periodos En este modelo de tres periOdos, el acuerdo a:Lque se llega en el tercer
. es (potencialmente) infinito. En ambos modelos se llega a un acuerdo periodo (s,1 - s) está fijado exógenamente. En el modelo con horizonte
inmediatamente, no hay negociaciones prolongadas (como huelgas). En infinito que consideraremos más tarde, la ganancia 8 del tercer periodo
el modelo de Sobel y Takahashi (1983) de negociación secuencial con representa la ganancia del jugador 1 en lo que queda del juego si se llega
información asimétrica, en cambio, pueden ocurrir huelgas en el único al tercer periodo (esto es, si las dos primeras ofertas son rechazadas).
equilibrio (bayesiano perfecto) con probabilidad positiva (véase la sección Para calcular el resultado por inducción hacia atrás de este juego de
4.3.B). tres periodos, calculamos en primer lugar la oferta óptima por parte del
Los jugadores 1 y 2 negocian el reparto de una peseta. Hacen ofertas se
jugador 2 si llega al segundo periodo. El jugador 1 puede recibir .5en el
alternativamente: primero el jugador 1 hace una propuesta que el jugador tercer periodo rechazando la oferta S2 del jugador 2 en este periodo, pero
2 puede aceptar o rechazar; si 2la rechaza, hace una propuesta que 1 puede el valor en este periodo de recibir s en el periodo siguiente es sólo 8s. Por
aceptar o rechazar, y así sucesivamente. Una vezqúe una oferta ha sido tanto, el jugador 1 aceptará S2 si y sólo si 82 :::::ós: (Suponemos gue cada
rechazada, deja de ser vinculante y es irrelevante en las siguientes rondas jugador aceptará una oferta si es indiferente entre aceptarla o rechazarla.)
del juego. Cada oferta corresponde a UIÍ. periodo y los jugadores son El problema de decisión del jugadOr 2 en el segundo periodo, por tanto,
impacientes: desCuentan las ganancias obtenidas en periodos posteriores se concreta en escoger entre 1 - ós en este periodo (ofreciendo 82 = ós al
de acuerdo con el factor Ó, donde O <ó < 1.7 - jugador 1) o recibir 1 - s en el siguiente periodo (ofreciendo al jugador 1
cualquier S2 < ós). El valor descontado de la última opción es ó(l - s),
7 El factor de descuento Ó reflejá el' valór temporal del dinero. Una peseta: recibida al que- es menor que 1 -Os obtenible por medio de la primera opción, de
principio deun periodopúede ingresarse en un bancoy proporcionar intereses, digamos-que
a-un tipo r por periodó y, por tanto, tendrá ún válor de 1 + r pesetas al principio deÍ periodo
forma quela oferta óptima del jugador 2 en el segundo periodo es 8i = ,)8.
siguiente, De forma equivalente, una peseta que se reciba al principio del periodo siguiente Por tanto, si el juego llega al segundo periodo, el jugador 2 ofrecerá si y
tiene ahora un valor de sólo 1/0 + r) pesetas. Sea Ó =' 1/0 + r); entonces úna ganancia el jugador 1 aceptará .
.". obterlida en el próximo periodo tiene ahora ahora un valor de sólo 6.".; una ganancia 7f
obtenida dentro de dos periodos tiene ahora un valor de s6lo 62."., yasísucesivaI'nente. El
Dado que el jugador 1 puede resolver el problema del jugador 2 en
valor actual de una ganancia futura recibe el nombre de valor futuro de esa ganancia._ el segundo periodo tan bien como el propio jugador 2, el jugador 1 sabe
68/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos en dos etapas de información / 69

que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando por inducción hacia atrás, el jugador 1 ofrecerá el acuerdo (j(s),l- f(s»
'"
la oferta S] del jugador 1 en este periodo, pero el valor en este periodo de en el primer periodo y el jugador 2 aceptará, donde fes) = 1 - 50 - os)
1',

recibir 1 - si el periodo siguiente es sólo de 50 - si). Por tanto, el jugador es la fracción del jugador 1 en el primer periodo del juego anterior de tres
2 aceptará 1 - s] si y sólo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). El periodos cuando el acuerdo (s,1 - s) se imponía exógenamente en el tercer
problema de la decisión del jugador 1 en el primer periodo, por tanto, se
periodo.
concreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo
Sea s A la ganancia más alta que el jugador 1 puede recibir en cualquier
1- SI = 50-si) al jugador 2) o recibir si en el próximo periodo (ofreciendo
resultado por inducción hacia atrás del juego completo. Consideremos el
cualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la última
uso de SA como la ganancia del jugador1 en el tercer periodo, tal como
opción es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obtenible
lo hemos descrito anteriormente; esto producirá un nuevo resultado por
por medio de la primera opción, de forma que la oferta óptima del jugador
inducción hacia atrás en el que" la ganancia en el primer penado del
1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58).'Por tanto, en
jugador 1 es fCsA).Dado que fes) = 1- 5 + 02Ses creciente'en s; f(sA)
el resultado por inducción hacia atrás de este juego de tres periodos, el
es la ganancia en el primer periodo más alta posible; ya quesA es la
jugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.
ganancia más alta posible en el tercer periodo. Pero SA es también la
Consideremos ahora el caso en que el horizonte es infinito. El desarro- ganancia más alta posible en el primer periodo; de forma que!(sA) =
llo temporal es el mismo que hemos descrito anterio~ente, excepto que el SAo Argumentos similares demuestran que f(sB) = SB, donde SB es la
acuerdo exógeno del paso (3) esreemplazado por una sucesión infinita de ganancia más baja posible que el jugador 1 puede obtener en cualquier
pasos (3a), (3b), (4á), (4b) yasísuéesivamerite. El jugador 1 hacela"oferta resultado por inducción hacia atrás del juego completo. El único valor de
en los peripdiJsÍII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:ión con~ s que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;
tinúa hasta que un9 elelos dos jugadore~ acepta,un¡t9f~rta. Nos gustaría sA = SE 0= s. de forma que, existe un único resultado por inducción hacia
hallar el resultado PO! inducción pacia atrás de esteJuego pe horizonte atrás d~l juego completo: en el primer periodo el jugador 1 ofrece un
infinito moviél}-dcmoshacia atrás, tal como lo hemos hecho en los casos acuerdo (s' = 1/(1+0),1- s'" = 5/0 + o» al jugador 2, quien acepta. \.'
analizados hasta ahora. Sin embargo, co~oel jueg~podría continuar

hasta el infinito, no existe un último momento a partir del cual iniciar tal '" ,

análisis. Afo~nadamente, la,siguiente idea (aplicada.()riginalmente por 2.2 Juegos en dos etapas con información completa
Shaked y Sutton [1~84])nos permité truncar el juego de horizonte infinito .pero imperfecta :, -
y aplicar la lógica del Giso'en el que ell10rizonte ~. fuíi:to:el juego q~e
empieza en el,tercer periopo (si se alcanza) es idéntico al jueg~ completo
2.2.A.Teoña: Perfección en subjuegos .
(empezando desde el primer periodo); en ambos cas~s el jugador 1 hace
la primera oferta, los jugadores se alternan haciendo las siguientes ofertas
Enriquecemos ahora la clase de juegos analizacia eIlla sección anterior: ,~ "

y la .negociación continúa hasta que un jugador acepta una oferta.


Como en los juegos dinámIcos con información completa y perfecta, conti-
Dado que no hemos definido formalmente el resultado por inducción nuamos suponiendo que el jUego sigue una sucesión de etapas, habiendo
hacia atrás de este juego 'de negociación con horizonte infinito, nuestros én
los jugadores observado las decisiones formadás~ las etapas previas an-
argumentos serán informales (pero pueden formalizarse). Supongamos tes del comienzo de una nueva etapa. Sin embargo, a diferencia de los
que existe un resultado por inducción hacia atrás del juego completo en juegos analizados en la sección anterior, peImit:iritos qúe haya decisiones
el que los jugadores- 1 y 2 reciben las ganancias s y 1 - s respectivamente. simultáneas en cada etapa ..¡ t:omo explicaremos ,en la sección 2.4; esta
Podemos utilizar estas ganancias en el juego que empieza en el tercer simultaneidad de decisiones significa que los juegos analizados en esta
periodo, si se alcanza, y proceder entonces hacia atrás hasta el priíner pe- sección tienen información imperfecta. Noobstante, estos juegos compar-
nodo (como en el juego de tres periodos) para calcular un nuevo resultado "ten características importantes con los"juegos con irLformación perfecta
por inducción hacia atrás del juego completo. En este nuevo resultado considerados en la secclónanterior.
'70 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos elldos etapas de illfomwciólI I TI

Analizaremos el siguiente juego sencillo, al cual (sin mucha inspi- 1. Los jugadores 1 y 2escogen simultáneamente las acciones 1/,1 y "-z de
ración) llamaremos juego en dos etapas con información perfecta pero los conjuntos factibles Al Y Az respectivamente.
incompleta: 2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z» parai = 1,2.

1. Los jugadores 1 y 2 escogen simultáneamente las acciones al y az de


Supongamos que (0.1,0.2) es el único equilibrio de Nash de este juego de
los conjuntos factibles Aly Az respectivamente.
decisiones simultáneas. Llamaremos a (o,i,0,2'0.; (al' 0.2),0,4 (al ,(1,2» resultado
2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), y
perfecto en subjuegos de este juego en dos etapas. Este resultado es el
escogen entonces simultáneamente las acciones 0.3 y 0.4 de los conjuntos
ánalogo natural del resultado por inducción hacia atrás en los juegos con
factibles A3 y A4 respectivamente. . ~
información completa y perfecta, y esta analogía se refiere tanto a sus
3. Las ganancias sonui(al,az,a3,a4) para i = 1,2,3,4.
canieterísticas atractivas como a las que no lo son tanto. Los jugadores 1 y
Muchos problemas económicos se ajustan a esta descripción.8 Tres ejem- 2 no deberían creer ninguna amenaza por parte de los jugadores 3 y 4 que
plos (que discutiremos más adelante con mayor detalle) son los pánicos correspondiera a acciones que no fueran el equilibro de Nash del juego
bancarios, los aranceles y la competencia internacional imperfecta y los que queda en la segunda etapa, ya que cuando el juego llegue realmente a
torneos (por ejemplo, la lucha entre varios vicepresidentes de una empresa la segunda etapa, al menos uno de los jugadores 3 o 4 no querrá cumplir su
por ser el próxüno presidente). Otros problemas e~xJl1ómicospueden mo- amenaza (precisamente porque no es un equilibrio de Nash del juego que
delarse si permitimos una mayor complejidad, ya sea añadiendo más queda en la segunda etápa).Por otra parte, supongamos que el jugador
jugadores o permitiendo que los jugadores jueguen en más de una etapa. 1 es también el jugador 3, y que el jugador 1 no juega 0'1 en la primera
Podría incluso hab~r~enos jugadores: en algunas aplicaciones.los juga- etapa: el jugador 4 puede querer entonces reconsiderar el supuesto de que
dores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 no el jugador 3 (es decir, el jugador 1) jugará a;(0,1,o.Z) en la segunda etapa.
aparece.
Resolvemos un juego de esta clase utiÍizando un enfoque parecido 2.2.B Pánico bancario
~!_qe la inducción haci~ atrás, pero est~ vez, el primer paso quedamos
cuando nos movemos hacia atrás desde el final del juego exige la reso- Dos inversores han depositado cada uno de ellos una cantidad D en un
lución de un juego real(el juego siinultáneoentre los jugadores 3 y 4 en banco. El banco ha invertido estos depósitos en un proyecto a largo plazo.
la segUnda etapa, dado el resultado de la primera etapa) en vez de re- Si el banco se ve obligado a liquidar su inversión antes de que el proyecto
solver un problema de optünización para un único individuo como en la venza, puede recuperar un total de 2r, donde D > r > D /2. Sin embargo,
sección anterior. P.arano complicar las cosas; supondremos en esta sección si el banco deja que la inversión llege a su vencimiento, el proyecto rendirá
que para cada resultado factible de la primera etapa, (0.1,0.2), el juego que un total de 2R, donde R > D.
queda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene un Existen dos fechas en las cuales los iiwersores pueden sacar dinero del
único equilibrio de Nash que denominam()s (a;(al,az),a¡(al,az». É~ la banco: la fecha 1 es anterior al vencimiento de la inversión del banco, la
sección 2.3.A (sobre juegos repetidos) consideramos las consecuencias de fecha 2 es posterior. Para simplificar, supondremos que no hay descuento.
prescindir de este supuesto. Si ambos inversores sacan dinero en la fecha 1, cada uno recibe r y el juego
Si los jugadores 1 y 2 prevén que el comportamiento en la, segunda se acaba. Si sólo un inversor saca dinero en la fecha 1, ese inversor recibe
etapa de los jugadores 3 y 4 vendrá dado por (a;(al,a2~,-a¡(al,az», la in- D, el otro recibe 2r - D Y el juego se acaba. Finalmente, si ninguno de
teracción entre los jugadores 1 y 2 en la primera etapa se concreta en el los inversores saca dinero en la fecha 1, el proyecto JJega a su vencimiento
siguiente juego de decisiones simultáneas: y los inversores deciden si sacar el dinero o no en la fecha 2. Si los dos
inversores sacan el dinero en la fecha 2, cada rula de ellos recibe R y el
8 Como en la sección anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 en
la segunda etap~, A:>! A4, podrían depender del resultado de la primera etapa (al,a2)' En
juego se acaba.' Si sólo un inversor saca el dinero en la fecha 2, ese inversor
particular, podnan eX1stirvalores (al,a2) que finalizaran el juego. recibe 2R - D, el otro recibe D y el juego se acaba. Finalmente, si ninguno
•.. ,:'
-
72 / JUEGOS DINÁMICOS CON INFOJ<MAClÓN COMPLETA (c. 2)
JlIegos en dos etapas de infonnación / 73

de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha
inversor y el juego se acaba. 1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) en
En la sección 2.4 discutiremos cómo representar formalmente este la fecha 2.
juego. Sin embargo, por ahora procederemos de modo informal. Repre-
sentemos las ganancias de los dos inversores en las fechas 1 y 2 (en función
de sus decisiones sobre sacar dinero en esas fechas) con el siguiente par Sacar No sacar
de juegos en forma normal. Nótese que el juego en forma normal co- Sacar r,r D,2r - D
rrespondiente a la fecha 1 no es típico: si ambos inversores escogen no
No Sacar 2r - D,D R,R
sacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que los
inversores pasan al juego en forma normal correspondiente a la fecha 2.
Figura 2.2.1
Sacar No sacar
Sacar T,T D,2r-'--D El primero de estos resultados puede interpretarse. como el de un
pánico bancario. Si el inversor 1 cree que el inversor 2 sacará su dinero
No Sacar 2r - D,D siguiente etapa
en la fecha 1, su mejor respuesta es sacar también el dinero, aun cuando
Fecha 1 a ambos les iría mejor si esperasen a la fecha 2 para sacar el dinero. Este
juego del pánico bancario difiere del dilema de los presos discutido en el
. capítulo 1 en un aspecto importante: ambos juegos poseen un equilibrio de:
Sacar No sacar Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.a
de los presos éste es el único equilibrio (y loes en estrategias dominantes),
Sacar R,R 2R- D,D
mientras que en este juego existe también un segundo eqUilibrio qúe
NoSacar D,2R - D, R,R es eficiente. Por tanto, este modelo no predíce cuándo va a ocurrir un
pánico bancario, pero muestra que es un fenómeno que'p~~de ocurrir en
Fecha 2
equilibrio. Véase un modelo más rico en Diamond y DybVig (1983):.
Para analizar este juego procedemos hacia atrás. Considérese el juego
/, -,

en forma normal correspondiente a la fecha 2. Como R > D (y por 2.2.C Aranceles y competencia internacional imperfecta
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un único equilibrio de Nash de este juego: ambos inversores Nos ocupamos ahora de una aplicación de economía internacional. Con-
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay sideremos dos países idénticos, que denominamos con i = 1,2. Cada país
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en tiene un gobierno que escoge un arancel, una empresa que produce tanto
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1. para el consumo interno como para la exportación y unos consumidores
Dado que r < D (y por tanto 2r - D < 1'), esta versión de un periodo del que compran en el mercado interno, ya sea de la empresa nacional o efe
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras: la extranjera. Si la cantidad total en el mercado del país i es Qir el precio
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias de equilibrio del mercado es Pi(Qi) = a - Q.¡. La empresa del país i (que
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a en adelante llamaremos empresa ~)produce hi para el consumo interior
unas ganancias de (R,R). Por tanto, el juego original del pánico bancario y ei para la exportación. Por tanto, Qí = hí + ej. Las empresas tienen
de dos periodos tiene dos resültados perfectos en subjuegos (y, por tanto, un coste marginal constante e y no tienen costes fijos. Por tanto, el coste
no se ajusta totalmente a la clase de juegos definida en la sección2.2.A): total de producción de la empresa i es Cí(hí,ei) = c(hí + eí). Las empresas
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas también incurren en un coste arancelario sobre las exportaciones: si la
.,
74 I JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA Ce. 2) fllegos eH dos etapas de ill{omlOcíó/I I 75

empresa iexporta ei al país ,7 cuando el gobierno j ha establecido una tasa Suponiendo que e; :::;a - c, tenemos que
arancelaria de tj, la empresa i debe pagar tjei al gobierno j,
• 1( ,,)
, El desarrollo temporal del juego es el siguiente: Primero, ambos go- 11,; = '2 a - ej - e , (22,1)

bIernos escogen simultáneamente las tasas arancelarias tI y t2. En se-


gundo lugar, las empresas observan las tasas arancelarias y escogen si- y suponiendo que 11,; :::; a - e - tj, tenemos que
m~:áneamente las cantidades para el consumo interno y para la expor-
tacIOn, (hI,eI) y (h2,e2). En tercer lugar, las ganancias son los beneficios ei• = '2
1('o, - 1*
tj - e - tj ) . (2.22)

..... de la empresa i y el bienestar total del gobie.r:noi, donde el bienestar total


...,.' (Los resultados que derivamos son coherentes con ambos supuestos,) Las
,
del país i es la suma de los excedentes de los consumidor~s9 del país i,
dos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse para
los ~eneficios recibidos por la empresa i y el ingreso arancelario que el
cada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incógnitas
gobIerno ~recauda de la empresa j:
(hi,ei,hi,ei). Afortunadamente, este sistema de ecuaciones puede simpli-
1r'i(tútj,hi,eúhj,ej) =[0. - (hi+ ej)Jhi + [a - (ei + hj)Jei
ficarse dividiéndose en dos grupos de dos ecuaciones con dos incógnitas,
Las soluciones son
- c(hi + e;) - tjeú
", 1 h~ = + ti • 0.- C - 2tj
Wi(tútj,h"e"hJ,ej) ='2Qf + 1r'i(ti¡tj¡hi,ei,hj,ej) + tiej,
0.- C
y ei = 3 (2,23)
, '3

Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si Recordemos (en la sección 1.2.A) que la cantidad de equilibrio escogida
es un equilibrio de Nash del juego (de dos mercados) restante
(hj,ej,hi,ei) por las dos'empresas en el juego de Cournot es (a - c)/3, pero que este
entrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar resultado se obtuvo bajo el supuesto de costes marginales simétricos. En
el equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelarias
de los gobiernos hacen que los costes marginales sean asimétricos (como
'!'~ en el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal ele
Como 1r'i(t"tj,h"e"h;,e;) puede escribi~e como la sum~ de los benefi- la empresa i .es c, pero el delaempresa j es c + ti. Como el coste de la
~io,sde la empresa i en ~l.mercado i (los cuales son función de hi y e; empresa j es más alto, ésta quiere producir menos .. Pero si la empresa j
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cua- va a producir menos, el precio de ,equilibrio será'.Il~J~al~~,deforma que la
les son función, de ei, h;.y tj. únicamente), el problema de optimización empresai querrá producir más, en cuyo caso la empresa j querrá producir
en los dos mercados para la empresa i se simplifica al separarse en dos menos todavía. Por tanto, en equilibrio, hi crece con ti y e; decrece (a un
problemas, uno para cada mercado: hi debe solucionar ritIno más rápido) con ti, como indica (2.2.3).
Una vez resuelto el juego entre las dos empresas que queda en la
, max hi[a - (hi + eJ~)- cL segunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,
.-~ h,::::O ' ,
podemos ahora representar la interacción entre los dos gobiernos en la
y ei debe solucionar primera etapa con el siguiente juego de decisiones simultáneas. Primero,
los gobiernos escogen las tasas aran,celarias tI y t2 simultáneamente. En
maxei[a - (ei + 11,*) - el - te'. segundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei) para el gobierno
<,::::0 J J '
i = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),
Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.
9 S' .
1 un consUffildor compra un bien a un, precio,p cua~dohab'ríá estado dispuesto a Para simplificar la notación, suprimiremos la dependencia de 11.; de f'i
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deináilcla inversa
y de ei de tj: con W;(ti,tj)genotamos a Wi(ti,tj,hi,ei,hi,ei), la ganancia
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr del gobierno i cuando eS.<;9ge1a tasa arancelaria ti, el gobierno .i escoge t j
/,-.

76/ JUEGOS DINÁJVlICOS CON INFORMACIÓN COMPLETA Ce. 2) Juegos en dos etapas de información / 77

y las empresas i y jse comportan según el equilibrio de Nash dado por del libre comercio). (Si es factible tener aranceles negativos, es decir,
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos, subsidios, el óptimo social consiste en que los gobiernos escojan tI =
entonces, para cada i, ti debe solucionar t2 = -(a - e), lo que hace que la empresa nacional no, produzca nada
para el consumo interior y exporte la cantidad de competencia perfecta
max W;*(ti,t*). al otro país.) Por lo tanto, dado que las empresas i y j se comportan
ti~O )
según el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,
Pero W;*(t¡,tiJ es igual a
la interacción entre los gobiernos en la primera etapa es un dilema de los
presos: el único equilibrio de Nash lo es en estrategias dominantes, y es ... ".
(2(a - e) - ti? + (a - e + ti)2 + (a - e - 2t~?
1 + t(a
t
- e - 2t)1 socialmente ineficiente.
18 9 9 3'
por tanto 2.2.0 Torneos
a-e
t~ =--
, 3 Consideremos a dos trabajadores y su capataz. El producto del trabaja-
dor i (i = 1 o 2) es Yi = ei + Eú donde ei es esfuerzo y Ei es ruido. El
para cada i, independientemente de tj. En consecuencia, en este modelo
proceso de producción es el siguiente: Primero, los trabajadores escogen
escoger una .tasa arancelaria de (a - e)j3 es una estrategia dominante
simultáneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
de cada gobIerno. (En otros modelos, por ejemplo cuando los costes
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
margInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos no
de acuerdo con una función dedensidad f(E) con media cero. Entercer
son domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3) obtenemos
lugar, el producto de los trabajadores es obsen:ado pe~ono su e~fu~i~o~
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
hi = 4(a -:-e) e~ = a - e
9 y , 9 han producido, pero no (directamente) de su esfuerzo.
como las cantidades escogidas por las empresas en la segunda etapa. Por Supongamos que el capataz decide inducir a los trabajadores a esfor-
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es zarse más y para ello les hace competir en un torneo;.tal y como origi-
(ti =5 =(a - e)j3,hj=hi= 4(u-:- e)j9,ej = ei = (a --' e)j9)~ ' nalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
En el resultado perfecto en subjuegos, la cantidad agregada en cada vencedor del torneo (es decir, el trabajador quemás:produica)eswA;"el
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido salario recibido por el perdedor es WB. La ganancia:deun trabajador que
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mer- reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
cado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cour- desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
not. Por tanto, el excedente de los consumidores en el mercado i (el cual, g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.

como hemos visto anteriormente, es simplemente la mitad del cuadrado Transcribimos ahora esta aplicación'a lostérininos de la clase de juegos
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos discutida en la sección 2.2.A. El capat~~'~"eIRíg~dor 1~cuya acción al es
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que escoger lbs salarios W A y W B que se pagarán en el torneo. No hay jugador
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles 2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
Iguales a cero son socialmente óptimos en el sentido de escogidos en la primera etapa y deci~e,!-1~n.t,?~cessünultáneamente sus
acciones a3 Y a4, es decir los esfuér~o~'~l'y'é~:(Consideraremos más áde-
max W¡(t],t2) + Wi(t2,tl),
tl,t2~O lO Para no complicar la exposición de esta aplicación; ignoramos varios detalles técnicos,
tales como las condiciones bajo las cuales la 'condición de primer orden del trabajador es
de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdo
suficiente. No obstante, el análisis eXige illI mayor cálculo de probabilidades que en los casos
en el que se comprometan a eliminar los aranceles (es decir, en favor anteriores. Esta aplicación puede saltarse sin pérdida de continuidad. '
Juegos el1 das etapas de ¡,¡[anuacirÍu ! 79
78 / ]VEGaS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
Prob{Yi(e;) > Yj(ej)} =Prob{Ei > ej + éj - e;}
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por , ' =1 Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
tanto también los salarios) es función no sólo de las decisiones de los ju- . €j

gadores sino también de los términos de ruido El y (.2,operaremos con las


ganancias esperadas de los jugadores.
= /[1 - J
F(ej - ei + Ej)JJ(Ej)dEj,

,',' Supongamos que el capataz ha elegido los salarios WA y WB. Si el


-_:;,' de forma que la condición de primer orden de (2.2.5) se convierte en
par de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entre
los trabajadores, para cada i, ei ha de maximizar el salario esperado del
trabajador i menos la desutilidad del esfuerzo: ei debe ser una solución
dell
(WA - WB) LJ
J(e; - ei + Ej)f(Ej)dEj = g'(ei)'

En un equilibrio de Nash simétrico (es decir, ei = ei = e') tenemos que

max WA Prob{Yi(ei) >


e,,,=O
, = (WA - WB)
Yj(e;)} + 1)1B Prob{Yi(ei) ::; YjCe;)}

Prob{Yi(ei) > Yj(e;)} + WB


,,',
~ g(ei),
-' g(ei)
(2.2.4)
(WA - WB)
1
. €j
J(Ej) 2 dEj -- 9 '(')e .
(2.26)

Como g(e) es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valor
::. mayor d eWA-WB ) I'nduce a un mayor
'
esfuerzo, cosa harto
,
mtU.lliva. Por
"',1::'" donde Yi(ei) = ei + Ei',La condición de primer orden de (2.2.4) es' tra parte con un mismo premio, no vale tanto la pena esforzarse cuando
-,,) :
"

)8Prob{Yi(ei) >
:1 ruido e~ muy fuerte, porque es probable que elresultado del to:neo se
;:\
,-,~~tl
(WA _ WB 8
Yj(e;)} _
- 9
'( ,)
e,. (2.2.5) determine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,
ei
si Ese distribuye normalmente con varianza a2, entonces
~~~, .'
.,:¡:- ..'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
~:', un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
.",.!:.'
adicional, que es el producto de lo que se gana en salario por venCer en el
--");
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar. que decrece en a, de forma que E' efectivamer:te decrece en a..
"
__
,~i
Por la regla de Bayes,12 Procedemos ahora hacia atrás, hasta la pnmera etapa del Juego. Su-
pongamos que SI,. 1os trabaJ'adores ' acuerdan
' ' participar
, en el torneo
. (en
11 Al escribir (2.2.4),supusimos que la función de densidad del ruido ¡(e) es tal que el t
vez d e acep ar un e, mpleo a lternativo) responderan, a. los salanos ',I! A
:;
~~',' suceso en el qU€ lostrabaj~dores producen exactamente lo mismo OCurr€con probabilidad . d 1
y W B lugan ,o e eqw, 'libn'o de Nash simétrico caractenzado
.. ' . .,. por (2.2.6).
cero y, por tanto;no es necesario considerarlo en la función de utilidad esperada del trabajador
"o,}' i. (Más formalmente, suponemos que la función de densidad ¡(E) es no atómica) En una (1gnoramos, por t anto , la posibilidad de equihbn, os asrmetncos y,de un ,
descripción completa del torneo, sería natural (pero innecesario) especificar que el ganador se equilibrio en el que la elección de los es~erzos por parte de los trabaJa-
,)~
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA +wB)/2 .
dores venga dada por la solución de esquma el = e2 = en vez de por la ?:
.~} condición de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlu-
l2La regla de Bayes proporciona una fórmula para P(AIB), la probabilidad (condicional)
,",.l~ de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B) nI'd a d d e emp 1ea alternativo proporcionan' a una utilIdad Un' Como , en' el .
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan equilibrio de Nash simétrico cada jugador gana el tor~eo con probal:lh-
'. '-,' tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente. La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
dad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI capataz qUJ~re :1
..../
inducir a los trabajadores a participar en el torneo debera escoger salanos
'
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra. que satisfagan

~_l.>t'
80 / JUEGOS DlNAMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos repetidos / 81
(

1 1 ganancias del juego completo son simplemente la suma de las ganancias


-w,
2 ,~ + 2-wB - g(e*) >- Ua. (2.2.7) de cada etapa (es decir, no hay descuento).
(
Suponiendo que Ua sea lo suficientemente pequeña corno para que el Jugador 2
capataz quiera inducir a los trabajadores a participar en el torneo, éste (
Iz D2
escogerá los salarios que maximicen el beneficio esperado, 2e* -"illA - WB,
sujeto a (2.2.7). En el óptimo, (2.2.7) se satisface con igualdad: h 1,1 5,0
Jugador 1
WB = 2Ua + 2g(e*) - WA. (2.2.8) 0,5 4,4
El beneficio esperado es entonces 2e* - 2Ua - 2g(e*), de forma que el ('.
capataz quiere escoger unos salarios tales que el esfuerzo inducido, e*, Figura 2.3.1
maximice e* - g(e*). El esfuerzo inducido óptimo, por tanto, satisface
la condición de primer orden l(e') = 1. Sustituyendo esto en (2.2.6) se Jugador 2
obtiene que el premio óptimo, WA - WB, es una solución de Iz D2 (

(WA - WB) l
J
f(Ój)2dój = 1,
Jugador 1
2,2 6,1

Y (2.2.8)determina entonces WA Y"illB. 1,6 5,5

Figura 2.3.2
2.3Juegos repetidos
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
En esta sección analizarnos si las amenazas y promesas sobre el comporta- Este juego pertenece a la clase de los juegos analizada en la sección 2.2.A.
miento futuro pueden influir en el comportamiento presente en situacio- Aquí los jugadores 3 y 4 son idénticos a los jugadores 1 y 2, los espaCios
nes que se repiten en el tiempo. Buena parte de lo que hay que entender de acciones A3 y A4 son idénticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas son simplemente la suma de las ganancias en la'pnmera etapa (ái.;a2)
nuevas se requieren para entender los juegos con un horizonte infinito. y en la segunda etapa (a3,a4)' Además, el dilema de los presos en d.ós
Hemos definido también el equilibrio de Nash perfecto en subjuegos. Esta etapas satisface el supuesto que hicimos en la sección 2.2.A: para cada
defirüción tiene una expresión más sencilla para el caso especial de los jue- resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
gos repetidos que en el general de los juegos dinámicos con információn en la segunda etapa entre los jugadores 3 y 4 tiene un único equilibrio
completa que considerarnos en la sección 2.4.B. La introducirnos aquí para de Nash, que denotamos por (a3(al,a21,a,i(al,a2»' De hecho, el dilema .~'.
tacilitar la exposición posterior. . '.
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la sección 2.2.A peTInitini.osla posibilidad de
2.3.A Teoría: Juegos repetidos en dos etapas
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aquí la notación (a; (al ,a2) ,a¡ (al ,a2»
Consideremos el dilema de los presos dado en forma normal de la figura en vez de simplemente (aj,a¡). (En el juego de los aranceles, por ejemplo;
2.3.1. Supongamos que hay dos participantes en este juego que deciden las cantidades de equilibrio escogidas por las empresas en la segunda
simultáneamente en dos ocasiones, habiendo observado el resultad"ode li,'l etapa dependían de los aranceles escogidos por los gobiernos en la primera
primera decisión antes de decidir por segunda vez, y supongamos que las etapa.) Sin embargo, en el dilema de los presos en dos étapas, el único
• [IleSOS repef idos / 83
82 / JuEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

equilibrio del juego de la segunda etapa es (I¡,h), independientemente lora al caso de dos periodos, pero consideramos la posi-
del resultado de la primera etapa. .. vodlvdemqo:::1 J'uego de etapa G tenga múltiples equilibrios :le ..NilSh,¡
blhda e . d . d [y C ll1utan é1
Siguiendo el procedimiento descrito en la sección 2.2.A para calcular el 3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 .., . 1
resultado perfecto en subjuegos de tal juego, analizamos la primera etapa como
. de los presos d e l a fi gura 23.. I , pero las estrategias enOJ1Unal
. 'b .ilS
del dilema de los presos en dos etapas teniendo en cuenta que el resultado dIlem; sido añadidas al juego de forma que ahora existen dos eqUlh nos
Di ha '. (1 J) como en el dilema de los presos, y
del juego restante en la segunda etapa será el equilibrio de Nash de ese N h en estrategIas puras. ¡,2 . "1' I
de as d ' (D D) Natura men te, es artl' f)' cial añadir un eqUllt mo a
1
juego, es decir, (IIJú con ganancias de (1,1). Por tanto, la interacción en
la primera etapa entre los jugadores en el dilema de los p~esos en dos a~ora a de~as pr~~os2de esta manera, pero nuestro interés en este juego
dIlema, e os 't'vo que sustan h' va. En la próxima sección veremos que
etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que es mas exposll , 'h d uilibrios
las ganancias 0,1) de la segunda etapa se han sumado á' cada par de . tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe '1' d etapa que se repiten infinitamente tienen
ganancias de la primera etapa. El juego de la figura 23.2 tiene también un u'Iti les mc1uso SI os Juegos e . "
único equilibrio de Nash: (IIJZ). Por tanto, el único resultado perfecto en m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq. . de etapa artificial en el contexto Sl1nple
subjuegos del dilema de los presos en dos etapas es (¡¡Jz) en la primera . , n analIZamos un Juego
etapa, seguidC? de (I¡Jz) en ¡la segunda etapa. No se puede conseguir est~::cC1:riodos, y nos preparamos con ello para el análisis poster~or de
de p ..' 'co en un contexto con honzonte
cooperación, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en un juego de etapa con mteres economl ,
subjuegos. infinito.
Este argumento continúa siendo válido en situaciones más generales.
(Aquí nos apartamos momentáneamente del caso de dos periodos para
permitir cualquier número finito de repeticiones, T.) Denotemos con
G = {A¡, ... , An; Ul; ... ,un} un juego estático con información completa 1,1 5,0 0,0
en el que los jugadores 1 a n escogen simultáneamente las acciones a¡ a an 0,5 4,4 0,0
de los espacios de acciones A¡ a An respeftivamente, siendo las ganancias 0,0 0,0 3,3
U¡(al;', . ,an) a un(a¡, ... ,an). Llamaremos al juego G, juego deetapadel
juego repetido.
Figura 2.3.3

Definición. Dado un juego de etapa G, G(T) denota el juego r.epetido fini-


Supongamos que el juego de etapa de la figura 2.3.3 s.ejuega dos veces,
tamente en el que G se juega T veces, habiendo los jugadores observado los
h b' do los J'ugadores observa d o e1 resu lt a d o de la .pnmera etapa antes
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las a len . l d Demostraremos que existe. un único resultado
... }: de que empIece a segun a. . (c c)
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
erfecto en subjuegos de este juego, en el que el par de estrategIas 1, 2
etapa.
P . l'
se Juega en a pnmera etapa .14 Corno en la sección 2.2.A, supongamos que

Proposición. Si el juego de etapa G .tiene un únicQequilibrio de Nash, entonces, . . .. 22 A Si G tiene un único resultado perfecto en
dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se
para cualquier T finito, el juego repetido G(T) tiene un ú~ico resultado perfecto subjuegos, entonces G(T) hene un unlCOres
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3 juega .el resultado perfecto en subjuegOdsfide.~. la nodón de resultado perfecto en subjuegos
14E '-' tamente hablando hemos e ni o
S'HC ' '. 'd l .. 22 A El dilema de los presos en dos etapas
13 Se ~btienen resUltados análogos si el juego de etapa G es un júego dinámicó con in- ól 1 1 se de juegos defim a en a seccJOn . . . .
s o para a e a da resultado factible del juego de la primera eta pa eXlste
formadón completa. Supongamos que G es un juego dinámico con inJonnádón completa y pertenece a esta clase, porque para ca d l gunda etapa Sin embarg0. el
perfecta de la clase definida en la secdón 21.A. Si G tiene un úr¡jco resultado por inducdón Tb' d N sh en el juego que que a en a se .
un único eqU11 no e ~ . n el . e o de e~apa de la figura 2.3.3 no pertenece a
hada atrás, G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender
resultado por inducdón hacia atrás de G. Sinillarmente, supongamos que G es un juego en tIque el ¡U.ego de etapa ene m. . 11
es a c ase, por b' os de forma que sea apiJea ) e a
formalmente la definición del resultado perfecto en su Jueg
84 / JUEGOS DlNÁ,vllCOS CON INFORfvIAC¡ÓN COMPLETA (e. 2)
Juegos rq;elidos / 85

en la primera etapa los jugadores prevén que el resultado de la segunda 2.3.4 corresponde al resultado perfecto en subjuegos «Cl,Cz),(D],D2») del
etapa será un equilibrio de Nash del juego de etapa. Puesto que este juego repetido, puesto que el resultado previsto en la segunda etapa es
Juego de etapa tiene más de un equi.librio de Nash, ahora es posible que (Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
los Jugadores prevean que a resultados diferentes en la primera etapa anteriormente, se puede alcanzar la cooperación en la primera etapa de
les sIguen equilibrios diferentes del juego de etapa en la segunda etapa. un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
Supongamos, por ejemplo, que los jugadores prevén que (Dl,Dz) será el de un resultado más general: si G = {Al,'" ,An; uI- ... ,un} es un juego
resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero estático con información completa que tiene múltiples equilibrios, pueden
que (II,1z) será el resultado de la segunda etapa si el resultado de la existir resultados perfectos en subjuegos del juego repetido G(T) en los
primera etapa es cualquiera de los ocho restantes. La interacción entre que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
los jugadores en la primera etapa se concreta entonces en el juego de una de Nash de G. Volveremos sobre esta idea en el análisis de un juego con
etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1) horizonte infinito en la próxima sección.
se ha sumado a las otras ocho casillas.
La conclusión principal que debemos sacar de este ejemplo es que
las amenazas o las promesas creíbles sobre el comportamiento futuro
pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra
2,2 g,1 1,1 perspectiva, puede que quizás el concepto de perfección en subjuegos
! 1-:'" --
no utilice una definición de credibilidad lo suficientemente fuerte. Al
1,6 ]1 1,1 derivar el resultado perfecto en subjuegos «C],CZ),(D1,Dz», por ejemplo,
1,1 1,1 hemos supuesto que Jos'jugadores prevén q~e (DI,Dz) s~rá el resultaclü,
~''!.
de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~
Figura 2.3.4 (I¡'!z) será el resultado en la segunda etapa si eIde la primera ronda es
cualquiera de los ()chorestantes. Pero jugar (11,!2)enléi.se~da etapa, con
Existen tres equilibrios de Nash con estrategias puras en el juego unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2, con una ganancia de (3, 3), está también disp¿nible cci~oe'luilibrio de
los equilibrios de Nash de este juego de una etapa corresponden a los Nash del juego de etapa que queda. Dicho en términos poco preciSos.
resultados perfectos en subjuegos del juego repetido original. Denotemos parecería natural que los jugadores renegociiü-an:15.SiJC1,cz) no es'~i
con «w,x),(y,z) un resultado del juego repetido: (w,x) en la primera etapa resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~á
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4 (I¡'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;
corresponde al resultado perfecto en subjuegos «(1],[Z),(1],[2» del juego pasado está, y que se debe jugar el eqüilibriodel juegbdeetapa (Dl,D~)
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z) unánimemente preferido. Pero si (DI,Dz)va a serelr~sÚltado de la
como consecuencia de cualquier resultado en la primera etapa excepto de segunda etapa independientemente de cuál sea el rescltadoenla primera
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura ronda, el incentivo para jugar (Cl,Cz) en ia prirñ~~áet~p.a_desaparece: la
~.3.4 corresponde al resultado perfecto en subjuegos «Dl,Dz),(11'!Z» del interacción entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce
al juego
Juego repetido. Estos dos resultados perfectos en subjuegos del juego de una etapa en el que la gánancia (3, 3Yse'ha~stÜÍ1adóacada casilla del
repehdo simplemente enlazan los resultados de los equilibrios de Nash juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura Cj del jugador i. ' '. . ."._.. '.
','
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadón (o incluso
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es negodadón) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debería añadirse a
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones la descripdón y análisis del jue¡;¡m.'Aquí súpimemos que no es así, de forma que lo que
mduso mas generales.
entendemos por "renegodar" no-esotra cosa que un ejerddo de introspección.
Juegos repetidos / 87
86 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e 2)

seguido de Di peros~lo 5 +1/~ a.ljugar Ji en :a primera ~tapa (e i.ncluso


menos con otras deCISIOnes).Mas Importante aun, el problema del eJemplo
, terior no aparece aquí. En el juego repetido en dos etapas basado en la
JI 1,1 5,0 0,0 0,0 0,0 an
figura 2.3.3, la única forma de castigar a un jugador por desviarse en la
Cl 0,5 4,4 0,0 0,0 0,0 , primera etapa era jugar ~n equilibrio .~ominado en :1 sentido de Par,eto
DI 0,0 0,0 3,3 0,0 0,0 en la segunda etapa, cashgandotamblen con ello al Jugador que casllga,
Aquí, en cambio, existen tres equilibrios en la frontera de Pareto -uno
/:;~ PI 0,0 0,0 0,0 4,! 0,0 para recompensar el buen comportamiento de ambos jugadores en la
Ql 0,0 0,0 0,0 0,0 !,4 primera etapa y los otros dos para ser utilizados no sólo para castigar al
~Ti;;~):Jugador que se desvía en la primera etapa, sino también para recom pensar
'."'2E::.aiillgádor que castiga. Por tanto, si se requiere una penalización en la
Figura 2.3.5
Y';~">Segunda ronda, no existe otro equilibrio del juego de etapa preferido por
!-F ' ., .eljugador que castiga, de forma que no se puede persuadir al jugador que
Para acercamos a la solución de este problema de renegociación,-con~
castiga de que renegocie la penalización.
sideremos el juego de la figura 2.3.5, que es aún más artificial qué él j\.tego
de la figura 2.3.3. Una vez más, huestro interés en este juego' ~s más
expositivo que económico. Las lciJ~ásquééstamosdesarrollándó pái~-tTa: 2.3.B Teoría:Juegos repetidos infinitamente

tar él tema de la renegociación en esté juego artificial se pueden aplicar


también a la renegociación en juegos infinitamente repetidos; véase Fairell Pasamos ahora a los juegos repetidos' infinitamente. Como en el caso
y Maskin (1989),por ejemplo. " de un horizonte finito, el tema principal es el de que las amenazas o las
Eneste juego de etapa se añaden las estrategi~s Pi y Qia1juego de promesas, creíbles sobre el comportamiento futuro pueden influir en el
etapa de la figUra 2.:5.3.Existen cuatro equilibrios de Nash con estrategias comportamieritopresente\ En el caso de un horizonte finito vimos que si
purasdeljuego de etapa: (IJ,h)' (Dr,1J2) Y ahora también (Pl,P2) y (Ql,Q2)' existen equilibrios de Nash múltiples del juego de etapa G, pueden existir
Como antes, los)ugadores prefieren unánimemente\D1,D2) a (h,h). Más resultados perfedos en subjuegos del juego repetido G(T) en los que, para
importante aún, no hay ningún equilibrio de Nash (x,y) en lélfigUra 2.3.5 ,rualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G.
t~l que los jugadores prefieran unánimemente (x,y) a (Pl,P2); (Q1;Q2) o .;~ Untesultado más poderoso se da en los juegos repetidos infinitamente:
(Dl;D2). Decimos entonces que (Dl,D2) domina en el sentidO de PÚeto' a intruso si el juego de etapa tiene un único equilibrio de Nash, pueden
(IJ,h), y que (P1,P2),(Ql,Q2) y (Dl,D2) están en Ía fronterade Paretode las ','e3dstir muchos resultados perfectos en subjuegos en los que ning'uno de
ganancias de los equilibrios de Nash del juego de etapa de la figtira2.3.5. los resultados en cada etapa sea un equilibrio de Nash de G,
Supongamos que el juego de etapa de la figura 2.3.5 se'juega dos _ Empezamos con el estudio del dilemá de los presos repetido in rinita-
veces, habiendo los jugadores observado el resultado de la prirnéfa\511da mente. Consideramos a continuación la clase de juegos repetidos infini-
antes de que empiece la segunda. Supongamos adicion~J~erit~gue los , tamente análoga a la clase de juegos repetidos finita mente definida en la
o" :,'sécción anterior:' un juego estático con información completa, G, se repi te
jugadores prevén' que el resultado de la segundaétapa será el sigUi~nte:
(DJ,D2) si el resultado dela primera etapa es (Cl,C2); (PI ,P2) sieiiés'U1tadü t:r;~LIfullutamente, habiendo los jugadores observado 10s'resultados de todas
de la primera etápa es (Cj,w), donde 1JJ puede ser cualquierco~amE:Ílos , las rondas anteriores antes de que empiece la etapa siguiente. Para esta
C2; (Ql,Q2) si el resultado de la primera etapa eS (x,C2), donde x puede ser . "cIase de juegos repetidos finita e infinitamente, definimos los conceptos
cualquier cosa menos Cl y (DJ,D2) si el resultado de la primera etapa es de estrategia de un jugador, de subjuego y de equilibrio dé Nash perfecto
(y,z), donde y puede ser cualquier cosa menos ely zpuedes~;, ctialquier el).,"súbjuegos.(En la sección 2.4.B definimos estos conceptos para juegos
, dinámicos con información completa en general, no sólo para esta clase
cosa menos C2. Entonces «Cl,C2),(Dl,D2» es un result<l:dópeaésto'en
subjuegosdeljuego repetido porque cada jugador obtiene 4+3ál jugare; de juegos repetidos.) Utilizamos después estas definiciones para enuncia r
(
''-.-
(,
~
..
1'.
~, .'

~8 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) ]¡¡egos repetidos /89

y demostrar el teorema de Friedman (1971) (también llamado teorema de el valor presente de las ganancias, es decir, la ganancia total que podría
tradición oral o teorema folk).I6 ingresarse en un banco ahora de forma que produjera el mismo saldo al
final de la sucesión.

Jugador 2 Definición. Dado un factor de descuento 5, el valor presente de la sucesión


h D2 infinita de pagos 7f¡,7f2,7f3,'
.. es

1,1 5,0 00

Jugador 1 7fi+ 57f2+ 527f3+ ... = L 5 l7f


t
- t.

t=I
0,5 4,4
También podemos utilizar 5 para reinterpretar lo que l~amamos un
juego repetido infinitamente como un juego repetido que se acaba después
de un número aleatorio de repeticiones. Supongamos que al finalizar cada
c..
Figura 2.3.6
etapa se lanza una moneda (trucada) para determinar si el juego se acaba ';-',

~ no. Si la probabilidad de que el juego se acabe inmediatamente es p y,


Supongamos que el dilema de los presos de la figura 2.3.6 se repite por tanto, 1 - p es la probabilidad de que el juego continue al menos una
infinitamente y que, para cada t, los resultados de las t - 1 jugadas ante- etapa más, una ganancia de,7f a recibir en la siguiente etapa (si se juega)
riores del juego de etapa se han observado antes de que la t-ésima etapa tiene un valor de sólo O-p)7f /0 +1')antes de efectuar el lanzamiento del~
empiece. Sumar simplemente las ganancias de esta sucesión infinita de moneda correspondiente a esta etapa. Del mismo modo, una gan~cia de
"'~'-
juegos de etapa no proporciona una medida útil de la ganancia de un 7fa recibir dentro en dos etapas (si ambas etapas se juegan) tiene un:valor
jugador en el juego repetido infinitamente. Recibir una ganancia de 4 en de sólo 0- p)27f/0 + 1')2antes de efectuar el lanzamiento de la moneda
cada periodo es mejor que recibir una ganancia de 1 en cada periodo, por correspondiente a esta etapa. Sea 5 = O - p)/O + 1'). Entonces el valor ,,",

ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recor- presente 7f1+ 57f2+ 527f3+ ... refleja tanto el valor temporal del dinero como
demos (en el modelo de negociación de Rubinstein <;lela sección 2.1.D) la posibilidad de que el juego se acabe. '.'
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta Consideremos el dilema de los presos repetido infinitalIlente en elque
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de interés el factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugador
por periodo. Dados un factor de descuento y las ganancias de un jugador en el juego repetido es el valor presente de las ganan.ciasdel jugad()f,ep
obtenidos de una sucesión infinita de juegos de etapa, podemos calcular los juegos de etapa. Demostraremos que la cooperación, es decir,(D1,D2),
puede ocurrir en cada etapa de un resultado perfecto en subjuegos del
juego repetido infinitamente, aun cuando el único equilibrio de Nash
del juego de etapa es la no cooperación, es decir, (1},h) El argumerlto
es del mismo estilo que nuestro análisis del juego repetido en dos etapas
16 El teorema de tradición oral original se referia a las ganancias en todos los equilibrios basado en la figura 2.3.3 (el juego de etapa en el que añadimos un segundo
de Nash de un,juego repetido infinitamente. A este resultado se le llamó teorema de tradición equilibrio de Nash al dilem,! de los presos): si los jugadores cooperan
oral por ser ampliamente conocido entre los teóricos de juegos de íos "años cincuenia, aun
hoy entonces juegan un equilibrio con ganancias altas mañana; en caso
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgánancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y, contrario juegan un equilibrio Con ganancias bajas mañana. La diferencia
por tanto, refuerza el teorema de tradición oral original al utilizar un criterio de solución más entre el juego repetido en dos etapas y el juego repetido infinitamente es
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo, que aquí el equilibrio con gananciéls áltasquepodría jugarse mañana no
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradición oral, aun cuando' no hayan sido ampliamente
se ha añadido artificialmente, sirlOque representa continuar cooperando
conocidos entre los teóricos de juegos antes de ser publicados. a partir de mañana y en lo Sucesivo.
Juegos repetidos ! 91
90 I JUEGOS Dú'\JÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

Supongamos que el jugadori empieza el juego repetido infinitamente ue el jugador j recibe por realizar esta elección de forma óptima (ahora
cooperando y sigue cooperando en cada juego de etapa siguiente si y sólo q cada vez que aparezca). Si jugar Dj es óptimo entonces
y ,
si ambos jugadores han cooperado en cada ronda previa. Formalmente,
.Ia estrategia, del jugador i es: V=4+ól/,

o V = 4/(1- ó), ya que jugar Dj conduce a la misma decisión en la sig"uiente


Jugar Di en la primera etapa. En la t-ésima etapa, si
etapa. Si jugar Ij es óptimo entonces
el resultado de todas las t - 1 etapas anteriores ha sido
(Dl,D2) entonces jugar Di; en caso contrario, jugar h . ó
V =5+ 1_ o'
Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel disparador(trigger strategy);. coma obtuvimos antes. Por tanto, jugar Dj es óptimo si y sólo si
'llamadaasÍ p'orque el jugadÓ~i coopera hastaquealguieridefa de Cooperar,
4 o
lo qu~Aesencadena' la;décislón'de. rtovóivéi '~'.'cooperairí.Utlcaffiás: Si 1_ o ~ 5 + 1 _ ó' (2.3.1)
ambos jugadores adoptánla, estrat~gia derdlsparador, el resUltado d~l"
o ó ~ 1/4. Por tanto, en la primera etapa, y en cualquier ronda tal que
juegorepeti~o inffuitamertte será (Dl,D~)enCádaetapa.' Yerembs pnmeio
todos los resultados anteriores hayan sidoCDl,D2), la decisión óptima del
que si o está' lo suficientemente Cerca de uno, el hecho de que los dos
jugador j (dado que el jugador i ha adoptado láestrategia del disparador)
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
es Dj si y sólo si ó ~ 1/4. Combinando esta observación con el hecho
juegorepetidó infinitamente. Veremos a contiriu~ción que este equilibrio
de que la m~jor respuesta de j es jugar siempre Ij cuando el resultado
de Nash es'perfecto en subjuegos, en un sentido que se precisará más
de alguna etapa difiera de (Dl,D2), tenemos que el que los dos jugadores
adelante.
jueguen la estrategia del disparador es un equilibrio de Nash si y sólo si
Para demostrar que la adopción de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido Ó ~ 1/4.
Vamos a ver ahora que este equilibrio de Nash es perfecto en sub-
infinitamente, supondremos que el jugador i ha adoptado la estrategia
.juegos. Para hacerlo, definimos el concepto de estrategia en un juego
del disparador ydemostraremos a'continuación, siempre que o esté lo
repetido, de subjuego en un juego repetido y de equilibrio de Nash per-
suficientemente cerca de uno, que adoptar esta estrategia es también la
fecto en subjuegos en un juego repetido. Para ilustrar estos conceptos
mejor respuesta del jugador j. Dado que el jugador i jugará I¡ para
con ejemplos sencillos de las secciones anteriores, los definiremos para
siempreeuandó el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el juegos repetidos tanto finita como infinitamente. En la sección anterior
definimos el juego repetido finitamente G(T) basado en un juego de etapa
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal G = {Al,'" ,An; 'ul,' .. ,un), un juego estático con informaéión completa
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionaría en el que los jugadores 1 a n eligen simultáneamente las acciones al a (1."
una ganancia de 5 en esta etapa, pero desencadenaría la riocooperación de los espacios de acciones Al a An respectivamente, y las ganancias son
del jugador"i (y, por tanto, también del jugador j) enio sucesivo, de forma Ul (al, ... ,an) a Un (al, ... ,O'n)' Definimos ahora el juego análogo repetido

que la ganancia en cada etapa futUra sería 1: Comd'1+ó+ó2+:. /=1/(1-0), infinitamente.17


el valor presente de esta:sucesión de ganancias es
Definición. Dado un juego de etapa G, denominamos G(co,o) al juego repetido
.0 .infinitamente en el que G se repite por siempre y los jugadores tienen el mismo
5 + 0.1 + o 2 .
.1 + ... = 5 + -"-.
1-0
17 Naturalmente se puede definir también un juego repetido basado en un juego de etapa
Alternativamente, jugarD j proporcionaría una gananCiade 4 enéitá'etapa
diháInico, En esta sección limitamos nuestra atención a juegos de etapa estáticos para poder
y conduciría a exactamente lafuis~a elecciórtentre Ijy Dj en lasigtiiente presentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y
etapa. Llamemos V al val,or ptesert!e de la sucesión infinIta degahán¿ia's
. _. . _ '. . . . "'.~ •. ~,.~- ;.0 . < - ,"
2.3.E son juegos repetidos basados en juegos de etapa dinámicos.

.::
..,'
92 I JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)
Juegos repetidos I 93
¡áclor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
juego repetido en dos etapas consideramos una estrategia en la que la
jllego de etapa son conocidos antes de que empiece la t-ésima etapa. La ganancia
decisión del jugador .¡ en la segunda etapa era contingente del resultado
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesión infinita de juegos de etapa. de la primera etapa: jugar Ci en la primera etapa y jugar li en la segunda
a menos que el resultado de la primera sea (C¡,Cz), en cuyo caso jugar Di
en la segunda etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
En el juego repetido finitamente G(T) o en el repetido infinitamente
plan completo de acción, es decir, especifica una acción factible del jugador
G(co/i), la historia de! juego hasta la etapa t es el registro de las decisiones
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
de los jugadores desde la etapa 1 hasta la t. Los jugadores podrían ha-
forma algo más frívola, si un j~ga_dordejara una estrateg!a a su abogado
ber escogido (un, ... ,un¡) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y
anles de que el juego empezase, el abogado podría sustituir al jugador
(U¡u ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapa
en el juego, sin necesitar en ningún caso de instrucciones adicionales
s la acción Uis pertenece al espacio de acciones Ai.
sobre cómo jugar. En un juego estático con información completa, por
ejemplo, una estrategia es simplemente una acción. (Por esto describimos
Definición. En e! juego repetido finitamente G(T) o en el juego' repetido infini-
lal juego como G = {S¡,,,,,Sn;'U¡, ... ,un} en el capitulo t pero aquí
tamente G(co,8), la estrategia de un jugador determina la acción que el jugador
pu:de describirse también como G = {A], ... ,An; U¡, '" ,un}: en un juego
realizará en cada etapa para cada posible historia de/juego hasta la etapa anterior.
estallco con información 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinámico, una estrategia es más complicada. Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,
la parte que queda por jugar empezando en cualquier momento en el que
Consideremos el dilema de los presos en dos etapas analizado en la
la historia completa del juego hasta entonces sea información deI'doIÍúrÜo
sección anterior. Cada jugador acruados veces, de forma que podría
público entre los jugadores. (Más adelante en esta sección damos una
pensarse que una estrategia es simplemente un par dé irIstrucciones (b,c),
definición precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(i
donde b es la decisión en la primera etapa y e es la decisión en la segunda
sección 2.4.B damos una definición precisa para juegos dinámicos con in-
elapa. Pero existen cuatro resultados posibles de la prÍ11leraetapa, (1¡,1z),
formación completa en general.) En el dilema de los presos en dos etapas,
U¡,Dz),(D1,1ú y (D¡,Dú, que representan cuatro contingencias diferentes
por ejemplo, hay cuatro subjuegos que corresponden a los juegos de la
en las que al jugador l~ podría corresponder actuar. Por tanto, la estrategia
segunda etapa que siguen a los cuatro resultados posibles de la primera
de cada jugador consta de cinco instrucciones, que indicamos mediante
etapa. Del mismo modo, en el juego repetido en dos etapas basado en
(V¡W,x,y,z), donde v es la decisión en la primera etapa y w,x,y y zson''!as
la figura 2.3.3, hay nueve subjuegos que corresponden a los nueve re-
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (D¡Jz) y
sultados posibles en el juego de la primera etapa. En el juego repetido
(D¡,Dz) respectivamente. Usando esta notación, las instrucciones "jugar b
finita mente G(T) yen el juego repetido infinitamente G(co,8)la definición
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
de estrategia está íntimamente ligada a la definición de subjuego: la es-
se describen como (b,c,c,c,c), pero esta notación también puede expresar
trategia de un jugador determina las acciones que el jugador realizará en
estrategias en las que la decisión de la segunda etapa es contingente del
la primera etapa del juego repetido y enla primera etapa de cada uno de
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
sus subjuegos.
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
Definición. En e/juego repetido finitamente G(T), un sllbjllego que empieza en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
la etapa t + 1 es e! juego repetido en e! que G se juega T - t veces y que designamos
de cada Jugador consta de diez instrucciones, una decisión en la primera
por G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t + 1, uno para
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
cada una de las posibles historias de! juego hasta la etapa t. En e! juego repetido
resultado posible de la primera etapa. Recordemos que al analizar el
infinitamente G(co,8), cada subjuegoque empieza en la etapa t + 1 es idéntico
94 / JUEGOS DINÁMICOS CON INFOI~MAClÓN COMPLETA (e. 2) ¡liegos "e¡'e/idos / qs

al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos (Dl,Dz). Si el jugador adopta la estrategi~ del disparador p~ra el juego
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del entonces (i) las estrategias del Jugador en un subluego de la
comp leto , 1
juego hasta la etapa t. . era clase son de nuevo la estrategia del disparador, que ya 1e11l0S
nm
Pd strado que es un equilibrio de Nash del juego completo, y (H) la,s
emo . 1 t
Obsérvese que la t-ésima etapa de un juego repetido no es por sí misma estrategias del jugador en un juego de la segunda clase son slmp eme:1.e
un subjuego del juego repetido (suponiendo que t < T en el caso finito). repetir en lo sucesivo el equilibrio del juego de etapa (1¡,1z), que e: ~a,~blen
Un subjuego es una parte del juego original que no sólo empieza en un un equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. de
momento en que la historia del juego hasta entonces es información del Nash en las estrategias del disparador del dilema de los presos repetido
domino público entre todos los jugadores, sino que también incluye todas infinitamente es perfecto en subjuegos.
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-ésima etapa aisladamente sería equivaierit~a considerar la t-ésima etapa Ganancia al jugador 2
corno la etapa final del juego repetido .. Tal análisis podría llevarse a cabo
pero no sería relevante para el juego repetido original.
Estamos ahora preparados para la definición de equilibrio de Nash (0,5)

perfecto en subjuegos, la cual depende a su vez de la definición de equili-


brio de Nash. Esta última no 11acambiado desde el capítulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinámico: en cualquier juego, un equilibrio de Nash es una co-
lección de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los demás jugadores.
Ganancia al
jugador 1
(5,0)
Definición. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego. ' , Figura 2.3.7
, '

El equilibrio de Nash perfecto en subjuegos es un refinamiento del Aplicamos seguidamente argumentos análogos al juego repetí.do infi-
equilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategias 'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
de los jugadores deben ser primero un equilibrio de Nash y pasar luego (1971) para juegos repetidos infinitamente. Para enunciar' el teorema, ne-
una prueba adicionaL cesitarnos dos últimas definiciones. Primero, llamamos factIbles a las ga-
Para demostrar que el equilibrio de Nash en las estrategias del dis- nanCIas. (Xl,"" x n ) en ell'uego de etapa G si son una combinación
.
convexa
parador deLdilema de los presos repetido infinitamente es perfecto en (es decir, una media ponderada donde las ponderaciones son no-negativas
subjuegos, debernos demostra'r que las estrategias del disparador cons- y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
tituyen un equilibrio de Nash en cada subjuego de este juego repetido de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
infinitamente. Recordemos que cada subjuego de un juego repetido infi- región sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
nitamente es idéntico al juego completo. En el equilibrio de Nash en las (1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
estrategias del disparador del dilema de los presos repetido infinitamente, , ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que 1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
todos los resultados de las etapas anteriores han sido (D¡,D2), y (ii) sub- las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
juegos en los que el resultado de al menos una etapa anterior difiere de de) la región sombreada de la figura 2.3.7 son medIas ponderadas de las
96 / JUEGOS DfNÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos repetidos / 97

ganancias de más de dos estrategias puras. Para conseguir una media


cada jugador 'í y si (j está lo suficientemente cerca de uno, existe UI1 equilibrio de
ponderada de las ganancias de estrategias puras, los jugadores podrían
Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza
ulilizar un mecanismo aleatorio público: jugando U],D2) o (D],h) de-
(X], ... ,xn) como ganancia media. '
pendiendo del lanzamiento de una moneda (no trucada), por ejemplo,
consiguen ganancias esperadas de (2,5,2,5).
La segunda definición que necesitamos para poder enunciar el teo- Pago al jugador 2
rema de Friedman es un reajuste de las ganancias a los jugadores: Con-
tinuamos definiendo las ganancias de cada jugador en el juego repetido
infinitamente G(oo,ti) como el valor presente de la sucesión infinita de (0,5)

ganancias del jugador en el juego de etapa, pero es más conveniente ex-


presar este v.alor en términos de la ganancia media de la'misma sucesión
infinita de juegos de etapa, la ganancia que se tendría que recibir en cada
etapa de forma que resultara en el mismo valor presente. Sea 8 el factor de (.
descuento. Supongamos que la sucesión infinita de ganancias 7f¡'1f2,1f3, ...
tiene un valor presente de V. Si se recibiese una ganancia 7f en cada etapa,
el valor presente sería 1fjO - 8). Para que, 1f sea la ganancia media de Ganancia-al
jugador 1
la sucesión infinita 7f1,1f2,7f3, ... con un factor de descuento 8, estos dos (5,0)
valores presentes han de ser iguales, por tanto 1f = VO - 8). Es decir, la
ganancia media es O - 8) veces elv~lOr presente:
Figura 2.3.8

Definición. Dado el factor de descuento 8, la ganancia media de la sucesión


infinita de ganancias 1f],1f2,1f3,' .. es La demostración de este teorema repite los argumentos ya dados para ,, .:.
el dilema de los presos repetido infinitamente, de forma que la relegamos
00
al apéndice, Es conceptualmente inmediato pero algo complicado de no-
O - 8) ¿ 8t-]7ft._
tación extender el teorema a los juegos de etapa de buen comportamiento
t=1
que'~~ ~~~ni,finitosni ~iáticos (veremos algunos ejemplos ~n las apli7
La ventaja de la ganancia media con respecto del valor presente es que caciones dé las tres próximas secciones). En el contexto del dilema de
el primero es directamente comparable con las ganancias del juego de lo~p~sos de la fiísuril 2.3.6.- el teorema de Friedman garantiza que puede
etapa. En el dilema de los presos de la figura 2.3.6, por ejemplo, ambos alcanzarse cualquier punto en la región más oscura de la figura 2.3.8como
jugadores podrían recibir una ganancia de 4 en cada periodo. Tal sucesión ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego
infinita 0e ganancias tiene una ganancia media de 4 pero un valor presente rep~tido, siempre y cuando el factor de descuento esté lo suficientemente
de .4/0 - 8). Sin embargo, como la ganancia media no esmás que un cerca de uno.
reajuste del valor presente, maximizar la ganancia media es equivalente a , Concluimos esta sección esbozando dos derivaciones adicionales de la <,'

maximizar el valor presente.


teoría de juegos repetidos infinitamente, que se complican al añadírseles
Estamos finalmente preparados para enunciar el resultado principal la siguiente característica especial del dilema de los presos. En el dilema
en nuestra discusión sobre juegos repetidos infinitamente.
de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar
seguro de recibir,como mínimo la ganancia de 1 del equilibrio de Nash,
leorema. (Friedman 1971): Sea G un juego finito, estátic~y con información
jugando 1;. En un juego de duopolio de Cournot de una etapa (como
completa. Denominemos (e], ... ,en) a las ganancias en un equilibrio de Nash de
el descrito en la sección 1.2.A), por el contrario, una empresa no puede
G, y (x 1, ... ,xn) a otras ganancias factibles cualesquiera de G. Si Xi > ei para estar segura de obtener los beneficios del equilibrio de Nash produciendo
, .~t~;
'b:
~t::
Juegos I'qJef idos I 99
98 I JUEGOS DlNMIICOS CON INFORMACIÓN COMPLETA (e. 2)

, 'o'n creíble más fuerte' por tanto, utilizando el enfoque de


la cantidad del equilibrio de Nash; más bien, el único beneficio que una la pena 1IzaCI ' ", '.,
a!1Zarse ganancias medIas que no podnan alcanzill se
empresa puede estar segura de recibir es cero, produciendo cero, Dado Abreu pue den alc ' ,
un juego de etapa arbitario G, denotamos con Ti la ganancia de reserva del 'l' do el enfoque de la estrategia del disparador. En el ddema de
utl Izan " , .
jugador 'Í -la ganancia más alta que el jugador 'Í puede estar seguro de . os SI'n embargo el equilibrio de Nash del Juego de etapa genera
los pies , '
cias de reserva (esto es, ei = T;) tales que los dos enfoques son
recibir, hagan lo que hagan el resto de los jugadores, Debe ser el caso que unas g anan , ,
Ti :::; ei (donde eí es la ganancia del jugador 'Í en el equilibrio de Nash
equivalentes, En la próxima sección damos ejemplos de los dos enfoques.
utilizado en el teorema de Friedman), ya que si Ti fuera mayor que eú no
sería la mejor respuesta del jugador 'Í jugar su estrategia dl:iJ equilibrio de Apéndice
Nash, En el dilema de los presos, Ti = ei, pero en el juego del duopolio de
Co1irnot (y típicamente), Ti < ei. " '-"")': . ste
Ene apéndice demostramos el teorema de Friedman, Sea (ael,'" ,o'e,,)
d 'l'b'
el equilibrio de Nash de G que proporciona las ganancias e equJ 1 no
Fudenberg yMaskin (1986) demuestt~Il,qyeenjuegos con dos Jugado~
res, las ganancias de reserva (Tl,T2)'pi.led~~réerripla'zaia las gananCias de (el,-'"' e)TI. • Del mismo modo, sea (0.",1,' .. ,0,,,,,,) la colección de acciones
que proporciona las ganancias factibles,(xl, ... ,xn), ,(La:U~a ~o.tación es
equilibrio (q,éú'en el enunciado del te¿terna.deFriedman. Es decir, si
sólo indicativa porque ignora el mecamsmo aleatono publIco l1plCamente
(Xl,X2) es una ganancia factible deO, C011Xi' > Ti para cada 'Í, para 5 lo
necesario para alcanzar cualquier ganancia factible.) Consideremos la
suficIentemente cerca de uno, existe un equilibrio de Nash perfecto en
siguiente estrategia del disparador en el caso del jugador 'Í:
subjuegos de 0(00,5) que al~ania (Xl,X2) como ganancia media, incluso si
Xi < ei para alguno de los jugadores, En juegos con más de dos jugadores,
Jugar axi en la primera etapa. En la t-ésima etapa, si
Fudenberg y Maskin ofrecen una condición débil bajo la cual las ganancias el resultado de todas las t - 1 etapas anteriores ha sido
de reserva (TI," "Tn) pueden reemplazar a I",sganancias de equilibrio en
(O.xl" .. ,0.",,,) jugar an; en caso contrario jugar o.ei'
el enunciado del teorema.
También tiene interés la siguiente pregunta complementaria: ¿qué Si ambos jugadores adoptan esta estrategia, el resultado en cada etar,Jé1 del
ganancias medias pueden alcanzarsetoh un equilibrio de Nash perfecto juego repetido infinitamente será (0,,,,1,' .. ,0,,,,,,). Argu~1entaJllOs pnmero
en subjuegos cuando el factor de descuénto no está 10 "suficientemente que si ti está lo suficientemente cerca de uno, el que lo~Jugadores ~d()pten
cerca de Uno"? Una manera de abordar esta cuestión es considerar un esta estrategia constituye un equilibrio de Nash del Jueg~ re~eltdo, Ar-
valor fijode5 y determinar las gánaitciás medias que pueden alcanzarse gumentamos a continuación que esta estrategia es un equillbno de Nash
si los jugadores usan las estrategias del dísparador qué se desplazan para perfecto en subjuegos. , '
siempre al equilibrio'de Nashdel juego de'etapa despuéS de cualquier Supongamos que todos los jugadores excepto el J~g~dor ¡,han, adop-
desviación. Valores menores de 5 hacen queuna penalización que empiece tado la estrategia del disparador. Dado que los demas Jugaran Stempl.e
en el próximo periodo sea menos efectiva para evitar una desviación en (o.el,'" ,o.e i-l,ae i+l, ... ,aen) siempre si el resultado de alguna etapa dI-
este periodo ..'No obstante;lós jugadores pueden tlpicamernte hacer algo fiere de (a~l,' .. ,~xn), la mejor respuesta del jugador 'Í esjugar siempre (J'e;
mejor que simplemente jugar un equilibrio de Nash del juego de etapa. si el resultado en alguna ronda difiere de (a"l,' .. ,o.xn)' Queda por deter-
Un segundo enfoque, iniciado por Abreu (1988), se basa en la idea de minar la mejor respuesta del jugador 'Í en la primera ronda yen cualquier
que la forma más: efectiva de evitar que jm jugador- se desVÍe de una etapa en la que todos los resultados anteriores hayan sido (a",l, . ' . ,().",,,),
estrategia propuesta es amenazarlo con administrar la penalización creíble Sea adi la mejor desviación de (0.",1, ... ,0.",") que puede adoptar el jugador
más dura en el caso que se desVÍe (es decir, amenazar con responder a 'Í. Esto es, adi es una solución de
una desviación jugando el equilIbrio de Nash perfecto en subjuegos del
juego repetido infinitamente que proporciona la ganancia menor entre max lLi(o.xl, - -' ,o,x,i_l,ai,o..T:¡i+l,'" ,o.xn).
todos esos equilibrios al jugador que se desvía). En la mayoría de juegos, a,EA,
Sea di la ganancia a -i con esta desviación: di = v,;(axl,' , . ,o,,,,,i-l ,0.di,0'x,;+1
... ,-,'
. "
'
.
,', desplazarse para siempre al equilibrio de Násh del juego de etapa no es
100/ JUECOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos repetidos / 101
(Ignoramos de nuevo el papel del'
.. , el",.,.,). .
. . 'i - . " mecamsmo aleatorlO'la me- (dado que los demás jugadores han adoptado la estrategia del disparador)
JOIl eSVlaClOny su ", ~ .
ganancIa puellen depender de que' estr t .
es axi si y sólo si {¡ ?: (di - xi)/(di - ei).
hay
"/L(a.
l .
a.
d
°
a se eCClOna el mecanismo aleatorio)
.
.,...
a egIa pura
lenemos que di ?: x.; = Combinando esta observación con el hecho de que la mejor respuesta
, .eL ... , x '-1
I I
a XlI. a X¡'l+
. 1I ... I
a)xn > e,¡ = Ui
((le]" ... ,aen).
de 'i es jugar aei para siempre si el resultado de alguna etapa difiere de
Jugar adi proporcionará una ganancia de di en esta etapa pe d
cadena (ael,' .. ,a. a. . ro esen- (axIJ' .. ,axn), conc'¡uimos que jugar la estrategia del disparador por parte
. e,,-I, e,-.+L ... ,ae.,.,)en lo sucesIvo por parte de los d ' de todos los jugadores es un equilibrio de Nash si y sólo si
Jugadores, ante lo cual la mejor respuesta del J' d' emas
l' uga or z es ae;, de forma
que a,gadnanClaen. cada etapa futura será e'i. El valor presente de esta , d,; - Xi
SuceSlOn e gananCIas es u ?: max -d--'
1 i - ei

.
d".,+ u . e.,' + u,2 . e. +
' '"
= d., + 1 _o oei. Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foimá que eI~valormáximo de esta fracción para cualquier jugador sea
(Dad~ ~ue cualquier desviación desencadena la mismarespuest. d 1 también estrictamente menor que 1.
demas Jugad 1" d . '.' , a e os Queda por demostrar que este equilibrio de Nash es perfecto en sub-
. ores, a umca esviación que necesitamos considerar es la '
ventaJosa) Alt ti .' mas juegos. Es deCir,'que las estrategias del disparador deben constituir un
" . ema vamente, Jugar axi proporcionará una ganancia de x.
en esta et~pa y conducirá a exactamente la misma elección entre a. a' equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
,~I:/~sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~
(e Juego de etapa que el Jugador i recibe por elegir óptimament (h
es
subjuegode 0(00,0) idéntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
Ycada vez t . e a ora clases: (i) subjuegos en los que los resultados de las etapas anteriores han
que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti' ':,.,
entonces " X> P mo, sido (axl, .. -: ;a~n), y (ji) subjuegos'en losqué
el resultado de al menoSú.ri¡{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
Vi = Xi + oVi, disparador en el juego completo, (i) las estrategias'dé los jugadores ériun'
,/0 ,) S"1Jugar subjuego de la primera etapa son de nuevo las estrategias del disparador
o V,-,- x - u. adi es. óptimo, entonces
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash

Vi = di + --e.
o del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle . ....... '
1-0'" la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiiegÓ
como obtuvimos p' ( . de etapa (ael,' .. ,aen), lo que también es un equilibrio de Nash d~l jrieg;;~"
rio no está co 1 ~eVl~ment~. Supongamos que el mecanismo aleato- completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
' . rre aClOna o senalmente. Es suficiente entonces que d. sea
la ganancIa mayor a la . d . ., d ' del juego repetido infinitamente es perfecto en subjuegOs.
. '. . meJor. eSVlaClOn el jugador i entre las difere _ ':.." ,

:~:a~:~:;n~clOnes de es~at~gias puras seleccionadas por el mecanismno


. n consecuencIa, Jugar axi es óptimo si y sólo si 2.3.C Colusión entre duopolistas de Coumot

Xi {¡ Friedman (971) fue el primero en demostrar que podria alcanzarse la


-->d+--
1 - {¡ - " 1 _ o e,,,. cooperación en un juego repetido infinitamente utilizando estrategias que
o
consistieran en elegir para siempre el equilibrio de Nash del juego de etapa
después de cualquier desviación. Originalinente se aplicó a los casos de
o> d; - Xi
colusión en un oligopolio de Cmimot, del siguiente modo:
- di - ei'

Por tanto, en la pri.. ' . Recordemos el juego deCoumot estático de la sección 1.2.A: Si la
. . m.ra etapa, y en cualqwer etapa tal que todos los resul- cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,

•.
tal:los antenores hayan 'd ( '" , .
. SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene

--------
102 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Jllegos repel idos / 103

costes fijos. Las empresas escogen sus cantidades simultáneamente, En el También podemos preguntarnos qué pueden conseguir las empresas si
único equilibrio de Nash, cada empresa produce una cantidad (a - c)/3; 6< 9/17. Exploraremos los dos enfoques descritos en la sección ante.rior.
a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado Determinamos en primer lugar, para un valor dado de ó, la cantIdad
que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad
más rentable que las empresas pueden producir si ambas siguen una
de monopolio, qm == (a- c)/2, ambas empresas estarían mejor si cada una
produjera la mitad de la cantidad de monopolio, q¡ = qm/2. ~ trategia del disparador que transforman para siempre en la cantidad .de
Cournot después de cualquier desviación. Sabemos que estas estrategIas
Consideremos el juego repetido infinitamente basado en este juego no pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dad
de etapa de Cournot, cuando las dos empresas tienen el mismo factor de de monopolio, mientras que para cualquier valor de 6, repetIr la cantIdad
descuento 6. Calculemos ahora los valores de 6 para los <fue,cuando las de Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.
"
",', dos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de ' Por tanto, la cantidad más rentable que puede darse con las estrategias del
Nash perfecto en subjuegos de este juego repetido infinitamente: ' clispáradoresfáentre q;,{/2 y qc. Para calcular esta cantidad, consideramos
la estrategia del disparador siguiente:
Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~n
e! primer periodo. En el t-ésim,o periúdo~producir qm/"Z Producir q* en el primer periodo. En el t-ésimo periodo,
SI ambas empresas han producido qm/2 en cada uno d~
producir q* si ambas empresas han producido q* en cada
los t- 1 periodos anteriores; en caso éúntnirio¡ producir, uno de los t ~,1 periodos anteriores; en caso contrario,
la cantidad de Cournot, qc. ,
producir la cantidad de Coumot, k

Puesto,qu~ e,!argumento e~ paralelo al dado para eldilem~de los pres;s El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, que
de la sección anterior, seremos breves en la discusión. '"
denotaremos mediante 11"*. Si la empresa i va a producir q* en este periodo,
El beneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es la cantidad que maximiza los beneficios de la empresa j en este periodo
(a - c)2/8,.que denotaremos por 1r m/2. ~l beneficio deuna empresa cuando es una solución de
ambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, si
la empresa i vaa producir qm/2 en este periodo, la cantidad que maximiza
max (a, - qj - q* - c)qj.
los beneficios de la empresa j en este periodo es uria sohición de ' _. qj

La solución es qj = (a. - q* - e)/2, con un beneficio de (a - q* - c)2/4, que


max
qj
(a - q'
J
_l,q
2'
~ c)q,
m - J de nuevo denotamos por 11" d. Que las dos empresas jueguen las estrategias
del disparador dadas anteriormente es un eql,tilibriode Nash siempré que
La solución es qj = 3(0. - c)/8, con un beneficio de 9(0. - c)2/64, que
denotamo~ mediante 11"d ("d" por desviaciÓn). ' Por tanto, que las dos! 1 8
-- '11"* > 7rd + --' 7rc,
empresas Jueguen la estrategia del disparador expuesta anteriormente es 1-8 - 1-6
un equilibrio de N ash siempre que ' ,
Despejando q* en la ecuación de segundo grado resultante se obtiene que
el valor menor de q* para el que las estrategias del disparador dadas
116
1- 6 ' 2"11"m ::: 7rd + 1 _ 6 . 11"c, '(2.3.2) ant~riormente son un equilibrio de Nash perfecto en subjuegos es

análoga a (2.3.1)en el análisis del dilema de los pr~~9S; S~stitu~e~do los 9 - 56


q* = 3(9 _ ó) (a - e),
',':.'
valores de11"m, -rrd y 11"cen (2.3.2)obtenemos que 6::: 9/1'1. Poi-Ías mi;mas
razones que en la sección anterior, este equilibrio d~ Nash es perfecto en
que decrece monótonamente con Ó, tiende a qm/2 cuando ó tiende a 9/17
subjuegos. "..,' ' "
y tiende a qc cuando 6 tiende a cero.
-":
10'1.1 JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) J !legos repetidos / 105

Exploramos ahora el segundo enfoque, que incluye la amenaza de perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash en
hacer efectiva la penalización más fuerte creíble. Abreu (1986) aplica esta cada clase de subjuegos. En los subjuegos de colusión, cada empresa
Idea a unos modelos de Cournot más generales que el nuestro, utilizando debe preferir recibir la mitad del beneficio de monopolio en lo sucesivo a
un factor de descuento arbitrario; nosotros simplemel1te demostramos recibir 7f d este periodo y el valor presente por penalización en el periodo
que el enfoque de Abreu permite que en nuestro modelo se obtenga el siguiente:
resultado de monopolio cuando f¡ = 1/2 (que es menor que 9/17). Consi-
1 1 (2.3.3)
deremos la siguiente estrategia del "palo y la zanahoria"): -- . -7r > 7rd + 8V(x).
1-5 2 m_

Producir la mitad de la cantidad de monopolio, qm/2, en En los subjuegos de penalización, cada empresa debe preferir administrar
el primer periodo. En el t-ésimo periodo, producir qm/2 el castigo a recibir 71" dp este periodo y empezar de nuevo la penalización
si ambas empresas produjeron qm/2 en el periodo t - 1, en el siguiente periodo:
qm/2 si ambas empresas produjeron x en el periodo t - 1,
Y x en cualquier otro caso. V(x) ?: 7r dp(X) + 5V(x). (2.3.4)

Sustituyendo V(x) en (2.3.3) obtenemos


Esta estrategia incluye una fase de penalización (de un periodo) en la que
la empresa produce x y una fase de colusión (potencialmerite infinita) en la
5 G7rm -7r(X») ?: 7rd - ~7fm.
que la empresa produce qm/2. Si cualquiera de las dos empresas se desvía
de la fase de colusión, empieza la fase de penalización. Si cualquiera de las Es decir, lo que se gana en este periodo por desviarse no debe ser mayor
d~)sempresas se desvía de la fase de penalización, ésta vuelve a empezar. que el valor descontado de la pérdida en el periodo siguiente debida a
SInmguna empresa se desvía de la fase de penalización, empieza de nuevo la penalización. (Siempre y cuando ninguna de las empresas .se desvié
la fase de colusión.
de la fase de penalización, no hay ninguna pérdida a parlii dél si~ente
El beneficio de una empresa si ambas producen x es (a - 2x - e)x, que periodo, ya que la fase de penalización termina y las empresas vüelven
denotaremos mediante 7f(x). Sea V(x) el valor presente de recibir 7f(x) en al resultado de monopolio, como si no hubiera habido desviación.) Dél
este periodo y la mitad del beneficio de monopolio en 16 sucesivo: mismo modo, (2.3.4) puede reescribirse como .
f¡ 1
V(x) = 7f(x) + -- . -7f
1- f¡ 2 m. 5 G7fm - 7r(x») ?: 7rdP ~ 7f(x?:: .
Si la empresa 'i va a producir x en este periodo, la cantidad que maximiza
el beneficio de la empresa j este periodo es la solúción de con una interpretación análoga. Para 5 = 1/2, (2.3.3)se cumple siémp~e y
cuando x/(a - e) no esté entre 1/8 y3/8, Y (2.3.4)se'C{unplesix/(a - e)
max (a - qj - x - e)qj.
está entre 3/10 y 1/2. Por tanto, pa~a 5 = 1/2, la,estrafégia del palo y la
qj zanahoria consigue que el resultado de mOÍ1.<)polio" sea un equilibrio de
Esta solución es qj = (a - x - e)/2, con un beneficio de (a - x - c)2/4, que Nash perfecto en subjuegos, siempre y cuando 3/Ss x/(a - e) S 1/2.
deno~amos por 7r dp(X), donde dp significa desviarse de la penalización. Existen otros muchos modelos de oligopolio dinámico que enriquecen
SI arr:ba.s .empresas juegan esta estrategia, los subjuegos del juego el modelo simple desarrollado aquÍ. Concluirnós esta sección discutiendo
.. ',
repet~~o mfulltamente pueden agruparse en dos clases: (i) subjuegos de brevemente dos clases de estos modelos: los modelos con variables de es-
coluslon:.en los que el resultado del periodo anterior fue (qm/2,qm/2) o tado y los modelos con supervisión imperfecta. Las dos clases de modelos
(x,x),y (n) subjuegos de penalización, en los que el resultado del periodo tienen muchas aplicaciones que trascienden el ámbito del oligopolio;por
~ntenor no fue ni (qm/2,qm/2) ni (x,x). Para que el que las dos empresas ejemplo, el modelo de salaribs de eficiencia de la próxima sección es un
jueguen la estrategia del palo y la zanahoria sea un equilibrio de Nash caso de supervisión imperfecta. ','
106 / JuEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2) Jllegos repel ido< / 107

Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusión en el W10S salarios más altos podrían inducir a que los trilbajado-
desarro 11ildos , , . .
ciclo económico, permitiendo que la intersección con el eje de abci~as de .' preparados solicitasen empleo en la empresa que los ofrecIelil,
res mejor . ,.
la función de demanda fluctúe aleatoriamente de un periodo al otro. En o podrían inducir a los trabajadores ya empleados a trabajar mas mtensa-
cada periodo, todas las empresas observan la intersección con el eje de ab- mente.
cisas de la función de demanda en ese periodo antes de tornar decisiones; Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inámico en el q.ue
en otras aplicaciones,los jugadores observan otras variables de estado l empresas inducen a los trabajadores a trabajar mas pagando salanos
al principio de cada periodo. El incentivo a desviarse de una estrategia :r:os y amenazando con despedir a los que sean descubiertos trabajando
pactada depende tanto del valor de la demanda en este periodo corno poco. Como consecuencia de estos salarios altos, las empresas reducen su
de los posibles valores de la demanda en periodos futuros. (Rotemberg demanda de trabajo, de forma que a1g1.mostrabajadores tendrán empleo
y Salonersuponen que la demanda no está correlacionada serialmente n salarios altos mientras que otros estarán (involuntariamente) parados.
de forma que esta última consideración ,es independiente del valor pre~ ca d ,. 1
Cuanto mayor sea el número de trabajadores para os, mas tIempo e
sente de la demanda, pero otros autores posteriormente han relajado este llevará a un trabajador que haya sido despedido encontrar un nuevo
supuesto.)
empleo, de forma que la amenaza de despido resulta más. efectiva. En
Green y Porter (1984) estudian la colusión cuando las desviaciones el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
no se pueden detectar perfectamente: en vez de observar las cantidades trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
escogi~~s ~or la otra empresa, cada empresa observa tan sólo el precio empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
de eqwlibno del mercado, que cada periodo recibe sacudidas debidas a Vamos a estudiar los aspectos de este modelo que tienen que ver co~
una perturbación aleatoria inobservable. En este contexto, las empresas los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
no puede,n distinguir cuándo un precio de equilibrio bajo se debe a que competitivo) analizando el caso de una empresa y un trabajador.
una ~ ,mas empresas se han desviado de la estrategia pactada o a que , Consideremos el siguiente juego de etapa. En primer lugar, la empresa
oc:un0 una perturbación adversa. Green y Porter examinan los equili- ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
bnos con estrategias del disparador tales que c~alquier precio por debajo rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
de un nivel crítico dispara un periodo de penalización durante el cual un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
las empresas juegan sus cantidades de Coumot. En equilibrio, ninguna escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
empresa se desvía. No obstante, una perturbación especialmente mala (lo que no le produce desutilidad). La decisión tornada por el traba~ador
puede hacer que el precio caiga por debajo del nivel crítico, desencade- sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
na~do un periodo de penalización. Como algunas penalizaciones ocurren produce es observado tanto por la empresa como por el.!!abajador. La
acc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en el producción puede ser alta o baja; para simplificar, suponemos que el
anahSls de las estrategias del disparador no son óptimas. Estrategias de nivel bajo de producción es cero y escribimos, eLnivel~1to como y > O.
dos ~ases del tipo ,analizado por, Abreu podrían parecer prometedoras; Supongamos que si el trabajador realiza un esfuerzo, la producción es ~J,ta
efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que pueden con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
ser optimas.
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de producción es signo inequívoco de falta de
2.3.D Salarios de eficiencia esfuerzo. .tI

Si la empresa emplea al trabajador con un salario w, las gananciils a


En los modelos de salariOs de eficiencia, lo que producen los trabajadores lbs jugado~es si el trabajador realiza un esfuerzo ~ la pro~ucción e: alta
de una empresa depende del salario que la empresa paga. En el con- son y - w para la empresa y w -'- e para el trabajador. SI el trabaJildor
texto. de lo: países en vías de desarrollo, esto se explicaría porque unos no se esfuerza, e es cero; si la producción es baja, y es cero. Suponemos
salan os mas altos podrían conducir a una mejor nutrición; en los países que y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr
108/ JUEGOSDINÁMICOS CON INFOI~lyIACIÓNCOMPLETA (c. 2) Jllegos repetidos / 109

empleado en la empresa y realizar un esfuerzo, aunque también le resulta es también análoga a estas estrategias del disparador, pero es ligeramente
m~jor ponerse de independiente a estar empleado en la empresa y no más sutil ya que el trabajador decide en segundo lugar en el juego de etapa
estorzarse. de decisión sucesiva. En un juego repetido basado en un juego de etapa de
El resultado perfecto en subjuegos de este juego de etapa es más decisión simultánea, las desviaciones se detectan sólo al final de la ronda;
bien poco prometedor: dado que la empresa pagaw por adelantado, el sin embargo, cuando el juego de etapa es de decisión sucesiva, una des-
trabajador no tiene ningún incentivo para esforzarse, de forma que la viación del primer jugador se detecta (y debería ser contestada) durante
empresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajar la misma ronda. La estrategia del trabajador es jugar cooperativamente
como independiente. Sin embargo, en el juego repetido infinitamente, la siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
empresa puede inducir un esfuerzo pagando un salario wsupérior a Wo y pero responder de forma óptima a cualquier desviación de la empresa,
amenazando con despedir al trabajador en cuanto la producción sea baja. sabiendo que el resultado perfecto en subjuegos del juego de etapa se
Demostramos que para algunos valores de los parámetros, la empresa jugará en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,
encuentra que vale la pena inducir un esfuerzo pagando ese salario. el trabajador acepta la oferta de la empresa pero no se esfuerza.
Uno podría preguntarse por qué la empresa y el trabajador no pueden Derivamos ahora las cond,iciones bajo las cuales estas estrategias son
firmar un contrato c-6mpensatorio que dependa de la producción, deforma un equilibrio de Nash perfecto en subjuegos. Como en las dos secciones
que induzca al esfuerzo. Una razón por la que estos contratos podrían anteriOres, el argumento consta de dos partes: (i) la derivación de las
no ser viables es que a un tribunal le resulta muy dificil. hacer que se condiciones bajo las cuales estas estrategias son un equilibrio de Nash, y '\."
cumplan, quizás porque una medida adecuada de la producción incluye (ü) la demostración de que es perfecto en subjuegos.
la calidad, las dificultades inesperadas en las condiciones de producción, Supongamos que la empresa ofrece w. en el primer periodo. Dada
etc. De un-aforrÍ1.amás general, es probable que loscontf?tos contingen~ la estrategia de la empresa, es óptimo para el trabajador aceptar. Si el
tes a determinadOs volú.menes de producción sean imperfectos (más que trabajador realiza un esfuerzo, está seguro que producirá al nivel alto,
completamente inviables), aunque los incentivos todavía pueden jugar un de forma que la empresa volverá a ofrecer w' yel trabajador volverá a
papel en el juego repetido estudiado aquí. enfrentarse en el periodo siguiente a la misma decisión sobre el esfuerzo
Consideremos las siguientes estrategias en el juego r~petido infinita- a realizar. Por tanto, si la decisión óptima dél trabajador es esforzarse, el
mente, que incluyen el salario 'W. >wo que se determinará más adelante. valor presente de las ganancias del trabajador es
Diremos que la historia del juego es de salarió álto y prod~c2ión alta si todas
las ofertas anteriores han sido 'W., todas las ofertas anteriores han sido Y.: = (w' - e) + 8y':,
aceptadas y todos los niveles de producción anteriores han sido altos. La
o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,
estrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecer
producirá al nivel alto con probabilidad p, en cuyo caso la misma decisión
w = 'W. en cada periodo siguiente siempre y cuando la historia del juego
con respecto al esfuerzo se dará en el próximo periodo, pero el trabajador
sea de salario alto, producción alta, pero ofrecer w = Oen caso contrario.
producirá el nivel bajo con probabilidad 1- p,en cuyo caso la empresa
La estrategia del trabajador es aceptar la oferta de la empresa si w ~_ Wo
ofrecerá w = O en lo sucesivo, de forma que en adelante el trabajador
(decidiendo trabajar como independiente en caso contrario) y realizar un
será independiente. Por tanto, si no esforzarse es la decisión óptima del
esfuerzo si la historia del juego, incluyendo la oferta presente, es de salario
trabajador, el valor presente (esperado) de las ganancias del trabajador es
alto y producción alta (no esforzándose en caso contrario).
La ~trategia de la empresa es análoga a las estrategias del dispara-
dor analIzadas en las dos secciones anteriores: jugar cooperativamente V. = w' + {j { pV.+ O -p\. wa_ }
{j'

siempre y cuando todas las jugadas anteriores hayan sido cooperativas,


pero escoger en lo sucesivo el resultado perfecto en subjuegos del juego o V. = [0- 8)'W' + {jO - p)71Jo]/(l - {jp)O - 8). Realizar un esfuerzo es
de etapa si alguna vez se rompe la cooperación. La estrategia del jugador óptimo para el trabajador si Ve ~ V., O
Juegos repelidos / 111
110 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

que puede interpretarse como la restricción f~~liar de que fj debe ser lo

w
*
2: Wo + '(1
1- p{j
p .
)e == Wo
(1 -
+ 1 + ---
(j
[jO - p)
e
)
(2.3.5)
suficientemente alta para lograr una cooperaclOn sostenIda.
. (j -
Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las
Por tanto, para inducir un esfuerzo, la empresa debe pagar no sólo Wo + e .estrategias que estamos considerando son un equilibrio de Nash: .Para
para compensar al trabajador por renunciar a la oportunidad de trabajar demostrar que estas estrategias son perfectas en subjuegos, defJmmos
como independiente y por la desutilidaddel esfuerzo, sino también por primero los subjuegos del juego repetido. Recordemos que cuan~'¡o el
la prima salarial O - {j)e/ [jO - p):NaturaImente, si p está cerca de uno (es juego de etapa obliga a decisiones simultáneas, lo~ subJuegos ~el Juego
',1'

decir, si no esforzarse es difícilmente detectable), la prima salarial debe repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode
ser extremadamente alta para inducir un esfuerzo. Si p == O, por otra parte, etapa de decisiones sucesivas considerado aquí, los subjuegos empIezan
esforzarse es la decisión óptima del trabajador si no sólo entre etapas sino también dentro de cada etapa, después de que el
trabajador observa el salario que la empresa ofrece. Dadas las estrategias
1 (* ) .,. fj de los jugadores, podemos agrupar los subjuegos en dos clases: los que
1 _ 6 w - e 2: w + 1- 6 wo, (2.3.6)
empiezan después de una historia de salario alto y producción alta, y los
análogamente a (2.3.1) y (2.3.2) en los casos con supervisión perfecta de que empiezan después de todas las demás historias. Hemos demosb'ado
las dos secciones anteriores, (2.3.6) es equivalente a ya que las estrategias de los jugadores son un equilibrio de Nash dada
una historia de la primera clase. Queda por hacer lo mismo cor~una
W* >
_wo+ '(1 1- 6)
.+-/5-. e,
historia del segundo tipo: como el trabajador no se esforzará l1\1nca,es
una decisión óptima de la empresa inducir al trabajador a trabajar como
queefectivamenfe es (2.3.5) con p == O. independiente; dado que la empresa ofrecerá V) == O en la siguiente etapa y
Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajador en lo sucesivo, el trabajador no debería esforzarse en esta etapa y debería
sea la mejor respuesta a la estrategia de la empresa, a la empresa tiene aceptar lá oferta presente sólo si 'w 2: O.
también que merecerle la pena pagar w::
Dada la estrategia del trabajador, En este equilibrio, trabajar como independiente es permanente: si se
el problema de la empresa en el primer periodo se c(;mcreta en escoger descubre al trabajador no esforzándose, la empresa ofrece 1J) == O en lo
entre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazando sucesivo; si la empresa se desvía alguna vez de ofrecer w ==. w*, el t.ra-
co~ ~espedir al trabajador si en algún momento la producción es baja, y bajador nunca volverá a esforzarse, de fiJrma quela empresa no puede
~eclbl~ndo por tanto la ganancia y - w* en cada periodo; y (2) pagar w == O, permitirse emplear al trabajador. Hay varias razC?naspara preguntarse
mdu~l~ndo con ello al trabajador a escoger trabajar como independiente, si es razonable que el trabajo como independiente sea permanente. En
y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Por nuestro modelo de una empresa y un trabajador, ambos jugadores pre-
tanto, la estrategia de la empresa es una mejor respuesta a la del traba- ferirían volver al equilibrio de salario alto y producción alta del juego
jador si repetido infinitamente, antes que jugar para siempre el resultado perfecto
en subjuegos del juego de etapa. Éste es el problema de la renegociación
y - w* 2: O. (2.3.7)
presentado en la sección 2.3.A. Recordemos que si los jugadores saben que
no se podrán hacer cumplir las penalizaciones, la cooperación inducida
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador por la amenaza de estas penalizaciones ya no es un equilibrio.
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una En el contexto del mercado de trabajo, la empresa puede preferir no
condición más fuerte si estas estrategias han de formar un equilibrio de renegociar si emplea muchos trabajadores, ya que renegociar con un tra-
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican bajador puede estropear el equilibrio de salario alto y producción alta que
1-/5 se está todavía jugando (o aún sé ha de empezar a jugar) con los otros
Y-e>
- 'tilo + ---e
60 - p) , trabajadores. Si hay muchas empresas, la cuestión es si ~aempresa .i con-
,'.

'112 í JUEGOS DlNÁMJCOS CON INFORMACJÓN COMPLETA (c. 2) fllegos repetidos / 113

tratará a trabajadores empleados anteriormente en la empresa .¡. Pudiera la autoridad monetaria observa esta expectativa y escoge el nivel real de
ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de inflación, -¡r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,
salario alto y producción alta logrado con sus trabajadores, como en el los empresarios quieren simplemente prever correctamente el nivel de
caso de una única empresa. Algo así puede explicar la falta de movilidad inflación; alcanzan su ganancia máxima (que es cero) cuando -¡r= 7[e. A la .'
~:;,,
de los administrativos jóvenes y varones entre las grandes empresas en autoridad monetaria, por su parte, le gustaría que la inflación fuera cero
Japón. . pero que la producción estuviera en su ruvel de eficiencia (y*). Escribimos
Alternativamente,si los trabajadores despedidos pueden siempre en- la ganancia de la autoridad monetaria como
contrar nuevos empleos que sean preferibles a trabajar como independien-
tes, el salario en esos nuevos empleos (neto de cualquier desutilidad del U(-¡r,y),= ::-C'Tr2 _ (y _y*)2,
esfuerzo) es el que aquí juega el papel del salario en el trabajo por libre
lUo. En el caso extremo en el que un trabajador despedido no sufra nin-
donde el pªiá,meti-o c > O refleja el dilema de laaú,-t?I1d~dITl();l1~;~ria
~n~,~
S115 dos ~lJjeti~os'?llPo!;ga.mos q';le el verdad~!(): !ÚyeI d~ pr,c)~}lc.ción
guna pérdida, no existirán penaliza'ciones por no esforzarse en el juego
repetido infinitamente y, por consiguiente, no existirá ningún equilibrio es i~sigule;tefuIíd¿n del ~velde producción deseado'y de la in£l.ac.i~~
' iIDpfevista'; " , , ,
de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe
una aplicación elegante de estas ideas en el contexto de la deuda pública
y =by* + d(-¡r - -¡re),
externa en Bulow y Rogoff (1989): si un país endeudado puede conseguir
el importe de los créditos a largo plazo que recibe de los paíSes acreedores donde b < 1refleja ,la presencia de un poder de monopolio en los mer~
mediante transacciones a corto plazo por adelantado en el mercado inter- cados de productos (de forma. que si no hubiera inflación imprevista; se
nacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento produCiría a un nivel por debajO del de eficiencia) y d >' O mide el efecto de
de los términos de la deuda en el juego repetido infinitamente entre paíSes la iriflaciQrlin1prevista sobre.la producción a través de los salarios reales;
deudores y acreedores. tal ycomo se describió en el párrafo anterior. Podemos entonces reescribrr
la ganancia de la autoridad monetaria como. .
2.3.E Política monetaria estable en el tiempo
W(-¡r,7[e) = _c-¡r2 - [(b - l)y* +d(-¡r - 7[e)]2.
Consideremos un juego de decisiones sucesivas en el que empresarios y
trabajadores renegocian los salarios nominales, después de lo rualla auto- Para h~llar el resultadop;d~to en subjuego~A~:'~!~'jt;~~9. d~¿~~tp.J~
calculambs primero la elección óptima de-n: por Bme~ela,aut0!fd~9
ridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a
monetari~¡-a.adas l~s exp~étativas de los einpresarib~ -¡re.MaximiZando
de inflación. Si los contratos salariales no pueden' ser automáticamente
W(-¡r,-¡re) obtenemos
achlalizables, empresarios y trabajadores tratarán de prever la inflaCión
antes de fijar los salarios. Sin embargo, una vez se ha fijado el sala- d '
1l'*(-¡re)
= --:J?[(l - b)y* + d-¡re]. (2.3.8)
rio nominal, un nivel real de inflación superior al previsto erosionará el c+ u-
salario real, haciendo que los empresarios aumenten el empleo y la pro-
Dado qJle.los empresarios prevén que la autoridad monetaria escogerá
ducción. La autoridad monetaria, por tanto, se enfrenta aun dilema al -¡r*(-¡re),
i~$'empresarios escogerán la -¡reque maximice _[-¡r*(7[e)- -¡re]2,lo
tener que escoger entre los costes de la inflación y las ventajas de reducir
que da1r*(-¡re)= -¡re,o,.,
el paro y aumentar la producción ante una evolución impreVista del nivel
de inflación.
-¡re = ---y
d(1 - b) *' = ,-¡r.,
Como en Barro y Cardan (1983), analiZamos una versión en forma c
reducida de este modelo en el siguiente juego de etapa. Primero, los donde el subíndice s denota, "juego de etapa". De forma similar, podría
empresarios forman sus expectativas de inflación, -¡re.En segundo lugar, deCirse que la expectativa' niCiomilque los empresarios deben mantener
~
, ;:~;~~\:i!~W;Ú.;,~,\ ••~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;¡,,:,;1;'r,,,,l..l.'~I'
.••.,,.:.,,••;"" ••.:.:"'J.._~' ...•.•.•...•.
~-...:..!...~...:..-'~~L~,I _ •.~I;.l...;.'--:'<'~. ---.---------

Juegos dil1ámicos COll il1fOI'llWÓÓI1 completa pero illlpe,.[eda / 115


114 / JUEGOS DINÁMICOS CON TNFORMAClÓN COMPLETA (c. 2)

<... es la que será confirmada en lo sucesivo por la autoridad monetaria, de (2,39)


form~ que "*("e) =: ".e, y por tanto ".e = "'s' Cuando los empresarios
_l_W(O O) > w (".+(0),0) + _rS_vV("',""'s),
1-b '- 1-15
mantIenen esta expectativa ".e =: "'s, el coste marginal en que incurre la
autoridad monetaria al fijar". ligeramente por encima de ".s compensa que es análoga a (2.3.6). 2
Simplificando (2.3.9) obtenemos b 2: c/(2e + d ). Cada u~o de los pa-
exactamente el beneficio marginal de la inflación imprevista. En este
rámetros c Y d tiene dos efectos. Un aumento en d, por ejemplo, hace
resultado perfecto en subjuegos, se espera que la autoridad monetaria
que la inflación imprevista sea más efectiva de cara al aumento de ~a
".-,: cree inflación y así lo hace, pero estaría mejor si pudiera comprometerse a
producción, y resulta por tanto más tentador para la autondad mon:tana
no ~rear inflación. Efectivamente, si los empresarios tuvieran expectativas
ser indulgente con la inflación imprevista, aunque por la mIsma razon, un
racIOnales (esdecir, rr =: ".e), una inflación cero maximiza la ganancia de la
aumento en d también aumenta el resultado del juego de etapa"" lo que
autoridad monetaric:.(es;decir, W(". ,'" e) = _c".2 - (b - 1)2y*2 cuando". = ".e,
hace que la penalización sea más dolorosa para la autoridad monetária,
defonna que"..==O~só1'5tiroo)., ... .. .
Dél mismo modo, un aumento de c hace que la inflación sea más dolorosa,
.. . C6risi~~r~n10sah~ra!erjüeg() rer'etidO infinitam,ente en el que ambos
por lo que la inflación imprevista resulta m~n~s tentadora, pero ~ambién
. Jugadores tienen el rmsmo factor de descuento Ó. Derivaremos condicio-
hace que".. disminuya. En ambos casoS, el ultImo efecto pesa mas que :1
nes bajo las cuales". = ".e.=: Oen cada periodo de un equilibrio de Nash
primero, de forma que el valor crítico del factor de descuento necesarIO
per~ecto en subjuegos que incluya las siguientes estrategias. En el primer
para mantener este e.quilibrio, c/(2c + d2), decrece c~n d y crece c.onc.
penado, los empresarios mantienen la expectativa ".e =: O. En periodos
Hasta ahora hemos demostrado que la estrategIa de la autondad mo-
sucesivos.mantienen1a expectativane =;'O siempre y cuandó todas las
netaria es una mejor respuesta a la estrategia de los empresarios si (2.3.9)s~
expectativas anteriores hayan sido ne=: ó.}' todos los niveles de inflación
cumple. Para demostrar que éstas estrategias son un equilibrio ~e Nash,
a~teriores.hayan sido e0ctivamente ". =: O;en caso contrario, los empresa-
queda por demostrar que la última es una mejor resp.uesta ~ la pnmera,.lo
nos.mantienenJa'exp'ectativaie =:".. (la expectativa racional en el juego cual se deriva de la observación de que los empresanos obtIenen su mejor
de etapa), De forma similar, la autoridad monetaria fija". = Osiempre
ganancia posible (que es cero) e.\lcada periodo. Demostrar q~e :stas es-
. ,~.;. y cuando la expectativa presente sea ne,.", O;todas las expectativas ante-
trategias son perfectas en subjuegos requiere argumentos analogos a los
~ores hay.an sido ".e = OY todos los niveles de inflación anteriores hayan
'.":.' sIdo efectIvamente". = O;en caso contrario, laautorid'ad monetaria fija de la sección anterior.
".=: ".*(nC}(sumejor respuesta a las expectativas de l()s empresarios, tal
como se indica en (23.8». .. ',.' "; . . .
2.4 Juegos dinámicos con infoIDlación completa pero imperfecta
Supongamo~que los empresarios mantienen la eXpectativa ".e = O
en el primer periodo. Dada la estrategia de los empresarios (es decir,
2.4.A Representación de los juegos en fonna extensiva
la forma en que los empresarios actualizan sus expectativas después de
obse~a~ el nivel verdadero de inflación), la autoridad monet~riapuede
En el capítulo 1 estudiamos juegos estáticos representándolos en forma
restrmg¡r su atención a dos decisiones: (1)". =: O, lo que conducirá a
normaL Analizamos ahora juegos dinámicos representándolos en forma
ne = Oe~periodo siguiente y, por tanto, a la misma decisión por. parte de
extensiva.19 Este enfoque expositivo puede hacer que parezca que los
la autondad monetaria en el siguiente periodo; y (2) n = ".*(0)utilizando
(2.3.8),10 que conducirá a".e en lo su~esi~o,'en cuyo caso la autoridad =".. juegos ~státicos tienen que representarse en fo~a nom:al y los juegos
dinámicos en forma extensiva, pero esto no es asI. CualqUJer Juego puede
monetaria encontrará que es óptimo en lo sucesivo escoger n =: ". •. En
representarse tanto en forma normal como extensiva, aunque para algu-
con~ecuen~ia, fijar". =: Oen este periodo resulta en la ganancia W(O,O) por
p~n~do, mIentras que fijar" =: ".*(0)eneste periodo resulta en la ganancia
W (". (O),O)eneste periodo, pero W(". .,".) en lo sucesivo. Parlo tanto, la 19 Damos una descripción ü;'formaJ de la forma extensiva; p'ara un tratamienTo preciso
est:rategia de la autoridad monetaria es la mejor respuesta consúltese Kreps y Wilson (1982).
116/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos dinámicos con información completa pero imperfecta / 117

nos juegos una de las dos formas es más apropiada que la otra. Vamos a Este árbol empieza con un nodo de decisión correspondiente al jugador
ver cómo los juegos estáticos pueden representarse utilizando la forma ex- 1, donde 1 escoge entre 1 y D. Si el jugador 1 escoge 1,se llega a un nodo
tensiva y cómo los juegos dinámicos pueden ser representados utilizando de decisión del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,
la forma normal. si el jugador 1 escoge D, se llega a otro nodo de decisión del jugador 2,
Recordemos de la sección l.1.A que la representación en forma normal donde 2 escoge entre l' y D'. Después de cada una de las decisiones de
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles 2 se llega a un nodo terminal (es decir, el juego termina) y se reciben las
de cada jugador y (3) las ganancias recibidas por cada jugador para cada gan¡mc;iasindicadas ..
combinación de estrategias posibles. Es inmediato extender el árbol de la figura 2.4.1 para representar
cualquier juego dinámiCo con información completa y perfecta, es decir,
Definición. La representación en fanna extensiva de un juego exige preci~ar: cualquier juego en el queros jugadores toman sus decisiones uno después
(1) los jugadores, (2a) cuándo tiene que jugar cada jtigador,(2b) lo qt{e cada del otro, todas las decisiones previas son información del dominio público
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada antes de realizar el siguiente movirnientoy las ganancias a los jugadores
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida con cada combinación factible ,de decisiones son información del domi-
por cada jugador para cada combinación posible de jugadas. nio público. (Los espacios. de-acciones continuos, como en el modelo de
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos 5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,
analizado varios j~egos representados en forma extensiva. La contri- presentan dificultades gráficas pero no conceptuales) Deriva~os segui-
bución de esta sección consi~te elldescribir estos juegos en forma deárbol d¡mWl1teJareprese~tfición.en forma ,normal del juego:de la figura 2.4.1.
en vez de utiliZár' palabr~s, porqtie el uso deárbo~es,.~ menudo'facilita C:0l1clpimospOI\últiIIÍ.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!á~cosc
tanto la explicaci6n co~o el análisis. ' .. , .> .,. - ' .. Plledel1represerÚarse enfofI!la extensiva y descnbiend() cómo represen~ .
Como ejemplo de un juego en formaextensiva, consideremóseI si- tar en formaext~nsiva l()s juegos dinámicos con información ~9rnpleta
glliente representante dé la clase de juegos en dos etapas 'con información pero imperfecta.
completa y perfecta presentada en la sección 2.1.A: Tal como parecen indicar las convenciones sobre nmneración ~l~)as
definiciones de las-formas no,rmaly extensiva, existe una íntiIna relaC;ión
1. El jugador 1 escoge una acción al del conjunto factible Al = {J,D}.
entre las estrategias f¡;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~
2. El jugador 2 observa al y escoge entonces una acción a2 del conjunto
nornal y la descripcipl1 de cu'ándo dec.ide un jugadorrcqu~'p:ll.~doe'):¡a<;£ú
,42 = {J',D'}.
qp.ésabe(apartados 2ª,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.tiñ
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el árbol de
juego dinámico en forma normal, necesitamos.h"aducirJ~Wof!!laciónen:
la figura 2.4.1.
forma e?'tensiva en términos de la descripción del espacio de estrategías'
<.. 2,') de cada jugador en la fórma~normal. Para hacer esto, recordemos la
definición de estrategia dada (formalmente) en la sección 2.3.B:

Definición. Una estrategia de un jugador es un plan de acción completo, es


decir, e~pecifica una acción factible de/jugador en cada contingenCia en la que al
jugador le pudiera corresponder actuar.
l'
-.'
Ganancia al jugador 1: 2 o . Puede parecer innecesario exigir que la estrategia de un jugador es-
Ganancia al jugador 2: 1 O
-p~tmque una acción factible, para cada contingencia en la que al juga-
db~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no
Figura 2.4.1 . ,poarí¡¡qlOs aplicar lanocióri de equilibrio de Nash a los juegos dinámicos
118/ JUEGOS DINÁMICOS CON INFORMACfÓN COMPLETA (c. 2)
Juegos dinámicos COI! informaciá,¡ comFleta Fero imFerfecta / 119
con información completa si permitiéramos que las estrategias de un ju-
, ., forma extensiva. Denominemos las filas de la forma normal
gador ~epran sin especificar sus acciones en algunas contingencias. Para entaClonen . I d
sd aCuerd oc on las estrategias factibles del Jugador 1 y las ca umnas e
que el Jugador j calcule una mejor respuesta a la estrategia del jugador i,
puede que j necesite considerar cómo,actuaría i en todas y cada una de las, ' e d o con las estrategias factibles del jugador.. 2, y calculemos las gana 11-
euer
contingencias, no sólo en las contingencias que i o j creen que es posible' ~aoo 1 J'ugadores
a. ' en cada combinación posIble de estrategIas, " como se
~~~. . dica en la figura 2.4.2.
111 Una vez mostrado que un juego dinámico puede rep~esentars: .en
En el juego de la figura 2.4.1, el jugador 2 puede tomar dos acciones, ,'c:
pero ppsee cuatro estrategias, puesto que hay dos contingencias diferentes' formano,rmal pasemos, seguidamente a demostrar cómo un Juego , estatIco
(concretamente, después de observar que el jugador 1 ~scoge Iy después ' . de
(es d eClr, , decisiones simultáneas)
' puede representarse
., en
'. forma , exten-
de observar que el jugador 1 escoge D) en las que podría corresponder siva. Para ello, nos basamos len la observaoon hecha en la sec~IOn ] .l.A
actuar al jugador 2. ,_. -.e., . '" ", , (en conex¡'o'ncon el dilema de los presos) de que , no es necesano que los .
, 'dores actúen simultáneamente: es suficiente con que cada uno escoJa
'. ~'
¡ugaestrateoia sin conocer la decisión del otro, como sería el caso en el
,!strategial: Si el jugador 1 juega [,entonces jugar!'; si el jugado~l una o~ d .. Id
Juega D, entonces jugar !', 10que denotamos por (JI,!'). , dilema de los presos silos presos tomaran sus eC¡SlO~eSen cea: :epa-
.. radas. Por tanto, podemos representar un juego de (d¡gamos) deosJOnes
, o.'. ,!strategia 2: Si el jugador 1 juega 1, entonces jugar 11; si el jugador 1
, Juega D, entonces jugar DI, 1() que denotamos por (JI,DI). simultáneas entre los jugadores 1 y 2 como sigue:
o,!strategiíl3: Si el jugador 1juega!, entonces jugar DI; si el jugador T
Juega D, entoncesjugar !', lo que denotamos por (DI,!I). , 1. El jugador 1 escoge una acción al del conjunto factible Al'
2. El jugador 2 no observa la decisión del jugador 1, pero escoge una
''!strategía 4: Si elJugador 1 juegaI, Emtonce~jugar DI; si el jugador 1
Juega D,entonces jugar DI; lo que denotamos por (DI,DI). acción az del conjunto factible Az-
3. Las ganancias son tI'l (aj,az) y uz(al,az).
~l jugad~r 1, sin embargo, tiene dos acciones pero sólo dos estrategias:
Alternativamente, el jugador 2 podría jugar primero y el jugador 1 podría
Jugar 1 yJugar D. La razó~ por la cual el jugador 1sólo tiene dos estrategias
decidir sin obervar la acción de 2. Recordemos que en la sección 2.1.B
:s que solo hay una contingencia en la que pudiera torresponder jugar al
demostramos que un juego consiste en escoger cantidades con esta f.or111a
Jugador 1 (concretamente, la primera jugada, que corresponde al jugador
temporal y estructUra informativa difiere significativa,mente del J~Jego
1), de.forma que el espacio de estrategias del jugador1 es equivalente al
espacIO de acciones Al == {1,D}. ,. . de Stackelberg, que tiene la misma forma temporal pero, una estructura
informativa taL quedacempresa 2 observa la decisión de la empresa ?_
Jugador 2 Hemos visto que el juego de decisiones sucesivas y ac~ón del contrano
no observada tiene el mismo equilibrio de Nash que el Juego de COUlnot
(JI,!') (J';DI) (DI,!') (DI,DI)
de decisión simultánea.
1 3,1 3,1 1,2 1,2 Para represen:tar este tipo de ignorancia sobre los mo~i~ientos ante-
Jugador 1 "
',---.../
/
riores en un juego en forma extensiva, introducimos la nOC1On de conjunto
D 2,1 0,0 2,1 0,0
de información de un jugador.
')
"",.;

Figura 2.4.2
Defuliciónó Un conju~to de itlfonnación de un jugador es una colección de
nodos de decisió~ que satisface:
.Dados estos espacios dl7estrategias de los dos jugadores, eSÍnil1ediató
",.,' denvar la representación ,en forma normal del juego a partir de surepre- W al jugador le corresponde jugar ett-cada nodo del conjunto de informacióny.
(ii) cuarido en el transcu'rso del juego se llega a 11/1 nodo del conjunto de 111fOl-
¿
120/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos dinámicos con información completa pero imperfecta / 121

mación, el jugador al que le corresponde decidir no sabe a qué nodo dentro del Como segundo ejemplo del uso de un conjunto de información para
conjunto de infonnación se ha (o no se ha) llegado. representar la ignorancia de las jugadas anteriores, consideremos el si-
guiente juego dinámico con información completa pero imperfecta:
La parte (ii) de esta definición significa que, en un conjunto de información,
el jugador debe tener el mismo conjunto de acciones factibles en cada nodo
de decisión; en caso contrario el jugador seria capaz de inferir a partir del 1. El jugador 1 escoge una acción al del conjunto factible Al = {l,D}.,
conjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s) 2. El jugador 2 observa al y escoge a continuación una acción a2 del
nodo(s). conjunto factible A2 = {J',D'}.
3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuación
Preso 1
una acción a3 del conjunto factible A3 = {I",D"}. -1

La representación en forma extensiva de este juego (ignoramos las ganan-


cias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;
el jugador 3 tiene dos conjuntos de información: uno con un único ele-
mento que sigue a D por parte del jugador 1 y DI por parte del jugador
2 y otro con más de un elemento que incluye los demás nodos en los que
le corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3
observa es si (al,a2) = {D,D'} o no ..

4 o 5 1 1 D
4 5 O 1 ':."'

Figura 2.4.3

3
En un juego el! forma extensiva, indicaremos que una colección de
nodos de decisióneonstituye un-conjunto de información con una línea
discontinua, como en la representación en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qué jugador- le corres-
ponde mover en los nodos del conjunto de información por medio de una
Figura 2.4.4
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la línea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretación del conjunto de información del preso 2 en la fi- Ahora que hemos definido la noción de conjunto de información, po-
gura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe demos ofrecer una definición alternativa de la distinción entre información
es que se ha llegado al conjunto de información (es decir, que el preso 1 perfecta e imperfecta. Definimos previamente la información perfecta di-
ha decidido), pero no a qué nodo se ha llegado (es decir, lo que ha hecho). ciendo que en cada jugada, el jugador al que le corresponde jugar conoce
Veremos en el capítulo 4 que el preso 2 puede tener una opinión de lo que toda la historia del juego hasta ese momento. Una definición equivalente
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta es que cada conjunto de información contiene un único elemento: Por
cuestión hasta entonces. el contrario, la información imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2) Juegos dinlÍmicos COI1infonl1nóón completa pero imperfecto / 123

cO~j~ntode informaci~n con má~ de un elemento,19Por tanto, la represen- (a) empieza en un nodo de decisión n que sea un conjunto de información con 1111
t~ClQnen forma extensiva de un Juego de decisiones simultáneas (como el único elemento (pero que no sea el primer nodo de decisión del juego),
~lle~a de l~s presos) es un juego con información imperfecta. De forma (b) incluye todos los nodos de decisión y terminales que siguen a n en el árbol
~lml1ar, l~: J~egos en dos etapas estudiados en la sección 2.2.A poseen. (pero no los nodos que no siguen a n) y
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son (e) no intersecta a ningún conjunto de información (es decir, si 1m nodo de
slmultaneas~ como también lo son las decisiones de los jug~dofes 3 y 4.. decisión n' sigue a n en el árbol, todos los otros nodos en el conjunto de
?e forma mas general, un juego dinámico con información co'mpleta pero información que contiene a n' deben también seguir a -n y, por tanto, deben
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos incluirse en el subjuego).
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la Debido al comentario entre paréntesis de la parte (a), no contamos el
figura 2.4.4. ." .... ,_. ..", .... ", "
juego completo como un subjuego, pero esto es sólo una cuestión de
" .: '. -- ". - ~
.
estiló: eliirtinar ese comentario entre paréntesis de la definición no tendría
2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~" ningúri efecto.
~ '-..:. Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
En la secció~ 2.3.B di~ós la définición generalder'eqtiilibriOdé~~shper: ~.". de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definición. En la
fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6í:lsóloa jueg(Js' . figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
repetido~ porque defimmos' los conceptos de estrategia' ysubjuego sólo' . decisión del jugador 2. En el dilema de los presos (o cualquier otro juego
para los Juego~repetidos. En la secCión2AA dimos la.definición gene" de decisión simultánea) no hay subjuegos. Para ilustrar la parte (c) de la
ral de ,estrategIa. Presentamos ahora la definieióngeneral de subjuego, definición', consideremos el juego de la figura 2.4.4. Sólo hay un subjuego,
despues de lo cual podremos aplicar la definición de equilibrio de Nash el que empieza en el nodo de decisión del jugador 3 que sigue a D por
perfecto en subjuegos a los juegos dinahúcos con inforinación completa parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
en general. este juego ningún subjuego empieza en ninguno de los nodos de decisión
del jugador 2, aun cuando estos dos nodos son conjuntos de información
, Recordemos que en la sección 2.3.Bdefinimos inforinalmertte un sub-
jue.go como la parte del ju~g,?que'q\teda'pórjugatecipeZáIldbeit cual- . de un único elemento.. .
"Vná trtanera de motivar la parte (c) consiste en áfumar que queremos
qUl~r momento en el que lá.~~storia éOrripletadeljuego has~a eritonces
poder ari~liiar ili1subju~gcipor sí mismo y que qti~rem6s que el a'náiisi's
sea mfo~~.c!6n deldoiriinióp~b~C~ entretbdosiosjugádor~tydiinós
un~ defimclOn formal en el caso de los juegos répetidos,que"eht6nces searei~vaiít~pai~el juego completo. En la figura 2.4.4, si intentáramos
definir un:'subjuego que empezara en el nodo de decisión del jugador 2
~stabam~s, co~sideran.do',Ofrecemos ahora una. definicióh fdrmál' para
Juegos dmarrucos con mformación completa en genera], en téI111iri6sdé la qué sigue a la decisión I del jugador 1, estaríamos creando un subjuego en
representación e.nforma extensiva del juego. el que el jugador 3 ignora la decisión del jugador 2 pero conoce la deeislón
del jugador.1. Tal subjuego no sería relevante para el juego completo
porque en ~ste lÍltimó el jugador 3 no conoce la jugadade 1, sino que tan
Definición. Un subjuego en un juego énforina extensiva
-~.--:': sólo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleEÚ-fsimojuego de etapa de 1.111 juego repetido no es en sí mismo
19 . '. ":.~:;C >0 ••••••••

, Est~ ~aracterización de la informaaón perfecta e imperfecta en términos de 20njuntos de un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
informaaon con ~o o más elementos está restringida a los juegos cón info~ació" complet; Otra m'anerade motivar la parte (c) es dándonos cuenta de que la
~~~te, com~.veremos en el c~pítulo,4, la ,repre~:,n;a,~ón.."n fonTlae.x.\é~~~~<'l'd{~ ju~i¿. parte (a) sólo garantiza que el jugador al que le corresponde jugar en el
formaclOn perfecta pero Incompleta tiene un conjunto de informaciÓn cóf(inái; dé' uti .
elemento. En este capítulo, sin embargo, restringimos nuestra atención a la infbrmacióh nodo n conoce la historia completa del juego hasta ese momento, no que
completa. ., los demás jugadores también conozcan la historia. La parte (c) garantiza
12~ / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) JlIegos dinámicos con información completa pero imperfecta / 125

que la historia completa del juego hasta ese momento sea información del Hemos encontrado ya dos ideas íntimamente ligadas al equilibrio de
dominio público en el siguiente sentido: en cualquier nodo que sigue a Nash perfecto en subjuegos: el resultado por inducción hacia atrás defi-
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el nido en la sección 2.1.A y el resultado perfecto en subjuegos definido en
juego llegó al nadan. Por tanto, incluso si ni pertenece a un conjunto de la sección 2.2.A. En términos informales, la diferencia es que un equili-
información con más de un elemento, todos los nodos en ese conjunto de brio es una colección de estrategias (y una estrategia es un plan completo
información siguen a n, de forma que el jugador al que le corresponde de acción), mientras que un resultado describe lo que pasará sólo en las
decidir en ese conjunto de información sabe que el juego ha llegado a un contingencias que se espera que se den, no en cada posible contingencia.
nodo que sigue a n. (Si las dos últimas afirmaciones parecen difíciles es en Para ser más precisos sobre esta diferencia entre equilibrio y resultado, .....
"
parte porque la representación en forma extensiva de un juego especifica y para ilustrar.la noción de equilibrio de Nash perfecto en subjuegos,
lo que el jugadori sabe en cada uno de sus nodos de, decisión, pero no !econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.
hace explícito lo que el jugador i sabe en los nodoséfe decisión de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de Definición. En el juego en dos etapas con información completa y perfecta
cómo podría no cumplirse la parte (c). Podemos ahora reinterpretar este definido en la sección 2.1.A, el resultado por inducción hacia atrás es (aj',R2(aj'»
ejemplo: si caracterizásemos (informalmente)1o que el jugador 3 sabe pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al».
en el nodo de decisión del jugador 2 que sigue a la decisión 1 por parte
del jugador 1, diríamos que 3 no conoce la: historia del juego .hast~ ese .C;.,
En este juego, la acción aj' es una estrategia del jugador 1 porque sólo
momento, ya que 3 tiene otros nodos de decisión en lasque 3no sabe sil -hay una contingencia en la que le puede corresponder actuar, el principio
jugó 1 o D. ~;.
del juego. Sin embargo, del jugador 2, R2 (aj') es una acción (concretamente
Dada la definición general de subjuego, podemos;ahora aplicar la la mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~
definición de equilibrio de Nash perfecto en subjuegosde la sección 2,3.B. gia para el jugador 2 debe especificar la acción que 2 tomará después' de
cualquier posible decisión de 1 en la primera ronda. La función de mejor "
1',.,

Definición. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las respuesta R2(al), por otro lado, es una estrategia del jugador 2. En este
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego. juego, los subjuegos empiezan (y terminan) con el moVimiento del juga-
dor 2 en la segunda etapa. Hay un subjuego para cada acciónfactible,'al
Es inmediato demostrar que cualquier juego dinárrlicü:finito con.infor-
en Al, del jugador L Para demostrar que (aj',R2(al» esUILequilibrio de
mación completa (es decir, cualquier juego dinámico en él q~~ iffi ~&nero
Nash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at»"
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jéné
es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
yen un equilibrio de Nash en cada uno de estos subjuegos ... Como los
mixtas. El argumento procede por: construcción, utilizando un procedi-
subjuegos no son más que problemas de decisión unipersonales, se trata
miento parecido a la inducción hacia atrás, y está basad~. en dos o~stTrva-
de exigir que la decisión del jugador 2 sea óptima en cada subjuego, que
ciones. Primero, aunque presentamos el teorema de Nash en el contexto
es exactamente el problema que la función de mejor respuesta, R2(al),
de juegos estáticos con información completa, éste se extiend~ a'todo
juego finito en forma normal con informaciÓn complef~, y hemos visto
(donde un subjuego es un subjuego menor si na contiene más subjuegos). Sustituyamos
que estos juegos pueden ser estáticos o dinámicos. En segundo lugar, un entonces cada t¡no de estos ~up¡I.l~¡;'?~,!??rl~~ g~~S~!ls.de. uno d~7~ equilibrios de Nash. i"

juego dinámico finito con información completa tiene llÍl nÓínerq)lnito Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales en .'
~.'. '
de subjuegos, cada uno de los cuales cumple las hipótesisdelte~r~riía dé una versión truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores de
Nash.20 . -. - '. este juego truncado que contengan estas nadas' ~e~es Y: sustituyamos cada uno de estos
subjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta forma

:~
hacia atrás a lo largo del árbol, s<;9~tje,'!t¡ur ~qUlli~~o ~e Nash perfecto en sub¡uegos,porque
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos primero las estrategias de los jugadores con~tit;uY~)l, uneqllilibno de Nash (de hecho, un eqUlhbno de
t"dos los subjuegos menores que contienen nodos terminales en el árbol del. juego original Nash perfecto en subjuegosl en cada subjuego.- .
'<.;'
JlIegos di17ál17icos C017 i17forl17aeió17 completa pero imf,,:rfeela /127
126 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

y D (que conduce a una ganancia de 2 por parte del jugador] después


soluciona. Finalmente, (ai,R:z(al)) es un equilibrio de Nash porque las
de que 2 juege 1'). Por tanto, la mejor respuesta de. 1 al comportamiento
estrategias de los jugadores son mejor respuesta la una a la otra: o.i es una
previsto del jugador 2 es jugar D en la primera etapa, de forma que el
mejor respuesta a R2(al), es decir, o.i maximiza 1J,1 (0.1,R2(0.1)), y R2(0.1) es
resultado por inducción hacia atrás del juego es (D,1'), como se indica con
,',una mejor respuesta a ai, es d~dr,R2(ap maximiza ¡do.i ,0.2)'
la trayectoria en negrita que empieza en el nodo de decisión del jugador
Los argumentos son análogos' para los juegos considerados en la
1 en la figura 2.4.5. Hay una trayectoria en negrita adicional que emana
,/,' sección 2.2.A, de forma que nos ahorramos los detalles.
del nodo de decisión del jugador 2 que sigue a la de~isión 1 del jugildor 1.
Esta trayectoria parcial a lo largo del árbol indica que el jugador '2 habría
Definición. En el juego en dos etapas con infonnación'completa pero imperfecta
escogido D' sise hubiera llegado a ese nocla de decisión.
definido en la sección 2.2.A, el resultado perfecto en subjuegos es {o.i ,o.i,0.3 (0.1' o.i),
0.4:(a1,ai)), pero el equilibrio de Nnshperfeeto en subjuegos es (o.i,0.2;0.; (al ,0.2),
'a4:(aT~0.2)).

En este juego, el par de acciones (a3(ai,a2),o,4:(a1,0.2 »


es el equili-
brio de Nash del subjuego que juegan por separado los jugadores 3 y
4 (concretamente, el juego que queda después de que los jugadores 1 y
"'-:,'
~.escogen (ai,ai)), mientras que (aj(aJ,a2},a4:(al,0.i)) es una estrategia del
jugador 3 y una estrategia para el jugador 4, es decir unos planes de.acción
2ompletos que describen una respuesta a cada par de movimientos fac-
Fblesde los jugadores 1 y 2. En este juego, los subjuegos consisten en
3 1 2 o
la interacción en la segunda etapa entre los jugadores 3 y 4, dadas las 2 1 O
1
acciones tomadas por los jugadores 1 y 2 en la primera ronda. Tal y como
exige.el equilibrio de Nash perfectO'en subjuegos, el par de estrategias Figura 2.4.5
(a;(al,aú,a'¡(al,aú) especifica un equilibrio de Nash,en cada uno de esto
subjuegos.
Recordemos que la representación en forma normal de este juego se
'Coriduim~sesta sección (y esté:~apítulo) con un ejemplo que ilustra
dio en la figura 2.4.2. Si hubiéramos encontrado este juego en forma
el tema~principal del capítulo: la perfección en los subjuegos elimina
normal en la sección 1.1.C, habríamos hallado sus equilibrios de Nash
los equilibrios de Nashque.sé basan en'promesas o amenazas que no
(con estrategias puras). Éstos son (D/D',!'» e (!,(D',D')). Podemos
son creíbles. Recordemos el juego en forma extensiva de lá figura 2.4.1.
ahora comparar estos equilibrios de Nash en el juego en forma norIllal de
Si hubiéramos encontrado este juego en la sección 2.1.A, lo habríamos
la figura 2.4.2 con los resultados del procedimiento por inducción hacia
resuelto poririducción hacia atrás del siguíente;nodo: si el jugador 2
atrás en el juego en forma extensiva de la figura 2.4.5: el equilibrio de Nash
alcanza el riada de decisión que sigue a la decisión 1 del jugador 1, la
(D,(D',J')) en la representación en forma normal corresponde a todas las
mejor respuesta de 2 es jugar D' (lo que proporciona una ganancia de 2)
trayectorias en negrita de la figura 2.4.5. En la sección 2.1.A llamamos
en vez de jugar l' (que proporciona tina ganancia de 1). Si 2alcanza el nodo
a (D,J') el resultado por inducción hacia atrás del juego. Sería natural
de decisió.nque sigue alá decisí~nD..del jugador 1, la mejor respuesta de 2
llamar a (D,(D',1') el equilibrio de Nash por inducción hacia atrás del
es jugar l' (lo qué proporciotui\ciéi gahancia de l)'en vez de jugar Di (que
juego, pero utilizaremos una terminología más general y lo lJamaretnos el
proporciona una ganancia de O). Dado que el jugador 1 puede resolver
equilibrio de Nash perfecto en subjuegos. La diferencia entre e1resultado
el problema del jugador 2 tanto como el propio jugador 2, el problema
y el equilibrio es que el resultado sólo especifica la trayectoria en negrita
de 1 ,~I11a prírn~ra nmdas~ c~~Cre.ta en eséoger entré r (que conduce a
que empieza en el primer nodo de decisión del juego y acaba en un nodo
una gananCia. de 1 por parte del jugador 1 después de que 2 juege D')
Lecturas adicionales / 129
128 / JUEGOS DIN.Á.MICOS CON INFORMACIÓN COMPLETA (e. 2)

terminal, mientras que el equilibrio también especifica la trayectoria en es equivalente a forzar al jugador a considerar una posible con~ngencia
negrita adicional que emana del nodo de decisión del jugador 2 que sigue a en la que le correspondería jugar, ya que si en el transcurso del Juego se
la decisión 1del jugador 1. Es decir, el equilibrio especifica una estrategia llega a ese conjunto de información, el jugador no sabe si se ha ~~~ado ~
completa del jugador 2. ese nodo de decisión o no, precisamente porque el nodo de deClslOnesta
contenido eh un conjunto de información con más de un elemento.
Pero, ¿qué pasa con el otro equilibrio de Nash, (/(D',D'»? En este
equilibrio, la estrategia del jugador 2 es jugar D' no sólo si el jugador 1 Una forma de tratar él problema de los conjuntos de información co~
escoge I (como también ocurría en el primer equilibrio) sino también si el más de un elemento cuando se utiliza inducción hacia atrás, es proce'-
der hacia atrás a lo largo de la forma extensiva hasta que se encuentre ::.:',,,
jugador 1 escoge D. Dado que D' (si sigue a D) conduce a una ganancia
de Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte del un conjunto de información con más de un elemento, pero saltándoselo
Jugador 2 es jugar I, consiguiendo con ello una ganancia de 1 (después de y siguiendo haóh arriba"en el árbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.
que el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguaje formación con unúniw elemento. Uegados ahíhabra que consIdera::'.
vago pero sugerente, podría decirse que el jugador 2 está amenazando no sólo lo que el jugador al que le corresponde jugar ené~ecónjUrit'ó"
con jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tiene de información con unúnicQ elemento haría'si sealCanzase:ésé itodó"de
la ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja una decisión, sino también la acción que tomaría el í~ga:dár al que le'córres~
acclOn. SI la tuviera, estaría incluida en la forma extensiva.) Si esta ame- ponde jugar en cada ~o de los conjuntos de informacióIl.c'o~.'~~~~e.~
naza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad de elemento que se han saltadO. "En térininospoco foIirlálés, este procedi~
llevar a cabo su amenaza. Sin embargo, la amenaza no debería funcionar miento proporciona un ~qiiilibrio de NashI'erféctd'en~subjuego~::}:J-:iíá
ya que no es creíble: si al jugador 2 se le diera la oportunidad de llevarl~ segunda manera de tratar el problema 'es proceder' haCi~atrás:<¡Íiló"Ya:rIfó
a cabo (es decir, si el jugador 1 jugara D), 2 decidiría jugar I' antes que D'. de la forma extensiva hasta 'encontrar un conjÜrito'dé-infomúiéioIi:'con ','.'

De un modo más formal, el equilibrio de Nash U,(D',D'» no es perfecto más de un elemento; Forzar entcmces al jugador'alqüe're"corrésp6fiCI~
(: '
en su.bjuegos, porque las estrategias de los jugadores no constituyen un jugar en ese conjunto' de illforma'cióna considerarlo qiieha'riiaellegarsi~
a ese conjunto de inforinádón:(Hacer esto requiere que eljugadot.tengá: .;:'
eqUlhbno de Nash en uno de los subjuegos. En particular, la elección de
D' por parte del jugador 2 no es óptima en el subjuego'que empieza (y una valoración probabilisticá'con reSpecto a:que'nodoseha;lle'g~d~e~:el
acaba) en el nodo de decisión del jugador 2 que sigue a la decisión D del conjunto de información.,Tal~ valoración dependerá Il.a~~eri~é~é,rá~
jugador 1. posibles decisiones de lo~ jugadores 'queestán pór~Círiia'~J:l!.:ékªf:tt~Y.,';g~'~
forma que una pasada de abajo arriba a.la lárgo deláTbol1ÍtiliZáhá:(l~st~:é.; " ,•....
En un juego con información completa y perfecta, la inducción hacia
método no puede proporcionar una solución-),~n.t~os'inf()iin~~I
atr~s elimina las amenazas que no son creíbles. I?ado que cada conjunto ,,'" -,
este procedimiento proporciona un equilibrio bayesiano perfedo.{véáse
de mformación contiene un único elemento, cada nodo de decisión del
árbol representa una contingencia posible en la que podría corresponderle capítulo 4).
actuar a un jugador. El proceso de moverse hacia atrás a lo largo de la
forma extensiva, nodo a nodo, se concreta por tanto en forzar a cada
2.5 Lecturas adicionales
jugador a considerar llevar a cabo todas y cada una de las amenazas que
.•..-•.,
el Jugador pudiera hacer. En un juego con información imperfecta, sin
Sección 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
embargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenal
tación sindical, véase ~ m~d~k, de negociación repetida en.Espinosa y
men~s ~n conjunto de información con más de un elem'ento. Aquí se
Rhee (1989; ejercicio 2,lO}y un'modelo de tina única negociación en el que
podna mtentar el mismo enfoque: proceder hacia atrás a lo largo de la
las empresas pueden escoger negociar sobre salarios y empleo o sólo sobre
forma extensiva y alcanzar eventualmente un nodo de decisión contenido
salarios, en Staiger (199¡), Sobre la negociación sucesiva, véase un modelo
en un conjunto de información con más de un elemento. Pero forzar al
al estilo de Rubinstein de negóciación entre una empresa y un sindicato en
jugador a considerar lo que haría si se llegase a ese nodo de decisión no
Ejercicios / 131
130 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

ingresOs [A e Ip y escoge una herencia,B, que dejar al hijo. La gananciél


Fernández y Glazer (1991), con la característica nueva de que el sindicato
del hijo es UUR + B); la del padre es VUp - 13)+ /,;UUR + B), donde /,;> O
debe decidir si convocar o no una huelga después de que el sindicato o
refleja la preocupación del padre por el bienestar del hijo. Supongamos
la empresa rechacen una oferta. Existen múltiples equilibrios perfectos
que la acción es un número no negativo, A ::::0, que las funciones de
en subjuegos efi~ientes que incorporan, ~ su vez, equilibrios perfectos en
ingreso I H(A) e Ip(A) son estrictamente cóncavas Y tienen un Imíximo
subjuegos ineficientes (es decir, que incluyen huelgas), aun cuañdohaya "
información completa. El libro de Osborney Rubinstein (1990) examina'
en AH > ° Y Ap > ° respectivamente, que la herencia B puede ser
positiva o negativa y que las funciones de utilidad U y V son crecientes
muchos modelos de negociación en teoría de juegos, los relaciona con el
y estrictamente cóncavas. Demuéstrese el teorema del "nif1o mimado":
enfoque axiomático de Nash sobre la negociaci6n y utiliza los modelos de
en el resultado por inducción hacia atrás, el hijo escoge la acción LJue
negociación como base de la teoría del mercad~. ',~
maximiza elingreso agregado de la familia fH(A) + Ip(A), a pesilr de que
Sección 2.2: Sobr~ los pánicos. bancarios, véa~e JaCkJiny ,Bhattacharyá
sólo la función de ganancias del padre es de alguna forma altruista,
(1988). El libro de, McJ\.1illan(1986)e.xámina lé;ls.prjmeré;lsapliciK~Qries-'-
dé teoría de juegos a la economíainternaciolv~i;:véaseuntrabajo'thás
2.2 Supongamos ahora que padre e hijo juegan un juego diferente, ana-
rec~ente sobre la deuda exterior en Bu19W..y Rogóff(1989) .. Sobre los
lizado originalmente por Buchanan (1975). Los ingresos IH e Ip están
torneos, consúltese un modelo en el qué lbs trabajadores pueden tanto
fijados exógenamente. Primero, el hijo decide qué parte del ingreso If{
",
aumentar su producción como sabotear la de los demás, en Lazéar (1989;
.',.-. ahorrará (S) para el futuro, consumiendo el resto UR - S) hoy. En se-
ejerc~cio2.8). Véaseen Rosen (1986) el tem.ade los premios necesarios
gundo lugar, el padre observa la elección de S por parte del hijo y es-
paraIT)antener los incentivos en Una,sucesi8n de torneos en los' que los
coge una herencia, B. La ganancia del hijo es la suma de las utilidades
perdedores en una etapa no pasan a la siguiente. .
presente y futura: Ul UR - S) + U2(S + B). La ganancia del padre es
Sección 2.3: Benoit y Krishna (1985)analizan juegos repetidos finitos,
V(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones de
Sobre larenegociación en los juegos repetidos finitos, consúltese Benoit
utilidad Ul, U2, y V son crecientes yestrictamente cóncavas. Demuéstrese
y Krishna (1989), y en los juegos repetidos infinitos véase el artículo pa-
que hay un "dilema del samaritano": en el resultado por inducción hacia
norámico de Farrell y Maskin (1989). :Tirole(1988, capítulo 6) examina
atrás, el hijo ahorra demasiado poco, para inducir al padre a dejarle una
modelos dinámicos de oligopolio. El libro de Akerlof y Yellen (1986) re-
herencia mayor (es decir, tanto las ganancias del padre corno las del hijo
coge algunos de los tra~ajos más importantes sobre salarios de eficiencia
podrían aumentar si S fuera convenientemente más alto y B convenien-
y ófrece una introducción integradora. Sobre política monetaria, véase
temente más bajo).
en Ball (1990) un resumen de los hechos estilizados, una revisión de los
modelos existentes y un modelo que explica la trayectoria temporal de la
2.3 Supongamos que los jugadores en el juego de la negociación con ho-
inflación.
rizonte infinito de Rubinsteintienen factores de descuento diferentes: 81
Sección 2.4: Véase un tratamiento formal de los juegos en forma exten-
corresponde al jugador 1 y {j2 al jugador 2. Adóptese el argumento dado
siva en Kreps y Wilson (1982), y un enfoque más verbal en Kreps (1990,
en el texto para demostrar que en el resultado por inducción hacia atrás,
capítulo 11).
el jugador 1 ofrece el acuerdo

2.6 Ejercicios

2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,


anahzado originalmente por Becker (1974). Primero el hijo toma una al jugador 2, quien lo acepta.
acción, A, que.resulta en un ingreso para él, IR (A), yen un ingreso para
2.4 A dos socios les gustaría completar un proyecto. Cada socio recibe la
el padre;Jp(A). (Pensemos en I H(A) corno el ingreso dél hijo, neto de
ganancia V una vez el proyecto ha sido completado, pero ninguno de ellos
cualquier coste de, la acciÓn A.) En segundo lugar, el padre óbservá los
132/ JUEGOSDINÁMICOS CON I~JFOR¡\'IACIÓNCOMPLETA (c. 2) Ejercicios I 133

recibe ganancia alguna antes de que el proyecto se haya podido terminar. otro difícil (D), y que la preparación es útil en los dos empleos, pero más
El coste que queda hasta que el proyecto se complete es R. Ninguno de . en el difícil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
los socios puede comprometerse a hacer aportaciones futuras de cara a produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
completar el proyecto, de forma que deciden establecer el siguiente juego preparación de j (~ O o S). Supongamos que la empresa puede compro-
de dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de cara meterse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
a completar el proyecto. Si esta contribución es suficiente para completar ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
el proyecto, el juego se acaba y cada socio recibe V. Si esta contribución no del trabajador, que normalizamos a cero.
es suficiente para completar el proyecto (es decir, Cl < R), en el periodo El desarrollo temporal del juego es el siguiente: En el momento O la
2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto. empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~-
Si la suma (sin descontar) de las dos contribuciones es suficiente para mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
completar el proyecto, el juego acaba y cada socio recibe V. Si la suma el nivel de preparación S a un coste C. (Ignoramos laproducción'y los
es insuficiente para completar el juego, éste termina y ningún socio recibe salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
nada. aún la preparación, lo eficiente es que se le asigne el trabajo E.) Suponga-
Cada socio debe obtener el dinero con el que contribuye a financiar mos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
el proyecto de otras actividades lucrativas. La forma óptima de hacerlo la preparación. En el momento 2 la empresa observa si el trabajador ha
es sacar primero dinero de las alternativas menos rentables. El coste (de adquirido o no la preparación y decide entonces si concederle el ascenso
oportunidad) que resulta de una contribución es, por tanto, convexo con al trabajo D o no durante el segundo (y último) periodo de empleo qel
respecto al tamaño de la contribución. Supongamos que el coste de una trabajador.. "".':-
contribución e es e2para cada socio. Supongamos que el socio 1 descuenta Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
los beneficios del segundo periodo de acuerdo con el factor de descuento donde el trabajador realiza el trabajo 'i y tiene un nivel de preparación j.
5. Calcúlese el único resultado por inducción hacia atrás de este juego La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
de contribuciones de dos periodos para cada trío de parámetros (V,R,5); es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
véase el caso con horizonte infinito en Admati y Perry (1991). primer periodo. Hállese el resultado por inducción hacia atrás, Véase un
modelo más complejo en Prendergast (1992).
2.5 Supongamos que una empresa quiere que un trabajador adquiera !.:::' .
0'- .~.

la preparación necesaria para desarrollar una determinada tarea, pero 2.6 Tres oligopolistas operan en un mercado con una demanda inversa
dicha tarea eS tan inconcreta que ningún tribunal podría verificar si el dada por P(Q) = a - Q, donde Q = ql + q2 + q3 Y qj es la cantidad producida:.
trabajador ha adquirido o no la preparación necesaria. (Por ejemplo, por la empresa j. Cada empresa tiene un coste margipal de producción
la empresa podría pedir al trabajador que se familiarizase con "nuestra constante, e, sin costes fijos. Las empresas escogen sus cantidades de la
forma de h¡lCerlas cosas", o se hiciera un experto en "este nuevo mercado siguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3
en el que podríamos entrar".) La empresa,. por tanto, no puede firmar observanql y escogen entonces simultáneamente q2 y q3 respectivamente.
un contrato para reembolsar al trabajador el coste de esta preparación: ¿Cuál es el resultado perfecto en subjuegos?
incluso si el trabajador adquiere esta preparación, la empresa puede decir
que el trabajador no lo ha hecho, y ningún tribunal podría decidir quién 2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerza
tiene razón. Del mismo modo, el trabajador no puede firmar un contrato de trabajo de todas las empresas de un oligopolio, comO el. Sindicato
para adquirir esta preparación si se le ha pagado por adelantado. .Unido de Trabajadores del Automóvil en el caso de la General Motors,
La empresa podría utilizar, como incentivo para que el trabajador Ford, Chrysler y otras. Sea la sucesión temporal de las jugadas análog~ al
adquiera la preparación, promesas (creíbles) de ascenso de la siguiente modelo de la sección 2.1.C: (1) el sindicato realiza una demanda salanal,
forma. Supongamos que hay dos trabajos en la empresa, uno fácil (E) y "", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las
¡
ti:! I
134 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Eje,.cici()~ / 135

ganancias del sindicato escogen simultáneamente los niveles de empleo, resultado perfecto en subjuegos. Demuéstrese que los salarios, nivel de
.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa empleo y beneficios (y, por tanto, también la utilidad del sindicalo y el
es el salario que los miembros del sindicato podrían ganar en un empleo excedente del consumidor) aumentan cuando los aranceles desapilrecen.
alternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas, Véase otros ejemplos en la misma línea, en Huizinga (1989).
y los beneficios de la empresa i son i(w,Lí). A continuación se describen
. losdeterminantes de los beneficios de dicha empresa: todas las empresas 2.10 El juego de decisión simultánea que a continuación se describe se
..tienen la siguiente función de producción: el nivel de producción es igual juega dos veces, habiéndose observado el resultado de la primera etapa
al nivel de empleo; qí = Lí. El precio de equilibrio es P(Q) = Q, - Q antes de que empiece la segunda. No hay descuento. La variable T
cuando la cantidad agregada en el mercado es Q = q] + ... ' + qn. Para no es mayor que 4, de forma que (4, 4) no es una ganancia de equilibrio
complicar las cosas, supongamos que las empresas no tienen más costes del juego jugado una sola vez. ¿Para qué valores de x es la siguiente
que los salariales. ¿Cuál es el resultado petfeéto en subjuegos de este estrategia (jugada por ambos jugadores) un equilibrio de Nash perfecto
juego? ¿Cómo (y por qué) afecta el mimero de empresas a la utilidad del ensubjuegos?
sindicato en el resultado perfectb ..en subjuegos?
Jugar Qí en la primera etapa. Si el resultado de la primera etapa es
(Ql,Q2), jugar Pí en la segunda etapa. Si el resultado de la primera
2.8 Modifiquemos el modelo de torneos dé la sección 2.2.D de forma
.que la producción del trabajadori sea Yí == eí -'- (1/2)8j +Eí, donde Sj 2': ° etapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si el
resultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si en
representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo la segunda etapa. Si el resultado de la primera etapa es (y,z)donde
(productivo y destructivo) del jugador i es g(eí) + g(8í), como en Lazear
y =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.
(1989). Demúéstrese que elpremio óptimo WA -W13 es menor que cuando
no hay posibilidad de sabotaje (como en el texto).

2,2 x,O -1,0 0,0


2.9 Consideremos dos países. En la fec;l1a1, ambos países tienen aranceles
.tan altos que no hay comercio entre ellos. Dentro de cada país, los salarios O,x 4,4 -1,0 0,0
y el nivel de empleo se determinan como en el modelo de monopolio y 0,0 0,0 0,2 0,0
sindicato de la sección 2.l.C. En la fecha 2, todos los aranceles desaparecen, 0, -1 0, -1 -1, -1 2,0
ahora cada sindicato fija el salario en su país, pero cada empresa produce
para los dos mercados. 2.11 El juego de decisión simultánea que a continuación se describe se
Supongamos que en cada país la demanda inversa es P(Q) = Q, - Q, juega dos veces, habiéndose observado el resultado de la primera etapa
donde Q es la cantidad agregada en el mercado de ese país. Sea q = L la antes de que empiece la segunda. No hay descuento. ¿Puede alcanzarse
función de producción de cada empresa, de forma que los sálariosson el en la primera etapa la ganancia (4,4) en un equilibrio de Nash perfecto en
único coste dela empresa, y sea U(w,L) = (w -wo)L la funci6n de utilidad subjuegos con estrategias puras? En caso afirmativo, especifíquense las
del sindicato, donde 71Jo es un salario alternativo para los trabajadores. estrategias que lo pem1Íten. En caso negativo, demuéstrese por qué no.
Calcúlese el resultado por inducción hacia atrás en la fecha l.
Considérese ahora el siguiente juego en la fecha 2. Primero, los dos 1 e D
.".,;.,' sindicatos escogen simultáneamente los salarios, 1J)] y 1J)2. Las empresas
A 3,1 0,0 5,0
observan los salarios y escogen los niveles de producción para los mer-
cados interior y exterior, que denotamos mediante hí y eí en el caso de lvI 2,1 1,2 3,1
la empresa del país i. Toda la producción de la empresa se realiza en B 1,2 0,1 4,4
su propio país, de fo.rma que el coste total es Vií(hí + eí). Calcúlese el
136 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA Ce. 2) Ejercicios I 137

2.12 ¿Qué es una estrategia en un juego repetido? ¿Qué es un subjuego en producción de monopolio, ¿cuál es el equilibrio de Nash perfecto en sub-
un juego repetido? ¿Qu¿ es un equilibrio de Nash perfecto en subjuegos? juegos simétrico más rentable al que puede llegarse utilizando estrategias
del disparador?
2.13 Recuérdese el modelo de duopolio de Bertrand estático (con pro-
j'.'

duetos homogéneos) del ejercicio 1.7: las empresas fijan los precios si- 2.16 En el modelo de salarios y nivel de empleo analizado en la sección
multáneamente; la demanda del producto de la empresa i es a - Pi si 2.1.C, el resultado por inducción hacia atrás no es socialmente eficiente.
Pi < Pj, es Osi Pi > Pj y es (a - p¡)/2 si Pi = Pj; los costes marginales son En la práctica, sin embargo, una empresa y un sindicato negocian hoy los
e < a:-Considérese el juego repetido infinitamente basado en este juego términos de un contrato por tres años, renegocian al cabo de tres años
de etapa. Demuéstrese que las empresas pueden utilizar estrategias del los términos de un segundo contrato y así sucesivamente. Por tanto, esta
disparador (que significan jugar para siempre el equilibrio de Nash del . relación se puede caracterizar con más o menos exactitud como un juego
juego de etapa después de cualquier desviación) para mantener--~lnivel repetido, como en Espinosa y Rhee (989)..,-'-"
de precios de monopolio de un equilibrio de Nashperfecto en subjuegos' En este problem~ se denvan condiciones bajo las cuales un eqUilibrio
si ys~lo si O ~ 1/2.' _ de Nash perfecto en subjUegos dél juego repetido infinitamente es superior:
en el, sentido de Paretoal resultado por inducción hacia atrás del juego
2.14 Supongamos que léldemanda fluctúa de formélaleatoria en el juego jugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidad
de Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada del sindicato y los beneficios de la empresa en el resultado por inducción
.periodo, el punto de interacción de la fu~ciónde dema;nda con el eje de hacia atrás del juego jugado una sola vez. Consideremos un par utilidad"-, ,
abcisas es aA. con probabilidad 'Ir.y aB « aA) co~ probabilidad 1 -::'Ir; las beneficio alternativo (U,'Ir) asociado con un par salariá-empleo alteíriatlvó :
demandas en los diferentes perlados son indep~nciientes. Supongamos (w,L). Supongamos que ambas partes tienen elmisinofador de descu~ií.to:
que en cada periodo el nivel de demanda es revelado a ambas empresas O (para cada periodo de tres años). Derívense condiciones sobre (w,L)
antes de que éstas escojan los precios de ese periodo. ¿Cuáles son los tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)
niveles de precios de monopolio (P.4 y PB) para los dos niveles de de- sea el resultado de un equilibrio de Nash perfecto en subjuegos del juego
manda? Calcúlese 0*, el fi1enor valorde 8 tal que las empresas pueden repetido infinitamente, donde se juega (U* ,'Ir*) para siempre después de
utilizar estrategias del disparador para mantener estos niveles de precios cualquier desviación. '.- -~
de monopolio (es decir, jugar Pi cuando la demanda es aú para i = A,E) '':'''. ":/."

en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de O 2.17 Consideremos el siguiente juego con horizonte infinIto entre una
entre 1í2 y 0* hállese el precio máximo p(o) tal que las empresas puedan única empresa y una sucesión de trabajadores, cada uno de los cuales vive
utilizar estrategias del disparador para mantener el precio p(o) cuando la durante un periodo del juego. En cada periodo, el trabajador decide. sí
demanda es alta y el precio P B cuando la demanda es baja en lln equilibrio esforzarse y producir por tanto a un nivel y con un coste por elesfuerzo
de Nash perfecto en subjuegos. (Véase Rotemburg y Saloner 1986.) de c, o no esforzarse, no producir nada y no incurrir en ningún coste. Lo
que se produzca es propiedad de la empresa, peto ésta puede compartirlo
2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. La con el trabajador pagándole un salario como se describe a continuación:
demanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,.. supongamos que al principio del periodo el trabajador dispone de una
Consideremos el juego repetido infinitamente basado en este juego de oportunidad alternativa con un valor de cero (neto del coste por el es-
etapa. ¿Cuál es el valor menor de -O tal que las empresas pueden utilizar fuerzo) y que no se puede obligar al trabajador a aceptar un salario por
estrategias del disparador para mantener el nivel de producción de mo- debajo de cero. Supongamos también que y > c de forma que esforzarse
nopolio en un equilibrio de Nash perfecto en subjuegos? ¿Cómo varía la es eficiente.
respuesta al cambiar -n? ¿Por qué? Si (j es demasiado pequeño para que Dentro de cada periodo, el desarrollo temporal es el siguiente: pri-
las empresas utilicen estrategias del disparador para mantener el nivel de mero el trabajador escoge un nivel de esfuerzo, a continuación tanto la (;::-:-'

:~
138 / JUEGOS OlNÁMICOS CON INFORMACIÓN COMPLETA (c. 2) Refrrencias /\39

empresa corno el trabajador observan el nivel de producción y finalmente de Nash en estrategias puras? ¿Cuál es el resultado por inducción hacia
la empresa escoge un salario para pagar al trabajador. Supongamos que , 7 'Cuál es el equilibrio deNash perfecto en subJuegos?
atraso ¿
no existe manera de hacer cumplIr los contratos salariales: no hay nin-
guna restricción sobre la elección del salario por parte de la empresa. 2.22Proporciónense las representaciones en for~~ae;xtensiva y,nonnal del
En el juego de un periodo, sin embargo, perfección en subjuegos implica . d 1 pánico bancario discutido en la seCCIOn2.2.B. ¿Cuales son Jos
que la empresa ofrecerá un salario de cero produzca lo que produzca e! Juego e .. 7
equilibrios de Nash perfectos en subjuegos en estrategIas puras.
trabajador, de forma que el trabajador no se esforzará.
Consideremos ahora el problema con horizonte infinito. Recordemos
2.23Un comprador y un vendedor desearían realizar un intercambio. An-
que cada trabajador vive sólo por un periodo. Supongamos, sin embargo,
tes de hacerlo, el comprador puede efectuar una inversión que aumenta
que al principio del periodo t, la historia del juego hasta el periodo t - 1 es
el valor que asigna al objeto a intercanlbiar. Esta inversión no pued: ser
conocida por el trabajador que trabajará eh el periodo t. (Pensemos como'
observada por el comprador y no afecta el valor que el vendedor aSIgna
si esta información.setransrnitiese de generación a generación entre los
al objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.
trabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdo
empresa que compra otra. En algún momento antes de la [uslon, el com-
con el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:
prador podría haber actuado en el sentido de cambiar los productos que
la empresa y de cada trabajador en un equilibrio perfecto en subjuegos
su empresa planea introducir en el mercado de forma que se complemen~
del juego cOllhorizonte infinito en las que en equilibrio cada trabajador
ten después de la fusión con los productos de la ~mpr~sa comprada. SI
se esfuerza y produce por tanto a un niyely, siempre y cuando el factor
el desarrollo de un producto lleva tiempo y el CIclovItal del producto
de descuento sea lo suficientemente alto. Dése una condición necesaria y
es corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~o
suficiente para ,que su equilibrio exista.
esta inversión después de la fusión.) Para el comprador el valor IIllClal
del objeto es v > O; una inversión de 1 aumenta est~ v~lor a '/)+ 1, ?ero
2.18 ¿Qué es una estrategia (en un juego arbitrario)? ¿Qué es un conjunto cuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmer
de información? ¿Qué es unsubjuego (eh un juego arbitrario)?
lugar, el comprador escoge un nivel de inversión 1e incurre en el cosle
12, En segundo lugar, el comprador no observa 1pero ofrece vender el
2.19En la versión de tres periodos del modelo de la negociación de Rubins- objeto por un precio p. En tercer lugar, el comprador a~epta o rechaza la
tein analizada en la sección 2.1.D, calculamos el resultado por inducción oferta del vendedor: si el comprador acepta, la ganancIa del comprador
hacia atrás. ¿Cuál es el equilibrio de Nash perfecto en subjuegos? es v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, é~tas
ganancias son _12 y cero respectivamente. Demuéstrese que .no eXIste
2.20 Consideremos las siguientes estrategias.en la versión de horizonte ningún equilibrio de Nash perfecto en subjuegos con estrate?las puras
infinito del modelo de la negociación de Rubinstein. (Recordemos la en este juego. Calcúlese el equilibrio de Nash perfecto en SUbJ1,legos. con
convención notacional de que la oferta (s,1 - s) significa que 'el jugador 1 estrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna
obtendrá s y el jugador 2 obtendrá 1 - s, independientemente de quien . probabilidad positiva a dos niveles de inversión y la e~trategla mIxta del
haga la oferta.) Sea s. = 1/(1 + ó). El jugador 1 siempre ofrece (s" ,1 - s.) vendedor sólo asigna probabilidad positiva a dos precIOS.
y acepta una oferta (s,l - s) sólo si s ~ ós •. El jugador 2 siempre ofrece
(1 - s. ,s*) y acepta una oferta (.s,l - s) sólo si 1 - s ~ 5s.: Demuéstrese
que estas estrategias son un equilibrio de Nash. Demuéstrese que este
equilibrio es perfecto en subjuegos.
2.7 Referencias

2.21 Proporciónense las representaciones en forma extensiva y normal del ABREU, D. 1986. "Extremal Equilibria of Oligopolistic Supergames." JOlll'1wl
juego de la granada descrito en la sección 2.1. ¿Cuáles son los equilibrios of Economic Theory 39:191-225.

".Ij
"'",'
140/ JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)
Referencias / 141

-. 1988. "On the Theory of lnfinitely Repeated Carnes with Discounting." FRIEDMAN, J. 1971. "A Non-cooperative Equilibrium for Supergames."
Ecollometrica 56:383-96.
Review o/ Economic Studies 38:1-12.
ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal Cartel Equilipria
FUDENBERG,D., Y E. MASKIN. 1986. 'The Folk Theorem in Repeated Carnes
with Imperfect Monitoring." ¡oumal o/ Economic Theonj 39:251-69.
with Discounting and Incomplete Inforrnation." Econometrica 54:533c54.
ADMATI, A., Y M. PERRY. 1991. "JointProjects without Commitment."
CREEN, E., YR. PORTER. 1984. "Noncooperative Collusion Under Irnperfect
Review o/ Economic 5tudies 58:259-76.
Pricelnformation," Econometrica 52:87-100.
AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the Labor 1;;
. ~,.
HUIZINGA, H. 1989. "Union Wage Bargaining and Industry Structure."
Market. Cambridge, Inglaterra: Cambridge University Press.
Stanford University, Mirneo.
BALL, L. 1990. "Tirne-Consistent Policyand Persistent Changes in In-
Hation." National Bureau of Econornic R.esearch Working Paper #3529 JACKLIN, c., y S. BHATTACHARYA. 1988. "DistinguishingPanics and In':
(Decernber). - formation~based Bank Runs: yYelfare and Policy Implications." ¡oumal of .
Political Economy 96:568~92.
BARRO, E., Y D. CORDON. 1983. "Rules, Discretion, and Reputation in a
Model of Monetary.Policy." ¡oumal of Monetanj Economics 12:101-21. KREPS, D. 1990. A Course in Microeconomie Theory. Princeton, NJ: Princeton
University Press.
BECKER, G. 1974. "A Theory of Social Interactions." ¡oumal of Political
Economy 82:1063-93. KREPS, D., Y R. WILSON. 1982. "Sequential Equilibrium:." Eeonometne~
. .' ~; :L'.iC,;
50:863-94.. .:/
BENOIT, J-P., y V Krishna. 1985. "Finitely Repeated Carnes." Econometrica
53:905-22. LAZEAR, E. i989. "Pay Equality and Industrial Politics." ¡oumal of Politieal
Eeonomy 97:561-80.
-. 1989. "Renegotiation in Finitely Repeated Carnes." Harvard Business
School Working Paper #89-004. . LAZEAR, E., Y S. ROSEN. 1981. "Rank-Order Tournarnents as Optimum:
Labor Contracts." ¡oumal of Politieal Eeonomy 89:841-64.
BUCHANAN, J. 1975. "The Sarnaritan'sDilernrna." In Altruism, Morality,
and Economic Theonj, E. Phelps, ed. New York: Russell Sage Foundation. LEONTIEF, W. 1946. "The Pure Theory of the Cuaranteed Annual Wage
Contract." ¡oumal of Political Eeonomy 54:76-79.
BULOW, J., y K. ROGOFF. 1989. "Sovereign Debt: Is to Forgive to Forget?"
American Economic Review 79:43- 50.
McMn:.LAN, J. 1986. Carne Theory in International Economies. ChUT, Suiza:
D[AMOND, D., Y P. DYBVIG. 1983. "Bank Runs, Deposit Insurance, and Harwood Acadernic Publishers.
Liquidity." ¡oumal of Political Economy 91:401~19.
OsBORNE, M., Y A. RUBINSTEIN. 1990. Bargaining and Markets. San Diego:
ESPJNOSA, M., y C. RHEE. 1989. "Efficient Wage Bargaining as a Repeated Acadernic Press.
Came." Quarterly ¡oumal o/ Economics104:565-88.
PRENDERGAST, e 1992. "The Role of Prornotíon in Inducing Specific Hu-
FARRELL,J., y E. MAsKIN. 1989. "Renegotiation in Repeated Carnes." Carnes man Capital Acquisition." De próxima aparición en Quarterly ¡oumal o/
¡¡lid t'conomic Behavior 1:327-60. Eeonomies.

FERNÁNDEZ, R., Y J. CLAZER. 1991. "Striking for a Bargain Between Two ROSEN, 5.1986. "Prizes and Incentives in Elimination Tournaments.'~ Ame-
Completely Informed Agents." American Economic Review 81:240-52. rican Economie Review 76:701-15.
142 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

ROTEMBERG, J., y G. SALONER.1986. "A Supergame-Theoretic Model of


Busmess Cycles and Price Wars during Booms." American Economic Review
3. JUEGOS ESTÁTICOS
76:390-407.
CON INFORMACIÓN INCOMPLETA
RUB~STEJ.¡'\I,A. 1982. "Perfect Equilibrium in a Bargaining Model." Econo-
metrzca 50:97-109.

..
, ,'
,~:;
.~ ~i~TEN,R. 1965. "S~i~~~he~retis.che. Behandlung eines Oligopolmodells
24. Nachfragetraghelt. Zeltslzcrift für Gesamte Staatswissenschaft 121:301-
Con este capítulo comienza nuestro estudio de los juegos con ill!0r1110ÓÓIl
SHA~~D,.A., ~ J. SurrON. 1984. "Involuntary Unemployment as a Perfect incompleta, también llamados juegos bayesianos .. Recordemos que en un
Equzh?numm ~ Bargaining Model." Econometrica 52:1351-64. juego con infoIDlación completa las funciones de ganancias de. los juga~
dores son información del dominio público. Por el contrario, en un juego
S~IRO,C., yJ.'STIGLITZ.1984. "Equilibrium Unemployrnent as a D' '-
con información incompleta, al menos un jugador no está'seguro de la
plme Device." American Economic Review 74:433-44. ISCl
función de ganancias de otro jugador. Un ejemplo común de un juego
7 L y J. T~HASHI. 1983. "A MultistageModel
SOB _L, of Bargainin ." estático con información incompleta es una subasta de sobre cerrado:
Remew of Economlc Studies 50:411-26. g cada participante conoce su propia valoración del bien subastado, pero no
conoce las valoraciones de los otros participantes, y las pujas se entreg¡m
H. VON. 1934.. Marktform und Gleú:hgewicht.
STA~:I<ELBERG, Viena: Julius
en sobres cerrados, por lo que las decisiones de los jugadores pueden con-
Spnnger.
siderarse simultáneas. Sin embargo, la mayoría de los juegos bayesianos
STAIGER~D. 1991. "Why Do Union Contracts Exclude Employment?" Stan- con interés económico son dinámicos. Como veremos en el capítuJo,4,
ford Uruversity, Mimeo. la existencia de información privada conduce de forma natural a que las
partes informadas intenten comunicar (o a confundirlos), y que las par-
TIROLE,J. 1988. The Theory o/ Industrial Organization. C
Press. ambridge: MIT tes no informadas intenten conseguir información. Estas cuestiones son
intrínsecamente
.
dinámicas. '
En la sección 3.1, definimos la representación en forma normal de
un juego bayesiano estático y el equ.i1ib'nóbayesiano de Nash en dicil~
juego. Puesto que estas definiciones son abstractas y algo complejas,
introduciremos las ideas principales con un ejemplo sencillo, el de l~
.{,;',
competencia a la Cournot bajo información asimétrica.
En la sección 3.2 consideramos tres aplicaciones. En priiller lugar,
ofrecemos una discusión formal de la interpretación de las estrategias
mixtas dada en el capítulo 1: la estrategia mixta del jugador .i representa
la incertidumbre del jugador i con respecto a la estrategia pura que eligirá
j, y la elección de j depende de una cierta información privada. En
segundo lugar, analizamos una suba sta "de sobre cerrado en la que las
valoraciones de los participantes son información privada, mientras que
la valoración del vendedor es conocida. Finalmente, consideramos el
caso en el que un comprador y un vendedor tienen, cada UIlO de ellos,
información privada sobre sus valoraciones (como cuando una empresa
14.1/ JUEGOS EST..\TICOS CON INFOR,"IACláN INCOMPLETA (e. 3)
Teorla: ¡llegas bayesianos estáticos y equilibrio bayesimlO de Nash / 145
conoce el producto marginal de un trabajador y el trabajador conoce las
De modo similar, si el coste de la empresa 2 es bajo, q';(cB) será la solución
oporl1midades alternativas de que dispone). Analizamos un juego de
de
intercambio llamado subasta doble: el vendedor anuncia un precio de
venta y el comprador anuncia simultáneamente un precio de compra;
el intercambio tiene lugar al precio medio si el último es mayor que el
max[(a - qi - q2) - cBlq2'
q2
primero.
Finalmente, la empresa 1 sabe que el coste de la empresa 2 es alto con
En la sección 3.3 enunciamos y demostramos el Principio de revelación, probabilidad B y debería prever que la cantidad elegida por la empresa 2
e indicamos brevemente cómo puede aplicarse al diseño de juegos cuando será qi(CA) o qi(CB), dependiendo del coste de esta empresa. Por taJ;lto,la
los jugadores tienen información privada. empresa 1 elige qi que resuelve

3.1 Teoría: Juegos bayesianos estáticos y equilibrio bayesiano maxB [(a -, ql - qi(cA») ~ 'cJ ql + (l - B) [(a -ql - qi(CB») - c] ql
de Nash q¡

3.1.A Un ejemplo: para maximizar el beneficio esperado. . , .,


Competencia a la Cournot bajo información asimétrica Las condiciones de primer orden de estos problemas de optinuzaclOn .,"
L•...

son

Consideremos un modelo de duopolio de COlirnot con demanda inversa • a - qi - CA

dada por P(Q) = a - Q, donde Q = ql + q2 es la cantidad agregada en q2(CA) - 2


el mercado. La función de costes de la empresa 1 es CI (ql) = cql. Sin - a- qi - CB
qi(c~) -2
embargo, la función de costes de la empresa 2 es C2(q2) = crlq2 con proba-
bilidad f) y C2(q2) = CM2 con probabilidad 1- B, donde CB < CA. Además, y
la información es asimétrica: la empresa 2 conoce su función de costes y
la de la empresa 1, pero la empresa 1 sólo conoce su función de costes y • B [a - qi(cA) - c] + (l - B)-[a - qi(CB) ~c]
ql = - 2 '
que el coste marginal de la empresa 2 es CA con probabilidad e y CB con
probabilidad 1- e. (La empresa 2 podría ser nueva en el sector o haber de- Supongamos que estas condiciones de primeror.den caracteriz~i~iso-
sarrolJado una nueva tecnología.) Todo esto es información del dominio luciones de los problemas de 'optimización anterióres, '\Recotdem:~s.~el
público: la empresa 1sabe que la empresa 2 cuenta con mejoiinformación, ejercicio 1.6 que, en un duopolio de Coumot .C?-!1 ~oI1llación.co.~gl~ta, "
1• .:.::-

y la empresa 2 sabe que la empresa 110 sabe, y así sucesivamente. si los costes de las empresásson lo'suficientemente diferentes entre sí, la
(
Naturalmente, la empresa 2 querrá elegir una cantidad diferente (y empresa con el coste alto no produce nada en-equilibÍio. Corno ejeicíoo, "-'.-

presumiblemente menor) si su coste marginal es alto que si es bajo. Por hállese una condición suficiente para excluir aquí problemas análogos.)
su parte, la empresa 1 debería prever que la empresa 2 puede ajustar Las soluciones a las tres condiciones de primer orden son
su cantidad al coste de la manera indicada. Sean qi(CA) y qi(CB) las
cantidades elegidas en función de sus costes, y sea qi la cantidad elegida
por la empresa 1. Si el coste de la empresa 2 es alto, ésta elegirá qi(cA) tal
que sea una solución de
y
max[(a
q2
- qi - q2) - cAlq2- a - 2c +BCA + (l - B)cB
qi =- 3
.
Teoria: Juegos bayesw,lO s estlÍticos y eqllilib,'io bayesiallo de Nosl, ! 147
146/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)

(.., 'bl es fun.,dones de ganancias de .¡, /),;(0.], ... ,0,,,; /,,),'


Comparemos q2:(CA), q2:(CB) y qj con el equilibrio de Cournot con Sean la POSI
¡ugad ores. , 'd' pertenece a un conjunto de tlPOSPOS1-
información completa y costes el y ez, Suponiendo que los valores de et y . !ttpO del Juga or 1" que . .
donde tí es e '1 esponde a una de las fUllcJOlles
Cz son tales que ambas cantidades de equilibrio son positivas, la empresa . es aGiode tipos) 7';. Célda tIpO 'i corr ,
i produce q¡ = (a - 2Ci + cj)/3, en este caso con información completa, Por bies (o PI' ador i podna tener.
de ganancias diferente que e Jug ~os que el J'ugador i tiene dos posi-
el contrario, en el caso con información incompleta, q2:(cA) es mayor gue , plo abstracto, supongar. . ,
Como eJem 'D" s en este caso que el jugador'/. tlene
(a - 2CA + c)/3 y qi(CE) es menor que (a - 2CB + c)/3, Esto ocurre porque la f 'ones de gananCIas. ]namo . . J }
empresa 2 no sólo ajusta su cantidada su coste, sino que también respohde .bies unCI 's t. Y h que e espaCIO
l' de tipos del J'ugador '1 es Ti = l.til,liz
. )
dos hpO, ,1 '~d ias del jugador i son 11,i(al,' .. ,0,,,, til Y
al hecho de que la empresa 1 no puede hacerlo. Por ejemplo, si el coste
Yque las dos funcpIOndesoesgua:::r la idea de que cada uno de los tipo.s
de la empresa 2 es alto, ésta produce menos porque su costE4'esalto, pero ( a 't-z) o em "d 1 f nciones de gananCIas . d'fJ 'eren t e
tii al,' , ., "", '
por otro lado produce más porque sabe que la empresa 1 producirá una 1' dar corresponde a una e as u
d.e Juga . , 1fin de representar'. laposibilidad de que
cantidad que maximice su beneficio esperado y qué, por ello, es menor 1, ador podna tener, con e . .
delo que produciría sisupierá que ~l cbstede la empresa 2 es alto, (Una . que d' e ¡ug
ador puede tener 1 eren . d'f tes conJ'untos de acciones factibles, como 1
ca a Jug , " . S s por eJ'emplo, que el conjunto } ee
caraé:terísticade este ejemplo que puede prestarse a confusión, es que qi es . os a contmuaCIOn, upongamo,
vereID. factibles del Juga , d ar t. es {b} con probabilidad q y {o"b,c con
exactamenteigliala las cantidades deC:ournot espetadas que la empresa 1 a, (
aCCIOnes d afirmar que i tiene dos tipos ti1
produciría en los'dos juegos correspondientes con información completa. bTd dI - Entonces po emos ,
Esto no es cierto normalmente; consideremos por ejemplo el caso en el proba 11 a a r~babi1idad de til es q) y podemos decir que el conjunto
cual el coste total de
la empresa i es cíq'f) ~:i~C:i:~: ~ac~bles de i es {a,b,c} para amb~s tipos, pero hacer que la
. d d 1 gir c sea -00 para el tlpO til'
. , .
-
ganancia de,nva l~ :á: ;oncreto consideremos el juego de Cournot de la
3.1.B Representación en forma nlirmal de los juegos bayesianos p
Como e¡em . Las aCCIones
, , nterior 'd' e 1a s empresas son sus decisiones sobre
estáticos
secclOn a 'L 2 tiene dos posibles funciones de costes
las cantidades ql y qZ' a empresa .
y, por ello, dos posibles funciones de beneficios o gananCIas:
Recordemos que la representación en fOI1Jlanormal de un juego con infor-
mación completa de n jugadores es G = {SI' , , . ,S~; u], ' , .• 11,n}, donde Sí es
'1rZ('1l,'1Z; cn) = [(a - '11 - qz) - CE) qZ
el espacio de estrategias del jugador i y 11,í(Sl, ,., ,sn) es laganancia al juga-
dor i cuando los jugadores éligen ras estrategias (S], ~.: ,~~),'SÚ~ e~~~rgo, y
como discutimos en la sección 2,3,13" en un juego dé decisión siíriúitánea
con información completa, para un jugador una estra~egia ~~s{mplemente 1rZ(ql,qZ; CA) = [(a, - '11 - '1z) - CA) '12
una acción, por laque podemos escribir G'; {Al .... ~,A~;11,],... 'Un}'
La empresa 1 sólo tie~e una función de ganancias posible:
donde Ai es el espacio de acciones dei y 1Li(a], .. , ,an) es la ganancia
del jugador i cuando lo,sjugadores eligen las acciones (a]" , "an), Para
'1rl(ql,Qz;C) = [(a - ql - '1z) - e) ql
preparar nuestra descripción del desarrollo temporal de un juego estático
con información incompleta,describimos la secuencia temporal de un juego Podemos deCIr . que e 1 espaCIO
'de tipos . de" la empresa 2 es Tz = {CB,CA} y
estático con información completa del siguiente'modo: (1) ios jugadores qué el espacio de tipos de la empresa 1 es 7] = {c}', l' d
toman simultáneam:ente sus decisiones (el jugador i elige del conjuntoa; '"
Da d a esta d e fimCIOn del.' tipo de un jugador, decrr '1 que e ' Juga~' or
factible Aí), y luego (2) reciben las ganancias 11,i(a], ' , . ,an). ,. .-' .-';, d"e gananCIas
1 conoce su fuhcIOn
'es equivalente " a deCIr que e Jugalor /.
" '. , d ..decir que el Jugador '1, puede no estar
Ahora queremos representar en forma normal un juego dé decisión si- conoce su tIpo, Del rmsmo mo o, , I t .
multánea con información incompleta, también llamado juego bayesiano seguro d e las fuh'CIonesed ganancI'as . de otros J'ugadores es
. equwa ene d
estático, El primer paso consiste en representar la Idea de que cadajuga- a decir que puede no estar ' seguro. de los tipos de otros Jugadores, , r, e-I
""-
notados por t-í = (t],., . ,/i_l,t,+l". t ). Utilizamos T-i para mucar e
dar conoce su función de ganancias, pero puede no conocer las de otros .. , 'n
148/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)
Teoría: Juegos bayesianos estáticos y equilibrio bayesiano de Nash / 149

conjunto de todos los posibles valores de Lú y utilizamos la distribución


con información imperfecta queremos decir (como en el capítulo 2) que en
de probabilidad Pi(LtlU para designar la conjetura sobre los tipos de los
alguna ronda del juego el jugador al que le corresponde decidir no conoce
otros jugadores, L¡, dado el conocimiento del jugador i de su tipo ti. En
la historia completa del desarrollo anterior del juego. Aquí, como el azar
cada aplicación analizada en la sección 3.2 (yen la mayor parte de la
revela el tipo del jugador i al jugadori pero no al jugador j en el paso
literatura), los tipos de los jugadores son independientes, en cuyo caso
(2),el jugador j no conoce la historia completa del juego cuando toma sus
p¡(LtlU no depende de t'i, por lo que podemos escribir la conjetura del.
decisiones en el paso (3).
jugador i como Pi(Li). Sin embargo, hay contextos en los que los tipos
Necesitamos tratar otras dos cuestiones algo más técnicas para com-
de los jugadores están correlacionados, por lo que deberemos tenerlo en
pletar la discusión sobre la representación en forma normal de los juegos
cuenta en nuestra definición de juego bayesiano estático, escribiendo la
bayesianos estáticos. En primer lugar, existen juegos en los cuales el ju-
conjetura del jugador i como Pi(Ltlt;).1
gador i tiene información privada no sólo sobre su propia función de
Uniendo los nuevos conceptos de tipos y conjeturas con los elementos
gananci¡¡.s,sino también sobre la función de ganancias de otro jugador.
ya familiares de la representación en forma normal de un juego estático
Por ejemplo, en el ejercicio 3.2, cambiamos la información asimétrica del
con información completa, obtenemos la representación en forma normal
modelo de Coumot de lasecéión, 3.1.A de manera que los costes son
de un juego estático bayesiano.
simétricos y del dominio público, pero una empresa conoce el nivel de
demanda y la otra no. Puesto que el nivel de demanda afecta lasfun~
Definición. La representación ell ¡onll a 110m/al deun juego bayesiano estático
ciones de ganancias de ambos jugadores, el tipo de la empresa informada
de JI jugadores exige concretar los espacios de acciones de los jugadores Al, ... ,An,
aparece en la función de ganancias de la empresa no informada. En el caso
sus espacios de tipos T1, ... ,Tn, sus conjeturas PI/"',Pn y sus fUnciones de
de 1'1 jugadores, capturamos esta posibilidad permitiendo que la ganancia
ganancias ul, ... ,un. El tipo del jugador i, tú es collocido sólo por el jugador
del jugador i dependa no sólo de las acciones (al,'.' ,an), sino
i, detennina la función de ganancias del jugador i, 'U¡(al, ... ,an; ti), y es un
también de todos los tipos (tl, ... ,tn). Escribimos esta ganancia como
elemento del conjunto de tipos posibles T;. La cOlljetura del jugador i, Pi(L¡ Iti),
ui(at, ... ,an;tl, o ••• ,tn).
describe la incertidumbre de i respecto a los posibles tipos de 'los otros 1'1 - 1
La segunda cuestión técnica se refiere a las conjeturas Pi(Ltlti). Su-
jugadores, Lú dado el propio tipo de i, ti. Denotamos este juego como G
pOl\emos que es del dominio público que en el paso (1) del desarrollo
{Al,'" ,An;TI, ... ,Tn;PI,'" ,p,,;lL], ... ¡Un}.
temporal del juego estático bayesiano, el azar escoge un vector de, ,tipos
t = (tI, ... ,tn) de acuerdo con la distribución a priori de probabilidad p(t\
Siguiendo a Harsanyi (1967), suponemos que el desarrollo temporal
de un juego bayesiano estático es la siguiente: (1) el azar determina un
Cuando el azar revela ti al jugador i, éste puede calcular laconjel:tii- a, "
Pi(Lilti) utilizando la regla de Bayes:2'
vector de tipos t = (tI,' .. ,tn), donde ti se obtiene del conjunto de tipos
posibles Ti; (2) el azar revela ti al jugador i, pero a ningún otro jugador; (3) p(L;,ti) p(L;,ti)
los jugadores toman sus decisiones simultáneamente; el jugador i elige ai Pi(Li Iti) = P(ti) ¿: p(L;,ti) .
del conjunto factible A¡, y (4) se recibt;.nlas ganancias 'ui(a¡, ... ,an; ti). Con t_iET_i

la introducción ficticia del azar en (1) y (2), hemos descrito un juego con Además, los otros jugadores pueden calcular las distintas conjeturas que
información incompleta como un juego con información imperfecta, donde podría, formarse el jugador -i, dependiendo del tipo de i, concretame,nte
'1 Imaginemos que dos empresas están compitiendo por desarrollar una nueva'tecnologia.
2 La regla de Bayes es una fórmula para calcular P(AiB), la probablIidad (condidomida)
La posibilidad de éxito de cada empresa depende en parte de la dificultad en desarrollar la '
de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,El
tecnología, dificultad que es desconocida, Cada empresa sólo sabe si lo ha logrado o no, pero
las prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podido
no si la otra Jo ha conseguido. Sin embargo, si la empresa 1 ha tenido éxito; es más probable
ocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. La
que la tecnologia sea fádl de desarrollar y, por ello, también más probable que la' empresa 2
regla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicional
la haya desarrollado. Por lo tanto, la conjetura de la empresa 1 sobre el tipo de la empresa 2
d", que se dé /1es igual a la probabilidad de que se den tanto A como B, dividida por. la
depende del conocimiento por parte de la empresa 1 de su propio tipo.
pr~babilida'd a pri9ri de que ocurra B.
Teoria: Juegos bayesimws estáticos y eq¡lÍlibrio bayesúllIo de Nasl¡ / 151
150/ JUEGOS ESTt\TICOS CON INFORMACiÓN INCOMPLETA (c. 3)

/. Después de todo, una vez el azar ha elegido un tipo particular y se


Pi(Lilti) para cada ti en Ti' Como ya indicamos, vamos a suponer a
lo ha revelado a un jugador, puede parecer que el jugador no necesita
menudo que los tipos de los jugadores son independientes, en cuyo caso.
p;(Li) no depende de ti, pero se obtiene a partir de la distribución a priori
preocuparse por las acciones que podría haber tomado de haber salido
p(t). En este caso, los otros jugadores conocen la conjetura de i sobre sus
elegido otro tipo. Sin embargo, el jugadori necesita tener en cuenta lo que
harán los otros jugadores, y lo que harán depende de lo que piensen que
.,
"

tipos.
hará el jugador 'i para cada ti en Ti. Por 10 tanto, para decidir qué hacer
una v~i que un tipo ha sido elegido, el jugador i tendrá que pensar qué
3.1.C Definición del equilibrio bayesiano deNash
habría hecho vara cada otro tipo de Ti que podría haber sido elegido.
Consideremos, por ejemplo, el juego de Coumot con información
Ahora queremos definir el concepto de equilibrio de los juegos bayesiano~,
asimétrica de la sección 3.1.A. Argumentamos allí que la solución del juego
estáticos. Para ello, necesitarí1osd~finir primero los espacios de estrategias,
tonsiSté enlaelección de tres cantidades: qi(CA), qi(cs) y qj .En términos
de los jugadores en dicho juegó.~Retordemos de las setciones2.3.By:'
dél;:¡ defiJ:lidÓnde estrategia q~e acabani.ós de dar;ét'par (q~(cA),qi(cB»
2AB qtle la estrategia de unjtigadot'esun pÍartde acción completo, que; 1
esla estrategia de la empresa 2 y qj es la estrategia dedá,'empresa 1. Es
establece una accióh factible para cadá contihgenciaenla que el jugadót ¡".'~
fácilimagihar que la empresa2 elegirá dif~rentes c~tidaél~s' dependietlqÓ
podría tener que actuar: Dada la sécuencia temporal del juego estático ,¡
de su coste. Sin embargo, es igualmel1te importante darse c~enta de qDe
, ~ayesiáno<en ehual el azar comienza el juego eligiendo los tipos ¥~
los>':
li elecdón de la cantidad de la emp~és~í debería tener en cuenta quej~
Jugadores, una estrategi'a (pura)deljugadór i debe establecer una acci6i{ ,
. cantidad de la empresa 2 dependerá "üel coste de la empresa 2. PoP 16
posible para cadáunO de los tipos posibles del jugador i. ", i.
tanto, si nuestro concepto de equilibrio es requerir que la estrategiá"J~
-.-"{' ..~: . ,t '~' .. ,' .' :~' -
la empresa 1 sea tma mejor respuesta a la estrategia de la empresa;2;.Ia
DefinidÓri:Enet¡'uegobayesÍlm.iJestáticoG=={AI,:.A'TI
_ . , nI
I ' .. "' T 'PI
nI .".,'
1°."/
estrategia de la empresa 2 debe ser un par de cantidéldes, una para ca9a
P":; Ul~' .. ,U,;}, una'estrategia del jugador i es una funciÓn Si(t;) donde, para posible coste tipo, o si no, la empresa 1 no podría calCUlarsi su estrategia
cada tipo ti en Ti, Si(ti)'determiha la acciÓn del conjunto factible Ai que el tipo ti
es efectivamente una mejor respuesta a la estrategia dela empresa 2., .
elegiría si el azar determinara que el jugador es de este tipo. De forma más general, no podríamos apJicar la noción de equilibrio de
Nash a juegos bayesianos si permitiéramos que la estrategia de un jugadf?r
Al contrario que en lós juégos (tahto estáticos como dinámicos) con nóespedficara lo que el jugador haría si algunos tipós're~ultarap. el~gi40¡;
información completa, en 'un juego bayesiano; los espacios de estrategias por el azar. Este ~rgumento es análogo .~ ~no 'delcapífUl~ 2:' 'pll'ªdk
no se dan en la representaCión 'en forma normal del juego; sino que sé haber parecido Innecesario 'exigir que laestrateiíá derjtig:ádor i el1.t[;4
construyen a partir de los espacios de tipos y acCiones. El conjunto' de juego dinámico con informaciÓn completa especlfic';;;seuna acciÓnf<lctibie
posibles estrategias (puras) del jugador i, Sir es el conjunto de toda,s las para cada contingencia en la cual el jugador i podría haber tenido qúé
funciones posibles con dominio T; y recorrido Ai. Por ejemplo, en una jugar, pero no podríamos haber aplic<ldola noción de equilibrio de Nash
estrategia de separaciÓn, cada tipo ti en Ti elige una acción diferente ai a juegos dinámicos con información completa si hubiéramos permitido
d~ Ai. Por el contrario, en una estrategia de agrupaciÓn, todos los tipos que alguna estrategia dejara sin determinar las acciones del jugador en
elIgen la misma acción. Esta distinei6h entre estrategias de separación y
alguna contingencia.
de agrupación es importante para la discusión de los juegos dinámicos con . Una vez dada la definición de estrategia en un juego bayesiano, abor-
ir;£0rmación incompleta del capítulo 4. Introducimos la distinción aquí damosahora la definición del equilibrio bayesiano de Nash, A pesar d~
solo para ayudar a describir la'grart variedad de estrategias que'pueden la.complejidad notacibrial de la definición; la idea central es simple y fa-
construirse a partir de un determinado par de espacios de tipos y acciones; miliar: la estrategia de cada jDgador debe ser una mejor respuesta a las
TiyAi. _ ",' .
estrategias de los restantes jugadores. Es decir, un equilibrio bayesiaJio,.. '
I)u,~de parecer innecesari~ exigir que la estrategia dél jugador i deter- de Nash es simplemente un equilibrio de Nash en un juego bayesiano.'¡'
mine una acción factible para eada uno de los tipos posibles del jugado~
,'.'. '
152/ JUEGOS EST..i.TICOS CON INFORMACiÓN INCOMPLETA (e 3) Aplicaciones / 153

Definición. En el juego bayesiano estático G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .
)J" ;(¿I, ... ,1¿,,} las
estrategias ,,*= (.~1',... ,"~) forman un equilibrio bayesiano Pat
de Nash (con estrategias puras) si para cada jugador i y para cada uno" de sus Ópera Boxeo
tipos ti en Ti, si (ti) es una solución de
Ópera 2,1 0,0
Chris
Boxeo 0,0 1,2

Es decir, ningún jugador quiere cambiar su estrategia, incluso si el cambio supone


cambiar sólo una acción para un tipo. La batalla de los sexos

Es inmediato dem'ostrar que en un juego bayesiano estático finito (es Ahora supongamos que, aunque se conocen desde hace mucho tiempo,
decir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todos Chris y Pat no están seguros ele las ganancias del otro. En particular.' su-
conjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez con pongamos que: -la ganancia de Chris si ambos van a la óp.era es 2+te, donde
estrategias mixtas. La demostración es muy similar a la de la existencia te es información privada de Chris; la ganancia de Pat SI ambos van al bo-
de un equilibrio de Nash con estrategias mixtas en juegos finitos con xeo es 2 + tp, donde tp es información privada de Pat, y te y tp se obtienen
información completa, por lo que la omitimos. independientemente de una distribución uniforme en [O,;:¡;]. (La elec~ó~.
de una distribución uniforme en [O,x] no es importante; la idea que quere-
3.2 Aplicaciones mos recoger es que los valores te y tp sólo afectan ligeramente a las ganan-
cias en el juego original, para lo cual podernos pensar que x es pequeña.)
3.2.A Revisión de las estrategias mixtas El resto de las ganancias son las mismas. En términos del juego bayesiano
estático abstracto en forma normal G = {Ae,Ap; Te,Tp; Pe,Pp; ue,up} los es-
Como mencionamos en la sección 1.3.A, Harsanyi (1973) interpretó la pacios de acciones son Ae = Ap = {ópera, boxeo}, los espacios de tipos
estrategia mixta del jugador j como la incertidumbre deTjugador i sobre son Te = Tp = [O,x], las conjeturas son Pe(tp) = )Jp(te) = l/~.para cada t~,Y
la estrategia pura elegida 'por el jugador j y que, a su vez; la elección de j tp, Ylas ganancias son las siguientes:
depende de cierta información privada. Ahora damos"i.m\~rúlI1ciádo'más
preciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~ Pat
juego con información completa puede (casi siempre) interpretarse como Ópera Boxeo
un equilibrio bayesiano de Nash con estrategias puras en un juego muy
similar con algo de información incompleta. (No tendrem9sen cuenta los Ópera 2 + te,l 0,0
casos raros en los cuales tal interpretación no es posible.) De un modo más Chris
evocador, la característica crucial de un equilibrio de Nashcori estrategias Boxeo 0,0 1,2 + tp
mixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadór
i no sabe con certeza la elección del jugador j. Esta falta de certeza puede
provenir de algún suceso aleatorio o (más probablemente) de tin poco de La batalla de los sexos con información incompleta
información incompleta, como en el siguiente ejemplo. --
Recordemos que en la batalla de los sexos existen dos equilibrios de Vamos a construir un equilibrio bayesiano de Nash con estrategias
Nash con estrategias puras, (ópera, ópera) y (boxeo, boxeo), y uno con puras de la versión c()n i,nforrnación incompleta de la batalla de l~~ sexos
estrategias mixtas, en el que Chris elige la ópera con probabilidad 2/3 y en el cual Chris elige la ópera si te es mayor que un valor cntico e -y
Pat elige el boxeo con probabilidad 2/3. elige el boxeo en cualquier otro caso, y Pat elige el boxeo si tp es mayor. ""';
.','.
","
Aplicaciones / 155
154/ ]VEGaS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)

que un valor crítico p y elige la ópera en cualquier otro caso. En tal


-3 +)9 +4:¡;
equilibrio, Chris elige la ópera con probabilidad (x - el/x y Pat elige el 1------ "
2:1;
,'.

\.~}
1
boxeo con probabilidad (x - p)/x. Vamos a demostrar que, cuando la
información incompleta desaparece (es decir, cuando x tiende a cero), el que tiende a 2/3 cuando :¡; tiende a cero. Por lo tanto, cuando la infor-
comportamiento de los jugadores en este equilibrio bayesiano de Nash en mación incompleta desaparece, el comportamiento de los jugadores en
estrategias puras tiende a su comportamiento en el equilibrio de Nash con este equilibrio bayesiano de Nash con eslrategias puras del juego con
estrategias mixtas del juego original con información completa. Es decir, información incompleta tiende a su comportamiento en el equilibrio de
tanto (x - el/x y (x - p)/xtienden a 2/3 cuando x tiende a cero. Nash con estrategias mixtas en el juego original con información completa,
Supongamos que Chris y Pat eligen las e;trategias qu~' acabamos de
describir. Para un valor dado de x vamos a determinar los valores de c y 3.2.B Una subasta
p tales que las~str:ategiasf~rm~!} c~~qt4.l,ilJp9 J?~ye~ia,it2,.~eI::f
a,~!t,9ada
la estrategia dé Pat, las gammcias esperadas de Clilis'"á(el~gir la6pera y Consideremos la siguiente subasta de sobre cerrado al primer precio. Hay
el boxeo son' ," ! .,
.d.osparticipantes qué denóminamos i = 1,2. El participante i tiene una
-. . , v~Íorad6n Vi del bien, es decir, si i consigue el bien y paga el precio
E.(2+tc)+
j; " .
[1- E...] .0=~(2:i-.t.c.)',< :'
X" x'
p;la gaiianCia' de i'es v; ~. 'p. Las valoraciones de los dos participantes
iistáfi urtiforÍnementedistribUidas de fotina independiente en [O,1]. Las
y pujas no pUEidenséfnegativas .. Los participantes entregan sus pujas
simultáneamente. La puja más alta gana la subastay el ganador paga el
x
°
E. . + [1 '- E.] . 1 = 1 - E..'
'. x x precio de su puja, mientras que el otro participante no obtiene nada ni paga
respectivamente. Por lo tanto, elegir la óperaes óptiII1;~.
si y sólo ?i nada. En caso de empate, el ganador se determina lanzando una moneda.
Los participantes son neutrales al riesgo. Todo esto es información del
(3.2.1) dominio público.
Para formular este problema como un juego bayesiano estático, debe~
De forma similar, dada la estrategia de Chris,lasg~~ancias~spera1a,s de mas identificar los espacios de acciones, los espacios de tipos, las conje-
Pat por elegir. el boxeo y la ópera son '. ' turas y las funciones de ganancias. La acción del jugador i es entregar
una puja bi (no negativa) y su tipo es su váloraciónvi' (En términos del
C]. e e., .'
juego abstraclo G = {A1,A2;T},1'z;Pl,P2;Ul,U2}' el espacio de acciones es
[ 1-- . O+ -(2 + tp) = -(2 + tp)
x x x Ai ~ [0,00) y el espacio de tipos es Ti = [0,1].) Como las valoraciones son
y . independientes, el jugador i cree que Vj está uniformemente dislribuido
en [0,1], independientemente del 'valor de '1)i' Finalmen.te, la función de
[ ee C]
1-- .1+-.0=1--,
x x x ganancias del jugador i es
respectivamente. Parlo tanto, elegir el boxeo es óptimo si y sólo si si bi > bj,
si bi = bj,
x
tp .;::: ..- :- 3 = p. (3.2,2) si bi < bj.
e
Resolviendo (3.2.1) y (3.2.2) simultáneamente obtenemos p = e y p2 + 3p- Para obtener un equilib~io bayesiano de Nash de este juego comen-
x= O.'Reiolvlendo la ecuaCión de segundo gradase demuestra que la zarnos construyendo los espacios de estrategias de los jugadores. Recor-
probabilidad:deque Chris elija la ópera; concretamente (x ::..c)/x, y la de demos que en un juego bayesiano estático, una estrategia es una función
que Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a. que va de tipos a acciones. Por lo tanto, para el jugador i una estrategia
156/ JUEGOS ESTÁTlCOSCON INFORMACIÓN INCOMPLETA Ce. 3)
Aplicaciones / 157

es una hmción bJv¡) que determina la puja que elegiría cada uno de los 5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo caso
tipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, la bi (V¡) no es lineal, sino plana al principio y con pendiente positiva después.
estrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2) Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,
del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2» centrándonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse en
constituye un equilibrio bayesiano de Nash si, para cada V¡ en [0,1], b;(vi) equilibrio: puesto que es óptimo para un tipo más alto pujar tanto al
es una solución de
menos corno la puja óptima del tipo más bajo, tenemos que Cj 2: O, pero
entonces aj 2: 1 implicaría que bj(Vj) 2: Vj, lo que no puede ser óptimo.
1 Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'
max(v.¡- b¡) Prob{b¡ > bj(vj)} + -(v.¡ - bi) Prob{bi = bj(uj)}.
caso b;(v.¡) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.
~ 2
R9\:h~f\19s.
reRe!ir el D.1ÍSmo análisis para el jugador j suponiendo que el
Simplificamos la exposición buscando un equilibrio lineal: bl (VI) = jugac!9i'iadOpta Iaéstrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,
al + clvl y ~(V2) = a2 + C2V2. Nótese que no estarnos limitando los espacios aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultados
de estrategias delos jugadores para incluir sólo estrategias lineales, sino tenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.
que estamos permitiendo que los jugadores elijan estrategias arbitrarias dijimos antes.
y nos preguntamos si existe un equilibrio lineal. Resulté!;que, puesto que Podríamos preguntarnos si hay otros equilibrios bayesianos de Nash
las valoraciones de los jugadores están uniformemente distribuidas, no en este juego, y también cómo las pujas en equilibrio cambian cuando
sólo existe un equilibrio lineal sino que éste es único (en un sentido que la distribución de las valoraciones de los jugadores cambia. Ningunacie
precisaremos). Veremos que b;(vi) = v;/2. Es decir, cada jugador,entrega estas cuestiones puede resólverse utilG:ando la técnica que acabaiTIosdi
una puja igual a la mitad de su. valoración ... Tal puja refleja el dilema aplicar (proponer estrategias .lineales y después derivar los coeficientes
fundamental al que se enfrenta cualquier participante en una subasta de que l~s cOnvierten enequllibrio). No conduce a niI:guna part~ inte~~..
este tipo: cuanto más alta sea la puja más posibilidades tiene de ganar; taradivinar todas las formas funcionales que podrían tener otros egi1i-
cuanto niás baja sea la puja, mayor será la ganancia si gana. librios de este j~ego, y no existe equilibrio lineal para ninguna otra dis-
Supongamos que el jugador j adopta la estrategia Qj(Vj) = aj + CjVj. tribución de valoraciones. En el apéndice, derivamos un equilibrio baye-
Para un valor dado Vi la mejor respuesta del jugador i es una solución de siano simétrico}. nuevamente para el caso de valoraciones uniformemente
distribuida¡;, Suponiendo _qu~.lasestrategias de los jugadores son estric~
n¡,ax(Vi - b¡) Prob{bi > aj + CjVj}, tamentecrecientes y diferenciables, demostrarnos que el únic,?equilibi;i,~
bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que yaÍ1errÍos' deri~
donde hemos utilizado el hecho de que Prob{bi = bj(vj)} =0 (puesto que vadO. La técnica que utilizarnos puede extenderse fácilmente a una clase
bj(v;)= aj + CjVj y Vj está uniformemente distribuida; también lo está bj). más amplia.de distribuciones de las valoraciones, y también al caso de n
Puesto que no ttene sentido que el jugador .i puje por debajo de la puja participil;ntes.4
mínima del jugador j y sería tonto por parte de ipujar por encima del
máximo del jugador j, tenemos que aj ::; bi ::; aj + Cj, por lo que

P. ro b{b .i > aj +Cjv] } -- p.10 b { Vj bi -


< --- bi - aj
aj } = ---o
Cj Cj 3 Un equilibrio bayesiano de Nash se denomina simétrico si las estrategias de los jugadores
son idénticas. Es decir, en un equilibrio bayesiano de Nash simétrico existe una sola función
Por lo tanto, la mejor respuesta del jugador i es
b(Vi) tal que la estrategia b¡(v¡) del jugador 1 es b(v¡) y la estrategia bz(vz) del jugador 2 es
b(vz), y esta única estrategia es una mejor respuesta a sí misma. Por supuesto, puesto que
si v. > a.JI
l _ las valoraciones de los jugadores serán normalmente diferentes, sus pujas también lo serán,
si Vi <aj. incluso si ambos utilizan la misma estrategia.
4 La omisión de este apéndice no impedirá la comprensión del resto del libro.
AplicacirJlles / 159
.158 I JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (e. 3)

donde k es una constante de,integración. Para eliminar k necesitamos una


Apéndice
condición de frontera. Afortunadamente, un razonamiento económico
simple nos ofrece una: ningún jugador debería pujar por encima de su
Supongam.os queel jugador j adopta la estrategia bO y supongamos que
propia valoración. Por tanto, debe cumplirse que b(Vi) ::; Vi para cada
N.) es estnctamente creciente y diferenciable. Entonces', para un valor
Vi. En particular, debe ocurrir que b(O) ::; O. Puesto que las pujas están
dado de Vi la puja óptima del jugador ies una solución de
restringidas a ser no negativas, esto implica que b(O) = O,Yentonces k = ()
y b(Vi) = v¡f2, como dijimos.
maX(Vi - bi) Prob{bi > b(vj)}.
bi

Sea b-1 (bj) la valoración-que el participante j debe tener para pujar bj; esto 3.2.C Una subasta doble
es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj está uniformemente clistribuida A continuación consideramos el caso en el cual un comprador y un ven-
en [O,ll,Prob{bi > b(1jÚt= Prob{b:2-I(b»> vü= b-1(bi). La condición de dedor tienen cada uno información privada sobre sus valoraciones, como
primer orden.para la opti~zación del probletriadél jugador ies en Chatterjee y Samuelson (1983). (En Hall y Lazear [1984] el compra-
. d' dor es una empresa y el vendedor un trabajador. La empresa conoce el
-b-1(bi) + (Vi ~ bi) db. b-¡(bi) = O. producto marginal del trabajador, y el trabajador conoce sus olras opor-
'1 .; •
tunidades. Véase el ejercicio 3.8.) Analizamos un juego de intercambio
Esta condi<:ió~es unaecÍlaciÓri iJ1pIícita d~ia m~jor~~sp'uesta del jugador
llamado subasta doble. El vendedor anuncia un precio de venta p." y el
ta .la estrategIa b(.) jugada por j dádoqil~ la Véiloracióndei es Vi. Si la ..
compradorsimuItáneamente anuncia un precio de compra p". Si Pb 2: P.,
estrategia bO tiene que ser un equilibrio bayesiano de Nash simétrico, es
el intercambio tiene lugar a un precio Ji = (Pb + Ji,) /2. Si Pb < ]J, no se da
necesario que la soluc_iónala condición de primer orden seab(vi). Es decir,
el intercambio.
para cada una de las posibles valoraciones del pujador 7" éste no quiere
La valoración por parte del comprador del bien del vendedor es /JI,;
desvIarse de laestrategia bOdado que el jugador j utiliza esta est;ate~a.
la del vendedor es v.•. Estas valoraciones son información privada y se
Para imponer este requisito, sustituimos bi b(Vi) en la condición" de
obtienen independientemente de distribuciones uniformes en [O,JI. Si el
primer orden, obtenielldo
comprador obtiene el bien por el precio p, su utilidad es v" - p; si no hélY
intercambio la utilidad del comprador es cero. Si el ,:,:endedor vende el
-b-l(b(~i» +(Vi - b(Vi» d: b-1(b(Vi» = O.
i bien por el precio p, su utilidad es Ji - v.; si no hay intercambio su utilidad
Por supuesto;b-1(b(vi»)'es simplemente v;. Además, d{b-1(/j(Vi»}/dbi =
es cero. (Cada. una de estas funciones de utilidad mide el cambio en la
.'.
'.'
l/b'(vi). Es decir, d{b-1(bi)}/dbi mide cuánto debe cambiar la valoraCión utilidad de cada parte. Si no hay intercambio, no hay cambio en utilidad.
del jugador i para producü: un cambio de una unidad en lapuja, mIentras No cambiaría nada definir, digamos, la utilidad del vendedor como Ji si
que b'(Vi) mide cuánto cambia Ía puja en respuesta a un cambio de u~a hay intercambio a till precio P y v .• si no hay intercambio.)
unidad en la valoración .. Por lo tanto, bO debe satisfacer la ecuación En este juego bayesiano estático, Í1naestrategia del comprador es una
diferencial de primer orden funciónp/,(vb) que determina el precio que el comprador ofrecerá para cada
una de sus posibles valoraciones. Del mismo modo, una estrategia del
1 vendedor es una función p,(v,) que especifique el precio que el vendedor
-Vi + (Vi - b(Vi»-b'( ) = O,
. t'i pedirá para cada una de sus posibles valoraciones. Un par de estrategias
la cual~e expresa de un modo más conveniente como b' (Vi)Vi +b( Vi) = Vi. La {Pb(Vb),p,(V,)} constituye un equilibrio bayesiano de Nash si se cumplen
parte izquierda de esta ecuación diferencial es precisamente d{ b(Vi )Vi} /dVi. las dos condiciones siguientes. Para cada Vb en [O,1], Pb(Vb) es una solución
Integrando ambas partes de la ecuación obtenemos de

1 max Pb [v b - Pb+E[P,(v,)IPb>¡,,(U,)J]
2
Prob{p
.
>p
1) - S
(7) )}
S ,
(3.2.3)
b(v)v'
7. 2 1_ + k ,
t = -'Il
16Ll ! JUEGOS ESTÁTICOS CON INFOI{,'"IAClÓN INCOMPLETA (e. 3)
Aplicaciones! 161

donde E[psCuJlpb 2':f'JuJJ es el precio esperado que pedirá el vendedor, del vendedor es una mejor respuesta a la del comprador, ya que para los
condicionado a que lo que pida sea menor que el precio ]lb ofrecido por el tipos del vendedor que hacen que el intercambio se prefiera a la ausencia
cumprador. Para cada Vs en [0,1], J!s(Vs)es una solución de de intercambio éste ocurre, y viceversa. El argumento análogo demuestra
que la estrategia del comprador es una mejor respuesta a la del vendedor,
por lo que estas estrategias forman un equilibrio bayesiano de Nash. En
(3.2.4) este equilibrio el intercambio se da para los pares (Vs¡Ub) indicados en la
figura 3.2.1; el intercambio sería eficiente para todos los pares (V"Vb) tales
donde E[Pb(Vb)lpb(Vb) 2':PsJ es el precio esperado que ofrecerá el compra- que Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.
dor condicionado a que lo que ofrezca sea mayor que el precio Ps que pide Ahora derivamos un equilibrio bayesiano de Nash lineal de la subasta
el vendedor.
doble. Como en la sección anterior, no restringimos los espacios de estrate-
giasdelos jugadores de nianera que se incluyan solamenre las estrategias
Vb
lin~ales, sino que pennitimos que los jugadores elijan estrategias arbitra-
rias pero nos preguntamos si existe un equilibrio que sea lineal. Existen ,','

<:.
muchos otros equilibrios además de los equilibrios de precio único y el
equilibrio lineal, pero el equilibrio lineal tiene propiedades de eficiencia
Intercamqio interesantes que describiremos más adelante.
x Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs' ;';:
Entonces Ps está uniformemente distribuido en [as,as + cs], por lo que ....
(3.2.3) se convierte en

as + Pb}]
max [Vb - -1 {Pb + .--- Pb - as
---,
Pb 2 2 Cs

cuya condición de primer orden consiste en (

2 1
Pb = 3"Vb + 3"as. (3.2.5)
"-; .:r.,:,,,: •.,;_._~_

Por lo tanto, si el vendedor utiliza una estrategia lineal, la mejor respueSt'á'


x V. del comprador también es lineal. Análogamente, supongamos. qtieJa.
estrategia del comprador es Pb(Vb) = ab + CbVb. Entonces, P~ está üiUforrne.:-
mente distribuido en [ab,ab + Cb], por lo que (3.2.4) se convierte en
Figura 3.2.1
1{ Ps + ab + Cb } ]
Existen muchísimos equilibrios bayesianos de Nash de este juego. max [ -2 Ps + 2 - Vs
. p,

Consideremos, por ejemplo, el siguiente equilibrio de precio único en


cuy? condición de primer orden es
el cual el intercambio ocurre a U!l único precio si es que ocurre. Para
cualquier valor de x en [0,1], sea la estrategia del comprador ofrecer x
P. = ~vs + ~(ab + Cb). (3.2:6)"
si Vb 2': x y ofrecer cero en cualquier otro caso, y sea la estrategia del
vendedor pedir x si Vs ::; x y pedir uno en cualquier otro caso. Dada la Por lo tanto, si el comprador utiliza una estrategia lineal, la mejor respuesta
estrategia del comprador, las posibilidades del vendedor se concretan en del vendedor también es lineal. Si las estrategias lineales de los jugadores
un intercambio a x o en que no haya intercambio, por loque la estrategia han de ser mejores respuestas la una a la otra, (3.2.5) implica que Cb = 2/3
Apl icnCÍollcs / 163
162/ JUEGOS ESTÁTlCOS CON INFORMACIÓN INCOMPLETA (c. 3)

v, v, = v, + 0/4)
y CLb = CLs /3, y (3.2.6) implica que Cs = 2/3 Y as = (ab + Ch) /3. Por lo tanto,
las estrategias de equilibrio lineal son
V,= v,

(3.2.7) Intercambio

2 1
p,,(v.) = 3v., + "4
como muestra la figura 3.2.2.

p"p,

3/4 v,

Figura 3.2.3

Comparemos las figuras 3.2.1 y 3.2.3 (las descripciones de los pares


de valoraciones para los cuales el intercambio aCUITeen los equilibrios
de precio único y simétrico respectivamente). En ambos casos se da el
intercambio posible más valioso (concretamentev. = O Y Vh.,= 1), Pero al
equilibrio de precio únicó le faltanalgunos intercambiosyaliosos (corno
v. == O Y Vh = X - E, dónde E, es pequeño, y logra ,algunos intercambios
que casi no valen nada (como v. = x - E Y Vh = X +.E). Por el contra~io,
1/4 3/4
al equilibrio lineal le faltan todos los intercambios que casi no valen riada
V" Vb
".'
;.¡.J'
"
,
pero logra todos los intercambios de valor al menos 1/4. Esto sugiere
que el equilibrio lineal puede dominar los equilibrios de precio único
Figura 3.2.2
en términos de las ganancias esperadas de los jugadores, pero también
plantea la posibilidad de que los jugadores pudieran estar incluso mejor
Recordemos que el intercambio en ia subasta doble se da si y sólo si
en un equilibrio alternativo.
Ph ~ P •. Manipulando (3.2.7) y (3.2.8) se demuestra que el intercambio
Myerson y Satterthwaite (1983) demuestran que, para distribuciones
ocurre en el equilibrio lineal si y sólo si Vh ~ V. + (1/4), como muestra
uniformes de las valoraciones como las consideradas aquí, el equilibrio
l~ figura 3.2.3. (De acuerdo con esto, la figura 3.2.2 revela que, para los
lineal consigue ganancias esperadas mayores que ningún otro equilibrio
tIpos del vendedor por encima de 3/4, se realizan demandas por encima
bayesiano de Nash en subasta doble (incluyendo equilibrios múltiples).
de la oferta más alta del comprador Pb(l) = 3/4, Yque para los tipos del
Esto significa que no existe un equilibrio bayesiano de Nash en subasta
vendedor por debajo de 1/4 se realizan ofertas por debajo de la oferta más
doble tal que el intercambio ocurra si y sólo si es eficiente (es'decir, si y.sólo
baja del vendedor, P. (O) = 1/4.)
lb4 / JUEGOS ESTÁTICOS CON INFOI<iVIACIÓN INCOMPLETA (e. 3)
El principio de revelación / 165
si /lb 2: ti..). También demuestran que este último resultado es muy general:
o de que éste no siempre vaya a quien puje más alto. Afortunadamente,
SiUb está distribuida de forma continua en [Xb,YbJ y 'u" está distribuida de
el vendedor puede utilizar el principio de revelación para simplificar
forma continua en [:l:s,ys], donde Ys > Xb e Yb > x" no existe ningún juego
considerablemente este problema de dos maneras. En primer lugar, el
de negociación al que quisieran jugar el comprador y el vendedor que
vendedor puede limitar su atención a la siguiente clase de juegos:
tenga un equilibrio bayesiano de Nash en el que el intercambio ocurra si
y sólo si es eficiente. En la próxima sección vamos a indicar cómo puede
utilizarse el principio de revelación para demostrar este resultado general. 1. Los participantes hacen declaraciones (posiblemente falsas) sobre sus
Concluimos esta sección aplicando este resultado al modelo de empleo de tipos (es decir, sus valoraciones). El jugador i puede declarar ser cual-
Hall y Lazear: si la empresa tiene información privada sobre el producto quier tipo Ti del conjunto Ti de posibles tipos de i, independientemente
marginal m del trabajador y el trabajador tiene información privada sobre de cuál sea el verdadero tipo i, k
una oportunidad alternativa ti, no existe ningún jÚe'gode negociación que
2; Dadas las declaraciones de los participantes (TI,' .. ,Tn), el jugadori
la empresa y el trabajador quisieran jugar que 'produZca empleo si y sólo
si es eficiente (es decir, si y sólo si m2: v). ofrece Xi(Tlt .. "Tn) y recibe el bien subastado con probabilidad qih,
. .. ,Tn). Para cada posible¡;ombinación de declaraciones h, ...,Tn),la
suma de las probabjlidades ql (TI,' , . ,Tn) + ". + qn(Tl," .,Tn) debe ser
menor o igual a uno.
3.3 El principio de revelación

El principio de revelación, debido a Myerson (1979) en el contexto de Los juegos de esta clase (es decir, los juegos estáticos bayesianos en los
los juegos bayesianos (yen otros en contextos relacionados), es Un ins~ cuales la única acción del jugador es hacer una declaración sobre su tipo)
trumento importante para diseñar juegos cuando los jugadores tienen se llaman mecanismos directos.
información privada. Puede aplicarse a los problemas de las subastas La segunda manera en la que el vendedor puede utilizar el princi- r,:
y del intercambio bilateral descritos en las dos secciones anteriores, así pio de revelación es limitando su atención a los mecanismos directos, en ".'.

como a una amplia gama de problemas. En esta sec~ión enunciamos y los cuales decir la verdad constituye un equilibrio bayesiano de Nash
demostramos. el principio de revelación para juegos bayesianos estáticos. para cada participante, es decir, a l¡¡s funciones de oferta y de proba-
(La extensión de la demostración' a juegos bayesianos dinámicos es in" bilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'", taun)}
mediata.) No obstante, antes de hacerlo, vamos a indicar cómo se utiliza tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti
el principio de revelación en los problemas de subastas y de intercambio para cada ti en n. Un mecanismo directo en el cual decir la verdad cons-
bilateral. '
tituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.
Consideremos un vendedor que quiere diseñar una subasta que ma-
Fuera del contexto del diseño de una subasta, el principio de reve-
ximice sus ingresos. Sería una ardua tarea detallar todas y cada una de las
lación puede seguir siendo utilizado de estas dos maneras. Cu~lquier
diferentes subastas posibles. En la subasta dela sección ;3,2.B, por ejemplo,
equilibrio bayesiano de Nash de un juego bayesiano puede representarse
el participante que puja más alto paga al vendedor y consigue el bien
<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesiano
subastado, pero existen muchas otras posibilidades. Los participantes,
adecuadamente escogido, en el cual por "representado" queremos decir
por ejemplo, pueden tener que pagar una entrada, De forma más general,
que para cada posible combinación de tipos de los jugadores (tit ... ,tn),
algunos de los participantes que pierden pudieran tener que pagar dinero,
las acciones y las ganancias de los jugadores en el nuevo equilibrio son
tal vez en cantidades que dependan de sus pujas y de las de los demás.
idénticos a los del equilibrio original. IÍtdependientemente de cuál sea el
También podría el vendedor establecer un precio de reserva, un precio
juego original, el nuevo juego bayesiano es siempre un mecanismo directo;
mínimo por debajo del cual no se aceptaran pujas. De forma más general,
independientemente del equilibrio original, el nuevo equilibrio siempre
puede existir cierta probabilidad de que el vendedor se quede con el bien
consiste en decir la verdad. De manera más formal:
El principio de revelació" / 167
166/ JuEGOS ESTÁTICOS CON INFORMACIÓN INCOMPLETA (c. 3)

Teorema. (El principio de revelación). Cualquier equilibrio bayesiano de minan qué mecanismos directos tienen un equilibrio de decir la verdild.
Nash en un juego bayesiano puede representarse mediante un mecanismo directo Luego imponen la restricción de que cada tipo de cada parte quiera juga.r
de incentivos compatibles. (esdecir, que cada tipo de cada parte tenga una ganancia esperada en eqUl-
librio no inferior a la ganancia que ese tipo podría conseguir negándose
En la subast~ analizada en la sección 3.2.B supusimos que las valótació-' .. ' a jugar, concretamente cero para cada tipo de compra~or y is para el
nes de los párticipantes eran independientes entre sÍ. Tambiénsupusitnos ;; tipo de vendedor tB). Finalmente, demuestran qu~ en n1l1gl1l10de estos
(de forma implícita en la definición de las valoraciones de los partiCipan- mecanismos directos de incentivos compatibles, el mtercambJO se da con
',': tes) que conocerla-valoraCión del jugador j no éambiaria la valoracÍóiÍ.del probabilidad uno si y sólo si el intercambio es eficiente .. El.~rincipio ~e
jugador i (aunque tal con~chniento cart1biarianormalment~ la puja de i). revelación garantiza entonces que no hay juego de negOClaClonque qUJe-
ranseguir el comprador y el vendedor que tenga un equilibrio bayesiano
Caracterizamos estos dos supuestos diciendo que los participantes tienen
valores privadóseindep~ndientes. Eh'este caso, Myerson (1981)deter-' de Nash en el cual se dé el intercambio si y sólo si es eficiente.
mina quémecaÍüsmos directús"HénehUh ecjirilibrio de decirlaveidady Para dar un enunciado formal y una demostración del principio de re-
cuáles de estos equilibrios maximizan la ganancia esperada del vendedor. velación, consideremos el equilibrio bayesiano de Nash s' = (si, ... ,s;,) en
El principio de revelación garantiza entonces qué no hay otra subasta con el juego bayesianoestático G = {Al,'" ,An; TI,' .. ,Tn;Pl,'" ,Pn; nI, ... ,un}'
un equilibrio bayesiano de Nash que proporcione al vendedor una ga- Vamos a construir un mecanismo directo con un equilibrio de decir la
. nancia esperada más alta, puesto que el equilibrio de tal subasta habría verdad que represente s*. El mecanismo directo adecuado es un juego
sido representado por un equilibrio de decir la verdad de un mecanismo bayesiano estático con los mismos espacios de tipos y de conjeturas que
directo; y ya consideramos todos los mecartisr'nq~directos de incentivos G, pero con nuevos ~spacios de acciones y nuevas funciones de ganancias.
compátibles. TambIén déinuestra'Mye~son que el equilibrio bayesia~o d~ Los nuevos espacios de acciones son simples. Las acciones. factibles del
Nash simétrico de la subasta analizada en la sección 3.2.B es equivalente jugador i en el mecal1ismo directo son declaraciones (posiblemente falsas)
a este equilibrio de decir la verdad maximizador de la ganancia (como los sobre sus posibles tipos. Es decir, el espacio de acciones del jugador i es
equilibrios simétricos de otras conocidas subastas). Ti. Las nuevas funciones de ganancias son más complicadas. Dependen
tomo seglindoejemplo derprin~ipio derevelació.n, consideremos el no sólo del juego original G, sino también del equilibrio original en dicho
problema del ii1tercambiobilateral descrito en la sección 3.2.C. Allí ana~ juego, s". La idea crucial es utilizar el hecho de que s" es un equilibrio
lizamos Unjuego 'de 'intercambio entre un comprador y un vehdJdor, hí en G para garantizar que de<:irla verdad es un equilibrio del mecanismo
subasta doble. En ese juego; si había iiüercarnbio; el comprador pagaba al directo, como vemos a continuación.
vendedor,'mientras CJuesino; no había pagó; sin embargo existehmuchas Decir que s" es un equilibrio bayesiano de Nash de G, significa
otras posibilidádes.Podriá. haber pagos (del comprador al vendedor o que para cada jugador i, s; es la mejor respuesta de i a las estrate-
viceversa) incluso sin intercambio, y la probabilidad de un intercambio mas (s" s" s~ s") de los demás ]'ugadores. Más concretamente,
0& '1""/ t-1' 'l+l,""'n
podriaestar estrictamente entre cero,yuno. También, la regla para deter- para cada uno de los tipos ti en Ti de i, S;(ti) es la mejor acción de A¡
minar si va haber intercambio podría exigir que la oferta del comprador que puede elegir i, dado que las estrategias de los otros jugadores son
fuera mayor que la demanda del vendedor en una cierta cantidad (posi- (si, ... ,s:_l ,s:+l' ... ,s~). Por tanto, si el tipo de i es tú y permitimos ai ele-
tiva o negativa); dicha cantidad podría incluso variar dependiendo de los gir una acción de un subgrupo Ai que incluye .5; (ti), entonces la elección
precios anunciados por las partes. óptima de i sigue siendo 3;(ti), suponiendo de nuevo que las estrategias
de los otros jugadores son (si, ... ,.5;_1,3;+" ... ,s~). Las funciones de ga-
Podemos capturar estas posibilidades considerando la siguiente clase
nancias en el mecanismo directo se eligen para confrontar a cada jugador
,".
de mecanismos directos: el comprador y el vendedor realizan simultánea-
mente declaraciones sobre sus tipos, Tb y T.., tras lo cual el comprador paga con una elección exactamente de esta clase.
al vendedor x(Tb,T que puede ser positivo o negativo, y el comprador Definimos las ganancias en el mecan.isIl1o directo sustituyendo las
.. : .. B),

declaraciones de tipos de Jos jugadores en el nuevo juego T = (TI, ... ,Tn)


recibe el bien coh probabilidad q(Tb,Ts)' Myerson y Satterthwaite deter-
W3 / JUEGOS EST..\'"ICOS CON INFORMACiÓN INCOMPLETA (e. 3) Ejercicios I 169

en las estrategias deequilibrio del juego original, 8*, Yluego sustituyendo 3.4 Lecturas adicionales
las acciones resultantes en el juego original 8*(T) = (sih), ... ,:5~(Tn» en
las funciones de ganancias del juego original. Formalmente, la función de Myerson (1985) ofrece una introducción más detallada a los juegos baye-
ganancias de .í es
sianos, el equilibrio bayesiano de Nash y al principio de revelación.
Consúltese McAfee y McMillan (1987) para un examen de la literatura
sobre subastas, incluyendo una introducción a la maldición del ganador.
Bulow y J(lemperer (1991) extienden el modelo de subastas de la sección
donde t = (t¡, ... ,tn). Se podría pensar que estas ganancias se dan porque
3.2.B para dar una interesante explicación de los pánicos y de los hundi-
un observador imparcial se acerca a los jugadores y pronuncia el siguiente ".,/
discurso: mientos racionales en los (digamos) mercados de valores. Sobre el em-
pl~o pajo información asimétrica consúltese Deere (1988),quien analiza un
Sé que ustedes ya conocen sus tipos y que van jugar el a modelo dinámico en el cual el trabajador va encontrándose con distintas
equilibno s' del juego G. Pero perIl1ítanme que lespre- eIIlpresa,s~ lo largod~l tiempo, cada una con su propio productonÍ.argmal
sente un nuevo juego, un mecanismo directo: En primer conocido de fOrmé:lprivada. Para aplicaciones del principio de revelación
lugar, cada uno de ustedes fírn;.ará un contrato que me c~nsúltese Baron:y Myerson (1982) sobre la regulación de un monópolio \ ..
permita a mí dictar la acción que tornarán ruando jugUe- con costes desconocidos, H¡¡rt (1983) sobre los contratos implícitos y el
mos e.En segundo lugar, cada uno de ustédes escribirá-' . paro inyolunté:lrioySappington (1983) sobre la teoría de la agencia.
una declaración sobre su tipo Ti y me la entregará~ Segui'-.
damente utilizaré la declaración del tipo de cada uno dé
ustedes en el nuevo juego, Ti, junto consúestfategia 'de ,; 35 Ejercicios
equilibno en el juego original, si, para ca1culiir-;'l~
acción
que habrían elegido en el equilibrio s' si su tipo fuera 3.1 ¿Qué es un juego bayesiano estático? ¿Qué es una estrategia (pura)
verdaderamente Ti, concretamente si (T¡). Finalmente, de- en tal juego? ¿Qué es un equilibrio bayesiano de Nash (con estrategias
terminaré que cada uno de ustedes torne la acción que puras) en dicho juego?
he calculado, y recibirán las ganancias resultantes (que \

dependerán de estas acciones y de sus tipos verdaderos). 3.2 Consideremos un duo polio de Cournot que opera en un mercado con
demanda inv~rsa P(Q) = a - Q, donde Q = qI + q2 es la cantidad agregada
Concluirnos esta sección (y la demostración del principio de reve-' en el mercado. Ambas empresas tienen unos costes totales de Ci(qi) = Cqi,
lación) demostrando que decir la verdad es un equilibrio bayesiano de pero la demanda es incierta: es alta (a = aA) con probabilidad O y baja
Nash de este mecanismo directo. Al declarar ser del tipo Ti de T¡, el juga~ (a. = aB) con probabilidad 1-0. Además, la información es asimétrica. La
dar i está en efecto escogiendo tornar la acción si'(Ti)deA¡. Si todos los, empresa 1 sabe si la demanda es alta o baja, pero la empresa 2 no lo sube.
demás jugadoresdicen la verdad, están efectivamente jugando las estr¡¡te-' Todo esto es información del dominio público. Las dos empresas eligen
gias (si" .. ,s:_¡,s~+I'" . ,si)' Pero discutirnos anteriormente que si juegan c~tidades,simultáneamente. ¿Cuáles son los espacios de estrategias de
esas estrategias, cuando el tipo de i es ti la mejor acción que puede elegir .¡-. g:ps'empresas? Háganse supuestos sobre aA, aB, e y C de manera que
lé:l~.
es ,st(t¡), 'Por tanto, si los otros jugadores dicen la verdad, cuando el tipo de todas las cantidades de equilibrio sean positivas. ¿Cuál es el equilibrio
i sea t, el mejor tipo del que se puede declarar seres ti. Es decir, decir laver~ bayesiano cie este juego?
dad es un equilibrio. De un modo más formal, jugar la estrategia de decir la
verdad T¡(ti) = ti para cada t.¡ en T¡ es un equilibrio bayesianode Nash del." 3.3 Consideremos el siguiente modelo de duopolio de Bertrand con infor-
juego bayesiano estático {TI," .,Tn;11, ... , Tn;PI," ',Pn;v¡, ... ,vn} para mación asimétrica y productos diferenciados. La demanda que se dirige
cada jugador i. a la empresa 'í es qi(P'¡,Pj) = a - Pi - bi . Pj. Los costes son cero para ambas
"1',

',.o',
170/ JUEGOS ESTÁTICOS CON INFORMACIÓN INCOMPLETA (c. 3) Ejercicios /171

empresas. La sensibilidad de la demanda de la empresa 'i al precio de la HáIlese un equilibrio bayesiano de Nash con estrategias puras del juego
empresa j es o alta o baja. Es decir, bi es o bA o bB, donde b,4. > bE > O. .':',::.' correspondiente con información incompleta tal ql~e, conforme la 111[0:-
Para cada empresa, bi = bAcon probabilidad IJ y b¡ '" b B con probabilidad. -' ;;i,;o,lIlación incompleta desaparece, la conducta de los Jugadores el: :1 ~qU1-
1 - IJ, independientemente de bj• Cada empresa conoce su propio biPe!6.,. ";"',',:
•.'UbriObayesiano de Nash tienda a su comportamIento en eJ.~qu¡Jlbno ele
no el de su competidora. Todo esto es información del dominio públiF ' ;¡(:"Nash con estrategias mixtas del juego original con mformaclOn completa,
¿Cuáles son los espacios de acciones, espacios de tipos, conjeturas y fUn~
ciones de utilidad en este juego? ¿Cuáles son los espacios de estrategias!. 3.6 Consideremos una subasta de sobre cerrado al primer precio en la cual
¿Qué condiciones definen un equilibrio bayesiano de Nash simétncú'é'8R las valoraciones de los participantes están distribuidas de forma indepen-
estrategias puras de este juego? Hállese dicho equilibrio .. " . diente y uniforme en [0,1]. Demuéstrese que si hay n participantes, la
""'¡<tr"t~giade Plljar (n - l)/n veces la propia valoración es un equilibrio
3.4 Hállense todosJos. equilibrios bayesianos de Nash con esrrategiasp •.~"yesiano de Nash simétrico.
.~; .
ras en el siguiente juego bayesiano estático: . ..tl~'f;'.~"
- ,

r$.7Cbnsideremos una subasta de sobre cerrado al primer precio en la cual


1. El azar determina si las gananCias son Como en' el juego 1 o como, ' '.ias:va10iacionesde los participantes están distribuidas indénticamente y
erjuego 2, siendo cada juego igttalmenfeprobable., ':deJorma independiente según la densidad estrictamente positiva !(-u;) en
2. El jugador lse entera de si el ázarhaescógidoel jUego! o el 2, per. ;10; 11~Calcúlese un equilibrio bayesiano de N ash simétrico para el caso de
el jugador 2';0. ,. '" . . "'dos partiCipantes .
. 3. El jugador. 1 elige A o B; simultáneamente el jugador 2 elige Do 1. "\ : .
..

4. Las ganancias son las que se dan en el jueg¿<lu~.deterrhiná'éiaár:;.'¡ ~;'j:SCónsidérese al comprador y al vendedor de la subasta doble analizada
. en la sección 3.2.C como una empresa que conoce el producto marginal 111.
1 j) ID'- 'del trabajador y un trabajador que conoce su oportunidad alternativa 7),
como en Hall y Lazear (1984), En este contexto, un intercambio significa
A 1,1 0,0 A 0,0 á,o
q~El~l.tralJaj<\~orestá empleado por la empresa, y el precio al cual las
B 0,0 0,0 B 0,0 2,2 ;part~' negoCian es el salario del trabajador w. Si se da el intercambio,
Juega2 .... .,la ganancia de la empresa es m ~ w, y la del trabajador es w; si no hay
Juega 1 \,4itercambio, la ganancia de la empresa es cero y la del trabajador v.
. Supongamos que m y v son obtenidos independientemente segú n Ulla
3.5 Recordemos de la Sección 1.3 que el juegode las monedas (un juegó'. , distribución uniforme en [0,1] como en el texto. Con fines comparativos,
estático con información completa) no tiene equilibrios de Nash cori'és~.. ii;tálCúlense las ganancias esperadas de los jugadores en el equilibrio lineal
trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Iílixhis;':'; :'',de la subasta doble. Ahora consideremos los dos juegos de intercambio
cada jugador elige cara con probabilidad 1/2 .. 'siguientes como alternativas a la subasta doble.
""r"l,'
.; . ¡liega 1: Antes de que las partes conozcan su información privada,
Jugador 2 \:fitman un contrato aceptando que si el trabajador es empleado por la
cara cruz empresa, su salario será w, pero también que cualquiera de las partes
:':puede romper la relación de empleo sin coste alguno. Después de que
cara 1,-1 -1,1
las partes conocen los respectivos valores de su información privada,
Jugador 1
,~núncian simultáneamente si aceptan el salario 1)) o si lo rechazall, Si
cruz -1,1 1,-1
h':'áI;ól:5os anunCian que 10 aceptan, hay intercambio; si no, no, Dado 1.111
\ valor de v arbitrario en [0,1], ¿cuál es el eqtlilibrio bayesiano de Nash de
','
172/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)
Referencias / 173

este juego? Dibújese un diagrama análogo a la figura 3.2.3 mostrando los


_. 1973. "Carnes with Randomly Disturbed Payoffs: A New Rationale for
pares de tipos para los que hay intercambio. Hállese el valor de 'lO que
Mixed Strategy Equilibrium Points." International ¡oumal of Game TheonJ
maximiza la suma de las ganancias esperadas de los jugadores y calcúlese
esta Suma. 2:1-23.

2: Antes de que las partes conozcan su información privada,


[llego
HART,O. 1983. "Optimal Labour Contracts under Asymmetric Informa-
firman un contrato aceptando que el siguiente juego dinámico se utilizará tion." Review of Economic Studies 50:3-35.
para determinar si el trabajador se une a la empresa y, si lo hace, con McAFEE, P. y J. McMILLAN. 1987. "Auctions and Bidding." ¡oumal of
qué salario. (Estrictamente hablando, este juego pertenece al capítulo Economic Uterature 25:699-738.
4. Vamos a adelantamos al capítulo 4 aduciendo que este juego puede
resolverse combinando las lecciones de este capítulo con las del capítulo 2.) MYERSON,R. 1979. "Incentive Compatability and the Bargaining Problem."
Una vez que las partes conocen los respectivos valores de su información. Econometrica 47:61-73.
privada, la empresa elige un salario 'lO que ofrece al trabajador, salario -. 1981. "Optimal Auction Design." Mathematics of Operations Research
que el trabajador acepta o rechaza. Analícese este juego utilizando el 6:58-73~
procedimiento de inducción hacia atrás, tal como hicimos en la sección
2.1.A con los juegos análogos de información completa. Dados 'lO yv, ¿qué -. 1985. "Bayesian Equilibrium and Incentive Compatibility: An I.ntro-
hará el trabajador? Si la empresa prevé lo que hará el trabajador, dado m duction." In Social Goals and Social Organization. L. Hurwicz, D. Schmeldler,
¿qué hará la empresa? ¿Cuál es la suma de las ganancias esperadas de los y H. Sonnenschein, eds. Cambridge: Cambridge University Press.
jugadores?
MYE~N, R., Y M. SATTERHWAlTE. 1983. "Efficient Mechanisms for Bila-
teral Trading." ¡oumal of Economic Theory 28:265-81.

3.6 Referencias SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal and
Agent." ¡oumal o/ Economic Theory 21:1-21.

BA1<ON, D., Y R. MYERSON.1982. "Regulating a Monopolist with Unknown


Costs." Econometrica 50:911-30.

BULOW,J., y P. KLEMPERER.1991. "Rational Frenzies and Crashes." Stan-


ford University Craduate School of Business Research Paper #1150.

CHATTERjEE,K., Y W. SAMUELSON.1983. "Bargaining under Incomplete


Informabon." Operations Research 31:835-51.

DEmE, D. 1988. "Bilateral Trading as an Efficient Auction over Times."


[ol/rIlal of Political Economy 96:100-15. .

HALL,R., Y E. LAZEAR.1984. "The Excess Sensitivity of Layoffs and Quits


lu Demand." [ournal of Labor Econ01nics 2:233-57.

HARSANYI,J. 1967. "Cames with Incomplete Information Played by Ba-


yesian Players Parts 1 II and I1I." Management Science 14:159-82, 320-34~
486-502.

~3
4. JUEGOS DINÁMICOS
CON INFORMACIÓN INCOMPLETA

En este capítulo presentamos un concepto más de equilibrio, el equilibrio


bayesiano perfecto, con lo que tenemos cuatro conceptos de equilibrio en
cuatro capítulos: el equilibrio de Nash en los juegos estáticos con infor-
mación completa, el equilibrio de Nash perfecto en subjuegos enlos juegos
dinámicos con información completa, el equilibrio bayesiano de Nash en
los juegos estáticos con información incompleta y el equilibrio bayesiano
perfecto en los juegos dinámicos con información incompleta. Podría pa-
recer que nos inventamos un nuevo concepto de equilibrio para cada clase
de juegos que estudiamos pero, de hecho, estos conceptos de equilibrio
están estrechamente relacionados. A medida que vamos considerando
juegos más completos, vamos reforzando el concepto de equilibrio para
excluir los equilibrios poco verosímiles que sobrevivirían en los juegos
más ricos si aplicáramos los conceptos de equilibrio adecuados a los jue-
gos más simples. En cada caso, el concepto de equilibrio más poderoso
difiere del más débil sólo en los juegos más ricos, no en los más simples;
En particular, el equilibrio bayesiano perfecto es equivalente al equili-
brio bayesiano de Nash en ios juegos estáticos con ,información completa,
equivalente al equilibrio de Nash perfecto en subjuegos en los juegos
dinámicos con información perfecta y completa (yen muchos juegos
dinámicos con información perfecta pero incompleta, entre los que se
incluyen los que hemos discutido en las secciones 2.2 y 2.3) y equivalente
al equilibrio de Nash en los juegos estáticos con información completa.
El equilibrio bayesiano perfecto se inventó para refinar (es decir, para
reforzar los requisitos de) el equilibrio bayesiano de Nash, del mismo
modo que elequilibrio de Nash perfecto en subjuegos refina el equilibrio
de Nash. Igual que introdujimos la perfección en subjuegos en juegos
dinámicos con información completa porque el equilibrio de Nash no
capturaba la idea de que las amenazas y promesas debían ser creíbles,
ahora limitamos nuestra atención al equilibrio bayesiano perfecto en jue-
176 I J¡;ECOS OINÁ,\IICOS CON I.\iFOR,\'/ACláN L\iCOMPLETA (e. 4)

Introducción al equilibrio bayesúl/lO pertixto I 177


gas dinámicos con información incompleta porque el equilibrio bayesiano
de Nash presenta el mismo inconveniente. Recordemos que si las estra- merca do de trabaJ'ode Spence (1973), el modelo de inversión'. empresarial
tegias de los jugadores han de formar un equilibrio de Nash perfecto de Myers y Majluf (1984) y el modelo de política monetana de Vlckers
en Subjuegos, no sólo deben formar un equilibrio de Nash en el juego (1986).
completo, sino también constituir un equilibrio de Nash en cada sub-
En la sección 4.3 describiremos otras aplicaciones del equilibrio ba-
juego. En este capítulo reemplazamos la idea de Subjuego por la idea
más general de juego de continuación, que puede comenzar en cualquier yesiano perfecto. Comenzaremos c0r:. el. an~~isis de juegos con parloteo
(cheap-talk games) (es decir, juegos de sena1JZacJOnen los cuales los mensa-
conjunto de información (ya sea de un único elemento o no), y no sólo en
conjuntos de información con un único elemento. A continuación proce- jes no cuestan nada), entre cuyas aplicac.ion~sse incluyen 1.asamenazas d~
to
demos por analogía: si las estrategias de los jugadores tienen que formar ve Presidencial a las decisiones del legIslativo norteamencano, los . anun
.
cios de política por parte de la autoridad monetaria y las comurucaclOnes
un equilibrio bayesiano perfecto, no sólo deben Constituir un equilibrio
(o "voz") en las organizaciones. En los juegos con parloteo, el ~cance de
bayesiano de Nash para el juego completo, sino también constituir un
equilibrio bayesiano de Nash en cada juego de continuación. la comunicación se determina por los intereses comu~es de los Ju~adores
más que por los costes de las señales de los diferentes tipos. EstudIaremo~
En la sección 4.1 presentamos de modo informal las principales ca- a continuación el modelo de negociación sucesiva de Sobel y Takahashi
racterísticas de un equilibrio bayesiano perfecto. Para ello, adoptamos
(1983), en el cual una empresa debe tolerar una huelga para den:ostrar
temporalmente una segunda perspectiva (complementaria) que cambia
que no puede permitirse pagar salarios más .altos.(cfr. el.mo~elo ge ne-
el énfasis anterior: el equilibrio bayesiano perfecto refuerza los requisitos
gociación con información completa de Rubmstem que mclwmos en la
del equilibrio de Nash perfecto en Subjuegos analizando explícitamente secclOn
" 2.1.D , en el cual las huelgas no se dan
. en equilibrio). Finalmente,
.. .
las conjeturas de los jugadores, Como en un equilibrio bayesiano de Nash.
exploraremos la explicación clásica de Kreps, Milgrom, ~~bert~ y WIlson
Esta segunda perspectiva surge porque, siguiendo a Harsanyi (1967),des-
(1982)del papel de la reputación en el logro de la coopera~~~ raCJOnale~,el
cribimos un juego con información incompleta como si fuera un juego Con
dilema de los presos repetido finitamente (cfr. la proposlclon en ~asecCloIl
información imperfecta; el azar revela el tipo del jugador i a i pero no a i,
2.3.A concerniente al único equilibrio de Nash perfecto en subJueg~s .de
por 10que j no conoce la historia completa del juego. Por lo tanto, un Con-
un juego repetido finitamente basado en un juego de etapa con un m:1CO
cepto de equilibrio diseñado para reforzar el equilibri~ bayesiano de Nash equilibrio de Nash). .:,
en los juegos dinámicos con información incompleta puede también re-
forzar el equilibrio de Nash perfecto en subjuegos en los juegos dinámicos En la sección 4.4 volveremos a la teoría. Aunque es la sección final
con información completa pero imperfecta. del libro, sirve para indicar lo que podría venir a continuacióIl.~~ql.!~
como culminación de los temas analizados. Allí describireII10se¥ustra-
En la sección 4.2 analizaremos la cla?e de juegos Con información in-
remos dos refinamientos (sucesivos) del equilibrio bayesiano perfecto, el
completa aplicada con más frecuencia: los juegos de seiialización. Enunciado
segundo de los cuales es el criterio intuitivo de Cho y Kreps (1987).
de un modo abstracto, un juego de señalización consta de dos jugadores
(uno Con información privada, el otro sin ella) y dos rondas (primero una
señal enviada por el jugador informado y después una respuestaadop_ 4.1 Introducción al equilibrio bayesiano perfecto
tadapor el jugador desinformado). La idea clave es que la comunicación
puede darse si un tipo de jugador informado quiere enviar una señal que Consideremos el siguiente juego dinámico con información :ompleta pero
sería demasiado cara de enviar por parte de otro tipo. En primer lugar imperfecta. En primer lugar, el jugador 1 elige en~e tres acclO~es,~,Cy D.
definiremos el equilibrio bayesiano perfecto en juegos de señalización y Si el jugador 1 elige D, se acaba el juego sin que Juegue el 2. 51el Jugador
describiremos los distintos tipos de equilibrios (que corresponden a dis- 1 elige 1 o C, el jugador 2 se da cuenta de que D no ha sido .elegida,(per?
tintos grados de comunicación, entre cero y completa) que pueden existir. no de si ha sido elegida lo C) y entonces elige entre dos aCCIOnes, 1 yD,
A continuación consideraremos el modelo original de señalización en el tras lo cual se termina el juego. Las ganancias se muestran en la forma
extensiva de la figura 4.1.1.

__ eM@_!.O!' ~!i!!!E'!!!!!'!'!!'!' :t,"""'~ ..""__.••••••••.••••• •._. ."_


. Introducción ,,1 c'1'lÍliIJl'io bayesiallo perjó)" I liCJ
178 I JUEGOS, PINA1v[jCO~ CON INFORMACIÓN INCOMPLETA (C 4)

Una manera de reforzar el concepto de equilibrio para excluir el equi-


'o . d Nash perfecto en subJ'uegos (D D') de la figura 4.1.1 es imponer
libno e ' ,
1
3 los dos requisitos siguientes:

"t 1 En cada conj'unto de inFormación el j'ugador que decide debe


RequISl o . ' J' ' .
formarse una conjetura sobre el nodo del conjunta ~te injorm,aclón al que se 1m
llegado en el juego. Para un conjunto de 111f~,:maclOncon mas de un ele1l1:/lfO,
una conjetura es una distribución de probabl11dad sobre los nodos del conju/lto
2 o' O O de infonnación; para un conjunto de información con un único. el:mento, la
1 O 2 1 conjetura del jugador asigna probabilidad uno al único nodo de declslO11.

"Figura 4.1.1
Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.
UtiÍiza~d¿ la rep!esent~ci6n'enfonnan9pnal de este juego4ad~~ sucesivamente racionales. Es decir, en cada conjunto de mformaclOn, la aCClO1l

la figura 4.1.2, observ~mq~ que existen~().seqüi1ibrios deNash con estra:;: tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.r
tegias puras, (1,1') y (D,D'),r~rá (ieterminat SI estos equiiibri~;'dé ],{f;h óptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~
son perfectos en subjuegos utiHz!Ull0slarepresentación en {antia e~t~ri~ guientes estrategias de los demás jugadores (donde una estra.tegla subslg,Ulente
'. ' "",' ,'" , , ", 'jl'!'
siva para definir los subjuegos del juego. Puesto que un' juego ,esdefÍr{j~9., es un plan de acción completo que cubre cada contmgencla que podna darse
de modo que comienza en, un nodo de decisión, que no es ~ás que~~: después de haberse alcanzado el conjunto de información).
conjunto deinformación cbn un único elemento (aunque no es eipri~EJ-,
n~do de decisión del jueg()), el juego'delafigura Ü.l no tiene subjuég~~~"
SI un juego no tiene subjuegos, el r~q,uisitode perfección en subjuegos . En la figura 4.1.1, el requisito 1 significa que si el juego alcanza el
(~o~cretamenteque las estrategias dé' los jugadores c~mstituyan un equi~ conjunto de información con más de un elemento del jugador 2, éste debe
hbno de Nash en cada subjuego) se cumple de forma trivia( Por tan£o: formarse una conjetura sobre el nodo que se ha alcanzado (o, de forma
encualquierjuego que no tenga subjuegos la definición de equilibrio de. equivalente, sobre si el jugador 1 ha jugado 1 o C).Esta conjetura se
Nash perfec~á en subjuegosles equivalenté a la definición de equilibriocl~ representa con las probabilidades p y 1 - p ligadas a los nodos relevilntes
Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios en el árbol, como muestra la figura 4.1.3.
'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramente .Dada la conjetura del jugador 2, la ganancia esperada porjugar D' es
d,euna amen,aza que nó resultacreíble: si llega el tumo del jugador 2,jugar p. 0+(1 - p).l = 1 - p, mientras que la ganancia esperada por jugar j' es

1 domma a Jugar D', por 10 que el jugador 1 no debería verse inducido a p.1 + (1- p) .2 = 2 - p. Puesto que 2 - p > 1 - p para cualquier valor
jugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover. ". de p, el requisito 2 hace que el jugador 2 no elija D'. AsÍ, basta con exigir
_. que cada jugador tenga una conjetura y actúe óptimamente de acuerdo
con ella para eliminar el equilibrio inverosímil (J],D') eneste ejemplo.
Jug~dor 2 , Lo~requisitos 1 y 2 insisten en que los jugadores se formen conjeturas
l' D' :y,actú~n de forma óptima según éstas, pero no que estas conjeturas sean
.,:'1:';'
'tazonables,.Para imponer requisitos adicionales a las conjeturas de los
1 2,1 0,0
.:.:J:" jt1gadót~s; distinguimos entre conjuntos de información que están en la
Jugadorl' C 0,2 0,1 trayectoria de equilibrio y los que están fuera de la trayectoria de equili-
D 1,3 1,3
.."í. brio. ,.

,;~~

Ii"
180 ! JUECOS DINÁ,VIICOS CON INFORMACIÓN INCOMPLETA (c. 4) Introducción al equilibrio bayesiano perfecto / 181

o sino que ahora también incluye una conjetura para cada jugador en cada
1 conjunto de informaciÓn en el que el jugador tenga que jugar.1 La ventaja
3
de hacer explícitas las conjeturas de los jugadores de esta manera es que,
igual que en capítulos anteriores insistimos en que los jugadores eligen
estrategias creíbles, ahora podemos insistir en que se forman conjeturas
,,
razonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3) ''-.'

como fuera de ésta (en el requisito 4 que sigue y en otros de la sección 4.4).
En aplicaciones económicas simples, que incluyen el juego de seña-
lización de la sección 4.2.A y el juego con parloteo de la sección 4.3.A,
o o los tres requisitos no sólo capturan el espíritu del equilibrio bayesiano '.' .
2 1 perfecto, sino que también constituyen su definición. Sin embargo, en
aplicaciones económicas más complejas, se necesita imponer másrequisi-
Figura 4.1.3 tos con objeto de eliminar equilibrios inverosímiles. Distintos autores han
utilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todas
Definición. Para un equilibrio dado en un cierto juego en fionna extensiv las definiciones incluyen los tres requisitos; algunas también incluyen el
c' t d . fi ',. , . . a, un
ollJun o e In onnaclOn esta en la trayectoria de equilibrio si' se . 1 requisito 4 y algunas imponen requisitos adicionales.2 En este capítulo
, '. b b Td d .. a canza
LOI/.pro.a 1 I a positiva cuando .el juego se desarrolla según las estrategias de tomamos los requisitos 1 a 4 como definición del equilibrio bayesiano
~qullzbrlO, ~ fuera de la trayectorza de equilibrio si es seguro que no se alcanza perfecto.3
Llllmdo el Juego se desarrolla según las estrateO"Ías de equilibrio (donde u .•
11' " " . . ó' ,equI-
1 mo. puede significar equilibrio de Nash, perfecto en subjuegos, bayesiano o
lmyeslano perfecto). 1 Kreps y Wilson formalizan esta perspectiva de equilibrio definiendo el equililJrio secuencial,
un concepto de equilibrio equivalente al equilibrio bayesiano perfecto en muchas aplicaciones
económicas, pero en algunos casos algo más restrictivo, El equilibrio secuencial es más
R "
equl~Ito 3. En conjuntos de infonnación sobre la trayectoria de equilibrio complicado de definir y aplicar que el equilibrio bayesiano perfecto, por lo que la mayoría de
las conJ~turas se determinan de acuerdo con la regla de Bayes y las estrategias d; los autores ahora utilizan este último. Algunos se refieren (de modo impreciso) al concepto de
eqllllzbrzo de los jugadores. equilibrio que aplican corno equilibrio secuencial. Kreps y Wilson muestran que en cualquier
juego finito (es decir, cualquier juego con un número finito de jugadores, tipos y jugadas
posibles) existe un equilibrio secuencial. Esto significa que en cualquier juego finito existe un
'. Por ejemplo, e~ el equilibrio de Nash perfecto en subjuegos (1,1') de la equilibrio bayesiano perfecto.
figur~ 4.?.3, la conjetura del jugador 2 debe ser p = 1: dada la estrategia de 2 Para dar una idea de las cuestiones que no son tratadas por los requisitos 1 a 4, supon-
,
gamos que los jugadores 2 y 3 han observado los mismos acontecimientos y a continuación '.
eqUIhbno del jugador 1 (concretamente 1), el jugador 2 sabe qué nodo se ha ambos observan una desviación del equilibrio por parte del jugador 1. En un juego con infor-
al~anz~~o en el conjunto de información. Como una segunda ilustración mación incompleta en el cual el jugador 1 tiene información privada, ¿deberían los jugadores
(lupotetica) del requisito 3, supongamos que en la figura 41 3 . t' 2 y 3 formarse la misma conjetura sobre el tipo del jugador 1? En un juego con información
u Tb . . . eXls lera completa, ¿deberían los jugadores 2 y 3 formarse la misma conjetura sobre las decisiones pre-
\~ ..'

n eqUl I no en estrategias mixtas en el cual el J'ugador 1 ele£in'a 1


vias no observadas del jugador 1? De modo similar, si los jugadores 2 y 3 han observado los
Prob ~.b IT1d a d ql, e con probabilidad q2 y D con probabilidad
. o.
1- q -'
con
El mismos acontecimientos y entonces el jugador 2 se desvia del equilibrio, ¿debería el jugador
requisito 3 obligaria a que la conjetura del jugador 2 fuera p = q /~q ~. ). 3 cambiar su conjetura sobre el tipo del jugador 1 o sobre las decisiones no observadas del
Los tr . '. 1 1 q2
jugador 1?
es reqUlsItos capturan el espíritu de un equilibrio bayesiano
3 Fudenberg y TIrole (1991) dan una definición formal del equilibrio bayesiano perfecto
perfecto. La nueva característica crucial de este concepto de eqw'll'b . para una amplia clase de juegos dinámicos con información incompleta. Su definición trata
debe Kr . no se
a eps y Wllson (1982): en la definición de equilibrio las conJ'etur cuestiones como las que hemos planteado en la nota 2. Sin embargo, en los juegos simples
~&.. va.n a)'111lve de importancia de las estrategias. Formalmente u analizados en este capítulo. estas cuestiones no se plantean, por lo que su definición es equiva-
lente a los requisitos 1 a 4; Fudenberg y TIrole ofrecen condiciones bajo las cuales su equilibrio
eqUIlIbno ya no consiste simplemente en una estrategia para cada jugad:
bayesiano perfecto es equivalente al equilibrio sucesivo de Kreps y Wilson.
182 / JUEGO 5 DINA.\IICOS
'' - CON INFOR,\IACláN INCO~II'LET,\ re .•) Introducción ni equilibrio bnycsinno perfccto / 183

Requisito 4. En conjuntos de información f/lera de la tral/eeto' t '¡'b ' l a 3, También satisfacen de forma trivial el requisito 4, puesto que
las eOn¡dl d na [ e eqru 1 no
, Iras se eterminan según ¡a regla de Bll1¡es y ¡as ' t' t ' d ' no existe ningún conjunto de información fuera de esta trayectoria de
Jugadores donde sea posible, - es la egzas e los equilibrio, por lo que constituye un equilibrio bayesiano perfecto.

Definición U q '¡'b . b
duras que s'at n¡, e ul¡1 no .ayesiano perfecto


consiste en estrategias y eon- 1 L
¡ lS aeen os requIsItos 1 a 4.

)
, Sería por supuesto útil enunciar el requisito 4 de un modo má ' A
, eVItando la vaga instrucción "donde sea posible" L h s preCISO,


una d 1 r ' . o aremos en cada L'
eas ap lCaClOneseconómicas analizadas en las siguientes se ' 2
P or ahora utir l'" CClOnes.
. Izaremos os Juegos de tres jugadores de las ti ras 4 1 4
~~.5 para Ilustra: y fundamentar el requisito 4. (De arriba abafc:se indi~a~
pagos de los Jugadores 1, 2 Y3 respectivamente.)

• L 2
O
O

,
2
Figura 4.1.5


Ahora consideremos las estrategias (L,!,!') junto con la conjetura p =
-,,} .. _---
O. Estas estrategias constituyen un equilibrio de Nash; ningún jugador
quiere desviarse unilateralmente. Estas estrategias Yla conjetura también

•)
satisfacen los requisitos 1 a 3; el jugador 3 tiene una conjetura y actúa
de forma óptima con respecto a ésta, y los jugadores 1 y 2 actúan de
forma óptima dadas las estrategias subsiguientes de los otros jugadores.

•••
1 O O
2 1 1 Pero este equilibrio de Nash no es perfecto en subjuegos, porque el único
1 2 1 equilibrio de Nash del único subjuego del juego es U,D'). Por tanto,
los requisitos 1 a 3 no garantizan que las estrategias de los jugadores
Figura 4.1.4 constituyan un equilibrio de Nash perfecto en subjuegos. El problema es
1
que la conjetura del jugador 3 (p = O) es inconsistente con la estrategia
con un ún' t
Este juego ti ne b' ,
un su Ju~go: comIenza en el conjunto de información del jugador 2 (l), pero los requisitos 1 a 3 no imponen restricciones a
la conjetura de 3 porque el conjunto de información de 3 no se alcanza
este sub' ICOe emento ~el Jugador 2. El único equilibrio de Nash en
Juego entre los Jugadores 2 3 (1 D' si el juego se desarrolla según las estrategias indicadas. No obstante, el
equilibrio de Nash e . y es , ), por lo que el único
requisito 4 fuerza a que la conjetura del jugador 3 esté determinada por
Estas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').
g¡ Y a conJetura p = 1 del jugador 3 satisfacen los requisitos la estrategia del jugador 2: si la estrategia de 2 es I, la conjetura debe ser
184/ JUEGOS DlNÁ,\;lICOS CON INFORMACIÓN INCOMPLETA (e. 4) Jllegos de señalización / 185

p = 1; si la estrategia de 2 es D, la conjetura de 3 debe ser p = O. Pero si que el equilibrio bayesiano perfecto hace que las conjeturas de los juga-
la conjetura de 3 es p = 1, el requisito 2 fuerza a que la estrategia de 3 sea dores sean explícitas, este equilibrio no puede reconstruirse procediendo
D', con lo que las estrategias (L,1,1') y la conjetura p = Ono satisfacen los hacia atrás en el árbol del juego, como hicimos para construir el equilibrio
requisitos 1 a 4. de Nash perfecto en subjuegos. El requisito 2 determina la acción de un
Como segunda ilustración del requisito 4, supongamos que la figura jugador en un conjunto de información.dado basado en parte en la con-
4.1.4 se modifica como muestra la figura 4.1.5. El jugador 2 dispone ahora jetura del jugador sobre dicho conjunto de información. Si el requisito 3
de una tercera acción po~ible, L' que termina el juego. (Para simplificar o el requisito 4 se aplican a este conjunto de información, determinan la
ignoramos las ganancias' en este juego.) Como antes, si la estrategia de conjetura del jugador a partir de las acciones de los jugadores situados
equilibrio del jugador 1 es L, el conjunto de información del jugador 3 está más arriba en el árbol. Pero el requisito 2 determina las acciones situadas
fuera de la trayectoria de equilibrio, pero ahora el requisito 4 puede no más arriba en el árbol, basándose en parte en las estrategias subsiguientes
determinar la conjetura de 3 a partir de la estrategia de 2. Si la estrategia de los jugadores, incluyendo la decisión en el conjunto de información
de 2 es L', el requisito 4 no pone restricciones en la conjetura de 3, pero si original. Esta circularidad implica que una sola pasada ha~a atrás a lo
la estrategia de 2 es jugar 1 con probabilidad q¡, D con probabilidad q2 y largo del árbol (normalmente) no es suficiente para calcular un equilibrio
£' con probabilidad 1 - ql - q2, donde ql + q2 > O,el requisito 4 dicta que bayesiano perfecto.
la conjetura de 3 sea p = q¡j(q¡ + q2).
Para concluir esta sección, relacionamos de modo informal el equili-
brio bayesiano perfecto con los conceptos de equilibrio presentados en los 4.2 Juegos de señalización
capítulos anteriores. En un equilibrio de Nash, la estrategia de cada juga-
dor debe ser una mejor respuesta a las estrategias de los otros jugadores, 4.2.A Equilibrio bayesiano perfecto en juegos de señalización
por lo que ningún jugador elige una estrategia estrictamente dominada.
En un equilibrio bayesiano perfecto, los requisitos 1 y 2 equivalen a exigir Un juego de señalización es un juego dinámico con información completa
que la estrategia de ningún jugador esté estrictamente dominada comen- y dos jugadores: un emisor (E) y un receptor (R). El desarrollo del juego
zando en cualquier conjunto de información. (Véase la :;ección 4.4 para , '!li
es el siguiente: .r'
una definición formal de dominancia estricta comenzando en un conjunto
de información.) El equilibrio de Nash y el equilibrio bayesiano de Nash
1. El azar escoge un tipo ti del conjunto de tipos factibles T = {tI,' .. ,tI} , 'Jt
no comparten esta característica en conjuntos de información situados
que asigna al siguiente emisor según una distribución de probabilidad (
fuera de la trayectoria de equilibrio, como los conjuntos de información
p(t;), donde p(ti) > Opara cada i y p(tl) + ... + p(tI) = 1. _rJ
que no están contenidos en ningún subjuego. El equilibrio bayesiano per- \
fecto tapa estos agujeros: los jugadores no pueden amenazar con jugar 2. El emisor observa ti y elige un mensaje mj del conjunto de mensajes
factibleslv! = {mI,' .. ,m}}. (
estrategias estrictamente dominadas al comienzo de cualquier conjunto
de información fuera de la trayectoria de equilibrio. 3. El receptor observa mj (pero no ti) y elige a continuación una acción \
Como indicamos anteriormente, una de las virtudes del concepto de Uk de un conjunto de acciones factibles A = {al" .. ,aK}.
(
equilibrio bayesiano perfecto es que hace explícitas las conjeturas de los 4. Las ganancias vienen dadas por UE(ti,mj,ak) y UR(ti,mj,ak).
(
jugadores para imponer no sólo los requisitos 3 y 4, sino también otros
requisitos (sobre conjeturas fuera de la trayectoria de equilibrio). Puesto En muchas aplicaciones, los conjuntos T, M Y A son intervalos de la
que el equilibrio bayesiano perfecto no permite que el jugador'í juegue una recta real, en lugar de conjuntos finitos como los considerados aquí. Es
estrategia estrictamente dominada comenzandQ en un conjunto de infor- inmediato permitir que el conjunto de mensajes factibles dependa del tipo J'

mación fuera de la trayectoria de equilibrio, tal vez no sea razonable que que determina el azar, y que el conjunto de acciones factibles dependa del
el jugador j crea que el jugador 'Í jugará tal estrategia. Sin embargo, puesto mensaje que envía el emisor.
186 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
Juegos de SeJllllizIlCi,ill / 187

Los modelos de señalizacion han sido aplicados extensamente en el expectativa de inflación por parte de los empresarios pre-
análisis económico, Para indicar la diversidad de posibles aplicaciones cede al juego de seii.alización, y la elección de la autoridad
mterpretamos brevemente la estructura formal en 1-4 en términos de las monetaria de inflación en el segundo periodo la sigue,
tres aplicaciones que serán analizadas en las secciones 4.2.B,4.2.C y 4.2.0.

En el modelo de señalización en el mercado de trabajo de En el resto de esta sección analizarnos el juego de seii.alización abs-
Spence (1973)elemisor esun trabajador, el receptor es el tracto dado en 1 a 4, más que estas aplicaciones. La figura 4.2.1 ofrece
mercado de posibles empresarios, el tipo es la capacidad una representación en forma extensiva (sin ganancias) de un caso simple:
productiva del trabajador, el mensaje es la elección' del T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Nótese que el juego
nivel de educaci9n.c;leltrabajador yla acción es el salario no se desarrolla desde el nodo inicial en la parte superior del árbol hasta
,pagado Eor el mercado. '" ". los nodos terminales en la parte inferior, sino desde una jugada inicial
"
;',

En el modelo deinversiórtempresarial y estruc~rade éiéterminada por el azar en mitad del árbol hasta los nodos terminales en
capital de Myers y Majluf (1984),el emisor es una empresa los extremos izquierdo y derecho.
que necesita capital para financiar WI nuevo proyecto, el Emisor
a,
receptor es un inversor potencial; el tipo es la rentabilidad a,
m, t, m,
de los activos existentes de la empresa, el mensaje es la
:- - .:.'
oferta de una participación en él beneficio de la empresa :
a cambio de financiación y lélacción es la decisión de si a, ¡J a, ~ ' •.
invertir ano por parte del inversor. ,
,
Azar Receptor
Receptor
,
E~ algunas aplicaciones, un juego de señaliza~ió~.f9rm~parte de un juego ,
mas complejo. Por ejemplo, el receptor pódría tóÍri~r ~udé'cisióll antes de ,
a, 1 - ¡J a,
que el emisor eligiese el mensaje en la segunda ~f~pa y~'elemisor podría
tornar su decisión después de que el receptor tomase la suya en la etap~ 3
(o simultáneamente). , m, t, m,
a,
ai
En el modelo de política monetaria de Vickers (1986), la Emisor
autoridad monetaria posee información privada sobre su
voluntad' de aceptar inflación para aumentar el nivel de Figura 4.2.1
empleo pero, por lo demás, el modelo es una versión en ,',
dos etapas del juego 'repetido con información completa Recordemos que (en cualquier juego) la estrategia de un jugador es un
del modelo analizado en la sección 2.3.E.Así, el emisor es plan de acción completo; una estrategia detalla una acción factible para
la autoridad monetaria'. el receptor es la patronal, el tipo la cada contingencia en la cual el jugador pudiera tener que actuar. Por lo
voluntad deja autoridad monetaria de aceptar una cierta tanto, en un juego de seii.alización, una estrategia pura del emisor es una
'. ,1: .~. inflación para aumentar el nivel de empleó, el mensaje la función m(ti) que especifica qué mensaje elegirá para cada tipo que el
elección deja inflación en el primer periodo por parte dela azar pueda detemIinar, y una estrategia pura del receptor es una función
autoridad monetaria y la acción la expectativa de inflación o.(mj) que especifica qué acción elegirá ante cada mensaje que .el emisor
en el segundo periodo' por parte de los empresarios. La pueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor como
el receptor cuentan con cuatro estrategias puras.
188/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4) Juegos de selialización / 189

Estrategia 1 del emisor: Jugar mI si el azar determina t] y jugar m] si el cuando se aplica al emisor. El receptor, por el contrario, elige una acción
azar determina t2. después de observar el mensaje del emisor pero sin conocer el tipo de éste,
Estrategia 2 del emisor: Jugar m] si el azar determina t] y jugar m2 si el por lo que la elección del receptor se da en un conjunto de información con
azar determina t2. más de un elemento. (Existe un conjunto de información de esa clase para
Estrategia 3 del emisor: Jugar TI12si el azar determina t] y jugar m] si el cada mensaje que pudiera elegir el emisor y cada uno de estos conjuntos de
azar determina t2' ' información tieneun nodo para cada tipo que pudiera haber determinado
Estrategia 4 del emisor: Jugar m2 si el azar determina t] y jugar m2 si el el azar.) Aplicando el requisito 1 al receptor obtenemos:
azar determina t2.
Estrategia 1 del receptor: Jugar a] si el emisor elige m] y jugar a] si el Requisito 1 de. señalización. Después de observar cualquier mensajemj d~
emisor elige m2. M, el receptor der~formarseuna conjetura sobre,qué tipos. podrían haberenVÚld~ ,'.
'.','

Estrategia 2 del receptor: Jugar a] si el emisor elige m] y jugár ai si el rn. Denotelrios'esta conNttira con la distribucióii de probabilidad¡¡(tilmjt
J .' .' ... ' ....•. ... .' . .. . ....' , .,'
d¡j~4e, .
'.'
emisor elige m2. . , ¡¡.(t;lmj)~Opara"cádati'im T y'" "
Estrategia 3 del receptor: Jugar a2 si el emisor elige m] y jugar a] si el
emisor elige m2. L ¡¡.(t¡jmj) = 1.
Estrategia 4 del receptor: Jugar a2 si el emisor elige m] y jugar a2 si el tiET
emisor elige m2.
Dados el mensaje del emisor y la conjetura del receptor, es inme~iat?
caracterizar la acción óptirrúl del receptor. " Aplicando el requisito','f::il:!-
Llamamos a las estrategias primera y cuarta del emisor de agrupación, ,.' "T'-, '.,;--:;,'.~t '

porque cada tipo envía el mismo mensaje, y a la segunda y a la tercera de receptor obtenemos: ", /~:
separacióll, porque cada tipo envía un mensaje diferente. En un modelo
con más de dos tipos también existen estrategias de agrupación parcial (o de Requisito fR de señalización. Para cada mj en NI, la acción del receP-!
semi-separación) en las cuales todos los tipos en un determinado conjunto tor a*(mj) debe maximizar la utilidad esperada del receptor dada la conjetura
de tipos envían el mismo mensaje, pero diferentes conjuntos de tipos ¡¡.(tdmj) sobre qué tipos podrían haber enviado "mj. Es decir, a*(mj) es una
envían mensajes diferentes. En el juego con dos tipos de la figura 4.2.1 solución de
existen estrategias mixtas análogas llamadas estrategias hfbridas, en las
cuales (digamos) t] juega m] pero t2 escoge aleatoriamente entre m] Y'1112.
Ahora traducimos los enunciados informales de los requisitos 1, 2 Y3
de la sección 4.1 a una definición fOfilal del equilibrio bayesiano perfecto
El requisito 2 también se élplica al emisor, pero éste tieneinf0:mac;:ión
en un juego de señalización. (La discusión sobre la figura 4.1.5 implica que completa (y por tanto una conjetura trivial), y además decide sorament~
el requisito 4 es vacuo en un juego de señalización.) Para simplificar las
al principio del juego, por lo que el requisito 2, e~ simplemen~e que la
cosas, limitamos nuestra atención a las estrategias puras; las estrategias estrategia del emisor sea óptima dadala estrategia dé! receptor:
hn)ridas se discutirán brevemente en el análisis de la señalización en el
mercado de trabajo de la próxima sección, Dejamos como ejercicio la
Requisito2E <leseñalización. Para cada ti enT: elmensaje del emisor m * (ti)
definición del equilibrio bayesiano de Nash en un juego de señalización
debe maximizar la utilidqd del emisor d,qda la estrategia del receptor a*(mj). Es
(véase el ejercicio 4.6).
decir, m~(ti) es una solución de
Puesto que el emisor conoce la historia completa del juego cuando
elige un mensaje, esta elección se da en un conjunto de información con
un lÍnico elemento. (Existe un conjunto de información de esa clase para
cada tipo que el azar pudiera determinar.) Por tanto, el requisito 1 es trivial
Juegos de se¡1alízaóólf / IlJ 1
190 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Si la estrategia del emisor es de agrupación o de separación, llamamos


~inalmente, dada la estrategia del emisor m *( , j
'
tipos que envían el mensaje m Es de' t t.), sea T el conjunto de al equilibrio de agrupación o de separación, respectivamente.
T si m*(l) = m. S' T 'J' , ,Clr, .i es un elemento del conjunto Concluimos esta sección hallando los equilibrios bayesianos perfectos
j , J' 1 j no esta vaclO, el con' t d . .,
rrespon,diente al mensaJ'e mj es t'a en 1a trayect Jun en estrategias puras en el ejemplo con dos tipos de la figura 4.2.2. Nótese
'd o e mformaclOn
'" co-
contrario ningu'n tl'PO' , ona e eqUIlIbno; en caso que cada tipo tiene las mismas posibilidades de ser elegido al azar; utíli-
, enVla m. por lo qu 1 .
correspondiente está fu d' 1 J' , e e conjunto de información zam<?s(p,l _ p) y (q,1 - q) para denotar las conjeturas del receptor en sus
era e atrayectona de e Tb'
en la trayectoria deequI'll'b'no¡ 1a ap l'IcaClondel
., qUI..1 no,
3 Para mensajes dos conjuntos de información.
:," > del receptor resulta en: reqUISIto a las conjeturas Los cuatro posibles equilibrios bayesianos perfectos con estrategias
puras de este juego con dos mensajes Y dos tipos son: (1) Agrupación en
Requisito 3 de seíialización. Para cada m.' " ' . Ii (2) AgrUpación en Di (3) Separación con tl eligiendo J Y t2 eligiendo
n:*(ti) .~ mj, la c01"ijetu;adel re¿;'ton;n el'cé/: en M, s~ eXIste t~/n Ttal que
dIente a mj debe derivarsed . l P¡, d' . yunto de tnformaclOn correspon- D, y (4) Separaclón con tl eligiendo D Y t2 eligiendo J. A continuación
e a reg a é B~yes y la estrategia del emisor: ' analizamOs estas posibilidades.
, ' -

/.' 1. Agrupación en J. Supongamos que hay un equilibrio en el cual


P(ti)
la estrategia del emisor es U,!), donde (mi ,-m") significa que el tipo 1.1
E.p(ti) .
elige m' Y el tipo t2 elige mil. Entonces, el conjunto de información del
". t,ET,
receptor que corresponde a J está en la trayectoria de equilibrio, por lo que
la conjetura del receptor (p,l - p) en este conjunto de información viene
Definición, Un equilibrio bayesiano erfi t .'. . determinada por la regla de Bayes y la estrategia del emisor: p = 0,5, que
juego de señalización consiste en ," dP ec o ,CO~l estrategIas puras en un
' t unpar eestrategzasm*(t')ya*(m) es la distribución a priori. Dada esta conjel1.lra(o cualquier otra conjetura),
con
(3).
je ura ¡At 1m ) . fi 'j ,yen una
' 'J que satls acen los requisitos de señalización (1), (2R), (2E) Y
;': "
la mejor respuesta del receptor que sigue a J es elegir a, de manera que
'\.
105 tipos del emisor tl y t2 alcanzan ganancias de 1 y 2respectivanlPnte.
Para determinar si ambos tipos del emisor quieren elegir J, necesitamos
establecer cómo reaccionaría el receptor a D. Si la r~spuesta del receptor
a D es a, el pago al tipo ti por elegir D es 2, 10 que es mayor que el pago
de 1 que recibe por elegir J. Pero si la respuesta del receptór a D es b,
°
h Y t2 alcanúm unas ganancias de y 1 respectivamente por elegir D,
mientras queson de 1 y 2 respectivamente por elegir J. Por lo tanto, si
existe Ufl equilibrio en el cual la estrategia deleÍnisor es U,I), la respuesta
del receptor a D debe ser b, de manera. que la estrategia del receptor debe
'.\ ser (o.,b), donde (e' ,e") significa que el receptor elige c' después de r y
e" después de D. Queda por considerar la conjetura del receptor en el
conjunto de información correspondiente a D y la optimalidad de elegir
b dada esta conjetura. Puesto que elegir 1) es óptimo para el receptor
para cualquier q S 2/3, tenemos que [U,J),(o.,b),p == 0,5,q] es un equilibrio
bayesiano perfecto de agrupación para cada q S 2/3.
2. Agrupación en D. A continuación supongamos que la estrategia
del emisor es (D,D). Entonces q = 0,5, de manera que la mejm respuesta
°
del receptor a D esb, obteniéndose unas ganancias de para l., y 1 pnra
t2. Pero ti puede conseguir 1 eligiendo J, puesto que la mejor respuesta
1)12 ¡JUEGOS DINÁMICOS CON INFOI~IVI~C10'N I';CO - ¡Liegos de señalización / 193 ':.
'- "tvIPLETA (e. 4)

del receptor a ,[ es a para cualquier valor de ) l ' 3. Dos empresas observan la educación del trabajador (pero no su capa-
equilibrio en el cual el " j y, por o tanto, no eXIsteun 4
emISOrJuegue (D,D). cidad) y entonces le hacen ofertas salariales de forma simultánea.
3. Separación con elección de I or a '. 4. El trabajador acepta la oferta salarial más alta, lanzando una moneda
la estrategia de separación U D) l Pd P rte de tI' SI.el emIsor elige en caso de empate. Sea -w el salario que acepta el trabajador.
receptor están en la tra t ~ :1' os os conjuntos de información del ",
yec ona l e equilib . l
se delenl1inan por la regl d BIno, por o que las conjeturas Las ganancias son las siguientes: -w - c('I),e) es la del trabajador, donde
y I} '" O Las' a e ayes y a estrategia del emisor: p '" 1
c(r¡,e) es el coste en el que incurre un trabajador con capacidad '1) para
a y b res~ectiva::~;:s drespuestas del receptor a dichas conjeturas _son
, ' ,e manera que ambos tipos del' . obtener una educación e; y(r¡,e) - -w es la de la empresa que emplea al
ganancias de 1 Qued . emIsor, conSIguen trabajador, donde y(r¡,e) es la producción de un trabajador con capacidad
dada la estrat~gia de~por compr(obar sIla estrategia del emisor es óptima
receptor a b) No lo es' si - l ti r¡ qu~ ha ot>!enido una educación e; y cero es la de la empresa que no
eligiendo I en lugar de DI' . . e po t2 se desvía
,e receptor responde con 1 empleaal trabajador.
una ganancia de 2 ' , a, con o que t2 recibe Vamos a centramos (aquí en cierto modo y más en la sección 4.4) en un
elegir D. ' que es mayor que la ganancia de 1 que recibe t2 al
equilibrio bayesiano perfecto en el cual las empresas interpretan la edu-
cación como una señal de capacidad y, en consecuencia, ofrecen un mayor
4. Separación con elección de D or d .
estrategia de separació (D I) 1 ~ parte e tI' SI el emisor elige la salario al trabajador con más educación. La ironía del trabajo de Spence
(/ _ 1 d ' n, ,as conjeturas del receptor deben ser p - O ,',,'-,
(1973) es que los salarios pueden aumentar con la educación incluso si la
- , e manera que la mejo dI' - y
consiguen unas ganancias d: r;s~~esta e re~eptor .e~(a,a) y ambos tipos educación no tiene efecto alguno sobre la productividad (es decir,irIcluso i
','

reaccionaría con a'la g . ci tI s~ deSVIaraelrgIendo 1, el receptor si la producción del trabajador con habilidad r¡ es y(r¡), independiente-
incentivo para qu~ 1 s:r;nCl~ de t s]ena ent~nces de 1,c,on lo que no hay mente de e). El trabajo de Spence (1974) generaliza el argumento al irIcluir
eSVIe e D Del rrusmo mod .t d '
de D, el receptor reaccio' .1 ' o, SI 2 se esviara la posibilidad de que la producción aumente no sólo con la. capacidad,
nana con a' a ganancia de t '
1, con lo que no existe' .' 2 sena entonces de sino también con la educación; la conclusión análoga es entonces que los
[(D,I),Ca,a),p = O _ 1] mcent1vo p.ar~ que t2 'se desvíe de l. Por lo tanto, salarios aumentan con la educación más de lo que puede explicarse por
,q - es un eqUIlIbno bayesiano perfecto de se paraclOn.
' .,
el efecto de la educación en la productividad. Seguimos este enfoque más

4.2.B Señalización en el mercado de trabajo general.s


Es un hecho bien establecido que los salarios son mayores (en pro-
medio) para los trabajadores con más años de escolaridad (por ejemplo,
La Senorme
de ' literatura sobre' Juegos d e senalrzaclOn
_. . , comienza con el model véase Mincer [1974]). Este hecho invita a irIterpretar la variable- e como
pence (1973), que precedIÓ tanto ala amplia utilización dI' o los años de escolaridad. En un equilibrio de separación podríamos pen-
f orma extensiva para des cn'b'Ir pro bl emas económic e los Juegos en
sar que un trabajador con capacidad baja tiene una educación de grado
de conceptos de equilib . 1d '" os como a a definición
no como e e eqUIlrbno bayesiano perfecto medio y que un trabajador con capacidad alta tiene una educación uni-
_ En esta seCClOn" replanteamos el modelo d S '. . versitaria. Desgraciadamente, interpretar e como los años de escolaridad
lorma extensiva y luego d 'b' l e pence como un Juego en plantea cuestiones dinámicas que no tratamos en el juego simple en 1--4,
escn IrnOSa gunos de sus 'l'b' b -
perfectos' en la s ., .- ,eqm 1 nos ayesianos
ba .' _ eCClOn4,.4 aplrcaremos un refinamiento del eq 'I'b .' como la posibilidad de que una empresa haga una oferta salarial después
yesIano perlecto a est' El m 1 no
e Juego. desarrollo temporal es el siguiet:lte:
4 La presencia de dos empresas en el papel del receptor deja este juego ligeramente fuera
de la clase de juegos analizada en la sección previa; pero véase la discusión que precede a la
1. El azar determin 1 .
puede ser o alta ~; ~?~Cl~)d rOdUCtiv~ ~e un trabajador, 1), la cual ecuación (4.2.1).
5 Formalmente, suponemos que trabajadores con alta capacidad sbn más productivos (es ",
2. El' aja . a probabIlIdad de que 1) = A es q. decir, y(A,e) > 'y(I3,e) para toda e), y que la educación no reduce la productividad (es decir,
trabajador averigua 'd d ' Ye(TI,e) ~ Opara cada 'TI y cada e, donde ye('r¡,e) es la productividad marginal de la educación
cación e ~ O.' su capacI a y entonces elige un nivel de edu-
para un trabajador de capacid"d TI con una educación e).

____________________ (:;:"
..J••.•
fuegos de sClia/ización /195
194 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

donde Ce (''I,e) denota el coste marginal de la educación de un trabajador de


del primer aúo de universidad de un trabajador (es decir, después de capacidad 7] y educación e.Para interpretar este supuesto consideremos
que un trabajador de baja capacidad haya terminado sus estudios pero un trabajador con educación el al que se le paga un salano 11J], como
antes de que uno de alta capacidad lo haya hecho). En un juego más muestra la figura 4.2.3,y calculemos el aumento salarial que sería necesario
complejo el trabajador podría elegir cada aúo si aceptar la mejor oferta
para compensar a este trabajador por un aument~ eneducac~ónde el a
del momento o volver a estudiar otro aúo. Noldeke y Van Damme (1990)
e2. La respuesta depende de la capacidad del trabajador: tra~~Jado:'~scon
analizan un juego más rico en esta línea demostrando que: (i) hay muchos . capacidad baja encuentran más difícil adquirir una educaClon adlCJonal,
equilibrios bayesianos perfectos; (ji) después de aplicar un refinamiento or lo que requieren un aumento salarial más alto (hasta IJ)B en lugar de
estrechamente relacionado cbn el que aplicaremos en la sección 4.4, sólo ~ólo hasta WA) para compensarles por ello. La interpretación gráfica de
uno de estos equilibrios sobrevive, y (iii) este equilibrio que 'sobrevive es este supu.esto e~q}le}s~ trabajadores con capacidad baja tienen c:Jrvas de
idéntico al único.equilibrio del juegosimple en 1,-4 quesobrevive después indiferencia '~óii.'mayorpendiente que los trabajadores con capaCIdad alta
de aplicar el refinamiento de la sección. 4.4, ..Por lo tanto, podriamos in-
(compáresej~ co~ IAenlafigura). .
terpretar vagamente e como los años deescoiaridad enel juego simple en
1,-4, porque los resultados son lbs mismos. en el juego más rico.
IR
En su lugar; vamos a evitar estas cuestiones dinámicas interpretando lA

::.••••••••
v
las diferencias en e como diferencias en la calidad del rendimiento de un
estudiante, 110 como diferencias én la d~ración de la escolaridad de dicho
estudiante. Por tanto, ei juego en t-4 podría aplicarse a un grupo de
estudiantes que han. terminado los estudios mediO,s~esdecir, trabajadores
:""r con doce años. de educación exaCtamente) o.a tUl grupo de Íicenciados
~.
universitarios, o a un grupo de estudiantes con un máster en dirección de w,
empresas. Bajo esta interpretación, e mide el número y el tipo de asigna-
:.turas estudiadas y las notas y premios conseguidos durante un programa
académico de duración fija. Los costes de la enseñanza (si existen) son en-
tonces independientes de e, de manera que la función de costes c(7],e) mide
los costes no monetarios (o psíquicos): estudiantes cón una capacidad
más baja encuentran más difícil conseguir notas altas en una institución
determinada, y tainbién más difícil conseguir las mismas notas en una Figura 4.2.3
institución más competitiva. Así, la utilización de la educación por parte
de la empresa como señal, refleja el hecho de que las empresas contratan
y pagan m~s a los mejores estudiantes de una institución determinada y
a los estudiantes de las mejores instituciones.
También supone Spence que la competencia entre las empresas hará
El supuesto crucial en el modelo de Spence es que los trabajadorescon
que los beneficios esperados sean cero. Una forma de incorporar este
poca capacidad encuentran la señalización más cara que los trabajadores
supuesto a nuestro modelo sería sustituyendo las dos empresas en la
con capacidad más alta. De un modo más preciso, el coste marginal de
etapa (3) por un único jugador llamado mercado que hace una oferta .s~-
la educación es más alto para trabajadores de baja capacidad que para los
larial únic'a w y que recibe la ganancia -[Y(T7,e) - w]2 (Esto cOl1vertma
de capacidad alta: para cada e,
el modelo en uno de la clase de juegos de señalización con un receptor
definidos en la sección anterior.) Para maximizar la ganancia esperadil,
196/ JUEGOS DINÁMICOS CON INFORMACJÓN INCOMPLETA (e. 4)
Juegos de señalización / 197

como pide el requisito 2R de señalización, el mercado ofrecería un salario Curvas de


ib'lJal al producto esperado de un trabajador con educación e, dada la indiferencia
w para capacidad n
conjetura de! mercado acerca de la capacidad del trabajador después de
observar e:

w(e) = ¡.L(Ale) . y(A,e) + [1 - ¡.L(Ale)] . y(E,e), (4.2.1)


y(n,e)
donde ¡.(.4Ie) es la probabilidad que el mercado asigna a que la capacidad
del trabajador sea A. El propósito de tener dos empresas compitiendo
entre ellas en la etapa (3) es conseguir el mismo resúlta.dosm '~t::~mr a.
un jugador ficticio llamado mercado. Sin embargo, pará g.arimftzar que
las empresas siempre ofrezcan un salario igual al produétoesperado del
trabajador, necesitamos imponer otro supuesto: tras observar la elección e*(iz) e
de educación e, ambas empresas se forman la misma conjetura sobre la (';,
; },
Figura 4.2.4
capacidad del trabajador, nuevamente denotada por ¡.L(Ale). Puesto que
e! requisito 3 de señalización determina la conjetura que ambas empre-
sas deben formarse después de observar la elección de e que está en la Ahora volvemos (deforma permanente) al supuesto de que la capaci-
trayectoria de equilibrio, nuestro supuesto es realmente que las empresas dad del trabajador es información privada. Esto abre la posibilidad d~ que.
también comparten una misma conjetura tras observar la elección de e que un trabajador con capacidad baja pueda tratar de pasar por un trabaJa~or
está fuera de la trayectoria de eqlúlibrio. Dado este supuesto, ~e deduce de capacidad alta. Pueden plantearse dos casos. La ~gura 4.2.5 des~nbe
que en cualquier equilibrio bayesiano perfecto ambas empresas ofrecen el caso en el que le resulta demasiado caro a un trabajador con capacIdad
e! salario w(e) dado en (4.2.1), tal como en el modelo de Bertrand de la baja adquirir una educación e*(A), incluso si esto permitier~ engaña~ a las
sección 1.2.Blas empresas ofrecen ambas un precio igual al coste marginal empresas y hacer que le pagaran el salario w*(A). Es deCIr,en la figura
de producción. Por tanto, (4.2.1) sustituye al requisito 2R de señal.ización 4.2.5, w*(B) - c[B,e*(B)] > w*(A) - c[E,e*(A)].
'-:
en el modelo con dos receptores de esta sección. lA
y(A,e)
Para preparamos para el análisis de los equilibrios bayesianos perfec- w
tos ele este juego de señalización, consideramos primero el juego análogo
w*(A)
con información completa. Es decir, suponemos temporalmente que la
capacidad del trabajador es información del dominio público entre los ,',

jugadores, en vez de infoffi1ación privada del trabajador. En este caso, la


competencia entre las dos empresas en la etapa (3) implica que un traba- y(B,e) ,
'".'
"

jador con capacidad TI y educación e recibe el salario w(e) = Y(TI,e)~ Parlo


tanto, un tTabajador con capacidad TI elige e, que soluciona
w*(B)
':,:,
max y(-r¡,e) - c(-r¡,e).
e') ,,

Denotamos la solución con e*ü¡), como muestra la figura 4.2.4, siendo e*(B) e'(A) e
w*(-,¡) = Y['¡,e*Cr¡)].
Figura 4.2.5
Juegos de se>lalizacíóll / '199
198/ JUEGOS DINÁMICOS CON [NFORMAClÓN INCOMPLETA (c. 4)

La figura 4.2.6 describe el caso contrario, en el cual podría decirse Para completar la descripción de equilibrio bayesiano perfecto ele agru-
que el trabajador con capaCidad baja envidia el salario y nivel de edu~ pación nos falta (i) determinar la conjetura ele la~ empresas p,(A le) para
cación del trabajador con capacidad alta (es decir, ?U'(E) - dE,e'(E)] < las elecciones de educación e =1 ep fuera del eqUlltbno, que entonces de-
?U'(A) - dE,e'(A)]). Este último caso es más realista y (como veremos) termina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),
más interesante. En un modelo en el que la capacidad del trabajador tiene y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador a
más de dos valores, el primer caso se plantea sólo si cada valor posible de la estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1 e-
capacidad es suficientemente diferente de l~s valores posibles adyacentes. presentan los requisitos 1 y 2E de señalización respechvame~te: CO~l~O
Si la capacidad es una variable continua, por' ejemplo, entonces se da el apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2R de senaltzaclon
último caso. en este modelo con dos receptores.
Una posibilidad es que las empresas crean que cualquier niv.elde ed~l-
cación distinto de ep indica que el trabajador tiene Wla capaCIdad baja:
p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podría parecer ex-
traña, nada en la definición de equilibrio bayesiano perfecto la e~c1L1ye,
porque los requisitos del 1 al 3 no imponen restricci~~es a las conjeturas
situadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en un
juego de señalización. El refinamiento que aplicamos en la sección 4.4 res-
tringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en un
juego de señalización; en particular excluye la conJ::ura que anahzamos
aquí. En este análisis de los equilibrios de agrupaclOn ~~s cent:3mos en
esta conjetura para simplificar la exposición, pero tamblen conSIderamos
w*(B} __
,_,__
. brevemente conjeturas distintas.
Si la conjetura de la empresa es

apara e =1 ep (4.2.3)
e*(B} e*(A) ~L(Ale) = { q para e = ep

entonces (4.2.1) implica que la estrategia de las empresas es


Figura 4.2.6
_ {Y(E ,e) para e =1 ep (4.2.4)
w(e) - wp para e,. -- e-p'
Como describimos en la sección anterior, en este modelo pueden exis-
;: .. Un trabajador con capacidad 7] escoge por lo tanto e como solución de
'.:.",' tir tres casos de equilibrios bayesianos petf~i:tos: de' ~i;rupación, de sepa-
ración e híbrido. Normalmente existen numerososdsos de cada clase de (4.2.5)
max'w(e) - c(7/,e).
equilibrio; aquí l~mitamos nuestra atertci6riáiirios cüant~s ejemplos. En
un equilibrio de agrupación, los dos tipos del trabajador eligen un nivel de La solución de (4.2.5) es simple: un trabajador con capacidad 7] elige o
educación único, digamos ep' Elrequisit03'de señéiliúción impli<;aque epa el nivel de educación que maximiza 'y(13,e) - c(T/,e). (Este último es
la conjetura de las empresas después de observar ep debe ser lac'onjetura precisamente e'(E) en el caso del trabajador de capacidad baja.) E.n el
a priori p,(Alep) = q, que, a su vez, exige que el salario ofrecido después de ejemplo descrito en la figura 4.2.7, lo primero es óptimo para .ambos t.lpOS
-.':: .
observarep sea del trabajador: la curva de indiferencia del trabajador de baja capaCldad
que pasa por el punto [e'(B),w'(B») queda por debajo de la curva de
(4.2) indiferencia del mismo tipo que pasa por el punto (ep,wp), y la curva
2(JO ! JUEGOS DINÁMICOS CON INfORMACiÓN INCOMPLETA (c. 4) Juegos de seiializnción / 201

de indiferencia del trabajador con capacidad alta que pasa por el punto trab~jador constituyen otro equilibrio bayesiano de agrupación. Como
(ep'll)p) está por encima de la función de salario tu = y(B,e). ejemplo de lo último, supongamos que la conjetura de las empresas es
cOffi9 en (4.;2.3), con la excepción de que cualquier nivel de educación por
y (A,e) encima de el! se interpreta como que el trabajador se escoge al azar de la
distribu.ción de capacidades:

O para e :S el! excepto cuando e = el'

q y(A,e) ¡L(Ale) = q para e = el'


{ q para e > el!;
"
1.:.;.
+ ( 1 - q) y(R,e)

donde el! en la figura 4.2.7 es el nivel de educación en el cual la curva


y (R,e) de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'wp) corta la función de salarios w = q . y(A,e) + (l - q) . y(B,e). La
estrategia de las empresas es entonces (,',

. {Y(B,e) para e :S el! excepto cuando e = el'

U
w(e) = wq para e = el'
e*(B) e' e para e> el!.
Wq

-,.Esta conjetura y esta estrategia de las empresas, y la estrategia (e(B) =


Figura 4.2.7
-e;,e(A) = el') deltrabajádor constituyen un tercer equilibrio bayesiano
perfecto de agrupación.
En resumen, dadas las curvas de indiferencia, las funciones de pro- Ahora vamos a tratar equilibrios de separación. En la figura 4.2.5;
ducción y el valor de el' en la figura 4.2.7,la estrategia [efE) = ep,e(A) = el'] (el caso donde no hay envidia) el equilibrio natural bayesiano perfecto
del trabajador, y la conjetura ¡L(Ale) en (4.2.3)y la estrategia w(e) en (4.2.4) ~-d~ separación incluye la estrategia [e(B) = e'(B),e(A) = e'(A)] del tTab'¡i. "
0'

de las empresas constituyen un equilibrio bayesiano perfecto de agru- j'ldor. El requisito 3 de señalización determina entonces la conje~ de
pación.
---lasempresas después de observar cualquiera de estos dos niveles deedu-
Existen muchos otros equilibrios bayesianos perfectos de agrupación cación (concretamente ¡L[Ale'CB)] = OY ¡L[A\e'CA)] = 1), por lo que C4.2.1)
en el ejemplo definido por las curvas de indiferencia y las funciones de implica que w[e'CB)] = w'(B) y w[e'(A)l = w'CA). Corno enla discusión
producción de la figura 4.2.7. Algunos de estos equilibrios incluyen una de los equilibrios de agrupación, para completar la discusión de estos
elección de un nivel de educación diferente por parte del trabajador (es _.equilibriosbayesianos perfectos de separación nos queda: (i) establecer la ",<
decir, un valor de el' distinto del de la figura); otros incluyen la misma conjetura ¡L(A[e) de las empresas para elecciones deniveles de educación
elección de un nivel de educación pero difieren fuera de la trayectoria de f}1eradel equilibrio (es decir, valores de e Pistíntos de e'CB) o e'CA)), la
,'.
equilibrio. Como ejemplo de lo primero, sea e un nivel de educación entre - ~ c~al determina entonces el resto de las estrategias wCe) de las empresas a_ '.',',','

ep y el, donde el en la figura 4.2.7 es el nivel de educación en el eualla curva .. partir de (4.2.1), y (ii) demostrar que la mejor respuesta de un trabajador 1'.>.,
de indiferencia del trabajador de baja capacidad que pasa por el punto de capacidad r¡ a la estrategia w(e) de las empresas es elegir e = e'Cr¡).
(e'(B)¡w'(B») corta la función de salario w = q . y(A,e) + (l - q) . y(B,e). Una conjetura que cumple estas condiciones es que el trabajador tenga
01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategia
C" '.
capacidad alta si e es al menos e'CA), y capacidad baja en cualquier otro
resultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del caso:
"
________ .:..-- 1::'•••
202 / JUEGOS DlNÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4) Juegos de se¡laliznció" / 2m

y(A,e)

10
O para e < e'(A)
p,(Afe) = { 1 para e.2: e'(A). (4.2.6)
y(A,e,J

w'(A)
La estrategia de las empresas es entonces y(B,e)

( _ { y(E,e) para e < e'(A)


we ) - y(A,e) para e 2: e'(A). w' (L)

Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta. e*(B) e'(A) es
a la función de salariosw = y(A,e), también es la mejor respuesta aquí.
Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuesta Figura 4.2.8
de dicho trabajador cuando la función de salarios eSw == y(E,e), de ma-
nera que w'(E) -e[B,e'(E)] es la mayor ganancia.que el trabajador puede ., de e uilibrio, de las conjeturas de las emjJr~sas
lograr de entre todas las elecciones de e < e'(A), Puesto que las cur~. Una expreslOn, fuera .q ., . Itrabajador tIene
que sustenta este comportamiento de e~Ulhbno es que ~o'
vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:
capacidad alta si e 2: e., y capacidad baja en caso contra .
diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] es
la mayor ganancia que puede conseguir; aquí un trabajador de baja ca- O para e < es
pacidad de entre todas las elecciones de e 2: e'(A). Por tanto, e'(E) p,(Aje) = { 1 para e 2: e.,.
es la mejor respuesta de un trabajador de baja capacidad, puest? qu~
w'(E) - dE,e'(E)] > w'(A) - dE,e'(A)] en el caso en que no hay envidia_ La estrategia de las empresas es entonces
A partir de aquí ignoramos el caso en el que no hay envidia. Como y(E ,e) para e < es
sugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es más inte"' -- w(e) = { y(A,e) para e 2: es.
resante. Ahora el trabajador con capacidad alta no puede ganar el salario
alto roCe) = y(A,e) simplemente eligiendo la educación e'(A) queelegiña . cidad baja tiene dos
Dada esta función de salarios, el trabaJado.r con capa. ar' (A,e,).
bajo información completa. En su lugar, para señalizar su capacidad, el ". .. . l . '(E) ganar 1}! (B) y elegIr es y gan.l/ .
mejores respuestas: e eglr e y . f d p'(JJ)' al.
trabajador con capacidad alta debe elegir e., > e'(A), .como muestra la ue esta indiferencia se resuelve en avor e ~ ,
Vamos a suponer q .' f dad arbitrariamente
figura 4.2.8, puesto que el trabajador con capacidad baja imitará cualquier . '" d 'amos aumentar es en una can 1 .
temativamente po n .. 'd d b J'aprefiriera estnc-
valor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tiene - d ue el trabajador con capaCl a a
pequena e manera q ,... 'd d alta las elecciones
capacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de' tamente e'(E), En cuanto al trabajador con capan a , .' d
separación incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabaja- . .
. de e > e son lnfenores a e" ya que e.,.
> e'(A). :Puesto que,
las LUlvas e
'j'
dor y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salarios s . 'dad baJ'a llenen mas pem lente que
indiferencia del trabaJador con capacI . 1 '1 .
de equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. Éste es .d d lta la curva de indiferenCla de u t11110
las del trabajador con capacl a a , ., 1 .'
el único comportamiento en equilibrio que sobrevive al refinamiento que »
que pasa por el punto ( e"y. (A ,es está por encima de la funclOn de s.a allos b"
aplicaremos en la sección 4.4. .
w = y(B,e) para e < e" por o
1 que las. elecciones de e < es son tam len
20-1 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4) Juegos de señaliznción / 205

inferiores. Por lo tanto, la mejor respuesta del trabajador con capacidad y la inferencia usual tras la separación da M(.4.leB) = O.Tres observaciones
alta a la estrategia de las empresas w(e) es e•. pueden ayudamos a interpretar (4.2.8): en primer lugar, puesto que el
Como en el caso de los equilibrios de agrupación, existen otros equi- trabajador con capacidad alta siempre elige eh, pero el trabajador con \:.'
librios de separación que incluyen diferentes elecciones de niveles de capacidad baja sólo lo hace con probabilidad 7f, observar eh indica que es
educación del trabajador con capacidad alta (el trabajador con capacidad más probable que el trabajador tenga capacidad alta, con lo que M(Aleh) >
baja siempre se separa en e*(B); véase lo que sigue) y otros equilibrios de q. En segundo lugar, cuando 7f tiende a cero, el trabajador con capacidad
separación que incluyen las elecciones de educación e*(E) y es pero di- baja nunca se agrupa con el de capacidad alta, por lo que ¡L(Aleh) tiende a
fieren fuera de la trayectoria de equilibrio. Como ejemplo de lo primero, urio. En tercer lugar, cuando 7f tiende a uno, el trabajador con capacidad
¡ "
sea e un nivel de educación mayor que es pero lo suficient~mente pe- baja casi siempre se agrupa con el de capacidad alta, por lo que M(Aleh)
queño como para que el trabajador con alta capacidad prefiera señalizar tiende a la conjetura a priori q.
su capacidad eligiendo e en lugar de inducir a pensar que tiene capaci- Cuando el trabajador con capacidad baja se separa del que tiene ca-
'.' ;;'
dad baja: y(A,e) - c(A,e) es mayor que y(B,e) - c(A,e) para cada e. Si pacidad alta eligiendo eB, la conjetura M(AleB) = O implica el salario
sustituirnos es por e en ¡L(Ale) y w(e) que acompañan a la figura 4.2.8, la w(eB) = y(B,eB)' Se deduce entonces que eB debe ser igual a e*(B): la
conjetura y la estrategia resultantes para las empresas, junto con la es- única elección del nivel de educación en la cual el trabajador con capaci-
trategia re(E) = e*(E),e(A) = e] del trabajador constituyen otro equilibrio dad baja puede ser inducido a separarse (probabilísticamente corno aquí
perfecto de Nash de separación. Corno ejemplo de lo último, sea la conje- o con certeza, corno en los equilibrios de separación discutidos anterior-
tura de las empresas sobre niveles de educación que están estrictamente mente) es la elección de educación con información completa e*(B) de
entre e*(A) y es estrictamente positiva pero lo suficientemente pequeña, dicho trabajador. Pa~a ve'r esto, supongamos que el trabajador con capa-
de manera que la estrategia resultante w(e) esté estrictamente por debajo ddad baja se separa eligiendo algún eB '1 e*(B). Tal separación alcanza la
de la curva de indiferencia del trabajador con baja capacidad que pasa por ganancia y(13,eB) - c(B,eB), pero de elegir e*(E) obtendría una ganancia
el punto (e* (B),w* (B». de al menos y[E,e*(B)] - c[E,e*(B)]Ca de más si la conjetura de lasem-
Concluirnos esta sección con una breve discusión sobre los equilibrios presas M[Aie* (E)] es mayor que cero) y la definición de e*(B) implica que
híbridos, en los cuales un tipo elige unnivel de educa<;ión con certeza, y[E,e*(E)] - c[E,e*(E)] es mayor que y(E,e) - c(E,e) para cada e '1 e*CB). " ,"

pero el otro tipo elige aleatoriamente entre la agrupación con el primer Por lo tanto, no existe una elección de nivel de educación eB '1 e*CE)
tipo (eligiendo el nivel de educación del primer tipo) y la separación del tal que el trabajador con capacidad baja pueda ser~inl:l1J:ci~?_ <l. separarse
primer tipo (eligiendo un nivel de educación diferente). Analizarnos el eligiendo eB.
caso en el cual el trabajador con baja capacidad escoge aleatoriamente; el Para que el trabajador con capaqgad baja esté dispuesto. aescoger ~ea-
ejercicio 4.7 trata el caso complementario. Supongamos que el trabajador toriamenteentre separarse en e*(E) y agruparse en eh, el salario w(eh) = Wh
con capacidad alta elige un nivel de educación eh (donde h quiere decir cl~behacer que el trabajador sea indiferente entre ambo~:
híbrido), pero el trabajador con capacidad baja elige aleatoriamente entre
eh (con probabilidad 7f) y eH (con probabilidad 1 - 7f). El requisito 3
w*(B) - c[B,e*(E)] = 'Wh - c(E,eh). (4.2.9)
de señalización (convenientemente extendido para incluirlas estrategias
mIxtas) determina entonces la conjetura de las empresas tras observar eh .Sin embargo, p?U'aque 'Whsea un salario de equilibrio para las empresas,
() ea. Con la regla de Bayes se obtiené
(4.2.1) y (4.2.8) implican que
, ....
(4.2.8)
q . (1 - q)7f
Wh = ---~. y(A,e¡.) + (1 ). y(E,eh). (4.2.10}
6 Recordemos de la nota 2 ele! capítulo 3 que la regla de Rayes establece que P(AIB) = q + (l - q)7f q + - q 7f
p(A.m/ P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).
1-'(04), por lo que P(AIE) = P(BIA). 1-'(04)/ P(B).
JlIegos de sel1alizIlciríll / 207
206 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Para un valor determinado de eh, si (4.2.9) da que '/1)h < y(A,eh), entonces de la figura 4.2.8. Ciertamente, cuando eh tiende a es, r tiende al, :ie
(4.2.10) determina el valor único de que constituye un equilibrio híbrido
7["
manera que rrtiende a cero. Por tanto, el equilibrio de separación descnt~
en el cual el trabajador con capacidad baja escoge aleatoriamente entre en la figura 4.2.8 es el límite de los equilibrios híbridos conSIderados a~ul.
e*(E) y eh, mientras que si '/1)h > y(A,eh), no existe ningún equilibrio Para completar la descripción del equilibrio bayesiano perfe:to híb:ldO
híbrido que incluya eh. de la figura 4.2.9, sea la conjetura de las empresas que el trabajador t1ene
capacidad baja si e < eh yen cualquier otro caso, que tiene capacidad alta
con probabilidad r y baja con probabilidad 1 - r:
w
O para e < eh
y(A,e)
/.L(A\e) = { r para e 2': e".

La estrategia de las empresas es entonces

y(E,e) para e < eh


r y(A,e) . w(e) = { r . y(A,e) + (l - r) . y(B,e) para e 2': eh.
+ O - r) y(B,e)
Sólo queda por comprobar que la estrategia del trabajador (e(B) = e" con
w~ probabilidad 7[",e(B) =
e*(E) con probabilidad 1 - 7[";e(A) = eh) es una
q y(A,e) mejor respuesta a la estrategia de las empresas. Para'el trabajador con
+,0- q) y(B,é) capacidad baja,la e < eh óptima es e*(B) y la e 2': eh óptima es el~' Para el
, trabajador con capacidad alta, eh es superior a todas las alternatlvas.
,,
,
y(B,e) 4.2.C Inversión empresarial y estructura de capital
'~

Consideremos un empresario que ha formado una empresa pero necesita


w*(B)
. 1:, financiación exterior para llevar a cabo un nuevo y atractivo proyecto. El
empresario tiene información privada sobre la rentabilidad actual de la
' .. '
'.' empresa, pero la ganancia del nuevo proyecto no se puede separar d: ~a
e*(B) e
ganancia de la empresa; lo único que se puede observa¡:..es el benefJC~o
agregado de la empresa. (Podríamos permitir también que el empresano
Figura 4.2.9
tuviera información privada sobre la rentabilidad del nuevo proyecto,
pero sería una complicacióÍl innecesaria.) Supongamos que el e~l~resario
ofrece a un inversionista potencial una participación en los benefiCJosde la
La figura 4.2.9 ilustra de forma implícita el valor consistente con el
7["

empresa a cambio de la financiación necesaria. ¿Bajo qué circunstancias


valor indicado de eh. Dado eh, el salario 11Ihes una solución de (4.2.9); por
se llevará a cabo el nuevo proyecto y cuál será la participaciél11"enlos
lo que el punto (eh/wh) está en la curva de indiferencia del trabajador con
..... beneficios de la empresa?
baja capacidad que pasa por el punto [e*(E),11I*(E)]. Dado 11Ih < y(A,eh),
la probabilidad r es una solución de r . y(A,eh) + (l - r) . y(E,eh) = 11Ih. Para transcribir este problema a un juego de señalización, suponga IDOS
Esta pr~ba~~lidad es la conjetura en equilibrio de las empresas, por lo que que los beneficios de la empresa antes del proyecto pueden ser altos o
bajos: = A b E, donde A > B > O. Para capturar la idea de que el
(4.2.~)s~~fica que = q(l-r)/r(l
7[" - q). La figura también muestra que la 7["

restrlCclOn11Ih-< y(A,eh) es equivalente a eh < es, donde es es la educación nuevo proyecto es atractivo, supongamos que la inversión requerida es 1,
elegida por el trabajador con capacidad alta en el equilibrio de separación la ganancia será R, la rentabilidad alternativa para el inversor potencial r

o.'
::'08;' JUEGOS DINÁMICOS CON INfORMACiÓN INCOMPLETA (c. 4) Juegos de sel1aliZJlcián !209

)' n > JO + 1'). Describimos a continuación el desarrollo temporal y las


ganancias: 1(1 +1') R
. < --o (4.2.13)
pB + (1 - p)A + R - A + R
1. El azar determina el beneficio de la empresa antes del proyecto. La Si p está lo suficientemente cerca de cero, (4.2.13) se cumple porque R >
probabilidad de que 1f == B es p. 1(1 + 1'). Sin embargo, si p está lo suficientemente cerca de uno, (4.2.13) se

2. El empresario conoce 1f y ofrece al inversor potencial una participación .' cumple sólo si
en los beneficios de la empresa, s, donde O::; s ::; 1. ., 1(1 + r)A
R - 1(1 + 1') 2: R - B. (4.2.14)
3. E~inversor observa s (pero no 1f) y decide si aceptar o rechazar la
oterta. Intuitivamente, la dificultad de un equilibrio de agrupación es que el tipo
4. Sí el inversor rechaza la oferta, su ganancia es lO + r) y la del empre- de beneficio alto debe subvencionar al tipo de beneficio bajo: haciendo
sano es 1f. Si el inversor acepta s, su ganancia es de s(1f + R) Yla del queq == pen (4.2.11) obtenemos s 2: 1(1 +1')/[pB+(1-p)A+RJ, mientras que
empresario O - s)(1f + R). si el inversor supiera con seguridad que 7r == A (es decir, q == O),. entonces
aceptaría una participación menor en los beneficios s 2: 1(1 +1')/(A+R). La
Myers y Majluf (984) analizan un modelo como éste, aunque conside- mayor participación en la empresa exigida por un equilibrio de agrupación
ran una empresa grande (con accionistas y un consejo de administración). es muy cara para la empresa con beneficios altos, tal vez tan cara como para
en lugar de un empresario (que es a la vez el director y el único accionista). hacer que la empresa con beneficios altos prefiera renunciar al proyecto.
Discuten diferentes supuestos sobre cómo lós intereses de los accionistas' Nuestro análisis muestra que existe un equilibrio de agrupación si pestá
podrían afectar la utilidad de los directivos; Dybvig y Zender (991) deri~. cerca de cero, por lo que el coste de la subvención es pequeño, o si (4.2.14)
van ~l contrato óptimo que los accionistas pueden ofrecer a los directiv~s .. se cumple, de manera que el beneficio del nuevo proyecto sobrepasa al
Este es un juego de señalización muy simple en dos aspectos: el coste de la subvención.
conjunto de acciones factibles del receptor es muy limitado, y el del emisor Si (4.2.13) no se cumple, no existe equilibrio de agrupación. Sin
es mayor pero poco influyente (cOri10veremos). Supongamos que tras embargo, siempre existe uno de separación. El tipo de beneficio bajo
reCIbir la oferta .5 el inversor cree que la probabilidad de que 1f == B es q. ofrece s == 1(1 + 1')/(B + R), que el inversor acepta y el tipo de beneficio
Entonces el inve,!sor aceptará s si y sólo si alto ofrece s < 1(1 + 1')/(A + R), queel inversor rechaza. En tal equilibrio
la inversión es ineficientemente baja: el nuevo proyec~o es rentable con
s[qB+ (l - q)A + R] 2: 1(1 + r). (4.2.11)
toda seguridad, pero el tipo de aÚo beneficio renuncia a la inversión. Este
equilibrio ilustra en qué sentido el conjunto de señales factibles del emi-
En cuanto al empresario, supongamos que los beneficios de la compañía sor es poco efectivo; el tipo de alto beneficio no tiene forma de sobresalir;
ant.es del proyecto son 1f, y consideremos si el empresario prefiere recibir unos términos de financiación que son atractivos para el tipo de beneficio
la financiación a cambio de la participación en los beneficios de la empresa alto son aún más atractivos para el de beneficio bajo. Como observan
o renunClar al proyecto. Lo primero es superior si y sólo si Myers y Majluf, en este modelo las empresas se ven empujadas hacia el
endeudamiento o hacia fuentes de financiación interna.
R Concluimos considerando brevemente la posibilidad de que el em-
s<-- (4.2.12)
-1f+R presario pueda tanto endeudarse como ofrecer participaciones en los be-
. En un equilibrio bayesiano perfecto de agrupación, la conjetura del neficios. Supongamos que el inversor acepta ofrecer un crédito D. Si el
Inversor debe ser q == p después de recibir la oferta de equilibrio. Como empresario no quiebra, la ganancia del inversor es D y la del empresario
la reslTÍcción en la participación (4.2.12) es más difícil de satisfacer para 1f + R - D; si el empresario quiebra, la ganancia del inversor es 1f + R

Ir == A q~e ~ara 1f == B, la combinación de (4.2.11) y (4.2.12) significa que Y la del empresario es cero. Como B > O, siempre existe un equilibrio
un equlhbno de agrupacióÍ1 sólo existe si de agrupación: los dos tipos de beneficios ofrecen el contrato de deuda
J¡¡egos de sáializnci')/1 I 211
210 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

D = JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficien- modelo con dos periodos es, por tanto, el siguiente:
temente negativo como para queR +B < JO + 7"), el tipo de beneficio
bajo no podría devolver su deuda, por lo que el inversor no aceptaría el 1. El azar determina el tipo e de la autoridad monetaria. La probabilidad
contrato. Aplicaríamos un argumehto'similar siH y A fueran benefiCiti;:' de que e =Des p.
esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ . 2. Los empresarios forman sus expectativas de inflación para el primer
que los beneficios actuales de !él empresa serán 1r+ J{ con probabilidad periodo, 1rj.
1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hay 3. La autoridad monetaria observa 1rj y escoge el nivel real de inflación
una probabilidad de 1/2 de qué el tipo de beneficio bajo no sea capaz del primer periodo, 1rI.
de devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptará el 4. Los empresarios observan 1rI(pero no e) y forman sus expectativas de
contrato. . inflación para el segundo periodo, 1r2.
5. La autoridad monetaria observa 1r2y escoge el nivel real de inflación

4.2.D Política monetaria del segundo periodo, 1r2.

Como indicamos en la sección 4.2.A, hay un juego de señalización de un


~n esta sección añadimos información pTivada ~ unaver~ión condospe~,
periodo incluido en este juego de política monetaria con dos periodos. El
nodos del juego repetido de polítical)1onetaria analizado. en la sétdóif
mensaje del emisor es la elección de la inflación por parte de la autoridad
2.3.E. Como en el modelo de Spence, eXisten mucho~ equilibrios baye~ia~'
monetaria en elprimer periodo, 1rI-y la acción del receptor es la expectativa
nosperfectosdé agrupación,lubridos yde s~parac!ór( Como ya discúti'G
de inflación' de los empresarios en el segundo periodo, 1r2. La expectativa
mas estos' equilibrios con detalle enJa sección4.2.S; aquí sólo esb~zéillio~>
délos empresarios en el primer periodo y la elección del nivel de inflación
los teínasmás'importantes.VéaseVlckers (986) péiriFlos detálle~de~
de la autoridad monetaria en el segundo preceden y siguen al juego de
un análisis similar con dos periodos yBarro (986) para un modelo de,.
reputación con muchos periodos. señalización respectivamente.
Recordemos que en el problema con un periodo (es decir, en el juego
Recordemos, de la sección 2.3.E, que la ganancia por periodo de la
de etapa del juego repetido analizado en la sección 2.3.E) la elección
autoridad' monetaria es .
óptima de. 7r por parte de la autoridad monetaria dada la expectativa
de los empresarios, 1re, es '
'"t

donde 1res elnivelreal de inflación, 1reesJa expectativa de inflación d~Jo~ 1r*(1re) = ~2[(l - b)y* + d1re].
c+d
empresarios e y* es el nivel eficiente de producción. Para los empresarios,:
la ganancia por periodo eS~(1r-1re)2; En nuestro modelo con dos periodos, El mismo argumento indica que si el tipo de la autoridad monetaria es c,
la ganancia de cada jugador es simplemente la suma de sus ganancias eh su elección óptima de 1r2dada la expectativa 1r2es
cada periodO('vV(1rI,1rj)+ W(1r2,1r2) y -(1rI _1rj)2 - (1r2 - 1r2)2, donde1rt es
el nivel.real de inflación en el periodo t y 1ri es la expectativa (al priricipio ~[O- b)y' + d1r21 =. 1r:i.(1r2'c).
del penado t) de inflación en el periodo~ por parte de los empresarios. c+d
El parámetro e en la función de ganancias W(1r¡rre) refleja el dilema de Previéndolo, si los empresarios empiezan el segundo periodo creyendo
la autoridad monetaria entre los objetivos de inflación cero y producción que la probabilidad de que e = D es ,!,se formarán la expectativan2(q) de
eficiente. En la sección 2.3.E, este parámetro era inlonnación del dominio forma que maximice
público. Suponemos ahora, en cambio, que esteparámetroes inlonnación
privada de la autoridad monetaria: e = Fa D (por "fuerte" y "débil'~ en (42.15)
la lucha contra la inflación); donde F > D > O. El desarrollo temporal del


~ 12 ! JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
Otras aplicaciones del equilibrio bayesiano perfecto! 213

En un equilibrio de agrupación, ambos tipos escogen la misma in- 4.3 Otras aplicaciones del equilibrio bayesiano perfecto
flación para el primer periodo, digamos 7r*,por lo que la expectativa de ,
los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria de
4.3.A Juegos con parloteo (cheap-talk games)
equilibrio, los empresarios empiezan el segundo periodo creyendo que la
probabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).
Los juegos con parloteo son análogos a los juegos de señalización, pero en
La autoridad monetaria de tipo c escoge entonces su inflación óptima para'
aquellos juegos los mensajes del emisor consisten en un mero parloteo (ca-
el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],fina- (i.
rente de coste alguno, que no es vinculante, y cuyo contenido son declara-
lizando con ello el juego. Para completar la descripción de este equilibrio,
ciones no verificables), Tal parloteo no puede ser informativo en el juego
queda (como siempre) definir las conjeturas del receptor fu~~a del equi-. de senalizacióh' de 'Spence: un trabajador que simplemente anuIlciara ,
Iibrio para calcular las correspondientes decisiones fuera del equilibrio ~.'.
"mi capacidades ?Ita" nI? sería creído. Sin embargo, eIl otros c:ontéxfos:
utilizando (4.2.15), y comprobar que estas decisiones no crean ningún
este tipo de comiúücacióri previa puede ser informativo. Como ejemplo "

':
incentivo a desviarse del equilibrio para ningún tipo del emisor.
sencillo, consideremos las posibles interpretaciones de la frase "sube la
En un equilibrio de separación, los dos tipos escogen niveles de in- bolsa"? En aplicaciones conrrf1iyor interés económico; Stein' (1989)'dec-
flación diferentes en el primer periodo, digamos 7[D y 7rF, por lo que la muestra que las meras declaraciones de la autoridad monetaria pueden
expectativa de los empresarios en el primer periodo es 7rí = P7[D+(1-phF. ser informativas aunque no puedan ser demasiado precisas, y Matthews
Después de observar 7[D, los empresarios empiezan el segundo periodq' (1989)estudia cómo una amenaza de veto por parte del presidente de los
creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9 Estados Unidos puede influir en la forma corno se aprueba el presupuesto,
modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo débil e~coge ei1~ en el Congreso norteamericano. Además de analizar elefecto,delparl6~
tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~
teo en:un contexto determinado, uno también puede preguntarse cómo
completar la descripción de este equilibrio,. no.'sólo queda, corno antes~
diseñar contextos para' aprovechar esta forma de comunicación~ En 'este
detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~
sentido, Austen-Smith (1990) demuestra que, en algunos casos, debates
probar que ningún tipo del emisor tiene incentivos para desviarse, sino
entre legisladores que actúan según su propio inh;rés acaban mejorando el
también comprobar que ningún tipo tiene incentivos pala imitar el cmn-,
valor social de la legislación que se aprueba, y Farrelly Gibbons (1991)de-
pOltamiento en equilibrio del otro. Aquí, por ejemplo, el tipo débil podría
muestran que, en algunos casos, la implantación sindical en uIla empresa
pensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !ª
mejora el bienestar social' (a pesar de la distorsión que crea:n el nivel .de
expectativa de los empresarios en el segurido periodo fuera 7[2(0),pero
empleo descrita en la sección2.1.C) porque facilita la coIIÍünicaciónentré
escoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuera la fuerza de trabajo y la dirección." ,c, ..

demasiado baja para el tipo débil, la expectativa consiguiente 7[2(0)podría ,r.

El parloteo no puede ser informativo en el modelo de Spence por-


ser tan baja que el tipo débil recibiera una ganancia enorme debido a la
que todos los tipos del emisor tienen las mismas preferencias en relación
inflación inesperada 7[i[7[2(O),D] - 7r2(O) en el segundo periodo. En un
con las posibles acciones del receptor: 'todos los trabajadores prefieren
equilibrio de separación, la inflación escogida en el primer periodo por el
salarios altos, independientemente de su capacidad. ~ara ver por qué tal
tipo fuerte debe ser lo suficientemente baja corno para que el tipo d~bil
uniformidad de preferencias entre los tipos del emisor vicia el parloteo
no sienta la tentación de imitarle, a pesar del ben~ficio que obtendría por
(en el modelo de Spence y más en general), supongamos que existiera un
la inflación inesperada en el segundo periodo. Para muchos valores de
equilibrio con estrategias puras en el cual uri subconjunto de los tipos del
los parámetros, esta restricción hace que 7[F sea menor que ei nivel d~
inflación que el tipo fuerte elegiría bajo información completa, delrrJsmo
7 En la versión en inglés del libro, la frase que originalmente aparece es "Hey, look out for that
modo que el trabajador con capacidad alta invierte más de la cuenta en bus!", que puede traducirse como "¡Cuidado con ese autobús!" o como "¡Espera ese autobús!",
educación en un equilibrio de separación del modelo de Spence. de endiendo del contexto. La fraseqúe nosotros incluimos aquí es una de las muchas frases en
ca~ellano que puede tener signifiéadosc?mpl"tamente diferentes dependiendo del contexto. '
Ésta es la idea que el autor quiere eXpresar. (N. de los T.).
Otras aplicaciones del equilibrio bayesinno prr!,'cfo / 215
214 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

emisor, TI, envía un mensaje mI, mientras que otro subconjunto de tipos; de las fuerzas básicas que operan en los juegos con parloteo. En esta
sección, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamos
T2, envía o.tro mensaje, m2. (Cada Ti podría contener sólo un tipo, como
en un equilibrio de separación, o muchos tipos, como en un equilibrio de sólo juegos abstractos con parloteo, dejando las aplicaciones como lectura
separación parcial.) En equilibrio, el receptor interpretará que mi viene de adicional.
Ti y tomará por tanto la decisión óptima, aú dada su conjetura. Come:,to" El desarrollo temporal del juego con parloteo más sencillo es idéntico
dos los tipos del emisor tienen las mismas preferencias sobre las acciones al del juego de señalización más sencillo; sólo cambian las ganancias.
a tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen esta
preferencia y enviarán el mensaje mI en lugar de m2, destruyendo con ello 1. El azar escoge un tipo ti del emisor, de un conjunto de tipos factibles
el equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teo T = {tlJ ... ,tI}, de acuerdo con una distribución de probabilidad pe!,;),
resultara. en un mensaje indicativo <leun saJaria,alto, mientras que otro donde p(ti) > O para cada í y p(tl) + ... + ]J(t[) = 1.
tipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqúier ni- 2. El emisor observa ti y escoge Ul1 mensaje mj de un conjunto de lnen-
vel d~ capacidad enviarían.el primer ni.ensaje~porlo que nópuede' existir
sajes factibles M = {mI,' .. ,mj}.
,un equilibrio en el que. el parloteo afecte los salari()s. 3. El receptor observa mj (pero no ti) y escoge entonces una acción (J.k de
, Por 10 tanto, para que el parloteo sea informativo, una condición nece- un conjunto de acciones factibles A = {al,' .. ,al(}.
saria es que diferentes tipos del emisor tengan preferencias diferentes en 4. Las ganancias vienen dadas por U E(tiak) y U R(tiak).
relación con:las acciOliesdeLreceptor, Una segunda condición necesaria,
por supuesto, es que el.receptor prefiera acciones¡,giferentesdependiendo
del ti'pó:del emisor .. (Tanto la señálizacióncomQ;ja.comurucaciónp~yia La característica clave de este juego es que el mensaje no tiene efecto di-
son inútiles si las preferencias del receptor sobre sus acciones' son inde~ recto rusobre la ganancia del emisor ni sobre la del receptor. La única
pendientes del tipo del emisor.). Una terceracondicióitnecesaria para que manera en la que el mensaje puede importar es a través de su contenido
el parloteo sea 'informativo es que las preferencias del receptór sobre sus informativo: cambiando la conjetura del receptor sobre el tipo del emisor,
acciones nlJ sean completamente opuestás alasd~emisor. Para adelantar un mensaje puede cambiar la decisión del receptor y, por tanto, afectar
',.' un último. ejemplo,supongamos que elr~~epto{prefiere.acciones bajas indirectamente a las ganancias de los dos jugadores. Como la misma infor-
cuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemi- mación puede ser comurucada en diferentes lenguajes, diferentes espacios
sores de tipos bajos prefieren acciones baja~ y los de tipos altos acciones de mensajes pueden alcanzar los mismos resultados. El espíritu del parlo-
altas, puede haber comunicación, pero si efemisor tiene ias preferencias teo es que puede decirse cualquier cosa; en consecuencia, formalizar este
opuestas no puede existir comunicación, ya que al emisorle gustaría cone concepto exigiría que M fuera un conjunto muy grande. Por el contrario,
fundir al receptor. Crawford y Sobel (1982) élIlalizanunmodelc5 abstracto suponemos que M es lo suficientemente rico para decir lo que haga falta
,,/
que satisface estas tres condiciones necesarias y establecen d()s resultados decir; es decir, M = T. Para los propósitos de esta sección, este supuesto
intuitivos: en términos informales, puede existir más comunicación por es equivalente a permitir que se diga cualquier cosa; sin embargo, para
medio del parloteo cuando las preferencias. de las jugadores están más los propósitos de la sección 4.4 (refinamientos del equilibrio bayesiano
íntimamente relacionadas, pero no puede existir comunicación perfecta a perfecto), este supuesto debe ser reconsiderado.
no ser que las preferencias de los jugadores estén perfectamente alineadas .. Puesto que los juegos con parloteo y de señalización más sencillos
tienen el mismo desarrollo temporal, las definiciones de equilibrio ba-
Cada una de .las aplicaciones económicas que acabamos de. describir
(parloteo por parte de la autoridad monetaria, amenazas de veto, debates yesiano perfecto en los dos juegos son también idénticas: un equilibrio
parlamentarios y presencia sindical) incluyen no sólo un juego sencillo bayesianó perfecto con estrategias puras en un juego con parlol<;:oes un
con parloteo sino también una modelizacion más completade un entorno par de estrategias m'(ti) y a'(mj), y una conjetura ¡.t(tdm) que satisfacen
económico. Analizar una de estas apii<:acionesexigiría describir no s<$loel los requisitos (1), (2R), (2E) Y (3) de señalización, aunque las funciones
juego sino también el modelo completo, lo que desviaría núestr<i atención de ganancias U R(túmj,o,k) Y U ECtú111.j,G.k) en los requisitos (2F,)y (2E) de
216/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4) Otras aplicaciones del equilibrio bayesimlO perfecto / 217

señalizac.ión son ahora equivalentes a URUi,a¡J y Udt."rtk) respectiva- Como en nuestra discusión anterior sobre las condiciones necesarias
mente. Sm embargo, una diferencia entre los juegos de señalización y los para que el parloteo sea informativo, hemos escogido las ganancias del
Juegos con parloteo es que en estos últimos siempre existe un equilibrio receptor de forma que prefiera la acción baja (aB) cuando el tipo del
de agrupación. Puesto que los mensajes no tienen un efecto directo sobre emisor es bajo (tB) y la acción alta mando el tipo es alto. Para ilustrar
las' . dI' .
> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, la
la primera condición necesaria, supongamos que los dos tipos del emisor
atírupaclOn es una. mejor respuesta del emisor. Puesto que los mensajes no tienen las mismas preferencias respecto de las acciones: x > Z e y > "w,
tIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor está por ejemplo, de forma que los dos tipos prefieren aB a aA' Entonces,
jugando agrupación, ignorar todos los mensajes es una mejor respuesta a los dos tipos les gustaría que el receptor creyera que t = tB, por lo
del receptor. Formalmente, sea a* la acción óptima del.receptor en un que el recepto~ no puede creer tal afirmación. Para ilustrar la tercera
equIlIbno de agrupación; es decir, a* es una solución de conciición necesaria, supongamos que las preferencias de los jugadores
son totalmente opuestas; z > x e y > w, .deforma que eltipo bajo:
del emisor prefiere laacción alta y el tipo alto la. baja, Ep.t()nces,aJB
le gustaría que el receptor <;reyera que t = tA, Y a tA le gustaría que
creyera que t. = tB, por lo que el receptor no puede creer ninguna de
Es.un equilibrio b.ayesiano perfecto de agrupación que el emisor juegue estas afirmaciones. En este juego con dos tipos y dos acciones, el único
cu::.qL1lerestrategI~ de agrupac~ón, que el receptor mantenga la conjetura caso que cumple la primera y la tercera condiciones necesariasesx. ~~.z
a F¡IOn pU') despues de cualqUler mensaje (en la trayectoria de equilibrio e y ~ 'W (los intereses ci~los jugadores están perfectamente alineados en
~ fuer~ de ella) y ~~e.~l receptor tome la acción a* después de cualquier el sentido de que, dado el tipo del emisor,jos jugCl~~rescoincideIl~l1Ja
len~aje. La cuestion mteresante en un juego con parloteo, por tanto, es acción que debería tomarse) .. ' Formalmente, en un equilibrio bayesiano
SI eXIsten equilibrios de no agrupación. Los dos juegos abstractos con perfecto de separación de este juego COI1 parloteo, la estrategia del emisor:
~arloteo 5ue discutimos a continuación ilustran sobre los equilibrios de es [mUB) = tB,m(tA) ~ tAL las conjeturas deL receptor son¡.t(tB!tB)."")
separaclOn y de agrupación parcial respectivamente. . y¡.t(tB\tA) = 0, y la estrategia del receptor. es [a{tB)= aB,aUA) ,= aA]'

Em,pezamos con un ejemplo con dos tipos y dos acciones' T = {t t } Para que estas estrategias y conjeturas formen un equilibrio, cada tiPe>del
P l( ) " B, A ,
emisor, tú debe preferir de~iI:la verdad, induciendo con ello la accióI.\ui'
ro) tB ~ p, y A = {aB,a.,!}. Podríamos utilizar un juego de señalización
COl~dos tIpO.S,dos mensajes y dos acciones, análogo al de la figura 4.2,1 a mentir, induciendo con ello aj. Por lo tanto, un equilibrio cieseparación
pal a descnblr las ?anancias en este juego con parloteo, pero las ganancias existesiysólosix;:::iey~w.' .. ~ . ,';.,
del par .(t¡,ak) son mdependientes de qué mensaje fue escogido, por lo que Nuestro segundo ejemplo es un caso eSpecial del model~ de Craw-
descnblmos los pagos utilizando la figura 4.3.1. La primera ganancia en ford y Sobe!' Ahóra, lás espacios de tipos; mensajes y acciones son con-
cada caSIlla es la del emisor, y la segunda la del receptor, pero esta figura tinuos: el tipo del emisor se distribuye unifórni.emente entre cero y uno
//0 es un juego en forma normal, simplemente recoge las ganancias de los (formalmente, T = [0,1] Y p(t) = 1 para todo.terrT);,e1'espacio de men-
jugadores para cada par tipo-acción. sajes es el espacio de tipos (M = T); y el espacio de acciones es el inter-
valo de cero a uno (A = [0,1]). La furiCión de ganancias del receptor es
', .... '
UR(t,a) = -(a - t)2, Y la del emisor es UB(t,a) :"':"-[a ~ (t+ b)]2, de forma
tB tA
que cuando el tipo del emisores t, la acción óptima del receptor es a ';"t,
aB 1:,1 y,O a.
pero .1i:i acdón óptiina' del' e-mi'sores =- t + b. Por 10 tanto, diferentes
(LA Z,O "W,1 tipos dei emisor tienen diferentes preferencias respecto de las acciones
del receptor (más precisam~nte, tipos altos prefieren acciones altas), y \',"

las preferencias de los jugadores no son completamente opuestas (más .•.


Figura 4.3.1 precisamente, el parámetro b'> o mide la similitud de las preferencias de
218 !JUEGOS DlNÁMICOS CON INFORMAClÓN'lrKOMPLETA (c. 4)
Otras aplicaciolles del equilibrio bayesiallo pa/écfo ! 219

los jugadores, cuando b está cerca de tero los intereses de los jugadores o Xl = 0/2) - 2&, Como el espacio de tipos es T = [0,1], T] debe ser
están más alineados),
positivo, por lo que un equilibrio de dos escalones existe sólo si .') < 1/4;
Crawford y Sobel demuestran que todos los equilibrios bayesianos para &:?: 1/4 las preferencias de los jugadores son demasIado cl1ferentes
perfectos en este modelo (yen una amplia clase de modelos relacionados) , para permitir incluso esta comunicación tan limitada.
son equivalentes a un equilibrio de agrupación parcial dé la siguiente
forma: el espacio de tipos está dividido en n intervalos [O,.');I),[XI,X2),' ."
[xn_l,l]; todos los tipos en un mismo intervalo envían el mismo mensaje, Punto medio
pero tipos en intervalos diferentes envían mensajes diferentes, Como
indicamos anteriormente, un equilibrio de agrupación (n = U'siempre
existe, Demostraremos que, dado el valor del parámetro de similitud de
preferencias b, ,existe uh número máximo de intervalos (o "escalones")
que pueden darse en equilibrio, denotado poi n*(b), y existen equilibrios
de agrupación parcial para cada n = 1,2,. , . ,n*(b), Una disminución de b
a=l
aumenta n*(b) (en este sentido, puede haber más comunicación a través
del parloteo cuando las preferencias de los jugadores están más alineadas),
Además, n*(b) es finito para todo b > 0, pero tiende a' ihfimto cuando b
t+b
tiende a cero (no puede existir comunicaciónperfect<:i a:no ser que las
preferencias de los jugadores estén perfecti¥llénte'alineadas), U,(t,a)
Concluimos esta sección caracterizando este equilibrio de agrupación
parcial, empezando con un equilibrio de dos escalones (n = 2) como Figura 4.3.2
ilustración. Supongamos que todos los tipos en el escalón [O,XI)envían
.t l
un mensaje mientras los que están en [xI,l] enví~n otro., Después de
recibir el mensaje de los tipos [O,XI),el receptor creE;;ráque el emisor está
distribuido uniformemente en [O,XI),poi 10 que su'.acción óptima será Para completar la discusión de este equilibrio de dos escalones, trata-
xJ/2;del mismo modo, 'después de recibir el mensaje de los tipos [Xi,l], mos el tema de los mensajes que están fuera de la trayectoria de equilibrio.
:' Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~e
".;.' la acción óptima del receptor será (Xl + 1)/2. Para que los tipos en [O/Xl)
,"
,,' quieran enviar su mensaje, debe pasar que todos estos tipos prefieran la estos mensajes no existan: todos los tipos t < X] escogen un mensaje
",:,"

acción xJ/2 a (Xl + 1)/2; del mismo modo, todos los tipos por encima de aleatoriamente de acuerdo con una dish'ibución uniforme en [O,X]); todos
Xl deben preferir (Xl+ 1)/2 a X] /2. los tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con una
Puesto que las preferencias del emisor son simétricas con respecto a distribución uniforme en [xI,l]. Como hemos supuesto que M = '1', no
su óptima acción, el tipo t del emisor prefiere xJ/2 a (Xl + 1)/2si el punto hay ningún mensaje del que podamos estar seguros que no se enviará en
medio entre estas dos acciones es mayor que la acción óptima de ese tipo, equilibrio, por lo que el requisito 3 de señalización detemüna la conjetura
t + b (como en la figura 4.3.2),pero prefiere (x] + 1)/2 a Xl/2 si t + b es mayor del receptor después de cualquier mensaje posible: la conjetu.ra del recep-
que el punto medio. Por lo tanto, para que exista un equilibrio de dos tor después de observar cualquier mensaje de [O,X]) es que t se distribuye
escalones, Xl debe ser el tipo t cuya acción óptima t + b sea exactamente uniformemente en [O,XI),y la conjetura del receptor después de observar
igual al punto medio entre las dos acciones: cualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.
(El uso de distribuciones uniformes en la estrategia mixta del emisor no

Xl +b = 2:1 [X]2 + -2-1]


X] +
,
tiene nada que ver con el supuesto de una distribución uniforme del tipo
del emisor; la estrategia mixta del emisor podría utilizar también cualquier
otra densidad de probabilidad estrictamente positiva sobre los intervalos
220/ JUEGOS DINÁM1COS CON INFORMACiÓN INCOMPLETA (e. 4)
Olras aplicaciones del equilibrio bayesimlO pelfeclo ! 221
,
\~.
indicados.) Como alternativa al enfoque de Crawford y Sobel, podríamos En un equilibrio de n escalones, si el primer escalón tiene una longi-
determinar una estrategia pura del emisor pero escoger conjeturas del re- tud ti,el segundo debe tener una longitud d + 4b, el tercero d + 8b Y así
ceptor ['uera de la trayectoria de equilibrio. Por ejemplo, sea la estrategia sucesivamente. El n-ésimo escalón debe acabar exactamente en 1, por lo
del emisor que todos los tipos t < Xl envíen el mensaje Oy que todos los que de~emosterer
tipos t ~ :1:1 envíen el mensaje Xl, y sea la conjetura del receptor fuera
de la trayectoria de equilibrio después de observar cualquier mensaje de ~. d + (d + 4b) + ... + [d + (n - 1)4b] = 1.
(0,:1:1) que t se distri~uye uniformemente en [O,XI), y después de observar
(,
cualquier mensaje de (Xl)] que t se distribuye uniformemente en [XI,1]. Utilizando el hecho de que 1 + 2 ~ ... + (n - 1) = n(n - 1)/2, tenemos que
Para caracterizar un equilibrio de n escalones, aplicamos repetida-
mente la siguiente observación sobre el equilibrio de dos escalones: el n .d + n(n - 1) . 2.b = 1. (4.3.1)
escalón superior, [Xbl], es 4b más grande que el inferior, [O,XI)' Esta ob-
Dado c~aiquiern tal que n(n -1). 2b < 1,existe' un vaJor de d c¡ue~óluci0I1a
servación se deriva del hecho que, dado el tipo del emisor (t), su acción
(4.3.1). Es decir, para cualquier n talque n(n-l).2b <1, existeunequilibrió
óptima (t + b) es mayor que la acción óptima del receptor (t) en b. Por
de agrupació~parcial de n escalones, y la longitud del primer escalón es
lo tanto, si dos escalones adyacentes tuvieran la misma longitud, el tipo
el valor de d que soluciona (4.3.1). Corno la longitud del primer escalón
frontera entre los escalones (Xl en el equilibrio de dos escalones) pre-
debe ser positiva, el número máximo de escalones en este equilibri?, n *(b);
feriría estrictamente enviar .el mensaje asociado con el escalón superior;
es el valor másaIto den tal que n(n - 1) .2b < 1. Utilizando la fórmula
efectivamente, los tipos ligeramente por debajo del tipo frontera también
de la ecu"ación "de segundo grado, se obtiene que n*(b) es el mayor enter?
lo preferirían. La única forma de hacer que el tipo frontera sea indiferente
por debajo de
entre los dos escalones (y conseguir con ello que los tipos por encima y por
debajo de la frontera prefieran estrictamente sus respectivos escalones) es
hacer que el escalón superior sea convenientemente más grande que el ~.[1 + JI + (2/b)}.
inferior, de la siguiente forma.
Consistente con la derivación del equilibrio de dos escalones, n*(b) = 1
Si el escalón [Xk-I,Xk) tiene una longitud de c (es decir, X* - Xk-l = c), para b ~. 1/4: no hay comunicación posible si las. preferencias de J<)S
la acción óptima del receptor correspondiente a este escalón (concretamen jugadores son demasiado diferentes. Así mismo, corno hemos dicho aI\!~.s~
te, h;k + Xk_I)/2) está (c/2) + b. por debajo de la acción óptima del tipo. n*(b) es decreciente en b pero tiende a infinito sólo cuandob tiende.a
frontera Xk (concretamente, Xk + b). Para hacer que el tipo frontera sea cero: puede haber más comunicación a trav~s del parloteo cuand() l~s
indiferente entre los escalones [Xk-I,Xk) Y [Xk,Xk+I), la acción del receptor preferencias de los jugadores están más alineadas, pero no puede existir
correspondiente al último escalón debe estar (c/2) + b por encima de la comunicación perfecta a no ser que las preferencias de los jugadores estén
acción óptima para :¡;k:
perfectamente alineadas.

Xk+l + :1;k ( b) C b 4.3.B Negociación sucesiva bajo información asimétrica


2 - Xk + = 2: + ,
Consideremos una empresa y un sindicato negociando sobre salarios.
o
Para simplificar, supongamos que el nivel de empleo es fijo. El salario de
reserva del sindicato (es decir, la cantidad que los miembros del sindicato
ganan si no son empleados por la empresa) es wr. Los beneficios de la
empresa, que <;ienotamos mediante 'Ir, se distribuyen uniformemente en
hB,KA], pero el valor real de K es conocido sólo por la empresa. Esta
Por lo tanto, cada escalón debe ser 4b más largo que el anterior. infom1ación privada podría, por ejemplo, reflejar un mejor conocimiento
Otras aplicaciol1es del equilibrio bayesial10 perfeclo ! 223
222 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

por parte de la empresa de los nuevos productos en fase de planificación.


1rj 2 - Ó /' *
Simplificarnos el análisis suponiendo que wr = 1rB = O. UJ2 = 2= -2-(4---3-Ó-) KA ,ltJ],

El juego de negociación dura dos periodos corno máximo. En el pri-


mer periodo, el sindicato realiza una oferta salarial, Wl' Si la empresa • Si el beneficio de la empresa, 1r, es mayor que 1))2' ésta acepta la oferta;
acepta esta oferta el juego concluye: la ganancia del sindicato es Wl y la en Caso contrario, la rechaza.
de la empresa 1r - Wl' (Estas ganancias son los valores presentes de las
sucesiones de salarios y beneficios [netos] que los jugadores acumulan a . do las empresas con beneficios altos aceptan
Por lo tanto, en cad a peno ,
lo largo de la duración del contrato que se está negociando, normalmente la oferta del sindicato, mientras que las de beneficios bajos la rechazan, y
tres años en Estados Unidos.) Si la empresa rechaza esta ofe~ta, enton- la oferta del sindicato en el segundo periodo refleja el hec~10de q~e las
ces el juego pasa al segundo periodo. El sindicato realiza una segunda empresas con beneficios altos aceptaron la oferta en e~ pnme: p:n~do.
oferta salarial, W2. Si la empresa acepta la oferta, los valores presentes de (Nótese el ligero cambio en la terminología: n~s .refenr:mos l1llhstmta-
las ganancias de los jugádores (medidas tm el primer periodo) so~ 8w~ mente a una empresa con muchos tipos de beneficlOs pOSIbleso.a.m~lchas
pa.:a el sindicato y 8('Ir- W2) para la empresa, dond~ 8 refleja tanto el empresas cada una con su propio nivel de beneficios.) En .eqUlhbno, las
descuento corno la corta vida de lo que queda de contrato después dei empresas con beneficios bajos toleran una huelga de.un p:nodo para can-
primer periodo. Si la empresa rechaza la segunda ofertadel sindicato, indicato de que tienen beneficios bajos e mduClr con ello a una
vencer al S . d S'
el juego finaliza y las ganancias son cera pÚa ambos jugado~es: Un mo- oferta salarial menor por parte del sindicato en el segundo pe~o o.. 111
delo J!1ásrealista podría permitir que la I).egbci~cióneontinuara hasta que embargo, las empresas con beneficios muy bajos encuentran que mclus~;a
una oferta fuéraaceptada, o podría obligar á las 'partes a someterse a una oferta del segundo periodo es intolerablemente alta y, por tanto, tambIen
decisión arbitral vinculante después de una huélga prolongada. AqtÚ sa- la rechazan.
crificamos realismo para ganar claridad. (Véase Sobel y Takahashi [1983] Empezamos nuestro análisis describiendo las estrategia~ y conjeturas
, y el ejercicio 4.12 para un análisis con horizonte infinito.) de los jugadores, tras lo cual definimos un equilibrio b~yesIano perfe:l:o.
Definir y hallar un equilibrio bayesiano perf~cto es algo eomplicado en La figura 4.3.3ofrece una representación en forma extenSIVade una.ver.slon
estemodelo; pero la solución eventual es simpl'~;eintuitiva, Empezarnos, simplificada del juego: sólo hay dos valores de 'Ir(1r B Y 1rA), Yel smdlCato
por lo tanto, esbozando el único equilibrio b!yesiano perfecto de este sólo tiene dos ofertas salariales posibles (lUB y WA)'
juego. ' "' En este juego simplificado, al sindicato le co~espo~de decidir en tres
conjuntos de información, por lo que su estrategIa conSIste en tres ofertas
• La oferta salarial del sindicato en el primer periodo es salariales: la oferta del primer periodo, WJ, y dos ofertas en el ,segundo
};~ periodo, W2 después de que Wl = WA sea rechazada y W2 despues ~e que
• (2 - 8)2 Wl = WB sea rechazada. Estas tres decisiones tienen lugar en tres conjuntos
'11)1 = 2(4 -38) 'Ir A.
de información con más de un elemento, en los que las conjetura.s del
• Si el beneficio de la empresa es mayor que sindicato son (p,1 - p), (q,l - q) y (r,1 - r) respectivamente. En el J:lego
completo (a diferencia de lo que pasa en el juego simplicad~ de la fJ~ura
• 2w¡ 2- 8
1rl = 2-8 = 4-"381rA 4.3.3), una estrategia del sindicato es una oferta w~ en el pnmer pe:l0do
y una función de oferta W2(Wl) en el segundo penado que deternuna la
J~ empresa acepta wj; encaso contrario, la empresa rechaza wj.
oferta lU2 a realizar después de que cada oferta Wl sea recha~:da. Cac~a
• SI su oferta es rechazada en el primer periodo, el sindicato actualiza
una de estas decisiones tiene lugar en un conjunto de informaCll111 COll.mils
su conjetura sobre los beneficios de la empresa: el sindicato cree que
1r se distribuye uniformemente en [O,irjJ. ' de un elemento. Hay un conjunto de in.formación en el seguJldo per~odo
• La oferta salarial del sindicato en el segundo periodo (condicionada a para cada oferta salarial que el sindicato podrí~ hacer e~:l pruner perto::lo
que wj sea rechazada) es (por lo que hay un continuo de conjuntos de mformaClon en vez de solo
224/ JUeCOS DIN;íMICOS CON INFOI<,\IACláN INCOMPLETA (c. 4) Otras aplicaciones del equilibrio bayesillno perfecto / 225

Azar juego completo, denotamos la conjetura del sindicato en el primer periodo,


mediante ¡¿l(íT), y la del segundo (después de que la oferta lOl del primer
periodo haya sido rechazada) con JL2(íTlwl).
Una estrategia de la empresa incluye dos decisiones (tanto en el juego
simplificado como en el completo). Sea Al (wll'lr) igual a uno si la empresa
E aceptase la oferta Wl del primerperiodo cuando su beneficio es íT;y cero si
la empresa rechazase Wl cuando su beneficio es íT. Del mismo modo, sea
A2(W2IíT/Wl)igual a uno si la empresa aceptase la oferta 'W2 del segundo
periodo cuando su beneficio es 'Iry la oferta del primer periodo fue lOl,Y
cero si la empresa rechazase '!U2 en tales circunstancias. Una estrategia de
lO,
wa
,WE}
la empresa es un par de funciones [Al(lOll-ir),A2(102iíT,lOl)J. Puesto que la
lC,1 - 7tH '- wB
empresa tiene informa~ióncorripleta durante iodo el juego, sus có~jehIias
son triviales.
Las estrategias ['Wl/W2(lOl>f y [Al(WllíT),A2(W2IíT,Wl)],
y las conjetur~s
[JL 1(íT), J.l2(íTIWl)] constituyen un equilibrio bayesiano perfecto si satisfacen'
los requisitos 2,}, y4 dy las.ección 4.1. (El requisito 1 se satisfac~:p~I
la simple existencia de las~onjeturas del sindicato.) Vamos aªe~?straE
que existe un único equilibrio bayesiano, perfe00, L(1parte ITI~j'~~Hlf
del arguplentoes aplicar el reqllisito 2 ala decisiónd~la empr~:;;aen.el
segundo periodo A2(102IíT/Wl): puesto q~~ é~te. es liltimo'Il}?~iirri:i~\~. ei,
o O. lO" O del juego, la d,ecisión óptima de la empresa es aceptar lO2 sLY:.,~ólo.~~
O O IT, - lO, O íT~ lO2; lOl es irrelevante. Dada ~sta parte de la estrategia dela e~p're~~:
es inmediato aplicar el requisito 2 a la elec~ión' de' ~na ~ferta:sai~íiÍ;
,.
ffi'~t'/:i~:,,'..:~~::-
por parte del sindicato en el segundo periodo:.102 deb~rí~ ".!"'''''~-'''''~'''''''!~h~t:};
• ,,- •• - • -,>. - -' -

ganancia esperada pore~ sindic~to, dada la contetura d~~~~~ J:?-L7rJ'W~r,x:;:.',' , ;'"


s la consiguiente estrategia de la empresa A2(10217l:,lOl)' :L,apart;e -
WáE¡.iPHPI;~;",;t;¡"1:;,:,
.,..>.',~_ ...•,..•.'-'>.":".~,.":'~~~;:~~~~:.;-._~.~~::.,.~
'_. - _. o'" -
.. 1.".,,,
..~:.~-',.:.-.-~'

del argumento es deterIninar la c;onjetura JL2(:r1'UJ1)d~f_ Il1od(),.~igpf~I1t.~;J]~:t'?,¿~?~~)


Comenzamos considerando momentáneamen,t~ el siguiel.'\te,P¿ll~lZ~:""" ,...
de negociación de un periodo, (Utilizaremos IJ;lástarsIe l?s~e.~~t~~P~,ªtr'
este problema como la solución en el segundo periodo del juegomndos
periodos.) En el problema con un periodo/supo~garnos que.~_s~~~~i?
cree que el beneficio de la empresa se distribuY~UI;iformement.é en [9~1[A
O lO,
O O donde íTl es por el momento arbitrario. Si el sindicato ofrece ,w, la mej?X
O 1t.~- IVg
O O respuesta de la empresa, es clara: aceptar lO~iys910 si íT~ 'w. Por lotapt9'
el problema del sindicato puede formularse co~o:; ",,'
Figura 4.3.3 ..
' .....
dos com.o en la figura 4.3.3). En cada conjunto de información, la conjetura maxUJ' Prob{la empresa acepta lO} + O. Prob{la empresa no acepta lO},
w .' ;.
del sIndIcato es una distribución de probabilidad sobre estos nodos. En el
donde Prob{la empresa acepta w} = (íTI-'w) /íTl para los valores relevantes
...
....
Otras aplicacio'l1es del equilibrio bayesiano perfecto / 227
226 / JUEGOS DINÁMICOS CON lJ'JFORMAClÓN INCOMPLETA (e. 4)

de las ofertas salariales (concretamente, O ~ W ~ 7fl)' La oferta salarial


óptima es, por lo tanto, W*(7fl) = 7f1l2. 7fl= max{7f"(w¡,7f,j2),Wl}'
Volvemos ahora (definitivamente) al problema con dos periodos. De- Para resolver esta ecuación implícita, supongamos que Wl ~ 7f"('U],irtl2).
mostramos en primer lugar que, para valores arbitrarios de Wl y W2, si el
Enances
t 7fl -- Wl, lo que contradice Wl > -
7f*(Wl,7fl/2). Por lo tanto,
sindicato ofrece Wl en el primer periodo y la empresa espera que ofrezca
Wl < 7f"(W},7fl/2),de manera que 7fl = 7f*(1JJl:¡r¡j2),o
W2 en el segundo periodo, todas las empresas con beneficios lo suficien-
temente altos aceptarán Wl y todas las demás lo rechazarán. Las posibles 21JJl Wl
,','
,~,', 7fl(Wl)=2_ó Y W2(w1)=2_ó'
,
ganancias de la empresa son 7f-Wl por aceptar '11)1, Ó(7f - W2) por rechazar
Wl y aceptar W2, y cero si rechaza ambas ofertas. Por lo tanto, la empresa Hemos reducido el juego a un problema de optimización en un pe-
prefiere aceptar Wl a aceptar W2 si 7f- Wl > ó(7f - W2), o riodo para el sindicato: dada la oferta salarial del sindicato en el prime.r
periodo, 1JJl,hemos hallado la respuesta óp~m~ ~e la empresa en e~pn-
mer periodo, la conjetura del sindicato al pnnc~plO del segundo p:n~do,
la oferta óptima del sindicato en el segundo penado y la respuesta 0.pt1ll1a
: ;- ~ de la empresa en el segundo periodo. Por lo tanto,.l,a oferta salanal del
y la empresa prefiere aceptar W1 a rechazarlas do~oferta~ si 7f-W1 > O.por sindicato en el primer periodo debería ser una soluclOn de
lo tanto, para valores arbitrarios dewl y W2, empresas con 1i" >máx{ 7f*(Wl,
W2), Wl} aceptarán Wl y empresas con 7f <1l].!,\x{7r*(Wl,Wi),W1} lo recha-
max. Prob{la empresa acepta 1IJ¡}
zarán. Como elrequisito 2 establece que la éinpresa actúa óptimamente w¡

dadas las subsiguientes estrategias de los jugadores, podemos obtener + ÓW2(Wl) . Prob{la empresa no acepta Wl pero acepta 1JJ2}
.
....} Al (wll7f)para un valor arbitrário de '11)1: empresas con 'Ir>max{ 7f*(-Wl,'U)2) + Ó . O. Prob{la empresa no acepta 71Jlni W2}'
,wt} aceptarán Wl y empresas-con 7f <~ax {7f*(Wl, W2), wt} lo rechazarán,
donde W2 es la oferta salarial del sindicato,en el segundo periodo W2(Wl). Nótese que Prob{la empresa acepta IUl}no es simplemente la probabilidad
Podemos ahora obtener f-l2(?rlwl);la éonjetura del sinc;licatoen el se- de que 7fsea mayor que Wl, sino la probabilidad de que 7fsea mayor que
gundo periodo en el conjunto de iÍ1.formaciónal que se llega si la oferta Wl 7fl('11)1):
del primer periodo es rechilza-dir. El requisito 4 implica que la conjetura
7fA - 7fl(Wl)
correcta es qué ?rosedistribuya uniformemente en [O,7f(Wl»), donde 7f(Wl) Prob{la empresa acepta w¡} =7fA
es el valor de 7f que hace que la empresa sea indiferente entre aceptar
Wl y rechazarlo para aceptar f;;ierta ópti~a del sindicato en el segundo La solución de este problema de optimización es wi, dado al principio del
periodo dada esta conjetura (concretamente, W"(7f(Wl» = 7f(wl)/2, como análisis, y ~i ywi, dados por 7f¡(llJÍ)Y W2(Wi> respectivamente,
obtuvimos en el problema de un periodo), Para ver esto, recordemos
que el requisito 4 establece que la conjetura del sindicato debe obt~nerse 4.3.C La reputación en el dilema de los presos repetido finitamenle
a partir de la regla de Bayes'y de la estrategia de la empr~sa. Por lo
tanto, dada la primera parte-de la estrategia de la empresa A1(WII7f)que En el análisis de los juegos con información completa repetid~s finitaJ~el.'te
acabamos de hallar, la conjetura del sindicato debe ser que los tipos que de la sección 2.3.A, demostramos que si un juego de etapa tIene un UnJco
quedan en el segundoperiode;se distribuyen uniformemente eiJ.[O,7fl], equilibrio de Nash, cualquier juego repetido finitamente basa~o en este
donde?rl =max{ 7f*(W},W2),Wt} y W2 es la oferta salarial del sindicato en juego de etapa tiene un único equilibrio de Nash perfecto el~~u~Juegos: en
el se~do periodo W2(Wl).Dáda esta conjetura, la oferta óptima del sin- cada etapa, después de cualquier historia, se juega el eqUIlIbno de Nash
dicato en el segundo periodo debe ser W"(7fl) = 7ft/2, lo que proporciona del juego de etapa. En contraste con este resultado teórico, buena parte. ~e
una ecua,q.ón implícita de 7flen,función de Wl: la evidencia experimental sugiere que frecuentemente se da cooperacJOl1
(.

228/ JUEGOS DIN'>'MICOS CON INFOllMACIÓN INCOlvlPLETA (e. 4)


Otras aplicaciones del equilibrio bayesiano perfecto / 229
1\
en dilemas de los presos repetidos finitamente, especialmente en etapas en que la ganancia en una etapa dependa sólo de las jugadas de esa etapa,
que no están demasiado cerca del final. (Véase algunas referencias en y que la ganancia total del juego repetido sea la suma de las ganancias en
Axelrod [1981].) Kreps, Milgrom, Roberts y Wilson (1982) demuestran cada una de las etapas del juego. En particular, se podría suponer que
que un modelo de reputación ofrece una explicación de estos hechos.8 con probabilidadp la mejor respuesta del jugador fila a la cooperación
La explicación más simple de un equilibrio de reputación en el dilema es la cooperación. Kreps, Milgrom, Roberts y Wilson (KMRW en lo su-
de los presos repetido finitamente incluye una manera nueva de modelar cesivo) demuestran que la existencia de información asimétrica unilateral
la información asimétrica. En lugar de suponer q\le un jugador tiene de este tipo no es suficiente para producir la cooperación en el equilibrio;
información privada sobre sus ganancias, supondremos que el jugador al contrario, no cooperar (confesar) es lo que ocurre en cada etapa, al igual
tiene información privada sobre sus estrategias factibles. En particular, que bajo información completa. Sin embargo, también demuestran que si
supondremos que con probabilidad p, el jugad~)Tfilapuede jug~sqlo l? la asimetría informativa es bilateral (es decir, existe también una proba-
estrategia del Talión(tit-fot-tat) (qll~ empieza el juego repetido cooperando bilidad q de qli.e'la mejor respu~sta del jugador columna a la cooperación
e imita en lo sucesivo la jugada q~lterior de su oponente), rnjent:rasque sea la cooperación) puede existir entonces un equilibrio en el que los dos
con probabilidad 1 - pel jugadqr fila puede utilizar cualquit:~rade las jugadores cooperen hasta que¡;¡uede muy poco para que el juego se acabe.
estrategias disponibles en eljuego rep~tido infinitamente (incluida la del Para repetirlo otra vez, supondremos que con probabilidad p el juga-
Talión). De acuerdo con la terminología habitual, llamaremos "racional" dor fila sólo puede jugar la estrategia del Talión. El espíritu del análisis
al jugador fila. La ventaja expositiva de esta fommlaciónse debe al hecho de KMRW' es que' incluso si p es muy pequeña (es decir, incluso si el
de que si el jugador fila se desvía alguna vez de la estrategia del Talión, jugador' coÚlrnna tiene sólo una ligera sospecha de que el jugador fila
pasa a ser información del dominio público que el jugador fila es radonal. podría no ser racional) ,ésta incertidumbre puede tener un gran 'efecto"e:n
La estrategia del Tali9n es simple y atractiva, y fue además la ganadora el siguiente sentido. KMRW demuestran que existe una cofa superior,.al
en el torneo del dilema de los' presos de Axelrod. No obstante, se podría número de etapas en las que algún jugador no coopera en equilibrio. Esta
cuestionar el supuesto de que un jugador tiene sólo una estrategia, incluso coti;lsuperior depende de p y de las ganancias en el juego de etapa, pero
si ésta es atractiva. A costa de perder algo de simplicidad expositiva, se no del número de etapas en el juego repetido. Por lo tanto, en cualquier
podría suponer que ambos tipos del jugador fila pueden jugar cualquier equilibrio de un juego repetido lo suficientemente largo, la fracción deeta- ,(

estrategia, pero con probabilidad p las ganancias del jugador son tales pas en las que ambos jugadores cooperan es grande. (KMRWestablecen
que la estrategia del Talión domina a cualquier otra estrategia del juego su resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~e
repetido. (La exposición se complica bajo este supuesto, porque una des- pueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~l
viación de la estrategia del Talión no hace que sea información del dominio argumento de KMRW son: (Osi el jugador fila se desvía de la estrategia
público que el jugador es racional.) Estas ganancias difieren de las que se del Talión,.pasa a ser información del dominio público que el jugador es
suponen nomlalmente en los juegos repetidos: para que la inütación de la racional, por lo que ningún jugador' cooperará en lo sucesivo, de manera
decisión previa del jugador columna sea un óptimo, las ganancias en este que el jugador fila racional tiene un incentivo para imitar la estrategia del
periodo del jugador fila deben depender de la jugada del jugador columna Talión, y (ii) dado un supuesto que i.I;npondreJI,t,osmás, adelante sobre las
en el periodo anterior. Como tercera posibilidad (de nuevo a costa de sa- ganancias del juego de etapa, la mejor respuest¡¡ del jugador columna a la
crificar simplicidad expositiva), se podría permitir que un jugador tuvief~ ~stategia del Talión sería coope~ar hasta. la última etapa del juego. .
información privada sobre sus ganancias en el juego de etapa, per()i~istir Para entendeú:uálésson los elementos básicos del modelo de KMWR,
8 Demo>tramos en la sección 2.3.Bque puede existir cooperación en el dilema de ló~pre'sos
con~iderarem~s eicompieII1ertt?riricie su ~áliSis:.en lugar de suponer q~e
repetido infinitamente. Algunos autores se refieren a tal equilibrio como un equilibrio de p es baja y analizar los juegos rep,etldc,>sdelarga duración, supondremos
"reputación", aun cuando las ganancias y oportUnidades de ambos jugadores son información qlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de
del dominio público. Por claridad, se podría describir ese equilibrio cómoun:~qciIibri~
.un juego repetido corto en el qud9!i dos jugadores cooperen en todas las
basado en "amenazas y promesas", reservando el término "reputación" a los jt¡egb~ 'en'los
que al menos un jugador tiene algo que aprender sobre otro, como ocurre en esta sección: ., etapas menos
.
en las dos
. .
úl9~Ilél.~,Empezamos con el caso de dos periodos.
Olras aplicaciones riel equilibrio bayesillllO perfecto / 231
230 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

íinitada por la estrategia del Talión en el segundo periodo, como se ve en


El desarrollo temporal es:
la trayectoria de equilibrio en la figura 4.3.5.
1. El azar determina un tipo para el jugador fila. Con probabilidad p, el
jugador fila sólo dispone de la estrategia del Talión; con probabilidad 1=1 1=2

1 - p, puede jugar cualquier estrategia. El jugador fiJase entera de su


tipo, pero el jugador columna no se entera del tipo del jugador fila. Estrategia del Talión C X

2. Los jugadores fila y columna juegan al dilema de los presos. Sus Jugador racional fila NC NC
decisiones en esta etapa pasan a ser información del dornini.o público.
Jugador columna X NC
3. Los jugadores fiJa y columna juegan al dilema de los presos por se-
gunda y última vez.
4. Se reciben las ganancias. Para el jugador fila racional y el jugador Figura 4.3.5
columna éstas son la suma (sin descuento) de sus ganancias enJas dos
etapas. El juego de etapa se presenta en la figura 4.3:4.

Para hacer de este juego de etapa un dilema de los presos, suponemos que 1=1 1=2 1=3
a > 1 yb < O.KMRWtambién suponen que a + b < 2,de forma que (como
"o ";
indicamos anteriormente en (ii» la mejor respuesta del jugador columna Estrategia del Talión C C C
a la estrategia del Talión es cooperar hasta la últíini'etápa del juego; en NC
Jugador racional fila C NC
lugar de ir alternando entre cooperar y no cooperar.
Jugador columna C C NC

Columna
Cooperar,No coop~rar Figura 4.3.6
-, .,:

Cooperar 1,1 b,a


Fila Escogiendo X = O, el jugador columna recibe la ganancia esperada
No cooperar a,b 0,0 p . 1 + (1 - p) . b en el primer periodo, y p . a. en el segundo. (Cmno la
estrategia del Talión y el jugador fila racional eligen jugadas diferentes
en el primer periodo, el jugador columna empezará el segundo periodo
Figura 4.3.4 sabiendo si el jugador fila es racional o juega la estrategia del Talión. La
ganancia esperada en el segundo periodo p . a refl~ja la incertidumbre
Al igual que en el último periodo de un dilema de los presos rejJetido del jugador columna sobre el tipo del jugador fila a la hora de decidir si
finitamente coninformación completa, no cooperar (NO) dórñiliaestriéc cooperar o no en el primer periodo.) Escogiendo X = NO, en cambio, el
tamente a cooperar (O) en l~última etapa de este juegod~ dos'peii6dos jugador columna recibe p . a en el primer periodo y cero en el segundo.
con información incompleta; tanto para el jugador fila r.;tcional c?mo
para Por lo tanto, el jugador columna cooperará en el primer periodo siempre
" el jugador columná. Dado que el jugador columna no coopetaráen"la que
)
última etapa, no existe ninguna razÓn para que el jug~dorfila r~éional10
hagaen larrimera etapa. Ahora bien, la estrategia delTaliÓn empieza p + (1 - p)b ¿ O. (4.32)
el juego con cooperación. Por lo tanto, la única decisi6n que hace falta
Supondremos en lo sucesivo que (43.2) se cumple.
determinar es la del jugador columna en el primer periodo, (X), 'que será
232/ JUECOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
Otras aplicaciones del equilibrio bayesiano pe/feelo / 233
Consideremos ahora el caso con tres periodos. Dado (4.3.2), si el
Dada (4.3.2), una condición suficiente para que el jugador columna no se
jugador columna y el jugador fila racional cooperan en el primer periodo,
desvíe es
la trayectoria de equilibrio en el segundo y tercer periodos vendrá dada
por la figura 4.3.5, con x= e y los números de los periodos cambiados.
Derivaremos condiciones suficientes para que el jugador columna' y el 1 + pa ~ a. (4.3.3)
Jugador fila racional cooperen en el primer periodo, como se indica en la Alternativamente, el jugador columna podría desviarse no cooperando
trayectoria de equilibrio de tres periodos en la figura 4.3.6.
en el primer periodo pero cooperando en el segundo, en cuyo caso la
En este equilibrio, la ganancia del jugador fila racional es 1 + a y la estrategia del Talión cooperaría en el tercer periodo, por lo que el desarrollo ,'o,,'
',,-;.",
8.anancia esperada del jugador columna es 1 +p+ (1- p)b+pa. Si el jugador del juego sería como se indica en la figura 4.3.8. La ganancia esperada del
tila racional no coopera en el primer periodo, pasa a ser información del jugador columnap?r esta desviación es a + b + pa, que es menor que su
dominio público que el jugador fila es racional. Por lo tanto, la 'ganancia gélnanciaesperada en' equilibrig siempre que
del jugador fila racional por no cooperar en el primer periodo es a~'que
es menor que la ganancia 1 + a de equilibrio, por lo que el jugador fila
1 + p + (1 - p)b + pa ~, a + b + pa.
racional no tiene incentivos para desviarse de la estrategia implícita en la
figura 4.3.6.
1= 1 1= 2 1= 3
¡-.

1= 1 1= 2 1=3 Estrategia del Tali6n e NC e


Estrategia del Talión C NC Jugador raCional fila C NC NC
Jugador racional fila Jugador columna' NC C NC
C NC NC "---'

Jugador columna NC NC NC
Figura 4.3.8

Figura 4.3.7
Dada (4.3.2), una condición suficiente para que el jugador columIla no se
desvíe 'es ' , ';!
Nos ocupamos ahora de si el jugador columna tiene algún inéentivo
para desviarse. Si el jugador columna no coopera en el primer periodo;
la estrategia del Talión tampoco lo hará en el segundo, y el jugador fila a+b:::;1. '(4.3.4)
~'acional no cooperará en el segundo periodo, porque es' seguro que' el Hemos demostrado que si (4.3.2), (4.3.3)y (4.3.4) se cumplen, el desarrollo
Jugador columna no lo hará en el último periodo. No habiendo cooperado del juego descrito en la figura 4.3.6 es la trayectoria de equilibrio de un
,en el primer periodo, el jugador columna debe decidir si cooperar o no equilibrio bayesiano perfecto del dilema de los presos con tres periodos. (,
en ~l segundo periodo. Si el jugador columna no coopera en el segundÓ Dado un valor dep, las ganancias ay b satisfacen estas tres d'esigualdades
?enodo, la estrategia del Talión tampoco lo hará en el tercero, por lo queel si pertenecen a la región sombreada' d&la;figura 4.3.9. A medida que p
Juego se desarrollará corno indica la figura 4.3.7. La ganancia deljugador tiende a cero, la regtónsombreadaq,esapare.ce,consistentemente con la
columna por esta desviación es a, que es menor que su ganancia esperada observación anterior de queeri~stasecci6nanalli:amos la cooperación en
en equilibrio siempre que
el equilibrio en juegos cort~s con valores altos de p, mientras que KMRW
~e centran en juegos de larga duración con valores bajos de p. Por otra
1 + p + (l - p)b + pa ~ a. parte, si p es lo suficieht~mentealta. como para sustentar la cooperación
en un juego corto, es suficientemente' alta para hacerlo en un juego largo.
Otras aplicaciol1es del equilibrio bayesiano perfecto / 235
234 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Formalmente, si a, by p satisfacen (4.3.2), (4.3.3) Y (4.3.4), para cualquier en el periodo T - 1, o (T - t - 1) + u, por lo que no cooperar no resulta
T > 3 finita existe un equilibrio bayesiano perfecto en el juego repetido T rentable para ningún t < T - 1. El argumento referente a.la figura 4.3.5
periodos, en el cual el jugador fila racional y el jugador columna cooperan implica que el jugador fila racional no tiene incentivos para desviarse en
hasta el periodo T - 2, tras el cual los periodos T - 1 Y T son tal como se los periodos T - 1 o T.
describen en la figura 4.3.5. (Véase el apéndice para una demostración de Demostramos a continuación que el jugador columna no tiene incenti-
esta afirmación.) vos para desviarse. El argumento referente a la figura 4.3.5 significa que el
jugador columna no tiene incentivos para desviarse cooperando hasta el
periodo T - 2 Ydejando de cooperar en el periodo T -1; el argumento re-
b a=l a=l/(l-p) ferente a la figura 4.3.6 implica que el jugador columna no tiene incentivos
para desviarse cooperando hasta el periodo T - 3 Y dejando de cooperar
a en el periodo T - 2. Por lo tanto, necesitamos demostrar que el jugador
columna ha tiene incentivos para desviarse cooperando hasta el periodo
t - 1 Y dejando de cooperar en el periodo t, donde 1 ::; t ::; T - 3.
Si el jugador columna no coopera en el periodo t, la estrategia del
Talión tampoco lo l~ará en el periodo t+ 1, por 10 que el jugador fija racional
tampoco lo hará (ya que no cooperar domina estrictamente a cooperar en
b = -p/(l-p) la (t + 1)-ésima etapa del juego, después de lo cual no cooperar de t + 2
a T proporciona una ganancia cero como mínimo, mientras que cooperar
en t + 1 haría que fuera información del dominio público que el jugador
fila es racional, resultando en una ganancia de exactamente cero a partir
Figura 4.3.9 de t.+ 2 hasta T). Dado que tanto la estrategia del Talión como el jugador
fila racional cooperan hasta elperiodo t y dejan de cooperar en el periodo
Apéndice t + 1, la conjetura del jugador columna al principio del periodo f; + 2 es
. ~
"'c ", que la probabilidad de que el jugador fija sea la estrategia del Talión es
p. Por lo tanto, si el jugador columna coopera en el periodo t + 1, el juego
Por razón de brevedad, nos referiremos a un e4u¡libri~~1yeSianoperfedO
del dilema de los presos repetido T periodos, como un equilíbrio cooperativo de continuación que etnpiezaen el periodo t + 2 será. idéntico a un juego
si el jugador fila racional y el jugador columna cooperan hasta el periodo de T periodos con T = T - (t + 2) + l. Por la hipótesis de inducción; existe
T - 2, tras lo cual los periodos T - 1 Y T se describen en la figura 4.3.5. un equilibrio cooperativo en este juego de continuación de T periodos;
Vamos a demostrar que si Ct, by p satisfacen (4.3,2),.(4.3.3) y (4.3.4), existe supongamos que se juega este equilibrio. Entonces1a ganancia del jugador
~nequilibrio cooperativo para cada T.;> :3 finito. Argumentamos por columna en los periodos t a T por no cooperar en el periodot y.cooperar
mducción: dado que para cada T = 2, 3, ... ,T ~ 1 existe un equilibrio coo- en el periodo t + 1 es
perativo en el juego con T periodos, demostramos que existe un
equilibrio
cooperativo en el juégo con T periodos.;. .... ..' a + b + [T - (t + 2) - 1] + 11 + (1 - p)b + pa,
Demostramos primero que el jugador fila raCio~~l no tiene incentivos
que es menor que la ganancia de equilibrio del jugador columna en los
para desviarse del equilibrio cooperativo en el juego con T periodos, Si
el jugador fila no fuera a cooperar en ningún periodó t < T'- 1, llegaría a periodos t a T,
ser del dominio público que el jugador fila esracional, por ló que recibiría
2 + [T.- (t + 2) - 11 + p + (1 - p)b + pu. (43.5)
una ganancia a en el periodo t y cero en cada periodo siguiente. Pero la
ganancia en equilibrio del jugador fila es 1 en los periodos t a T - 2, Y a
D6 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA Ce. 4) Refinamientos del equilibrio bayesimlO perfecto / 237

Hasta ahora hemos demostrado que el jugador columna no tiene in- el jugador 1 C es una estrategia estrictamente dominada: la ganancia de 2
centivos para desviarse cooperando hasta el periodo t - 1 Y dejando de por utilizar D es mayor que cualquiera de las ganancias que el jugador 1
cooperar en el periodo t, dado que se jugará el equilibrio cooperativo en recibiría por utilizar C, O y 1. Por tanto, no es razonable que el jugador 2
el juego de continuación que empieza en el periodo t + 2. Más en general, crea que el jugador 1 puede haber elegido C; formalmente, no es razonable
el jugador columna podría cooperar hasta el periodo t - 1, no cooperar que 1 - p sea positivo, por lo que p debe ser igual a 1. Si la conjetura
en los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Hay 1 - p > O no es razonable, tampoco lo es el equilibrio bayesiano perfecto
tres casos que son triviales: (1) si t + s = T (es decir, si el jugador columna (D,D',p ::;1/2), quedando (I,I',p = 1) como el único equilibrio bayesiano
nunca coopera después de no haberlo hecho en el periodo t), la ganancia perfecto que satisface este requisito.
es a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) si
t + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor que D
en (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l' 2
es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valores 2

de ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior con
s = O, existe un equilibrio cooperativo. en el juego de. continuación que
empieza en el periodo t + s + 2; supongamos que se juega este equilibrio.
Entonces, la ganancia del jugador columna en los periodos ta T por jugar
esta desviación es
---------------2 ------7
a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+ pg,
3 o 1 o
que es, de nuevo, menor que (4.3.5). 1 O O 1

Figura 4.4.1
4.4 Refinamientos del equilibrio bayesiano perfecto

En la sección 4.1 definimos un equilibrio bayesiano perfecto como las es- Otras dos características de este ejemplo merecen una breve mención.
trategias y las conjeturas que satisfacen los requisitos 1 a4, y'observamos En primer lugar, aunque C está estrictamente dominada, 1 no. Si Eestu~
que en tal equilibrio ninguna estrategia de ningún jugador puede estar es- viera estrictamente dominada (corno ocurriría si la ganancia de 3 por parte
trictamente dominada a partir de ningún conjunto de información. Ahora del jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicaría que
consideramos dos requisitos adicionales (sobre conjeturas fuera de la tra- no es razonable que p sea positiva, lo que implica que p debe ser cero, pero
yectoria de equilibrio), el primero de los cuales formaliza la idea siguiente: esto contradiría el resultado anterior de que p debe ser uno.,.En tal caso,
puesto que un equilibrio bayesiano perfecto impide que el jugador i jue- este requisito no restringiríé! lqs conj~turas fuera del equilibrio d~i jugador
glIe una estategia estrictamente dominada a partir de algún conjunto de 2. (Véase la definición formal'que damos más adelante)
,.1 .,_,'
, .í ..
. o. •

información, no es razonable que el jugador j crea que i utilizará esa En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicial-
estrategia. mente, porque C no sólo está estrictamente dC;IDinadaa partir de algún
Para concretar más esta idea, consideremos el juego de la figura 4.4.1. conjunto de info~ación, sino estrjctarr;f~t~~ominada en el sentido más
Existen dos equilibrios bayesianos perfectos en estrategias puras: (I,I',p = ." ~.

1) y (D,D',p ::; 1/2).9 La característica clave de este ejemplo es que para extensiva, ambos equilibrios de Nash sOn perfectos en subjuegos. En u,1') el conjunto de
información del jugador 2 está en la trayectpri", de equilibrio, por lo que el requisito 3 establece
. 9Derivar la representación en forma nonnal revela que existen en este juego dos equili- que p = L En (D,D') este conjunto d~ infqrm,!.ción está fuera de la trayectoria de. equilibrio,
bnos de Nash con estrategias puras: ([,JI) y (D,D/). Puesto que no hay subjuegos en la forma pero el requisito 4 no impone ningúna restricción a p. Por lo tanto, sólo requerimos que la
conjetura p de 2 haga que la acción D' sea óptima, es decir, p ~ 1/2.
Refil1amiel1lus riel equilibrio bayesial10 perfecto / 239
238 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Requisito 5. Si es posible, cada una de las conjetllras del jugador fuem de In


pleno. Para ver la diferencia, recordemos de la sección 1.1.B que una
trayectoria de equilibrio debería asignar una probabilidad cero a los nodos que
estrategia .5; es estrictamente dominada si existe otra estrategia Si tal que
se alcanzan sólo si otro jugador utiliza una estrategia que está estrictamente
para cada posible combinación de estrategias de los demás jugadores, la
dominada a partir de algún conjunto de información.
ganancia de 'i por jugar Si es estrictamente mayor que la ganancia por
jugar s;. Ahora consideremos una versión expandida del juego en la
La expresión "si es posible" en el requisito 5 incluye el caso que podría
figura 4.4.1, en la cual el jugador 2 tiene que jugar antes que el jugador 1,
plantearse en la figura 4.4.1 si D dominara tanto a e corno a J, como
y cuenta con dos opciones en esta jugada ihÍcial: acabar el juego o pasar
ocurnría si la ganancia de 3 del jugador 1 fuera 3/2. En tal caso, el
el control de éste a 1 en el conjunto de información de 1 tal como aparece
requisito 1 precisa que el jugador 2 tenga una conjetura, pero no es posible
en la figura. En este juego expandido, e está aún estrictamente ltominada
que esta conjetura asigne una probabilidad cero a los nodos que siguen a
a partir de algún conjunto de información, pero no está estrictamente
dominada, puesto que si 2 termina el juego en el nodo inicial, J, e y D
e y a J, por lo que el requisito 5 no se aplicaría en este caso.
obtienen la misma ganancia.
3,2
Puesto que e está estrictamente dominada en la figura 4.4.1, no es a
razonable que el jugador 2 crea que 1 puede haber elegido e, pero la do- [pI 1,
minancia estricta es una condición demasiado fuerte y, por lo tanto, hace
que este requisito sea demasiado débiL (Puesto que hay más estrategias b
estrictamente dominadas a partir de algún conjlmto de información que 2,0
estrategias estrictamente dominadas,. requerir, qÍié, jno !=reaque. i puede
haber elegido una de las primeras pone más restricciones sobre las con- Receptor
", jeturas de j de las que habría si j no creyera que i pueda haber utilizado
una de las últimas.) Seguidamente, nos quedarnos con el requisito tal 1,0
corno lo enunciamos originalmente: el j';lgador j no debería creer que
el jugador i ha elegido una estrategia estrictamente domÍ1;ada a partir de
algún conjunto de información. A continuación enunciamos este requisito [}- pI 1 1,
formalmente.
1,1

Figura 4.4.2

Definición. Consideremos un conjunto de información en el cual le toca deci- Corno segunda ilustración del requisito 5 consideremos el juego ele
dir al jugador i:" La estrategia s; está estrictamente dominada a partir de señalizacion de la figura 4.4.2. Al igual que en la sección 4.2.A, la estrate-
este conjunto de. información s(existe otra estrategia Si tal que, para cada gia del emisor (m',m") significa' que el tipo t1 elige el mensaje m' y el tipo
conjetura que pudiera fonnarse i 'e-n el conjunto de información' dado, y para t2 elige m",y la esti:ategiá elel receptor (a' ,a") significa que el receptor elige
cada posible combinación' de las esttaiegiils subsiguientes de .los otros jugadores la acción a' siguiendo a J y a" siguiendo a D. Es inmediato comprobar que
(donde una "estrategia subsiguiente" es un plan completo de acción que cubre las estrategias y conjeturas [(I,I),(7J"d),p = O,5,q] constituyen un equilibrio
cada contingencia que pudiera presentarse una vez se ha alcanzado el conjunto bayesiano perfecto ele agrupación para cualquier q ~ 1/2. Sin embargo, la
de inforrr;zacióridado) la ganancia esperada de i al tomar la acción indicada por Si característica esencial de este juego de señalización es que no tiene sentido
en el conjunto de información dado 'y al jugar la estrategia subsiguiente indicada que t1 elija D. Formalmente, las estratégias del emisor (D,I) y (D,D) (es
por Si és :estr,ictamente ;nayor que la ganancia esperada al tomar la acción y jugar decir, las estrategias en las cuales tI elige D) están estrictamente domj-
la estrategia subsiguiente especificadas por s;.
2-10/ jGEGOS DIN;Í;¡;IICOS CON INFOR¡;.L..•.CIÓN INCOMPLETA (e. 4)
Refinamientos del equilibrio bayesiano perfecto / 241 ....
nadas a partir del conjunto de información del emisor correspondiente a en lugar de Oy 1 como en la figura 4.4.2. Ahora [(I,I),(u,d),p = 0,5,q] es
Por lo tanto, el nodo t¡ en el conjunto de información del receptor que
ti .10 un equilibrio bayesiano perfecto de agrupación para cualquier valor de
sigue a O se alcanza sólo si el emisor utiliza una estrategia que esté estric- q, por lo que [(I,I),(u,d),p = O,5,q = O]es un equilibrio bayesiano perfecto
tamente dominada a partir de algún conjunto de información. Además, que satisface el requisito 5 de señalización.
el nodo t2 en el conjunto de información del receptor que sigue a D puede En algunos juegos, existen equilibrios bayesianos perfectos que pare-
alcanzarse por medio de una estrategia que no está estrictamente domi- cen poco razonables y sin embargo satisfacen el requisito 5. Una de las
nada a partir de algún conjunto de información, concretamente U,D). Por áreas de investigación más activas en teoría de juegos se ha preocupado
In tanto, el requisito 5 establece que q = O. Como [U,I),(n,d),p = 0,5,q] es de las dos siguientes cuestiones: (i) cuándo es un equilibrio bayesiano
un equilibrio bayesiano perfecto sólo si q 2 1/2, tal equilibrio'no puede perfecto poco razonable y (ii) qué requisito adicional puede añadirse a
cumplir el requisito 5. la definición de equilibrio para eliminar estos equilibrios que no son ra-
Un modo equivalente de imponer el requisito Sal equilibrio baye- zonables~ Cho y Kreps (1987) hicieron una contribución original y muy
siano perfecto del juego de señalización definido en la sección 4.2.A es el influyente en está área. Vamos él concluir esta sección discutiendo tres
siguiente. aspectos de su trabajo: (1) el ju~go de señalización "cerveza y quiche",
que ilustra cómo ciertos equilibrios bayesianos perfectos quena son ra-
Definición. En un juego de señalización, el mensaje mj de lvI está dominado zonablespueden satisfacer el requisito 5 de señalización; (2) una versión
para el tipo ti de T si existe otro mensaje mj de M tal quela menor ganancia más fuerte (pero de ninguna manera la más fuerte posible) del requisito 5
posible de ti por utilizar mj es mlÍs alta que la mayor ganancia posible de ti por de señalización, llamada el criterio intuitivo; y (3) la aplicación del criterio
utilizar mj: intuitivo al juego de señalización en el mercado de trabajo de Spence ....

min U E(ti¡m j' ,CLk) > max U E(túmj,ak)' 1,1 Cobardica 0,1
akEA ukEA Duelo Duelo

Req uisito 5 de señalización. Si el conjunto de información que sigue a 'mj está [pI Quiche t, Cerveza [ql
fllera de la trayectoria de equilibrio y mj está dominado para el tipo ti, entonces ..
,
,
(si es posible) la conjetura del receptor j1.(t.; Imj) debería asignar ~robabilidad cero No : 0,5
al tipo ti. (Esto es posible siempre que m] no esté dominado para todos los tipos 3,0 .,, 2,0
,,
en T.) ,,
Receptor , Azar Réeeptor
,,
,, "
En el juego de la figura 4.4.2, el equilibrio bayesiano perfecto de separación ,, "::'"
rU,D),(u,n),p = 1,q = O]satisface el requisito 5 de señalización trivialmente 0,-1 1,-1
Duelo: , 0,5 Duelo
(porque no hay conjuntos de información fuera de esta trayectoria de ,
,
equilibrio). Como ejemplo de un equilibrio que satisface el requisito
5 de señalización de forma no trivial, supongamos que se invierten las
No
[l - pI Quiche 1, Cerveza [1 - qI
No
~:
...

ganancias del receptor cuando el tipo t2 juega D: 1 por jugar d y Opor'u, 2,0 Malas pulgas 3,0

10 Como el conjunto de infonnadón del emisor COITespo~diente a tI sólo tiene un elemento, Figura 4.4.3
las conjeturas del emisor no juegan ningún papel en la definidón de dominancia estricta a
partir de este conjunto de inforrnadón. Demostrar que (D,n y (D.D) están estrictamente
duminadas a partir de este conjunto de información se reduce a ofrecer una estrategia alter-
En el juego de señalización "cerveza y quiche", elemisor es uno de los
nativa al emisor que proporcione la ganancia mayor a tI para cada estrategia que el receptor dos tipos: t¡ ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"
pudiera jugar. (l,D) es esa estrategia: proporciona 2 a tI en el peor de los casos, mientras que (con probabilidad 0,9). El mensaje del emisor es su elección de cerveza
(D,)) y (D,D) propordonan 1 en el mejor de los casos.

c.
Refinamientos del equilibrio bayesimlO perjec/o / 24:1
242 / JUEGOS DINÁMICOS CON lNFORMAClÓN INCOMPLETA Ce. 4)

o quiche para desayunar; la acción del receptor es decidir si batirse en Si este discurso fuera creído, establecería que q = 0, lo que es incom-
duelo o no con el emisor. Las características cualitativas de las ganancias patible con este equilibrio bayesiano perfecto de agrupación.
.. ', son que el tipo cobardica preferiría tomar quiche para desayunar, el malas Podemos ahora generalizar este argumento a la clase de juegos de
'" ..:.; señalización definida en la sección 4.2.A; con ello obtenemos el requisito
pulgas preferiría cerveza, ambos preferirían no tener que batirse con el
emisor (y esto les importa más que sus desayunos), y el receptor preferiría 6 de señalización.
batirse con el cobardica antes que con el malas pulgas. (Por lo tanto,
utilizando la terminología más convencional para los tipos, mensajes; y Definición. Dado un equilibrio bayesiano perfecto en un juego de serlalizaciól1,
acciones, este juego podría ser un modelo de barreras de entrada, como el mensaje mj está dominado en equilibrio para el tipo ti de T si la gl7J1I1ncia
el de Milgrom y Roberts [1982].) En la representación en foÍmaeextensiva en equilibrio de tú que denotamos mediante U'(t;), es más alta que la mayor
de la figura 4.4.3, la ganancia por desayunar lo que se prefiere es 1 para ganancia posible para ti por utilizar 7)Ij:
ambos tipos del emisor, la ganancia adicional potevitar un duelo. es.de 2
para los dos tipos, Y las ganancias del receptor por, batirse en duelo con
el cobardica o con el malas pulgas son 1 o -1 respectivamente;. todas las
demás ganancias son cero. Requisito 6 de señalización. ("El criterio intuitivo", Cho y Kreps 198'7):
Si el conjunto de información que sigue a mj está fuera de la trayectoria de
En este juego, [(qui~he, quiche), (no~duel65, p''; Ó,9;q] es unequilibri¿ equilibrio y mj está dominado en equilibrio para el tipo tú entonces (si es lJOsilJle)
bayesiano perfecto de agrupación para q 2: 1tt~~dé.más, este equilibrio la conjetura del receptor IJ,(ti 1m) debería asignar probabilidad cero al tipa 1:;.
satisface elrequisit05de señalización,yaqu,é J~~lhYet~no estádominad~ (Esto es posible siempre que mj no esté dominado eH equilibrio para torios los
para ningiln tipo del emisor. En particular, nad¿' gár'ahtiza que el cobardica tipos de T.)
vaya a estar mejor por tomar quiche (una ganancia de 1 en el peor de los
casos) que portorriar cerveza (una ganariciade 2 en el mejor de los casos). Cerveza y quiche muestra que un mensaje mj puede estar dominado en
Por otra parte, la conjeturadel receptor fuera de léltraye~toria de equilibrio equilibrio para ti sin estar dominado para t;. Sin embargo, si mj está do-
parece sospechosa: si el receptor obserVa:inesp~}~dán;\ente que el emisor minado para tú mj debe estar dominado en equilibrio para tú por lo que
elige cerveza, concluye que es al menos tan próbable 'Itieel em~sor sea imponer el requisito 6 de señalización hace que el requisito 5 sea redun-
cobardica como que sea malas pulgas (es decir, q 2:1/2), aun cuando (a) dante. Cho y Kreps utilizan un resultado más poderoso debido a Kohlberg
el cobar~icano puede mejorar de ninguna manenl su ganancia de 3 en y Mertens(1986) para demostrar que cualqüier juego deseñalización de
equilibrio tomando cerveza en vez de quiche, mientras que (b) el malas la dase definida en la sección 4.2.A tiene un equilibrio bayesiano perfeetcJ
pulgas podría méjorar su ganancia de 2 en equilibrio y recibir una ganancia que satisface el requisito 6 de señalización. Se dice a veces que los argu-
de 3 si el receptor mantuviera la conjetura de que q < 1/2. Dados (a) y mentos de este tipo utilizan la inducción hacia delante, porque al interpretar
(b), cabría esperar que el malas pulgas escogiera cerveza y pronunciara el una desviación (esto es, al formarse la conjetura p,(t; ¡mj» el receptor se pre-
siguiente discurso: gunta si el comportamiento pasado del emisor podría haber sido racional,
mientras que en inducción hacia atrás se supone que el comportamiento
Verme escoger cerveza debería convencerte de que soy del futuro será racional,
tipo malas pulgas: escoger cerveza no podri'a de ninguna Para ilustrar sobre el requisito 6 de señalizaCión, lo aplicamos al caso
manera haber mejorado la ganancia del tipo cobardica, por con envidia del modelo de señalización en el mercado de trabajo, analizado
(a); y si escoger cerveza te convenciera de que soy del tipo en la sección 4.2.B.
.malas pulgas, e~tonces hacerlo mejoraría mi ganancia, por Recordemos que existe una enorme cantidad de equilibrios bayesia-
(b). nos perfectos de agrupación, de separación e luoridos en este modelo.
Sorprendentemente, uno de estos equilibrios es consistente con el rec¡ui-
.~,
/
, ~-'

(,,1
,','
2,1-1 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4) Refinamientos del eqllilibrio bayesial10 perfecto / 245 1,'.

sito 6 de señalización, el equilibrio de separación en el cual el trabajador cual el trabajador con capacidad alta escoge un nivel de educación e> es
;;',
con baja capacidad escoge el nivel de educación de información completa no puede satisfacer el requisito 5 de señalización, ya que en tal equilibrio ,

y el trabajador con capacidad alta escoge la educación mínima necesa- las empresas deben creer que J.l(Ale) < 1 para niveles de educación entre
ria para hacer que el trabajador con capacidad baja sea indiferente entre es y e. (Un enunciado preciso es: el requisito 5 de señalización implica
imitarle o no, como ilustra la figura 4.4.4. que J.l(Ale) = 1 para e > es siempre que e no esté dominado para el tipo
con capacidad alta, pero si existe un equilibrio de separación en el que el
trabajador con capacidad alta escoge un nivel de educación e > es enton-
1,
y (A,e) ces los niveles de educación entre es y e no están dominados para el tipo
w con capacidad alta, de forma que el argumento es válido.) Por lo tanto, el
único equilibrio de separación que satisface el requisito 5 de señalización
y(A, e,)----.-.----- es el equilibrio que se muestra en la figura 4.4.4.
Una segunda conclusión se deriva también de este argumento: en
cualquier equilibrio que satisfaga el requisito 5 de señalización, la utilidad
~Y(Bre)
del trabajador con capacidad alta debe ser como mínimo y(A,es) - c(A,e.).
A continuación demostramos que esta <;¡onclusiónsignifica que algunos
equilibrios lubridos y de agrupación no- pueden satisfacer el requisito 5
w*(B) de señalización_ Existen dos casos, dependiendo de si la probabilidad de
que el trabajador tenga capacidad alta (q) es lo suficientemente baja para
que la función de salario w = q . y(A,e) + (1- q) . y(B,e) esté por debajo de
e*(B) la curva de indiferencia del trabajador con alta capacidad que pasa por el
e. e
punto [e.,y(A,es)]'
Suponemos en primer l,ugar que q es baja, como se muestra en la figura
Figura 4.4.4 4.4.5. En este caso, :ningún equilibrio de agrupación satisface el requisito 5
de señalización, porque el trabajador con capacidad alta no puede alcanzar
En cualquier equilibrio bayesiano, si el trabajador escoge un nivel de la ~tilidad y(A,es) - c(A,es) en este equilibrio. Del mismo modo, ningún
educación e y las empresas creen en consecuencia que la probabilidad de eq~ilibrio lubrido en el que el trabajador con capacidadalta se comporte
que el trabajador tenga capacidad alta es ¡.t(Ale), el salario del trabajador aleat9riaIl1ente ?ª,tisface el requisito 5 de señalización, porque el punto
será (educación, salario) en el que hay agrupación en este equilibrio está por
debajo de la función de salario w = q. y(A,e) + (1 - q). y(B,e). Finalmente,
w(e) = ¡.t(Ale) . y(A,e) + [1 - J.l(Ale)] . y(B,e). :ningún equilibrio lubrido en el cual el trabajador con capacidad baja se
comporte aleatoriamente satisface el requisito 5 de señalización, porque
el punto (educación! salario) en el que hay agrupación en este equilibrio
Por lo tanto, la utilidad para el trabajador con capacidad baja al esco-
debe estar en la curva de indiferencia del trabajador con capacidad baja
ger e'(B) es corno mínimo yfB,e*(B)] - c[B,e*(B»), que es mayor que su
que pasa por el punto [e*(B),w*(B)], como en la figura 4.2.9, y está por
utilidad al escoger cualquier e > e., independientemente de lo que la
tanto por debajo de la curva de indiferencia del trabajador con capacidad
empresa crea después de observar e. Es decir, en términos del requisito 5
alta que pasa por el punto[es;y(A,es)]' Por lo tanto, en el caso de la figura
de señalización, cualquier nivel de educación e > es estádom:inado para
4.4.5, el único equilibrio bayesiano perfecto que satisface el requisito 6 de
el tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5
señalización es el equilibrio de separación que muestra la figura 4.4.4.
de señalización implica que la conjehlra de la empresa debe ser ¡.t(Ale) = 1
para e > e., lo que a su vez implica que un equilibrio de separación en el
Re!ill11111ielllos del equilibrio bayesiallo parcelo / 247
246 / JUEGOS DlNÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

y (A,e)

w si e' < e < e", el requisito 6 de señalización implica que la conjetura de


la empresa debe ser ¡L(Ale) = 1, lo que a su vez significa que el equilibrio
y (A,e,) qy (A,e) de agrupación indicado no puede satisfacer el requisito 6 de seña lización,
ya que en tal equilibrio las empresas deben creer que ¡L(Ale) < 1 para las
elecciones de educación entre e' ye". Este argumento puede repetirse par8
todos los equilibrios de agrupación e híbridos en la región sombreada de
la figura, por lo que el único equilibrio bayesiano perfecto que satisface el
requisito 6 de señalización es el equilibrio de separación mostrado en la
y (B,e)
figura 4.4.4.

y (A,e)

w*(B)
w

y (A ,e, ) qy (A,e)
e*(B) e, e '

Figura 4.4.5

Suponemos ahora que q es alta, como se indica en la ñgura 4.4.6. Como


antes, los equilibrios híbridos en los que el tipO ~on capacidad baja se com- y U3,e)
porta aleatoriamente no pueden satisfacer el requisito 5 de señalización,
pero ahora los equilibrios de agrupación y eqtiilibriÓs lubri<¿losen los que
el tipo con capacidad alta se éorripOrta aleatoriamente pueden satisfacer
este requisito si la agrupáéióiúie da en un ptirito (educación, salario) de la
región sombreada de la figura. Sin embargo, estos equilibrios no pueden w*(B)
satisfacer el requisito 6 de señalización.
Consideremos el equilibrio de agrupación en ea mostrado en la figura
4.4.7. Las elecciones de nivel de educación e > e' están dominadas en equi- e*(B) e,
librio para el tipo con baja capacidad porque incluso el salario más alto
que podría pagarse a un trabajador con educación e, concretamente y(A,e), Figura 4.4.6
da un punto (educación, salario) por debajo de la curva de indiferencia del
trabajador con baja capacidad que pasa por el punto de equilibrio (ea,11Ja).
Las elecciones de nivel de educación entre e' y e" no están dominadas en
equilibrio pa~a el tipo con capacidad alta. Sin embargo, si esta elección
convence a las empresas de queel trabajador tiene capacidad alta, éstas
ofrecerán el salariO y(A,e), lo que hará que el trabajador con capacidad
alta esté mejor que en el equilibrio de agrupación indicado. Por lo tanto,
24¿j / J llEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
Ejercicios / 249

nes" se dan frecuentemente y que su modelo puede explicar muchos de


y (A,e)
los datos empíricos sobre huelgas. Sobre reputación, véase la "teoría de .-;,":
la credibilidad" de Sobel (1985), en la cual una parte informada puede ser ",:.,

qy (A,e)
un "amigo" o un "enemigo" de un agente decisor desinformado en una
sucesión de juegos con parloteo. Finalmente, véase Cho y Sobel (1990)
para más información sobre refinamientos en los juegos de señalización,
incluyendo un refinamiento que selecciona el equilibrio de separación
eficiente del modelo de Spence cuando hay más de dos tipos.

y (B,e)

4.6 Ejercicios

4.1 En los siguientes juegos en forma extensiva, derívese el juego en forma


normal y hállense todos los equilibrios de Nash con estrategias puras, los
perfectos en subjuegos y los bayesianos perfectos.

e* (L) ep e' e" e, e


,-.. .-;:"

a.
Figura 4.4.7 D

2
2

4.5 Lecturas adicionales

MilgTOny Roberts (1982) ofrecen una aplicación clásica de los juegos de


señalización en temas de organización industrial. En economía financiera,
Bhaltacharya (1979)y Leland y Pyle (1977) analizan la política de dividen-
4 o 3 O
dos y de propiedad empresarial (respectivamente) utilizando modelos de 1 O O 1

señalización. Sobre política monetaria, Rogoff (1989) pasa revista a los b.


juegos repelidos, los de señalización y los modelos de reputación, y Ball D

(1990) utiliza cambios (inobservables) en el tipo de la autoridad monetaria 2


4
para explicar la trayectoria temporal de la inflación. Para aplicaciones de
juegos con parloteo, véanse los trabajos de Austen-Smith (1990), Farrell
y Gibbons (1991), Matthews (1989), y Stein (1989) descritos en el texto.
Kennan y Wilson (1992) examinan la literatura sobre los modelos teóricos
y empíricos de negociación bajo información asimétrica, subrayando sus
aplicaciones a huelgas y pleitos. Cramton y Tracy (1992) permiten que
un sindicato escoja entre ir a la huelga y continuar trabajando al salario 1 1 4 4 3
3 2 O O 3
vigente; muestran que, de acuerdo con los datos, estas "últimas sihlacio-
Ejercicios / 251

<0'
250 / JUEGOS DlNÁMfCOS CON INFORMACIÓN lNCOMPLETA (c. 4)

".,'
4.2 Demuéstrese que no existe ningún equilibrio bayesiano perfecto con
estrategias puras en el siguiente juego en forma extensiva. ¿Cuál es el
equilibrio bayesiano perfecto con estrategias mixtas?
1") b :
(1/3)
D

: b 0,0
D 1,0 :
,
2 Receptor , Receptor
2
2,1 • 1,1
a , a
1 1, D

(1/3)
, "
,."','.
'~4':.' b b
0,0 1,0

Receptor Receptor
3 O O k'
\$. ;t ¡
•• 0,0
O 1 1 O a Azar a
1 1, D

4.3 a. Descnbase un equilibrio bayesiano perfecto de agrupáci6n en el que (1/3)


b
los dos tipos del emisor juegan D en el siguiente juego de señalización. 0,0 2,1

1,2 0,1
a a 4.4 Descnbanse todos los equilibrios bayesianos perfectos de agrupación y
1 1, D de separación con estrategias puras de los siguientes juegos de señalización.

b 0,5 b
3,0
a.
2,0 1,1 2,2
a a
Receptor 1 t, D
Receptor Azar

1,0 b 0,5 b
0,0 O,n
a 0,5 a 2,0

Receptor Azar Receptor


1 1, D
b
3,1 2,2
0,0 .1,0
a 0,5 a
b. El siguiente juego de señalización con tres tipos empieza con una
jugada del azar, que no aparece' en el árbol y que determina uno de los tres t, D
1
tipos con igual probabilidad. Descnbase un equilibrio bayesiano perfecto b
b • 1,1
0,1
de agrupación en el que los tres tipos del emisor juegan J.
252 / J UECOS I)INÁ,vllCOS CON INFORMACiÓN INCOMPLETA (e. 4) Ejercicios / 253 \:,.'

b,

30) IJ O
a
0,0
4.7 Dibújense las curvas de indiferencia y las funciones de producción
para un modelo de señalización en el mercado de trabajo con dos tipos.
Descríbase un equilibrio bayesiano perfecto hfbrido en el cual el trabajador
con capacidad alta se comporta aleatoriamente.
\.

0,5 b
1,1 , 4,1 4.8 Hállese el equilibrio bayesiano perfecto con estrategias puras en el
siguiente juego con parloteo. Cada tipo tiene la misma posibilidad de ser
Receptor Azar Receptor escogido por el azar. Como en la figura 4.3.1, la primera ganancia de cada
'.
casilla es la del emisor, y la segunda la del receptor, pero la figura no es
un juego en forma normal, sino que simplemente expresa las ganancias
'.
3,3. 1,2
a 0,5 a de los jugadores para cada par tipo-acción.

1 1, O
b b
0,1 2,0 ',',
0,1 0,0 0,0
1,0 1,2 1,0
4.5 Hállense todos los equilibrios bayesianos perfectos con estrategias
puras del ejercicio 4.3 (a) y (b). 0,0 0,0 2,1

4.6 El siguiente juego de señalización es análogo al juego dinámico con 4.9 Considérese el ejemplo del modelo con parloteo de Crawford y?obeI
infon11ación completa pero imperfecta de la figura 4.1.1. (Los tipos t¡ y discutido en la sección 4.3.A: el tipo del emisor se distribuye uniforri1e~
t2 son análogos a las jugadas 1 y e del jugador 1 en la figura 4.1.1; si
mente entre cero y uno (formalmente, T = [0,1] Yp(t) = 1 paratodo ten T);
el emisor escoge D en el juego de señalización, el juego se acaba, igual a
el espacio de acciones es el intervalo de cero uno (A = [0;1]); la furición
que cuando el jugador 1 escoge D en la figura 4.1.1.) Hállense (i) los de ganancias del receptor es UR (t,a) = - (a - t)2, Yla función de ganancias
equilibrios bayesianos de Nash con estrategias puras y (ti) los equilibrios del emisor es UE(t,a) = -[a - (t + b)]2. ¿Para qué v<ilóresdéb éxÍste:un
bayesianos perfectos con estrategias puras de este juego de señalización. equilibrio de tres escalones? ¿Es la ganancia esperada/del recepto~;már
Relaciónense (i) con el equilibrio de Nash y (ii) con el equilibrio bayesiano alta en un equilibrio de tres escalones que en uno de dos escalónes?'¿QUe
perfecto de la figura 4.1.1. tipos del emisor están mejor en un equilibrio de tres escalones que' eIi"t.mo
de dos escalones?

4.10 Dos socios deben disolver su sociedad. El socio 1 posee una par-
ticipación s en la sociedad, el socio 2 posee 1 - s.' Los socios están de
acuerdo en jugar el siguiente juego: el socio 1 anuncia un precio para la
sociedad, p, y el soci02 escoge entonces si comprar la participación de 1
por ps o vender la suya por pO - s). Supongamos que es información del
dominio público que las valoraciones de los socios de ser propietarios dé
toda la sociedad son independientes y se distribuyen uniformemente en.
[0,1], pero que la valoración deeada socio es información privada. ¿Cuál
es el equilibrio bayesiano perfecto?

.'
I\'.~J
Ejercicius / 255
254/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

del sindicato, cuando los beneficios de la empresa están uniformemenle


4.11 Un comprador y un vendedor tienen valoraciones 'Ve y Vv respec- distribuidos entre cero y 1r*,es V(7r') = d7r', Demuéstrese que b = 2d,
tivamente, Es informa,ción del dominio público que el intercambio es
c= 1/[1 +~] yqued= [~- (1- 6»)/25.
rentable (es decir, que Ve > vv), pero la magnitud de esta rentabilidad es
información privada de la siguiente manera: la valoración del vendedor se
4.13 Una empresa y un sindicato juegan el siguiente juego de la nego-
distribuye uniformemente en [0,1];la valoración del comprador Ve = k '1)",
ciación con dos periodos. Es información del dominio público que el
donde k > 1 es información del dominio público; el vendedor conoce Vv
beneficio de la empresa, 1r,está uniformemente distribuido entre cero y
(y por tanto ve) pero el comprador no conoce Ve (o vv)' Supongamos que
uno, que el salario de reserva del sindicato es 1JJr y que sólo la empresa
el comprador realiza una única oferta p que el vendedor acepta o rechaza.
conoce el verdadero valor de 1r. Supongamos que O < Wr < 1/2. Hállese
¿Cuál es el equilibrio bayesiano perfecto cuando k < 2? ¿Ycuando k> 2?
el equilibrio bayesiano perfecto del siguiente juego:
(Véase Samuelson 1984.)
1. Al comienzo del primer periodo, el sindicato realiza una oferta salarial
4.12 Este problema considera la versión con horizonte infinito del juego
a la empresa, Wl'
de la negociación con dos periodos analizado en la sección 4.3.B. Como
2. La empresa o acepta o rechaza 1JJI' Si acepta, hay producción en
antes, la empresa tieneinformación privada sobre sus beneficios' (1r),que
los dos periodos, por lo que las ganancias son 2WIpara el sindicalo
están uniformemente distribuidos en [O,1ro], y elsindicafo realiza todas las
y 2(1r- Wl) para la empresa. (No hay descuento.) Si la empresa no
ofertas salariales y tiene un s~Jariode. rese~.va JJr ":::O. ,l
acepta 1))1,no hay producción en el primer periodo, y las ganancias del
En el juego candas periodos, la ~ínpre~Kacepta la, primera oferta del primer periodo son cero tanto para la empresa como para el sindicato,
sindicato (Wl) si 1r'> 71'1,donde el tipo con:beneficlos,.1rl es indiferente 3. Al comienzo del segundo periodo (suponiendo que la empresa re-
entre (i) aceptar Wl y (ii) rechazar Wl pero aceptar la oferta del sindicato en chazó Wl) la empresa realiza una oferta salarial al sindicato, W2. (Al
el segundo. periodo (W2), y W2 es la oferta óptima del sindicato dado que contrario que en el modelo de Sobel y Takahashi, el sindica to no realiza
los bem~ficiosde la empresa están uniformemente distribuidos en [O,1rl]
la oferta.)
y que sólo queda un periodo de negociación. En cambio, en el juego
4. El sindicato o acepta o rechaza W2. Si lo acepta hay producción en
con horizonte infinito, W2 será la oferta óptima del sindicato 4ado que el el segundo periodo, con lo que las ganancias del segun<:ioperiodo (y
beneficio deja emprésaestá uniformemente distribuido en [O,1rl]y que
totales) son W2 para el sindicato y 7r- W2 para la empresa. (Recordemos
queda un n~er6infi.nito,de periodos de negociación (potencial). Aunque
que las ganancias del primer periodo fueron cero.) Si el sindicato
el tipo con beneficlos 1rlseráotra vezÍndiferente entre las opciones (i) y
rechaza W2 no hay producción, por lo que el sindicato gana un salario
(ii), el cambio en W2 haráq~e cambie el válor de 1rl. alternativo Wr en el segundo periodo y la empresa cierra y gana cero.
El juego de continuación que empieza en el segundo periodo del
juego de horizonte infinito es una versión a escala del juego completo: 4.14 Nalebuff (1987) analiza el siguiente modelo de la negociación previo
existe un número infinito de periodos de negociación (potencial), y los a un posible pleito entre un demandante y un demandado. Si el caso
beneficios de la empresa están otra vez uniformemente distribuidos entre va a juicio, el demandado se verá obligado a pagar al demandante una
Oy una cota superior; la única diferencia es que la cota superior es ahora cantidad d por daños. Es información del dominio público que d está
1rl en lugar de1ro. Sobel y Takahashi (1983)demuestran que el juego uniformemente distribuida en [0,1] y que sólo el demandado conoce el
con horizonte infinito tiene un equilibrio bayesiano perfecto estacionario. verdadero valor de d. Ir a juicio le cuesta al demandante C < 1';2, pero
En este equilibrio, si los beneficios de la empresa están uniformemente (por simplicidad) no le cuesta nada al demandado.
distribuidos entre Oy 1r*,elsindicato realiza una oferta salarial w(7r*) = b1r*, El desarrollo temporal es el siguiente: (1) El demandante propone
por lo que la:primera oferta es b1ro, la segunda b1rl' etc. Si el sindicato utiliza un acuerdo, s. (2) El demandado o acepta el acuerdo (en cuyo caso la
esta estrategia estacionaria, la mejor respuesta de la empresa proporciona ganancia del demandante es s y la del demandado es -s) o lo rechaza. (3)
..• ,,) 1rl = C7ro,7r2= C7rl,etc., y el valor presente esperado de las ganancias
<.-
256 / JUECOS DlNÁivllCOS CON lNFORivlACláN INCOMPLETA (e. 4) l
Referencias / 257 "' ..

Si el demandado rechaza 8, el demandante decide si ir a juicio, donde la (ii) determínese si el equilibrio puede ser sustentado por conjeturas que
ganancia del demandante será d - e y la del demandado -d, o retirar los satisfagan el requisito 6 de señalización (el criterio intuitivo).
cargos, en cuyo caso la gananéia cie ambos jugadores es cero.
En la etapa (3) si el demandante cree que existe una d* tal que el
demandad o aceptaría el acuerdo si y sólo si d > d*, ¿cuál es la decisión 4.7 Referencias
óptima del demandante con respecto al pleito? En la etapa 2, dada la
propuesta de acuerdo 8, si el demandado cree que la probabilidad de que AUSTEN-SMITH,
D. 1990. "Information Transrnission in Debate." American
el demandante vaya a juicio si 8 es rechazada es p, ¿cuál es la decisión ¡oumal o/ Political Science 34:124-52.
óptima para llegar a un acuerdo por parte del demandado de tipo d?
Dada una oferta s > 2c, ¿cuál es el equilibrio bayesiano perfecto del juego AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." Ame-
de continuación que comienza en la etapa 2? ¿Y dada una oferta s < 2c? rican Political Science Review 75:306-18.
¿Cuál es el equilibrio bayesiano perfecto del juego eompleto si e < J /3? BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lll-
¿Y si 1/3 < e < 1/2? fl~tion." National Bureau of13conornic Researeh Working Paper #3529
(December). .
4.15 Consideremos un proceso legislativo en el que las decisiones factibles
varían continuamente desde p = Ohasta p = 1. La decisión ideal desde el BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incom-
punto de vista del Congreso es e; pero el status quoes s, _dondeO < e < s < plete Information." ¡oumal o/ Monetary Economics 17:3-20.
1; es decir, la decisió;' ideal está a la izquierda del status quo. La deci¡;ión BHAITACHARYA; S. 1979. "Imperfect Information, Dividend Pólicy: ancÍ
ideal para el Presidente es ti que se distribuye uniformemente en [O,llpero the 'Bird in the Hand' Fallacy'" Bell ¡oumal of Economics 10:259-70: .. ,.. ~
es información privada del Presidente. El desarrollo temporal es simple: -.'
'.'
CHO, J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."
'-:. ~
.
el Congreso propone tma decisión p, que el presidente puede -ratificar
o vetar. Si p es ratificada las ganancias son -(e - p)2 para el congreso Quarterly ¡oumal of Economics 102:179-222.
y -(t - p)2 para el Presidente; si es vetada las ganancias son -(c - s)2 .':
CHO, l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signa- ¡:-',.
y ~(t - sf. ¿Cuál es el equilibrio bayesiano perfecto? Veriliquese que ling Carnes." ¡oumal o/ Economic Theory 50:381-413.
e < ji < s en equilibrio.
Supongamos ahora que el Presidente puede comunicarse (en el sentido CRAMTON, E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage BargainirÍg:
de enviar un mensaje del tipo que hemos llamado de parloteo).antes de Theory and Data." American Economic Review 82:100-21. '"
'i,;.

que el Congreso proponga una decisión. Consideremos un equilibrio v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."
CRAWFORO,
bayesiano perfecto de dos escalones en el que el Congreso propone PB o Econometrica 50:1431-51.
P.-I, dependiendo del mensaje que el Presidente envíe. Demuéstrese que tal
equilibrio no puede tener e < pa < PA < s. Explíquese por qué se deduce DYBVIG, E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevance
que no puede haber equilibrios que incluyan tres o más propuestas por with Asymmetric Information." Review o/ Financial Stlldies 4:201-19.
parte del Congreso. Derívense los detalles del equilibrio de d(?sescalones L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.
FARRELL,
en el que e = PB < PA < s: ¿qué tipos envían qué mensajes?, y ¿cuál es el
valor de PA.? (Véase Matthews, 1989.)_ FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium and
Sequential Equilibrium." ¡oumal o/ Economic Theory 53:236-60.
4.16 Considérese los equilibrios de agrupación descritos en el ejercicio 4.3 HARSANYI, J. 1967. "Carnes with Incornplete Information Played by Ba-
(a) y (b). Para cada equilibrio: (1)determínese si el equilibrio p~ecie ser yesian Players, Parts 1, n, and III." Management Science 14:159-82,320-34,
sustentado por conjeturas que satisfagan el requisito 5 de señalización; 486-502.
RefercI1cil15 I 259
258 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

50BEL, J., Y 1. TAKAHASHI. 1983. "A mullistage Model of Bargaining,"


KENNAN,J., y R. WILSON. 1992. "Bargaining with Priva te Information."
Review of Economic StLuties 50:411- 26.
De próxima aparición en Joumal of Economic Literature.
SPENCE,A. M. 1973. "Job Market Signaling." Quarterly ¡oumal of EcollúlIlics
KOHLBERG,E., YJ.-F. MERTENS.1986. "On the 5trategic 5tability of Equili- 87:355-74.
bria." Econometrica. 54:1003-38.
5PENCE,A. M. 197+. "Competitive and Optimal Responses to Signaling:
1<REPS,D., Y R. WILSON. 1982. "5equential Equilibrium." Econometrica An Analysis of Efficiency and Distribution." Joumal of ECOllomic T11eory
50:863-94. 8:296-332.
1<REPS, D., P. MILGROM,J. ROBERTS,y R. WILSON. 1982. "Rational Coope- STEIN,J. 1989. "Cheap Talk and the Fed: A Theory of 1mprecise Policy
ration in the Finitely Repeated Prisioners' Dilernma." Joumal of Economic Announcements." American Ecol1omic Review 79:32-42. ,
Theory 27:245-52. . ..,
VICKERS,J. 1986. "Signalling in a Model of Monetary Policy with Incol1l-
LELAND,H., y' [). PYLE.. 1977. "Ihf~rmatior\.~l Asymmetries, Financial plete Information." Oxford Economic Papers 38:443-55.
5tructure, and Financial intermedi~tión." Jouma/of Finance 32:371-87.; •

MATIHEWS,S. 1989. "VetoTI1reats: Rhetoric in a Bargaining Game." Quar-


terly Joumal of Econoinics 104:347-69. '

MILGROM,P.i Y J. ROBERTS.1982., "Limit Pricing and Entry under Incom-


plete Information: AnEquilibrium Analysis." EconomeÚica40:443-59. ,

MINSER,J, 1974: E)chooling; Experience, and Eamings. New York: Coiumbia


University Press for the NBER. .. . .'.

MYERS,S., Y N. MAJLUF. 1984. "Corporate Financing and Investment


Decisions When Firms Have lnformation that Iilvestors Do Not Have;"
Joumal of Financial Economics 13:187-221.

.:-'. NALEBUFF,B. 1987. "Credible Pretrial Negotiation." Rnnd Joumal of Econo~


mics 18;198-210.

NOLDEKE,G., Y E. VANDAMME. 1990. "5ignalling in a Dynamic Labour


Market." Review of Econ01nic 5tudies 57:1- 23.

ROGOFF,K. 1989. "Reputation, Coordination, and Monetary Policy." En


Modem Business Cycle Theory. R. Barro, ed. Cambridge: Harvard Univer-
sity Press.

5AMUELSON, W.1984. "Bargaining Under Asyrnmetric Information." £co-


nometrica 52:995-1005.'

SOBEL,J. 1985. "A Theory of Credibility." Review of Economic 5tudies 52:557-


n '
.,
INDICE ANALÍTICO

Abreu, D., 98, 104,106 Axelrod, R., 228


acuerdo, sobre ,ómo jugar un juego Ball, L., 130, 248
posibilidad d;q~e no haya acuerdo, BaCon, 0.,169
12n6,59 Barro, R., 54, 112, 210
relación con el equilibrio de Nash, batalla de los sexos, la:
9,12 con información incompleta, 153-54
Admati, A., 132 ejemplo de juego con múltiples
agrupación, equilibrio de, véase equilibrios de Nash, 11-12
.,'
agrupación parcial, eq~ilibrio de; ejemplo de equilibrio de Nash con '".'
bayesian~ perfecto,' equilibri~; estrategias mixtas, 12116,40-45, 152
agrupación estrategia de
agrupación, estrategia de, 150~188
véase también bayesiano ~rfecto, batallas, estrategias mixtas en, 31
equilibrio; agrupación, equilibrio de bayesiano, juego, 143,véase también
agrupación parcial, equilibrio de información in-completa, juego con;
en el juego de Crawford y Sobel, 28 "\ información incompleta
juegos con parloteo~ 216' bayesiano de Nash,'equilibrio
véase también bayesiano perfecto, compatibilidad de incentivos, 161 -.
equilibrio definido, 148-52
":'.
Akerlo£, G., 130 ejercicios 3.1-3.8,1690172
amenazas y promesas, credibilidad de ejercicio 4.6,.249
las, 53, 55, 85, 87, 126 en el principo de revelación, 165
aranceles, juego de los, 73-77 en la batalla de los sexos con
ejercido 2.9,134-35 información incompleta, 153-55
arbitraje en subasta doble, 159
convencional, 23 en subastas, 155
contenido informativo de las ofertas, limitaciones del, 174
48 .~ .;-~
lineal, en subasta, 155-57
ofertas salariales de equilibrio de lineal, en subasta doble, 159-61
Nash en oferta final, 23-27 precio único, en subasta doble, 160
árbol del juego, 56, 116-17,véase también relación con el equilibrio bayesiano
forma extensiva, juego en perfecto, 175-76
Aumann, R., 7, 32n14, 35n15 simétrico, en subasta, 157-58, 166-67,
Austen-Smith, D., 213, 248 157n3,
262 / ÍNDICE ANALÍT1CO
ÍNDICE

89-90,101-102,228n6
AN,\J.ÍTICO /263
l
Bhattacharya, S., 130, 248
véase también bayesiano, juego; bayesiano perfecto híbrido, equilibrio
Brandenburger, A., 47 en juegos repetidos finilamente con
información incompleta; ejercicio 4.7, 253
Brouwer, teorema de punto fijo de, 45 información completa, 82-86
bayesiano perfecto, equilibrio en señalización en el mercado de
Buchanan, J., 131 véase también repetido, juego
bayesiano dinámico, juego, véase trabajo, 205-207
Bulow, L 112, 130, 169 correlacionado, equilibrio, 35n 15
negociación, juego de; comunicación bayesiano perfecto con estrategias
correspondencia de mejor respuest~
previa, juego con; bayesiano mixtas, equilibrio
como función de mejor respuesl~,
perfecto, equilibrio; reputación; ejercicio 4.2, 250
colusión 42-43
señalización, juego de bayesiano perfecto de agrupación,
en el duopolio de Coumot definida, 36
bayesiano estático, juego equilibrio
dinámico, 101-106 de n jug~dores, 47
ejercicios 3.1-3.8,169-172 definición de, en juegos de
en modelos dinámicos de duopolio, intersecciones de, 39, 41
mecanismo directo;165 señalización, 190
105-10. representaciones gráfic~s de, 35, 38,
representación en forma normal de, ejercicios 4.3, 4.4, 4.16,250, 251, 256
véase también repetido, juego 42-44
146-50 ejemplo de, 191
compatibilidad de incentivos, 164-65 Cournot, A., 2, 11
subasta, 155-57 en juegos cOh p~r1oteo; 215~16
competencia internacional, 70 Coumot, juego de duopoli%ligopolio
en un juego de señalización de
subasta doble, 159-64 conjeturas. de
véase también bayesiano de Nash, estructura de capital, 208-10
en conjuntos de información con uno con información asimétrica, 143,
equilibrio; principio de revelación en un juego de señalización en
y más de un elemento, 179 144-146,147,151
bayesiano perfecto, equilibrio política inonetaria, 210
en equilibrio bayesiano con información complet~, 15-21,
construcción informal del, 129 en señalización en el mercado de
perfecto,181,185 59-62,75-76,145-146
definición del, 182 trabajo, 189.~201
en juegos bayesianos estáticos, 148 ejercicio 3.2, 169
definición del, en juegos con bayesiano perfecto de separación,
en refinamientos del equilibrio ejercicios 1.4-1.6, 48-49
parloteo, 215 equilibrio
bayesiano perfecto, 236-47 ejercicio 2.15, 176
definición del, en juegos de definición de~ en juegos de
véase también información imperfecta; en juegos repetidos, 101-106
señalización, 190 señalización, 190
información incompleta véase también juego de duopolio
ejercicios 4.1, 4.5, 4.6, 4.8, 4.10-4.15, ejemplo de,192
conjunto deinformación Cournot, equilibrio de, 60n4
48,249,252,253,253-56 ejercicio 4.4, 251
con más de un elemento,l22, 129, Cr~mton, P., 248
en el dilema de los presos repetido en juegos con parloteo, 217
176,178,189 Crawford, V., 177, 214,253
finitamentecon informadón en un juego de señalización
definido, con ejemplos, 222-23 credibilidad en los juegos dinámicos, 53
asimétrica, 227-36 en el m~rcado de trabajo, 199-204
en la definición deinformación véase también amenazas y promesas
en juegos dinámicos con . en un juego de señalización en
imperfectar.121 Criterio intuitivo, véase requisito 6 de
información completa pero estructura de capital, 208
en la definición de información señalización
imperfecta, 177-85 en un juego de señalización en
perfecta, 121
en juegos dinámicos con política monetaria, 211-12
véase también conjeturas; nodo de
información incompleta, 175-76 Becker, G., 130
decisión; trayectoria de equilibrio; Chatterjee, K., 159
en negociación sucesiva con béisbol, estrategias mixtas en el, 30, 40
información imperfecta; información Cho, l.-K., 177, 241, 243, 249
información asimétrica, 221-27 Benoit, J.-P., 130
incompleta
refinamientos del, 236-48 Bertrand, J., 2, 15n1
continuación, juego de, 176, 235
véase tambié/l negociación; juego de Bertrand, equilibrio de, 60n4
ejercicios 4.12, 4.14, 254, 256 lJ~sgupta, P. 48
la; conjeturas; parloteo, juegos con; Bertrand, juegode duopolio de, 21, 23;59
cooperación decisión, teoría de In, uni- frenle ~
híbrido; equilibrio; agrupación .. con información asimétrica: ejercicio
en el dilema de los presos repetido multi-personal, 61
parcial, equilibrio de; agrupación, 3.3,169-70
infinitainénte con información Deere, D., 169
equilibrio de; refinamiento;requisitos con productos homogéneos: ejercicio
asimétrica, 227-36 Diamond, D., 54, 73
1-4; separación, equilibno de; 1.7,49 dilema de los presos, el
en el modelo de salarios de
sucesivo, equilibrio; señalización, en juegos repetidos: ejercicios 2.13,
eficiencia,l07-108 cooperación en, 89-91, 227-236
juego de la; perfecto en subjuegos, 2.14,136 equilibrio de Nash en, 10
en juegos repetidos infinitamente,
equilibrio de Nash vease también duopolio, juego de
;,.

26-1 / íNDICE ANALÍTICO ÍNDICE ANALÍTICO / 265 .

definición de, 5 ejercicio 4.1,249


estrategia dd disparador en, 90 equilibrio, véase bayesiano de Nash,
véase también eliminación iterativa de relación con juegos en forma
estrategia del Talión en, 228 equilibrio; bayesiano perfecto,
estrategias estrictamente dominadas extensiva, 118-19
estrategias dominadas en, -1 equilibrio; de agrupación, equilibrio; ,(;"
etapa, juego de transcripción del enunciado informal
ganancia de reserva en,81-82 de separación, equilibrio; hlbrido,
con múltiples equilibrios de Nash, de un problema a un, 15-16,21-22,
repetido finilamente, 80-82 equilibrio; lineal, equilibrio; Nash,
82-87 153, 155
repdido finilamente con información equilibrio de; perfecto en subjuegos,
de decisiones sucesivas, 109, 111 véase también forma extensiva, juego
asimétrica, 227-36 equilibrio de Nash; agrupación
en el teorema de Friedman, 92 en
repetido infinitamente, 87-90, 90.95 parcial, equilibrio de
en juegos repetidos infinitamente, 86, Friedrnan, L 15n1, 54, 96,101
representación en forma extensiva espado de estrategias
91-92 Friedman, teorema de, 88
de, 120 ejercicios 3.2,3.3,169
en juegos repetidos infinitamente con demostración del, 97, 99-101
representación en forma normal de, en equilibrio lineal, 155-56, 160
información completa, 82 enunciado del, 96
213 en el juego de duopolio de Bertrand,
21 " en juegosrep~tid()s io'!fulitan,erüe con frontera, de Pareto, 87 .
dilema del samaritano, 131
información incomple,\a,;2,27 Fudenberg, D., 98, 181n3
dinámico, juego en el juego de duo polio de
véase también repetido, ju~go función de mejor respuesta, 35-37,
con información completa pero Coumot,15
expectativas .. como correspondencia de mejor
imperfecta, 70, 120-121 en j~egos con información completa,
en un juego repetido de política respuesta, 42-43
con información completa y perfecta, 3
monetaria, 112-115 como estrategia, 125
55 en juegos dinámicos con información
véase también expectativas racionales en el juego de duopolio de Coumot,
con información incompleta, 176 completa, 118
expectativas racionales, 3 17-21,39
estrategia en, 91,117 en juegos estáticos con información
en el juego delos aranceles,. 75
véase tamuíé" inducción hacia atTás; completa, 92
funciones de ganancias, en jue~s"
fDrma extensiva, juego en; bayesiano en juegos estáticos con información
factor de pescuento, 66, 16n7 bayesianos estáticos"146,1.49
perfécto, équilibrio; repetido¡ juego; incompleta; 150-51
efecto de valores bajos del, 99, en juegos estáticos con información
perféCto en subjuegos, equilibrio de en subastas, 155
102-106, completa, 4
Nash véase también forma extensiva, juego
en juegos repetidos infinitamente, 93,
disparad(¡r (/rigger), estrategia del, 90, en; forma normal, juego en
97
95,99, 103,106, véase también espacio de tipos
Farber, H., 2, 23 ganancia factible, 95
repetido, juego en el juego de Coumot cdn
farol, en póquer, 30 ganancia medio, 96
dmninada, estrategia, véase infomlación asinlétrica, 147
Farrell, J., 86,120,213,248 ganancia de reserva,
.
97, 98,.
estriclalllt.~nte donúnada, estrategia en juegos bayesianos estáticos, 147-48 ."

Fenlández,Fl,129 ganancias, información del dominio~"


duopolio, juego de,véase Bertrand, en la batalla de los sexos con
finito,juego: 34,45, 181n1. Véas~ también público sob;e Ías, 117,143 ".
jUégn de duo polio de; Coumot, juego información incompleta, 153
repetido finita mente, juego determinados por estrategias, 2
de duopoli%ligopolio de; Espinosa, M., 67,129,137
forma extensiva, juego en, 4, 115-117 esperados a partir de
supervisión imperfecta, juegos con; estático, juego
ejercicios 2.21, 2.22, 138-39 estrategias mixtas, 36:
Stackelberg, juego de duopolio de; con información completa, 1-2
relación con la forma normal,119 incertidumbre sobre los, 143, 146-147
variables de estado, juego con con información incompleta, 143
véase también nodo de decisión; véase también ganancia factible;
Dybvig, 1'.5-1,73, 208 véase tambié" ba yesiano de
conjunto de info,rmación; forma ganancia meclia; ganancia de reserva
Nash, equilibrio; Nash, equilibrio de;
nomlal, juego en Gibbons, El,48, 213, 248
fonna normal, juego en; etapa, juego
forma normal, juego en: Glazer, J., 129
ejid'ls, el prublema de los, 27-28 de
definición de, par,! ti!' juego con Gordon, D., 54, 112
elilninación iterativa de estrategias estrategia, véase conjetura; el palo y la
información completa, 3, 4 granada, juego de la "
estrictamente dominadas; 4-8, 13-15 zanahoria, estrategia de; equilibrio;
definición de, para un juego amenazas no crelbles en el, 53-54
en juegos de aligo polio de Coumot, mixta, estrategia; pura, estrategia;
estático con información incompleta, como juego con información
19.21 estrictamente dominada, estrategia;
146-150 completa y perfecta, 55
véase tamuíé" estrictamente disparador, estrategia de
ejercicios 2.21,2.22, 138-39 ejercicio 2.21, 138-39
dominada, estrategia estrictamente dominada, estrategia
--
ÍNDICE ANALÍTICO I 267
266 I ÍNDICE ANALÍTICO

en el madela de duapalia de dudas sabre la racianalidad cama, Kakutani, tearema de, 45, 47
véase también amenazas y promesas
Caumat, 144-146 53nl Kennan, J., 248
Creen, E.,106
en el madela de negaciación en juegas can parla tea, 213-21 Klemperer, P., 169
sucesiva, :221-27 en la reinterpretación del equilibrio. K!vfRW (Kreps, Milgram, Raberts,
véase también infarmación incampleta; de Nash can estrategias mixtas, 40, Wilsan) madela de, 229-34
Hall, R., 159, 171
infarmación privada 152-55 Kahlberg, E., 243
Hardin, C"V., 27
infarmación campleta, 1, 143, véase en las juegas de señalización, Kreps, D., 48, 115n117, 130, 177, 180,
Harsanyi, J., 31, 148, 152, 176
también información incampleta 185-213,236-47 228,241,243
Hart, O., 168
información campleta y perfecta, juega en un juega estática, 146-150 KrisllOa, V., 130
hfbrida, estrategia, 188
morida, equilibrio., véase bayesiana can, 55, véase también inducción hacia véase también infarmación asimétrica;
perfecta, equilibrio.; hfbrida, atrás; repetida, juega; perfecta en ~ bayesiana de Nash, equilibrid;
subjuegas, equilibrio. dé Nash infarmación campleta; infarmación Lazear, E., 54, 77,130,134,159,171
estrategia
hipótesis de racianalidad; en inducción infarmación campleta.pero irriperféda, imperfecta; bayesiana perfecta, Leland, H., 248
juega can, 70, 120-121 . equilibrio.; infarmación privada; Leontief, W., 54,55,62
hacia atrás, 57-59
Hatelling, H., 50 en das etapas, 92, 117 . reputación; principia de revelación
Huizinga, H., 135 véase tainbién infarmaaón infarmación incampleta, juega can, 143,
Hume, D., 2, 27 impeTf~da; bayesiand pérfeCta, 176, véase también bayesiana, juega; McAfee, P., 169
.equillbda; repetida, juega; perfecta bayesiana de Nash, equilibrio.; McMillan, L 130, 169
en subjuegas, eijúilibria de Nash parlatea, juegas con; infarmación Majluf, N., 177, 186,208
infarmación del daminio pública, 7 incampleta; bayesiana perfecta, Maskin, E., 48, 86, 98, 130
ignarancia de jugadas anteriares, izO-21
véase también infarmación imperfecta en el juega de dúopalia de Caumat equilibrio.; señalización, juega de matriz binaria, 3
inducción hacia atrás con información asimétrica, 144 infarmación perfecta Matthews, S., 213, 248
en juegas can infúrmati6n corhpleta definida, 53, 121 mecanismo. directa;-165
en equilibrio. bayesiana perfecta, 185
y perfécta; 11i, 143 juega dinámico can, 54 campatibilidad de incentivas, 165
en equilibrio. de Nashperfecta en
sabre la racianalidad de las véase también inducción hacia atrás; decir la verdad en, 166-68
subjuegas, 124, 129
jugadares, 7, 56-59 dinámica can infarmación campleta para subasta dable, 166
en juegas dinámicas can infarmación
sabre,las fvncianes de ganancias de y perfecta, juega; Infarmación véase también principia de revelación
campleta y perfecta, 56
las juga49'res, 1 imperfecta; perfecta en su bjuegas, mensaje daminada, véase requisita 5
en juegas dinámicas can infarmación
incampleta, ejercicio. 3.8; 171-72 infarmación iÍl'iperfecta . equilibrio. de Nash de señalización
definida, 53 infarmación privada mensaje daminado en equilibrio,véase
hipótesis subyacentes de, 57-59
véase también resultada par inducción en el juega de las aranceles, 73-77 diseñando. juegas can, 164 requisita 6 de señalización
hacia atrás en el juego de las pánicas bancarias, ejercicias 3.6-3.8, 171 Mertens, J.-F., 243
inducción hacia adelante, 243 71-73 en subastas, 155-58 Milgrom, P., 177, 228, 241,248
en el juega de tameo, 77-80 en subastas dables, 159-64 Mincer, J., 193 .
infarmación
en tearía de la decisión uni- frente a en juegas repetidas finitamente, 80'87 véase también infarmación mixta, estrategia
multipersanal,61 en juegas repetidas infinitamente, asimétrica; bayesiana de Nash, definición de, 32
87-105 equilibrio.; infarmación incompleta; ejercicjo 2.23, 139
véase también infarmación asimétrica;
juegas dinámicas con; 10 bayesiana perfecta, equilibrio.; ejercicio. 3.5, 170-71
infarmación campleta; infarmación
véase también infamación completa principia de revelación ejercicio. 4.2,250
imperfecta; infarmación incampleta;
pera imperfecta, juego can; ejercicias 1.9-1.14, 50-51
infarmación perfecta; infarmación
información incompleta; canjunta de reinterpretación de, 40
privada
infarmación; bayesiana perfecta, Jacklin, C. 130 véase también Nash, equilibrio. de;
infarmación asimétrica
ejercicias 3.2, 3.3, 169 equilibrio.; infarmación perfecta/o ;. jugadares racianales, 4-7 Nash, tearema de; pura, estrategia;
ejercicio. 4.12, 254 perfecta en subjuegas, equilibrio. dé estrategia
en el dilema de las presas repetida Nash manedas, juega de las (matcJ¡i/¡g pe,mies), 29
finitamente,227,236 infarmación incampleta Kakutani, S., 45 carrespandencia de mejar respuesta
(

2bí:i 1 ÍNDICE ANALÍTICO ÍNDICE ANALÍTICO 1269

en el, 35 relación con eliminación pánicos bancarios, juego de los, 70, 71-73 probabilidad
equilibrio de Nash con estrategias iterativa de estrategias estrictamente ejercicio 2.22, 139 de que se acabe un juego repetido, 90
mixtas en el, 37-39 dominadas, 10-11, 12-15,19-21 parloteo, juego con (cheap-talk game),177, distribución, 24nll
eSlra legias mixtas en el, 39 véase tambié" bayesiano de Nash, 213-21 en estrategias mixtas, 31
ganan.:ias esperadas en el, 33 equilibrio; convenio; eliminación desarrollo temporal de, 215 función de densidad, 23n10
siendo más listo en el, 30 iterativa de estrategias estrictamente ejercicios 4.8,4.9,4.15,253,256 véase también regla de Bayes conjetura "\

Mont¿;omery, J., 51 dominadas; bayesiano perfecto, equilíbrio de agrupación parcial en, problema de teoría de juegos, 4
Myers, S., 177, 186,208 equilibrio; perfecto en subjuegos, 213-21, punto fijo, teorema del, 45-47
l'vIyerson, R., 163, 164, 166, 169 equilibrio de Nash equilibrio bayesiano perfecto en, 177, pura, estrategia:
Nash, teorema de, 33, 45, 124 215 definición de, 93, 117
demostración del, 45-47 véase también bayesiano, juego; ejercicio 2.18, 138
Nash, J., 2,11,45 extensión del, 47 bayesiano perfecto, lC'luilibrio; ejercicios 3.1, 3.3,169-70
Nash, equilibrio de negociación con horizonte finito, juego de señalízación, juego de. en juegos bayesianos estáticos, 151-52
con amenazas o promesas la Pearce, D., 321114,16. en juegos de señalízación, 188
increíbles, 53, 126-129 con información asimétrica, 221-27 penalización, 87 en juegos dinámicos con información
con estrategias mixtas, 10n4, 37-45 ejercicio 2.19,138 desencadenamiento accidental de completa, 93
definición de, con estrategias ejercicios 4.10-4.14, 253-56 una, 106 en juegos repetidos con información
mixtas, 37 resultado por inducción hacia atrás más fuerte creíble, 98, 104-105 completa, 93
definición de, con estrategias puras, 8 del,66-68 véase también palo y la zanahoria, véase también estrategia; mixta,
ejemplos de, 9-10 negociación con horiionte infinito, juego estrategia del; supervisión estrategia
ejercicio 2.21, 138-39 dela imperfecta, juego~~on; disparador, Pyle, D., 248
ejercicios 1.4-1.8,48-49 ejercicios 2.3, 2.20, 131, 138 estrategia pe! ., é ••
en el juego de arbitraje de oferta final, resultado por inducción hacia perfecto en subjuegos, equilibrio de
23-26 atrás de Rubinstein, 68-69 Nash, 57, 89:91, 99, 124-126 racionalídad.sucesiva, 179.
en el juego de duopolio de. negociación de Rubinstein, juego de la, definición de, 94; refinamiento
Berlrand, 21 54,55,66,88,117 ejercicios 2.10-2.13, 2.19-2.23, del equilibrio bayesianoperfecto,
en el juego de duopolio de ejercicios 2.3, 2.19, 2.20, 131, 138 135-36, 138-39 177,194,199,202,236,248
Cmrnot, 16-19 niño mimado, teorema del, 130 véase también inducción hacia atrás, del equilibrio de Nash, 84
en el juego de la moneda, 37-39 nodo de decisión resultado por inducción hacia atrás; ejercicio 4.16, 256
en el juego de los pánicos bancarios, en juegos en forma extensiva, 117, Nash, equilibrio de; resultadoperfecto regla de Bayes, 149112,180,204n6
72-73 119-21. Véase también conjeturas; en subjuegos; bayesiano perfecto, renegociación, 86-86, 11 ...
en juegos en dos etapas cen información imperfecta; conjunto de equilibrio repetido finitamente, juego:
información completa pero información; nodo terminal Perry, M., 132 con información completa, 80-87
imperfecta, 70-71, 72,74,76,78-79 nodo terminal póquer, 30 definición, 82
en juegos repetidos en dos etapas, 81, en juegos en forma extensiva, 117 Porter, R., 106 dilema de los presos con iriformación
83-8~ en subjuegos, 125n19 predicción incompleta, 227-36
en juegos repetidos infinitamente, véase también nodo de decisión; forma en teoría de juegos, 8, 9 renegociación en un, 86-87
90-91,99,102,109-111,114-15 extensiva, juego en equilibrio de Nash como, 7, 8 repetido infinitamente, juego: 87-101
existencia de, en juegos finitos, 33-45 Noldeke, G., 194 por inducción hacia atrás, 56-59 definido, 92
fundamentación del, 8-9 Prendergast, c., 133 estrategia del disparador en, 90
limitaciones del, 177 principio de revelación estrategia en, 93
múlliples, 11, Osbome, M., 130 en el diseño de subastas, 164-165; ganancias ené 95
na existencia con estra tegias puras, enunciado.fomlal del, 166 subjuego en, 94
29 véase también mecanismo directo, véase también ganancia media
reinterpretación con estrategias palo y la zanahoria, estrategia del, 105, compatibilídad de incentivos; cooperación; colusión; factor de
mixtas, 40, 152-155 106 información privada descuento; ganancia factible;

.....
't.a
te::.
ÍNDICE ANM.íII(,() /2'71
270 / ÍNDICE ANALÍTICO

en un juego repetido, ejercicio 2.16, infinitamente, 93


tradición orat teorema de; ganancia en el juego de los pánicos bancarios, 72
137 en el dilema de los presos rel,elicio
de reserva; perfecto en subjuegos, en el juego de los aranceles, 76
Saloner, G., 106, 136 infinitamente, 94
equilibrio de Nash; disparador, en el juego de salarios de eficiencia, 108
Samuelson, W., 159,254 en el duopolio de Cournot repetid"
estrategia del en juegos dinámicos con información
Sappington, D., 169 infinitamente, 105
representación de un juego completa pero imperfecta, 71
Satterthwaite, M., 163 en el juego de política mone!"ria, n5
representación en forma en juegos repetidos en dos etapas, 82,
Scheinkman¡ J., 48 en el modelo de salarios de eficiencia,
extensiva, 115-116 83-84
secuencial, equilibrio, 181n1, véase 111
representación en forma normat 34, relación con el equilibrio de Nash
también bayesiano perfecto, equilibrio en el teorema de tradición oral, 101
146-150 perfecto en subjuegos, 126-127
Selten, R, 94,124 véase también inducción hacia atd,
véase también forma extensiva, juego véase también resultado por
señalización, juegos de: 176-77, 181 continuación, juego de; perfecto en
en; forma normal, juego en inducción hacia atrás; perfecto en
definición de, 185-92 subjuegos, equilibrio de Nash
reputación subjuegos, equilibrio de Nash
ejercicios 4.3-4.7, 250-53 supervisión imperfecta, juegos can,
comparación con el teorema resultado por inducción hacia atrás, 54
juego de estructura de capital, 105-106,106-112
de tradición oral, 228-30 ejercicios 2.1-2.5, 130-132
207-210 Sutton, J., 68
en el dilema de los presos repetido en el juego de duopolio de
juego de mercado de trabajo, 192-207
finitamente, 227-36 Stackelberg, 60
juego de política monetaria, 210-213
véase también información incompleta; en el juego de negociación con tres
refinamientos del equilibrio Takahashi, L, 66, 177, 222, 254
repetido finitamente, juego; repetido periodos, 67 Talión (Tit Jor Tat), estrategia del, en
bayesiano perfecto en, 239-248
infinitamente, juego en el juego de salarios y nivel de el dilema de los presos repetido,
véase también bayesiano, juego;
requisito 5 de señalización (para empleo,.65 228-32
comunicación previa, juego con;
refinamiento del equilibrio bayesiano en juegos de etapa, 83n 113 tipo
bayesiano perfecto, equilibrio
perfecto), 240, 243, 245-46 en juegos de negociación con en el juego de señalización de
separación, equilibrio de, véase
ejercicio 4.16, 256 horizonte infinito, 68-69 estnlclura de capital, 186
bayesiano perfecto, equilibrio
requisito 5, para refinamiento del en juegos dinámicos con información en el juego de señalización de política
Shaked, A., 68
equilibrio bayesiano perfecto, 239 perfecta y completa, 56
Shapiro, c., 54, 107 monetaria, 186
requisito 6 de señalización (para véase también equilibrio de Nash en el juego de señalización en el
Sobet J., 66, 177, 214, 222, 248, 249, 253
refinamiento del equilibrio ba yesiano péi-fecto en subjuegos mercado de trabajo, 186
Spence, A.M., 177, 186, 192, 193-95
perfecto), 243-44, 246-47 Rhee, c., 65, 129, 137 en juegos bayesianos estáticos, 147,
Stacchetti, E.¡ 106
ejercicio 4.16,256 Roberts, L 177, 228, 241, 248 Stackelberg, H. van, 15nl 148
requisitos 1, 2R, 2E,3 de señalización Rogoff, K, 112, 130, 248 Stackelberg, equilibrio de, 60, 61n4 en juegos con parloteo, 214
(para equilibrio bayesiano perfecto Rosen, S., 54, 77, 130 Stackelberg, juego de duopolio de, 54, en juegos de señalización, 185
en juegos de señalización), 188-90, Rotemberg, J., 106, 136 55,59-62,117 en subastas, 155
';,
237n6 Rubinstein, A., 130 ejercicio 2.6, 133 véase también información incompleta
.L/ aplicaciones de, 196, 198-99, 201-204 Rubinstein, juego de negociación de la, Tirole, J., x, 130, 181n3
véase también duopolio, juego de
en juegos con parloteo, 215 54,55,66,88,117 Staiger, D., 129 torneo, 70, 77-80
requisitos 1-4, para equilibrio bayesiano ejercicios 2.3, 2.19, 2.20, 131, 138 Stein, L 213, 248 ejercicio 2.8,134
perfecto, 178-85, 188-90, 199, 225-26, Stiglitz, J., 54,107 Tracy, L 248
236 subasta tradición oral, teorema de, 5'1, 88nl6
resultado, comparado con equilibrio, 126 salarios de eficiencia, juego de los, de sobre cerrado, 155-159 véase también Friedman, teorema ele
véase también resultado por inducción 106-112 doble, 159-164 trayectoria de equilibrio
hacia atrás; resultado perfecto en ejercicio 2.17, 136 reinterpretación en el mercado de definición de, 210-13
subjuegos salarios y nivel de empleo en una trabajo: ejercicio 3.8,171-72 conjeturas en conjuntos de
resultado perfecto en subjuegos empresa con fuente implantación subjuego información en la, 180
ejercicios 2.6-2.9, 133-134 sindical, 62 definición en juegos en forma conjeturas en conjuntos ele
en el juego de etapa de política con muchas empresas, ejercicio 2.7, extensiva, 123-24 información fuera de la, 1S2
monetaria, 113 133-34 definición en juegos repetidos finita e véase tambiérl bayesiano perfecto,

~.)
'-"#;"
;-~;:C"l
¡

equilibrio; refinamiento; perfecto en


subjuegos, equilibrio de Nash

valor próente, 89
Van Damme, E., 194
variables de estado, juego con, 105-106
Vicker" J., 177, 186,210

Wilson, R., 115n17, 130, 177, 180, 228, 248

Ydlen, J., 130


U 1'1~¡,il S IVI
Facultad de Cielic;;¡s ECélr1Ómicils
Zender, r., 208
D£CANi\TO
I ,fBRO CO;\lPR,\DO
l. SE"'JESTRE 2006 1

(;~

También podría gustarte