Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Gibbons Español
Gibbons Español
e 11:1. O:J1J
ROBERf GIBBONS
Universidad de Cornell
t
UN PRIMER CURSO
DE TEORÍA DE JUEGOS
I
I
&
,~-
TraducCión de
Paloma Calvo.
y Xavier ViJa
.i Universidad de Northwestern
~/"" l.i5
CONTENIDO
"':'
,','
":.
Prefacio IX
I
I
a.J
t
VI I
t
i
CONTENIDO CONTENIDU / Vll
2.2.A Teoría: Perfección en subjuegos 69 ' 4.2.B Señalización en el mercado de trabajo 192
2.2.B Pánico bancario 71 4.2.C Inversión empresarial y estructura de capital 207
2.2.C Aranceles y competencia internacional imperfecta 73 4.2.D Política monetaria 2JO
2.2.D Torneos 77 4.3 Otras aplicaciones del equilibrio bayesiano perfecto 213
2.3 Juegos repetidos 80 4.3.A Juegos con parloteo (cheap-talk games) 213
2.3.A Teoría: Juegos repetidos en dos etapas 80 4.3.B Negociación sucesiva bajo información asimétrica 221
2.3.B Teoría: Juegos repetidos infinitamente 87 4.3.C La reputación en el dilema de los presos repetido
2.3.C Colusión entre duopolistas de Cournot 101 finita mente 227
2.3.D Salarios de eficiencia 106 4.4 Refinamientos del equilibrio bayesiano perfecto 236
2.3.E Política monetaria estable en el tiempo 112 4.5 Lecturas adicionales 248
2.4 Juegosdinámicos con información completa pero 4.6 Ejercicios 249
imperfecta 11.5 / 4.7 Referencias 257
2.4.A Representación de losjuegos en forma extensiva 115
2.4.B Equilibrio de Nash perfecto en subjuegos 122 Índice analítico 261
2.5 Lecturas adicionales 129:/
2.6 Ejercicios 130
2.7 Referencias 139
~, .."
PREFACIO
j, •
La teoría de juegos es el estudio de problemas de decisión multipersona-
les. Tales problemas se plantean frecuentemente en economía. Como,es
bien sabido, por ejemplo, en situaciones de oligopolio se dan típicamente
problemas de este tipo (cada empresa debe tener en cuenta lo que harán
las demás). Pero muchas otras aplicaciones de teoría de juegos surgen
en campos ajenos a la organización industrial. A nivel micro económico,
. muchos modelos de intercambio (como los de negociación y de subasta)
utilizan teoría de juegos. A un nivel de agregación intermedio, y en el
campo de la economía laboral o de la economía financiera se utiliza lél
teoría de juegos en mode!os cJ.ecomportamiento de las empresas en los
mercados de factores, o pai~' dilucidar problemas de decisión multiperso~
nales dentro de ellas: varios trabajadores compitiendo por un ascenso,v~~
rios departamentos compitiendo por unos mismos recursos. Finalmente,
al nivel más alto de agregación, en el campo de la economía internacional,
se utiliza en modelos en los que los países compiten (o coluden) en sus
decisiones arancelarias y, en general, en una política económica exterior;
o en macroeconomía, para analizar los resultados de la política monetari!l
cuando el gobierno y los agentes que determinan los salaribs o los precios
se comportan estr,atégicamente.
Este libro está conc~bido para presentar la teoría de juegos a quienes
mástarde construirán (o, al menos, consumirán) los modelos de la teoría
de juegos en los ámbitos aplicados de la economía. Se han procurado
resaltar en él las aplicaciones de la teoría, tanto al menos .como la propia
,'.,
teoría, por tres razones. En primer lugar, porque las aplicaciones ayudan
a enseñar la teoría. En segundo lugar, porque las aplicaciones ilustran el
proceso de construcción de modelos; es decir, el proceso de traducción
de la descripción informal de una determinada situación a un problema
formal de teoría de juegos para ser analizado. En tercer lugar, porque
las diversas aplicaciones permiten comprobar que problemas similares
surgen en áreas diferentes del análisis económico, y que los mismos ins~
trumentos de teoría de juegos pueden apliCarse en cada sih¡ación."Para :..
x/ PREFACIO Prefacio / XI
subrayar el amplio alcance potencial delos juegos los ejemplos habituales Aprendí teoría de juegos con David Kreps, John Roberts y Bob Wilson
de organización industrial han sido sustituidos en gran medida por apli- durante mis estudios de doctorado, y con Adam Brandemburger, Drew
caciones en el ámbito de la economia laboral, de la macroeconomía y de
Fudenberg y Jean Tirole más adelante. A ellos debo la parte. teórica el: e:te
otros campos aplicados detanálisis económico] libro. El énfasis en las aplicaciones y otros aspectos del estIlo pedagoglco
Discutiremos cuatro tipos de juegos: juegos estáticos con información del libro, en cambio, se los debo en gran parte a los estudiantes del de-
completa, juegos dinámicos con información completa, juegos estáticos partamento de economía del M.l.I. quienes, de 19~5 a 1990, inspiraron y
con información incompleta y juegos dinámicos con información incom- moldearon los cursos que han culminado en este lIbro. Estoy muy agra-
pleta. (Un juego tiene información incompleta si un jugador no conoce las decido a todos estos amigos por las ideas que han compartido conmigo
ganancias de otro jugador, como ocurre en una subasta cuando uno de los y el estímulo que siempre me han otorgado, así com? ~or los numerosos
licitadores no sabe cuánto está dispuesto a pagar otro licitador por el bien comentarios útiles al borrador del libro que he reCIbIdo de Joe Farrell ,
subastado.) Correspondiendo a estas cuatro clases de juegos habrá cuatro Milt Harris, George Mailath, Matthew Rabin, Andy Weiss y varios éríticos
nociones de equilibrio: equilibrio de Nash, equilibrio de Nash perfecto en anónimos. Finalmente, me complace reconocer los consejos y apoyo que
subjuegos, equilibrio bayesiano de Nash y equilibrio bayesiano perfecto. he recibido de Jack Repcheck de Princeton University Press y la ayuda fi-
Existen dos maneras (relacionadas) de entender estos conceptos' de nanciera de una beca Olin en economía del National Bureau of EconOlnic
equilibrio. Primero, se puéden entender como sucesIones de conceptos
Research.
de equilibrio cada vez más poderosos, donde las definiciones más podero-
sas {es decir, más restrictiva.s) constituyen intentos de eliminar equilibrios
poco plausibles permitida'spor nociones de equilibrio más débiles. Ve-
remos, por ejemplo, que el equilibrio de Nash perfecto en subjuegos es
más poderoso que el equilibrio de Nash, y que 'el equilibrio bayesiano
perfecto es a su vez más poderoso que el eqUilibrio de Nash perfecto en
subjuegos. Segundo, puede afirmarse que el concepto de equilibrio rele-
vante es siempre el equilibrio bayesiano perfecto (o quizás un concepto
de solución aún más poderoso), aunque éste es equivalente al equilibrio
de Nash en juegos estáticos con información completa, equivalente a la
perfección en subjuegos ~n juegos dInámi~os con información completa (y
perfecta) y equivalente al equilibrio bayesiano de Nash en juegos estáticos
con información incompleta ..
Este libro puede utilizarse de dos formas. A los estudiantes de eco-
nomía de primer año de doctorado, muchas de las aplicaciones les serán
ya familiares, por lo que la parte de teoría de juegos se puede cubrir en
medio semestre, dejando muchas de las aplicaciones para ser estudiadas
fuera de clase. A los estudiantes de lIcenciatura, conviene presentarles
la teoría un poco más despacio, y clibrir en clase virtualmente todas las
aplic1l;ciones. El prerrequisito matemático fundamental es el cálculo di-
ferEáici!il"en"una variable; los rudimeJ1tos de probabilidad y análisis se
introéIucen'a.'medida que se necesitan.
"~';".~,:.'k:::~:t;;;::,~.::-::,:~:~;~~'~,-;
" -
'c,,}' Un~,btÍena fuente de aplicaciones de leoría de juegos en el ámbito de la organización
industrial,es TC9rfa.d~la. organización industrial, de Tirole (Ariel, 1990).
';',J •.~;I.~, -~':. : •..~.¥>-.-'~;.~,-.~~."..:\~.~-
\'
1. JUEGOS ESTÁTICOS
CON INFORMACIÓN COMPLETA
:";
"
En este capítulo consideramos juegos simples de la siguiente forma::pri- ;".
mero los jugadores forman decisiones simultáneamente; abjntfutiációñ
reciben sus ganancias, que depénden de la combinación de,ac.ciones'que ,
acaban de elegir, Dentro de la clase de estos juegos estáticos (o'de(fecrsióh
simultánea), restringimos nuestra atención a los jueg~s 'ton :iri¡oi-mai:íó~ '".,' (
completa. Es decir, la' ftrnciórr.de ganancias de cadajugá~bi";:~k).fiif¡cip~~'jt\~c~~~I¿t.r
que determina la ganancia de cada jugador a partir déIaéoinbiíiáé:t:cr'Lc:. '.?(.,
de acciones elegidas por los jugadores) es corú)dd'áfp6í:'10s'íJg'aq , '
Estudiamos los juegos dinámicos (o de toma'de. dedsioIi.eS'~ticeSivlfJ,',
los capítulos 2 y 4, Y los' j~egos con' informaci6riiriéOmpl~ti'(jt~gt~J'¡J¡:c"~.,
los cuales aI~n' jugáaorno esta segUro' de la funCión,:de:g'aniiliCi~',"'... , ," ,;<"fL
otr~ j~gador, como ocurre en ~I1asubasta en.la cual lo q~e ca~~Ii?t~~~~fo;:~fi:,,:.;:~:¡fi.;.
esta dIspuesto a pagar por el bIen subastacl.oes desconoCldo'pOr:rbS:0tro.S,:.'7,;~':;,;;,::~::}
licitadores) en los capítulos 3 y 4. 'ú;~;:jJ1.j;:)1:;~i\i;<~\':~.':~.j.~t.
En la sección 1.1 entramos en las dos cuestiones básicas de la tebrí~~de':i:.\.;i:.t"~t'
juegos: cómo describir un j~~g9,tsó,mo res~fYrE,~tR[?,bJ?~~4iJ~~~ttg£""
de juegos resultante. Con este fin describimos los instrumentos que,t,ití::~::~\i ..,;::i
lizaremos para analizar los juegos estáticos con informacióncompletáJ;,y!<:'
sentaremos las' bases de la teoría que utilizaremos para analizar jue'gos
más ricos en capítulos posteriores. Definimos tambiénJa repre.se:r¡tacÍljn,e11
forma normal de un juego y la noción de estrategia estrictamerzteti9mi.~
Demostramos ,que algunos juegos pueden resolverse mediq,nteja.; ªR1i;'
cación de la idea de que los jugadores racionales no utiUzarlestr~te~ '
estrictamente dominadas, pero también que en otros 'juegos' est~',e&:~
que da lugar a predicciones muy imprecisas sobre el desarrollode1jÍj~o '
(algunas veces tan imprecisa como la afirmación de q\le,"cuaIquiercqsª,
puede ocurrir"), Después, definimos el equilibrio de Nash,un concept2i.d~':",,~.,
solución que da pie a predicciones mucho más precisas,en una clase:j:l~:'>';
juegos muy amplia. - ",,:, .. " >::c~':~~'
2 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1) 7eoría básica: luegos en {arma/normal y equilibrio de Nas/¡ I 3
En la sección 1.2, utilizando los instrumentos desarrollados en la serán sentenciados a seis meses de cárcel. Finalmente, si uno confiesa y el
sección previa, analizamos cuatro aplicaciones: el modelo de competencia otro no, el que confiesa será puesto en libertad inmediatamente y el otro
imperfecta de Coumot (1838), el modelo de competencia imperfecta de será sentenciado a nueve meses en prisión, seis por el delito y tres más
,
¡<
y.
,
Bertrand (1883), el modelo de arbitraje de oferta final de Farber (1980) por obstFUcción a la justicia.
y el problema de los ejidos (discutido por Hume [1739] y otros). En El problema de los presos puede representarse mediante la siguiente
cada aplicación, en primer lugar traducimos la descripción informal del matriz binaria. (Como matriz, una matriz binaria puede tener un núrnero
problema a una representación en la forma normal del juego y después arbitrario de filas y columnas; binaria se refiere al hecho de que en un
hallamos su equilibrio de Nash. (Cada una de estas aplicaciones tiene un juego de dos jugadores hay dos números en cada casilla, las ganancias de
único equilibrio de Nash, pero discutimos ejemplos en los cuajes esto no los dos jugadores).
ocurre.)
En la sección 1.3 volvemos a la teoría. En primer lugar definimos la
Preso 2
noción de estrategia mixta, que interpretamos en términos d.-ela falta de cer-
Callarse Confesar
teza de un jugador con respecto a lo que otro jugador hará. Seguidamente,
enunciamos y discutimos el teorema de Nash (1950),el cual garantiza que Callárse -1,-1 -J,Q
un equilibrio de Nash (que puede incluir estrategias mixtas) existe en una Preso 1 - .',
amplia clase de juegos. Puesto que presentamos primero la teoría bá-
sica en la sección 1.1, las aplicaciones en la sección 1.2 y, finalmente, más
Confesar (Ü,'--c 9
"..
(6'-6
"\ -~'-
teoría en la sección 1.3, resulta evidente que el conocimiento de la teoría
incluida en la sección 1.3 no constituye un requisito para entender las El dilema de los presos
aplicaciones de la sección 1.2. Por otra parte, la idea de estrategia mixta y
la exis'tencia de equilibrio aparecen (ocasionalmente) en capítulos poste- En este juego, cada jugador cuenta con dos estrategias posibles: confe~
riores. sar y no confesar. Las ganancias de los dos jugadores cuando eligen un par
Cada capítulo concluye con ejercicios, sugerencias de ,lectura adicional concreto de estrategias aparecen en la casilla correspondiente-de la ma~
y referencias. triz binaria. Por convención, la ganancia del llamado jugador-fila (aquí el.
.~ , • preso,l) es la primera, ganancia, seguida, po~:la.gananciadeL jugador:,:
columna (aquí el preso 2). Por eso, si por.ejemp~o;el pre~oJ elige caUar.y.
1.1 Teoría básica: Juegos en forma normal y equilibrio de Nash
el preso 2 elige confesar, el preso 1 recibe una ganancia de-9(que repre,
1.1.A Representación de los juegos en forma normal senta nueve, meses en prisión) y el preso 2 recibe una gananCia de O (que
representa la inmediata puesta en libertad),
En la representación de un juego en forma normal cada jugador elige de Ahora abordamos el caso generaL .La representación en forma normal
forma simultánea una estrategia, y la combinación de las estrategias ele~ de un juego especifica: (1) los jugadores en el juego, (2) las estrategias
gidas por los jugadores determina la ganancia de cada jugador. Vamos de que dispone cada jugador y (3) la ganancia de cada jugador en cada
a ilustrar la representación en forma normal con un ejemplo clásico; el combinación posible de estrategias. A menudo discutiremos juegos con
,-.:.,'
del dilema de los presos. Dos sospechosos son arrestados y acusados de un número n de jugadores, enlos cuales los jugadores están numerados de
un: delltoo"rta policía no tiene evidencia suficiente para condenar a los 1 a n y ~ jugadºL~bitrari~~s denominad.o_p;.g;do:r-i:)SeGei~onjunto
sósp€éh:osOs,a menos que uno confiese.. La policía encierra a los sospe::' de estrategias con que cuenta el jugador i (llamado espacio de estrategia1
;~osCJse!t"~~Idasseparadas y les explica las consecuencias derivadas de las de i), y sea Si un elemento arbitrario de este conjunto. (Ocasionahnetí'ie
. \Íedsionés" que formen. Si ninguno confiesa, ambos serán condenados por escribiremos si E Si rara indicar que la estrategia Si es uh elemento
un delito menor sentenciados a un mes de cárcel. Si ambos, confiesan~ del conjunto Si.)Sea (sI,'" ,sn) una combin'ación de estrategias, una para;
<l/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1)
Teoría básica: Jllegos en formal normal y eqllilibrio de Nash I 5
cada jugador, y seaUi la función de ganancias del jugador i: '!ti(sl, ,sn) es siempre que T > R > P > I, para plasmar las ideas de ganancias de
la ganancia del jugador i si los jugadores eligen las estrategias (SI, ,sn)' tentación, recompensa, penalización e ingenuidad. De forma más general:
Compilando toda esta información tenemos:
Definición. En el juego en forma normal G = {SI, ... ,Sn;Ul, ... ,lln}, sean s;
Definición. La representación en forma nonnal de un juego con n jugadores
y s;' posibles estrategias del jugador i (por ejemplo, s; y s;' son elementos de Si).
especifica los espacios de estrategias de los jugadores SI,' .. ,Sn y sus funciones
La estrategia s; está estrictamente dominada por la estrategia s;' si para cada
de ganancias '!tI, ... ¡Un. Denotamos este juego con G = {SI, ... ,SIl;Ul, ... ¡Un}. ..
combinación posible de las estrategias de los restantes jugadores la ganancia de i "::':.'
por utilizar si es estrictamente menor que la ganancia de i por utilizar s;':
Aunque hemos indicado que en un juego en forma norm~llos juga-
dores eligen sus estrategias de forma simultánea, esto no significa que las
partes actúen necesariamente de fonna simultánea. Es suficiente que cada
para cada (sIr' .. ,Si-l,Si+l,' .. ,sn) que puede ser construida a partir de los espa-
parte elija la acción a seguir sin conocer las decisiones de los demás, como
cios de estrategias de los otros jugadores SI,'" ,Si~l,Si+l, ... ,Sn'
sería aquí el caso si los presos tomasen una decisión en momentos arbitra-
TÍosen sus celdas separadas. Además, aunque en este capítulo utilizamos
juegos en forma normal para representar solamente juegos estáticos en Los jugadores racionales no utilizan estrategias estrictamente domina-
los cuales los jugadores actúan todos sin conocer las decisiones de los das, puesto que bajo ninguna conjetura que un jugador pudiera formarse
demás jugadores, veremos en el capítulo 2 que las representaciones en sobre las estrategias que elegirán los demás jugadores sería óptimo utili-
forma normal pueden darse en juegos con tomas de decisión sucesivas, zar tales estrategias. 1. Así, en el dilema de los presos, un jugador racional
pero también que una alternativa, la representación en fonna extensiva del elegirá confesar, por lo que (confesar, confesar) será el resultado alque lle-:
juego, es a menudo un marco de trabajo más conveniente para analizar gan dos jugadores racionales, incluso cuando (confesar, confesar) supone
los aspectos diná,IIri,cosde los juegos. unas ganancias peores para ambos jugadores que (callar, callar). Como
el dilema de los presos tiene múltiples aplicaciones (que incluyen la ca-
1.1.B EliminaciÓn iterativa de estrategias estrictamente dominadas t l '::
~ rrera de armamentos y el problema del polizón en la provisión de bienes
públicos) trataremos variantes del juego en los capítulos 2 y 4. Por ahora
nos centraremos más bien en si la idea de que jugadores racionales no uti-
Después de describir un modo de representar un juego, ahora vamof? a
lizan estrategias estrictamente dominadas puede conducir a la solución
esbozar una forma de resolver un problema de-teoríadejuegos. Empe-
de otros juegos.
zamos con el dilemá de los presos, porque es fácil de resolver utilizando
únicamente la idea de que un jugador racional no utilizará una estrategia Consideremos el juego abstracto de la figura 1.1.1.2 El jugador 1 tiene
estrictamente dominada .. dos estrategias y el jugador 2 tiene 3: Sr = {alta, baja} y S2 = {izquierda,
centro, derecha}. Para el jugador 1, ni alta ni baja están estrictamente
En el dilema de los presos, si un sospechoso va a confesar, sería mejor
para el otro confesar y con ello ir a la cárcel seis meses, en lugar de callarse
1 Una cuestión complementaria también tiene interés: si no existe una conjetura que'el
y pasar nueve meses en prisión. Del mismo modor'siun sospechoso va a jugador i pueda formarse sobre las estrategias de los demás jugadores, que haga óptimo elegir
1:::.-
callarse, para el otro sería mejor confesarycon el~os~r puesto en libertad la estrategia Si, ¿podemos concluir que debe existir otra estrategia que domine estrictamente a
inmediatamente en lugar de callarse y permanecer en prisión durante s.;? L;'respuésta es afirmativa, siempre que adoptemos definidones adecuadas de "conj~tura';
y de "otra estrategia", términos que incluyen la idea de estrategias mixtas que introduciremos
un mes. Así, para el preso i, la estrategia de callarse está dominada en la secdón 1.3.A.
por la de confesar: para cada estrategia que el preso j puede elegir, la 2 La mayor parte de este libro considera aplicaciones económicas más:que ejemplos
ganancia del pnsionero i es menor si se calla que si cónfiesa. (Lo mismo abstractos, tanto porque las aplicaciones Son de interés por sí mismas como porque, pa~~..
ocurriría en cualqUier matriz binaria en la cual las ganancias 0, "--:1; -6 múchos lectores, las aplicaciones son a menudo un modo útil de explicar la teoría subyacente:;',
Sin embargo, cuando introduzcamos algunas ideas teóricas básicas, recurriremos a.eJe~p]' .. ,
Y -9 fueran reemplazadas por las ganancias T,R,P ePiespectivamente, abstractos sin una interpretación económica directa. ¡. ,".t,l"
:::--
1:
6 / JUEGOS ESTÁTICOS CON INFOR.MAClÓN COMPLETA (e. 1) Teoría básica: fuegos en formal nonnal y equilibrio de Nas/¡ / 7
,.ó"~';~;"~~V
.. J~~r~~#ft."'
.
:,f.~,•..
. -'~;. x" ,l'"
8/ jUECOS ESTATICOS CON INFORMACIÓN COMPLETA (e. 1)
Teoría básica: Juegos en formal nonnai y equilibrio de Nash / 9
Un par de estrategias satisface la condición (EN) si la estrategia de equilibrio de Nash. Para ver esto último recordemos que en la figura 1.1.4,
cada jugador es la mejor respuesta a la del otro, es decir, si ambas ganan- el equilibri.? de Nash ofrece una única predicción C8,D), mientrélS que la
cias estáÍr subrayadas en la casilla correspondiente de la matriz binaria. eliminación iterativa de las estrategias estrictamente dominadas ofrece
. Por ello C8,D) es el único par de estrategia~ que satisface (EN). Lo mismo una predicción con el mayor grado de imprecisión posible: no se elimina
:, ocurre para (confesar, confesar) en el dilema de los presos y para (alta, cen- ninguna.estrategia; puede ocurrir cUéllquiercosa.
.,,>' Tras demostrar que el equilibrio de Nash es un concepto de solución
tro)en la figura'1.1.1. Estos pares de estratégias son los únicos equilibrios
de Nash dé estos juegos.4 más poderoso que la eliminación iterativa de las estrategias estrictamente
dominadas tenemos que preguntarnos si el equilibrio de Nash no es un
concepto de solución demasiado poderoso. Esto es ¿podemos estar se-
1 e D guros de que el equilibrio de Nash existe? Nash (1950) dem\Jstiá que en
lA 0,1- 1-;0 5,3 cualquier juego finito (por ejemplo, un juego en el cual el nun1ero n de
jugadores y los conjuntos de estrategias SI,' .. ,Sn son todos finitos) existe
M 1,0 0,1- 5,3 al menos un equilibrio de Nash. (Este equilibrio puede~!1Cluirestréltegias
B 3,5 3,5
º'~ mixtas, que discutiremos en la sección 1.3.A. Paraun J~unciado preciso
del teorema de Nash véase la sección 1.3.B.) COUlnot (1838) propuso la
Figura 1.1.5 misma noción de equilibrio en el contexto deÍlJ1 modelo particular de
duo polio y demostró (por construcción) que existe un equilibrio en este
A continuación tratamos larel~dón entre el equili1:Jri2=c1..~ l':fª-sh y la modelo; véase la sección 1.2.A. En cada aplicación anaÜzada en este libro,
, eliminación iterativa de las estrategias estrictamente dominadas. Recor- seguiremos el ejemplo de Cqumot: demostraremo~ q~e existe un equi-
demos que las estrategias de equilibrio de Násh én el dilema de los presos Jibrio de Nash (o más poderoso) mediante la construcéión de uno. En
y
yen1a figUra1.P -:-(col1fesar,confésar) (álta, éentro)respectivamenfee- .algunas secciones teóricas, no obstante, utilizaremo~ el teorema de Nash
sorilas únicas estrategias 'que sobreviven a la eliminación iterativa de las (o su análogo para conceptos de equilibrio más poderosos) y simplemente
estrategias estrictamente dominadas. Este resultado puecl.egeneralizarse: diremos que existe un equilibrio. .,
si la ~lirniÍ1.aciónih;;rativa de las estrategias estrictamente dominadas eli- Conclullnos esta sección con otro ejemplo clásico, la bat~lla de los sexos.
mina tbdas las estrategias ~'enos las estrategias' (si, ... ,<), estas esfrate- Este ejemplo muestra que un juego puede tener múltipl~~equl1i'Griosae
giasconstituyen el único equilibrio de Nash del juego. (Véase el apéndice Násh, y también será útil en las discusiones sob~~~stTategias mixtas de las
para'una demostració'n de esta aflnnación.) Sin embargo, puesto que la secciones 1.3.B y 3.2.A. En la exposición tradicionáldel juego (que, quede
eliminación iterativa de las estrategias estrictamente dominadas éoÍl fre- claro, data de los años cincuenta), un hombre y una mujer están tratando
no
cuencia elimina más que una combinación de estrategias, es del máximo de decidir qué harán esta noche; nosotros analizarnos uha versión del
in~erés el hecho de que elequilibno déNáshsea un concepto de soluCión juego que no tiene en cuenta el sexo de los participantes} En lugares
más poderoso que la eliminaCi6n iterativa de las estrategias estrictamente de trabajo sep¡:¡rados, Paty Chris deben elegir entre ir a.'la ópera' o élun
dominadas en el siguiente sentido: si las estrategias si, ... ,s~ constituyen combate de boxeo.. Arn,bos(as) jugéldores(as) preferirían pasar la noche
iÚl"equilibrio de Nash, sobreviven a la eliminación iterativa de las estra- juntos(as), pero Pat preferiría estar juntos(as) en el boxeo, mientras que
tegias,estrictamenté dominadas (véase apéndiee para una demostración), Chris preferiría estar juntos(as) en la ópera, tal como representamos en la
. ,~' matriz binaria que sigue:
'..:::;:; pero pueden existir estrategias que sobrevivan a la eliminación iterativa de
elitrategi~s,estrictamente dominadas pero que no formen parte de ningún
"t;Ut~{'~,\~J~~~t.:h~~\1i'\~~;;-\:c:
..', -, . :' ".
, .
..;"",4:EstÍlafumadón es correcta incluso si no limitamos nuestra atendón al equilibrio de Nash
,'en:estx:~tegiaspuras; puesto que en estOs juegos no existen equilibrios de Nash en estrategias s En inglés, los diminutivos Pat y Chris pueden referirse tanto a nombres masculinos
i>''''fuíXta&:Yéasee! ejercido 1.10. :. ','. . (Patrick y Christopher) como femeninos (Patricia y Christinal. (N. de los T.)
'-';)';".;' '.'
12/ JUEGOS ESr,\rICOS CON INFOIUvlACJÓN COMPLETA (e. 1)
Teoría básica: fuegos en jonnalnol'mal y equilibrio de Nash / 13
Apéndice
Pat
Ópera Boxeo
Este apéndice contiene d~ll1ostraciones de las dos proposiciones siguientes,
que fueron enun<;:iadasde manera informal en la sección 1.1.C. Saltarse
Ópera ?,l 0,0
estas demostraciones )1.0 jmpedirá de forma sustancial la comprensión
Chris
del resto d~l libro. Sin embargo, para aquellos lectores no acostumbra~
Boxeo 0,01,~
dos a la manipulación de definiciones formales y a la construcción de
demostraciones, el dominio de estas demostraciones constituye un va-
La batalla de los sexos lioso ejercicio.
Ambos, (ópera, ópera) y (boxeo, boxeo) son equilibrios de Nash: Proposición A. En el juego en forma normal con njugadores G= {Sr. ... ,
Hemos argumentado antes que"si la teorladejuegos ofrece una única Sn; Ul,,; . ,Un L si la eliminación iterativa de las estrategias estrictamente domi-
solución a un juego, ésta debe ser un equilibiio de Nash. Este argumento nadas elimina todas las estrategiqs menos las (s1'" . ;s~),estas últimas estrategias
ignora la posibilidad de juegos en los cuales la teoría de juegos no' ofrece constituyen el único equilibrio de Nash del juego.
una solución única. También hemos argumentado que si se llega a un
ª<;:ut:!"¡jg._~º.º!~_~~mo
comportarse en un juego, las éstrategias establecidos Proposición B. En el juego en forma normal con n jugadores G = {SI,' .. ,Sn;
.t:!l tiªmergQ _d~~~~_se¡:-ú~. t:g~lliPJi~2=~~:~E!' I?~!~._e?t~.a~~~~~h>7al Ul, ... ,Un}, si las estrategias (S1' ... ,s~) forman un equilibrio de Nash; entonces
ig~~! que eLª~t~r.i~!,ignoral~ p_~~i!?ili9.él~.~e
juegospara los cuaiés7~se- sobreviven a la eliminación iterativa de las estrategias estrictamente dominadaS}'
_a!cance un -élc.~~~'!.<:¡Eña[gÚnSJsj~~g~~~º~múItipl~s'éCiciiil)riós~~f~"'Ñasl1'. ,.• .'.::t. ;'~-~~::~'li;r"
s()~~~sa!e_~~_~9,~~~Lb!2~.~o..mo)asol~.~ión más atT'a5.~Yª.9~lj~o:l'C¥an Puesto que la proposición B es más fácil de demostrar, comeriZalli~s
parte de la teoría de los capítulos posterl.oresci:mstÜuye'u~ esfu';Z'opa;á . por ella para entrar en materia. El argumenta "es
por<co¡{tradlédÓhí
identificar este equilibrio más atractivo en diferentes clases de juegos.) Esto es, vamos a suponer que una de las estrategias,en unequiIíbri~
Así, la existe.n.ciade múltiples equilibrios de Nash no es un problema en de Nash es eliminada por eliminación iterativa de las estrategias'~stri'c-'
sí mismo. Sin embargo, en la batalla de los sexos, (ópera, ópera) y (boxeo, tamente dominadas, y después demostraremos que llegaríamos a urta
boxeo) parecen iguahnente atractivos, lo que indica quepuééien eXistir conqadicc~ón si este supuesto ocurriera, demostrando así que el ~U:pti~sto
debe ser falso.' . .., -..i~.K•.,.... - ,.• ' ",.,L '"-
juegos para los cuales la teoría de juegos no ofrece una"soluciÓr{única y
en los que no se llegará a ningún acuerdo.6 En tales juegos, el equilibrio Supongamos que las estrategias (si,. e, e ,s;;') forman un equilibriCld~
de Nash pierde gran parte de su atractivo como predicción del juego. Nash del juego en forma normal G= {SI," "Sn;Ui~¿; ;,un}, pero sÜ:pon:
gamos también que (tal vez después de que algunas estrategias distintas
de (s1" .. ,s~) hayan sido eliminadas) si es la primera de las estrat~gias
(s1' ... ,s~) en ser eliminada por ser estrictamente'dominada. Entonces,
debe existir una estrategia S~' que no ha sido aún eliminada de Si que
domina estrictamente a si. Adaptando (DE) tenemos ., .'
6 E l .-
. n a secaon 1.3.B describimos un tercer equilibrio de Nash (que incluye estrategias
nuxtas) en la batalla de los sexos. Al contrario que (ópera,ópera) y (boxeo,boxeo), este tercer.
eqUlhbno ofrece ganandas simétricas, como se podria esperar de la solución única a un juego
sunetnco. Por otro lado, el tercer equilibrio es también ineficiente, lo cual puede influir en (Li.l)
contra de que se llegue a un acuerdo para alcanzarlo. Cualquiera que sea nuestro juicio sobre
los eqUllibnos de Nash en la batalla de los sexos, la cuestión sigue en pie: pueden existir para cada (sI;' .. ,si-l,Si+l,' .. ,Sn) que puede ser construida a partir de las
Juegos para l~s cuales la teoría de juegos no ofrezca una soluciÓn única y para los que no se estrategias que no han sido aún eliminadas de los espacios de estrategias
llegue a rungun acuerdo ..
de losatros jugadores. Puesto que si es la primera delas estrategias de
,', .
'~:'~ I
equilibrio en ser eliminada, las estrategias de equilibrio de otros jugadores Si s; = si (es decir, si si es la estrategia que domina estrictamente a s;)
no han sido eliminadas, por lo que una de las consecuencias de (1.1.1) es (1.1.5) contradice a (1.1.3),en cuyo caso la demostración está completa. Si
s; I si alguna otra estrategia s;' debe más tarde dominar estrictamente a
(1.1.2)
s;, ya que s; no sobrevive al proceso. Por eSO, las desigualdades análogas
a (1.1.4) y (1.1.5) se cumplen para s; y s;', que sustituyen a Si y -< respec-
Pero (1.1.2) es contradicha por (EN): si debe ser una mejor respuesta a . tivamente. Una vez más, si s;' = si la demostración está completa; si no,
(si, ... ,s:~1,s:+l"" ,s~), por lo que no puede existir una estrategia <' que pueden construirse otras dos desigualdades análogas. Puesto que es .<
domine estrictamente a si. Esta contradicción completa la demostración. la única estrategia de Sí que sobrevive al proceso, la repetición de este
Después de haber demostrado la proposición Bhemos ya demostrado argumento (en un juego finito) completa finalmente la demostración.
parte de la proposición A; lo único que nos queda demostrar es que si
la eliminación iterativa de estrategias estrictamente dominadas elimina
1.2 Aplicaciones
todas las estrategias excepto (si, ... ,s~), estas estrategias forman un equi-
librio de Nash. Por la proposición B cualesquiera otros equilibrios de
Nash habrían sobrevivido también, por lo que este equilibrio debe ser 1.2.A Modelo de duopolio de Cournot
único. Suponemos aquí que G es finito.
El argumento es nuevamente por contradicción. Supongamos que Como hemos indicado en la sección previa, Cournot (1838) se anticipó
la eliminación iterativa de estrategias estrictamente dominadas elimina a la definición de equilibrio de Nash en más de un siglo (pero sólo en
todas las estrategias excepto (si, ... ,si'), pero estas estrategias no forman el contexto de un modelo concreto de duopolio). Por ello, no es sor-
un equilibrio de Nash. Entonces debe existir un jugador i y alguna estra- prendente que el trabajo de Cournot constituya uno de los clásicos deía
tegia factible Si en Si tal que (EN) no se cumpla, pero Sí debe haber sido teoría de juegos y una de las piedras angulares en organización industriaL
estrictamente dominada por alguna otra estrategia s; en algún punto de] Consideramos aquí una versión muy simple del modelo de Cournot y
proceso. Los enunciados formales de estas dos observaciones son: existe presentaremos variaciones del modelo en los capítulos siguientes. En esta
Sí en Si tal que
sección utilizamos el modelo para ilustrar: (a) la traducción del enunciado
informal de un problema a.la forma normal de un juego; (b) los cálculos
necesarios para hallar el equilibrio de Nash del juego y (c) la eliminación
(1.1.3) iterativa de las estrategias estrictamente dominadas.
y existe s; en el conjunto de estrategias del jugador i que queda en algún Sean q1 y q2 las cantidades (de un producto homogéneo) producid~~
punto del proceso tal que . por las empresas 1 y 2 respectivamente. Sea P(Q) = a - Q el precio
de equilibrio de mercado cuando la cantidad agregada en el mercado es
Q = q1 + q2. (Más precisamente, P(Q) = a - Q para Q < a. y P(Q) = Opara
(1.1.4) Q 2: a.) Supongamos que el coste total de producción de la cantidad qi
para cada (S1,", ,Sí-1,Si+1," . ,sn) que puede ser construida a partir de las por la empresa i es Cí(qí) = eqí. Es decir, no existen costes fijos y el coste
estrategias que quedan en los espacios de estrategias de los otros jugadores marginal es constante e igual a e, donde suponemos que e < D.. Siguiendo
en ese punto del proceso. Puesto que las estrategias de los otros jugadores a Cournot, suponemos que las empresas eligen sus cantidades de forma
(si, ... ,si_1,s:+1'" . ,s~) nunca son eliminadas, una de las implicaciones de simultánea?
(1.1.4) es
. 7 En la sección 1.2.B discutimos el modelo de Bertrand (1883), en el cual las empres"s
ehgen preaos en vez de cantidades, y en la sección 2.1.B el modelo de Stackelberg (J 934), en
el cual las empresas eJ:gen cantidades, pero una empresa eHge antes que (y es observada por)
(1.1.5) la otra. Finalmente, discutimos en la sección 2.3.C el modelo de Friedman (1971). en el cual la
interacción descrita en el modelo de Coumot ocurre repetidamente en el tiempo .
16,' JUECOS EST.S.TICOS CON INFORMACIÓN COMPLETA' (e. 1) Aplicaciones / 17
Para encontrar el equilibrio de Nash en el juego de Cournot, primero En el modelo de duopolio de Cournot, el enunciado análogo es que el par
traducimos el problema a un juego en forma normal. Recordemos de de cantidades (qj,qi) forma un equilibrio de Nash si, para cada empresa
la sección anterior que la representación en forma normal de un juego i, q7 es una solución de
exige precisar: (1) los jugadores en el juego; (2) las estrategias de que
dispone cada jugador y (3) las ganancias recibidas por cada jugador con
cada combinación de estrategias posibles. Hay dos jugadores en un juego "
"
de duopolio: las dos empresas. En el modelo de Cournot las estrategias Suponiengo que qj < (bc(<;:omo demostraremos que ocurre), la condición
de que dispone cada empresa son las diferentes cantidades que puede de primer orden del problema de optimización dela empresa i es necesaria
producir, Vamos a suponer que el producto es continuamente divisible. y suficiente, con lo que se obtiene
Naturalmente, no puede haber producción negativa. Por ello, el espacio
1
de estrategias de cada empresa puede ser representado com? Si ':"[O,OO)! qi = 2(a - qj - e).
los números reales no negativos, en cuyo caso una estrátegiaÍípica'~i es
Así, si él phrdecantidades (qj,qi) ha de formarun'equilibrlo de Nash,Jas
la elección de una cantidad q.¡ 2': O.Se podría argumentar que no se puede
canhdadeselegidas por las ettípresas deben cumplir ' "
disponer de cantidades demasiado grandes, por 10 que éstas 'no debé'rían
incluirse en el espacio de estrategias de una empresa. No obstante, puesto
°
que P(Q) = para Q 2: a, ninguna empresa producirá una cantidad qi > a. ql* = 21(a - q2• - e)
Quedan por concretar las ganancias de la empresa .í en función de las y
estrategias elelsidas por dicha empresa y por la otra empresa, y definir
y hallar el equilibrio. Suponemos que las ganancias de la empresa son •
q2 = 21( a - • )
ql - e .
i~~.,
ql = q2 = -3-'
.
lri(qi,qj) = q¡[P(q¡ + qj) - el = gira - (qi + qj) - c]. que es ciertamente menor que a - e, como habíamos supuesto.
La interpretación de este equilibrio es simple. Cada empresa quema
Recordemos de la sección previa que, en un juego en forma normal de
por supuesto tener el monopolio del mercado, en cuyo caso elegiría qi para
dos jugadores, el par de estrategias (si ,si) forn'1.a. un equilibrio de Nash si,
para cada jugador i, maximizar 1f'i(qi,O), produciría la cantidad de monopolio q';'= (a - e)/2 y
alcanzaría un beneficio de monopolio 1f'i(qm,O) = (a - e)2 / 4. Dado que hay
dos empresas, los beneficios agregados del duopolio se verían maximiza-
(EN)
dos fijando una cantidad agregada ql + q2 igual a la cantidad de monopolio
para cada posible estrategia S¡ en Si. De la misma forma, para cada qm, como ocurrirla si qi = qm/2 para cada i, por ejemplo. El problema de
jugador i, 87debe ser una solución del problema de optimización este arreglo es que cada empresa tiene un incentivo para desviarse de él,
puesto que la cantidad de monopolio es baja, el precio correspondiente
P(qm) es alto y, a este precio, cada empresa quema aumentar su cantidad,
max 'lLi(8i,8j)'
',ES, pese a que tal incremento en la producción bajaria el precio de equilibrio
de mercado. (Formalmente, utilícese (1.2.1) para comprobar que qm/2 no
8 Obsérvese que hemos cambiado ligeramente la notación al escribir Ui(Si,Sj) en vez
de 'l/.¡(SI,s2)' Ambas expresiones representan las ganancias del'jugador i en función de las
es la mejor respuesta de la empresa 2 a la elección de qm/2 por parte de la
estrategias elegidas por todos los jugadores, Vamos a utilizar estas expresiones (y sus análogas empresa 1.) En el equilibrio de Cournot, al contrario, la cantidad agregada ,'-
,
con 11 jugadores) indistintamente. es más alta, por lo que el precio correspondiente es más bajo, con lo que la'
.,'
i.:,.
18 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1) Aplicaciones I 19
tentación de aumentar la producción queda reducida justo lo preciso para Como se muestra en la figura 1.2.1 estas dos funciones de mejor respuesta
que cada empresa decida no hacerlo, al darse cuenta de que con ello caerá se cortan sólo una vez, en el par de cantidades de equilibrio (qi ,q;).
el precio de equilibrio de mercado. Véase el ejercicio 1.4 para un análisis Un tercer modo de hallar este equilibrio de Nash es aplicar el proceso
de cómo la presencia de un número n dé oligopolistas afecta al dilema de eliminación iterativa de las estrategias estrictamente dominadas. Este
planteado en equilibrio por la tentacióri de aumentar la producción y el proceso ofrece una única solución que, por la proposición A del apéndice
temor a reducir el precio de equilibrio de mercado. de la sección anterior, debe ser un equilibrio de Nash (qj',qi). El proceso
En vez de hallar de forma algebraica el equilibrio de Nash del juego completo requiere un número infinito de pasos, cada uno de los cuales
de Cournot, se podría hallar gráficamente del modo siguiente: la ecuación elimina una fracción de las cantidades que quedan en el espacio de es-
(1.2.1) proporciona la mejor respuesta de la empresa i a la estrá'tegia de trategias de cada empresa. Vamos a discutir solamente los dos primeros
equilibrio de la empresa j, q;. Un razonamiento análogo conduce a la mejor pasos. En primer lugar, la cantidad de monopolio qm = (a. - c)/2 domina
respuesta de la empresa 2 a cUalquier estrategia arbitraria de la empresa estrictamente a cualquier cantidad más alta. Es decir, para cada :/; > 0,
1, y la mejor respuesta de la empresa 1 a cualquier estrategia arbitraria 'lri(qm,qj) > 'lri(qm + x,qj) para toda qj ~ o. Para comprobarlo, nótese que
"',
",! y si Q = qm + X + qj ~ a, entonces P(q) = O, por lo que producir una
cantidad menor aumenta el beneficio. En segundo lugar, puesto que
las cantidades mayores que qm han sido eliminadas, la cantielad (a -
' ..::; q, c)/4 domina estrictamente a cualquier cantidad más baja. Esto es, para
cualquier x entre cero y (a - c)/4,'lri [(a. - c)/4,qj] > 'lri[(o. - c)/4- x,qjJ para
cualquier qj entre cero y (a - c)/2. Para comprobarlo, nótese que
y
(O, (a - e)/2)
o.-c ) = [a-c
-4- - x ] [3(a-C)
---4-- + x ]
7fi ( -4- - x,qj - qj
',-
.•..
a. - e ]
.¡)~
.- ='lri ( qm,qj ) - X [ -2- +x - qj -
.• «a - c)/2, O) (a e c, O)' q, Tras estos dos pasos, las cantidades que quedan en el espacio de estrategias
de cada empresa sonlas contenidas en el intervalo entre (0.-c)/4 y (a-c) /2 .
.,): -; Figura 1.2.1 La repetición de estos argumentos conduce a intervalos cada vez menores
20/ JUECOS ESrÁrlCOS CON INfORMACIÓN COMPLETA (e. 1) Aplicaciones / 21
de las cantidades que quedan. En el límite, estos intervalos convergen al Como en el caso anterior, la repetición de estos argumentos conduce a la
único punto IJ.; = (a -c)/3. cantidad qi = (a - c)/3.
La eliminación iterativa de las estrategias estrictamente dominadas Concluimos esta sección cambiando el modelo de Coumot, de forma ".
también se puede representar en forma gráfica utilizando la observación que la eliminación iterativa de las estrategias estrictamente dominadas no
(incluida en la nota 1; véase también la discusión en la sección 1.3.A) de ofrezca una solución única. Para hacerlo, añadimos simplemente una o
,
que una estrategia es estrictamente dominada si y sólo si no existe ninguna más empresas al duopolio existente, Vamos a comprobar que el primero .•.... :
conjetura sobre las decisiones posibles de los demás jugadores para la cual de los dos pasos discutidos en el caso del duo polio continúa cumpliéndose,
sea la mejor respuesta. Puesto que sólo hay dos empresas en este modelo, pero el proceso termina ahí. Por eso, cuando hay más de dos empresas,
podemos reformular esta observación del siguiente modo: una cantidad la eliminación iterativa de las estrategias estrictamente dominadas ofrece
q¡ es estrictamente dominada si y sóJo si no hay ninguna conjetura sobreqj sólo la predicción imprecisa de que la cantidad de cada empresa no ex-
tal que q¡ sea la mejor respuesta de la en1presa i. Nuevamente"discutimos 'cederá a la cantidad de monopolio(como enla figura 1.1.4, donde no se
sólo los dos primeros pasos del pr,?ceso iterativo. En primer lugar,:n1¥1~a eliminaba ninguna ~strategia durante el proceso).
es una respuesta mejor para la empresa i producir más que la canti~~d de Para ser más concretos, consideramos el caso de tres empresas. Sea
monopolio qm = (a - c)/2. Para comprobarlo, consideremos, por ejemplo, Q-¡ la suma de las cantidades elegidas por las empresas distintas de i, y
la función de mejor respuesta de la empresa 2: en la figura 1.2.1, R2(q¡) sea 1ri(qúQ -i) = q.¡(a - qi - Q -i - e) siempre que qi + Q -i < a (mientras que (
es igual a qm cuando q¡ = 0, y disminuye cuando q] aumenta. AsÍ, para 7fi(qi,Q-i) =-Cqi si qi + Q-i 2: a). Nuevamente es cierto que la cantidad \ ..
cualquier qj 2: 0, si la empresa i cree que la empresa j elegirá qj, la mejor de monopolio qm = (a - e)/2 domina estrictamente cualquier cantidad
respuesta de la empresa .¡ es menor que o igual a qm. No existe qj tal que más alta. Es decir, para cualquier x > 0, 1ri(qm,Q-i) > 1ri(qm + ;,Q-D
la mejor respuesta de la empresa i sea' mayor que qm. En segundo lugar, para todo Q-i 2: 0, C0Il10 en el prime~ paso delcaso de duopolio.'sik
dada esta cota superior para la cantidad de la empresa j, podemos derivar embargo, puesto que hay dos empresas además de la empresa i, lo único
una cota más baja a la mejor respuest~ de la empresa i: si qj ::; (a - e)/2, que podemos decir acerca de Q_; es que está entre cero y(a - e), porque q/ ,o,.
entonces R;(qj) 2: (a - c)/4, como mostramos para la mejor respuesta de y qk están entre cero y (a - c)/2. Pero esto implica.que ninguna cantidad
la empresa 2 en la figura 1.2.2.9 °
qi 2: es estrictamente dominada en el caso de la empresa i, porque para
q, cada qi entrecero y (a -c)/2 existe un valor de Q-i entre cero y (a ~ e)
(concretamente;Q_i= a - e - 2qi), tal que qi es lamejor respuesta de la
(0, (a - e) /2) emp;esa i a Q~i. Poi- ello, en lo sucesivo ya no se puede eliminar rtingUIl~'
estrategia. . .'.
R,(q)
(O, (a - e)/4)
confusiones, puesto que existen diferencias entre los juegos de Bertrand empresai, pi es una solución de
y Cournot y en el comportamiento de equilibrio en estos juegos, pero /10
existe diferencia en el concepto de equilibrio utilizado en ambos juegos. max "i(pi'));) = max [u, -]Ji + upj](Pi - eJ,
O::;Pi <00 O::;Pi <00
En ambos el concepto de equilibrio utilizado es el equilibrio de Nash definido en
la sección anterior. La solución al problema de optimización de .ies
Consideremos el caso de productos diferenciados. (Para el caso de
+ bp*¡. + e).
pi = ~(iJ,
productos homogéneos véase el ejercicio 1.7.) Si las empresas 1 y 2 eligen . 2
los precios PI y P2 respectivamente, la cantidad demandada a la empresa Por 10 tanto, si el par de precios (pi ,pi) ha de ser un equilibrio de Nash,
i por los consumidores es las decisiones de precios de las empresas deben cumplir
'.'
dos juegos estáticos, esto es en realidad un juego dinámico del tipo que Prob {. weelegldo} = 1- F (1/J--2-
e+ws)
.
discutiremos en el capítulo 2, pero aquí lo reducimos a un juego estático
Así, el acuerdo salarial esperado es
enlre la empresa y el sindicato al suponer una determinada conducta del
árbitro en la segunda etapa.) Supongamos que el árbitro tiene un acuerdo
ideal que le gustaría imponer, que denominamos x. Supongamos además We . Prob{ 'Weelegido}+w •. Prob{ wselegido} =
que, tras observar las ofertas de las partes, 'We y 'W., el árbitro elige sim-
plemente la oferta más cercana a x: siempre que 'We < 'W. (una intuición 'We . F CUe;'Ws) + w •. [1 _ F (We; Ws)] .
que demostraremos que se cumple) el árbitro elige 'We si x < ('We + 'W.)/2 Y
elige 1/J. si]; > (-we + 'W.)/2, como vemos en la figura 1.2.3. (Lo que ocurre Suponemos que la empresa quiere minimizar el salario esperado impuesto
si 1; = (tue + 'W.)/2 es irrelevante; supongamos que el árbitro lanza una por el árbitro y el sindicato quiere maximizarlo.
moneda.) Si el par de ofertas (w:,w';) ha de constituir un equilibrio deNash del
w:
juego entre la empresa y el sindiéato, debe ser una 'solución dé~ .
Así, el par de ofertas salariales (w:,w;) debe ser una solución de las con-
(W,+W,) /2 dici~nes de primer orden de estos problemas de optimización: (!:,
Figura 1.2.3
(w;' - w:) . ~!(w: ; w;) = F (w; ; w;)
(
y
El valor de x es conocido por el árbitro, pero no por las partes. Las par- (....
les creen que x se distribuye aleatoriamente según una distribw,:ión de pro-
babilidad F(x), con la correspondiente función de densidad !(x).l1Dada
(w; - w:).~! ('W:; W;). [1- (w; ;w;)]. F
e
26/ JUEGOS ESTÁTICOS CON INFOIUvlAClÓN COMPLETA (e ]) Aplicacío/les / Z7
f(x) = _1_
V2rra2
exp { __ l_(x _
2a2
m)2}. Al menos desde Hume (1739), los filósofos políticos Y los economistas
han entendido que si los ciudadanos responden únicamente a incentivos
(En este ejemplo, se puede demostrar que las condiciones de primer orden privados, habrá un déficit en la provisión de bienes públicos y los recursos
anteriormente dadas son suficientes.) Puesto que una distribución normal públicos estarán sobreutilizados. Hoy en día, basta con fijarse en el medio
es simétrica con respecto a su media, la mediana de la distrjbuCÍón es igual ambiente para constatar la fuerza de esta idea. Fue el trabajo ampliamente
a su media, m. Por lo tanto, (1.2.2) se convierte en citado de Hardin (968) el que fijó la atención de los no economistas sobre
el problema. A continuación analizam.os un ejemplo bucólico.
W: 'w;
+
--2--=m C.onsideremos los n habitantes de una aldea. Cada verano todos los
aldeanos llevan sus cabras a pastar en el ejido de la aldea. Denominamos
Y0.2.3) se convierte en
gi el número de cabras que el i-ésimo campesino posee y el número total
de cabras en la aldea G = .rJ] + ... + gn' El coste de comprar y cuidar una
*_ * __ 1__ ~
we - f(m) - v2rra L
La comparación entre (1.2.6) y (1.2.7) muestra13 que G* > G**: en el <: "',
Así, si (9í, ... ,g~) ha de constituir un equilibrio de Nash, para cada i, 9i En la sección 1.1.C hemos déinido Si como el conjunto de estrategias con-
debe maximizar (1.2.4) dado que los otros aldeanos eligen (9í, ... ,97-1' que cuenta el jugador i, y la combiriacion de estrategias (si, ... ,s~) coíno
un equilibrio deNash si, para cada jugador i,'.s7es la mejor respuesta' dét
97H'" .,9~)o La condición de primer orden de este problema de optimi-
zación es jugador i a las estrategias de los otros n - 1jugadores:
(.
:::
'~~.
".'
30/ JUEGOS ESTÁTICOS CON JNFORJYIAClÓN COMPLETA (c. 1) Teoría avanzada: Estrategias mixtas y existencia de equililnio / 31
es previsto de forma correcta. ' , ''':I;,¡¡~,toJü~1ié\B~;,'.',;¡¿;" De forma .más general, supongamosq~e el jugador i cuenta con [(
(En cualquier juego en el cual a cada jugador le co~;~gá)di~ l~ estrategias puras: Si = {Sil,:" ,.me}. En este caso, para el jugadori
jugada del otro y que el otro no adivine la~uya;l:liJ1~~f~)\:tii~¡:~~~ una estrategia mixta es una distribución de probabilidad (Pi]" .. ,]J;f(), en
brio de Nash (al menos tal como este conc~Pt\\g~," .11!-.-:::r,W;'ii<:'>'-''''.,.c~~ la que Pik es la probabilidad,A~: <J~eél jugador i elija la estrategia 8;b
la sección l.1.C), porque la solución de tal juegó~1gªW .. :eñi:e' para k = 1, ... ,J(. Puesto que Pik'es una probabilidad, es necesi1rio que
. 7.~';'\f,-:1~~>7 ~~~:;t~f~;
,
32 / JLECOS EST.ÜJCOS CON INFORtvJAClÓN COMPLETA (c. 1)
Teoría avanzada: Estrategias mixtas y existencia de eqllil ¡brio / 33
o :S Pi, :S 1 para k = 1, ... ,Jo( Y ¡Ji] + ... + Pi!,' = 1. Vamos a utilizar La figura 1.3.1 muestra que una estrategia pura dada puede estar es'-
¡Jipara denotar una estrategia mixta del conjunto de distribuciones de trictamente dominada por una estrategia mixta, incluso si la estrategia
probabilidad sobre Si, del mismo modo que utilizamos Si para denotar pura no está estrictamente dominada por ninguna otra estrategia pura.
una estrategia pura de Si. En este juego, para cualquier conjetura (q,l- q) que el jugador 1 pudiera
formarse sobre el juego del jugador 2, la mejor respuesta de 1 es o A
Definición. En el juego en forma normal G '= {S], ... ,Sn; U], . , , /un} supon- (si q ::::1/2) o !vI (si q ::; 1/2), pero nunca B. Sin embargo, B no está
gamos que Si = {Si], ... ,SiK }. En este caso para el jugador .í una estrategia estrictamente dOIIÚnada ni por A ni por 1'1'1. La clave es que B está es-
mixta es lIna distribución de probabilidad Vi = (P'i1" .. ,PiK), dónde °::;
Pi, ::; 1 trictamente dominada por una estrategia mixta: si el jugador 1 elige A
para k = 1, . , . ,K Y Pi] + . , , + Vil, = 1. con probabilidad 1/2 y !vI con probabilidad 1/2, la ganancia esperada de
1 es 3/2, independientemente de qué estrategia (pura o mixta) utilice 2,y
Concluimos esta sección volviendo brevemente a la noción de es-
3/2 es mayor que el pago a 1 que produce con certeza la elección de!?;
trategias estrictamente dominadas que introdujimos en la sección 1.1.B,
Este ejemplo ilustra el papel de las estrategias mixtas para encontrar "otra
con objeto de ilustrar el papel potencial de las estrategias mixtas en los
estrategia que domine estrictamente a s/'.
argumentos allí utilizados. Recordemosque si una estrategia Si es estric-
tamente dominada, no existe ninguna conjetura que el jugador 'í pueda Jugador 2
formarse (sobre las estrategias que elegirán los demás jugadores) tal que
1 D
hiciera óptimo elegir S¡". El argumento inverso también se cumple, siem-
pre que permitamos estrategias mixtas: si no existe ninguna conjetura que A 3,- 0,-
el jugador i pueda formarse (sobre las estrategias que elegirán los demás Jugador 1 !vI O~- 3,-
jugadores) tal que hiciera ,óptimo elegir Si, existe otra estrategia que do-
B 2,- 2~
,
mina estrictamente a S¡.]4 Los juegos de las figuras 1.3.1 y 1.3.2 muestran
que este argumento inverso sería falso si limitáramos nuestra atención a
estrategias puras. Figura 1.3.2
i~ I
Jugador 2 La figura 1.3.2 muestra que una estrategia pura dada puede ser una
1 D mejor respuesta a una estrategia IIÚxta,incluso si la estrategia pura no 'es
una mejor respuesta a ninguna otra estrategia pura. En este juego,'Bno
. A 3,- 0,-
es una mejor respuesta para el jugador 1 a IoD deljugador 2, pero B E!s lá
Jugador 1 !vI 0,- 3,- mejor respuesta del jugador 1 a la estrategia mixta (q,1 - q) del jugador 2,
B 1,- 1,- siempre que 1/3 < q < 2/3. Este ejemplo ilustra el papel de las estrategias
mixtas en la "conjetura que se puede formar el jugador 'í".
Figura 1.3.1
1.3.B Existencia del equilibrio de Nash
I~ Pearce (l984) demuestra este resultado en el caso de dos jugadores, e indica que se
cumple para el caso de n jugadores siempre que las estrategias mixtas de los jugadores puedan En esta sección discutimos varios temas relacionados con la existencia del
estar correlacionadas. Es decir, siempre que lo que suponga el jugador .¡ sobre lo que hará equilibrio de Nash. En primer lugar, ampliamos la definición de equili-
el jugador j pueda estar correlacionado con lo que suponga el jugador i sobre lo que hará el
brio de Na'sh dada en la sección 1.1.C para inéluir las estrategias mixtas.
jugador k. Aurnann (1987)sugiere que tal correlación en los supuestos de i es completamente
natural, incluso si j, i Y k toman sus decisiones de fomla totalmente independiente: por En segundo lugar, aplicamos esta definiCión ampliada al juego de las mo-
ejemplo, i puede saber que tanto j como k fueron a una escuela de dirección de empresas, o nedas y a la batalla de los sexos. En tercer lugar, utilizamos un argumento
incluso a la misma escuela, pero puede no saber lo que se enseña en ella. gráfico para deIl10strar que cualquier juego de dos jugadores en el cual
e~
\¿, ¡
A_
34/ JUEGOS ESTÁTICOS CON [N FORMACIÓN COMPLETA (c. 1) Teoría avanzada: Estmtegil1S mixtas y existencia de c'1,lÍlibrio / 3.5
cada jugador cuenta con dos estrategias puras tiene un equilibrio de Nash (cara, cruz), y así sucesivamente.iS Puesto que la ganancia esperada del
(que posiblemente incluya estrategias mixtas). Finalmente; enunciamos y jugador 1 es creciente en .,.si 2 - 4'1 > OYdecreciente en .,.si 2 - 41} < O,
discutimos el teorema de Nash (1950), que garantiza que cualquier juego la mejor respuesta del jugador 1 es T = 1 (es decir, cara) si r¡ < 1/2 Y T = O
finito (es decir, cualquier juego con un número finito de jugadores, cada (es decir, cruz) si '1 > 1/2, como indican los dos segmentos horizontales
uno de los cuales cuenta con unnúmero ñnito de estrategias puras) tiene de ,*('1) en la figura 1.3.3. Esta afirmación es más poderosa que la afir-
un equilibrio de Nash (que posiblemente iricluya estrategias mixtas), mación del párrafo anterior con la que está estrechamente relacionada:
Recordemos que la definición de equilibrio de Nash dada en la sección en aquélla considerábamos solamente estrategias puras y encontrábamos
1.1.C garantiza que la estrategia pura de cada jugadoI: consti,tuye una que si '1 < 1/2, cara era la mejor estrategia pura, y que si '1 > 1/2, cruz
mejor respuesta a las estrategias puras dé los restantes jugaddres. Para era la mejor estrategia pura. En ésta consideramos todas las estrategias,
ampliar la definición de modo que incluya estrategias mixtas, necesita- puras y mixtas, pero encontramos nuevamente que si r¡ < 1/2, cara es la
mos simplemente que la e"strateiPaI"nixtade cada jugador sea.una mejor mejor estrategia de todas (puras o mixtas), y que si '1 > 1/2, cruz es la
respuesta a las estrategias mixtas de los otros jugadores. Puesto que cUale mejor estrategia de todas.
quier estrategia pura puede ser representada <:'0#10 la estiit~gia que asigna ,
~a probabilidad cero a todas sus otras estrategias puras, esta definición
ampliada incluye a la ari'terior. ,*('1)
(Cara) 1
. La forma de hallar la mejor respuesta del jugador i a una estrategia
mIXtadel jugador j se basa en la interpretación de la estrategia mixta del
jugador j como representación de la incertidumbre d~l Jugador i sobre lo
que hará el jugador j. Continuamos con el juego de las monedas como
ejemplo. Supongamos que el jugador 1 cree que el jugador 2 elegirá cara
con probabilidad '1 y cruz con probabilidad 1 - '1; esto es, 1 supone que
2 elegirá la estrategia mixta ('1,1 - '1). Bajo,este supuesto, las ganancias
esperadas del jugador 1 son '1. (-1) + O - '1) . 1 = 1 - 2'1 eligiendo cara y
'1' 1 + 0- '1) . (-1) = 2'1 - 1 eligiendo cruz. Puesto que 1 - 2'1 > 2'1 -1 si (Cruz)
.1
Ysólo si '1 < 1/2, la mejor respuesta en estrategias puras del jugador.1 es 1/2 '1
cara si '1 < 1/2 Ycruz si '1 > 1/2, Yel jugador 1 será indiferente en.tre cara (Cruz) (Cara)
y cruz si.'1 = 1/2. Nos quedan por considerar las estrategias mixtas del
jugador 1. .
Figura 1.3.3
Sea (,,1 - ,) la estrategia mixta en la cual el j~gador 1 elige ~ara con
probabilidad ,. Para cada valor de '1 entre cero y uno, cakulamos.el(los) La naturaleza de la mejor respuesta del jugador 1 a ('1,1 - '1) cambia
,*
valor(es) de" denotado(s) por ('1) tal que (,,1-,) sea una mejor respuesta cuando '1 = 1/2. Como indicamos anteriormente, cuando r¡ == 1/2 el
del jugador 1 a ('1,1 - '1) del jugador 2. Los resultados se r~cogen"~n la jugador 1 es indiferente entre las estrategias puras cara y cruz. Además,
figura 1.3.3. La ganancia esperada del jugador 1 al elegir (,,1-' ,) cuand~ puesto que la ganancia esperada del jugador 1 en (1.3.1)es independiente
2 elige ('1,1 - '1) es ;';"",1;',"1",: 1, ,.1
15 Los sucesos A y B son indepimdientes'si rrob{A y B} =Prob{A}.Prob{B). Así, ,1
escribir rq como la probabilidad de que r elijá cara y 2 elija cara, estamos suponiendo que
1 y 2 toman sus decisiones de formá independjente, como corresponde a la deso"ipci611 que
''1.(-1)+,0- '1).1+(1-')'1,1 +(1-1')0 - '1).(-1) = (2'1-1)+,(2-4'1)" 0.3.1) . dimos de los juegos de decisión Sill:'.\!Jtá!\e.a.Consúltese Aumann (1974) para la d"finicióu de
equilibrio correlacionado, que se'-!.tY~:;;T¡',it1:,gos en los cuales las decisiones de Jos jugadores
~_ .~,~ 'c~~'
pueden estar correlacionadas, puest?,;qtifó!js:rvan el resultado de un suceso ale"lorio. como
donde ''1 es la probabilidad de (cara, cara), f(1 -'1} la probábil~daadé el lanzamiento de una moneda, antes de elegIr sus respectivas estrategias.
'0.':
36/ JuEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)
Teoría avanzada: Estrategias mixtas y existencia de equilibrio / 37
(r,1 - T) es la mejor respuesta a (q,1 - q) para cualquier valor de T entre LP2k'Ul(Slj,S2k) ~ LP2kUl(S¡j~S2k)
k;l k;1
cero y uno. Así, r* O /2) es todo el intervalo [O,1L como indica el segmento
vertical de r*(q) en la figura 1.3.3. En el análisis del modelo de Coumot para cada Slj' en SI' Esto es, para que una estrategia mixta sea una mejor
en la sección 1.2.A, llamamos a Ri(q) la función de mejor respuesta de la respuesta a P2 debe asignar una probabilidad positiva a una estrategia
empresa i. AqUÍ, puesto que existe un valor de q tal que r*(q) tiene más pura concreta sólo si ésta es una mejor respuesta a P2. De forma inversa,
de un valor, llamamos a r*(q) la correspondencia de mejor respuesta del si el jugador 1tiene varias estrategias puras que son mejores respuestas a
~~dm1. J P21 cualquier estrategia mixta que asigna toda su probabilidad a algunas
Para derivar de forma más general la mejor respu~sta del jugador o ~ todas estas mejores respuestas en estrategias puras (y probabilidad
i a la estrategia mixta del jugador j, así como para dar un enunciado cero al resto de las estrategias puras) es también una mejor respuesta del
formal de la definición ampliada del equilibrio de Nash, limitamos ahora jugador 1 a P2.
nuestra atención al caso de dos jugadores, que permite presentar las ideas Para dar un enunciado fonnal de la definición ampliada del equilibrio
principales de modo más sencillo. Sea J el número de estrategias puras de Nash necesitamos calcular'la ganancia esperada del jugador 2 cuando
en .eh y J( el número de estrategias puras en S2. Vamos a escribir SI := los jugadores 1 y 21;1tilizanlas estrategias mixtas PI y P2. Si el jugador 2 cree
{ SI j, , , . ,S1] } y S2 := {S21, ... ,S2K }, y vamos a utilizar Slj y S2k para denotar que el jugad m 1 utilizará las estrategias (Sl1,' .. ,S1]) con probabilidades
las estrategias puras arbitrarias de SI y S2 respectivamente. (p11,' .. ,PIJ), la ganancia esperada del jugador 2 por utilizar las estrategias
Si el jugador 1 cree que el jugador 2 utilizará las estrategias (S21, ... ,S2K) (S21,' .. ,S2K) con probabilidades (p21," . ,P2K) es
K [ J ]
V2(Pl,PÚ:= f;P2k ~PljU2(S1j,S2k)
K
(Pll, ... ,Pu) es Dadas VI (Pl,P2) Y V2(Pl,PÚ podemos refommlar el requisito del equilibrio
de Nash de que la estrategia mixta de cada jugador tenga que ser una
mejor respuesta a la estrategia mixta de los demás jugadores: para que
J [ K ]
VI (Pl,P2) := L Plj c L P2kU¡ (Slj,S2k) el par de estrategias mixtas (pi ,pi) forme un equilibrio de Nash, pi debe
j;l k;l
(1.3.3) cumplir
J K
donde Plj . P2k es la probabilidad de que 1 utilice Slj y 2 utilice S2k. La para cada distribución de probabilidad PI sobre SI, y pi debe cumplir
ganancia esperada del jugador 1 con la estrategia mixta PI, dado en (1.3.3),
es la Suma ponderada de las ganancias esperadas con cada ~~a de las C
vhi,pi) ~ v2(pi,P2) 0.3.5)
";:,-
estrategias puras {Sl1," . ,S1]} dada en (1.3.2), donde las ponderaciones para cada distribución de probabilidad P2 sobre 52.
son las probabilidades (Pll,'" ,PIJ)' AsÍ, para que la estratégia 'mixta
(Pll, ... ,PI J) sea una mejor respuesta del jugador 1 a la estrategia mixta P2 Definición. En el juego en forma normal de dos jugadores G := {S¡,S2; 'Ul/U2} las
del jugador 2, debe cumplirse que Plj > Osólo si C c'
de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador: mejor respuesta del jugador.í a la estrategiamixla del jugador j presellt~Ja
(1.3.4) y (1.3.5) deben cumplirse. en la figura 1.3.3. Para complementar la figura 1.3.3 calculamos el(los)
valor(es) de '1, denotado(s) por '1*(1'), tal(es) que ('1,1 - '1) es una mejor
q . respuesta del jugador 2 a (r,l - r) del jugador 1. Los resultados se recogen
q*(r)
en la figura 1.3.4. Si r < 1/2, la mejor respuesta de 2 es cruz, de forma que
(Cara) 1 q*(r) = O.Del mismo modo, si r > 1/2, la mejor respuesta de 2 es cara, de
forma que q*(r) = 1. Si r = 1/2, el jugador es indiferente no sólo entre cara
y cruz sino también entre todas las estrategias mixtas ('1,1 - '1), de forma
que '1*0/2) es todo el intervalo [O,1].
(Cara) 1
Figura 1.3.4
q*(r)
r
1/2 ---_._---j ..... _------------------'
(Cara) 1
q*(r)
(Cruz)
1/2 1/2 1 q
(Cruz) (Cara)
Figura 1.3.6
(Cruz)
q
(Cruz) (Cara) La figura 1.3.6 es análoga a la figtira 1.2.1 del análisis de Cournot
de la sección 1.2.A. Igual que la intersección de las funciones de mejor
Figura 1.3.5 respuesta R2(ql) y RI ('12) dio el equilibiio de. Nash del juego de Cournol,
la intersección de las correspond~ncia,s d~ mejor respuesta r*(q) y q*(r)
nos da el equilibrio de Nash (ertestiategias mixtas) en el juego de las
A continuación, aplicamos esta definición al juego de las monedas y a monedas: si un jugador i elige 0./2,1 /2), (1/2,1/2) es la mejor respuesta
la batalla de los sexos. Para ello, utilizamos la representación gráfica de la del jugador j, tal como lo exige eléquilibrio de Nash.
40 I JUEGOS ESTÁTICOS CON INfORMACIÓN COMPLETA (c. 1) Teoría avanzada: Estrategias mixtas y existencia de equilibrio I 41
Conviene resaltar que el equilibrio de Nash en estrategias mixtas no se de las correspondencias de mejor respuesta de los jugadores, existen en la
basa en que ningún jugador lance una moneda al aire, arroje unos dados o figura 1.3.7 tres intersecciones de r*(q) y q*(r): (q = 0,1' = O), (q = 1,r = 1)
elija de forma aleatoria una estrategia. Más bien, interpretamos la estrate- Y (q = 1/3,1' = 2/3). Las dos primeras intersecciones representan los
gia mixta del jugador j como una representación de la incertidumbre del equilibrios de Nash en estrategias puras (boxeo, boxeo) y (ópera, ópera)
jugador i respecto a la decisión del jugador j sobre la estrategia (pura) que descritos en la sección 1.1.c.
va a seguir. En béisbol, por ejemplo, el lanzador puede decidir si lanzar
una bola rápida o una curva basándose en cómo le salieron los lanzamien- l'
segundo ejemplo de equilibrio de Nash con estrategias mixtas. Sea (q,1- q) En cualquier juego, un equilibrio de Nash (que incluya estrategias pu- (
la estrategia mixta en la cual Pat elige la ópera con probabilidad q y sea ras o mixtas) aparece como una intersección:,dJUas:.c.QITespon.dencias,de
(1',1 - 1') la estrategia mixta en la cual Chris elige ópera con probabilidad 'r. mejor respuesta de los jugadores, induso cuando:háymás de dosjugá-
Si Pat elige (l},l-q), 'las ganancias esperadas de Chris son q.2+(1-q)'0 = 2q dores y también cuando algunos o todos lósjugadores tienen más de dos
al elegir ópera y q'O + (1 - q) . 1 = 1- q al elegir boxeo. AsÍ, si q > 1/3, estrategias puras. Por desgracia, los únicos juegos en los que las co~es-
la mejor respuesta de Chris es ópera (es decir, l' = 1); si q < 1/3 la mejor pondencias de mejor respuesta de los jugadores tienen representaciones'
respuesta de Chris es boxeo (es decir, l' = O) y, si q = 1/3, cualquier valor gráficas sencillas son los juegos de dos jugadores en:lasque cada jugador
de l' es una mejor respuesta. De modo similar, si Chris elige (1',1 - 1') sólo tiene dos estrategias. Discutimos ahora con un argumento gráfico que (
las ganancias esperadas de Pat son l' . 1 + O - 'r) . O = l' al elegir ópera y cualquier juego de ese tipo tiene un equilibrio de Nash (que posiblemente
1'.0+(1 -1').2 = 20-r) al elegir boxeo. AsÍ, si l' > 2/3, la mejor respuesta de incluya estrategias mixtas).
Pat es ópera (es decir, q = 1); si l' < 2/3 la mejor respuesta de Pat es boxeo Consideremos las g¡mancias del jugador) representadas en la figura
(es decir, q = O) y, si r = 2/3 cualquier valor de q es una mejor respuesta. 1.3.8. Hay dos comparacionesfu:1portantes:' x con z e y con w. Basándonos
Como muestra la fig'ura 1.3.7, las estrategias mixtas (q,1 - q) = 0/3,2/3) en estas comparaciones, podemosdefi.iur cuatro casos principales: (i)
de Pat y (-1',1 - 1') = (2/3,1/3) de Chris forman, por lo tanto, un equilibrio x > z e y > w; (ii) :É < z e y < w; (iii) x > z e y < w, y (iv) x < z
de Nash.
e y > w. Discutimos primero estos cuatro casos y luego abordamos los
Al contrario que en la figura 1.3.6, donde sólo existía una intersección casos restantes en los qliex '=z' y o =w, '
,~.
'i~i..
,-----
,
42/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1) Teoría avanzada: Estrategias. mixtas y existencia de equilibrio / 43
, ~.,',
.. ,' (Alta) (Alta)
r*( q) r*( q)
Figura 13.8
1 q
en
ejeiriplo 'de eIIcí' l~figura}.3~ 13.' . . .
(Izquierda) (Derecha) (Izquierda). (Derecha) .-La apÍi~ación d.eU~.~r~~~de punto fijo p~ademosi:rar. el ~~.oJ:~m~ ~4~
Caso (i) Caso (ii) Nfl;~hs~,h~ceen dos~~ap?s: (1) mostJ:ando que, cualquier PJP1.to,fijo.,:,~,~
una cierta corr~sponder:ciaes lll1 equilibrio,de Nash y (2}u~~aIlclp,l},I1
Figura 1.3.11 teorema de punto fijo ildecuado para demostrar que esta corresponden~a
debe tener un punto fijo. La correspondencia apropiada es la correspon-
r r
(Alta) 1 dencia de mejor respuesta de n jugadores, El teorema de punto fijo rele-
(Alta) 1
vante se debe é\KaJ~utani"(194l),quien generé\lizó el teorema de Brom":er
r' co~ '~'lfin déiÍlcIuir c'orr~sp~ndéncias (de bueIl comportamiento) adei1{ás
q*(r)
de funciones. Lacprresp()ndénciade mejor'r~spuesta de n jugadores se
q*(r) obtiene a partir de laséorr~sponqencias individuales de mejor respuest~
(Baja) (Baja)
1 q 1 q
¡(x)
(Izquierda) (Derecha) (Izquierda) (Derecha)
Caso (iii~ Caso (iv)
x*
Figura 1.3.12
de las características cualitativas descritas en el texto, pueden ahora darse dos equilibrios de x* 1 x
Nash en estrategias puras sin un equilibrio de Nash en estrategias mixtas, y un continuo de
equilibrios de Nash en estrategias mixtas.
Figura 1.3.13
L
Lecturas adicíol1alfs I 47
46 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)
de los n jugadores del modo siguiente: consideramos una combinación de la figura 1.3.10: para q == q', r*(q') incluye cero, uno y todo el intervé1lo
arbitraria de estrategias mixtas (Pl,' .. ,Pn)' Para cada jugador i derivamos entre ellos. (De modo un poco más formal, r*(q') incluye el límite ele I"(q)
la mejor respuesta(s) de i a las estrategias mixtas de los otros jugadores cuando q tiende a q' por la izquierda, el límite de r*(q) cuando q liende a
(Pl,'" ,Pi-l,P'i+l,' .. ,Pn)' Construimos a continuación el conjunto de todas q' por la derecha, y todos los valores de r entre ambos lúnites:) Si ¡(:¡;I)
las combinaciones posibles de dicha mejor respuesta para cada jugador. en la figura 1.3.14 se comportara de forma análoga a la correspondencia
(Formalmente derivamos la correspondencia de mejor respuesta de cada de mejor respuesta del jugador 1, ¡(x') incluiría no sólo el círculo negro
jugador y luego construimos el producto cartesiano de estas n correspon- (como en la figura), sino también el círculo blanco y todo el intervillo entre
dencias individuales.) Una combinación de estrategias mixtas (pi, ... ,p~) ellos, en cuyo caso ¡(x) tendría un punto fijo en x'.
es un punto fijo de esta correspondencia si (pi, ... ,p~) pertenece al con- La correspondencia de mejor respuesta de cada jugador se com.portil
junto de todas las combinaciones posibles de las mejores respuestas de los siempre como r*(q') en la figura 1.3.14: siempre incluye (las generalizil-
jugadores a (pi, ... ,p~). Es decir, para cada i, pi debe ser la mejor (o una ciones adecuadas de) el límite por la izquierda, el límite por la derecha
de las mejores) respuesta(s) del jugador i a (pi, ,Pi-l,pi+l' ... ,p~), pero y los valores intermedios. El motivo de esto es que, como demostramos
esto es precisamente la afirmación de que (pi, ,p~) es un equilibrio de anteriormente en el caso de dos jugadores, si el jugador i tiene varias es-
'Nash. Con ello, completamos la primera etapa. ; : trategias puras que son mejores respuestas a las estrategias mixtas de los
La segunda etapa utiliza el hecho de que la correspondencia de me- demás jugadores, cualquier estrategia mixta Pi que asigna toda su pro-
jor respuesta de cada jugador es continua, en un sentido adecuado del babilidad a algunas o a todas las mejores respuestas en estrategias puras
término. El papel de la continuidad en el teorema de punto fijo de Brou- deljugador i (y probabilidad cero al resto de las estrategias puras de i.) es
wer puede observarse modificando ¡(x) en la figura 1.3.13: si ¡(x) es también una mejor respuesta del jugador i. Puesto que la corresponden-
discontinua, no tiene necesariamente un punto fijo. En la figura 1.3.14, ci¡l.de mejor respuesta de cada jugador se comporta siempre delmisll10
por ejemplo, ¡(x) > x para toda x < x', pero ¡(x') < x' para x 2: x',17 modo, io mismo ocurre con la correspondencia de mejor respuesta de
los TI, jugadores. Estas propiedades cumplen las hipótesis del teoremil de
Kakutani, por lo que esta última correspondencia tiene un pu.nto fijo.
1
El teorema de Nash garantiza que existe un equilibrio en una ampliil
clase de juegos, pero ninguna de las ilplicaciones analizadas en la sección
¡(x) 1.2 pertenece a esta clase (porque cada aplicación tiene espacios de estrate-
gias infinitos). Esto demuestra que lils hipótesis del teorema de NilSh son
condiciones suficientes pero no necesarias para que exista un equilibrio;
existen muchos juegos que no cumplen las hipótesis del teorema pero, no
obstante, tienen uno o más equilibrios de Nash.
x' x
un programa electoral (es decir, un punto eh la línea entre x = O Y x = 1). solicitar trabajo en una de las empresas. Los trabajadores deciden si-
Los votantes observan el programa de los candidatos y luego cada votante multáneamente si solicitar el trabajo de la empresa 1 o de la empresa 2.
vota por el candidato cuyo programa se acerque más a su posición en el Si sólo un trabajador solicita trabajo en una de las empresas, dicho tra-
espectro. Si, por ejemplo, hay dos cahdidatos y eligen programas x] = 0,3 bajador obtiene el trabajo. Si ambos trabajadores solicitan trabajo en la
Y X2 = 0,6, todos los votantes a la izquierda de x = 0,45 votan al candidato misma empresa, la empresa contrata a uno de ellos aleatorialnente, y el
1, y todos los que están a la derecha votan al candidato 2, y el candidato 2 otro queda desempleado (lo que significa una ganancia cero). Hállense
gana la elección con un 55 por ciento de los votos. Supongamos que a los los equilibrios de Nash del juego en forma normal. (Para más información
~andidatos sólo les importa ser elegidos; en realidad, su progr?ma no les sobre los salarios que fijarán las empresas, consúltese Montgomery [1991J.)
mteresa para nada. Si hay dos candidatos, ¿cúaJ es el equilibrio de Nash
.'/} con estrategias puras? Si hay tres caIldidatos,indíquese un equilibrio de Trabajador 2
Nash con estrategias puras. (Supongamos qué cuarido vanos candidatos Solicitar a Solicitar a
eligen el mismo programa, los votos obtenidos por ese programa se divi- empresa 1 empresa 2
den apartes iguales, y quelos empates entré'l?sq¡je~onsiguen más votos
se resuelven a cara o,cruz.) VéaseHotelling (1929)pa.ra un primer modelo Solicitar a ] ]
empresa 1 2:7/11'2:W] 'UJl,W2
similar. ... " "~o " '1,;
. J':
Trabajador 1
Solicitar a 1 1
1.9¿Qué es una estrategia mixta en un juego enfórma normal? ¿Qué es Un empresa 2 W2,1.v] 2: 'UJ2, 2: 'UJ2
equilibrio de Nash con estrategias mixtas en un juego en forma normal?
Fecha 2
1.10 Demuéstrese que no existen equilibrios de Nash con estrategias mix-
1.14 Demuéstrese que la proposición B en el apéndice a la sección 1.l.C
tas en los tres juegos en forma normal analizados en la sección 1.1: El
se cumple tanto para equilibrios de Nash con estrategias puras como con
dilema de los presos, el de la figura 1.1.1 y,el de la figura 1.1.4.
estrategias mixtas: las estrategias utilizadas con probabilidad positiva en
un equilibrio de Nash con estrategias mixtas sobreviven al proceso de
1:11 ~állese el equilibrio de Nash con estrategias mixta~ del juego del
eJerCICIO1.2. €liminación iterativa de las estrategias estrictamente dominadas.
56 / JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA (c. 2) Juegos dinámicos con información completa y perfecta / 57
siguiente y (3) las ganancias de los jugadores para cada combinación po- en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora
sible de jugadas son información del dominio público. las amenazas que no son creíbles en un sentido que definiremos con más
Resolvemos un juego por inducción hacia atrás de la siguiente forma: precisión. Veremos que pueden existir múltiples equilibrios de Nash en
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego, un juego de la clase definida por (1)-(3)" pero que el único equilibrio de
se enfrentará al siguiente problema, dada la acción al previamente adop- Nash perfecto en subjuegos es el equilibrio asociado con el resultado ob-
tada por el jugador 1: tenido por inducción hacia atrás. Éste es un ejemplo de la observación,
hecha en la sección 1.1.C, de que algunos juegos tienen múltiplesequili"
max 'u2(á.l,az). brios de Nash pero tienen un equilibrio que destaca como la soluciónmás
azEAz
llamativa del juego.
Supongamos que para cada ajen Al, el problema de optimización del Concluirnos esta sección explorando los supuestos de racionalidad
jugador 2 tiene una única solución que podemos denotar con Rz(al)' Ésta inherentes en los argumentos de inducción hacia atrás. Considere~os
es la reacción (o mejor respuesta) a la acción del jugador 1. Dado que para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos
el jugador 1 puede resolver el problema de maximización del jugador 2 veces:
tanto como el propio jugador 2, el jugador 1 debería prever la reacción del
jugador 2 a cada acción al que 1 pudiera tomar, de forma que el"problema
1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2
de 1 en la primera etapa se concreta en
para el jugador 1 y Opara el jugador 2. c.
2. El jugador 2 observa la elección de 1. Si 1 escoge D entonces 2 escoge
max 'Ul (al,Rz(al»).
alEA] J' o D', donde l' finaliza el juego con ganancias de 1 para ambos
Supongamos que este problema de optimización del jugador 1 tiene jugadores.
también una solución úlúca que podemos denominar aj. Llamaremos 3. El jugador 1 observa la elección de 2(y recuerda su propia decis~~t:J:
~
a (aj,Rz(aj» el resultado por inducción hacia atrás de este juego. El resultado la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es
por inducción hacia atrás ignora las amenazas no creíbles: el jugador 1 1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3
prevé que el jugador 2 responderá óptimamente a cualquier acción que 1 para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2
pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte respectiv~mente.,; ,
del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda ,_.; _~ : . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~¿'
etapa. Esta descripción verbal puede trélducirse al siguiente,juego en fempª.dg
Recordemos que en el capítulo 1 usamos la representación en forma árbol. (Ésta es la representación en forma extensiva que definiremos. de
. normal para estudiar juegos estáticos con información completa y hos forma más general en la sección 2.4.) La ganancia superior en el par .
concentramos en la noción del equilibrio de Nash como concepto para so- de ganancias que aparecen en el extremo de cada rama del árbol es la
lucionar tales juegos. Sin embargo, en la discusión sobre juegos dinámicos ganancia del jugador 1; la inferior es la del jugador 2, ~;,'
de esta sección no hemos hecho mención alguna ni de la representación Para calcular el resultado por inducc:ión hacia atrás de este' juego
en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una empezamos por la tercera etapa (es dear,la segunda decisión deLjugador
descripción verbal de un juego en (1)-(3) y hemos definido el resultado 1). Aquí el jugador 1 se enfrenta a una elección entre una ,ganancia de.3
por inducción hacia atrás como solución del juego. En la sección 2.4.A por medio de 1" o una ganancia de Oa trayés de 'J)"; de forma que!" ~
veremos que la descripción verbal en (1)-(3) es la representación en forma óptimo. Por tanto, en la segunda etapa, el jugador2 prevé que si él júego (,
...
,
extensiva del juego. En esta sección estableceremos la relación entre las llega a su te;cera etapa el jugador 1 escogerá J", lo que le proporcionaría
representaciones en forma extensiva y normal, y veremos que para juegos una ganancia de O.Por tanto,~n la ¡¡egunda etapala decisión del jugador 2
dinámicos la representación en forma extensiva es a menudo más con- es entre una ganancia de 1 por medio dé l' o una ganancia de Oa través de
veniente. En la sección 2.4.B definiremos el equilibrio perfecto de Nash D', de forma que l' es óptimo. Consecuentemente, eh la primera etapa el
58 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dil1tÍmicos COI1 il1formacióll completa y perfecta / 59
Este argumento establece que el resultado por inducción hacia atrás Stackelberg (1934) pr!Jpuso un modelo dinámico de duopolio en el cu~l
es que el jugador 1escoge I en la primera etapa y séacaba el'juegb: Aun unae'mpresa dominante (o líder) decide primero y una empresa subordI-
cuando el uso de la inducción hacia atrás establece que el juego sé acaba nada (o seguidora) decide en segundo lugar. En al~nosmome~üos de
en la primera etapa, UIlaparte importante del'afgUiriento ftáhl dé 10 que la historia de la industria automovilística estadourudense: por ~Jel1lplo,
ocurriría si el juego no se acabase en esta primera etapa. En la segunda General Motors parece haber jugado este papel de líder. Es mmedlat.o am-
etapa, por ejemplo, cuando el jugador 2 prevé que si el juego llega a la pliar esta des~ripción al caso en que haya más de una empresa segUidora,
terc;era etapa el jugador 1 elegirá I"¡ 2 está suponiendo que 1es racional. como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos el
Este supuesto puede parecer inconsistente coil el hecho de qué 2 tiene modelo bajo el supuesto de que las empresas escogen cantidades, como en
,.'0
la oportunidad de decidir en la segunda etapa sólo si 1 se desVÍa del el modelo de Coumot (donde las empresas deciden simultáneamente en
resultado obtenido por inducción hacia atrás. Es decir, puede parecer que . ente como aqUlO. DeJ'amos como ejercicio el desarrollo
veZ d e suceSlvam ,
si 1juega D en la primera etapa, 2 no puede suponer en la segunda etapa de un modelo de tomas de decisiones sucesivas en el que las empresas
que 1 sea racional, pero 'esto no es, así: si 1 juega D, en la primera etapa . s tal como
escogen 1os preclO " lo hacen (simultáneamente)
' ' . en el modelo ele
está claro que no puede ser información del dominio público que los dos
Bertrartd. ,
jugadores sean racionales; pero existen razones para que 1escogietaD El desarrollo temporal del juego es el sig'uiente: (1) La empresa 1
que no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidad
1 a d ql >
escoge una can t'd _ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
es que sea información del dominio público que el jugador 1 es racional una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de Recordemos que en el equilibrio de Nash del juego de Cournot del
producción (siendo cero los costes fijos). capítulo 1, cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregada
Para hallar el resultado por inducción hacia atrás de este juego, calcu- obtenida por inducción hacia atrás en el juego de Stackelberg, 3(a - e)/4,
lamos en primer lugar la reacción de la empresa 2 a una cantidad arbitra- es mayor que la cantidad agregada en el equilibrio de Nash del juego de
riamente fijada por la empresa 1. R2(ql) es una solución de Cournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado es
inferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelberg
maX7r2(ql,q2)==maxq2[a - ql - q2 - el, la empresa 1 podía haber escogido la cantidad correspondiente al juego
Q22:0 qz 2:0
de Coumot, (a - e)/3, en cuyo caso la empresa 2 habría respondido con su
lo que resulta en
cantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1
a-ql-e podría haber alcanzado el nivel de beneficios de Coumot, pero escogió no
R2(ql) ==" 2 ' hacerlo, por lo que los beneficios de la empre~a 1 en el juego de Stackelberg
siempre, queql < a-e .. La misma' ecuación pár_aR2(ql) apareCiÓ en deben'ser mayores que sus beneficios en el juego de Cournot. Pero el
nuestro aniilisisdél' juego de Coumot con' qecisiones sinlultáneas en la precio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que ros
sección D.A. La diferencia' es que aquí R2(iJ.~)e~~eal~e~:lte la reacción beneficios agregados son menores. Por tanto, el hecho de que la empresa
por parte de la~mpresa 2:á la cailtidadobservad~ que fijala empresa i, 1 esté mejor implica que la empresa 2 está peor en el juego de Stackelberg
mientras que en el análisis de Coumot R2(qI) es la mejor respuestacle h:i queen el jueg() de Coumot.
empresa 2 a una cantidad hipotética que'será sil!lultáneamenteescogida La observación de que la empresa 2 se encuentra en peor situación en ..
' ,"
por la empresa 1. '." el juego de Stackelberg que en el juego de Coumot ilustra una diferencia
Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa importante que existe entre los. problemas de decisión uni cimultiperL
2 tantoc0fi.lo,.l.a,propia e~p¡'~~a 2, I~, e0presá 1debería prever q~e ia sonale~:. En la teoría de la decisión con un único agente, eltenermás .
elección:'del~éantidad ql coinCidirá co"nla reaéciónR2(ql)' Por tanto, el información nunca puede hacer que el agente decisor esté peor. En teorÍa
problema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en de juegos, sin embargo, tener más información (o más precisamente, que ".
otros jugadores sepan que uno tiene más información) puede hacer que un
"maX7fl (ql,R2(ql») ==maxqIfa - ql - R2(qi) -:- el jugador esté peor. '
'_Q¡2:0, ,.' ,.' Ql2:0 • . . '. .
.. a- ql.""'"C Eil el juego de Stackelberg, la información en cuestión es la cantidad
==maxql '2 . ,.
de la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)
Q¡2:0 .
lo que resulta' en la empresa 1 sabe que la empresa 2 conoce ºl' Para ver el efecto que'
esta información tiene, consideremos un,juego de decisión suc~siva algo
a-c a-c distinto, en el que la empresa 1 escoge qr, después de lo cual la empresa
qi == -. -2- Y R2(qi) ==-4-
2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 cree
que es el resultado por inducción hacia atrás del juego del duopolio de que la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, la
Stackelberg.4 '.. '. mejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si la
empresa 1 prevé que la empresa 2 creerá que ello vaya a ser así y, por tanto,
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren típicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mención escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en (a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg
vez de ~u:nultáneas. Sin embargo, como se ha constatado en la secciÓ'nanterior, los juegos (a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1
con deaslones sucesivas poseen a menudo múltiples equilibrios de Nash, de los cuales sólo
uno está asociado can el resultado obtenido por inducción hacia atrás del juego, Por tanto, el
escoja su cantidad de Stackelberg. Más bien, el único equilibrio de Nash de
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al este juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,
uso de unrnterio de solución más poderoso que el mero equilibrio de Nash. precisamente el equilibrio de Nash del juego de Cournot, en el que las dos
62 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos dinámicos con infonlwción completa y perfecta / 1\3
empresas deciden simu1táneamente.5 Por lo tanto, que la empresa 1 sepa cuya condición de primer orden es
que la empresa 2 conoce q¡ va en contra' de la empresa 2.
R'(L) - w = O.
2.1.C Salarios y nivel de empleo en una empresa con fuerte
implantación sindical / Pendiente = w
R
En el modelo de Leontief, (1946) de relación entre una empresa y un
único sindicato (es decir, un sindicato que tiene el poder de monopolio de R(L)
ofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vo
sobre los salarios, pero la empresa tiene el ¿Ónrrolexclusivo del nivel de
empleo. (Conclusiones cualitativamente similares emergen en un modelo
más realista en el cual la empresa y el sindicato negocian los salarios,
pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) La
función de utilidad del sindicato es U(7JJ,L), donde w es el salario que el
sindicato pide a la empresa y L es el nivel de empleo. Supongamos que
U(w,L) es creciente en los dos argumentos w y L. La función de beneficios
L * (w) L
de la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos que
la empresa obtiene si emplea L trabajadores (y toma de forma óptima las
correspondientes decisiones de producción y de estrategia de mercado). Figura 2.1.1
Supongamos que R(L) es creciente y cóncava;
Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato Para garantizar que la condición de primer orden R'(L) -w =. O ~enga
efectúa una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yes- solución, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
coge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L). figura 2.1.1.
Podemos decir bastantes cosas sobre el resultado por inducción hacia atrás La figura 2.1.2 representa L * (w) en función de tu (pero ~tiliza l~s e!es
de este juego, aun sin haber supuesto ninguna forma funcional concreta de forma que faciliten la comparación con gráficos postenores) e lnchca
de U(w,L) y R(L), pero no podemos calcular el resultado explícitamente. que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
. En primer lugar caracterizamos la mejor respuesta de la empresa en la en su punto máximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
etapa (2), L*(w), a una demanda salarial arbitraria por parte del sindicato mejor cuanto menor sea w, de forma que las curvas :sobenefIClo ¡Dfenores
en la etapa (1), w. Dado w, la empresa escoge el nivel L*(w) que soluciona representan niveles de beneficio más altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato está tanto mejor cuanto más alto sea w, de forma que las curvas
max7r(w,L) =maxR(L) - wL, de indiferencia más altas corresponden a niveles de utilidad mayores del
L2:0 L2:0
sindicato.
6 Esta última propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
5 Esto es un ejemplo de la afirmación hecha en la sección 1.1.A:en';,n Juego en forma normal dado 'UJ. Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
los jugadores escogen sus estrategias simultáneamente, pero ello no implica necesariamente' concreta en la elección de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
que actúen simultáneamente; es suficiente con que cada uno tome su decisión sin conocer las beneficio posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
decisiones de los demás. Véase la sección 2.4.A para más discusión sobre esta cuestión. (L,u/) sea tangente a la restricción 'UJ = 1J)'.
64 / JUEGOS DfNAMICOS CON INFORÑ1ACIÓN COMPLETA (c. 2)
Juegos dinámicos con información completa y perfecta / 65
w L *(w)
' ...'
w Curva de indiferencia
del sindicato
w*
L*(w)
L
Curvas de isobeneficio de la empresa
L* (w*) L
Figura 2.1.2
'Figura 2.1.4.
,
'.
w En términos de las curvas de indiferencia representadas en la figura
2.1.3, al sindicato le gustarla escoger la demanda salarial w que propor- ',.,.,'
cione un resultado (w,L * (w» que esté en la curva de indiferencia más alta
posible; La soluciÓn al problema del sindicato es w*, la demanda salarial
que hace que la curva de indiferencia del sindicato que pasa por el punto
(w*,L*(w*» sea tangente a L*(w) en ese punto (véase la figura 2.1.4)'- Por
lo tanto, (w* ,L*(w*» es el resultado por inducción hacia atrás de este juego "~o
de salarios y nivel de empleo.
Es fácil ver que (w* ,L * (w*» es ineficiente: tanto la utilidad del sindi-
L
cato como los beneficios de la empresa aumentarían si w y L estuvieran en
Curvas de indiferencia del sindicato la región sombreada de la figura 2.1.5. Esta ineficiencia hace que resulte
difícil de entender que en la práctica las empresas parezca que retienen
Figura 2.1.3 el control exclusivo sobre el nivel de ocupación. (Si permitimos que la
empresa y el sindicato negocien los salarios pero mantenemos el control
exclusivo de la empresa sobre el nivel de empleo obtenemos un resultado
Consideremos ahora el problema del sindicato en la etapa (1). Dado igualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicación
que el sindicato puede resolver el problema de la.empresa en la segunda a este enigma basada en el hecho de que el sindicato yla empresa negocian
etapa, tanto como la propia empresa, el sindicato deberla prever que la repetidamente a lo largo del tiempo (normalmente cada tres años en Esta-
reacción por parte de la empresa a su demanda salarial w será escoger el dos Unidos). En ese juego repetido, siempre que la elección de.w por parte
nivel de empleo L*(w). Por tanto, el problema del sindicato en la primera del sindicato y la elección de L por parte de la empresa caigan en la región
etapa se concreta en
sombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esos
'.: .'
que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando por inducción hacia atrás, el jugador 1 ofrecerá el acuerdo (j(s),l- f(s»
'"
la oferta S] del jugador 1 en este periodo, pero el valor en este periodo de en el primer periodo y el jugador 2 aceptará, donde fes) = 1 - 50 - os)
1',
recibir 1 - si el periodo siguiente es sólo de 50 - si). Por tanto, el jugador es la fracción del jugador 1 en el primer periodo del juego anterior de tres
2 aceptará 1 - s] si y sólo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). El periodos cuando el acuerdo (s,1 - s) se imponía exógenamente en el tercer
problema de la decisión del jugador 1 en el primer periodo, por tanto, se
periodo.
concreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo
Sea s A la ganancia más alta que el jugador 1 puede recibir en cualquier
1- SI = 50-si) al jugador 2) o recibir si en el próximo periodo (ofreciendo
resultado por inducción hacia atrás del juego completo. Consideremos el
cualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la última
uso de SA como la ganancia del jugador1 en el tercer periodo, tal como
opción es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obtenible
lo hemos descrito anteriormente; esto producirá un nuevo resultado por
por medio de la primera opción, de forma que la oferta óptima del jugador
inducción hacia atrás en el que" la ganancia en el primer penado del
1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58).'Por tanto, en
jugador 1 es fCsA).Dado que fes) = 1- 5 + 02Ses creciente'en s; f(sA)
el resultado por inducción hacia atrás de este juego de tres periodos, el
es la ganancia en el primer periodo más alta posible; ya quesA es la
jugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.
ganancia más alta posible en el tercer periodo. Pero SA es también la
Consideremos ahora el caso en que el horizonte es infinito. El desarro- ganancia más alta posible en el primer periodo; de forma que!(sA) =
llo temporal es el mismo que hemos descrito anterio~ente, excepto que el SAo Argumentos similares demuestran que f(sB) = SB, donde SB es la
acuerdo exógeno del paso (3) esreemplazado por una sucesión infinita de ganancia más baja posible que el jugador 1 puede obtener en cualquier
pasos (3a), (3b), (4á), (4b) yasísuéesivamerite. El jugador 1 hacela"oferta resultado por inducción hacia atrás del juego completo. El único valor de
en los peripdiJsÍII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:ión con~ s que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;
tinúa hasta que un9 elelos dos jugadore~ acepta,un¡t9f~rta. Nos gustaría sA = SE 0= s. de forma que, existe un único resultado por inducción hacia
hallar el resultado PO! inducción pacia atrás de esteJuego pe horizonte atrás d~l juego completo: en el primer periodo el jugador 1 ofrece un
infinito moviél}-dcmoshacia atrás, tal como lo hemos hecho en los casos acuerdo (s' = 1/(1+0),1- s'" = 5/0 + o» al jugador 2, quien acepta. \.'
analizados hasta ahora. Sin embargo, co~oel jueg~podría continuar
,é
hasta el infinito, no existe un último momento a partir del cual iniciar tal '" ,
análisis. Afo~nadamente, la,siguiente idea (aplicada.()riginalmente por 2.2 Juegos en dos etapas con información completa
Shaked y Sutton [1~84])nos permité truncar el juego de horizonte infinito .pero imperfecta :, -
y aplicar la lógica del Giso'en el que ell10rizonte ~. fuíi:to:el juego q~e
empieza en el,tercer periopo (si se alcanza) es idéntico al jueg~ completo
2.2.A.Teoña: Perfección en subjuegos .
(empezando desde el primer periodo); en ambos cas~s el jugador 1 hace
la primera oferta, los jugadores se alternan haciendo las siguientes ofertas
Enriquecemos ahora la clase de juegos analizacia eIlla sección anterior: ,~ "
Analizaremos el siguiente juego sencillo, al cual (sin mucha inspi- 1. Los jugadores 1 y 2escogen simultáneamente las acciones 1/,1 y "-z de
ración) llamaremos juego en dos etapas con información perfecta pero los conjuntos factibles Al Y Az respectivamente.
incompleta: 2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z» parai = 1,2.
de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha
inversor y el juego se acaba. 1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) en
En la sección 2.4 discutiremos cómo representar formalmente este la fecha 2.
juego. Sin embargo, por ahora procederemos de modo informal. Repre-
sentemos las ganancias de los dos inversores en las fechas 1 y 2 (en función
de sus decisiones sobre sacar dinero en esas fechas) con el siguiente par Sacar No sacar
de juegos en forma normal. Nótese que el juego en forma normal co- Sacar r,r D,2r - D
rrespondiente a la fecha 1 no es típico: si ambos inversores escogen no
No Sacar 2r - D,D R,R
sacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que los
inversores pasan al juego en forma normal correspondiente a la fecha 2.
Figura 2.2.1
Sacar No sacar
Sacar T,T D,2r-'--D El primero de estos resultados puede interpretarse. como el de un
pánico bancario. Si el inversor 1 cree que el inversor 2 sacará su dinero
No Sacar 2r - D,D siguiente etapa
en la fecha 1, su mejor respuesta es sacar también el dinero, aun cuando
Fecha 1 a ambos les iría mejor si esperasen a la fecha 2 para sacar el dinero. Este
juego del pánico bancario difiere del dilema de los presos discutido en el
. capítulo 1 en un aspecto importante: ambos juegos poseen un equilibrio de:
Sacar No sacar Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.a
de los presos éste es el único equilibrio (y loes en estrategias dominantes),
Sacar R,R 2R- D,D
mientras que en este juego existe también un segundo eqUilibrio qúe
NoSacar D,2R - D, R,R es eficiente. Por tanto, este modelo no predíce cuándo va a ocurrir un
pánico bancario, pero muestra que es un fenómeno que'p~~de ocurrir en
Fecha 2
equilibrio. Véase un modelo más rico en Diamond y DybVig (1983):.
Para analizar este juego procedemos hacia atrás. Considérese el juego
/, -,
en forma normal correspondiente a la fecha 2. Como R > D (y por 2.2.C Aranceles y competencia internacional imperfecta
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un único equilibrio de Nash de este juego: ambos inversores Nos ocupamos ahora de una aplicación de economía internacional. Con-
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay sideremos dos países idénticos, que denominamos con i = 1,2. Cada país
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en tiene un gobierno que escoge un arancel, una empresa que produce tanto
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1. para el consumo interno como para la exportación y unos consumidores
Dado que r < D (y por tanto 2r - D < 1'), esta versión de un periodo del que compran en el mercado interno, ya sea de la empresa nacional o efe
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras: la extranjera. Si la cantidad total en el mercado del país i es Qir el precio
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias de equilibrio del mercado es Pi(Qi) = a - Q.¡. La empresa del país i (que
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a en adelante llamaremos empresa ~)produce hi para el consumo interior
unas ganancias de (R,R). Por tanto, el juego original del pánico bancario y ei para la exportación. Por tanto, Qí = hí + ej. Las empresas tienen
de dos periodos tiene dos resültados perfectos en subjuegos (y, por tanto, un coste marginal constante e y no tienen costes fijos. Por tanto, el coste
no se ajusta totalmente a la clase de juegos definida en la sección2.2.A): total de producción de la empresa i es Cí(hí,ei) = c(hí + eí). Las empresas
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas también incurren en un coste arancelario sobre las exportaciones: si la
.,
74 I JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA Ce. 2) fllegos eH dos etapas de ill{omlOcíó/I I 75
empresa iexporta ei al país ,7 cuando el gobierno j ha establecido una tasa Suponiendo que e; :::;a - c, tenemos que
arancelaria de tj, la empresa i debe pagar tjei al gobierno j,
• 1( ,,)
, El desarrollo temporal del juego es el siguiente: Primero, ambos go- 11,; = '2 a - ej - e , (22,1)
Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si Recordemos (en la sección 1.2.A) que la cantidad de equilibrio escogida
es un equilibrio de Nash del juego (de dos mercados) restante
(hj,ej,hi,ei) por las dos'empresas en el juego de Cournot es (a - c)/3, pero que este
entrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar resultado se obtuvo bajo el supuesto de costes marginales simétricos. En
el equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelarias
de los gobiernos hacen que los costes marginales sean asimétricos (como
'!'~ en el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal ele
Como 1r'i(t"tj,h"e"h;,e;) puede escribi~e como la sum~ de los benefi- la empresa i .es c, pero el delaempresa j es c + ti. Como el coste de la
~io,sde la empresa i en ~l.mercado i (los cuales son función de hi y e; empresa j es más alto, ésta quiere producir menos .. Pero si la empresa j
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cua- va a producir menos, el precio de ,equilibrio será'.Il~J~al~~,deforma que la
les son función, de ei, h;.y tj. únicamente), el problema de optimización empresai querrá producir más, en cuyo caso la empresa j querrá producir
en los dos mercados para la empresa i se simplifica al separarse en dos menos todavía. Por tanto, en equilibrio, hi crece con ti y e; decrece (a un
problemas, uno para cada mercado: hi debe solucionar ritIno más rápido) con ti, como indica (2.2.3).
Una vez resuelto el juego entre las dos empresas que queda en la
, max hi[a - (hi + eJ~)- cL segunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,
.-~ h,::::O ' ,
podemos ahora representar la interacción entre los dos gobiernos en la
y ei debe solucionar primera etapa con el siguiente juego de decisiones simultáneas. Primero,
los gobiernos escogen las tasas aran,celarias tI y t2 simultáneamente. En
maxei[a - (ei + 11,*) - el - te'. segundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei) para el gobierno
<,::::0 J J '
i = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),
Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.
9 S' .
1 un consUffildor compra un bien a un, precio,p cua~dohab'ríá estado dispuesto a Para simplificar la notación, suprimiremos la dependencia de 11.; de f'i
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deináilcla inversa
y de ei de tj: con W;(ti,tj)genotamos a Wi(ti,tj,hi,ei,hi,ei), la ganancia
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr del gobierno i cuando eS.<;9ge1a tasa arancelaria ti, el gobierno .i escoge t j
/,-.
76/ JUEGOS DINÁJVlICOS CON INFORMACIÓN COMPLETA Ce. 2) Juegos en dos etapas de información / 77
y las empresas i y jse comportan según el equilibrio de Nash dado por del libre comercio). (Si es factible tener aranceles negativos, es decir,
(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos, subsidios, el óptimo social consiste en que los gobiernos escojan tI =
entonces, para cada i, ti debe solucionar t2 = -(a - e), lo que hace que la empresa nacional no, produzca nada
para el consumo interior y exporte la cantidad de competencia perfecta
max W;*(ti,t*). al otro país.) Por lo tanto, dado que las empresas i y j se comportan
ti~O )
según el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,
Pero W;*(t¡,tiJ es igual a
la interacción entre los gobiernos en la primera etapa es un dilema de los
presos: el único equilibrio de Nash lo es en estrategias dominantes, y es ... ".
(2(a - e) - ti? + (a - e + ti)2 + (a - e - 2t~?
1 + t(a
t
- e - 2t)1 socialmente ineficiente.
18 9 9 3'
por tanto 2.2.0 Torneos
a-e
t~ =--
, 3 Consideremos a dos trabajadores y su capataz. El producto del trabaja-
dor i (i = 1 o 2) es Yi = ei + Eú donde ei es esfuerzo y Ei es ruido. El
para cada i, independientemente de tj. En consecuencia, en este modelo
proceso de producción es el siguiente: Primero, los trabajadores escogen
escoger una .tasa arancelaria de (a - e)j3 es una estrategia dominante
simultáneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
de cada gobIerno. (En otros modelos, por ejemplo cuando los costes
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
margInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos no
de acuerdo con una función dedensidad f(E) con media cero. Entercer
son domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3) obtenemos
lugar, el producto de los trabajadores es obsen:ado pe~ono su e~fu~i~o~
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
hi = 4(a -:-e) e~ = a - e
9 y , 9 han producido, pero no (directamente) de su esfuerzo.
como las cantidades escogidas por las empresas en la segunda etapa. Por Supongamos que el capataz decide inducir a los trabajadores a esfor-
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es zarse más y para ello les hace competir en un torneo;.tal y como origi-
(ti =5 =(a - e)j3,hj=hi= 4(u-:- e)j9,ej = ei = (a --' e)j9)~ ' nalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
En el resultado perfecto en subjuegos, la cantidad agregada en cada vencedor del torneo (es decir, el trabajador quemás:produica)eswA;"el
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido salario recibido por el perdedor es WB. La ganancia:deun trabajador que
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mer- reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
cado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cour- desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
not. Por tanto, el excedente de los consumidores en el mercado i (el cual, g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
como hemos visto anteriormente, es simplemente la mitad del cuadrado Transcribimos ahora esta aplicación'a lostérininos de la clase de juegos
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos discutida en la sección 2.2.A. El capat~~'~"eIRíg~dor 1~cuya acción al es
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que escoger lbs salarios W A y W B que se pagarán en el torneo. No hay jugador
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles 2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
Iguales a cero son socialmente óptimos en el sentido de escogidos en la primera etapa y deci~e,!-1~n.t,?~cessünultáneamente sus
acciones a3 Y a4, es decir los esfuér~o~'~l'y'é~:(Consideraremos más áde-
max W¡(t],t2) + Wi(t2,tl),
tl,t2~O lO Para no complicar la exposición de esta aplicación; ignoramos varios detalles técnicos,
tales como las condiciones bajo las cuales la 'condición de primer orden del trabajador es
de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdo
suficiente. No obstante, el análisis eXige illI mayor cálculo de probabilidades que en los casos
en el que se comprometan a eliminar los aranceles (es decir, en favor anteriores. Esta aplicación puede saltarse sin pérdida de continuidad. '
Juegos el1 das etapas de ¡,¡[anuacirÍu ! 79
78 / ]VEGaS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
Prob{Yi(e;) > Yj(ej)} =Prob{Ei > ej + éj - e;}
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por , ' =1 Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj
tanto también los salarios) es función no sólo de las decisiones de los ju- . €j
Como g(e) es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valor
::. mayor d eWA-WB ) I'nduce a un mayor
'
esfuerzo, cosa harto
,
mtU.lliva. Por
"',1::'" donde Yi(ei) = ei + Ei',La condición de primer orden de (2.2.4) es' tra parte con un mismo premio, no vale tanto la pena esforzarse cuando
-,,) :
"
)8Prob{Yi(ei) >
:1 ruido e~ muy fuerte, porque es probable que elresultado del to:neo se
;:\
,-,~~tl
(WA _ WB 8
Yj(e;)} _
- 9
'( ,)
e,. (2.2.5) determine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,
ei
si Ese distribuye normalmente con varianza a2, entonces
~~~, .'
.,:¡:- ..'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
~:', un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
.",.!:.'
adicional, que es el producto de lo que se gana en salario por venCer en el
--");
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar. que decrece en a, de forma que E' efectivamer:te decrece en a..
"
__
,~i
Por la regla de Bayes,12 Procedemos ahora hacia atrás, hasta la pnmera etapa del Juego. Su-
pongamos que SI,. 1os trabaJ'adores ' acuerdan
' ' participar
, en el torneo
. (en
11 Al escribir (2.2.4),supusimos que la función de densidad del ruido ¡(e) es tal que el t
vez d e acep ar un e, mpleo a lternativo) responderan, a. los salanos ',I! A
:;
~~',' suceso en el qU€ lostrabaj~dores producen exactamente lo mismo OCurr€con probabilidad . d 1
y W B lugan ,o e eqw, 'libn'o de Nash simétrico caractenzado
.. ' . .,. por (2.2.6).
cero y, por tanto;no es necesario considerarlo en la función de utilidad esperada del trabajador
"o,}' i. (Más formalmente, suponemos que la función de densidad ¡(E) es no atómica) En una (1gnoramos, por t anto , la posibilidad de equihbn, os asrmetncos y,de un ,
descripción completa del torneo, sería natural (pero innecesario) especificar que el ganador se equilibrio en el que la elección de los es~erzos por parte de los trabaJa-
,)~
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores
reciben(wA +wB)/2 .
dores venga dada por la solución de esquma el = e2 = en vez de por la ?:
.~} condición de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlu-
l2La regla de Bayes proporciona una fórmula para P(AIB), la probabilidad (condicional)
,",.l~ de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B) nI'd a d d e emp 1ea alternativo proporcionan' a una utilIdad Un' Como , en' el .
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan equilibrio de Nash simétrico cada jugador gana el tor~eo con probal:lh-
'. '-,' tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente. La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
dad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI capataz qUJ~re :1
..../
inducir a los trabajadores a participar en el torneo debera escoger salanos
'
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra. que satisfagan
~_l.>t'
80 / JUEGOS DlNAMICOS CON INFORMACIÓN COMPLETA (c. 2)
Juegos repetidos / 81
(
(WA - WB) l
J
f(Ój)2dój = 1,
Jugador 1
2,2 6,1
Figura 2.3.2
2.3Juegos repetidos
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
En esta sección analizarnos si las amenazas y promesas sobre el comporta- Este juego pertenece a la clase de los juegos analizada en la sección 2.2.A.
miento futuro pueden influir en el comportamiento presente en situacio- Aquí los jugadores 3 y 4 son idénticos a los jugadores 1 y 2, los espaCios
nes que se repiten en el tiempo. Buena parte de lo que hay que entender de acciones A3 y A4 son idénticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas son simplemente la suma de las ganancias en la'pnmera etapa (ái.;a2)
nuevas se requieren para entender los juegos con un horizonte infinito. y en la segunda etapa (a3,a4)' Además, el dilema de los presos en d.ós
Hemos definido también el equilibrio de Nash perfecto en subjuegos. Esta etapas satisface el supuesto que hicimos en la sección 2.2.A: para cada
defirüción tiene una expresión más sencilla para el caso especial de los jue- resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
gos repetidos que en el general de los juegos dinámicos con információn en la segunda etapa entre los jugadores 3 y 4 tiene un único equilibrio
completa que considerarnos en la sección 2.4.B. La introducirnos aquí para de Nash, que denotamos por (a3(al,a21,a,i(al,a2»' De hecho, el dilema .~'.
tacilitar la exposición posterior. . '.
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la sección 2.2.A peTInitini.osla posibilidad de
2.3.A Teoría: Juegos repetidos en dos etapas
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aquí la notación (a; (al ,a2) ,a¡ (al ,a2»
Consideremos el dilema de los presos dado en forma normal de la figura en vez de simplemente (aj,a¡). (En el juego de los aranceles, por ejemplo;
2.3.1. Supongamos que hay dos participantes en este juego que deciden las cantidades de equilibrio escogidas por las empresas en la segunda
simultáneamente en dos ocasiones, habiendo observado el resultad"ode li,'l etapa dependían de los aranceles escogidos por los gobiernos en la primera
primera decisión antes de decidir por segunda vez, y supongamos que las etapa.) Sin embargo, en el dilema de los presos en dos étapas, el único
• [IleSOS repef idos / 83
82 / JuEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
equilibrio del juego de la segunda etapa es (I¡,h), independientemente lora al caso de dos periodos, pero consideramos la posi-
del resultado de la primera etapa. .. vodlvdemqo:::1 J'uego de etapa G tenga múltiples equilibrios :le ..NilSh,¡
blhda e . d . d [y C ll1utan é1
Siguiendo el procedimiento descrito en la sección 2.2.A para calcular el 3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 .., . 1
resultado perfecto en subjuegos de tal juego, analizamos la primera etapa como
. de los presos d e l a fi gura 23.. I , pero las estrategias enOJ1Unal
. 'b .ilS
del dilema de los presos en dos etapas teniendo en cuenta que el resultado dIlem; sido añadidas al juego de forma que ahora existen dos eqUlh nos
Di ha '. (1 J) como en el dilema de los presos, y
del juego restante en la segunda etapa será el equilibrio de Nash de ese N h en estrategIas puras. ¡,2 . "1' I
de as d ' (D D) Natura men te, es artl' f)' cial añadir un eqUllt mo a
1
juego, es decir, (IIJú con ganancias de (1,1). Por tanto, la interacción en
la primera etapa entre los jugadores en el dilema de los p~esos en dos a~ora a de~as pr~~os2de esta manera, pero nuestro interés en este juego
dIlema, e os 't'vo que sustan h' va. En la próxima sección veremos que
etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que es mas exposll , 'h d uilibrios
las ganancias 0,1) de la segunda etapa se han sumado á' cada par de . tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe '1' d etapa que se repiten infinitamente tienen
ganancias de la primera etapa. El juego de la figura 23.2 tiene también un u'Iti les mc1uso SI os Juegos e . "
único equilibrio de Nash: (IIJZ). Por tanto, el único resultado perfecto en m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq. . de etapa artificial en el contexto Sl1nple
subjuegos del dilema de los presos en dos etapas es (¡¡Jz) en la primera . , n analIZamos un Juego
etapa, seguidC? de (I¡Jz) en ¡la segunda etapa. No se puede conseguir est~::cC1:riodos, y nos preparamos con ello para el análisis poster~or de
de p ..' 'co en un contexto con honzonte
cooperación, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en un juego de etapa con mteres economl ,
subjuegos. infinito.
Este argumento continúa siendo válido en situaciones más generales.
(Aquí nos apartamos momentáneamente del caso de dos periodos para
permitir cualquier número finito de repeticiones, T.) Denotemos con
G = {A¡, ... , An; Ul; ... ,un} un juego estático con información completa 1,1 5,0 0,0
en el que los jugadores 1 a n escogen simultáneamente las acciones a¡ a an 0,5 4,4 0,0
de los espacios de acciones A¡ a An respeftivamente, siendo las ganancias 0,0 0,0 3,3
U¡(al;', . ,an) a un(a¡, ... ,an). Llamaremos al juego G, juego deetapadel
juego repetido.
Figura 2.3.3
Proposición. Si el juego de etapa G .tiene un únicQequilibrio de Nash, entonces, . . .. 22 A Si G tiene un único resultado perfecto en
dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se
para cualquier T finito, el juego repetido G(T) tiene un ú~ico resultado perfecto subjuegos, entonces G(T) hene un unlCOres
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3 juega .el resultado perfecto en subjuegOdsfide.~. la nodón de resultado perfecto en subjuegos
14E '-' tamente hablando hemos e ni o
S'HC ' '. 'd l .. 22 A El dilema de los presos en dos etapas
13 Se ~btienen resUltados análogos si el juego de etapa G es un júego dinámicó con in- ól 1 1 se de juegos defim a en a seccJOn . . . .
s o para a e a da resultado factible del juego de la primera eta pa eXlste
formadón completa. Supongamos que G es un juego dinámico con inJonnádón completa y pertenece a esta clase, porque para ca d l gunda etapa Sin embarg0. el
perfecta de la clase definida en la secdón 21.A. Si G tiene un úr¡jco resultado por inducdón Tb' d N sh en el juego que que a en a se .
un único eqU11 no e ~ . n el . e o de e~apa de la figura 2.3.3 no pertenece a
hada atrás, G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender
resultado por inducdón hacia atrás de G. Sinillarmente, supongamos que G es un juego en tIque el ¡U.ego de etapa ene m. . 11
es a c ase, por b' os de forma que sea apiJea ) e a
formalmente la definición del resultado perfecto en su Jueg
84 / JUEGOS DlNÁ,vllCOS CON INFORfvIAC¡ÓN COMPLETA (e. 2)
Juegos rq;elidos / 85
en la primera etapa los jugadores prevén que el resultado de la segunda 2.3.4 corresponde al resultado perfecto en subjuegos «Cl,Cz),(D],D2») del
etapa será un equilibrio de Nash del juego de etapa. Puesto que este juego repetido, puesto que el resultado previsto en la segunda etapa es
Juego de etapa tiene más de un equi.librio de Nash, ahora es posible que (Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
los Jugadores prevean que a resultados diferentes en la primera etapa anteriormente, se puede alcanzar la cooperación en la primera etapa de
les sIguen equilibrios diferentes del juego de etapa en la segunda etapa. un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
Supongamos, por ejemplo, que los jugadores prevén que (Dl,Dz) será el de un resultado más general: si G = {Al,'" ,An; uI- ... ,un} es un juego
resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero estático con información completa que tiene múltiples equilibrios, pueden
que (II,1z) será el resultado de la segunda etapa si el resultado de la existir resultados perfectos en subjuegos del juego repetido G(T) en los
primera etapa es cualquiera de los ocho restantes. La interacción entre que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
los jugadores en la primera etapa se concreta entonces en el juego de una de Nash de G. Volveremos sobre esta idea en el análisis de un juego con
etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1) horizonte infinito en la próxima sección.
se ha sumado a las otras ocho casillas.
La conclusión principal que debemos sacar de este ejemplo es que
las amenazas o las promesas creíbles sobre el comportamiento futuro
pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra
2,2 g,1 1,1 perspectiva, puede que quizás el concepto de perfección en subjuegos
! 1-:'" --
no utilice una definición de credibilidad lo suficientemente fuerte. Al
1,6 ]1 1,1 derivar el resultado perfecto en subjuegos «C],CZ),(D1,Dz», por ejemplo,
1,1 1,1 hemos supuesto que Jos'jugadores prevén q~e (DI,Dz) s~rá el resultaclü,
~''!.
de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~
Figura 2.3.4 (I¡'!z) será el resultado en la segunda etapa si eIde la primera ronda es
cualquiera de los ()chorestantes. Pero jugar (11,!2)enléi.se~da etapa, con
Existen tres equilibrios de Nash con estrategias puras en el juego unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2, con una ganancia de (3, 3), está también disp¿nible cci~oe'luilibrio de
los equilibrios de Nash de este juego de una etapa corresponden a los Nash del juego de etapa que queda. Dicho en términos poco preciSos.
resultados perfectos en subjuegos del juego repetido original. Denotemos parecería natural que los jugadores renegociiü-an:15.SiJC1,cz) no es'~i
con «w,x),(y,z) un resultado del juego repetido: (w,x) en la primera etapa resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~á
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4 (I¡'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;
corresponde al resultado perfecto en subjuegos «(1],[Z),(1],[2» del juego pasado está, y que se debe jugar el eqüilibriodel juegbdeetapa (Dl,D~)
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z) unánimemente preferido. Pero si (DI,Dz)va a serelr~sÚltado de la
como consecuencia de cualquier resultado en la primera etapa excepto de segunda etapa independientemente de cuál sea el rescltadoenla primera
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura ronda, el incentivo para jugar (Cl,Cz) en ia prirñ~~áet~p.a_desaparece: la
~.3.4 corresponde al resultado perfecto en subjuegos «Dl,Dz),(11'!Z» del interacción entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce
al juego
Juego repetido. Estos dos resultados perfectos en subjuegos del juego de una etapa en el que la gánancia (3, 3Yse'ha~stÜÍ1adóacada casilla del
repehdo simplemente enlazan los resultados de los equilibrios de Nash juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura Cj del jugador i. ' '. . ."._.. '.
','
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadón (o incluso
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es negodadón) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debería añadirse a
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones la descripdón y análisis del jue¡;¡m.'Aquí súpimemos que no es así, de forma que lo que
mduso mas generales.
entendemos por "renegodar" no-esotra cosa que un ejerddo de introspección.
Juegos repetidos / 87
86 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e 2)
y demostrar el teorema de Friedman (1971) (también llamado teorema de el valor presente de las ganancias, es decir, la ganancia total que podría
tradición oral o teorema folk).I6 ingresarse en un banco ahora de forma que produjera el mismo saldo al
final de la sucesión.
1,1 5,0 00
t=I
0,5 4,4
También podemos utilizar 5 para reinterpretar lo que l~amamos un
juego repetido infinitamente como un juego repetido que se acaba después
de un número aleatorio de repeticiones. Supongamos que al finalizar cada
c..
Figura 2.3.6
etapa se lanza una moneda (trucada) para determinar si el juego se acaba ';-',
ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recor- presente 7f1+ 57f2+ 527f3+ ... refleja tanto el valor temporal del dinero como
demos (en el modelo de negociación de Rubinstein <;lela sección 2.1.D) la posibilidad de que el juego se acabe. '.'
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta Consideremos el dilema de los presos repetido infinitalIlente en elque
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de interés el factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugador
por periodo. Dados un factor de descuento y las ganancias de un jugador en el juego repetido es el valor presente de las ganan.ciasdel jugad()f,ep
obtenidos de una sucesión infinita de juegos de etapa, podemos calcular los juegos de etapa. Demostraremos que la cooperación, es decir,(D1,D2),
puede ocurrir en cada etapa de un resultado perfecto en subjuegos del
juego repetido infinitamente, aun cuando el único equilibrio de Nash
del juego de etapa es la no cooperación, es decir, (1},h) El argumerlto
es del mismo estilo que nuestro análisis del juego repetido en dos etapas
16 El teorema de tradición oral original se referia a las ganancias en todos los equilibrios basado en la figura 2.3.3 (el juego de etapa en el que añadimos un segundo
de Nash de un,juego repetido infinitamente. A este resultado se le llamó teorema de tradición equilibrio de Nash al dilem,! de los presos): si los jugadores cooperan
oral por ser ampliamente conocido entre los teóricos de juegos de íos "años cincuenia, aun
hoy entonces juegan un equilibrio con ganancias altas mañana; en caso
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgánancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y, contrario juegan un equilibrio Con ganancias bajas mañana. La diferencia
por tanto, refuerza el teorema de tradición oral original al utilizar un criterio de solución más entre el juego repetido en dos etapas y el juego repetido infinitamente es
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo, que aquí el equilibrio con gananciéls áltasquepodría jugarse mañana no
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradición oral, aun cuando' no hayan sido ampliamente
se ha añadido artificialmente, sirlOque representa continuar cooperando
conocidos entre los teóricos de juegos antes de ser publicados. a partir de mañana y en lo Sucesivo.
Juegos repetidos ! 91
90 I JUEGOS Dú'\JÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Supongamos que el jugadori empieza el juego repetido infinitamente ue el jugador j recibe por realizar esta elección de forma óptima (ahora
cooperando y sigue cooperando en cada juego de etapa siguiente si y sólo q cada vez que aparezca). Si jugar Dj es óptimo entonces
y ,
si ambos jugadores han cooperado en cada ronda previa. Formalmente,
.Ia estrategia, del jugador i es: V=4+ól/,
.::
..,'
92 I JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)
Juegos repetidos I 93
¡áclor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
juego repetido en dos etapas consideramos una estrategia en la que la
jllego de etapa son conocidos antes de que empiece la t-ésima etapa. La ganancia
decisión del jugador .¡ en la segunda etapa era contingente del resultado
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesión infinita de juegos de etapa. de la primera etapa: jugar Ci en la primera etapa y jugar li en la segunda
a menos que el resultado de la primera sea (C¡,Cz), en cuyo caso jugar Di
en la segunda etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
En el juego repetido finitamente G(T) o en el repetido infinitamente
plan completo de acción, es decir, especifica una acción factible del jugador
G(co/i), la historia de! juego hasta la etapa t es el registro de las decisiones
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
de los jugadores desde la etapa 1 hasta la t. Los jugadores podrían ha-
forma algo más frívola, si un j~ga_dordejara una estrateg!a a su abogado
ber escogido (un, ... ,un¡) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y
anles de que el juego empezase, el abogado podría sustituir al jugador
(U¡u ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapa
en el juego, sin necesitar en ningún caso de instrucciones adicionales
s la acción Uis pertenece al espacio de acciones Ai.
sobre cómo jugar. En un juego estático con información completa, por
ejemplo, una estrategia es simplemente una acción. (Por esto describimos
Definición. En e! juego repetido finitamente G(T) o en el juego' repetido infini-
lal juego como G = {S¡,,,,,Sn;'U¡, ... ,un} en el capitulo t pero aquí
tamente G(co,8), la estrategia de un jugador determina la acción que el jugador
pu:de describirse también como G = {A], ... ,An; U¡, '" ,un}: en un juego
realizará en cada etapa para cada posible historia de/juego hasta la etapa anterior.
estallco con información 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinámico, una estrategia es más complicada. Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,
la parte que queda por jugar empezando en cualquier momento en el que
Consideremos el dilema de los presos en dos etapas analizado en la
la historia completa del juego hasta entonces sea información deI'doIÍúrÜo
sección anterior. Cada jugador acruados veces, de forma que podría
público entre los jugadores. (Más adelante en esta sección damos una
pensarse que una estrategia es simplemente un par dé irIstrucciones (b,c),
definición precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(i
donde b es la decisión en la primera etapa y e es la decisión en la segunda
sección 2.4.B damos una definición precisa para juegos dinámicos con in-
elapa. Pero existen cuatro resultados posibles de la prÍ11leraetapa, (1¡,1z),
formación completa en general.) En el dilema de los presos en dos etapas,
U¡,Dz),(D1,1ú y (D¡,Dú, que representan cuatro contingencias diferentes
por ejemplo, hay cuatro subjuegos que corresponden a los juegos de la
en las que al jugador l~ podría corresponder actuar. Por tanto, la estrategia
segunda etapa que siguen a los cuatro resultados posibles de la primera
de cada jugador consta de cinco instrucciones, que indicamos mediante
etapa. Del mismo modo, en el juego repetido en dos etapas basado en
(V¡W,x,y,z), donde v es la decisión en la primera etapa y w,x,y y zson''!as
la figura 2.3.3, hay nueve subjuegos que corresponden a los nueve re-
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (D¡Jz) y
sultados posibles en el juego de la primera etapa. En el juego repetido
(D¡,Dz) respectivamente. Usando esta notación, las instrucciones "jugar b
finita mente G(T) yen el juego repetido infinitamente G(co,8)la definición
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
de estrategia está íntimamente ligada a la definición de subjuego: la es-
se describen como (b,c,c,c,c), pero esta notación también puede expresar
trategia de un jugador determina las acciones que el jugador realizará en
estrategias en las que la decisión de la segunda etapa es contingente del
la primera etapa del juego repetido y enla primera etapa de cada uno de
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
sus subjuegos.
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
Definición. En e/juego repetido finitamente G(T), un sllbjllego que empieza en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
la etapa t + 1 es e! juego repetido en e! que G se juega T - t veces y que designamos
de cada Jugador consta de diez instrucciones, una decisión en la primera
por G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t + 1, uno para
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
cada una de las posibles historias de! juego hasta la etapa t. En e! juego repetido
resultado posible de la primera etapa. Recordemos que al analizar el
infinitamente G(co,8), cada subjuegoque empieza en la etapa t + 1 es idéntico
94 / JUEGOS DINÁMICOS CON INFOI~MAClÓN COMPLETA (e. 2) ¡liegos "e¡'e/idos / qs
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos (Dl,Dz). Si el jugador adopta la estrategi~ del disparador p~ra el juego
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del entonces (i) las estrategias del Jugador en un subluego de la
comp leto , 1
juego hasta la etapa t. . era clase son de nuevo la estrategia del disparador, que ya 1e11l0S
nm
Pd strado que es un equilibrio de Nash del juego completo, y (H) la,s
emo . 1 t
Obsérvese que la t-ésima etapa de un juego repetido no es por sí misma estrategias del jugador en un juego de la segunda clase son slmp eme:1.e
un subjuego del juego repetido (suponiendo que t < T en el caso finito). repetir en lo sucesivo el equilibrio del juego de etapa (1¡,1z), que e: ~a,~blen
Un subjuego es una parte del juego original que no sólo empieza en un un equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. de
momento en que la historia del juego hasta entonces es información del Nash en las estrategias del disparador del dilema de los presos repetido
domino público entre todos los jugadores, sino que también incluye todas infinitamente es perfecto en subjuegos.
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-ésima etapa aisladamente sería equivaierit~a considerar la t-ésima etapa Ganancia al jugador 2
corno la etapa final del juego repetido .. Tal análisis podría llevarse a cabo
pero no sería relevante para el juego repetido original.
Estamos ahora preparados para la definición de equilibrio de Nash (0,5)
El equilibrio de Nash perfecto en subjuegos es un refinamiento del Aplicamos seguidamente argumentos análogos al juego repetí.do infi-
equilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategias 'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
de los jugadores deben ser primero un equilibrio de Nash y pasar luego (1971) para juegos repetidos infinitamente. Para enunciar' el teorema, ne-
una prueba adicionaL cesitarnos dos últimas definiciones. Primero, llamamos factIbles a las ga-
Para demostrar que el equilibrio de Nash en las estrategias del dis- nanCIas. (Xl,"" x n ) en ell'uego de etapa G si son una combinación
.
convexa
parador deLdilema de los presos repetido infinitamente es perfecto en (es decir, una media ponderada donde las ponderaciones son no-negativas
subjuegos, debernos demostra'r que las estrategias del disparador cons- y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
tituyen un equilibrio de Nash en cada subjuego de este juego repetido de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
infinitamente. Recordemos que cada subjuego de un juego repetido infi- región sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
nitamente es idéntico al juego completo. En el equilibrio de Nash en las (1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
estrategias del disparador del dilema de los presos repetido infinitamente, , ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que 1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
todos los resultados de las etapas anteriores han sido (D¡,D2), y (ii) sub- las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
juegos en los que el resultado de al menos una etapa anterior difiere de de) la región sombreada de la figura 2.3.7 son medIas ponderadas de las
96 / JUEGOS DfNÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
Juegos repetidos / 97
.
d".,+ u . e.,' + u,2 . e. +
' '"
= d., + 1 _o oei. Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foimá que eI~valormáximo de esta fracción para cualquier jugador sea
(Dad~ ~ue cualquier desviación desencadena la mismarespuest. d 1 también estrictamente menor que 1.
demas Jugad 1" d . '.' , a e os Queda por demostrar que este equilibrio de Nash es perfecto en sub-
. ores, a umca esviación que necesitamos considerar es la '
ventaJosa) Alt ti .' mas juegos. Es deCir,'que las estrategias del disparador deben constituir un
" . ema vamente, Jugar axi proporcionará una ganancia de x.
en esta et~pa y conducirá a exactamente la misma elección entre a. a' equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
,~I:/~sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~
(e Juego de etapa que el Jugador i recibe por elegir óptimament (h
es
subjuegode 0(00,0) idéntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
Ycada vez t . e a ora clases: (i) subjuegos en los que los resultados de las etapas anteriores han
que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti' ':,.,
entonces " X> P mo, sido (axl, .. -: ;a~n), y (ji) subjuegos'en losqué
el resultado de al menoSú.ri¡{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
Vi = Xi + oVi, disparador en el juego completo, (i) las estrategias'dé los jugadores ériun'
,/0 ,) S"1Jugar subjuego de la primera etapa son de nuevo las estrategias del disparador
o V,-,- x - u. adi es. óptimo, entonces
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
Vi = di + --e.
o del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle . ....... '
1-0'" la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiiegÓ
como obtuvimos p' ( . de etapa (ael,' .. ,aen), lo que también es un equilibrio de Nash d~l jrieg;;~"
rio no está co 1 ~eVl~ment~. Supongamos que el mecanismo aleato- completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
' . rre aClOna o senalmente. Es suficiente entonces que d. sea
la ganancIa mayor a la . d . ., d ' del juego repetido infinitamente es perfecto en subjuegOs.
. '. . meJor. eSVlaClOn el jugador i entre las difere _ ':.." ,
Por tanto, en la pri.. ' . Recordemos el juego deCoumot estático de la sección 1.2.A: Si la
. . m.ra etapa, y en cualqwer etapa tal que todos los resul- cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,
•.
tal:los antenores hayan 'd ( '" , .
. SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene
--------
102 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
Jllegos repel idos / 103
costes fijos. Las empresas escogen sus cantidades simultáneamente, En el También podemos preguntarnos qué pueden conseguir las empresas si
único equilibrio de Nash, cada empresa produce una cantidad (a - c)/3; 6< 9/17. Exploraremos los dos enfoques descritos en la sección ante.rior.
a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado Determinamos en primer lugar, para un valor dado de ó, la cantIdad
que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad
más rentable que las empresas pueden producir si ambas siguen una
de monopolio, qm == (a- c)/2, ambas empresas estarían mejor si cada una
produjera la mitad de la cantidad de monopolio, q¡ = qm/2. ~ trategia del disparador que transforman para siempre en la cantidad .de
Cournot después de cualquier desviación. Sabemos que estas estrategIas
Consideremos el juego repetido infinitamente basado en este juego no pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dad
de etapa de Cournot, cuando las dos empresas tienen el mismo factor de de monopolio, mientras que para cualquier valor de 6, repetIr la cantIdad
descuento 6. Calculemos ahora los valores de 6 para los <fue,cuando las de Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.
"
",', dos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de ' Por tanto, la cantidad más rentable que puede darse con las estrategias del
Nash perfecto en subjuegos de este juego repetido infinitamente: ' clispáradoresfáentre q;,{/2 y qc. Para calcular esta cantidad, consideramos
la estrategia del disparador siguiente:
Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~n
e! primer periodo. En el t-ésim,o periúdo~producir qm/"Z Producir q* en el primer periodo. En el t-ésimo periodo,
SI ambas empresas han producido qm/2 en cada uno d~
producir q* si ambas empresas han producido q* en cada
los t- 1 periodos anteriores; en caso éúntnirio¡ producir, uno de los t ~,1 periodos anteriores; en caso contrario,
la cantidad de Cournot, qc. ,
producir la cantidad de Coumot, k
Puesto,qu~ e,!argumento e~ paralelo al dado para eldilem~de los pres;s El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, que
de la sección anterior, seremos breves en la discusión. '"
denotaremos mediante 11"*. Si la empresa i va a producir q* en este periodo,
El beneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es la cantidad que maximiza los beneficios de la empresa j en este periodo
(a - c)2/8,.que denotaremos por 1r m/2. ~l beneficio deuna empresa cuando es una solución de
ambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, si
la empresa i vaa producir qm/2 en este periodo, la cantidad que maximiza
max (a, - qj - q* - c)qj.
los beneficios de la empresa j en este periodo es uria sohición de ' _. qj
Exploramos ahora el segundo enfoque, que incluye la amenaza de perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash en
hacer efectiva la penalización más fuerte creíble. Abreu (1986) aplica esta cada clase de subjuegos. En los subjuegos de colusión, cada empresa
Idea a unos modelos de Cournot más generales que el nuestro, utilizando debe preferir recibir la mitad del beneficio de monopolio en lo sucesivo a
un factor de descuento arbitrario; nosotros simplemel1te demostramos recibir 7f d este periodo y el valor presente por penalización en el periodo
que el enfoque de Abreu permite que en nuestro modelo se obtenga el siguiente:
resultado de monopolio cuando f¡ = 1/2 (que es menor que 9/17). Consi-
1 1 (2.3.3)
deremos la siguiente estrategia del "palo y la zanahoria"): -- . -7r > 7rd + 8V(x).
1-5 2 m_
Producir la mitad de la cantidad de monopolio, qm/2, en En los subjuegos de penalización, cada empresa debe preferir administrar
el primer periodo. En el t-ésimo periodo, producir qm/2 el castigo a recibir 71" dp este periodo y empezar de nuevo la penalización
si ambas empresas produjeron qm/2 en el periodo t - 1, en el siguiente periodo:
qm/2 si ambas empresas produjeron x en el periodo t - 1,
Y x en cualquier otro caso. V(x) ?: 7r dp(X) + 5V(x). (2.3.4)
Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusión en el W10S salarios más altos podrían inducir a que los trilbajado-
desarro 11ildos , , . .
ciclo económico, permitiendo que la intersección con el eje de abci~as de .' preparados solicitasen empleo en la empresa que los ofrecIelil,
res mejor . ,.
la función de demanda fluctúe aleatoriamente de un periodo al otro. En o podrían inducir a los trabajadores ya empleados a trabajar mas mtensa-
cada periodo, todas las empresas observan la intersección con el eje de ab- mente.
cisas de la función de demanda en ese periodo antes de tornar decisiones; Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inámico en el q.ue
en otras aplicaciones,los jugadores observan otras variables de estado l empresas inducen a los trabajadores a trabajar mas pagando salanos
al principio de cada periodo. El incentivo a desviarse de una estrategia :r:os y amenazando con despedir a los que sean descubiertos trabajando
pactada depende tanto del valor de la demanda en este periodo corno poco. Como consecuencia de estos salarios altos, las empresas reducen su
de los posibles valores de la demanda en periodos futuros. (Rotemberg demanda de trabajo, de forma que a1g1.mostrabajadores tendrán empleo
y Salonersuponen que la demanda no está correlacionada serialmente n salarios altos mientras que otros estarán (involuntariamente) parados.
de forma que esta última consideración ,es independiente del valor pre~ ca d ,. 1
Cuanto mayor sea el número de trabajadores para os, mas tIempo e
sente de la demanda, pero otros autores posteriormente han relajado este llevará a un trabajador que haya sido despedido encontrar un nuevo
supuesto.)
empleo, de forma que la amenaza de despido resulta más. efectiva. En
Green y Porter (1984) estudian la colusión cuando las desviaciones el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
no se pueden detectar perfectamente: en vez de observar las cantidades trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
escogi~~s ~or la otra empresa, cada empresa observa tan sólo el precio empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
de eqwlibno del mercado, que cada periodo recibe sacudidas debidas a Vamos a estudiar los aspectos de este modelo que tienen que ver co~
una perturbación aleatoria inobservable. En este contexto, las empresas los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
no puede,n distinguir cuándo un precio de equilibrio bajo se debe a que competitivo) analizando el caso de una empresa y un trabajador.
una ~ ,mas empresas se han desviado de la estrategia pactada o a que , Consideremos el siguiente juego de etapa. En primer lugar, la empresa
oc:un0 una perturbación adversa. Green y Porter examinan los equili- ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
bnos con estrategias del disparador tales que c~alquier precio por debajo rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
de un nivel crítico dispara un periodo de penalización durante el cual un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
las empresas juegan sus cantidades de Coumot. En equilibrio, ninguna escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
empresa se desvía. No obstante, una perturbación especialmente mala (lo que no le produce desutilidad). La decisión tornada por el traba~ador
puede hacer que el precio caiga por debajo del nivel crítico, desencade- sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
na~do un periodo de penalización. Como algunas penalizaciones ocurren produce es observado tanto por la empresa como por el.!!abajador. La
acc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en el producción puede ser alta o baja; para simplificar, suponemos que el
anahSls de las estrategias del disparador no son óptimas. Estrategias de nivel bajo de producción es cero y escribimos, eLnivel~1to como y > O.
dos ~ases del tipo ,analizado por, Abreu podrían parecer prometedoras; Supongamos que si el trabajador realiza un esfuerzo, la producción es ~J,ta
efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que pueden con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
ser optimas.
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de producción es signo inequívoco de falta de
2.3.D Salarios de eficiencia esfuerzo. .tI
empleado en la empresa y realizar un esfuerzo, aunque también le resulta es también análoga a estas estrategias del disparador, pero es ligeramente
m~jor ponerse de independiente a estar empleado en la empresa y no más sutil ya que el trabajador decide en segundo lugar en el juego de etapa
estorzarse. de decisión sucesiva. En un juego repetido basado en un juego de etapa de
El resultado perfecto en subjuegos de este juego de etapa es más decisión simultánea, las desviaciones se detectan sólo al final de la ronda;
bien poco prometedor: dado que la empresa pagaw por adelantado, el sin embargo, cuando el juego de etapa es de decisión sucesiva, una des-
trabajador no tiene ningún incentivo para esforzarse, de forma que la viación del primer jugador se detecta (y debería ser contestada) durante
empresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajar la misma ronda. La estrategia del trabajador es jugar cooperativamente
como independiente. Sin embargo, en el juego repetido infinitamente, la siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
empresa puede inducir un esfuerzo pagando un salario wsupérior a Wo y pero responder de forma óptima a cualquier desviación de la empresa,
amenazando con despedir al trabajador en cuanto la producción sea baja. sabiendo que el resultado perfecto en subjuegos del juego de etapa se
Demostramos que para algunos valores de los parámetros, la empresa jugará en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,
encuentra que vale la pena inducir un esfuerzo pagando ese salario. el trabajador acepta la oferta de la empresa pero no se esfuerza.
Uno podría preguntarse por qué la empresa y el trabajador no pueden Derivamos ahora las cond,iciones bajo las cuales estas estrategias son
firmar un contrato c-6mpensatorio que dependa de la producción, deforma un equilibrio de Nash perfecto en subjuegos. Como en las dos secciones
que induzca al esfuerzo. Una razón por la que estos contratos podrían anteriOres, el argumento consta de dos partes: (i) la derivación de las
no ser viables es que a un tribunal le resulta muy dificil. hacer que se condiciones bajo las cuales estas estrategias son un equilibrio de Nash, y '\."
cumplan, quizás porque una medida adecuada de la producción incluye (ü) la demostración de que es perfecto en subjuegos.
la calidad, las dificultades inesperadas en las condiciones de producción, Supongamos que la empresa ofrece w. en el primer periodo. Dada
etc. De un-aforrÍ1.amás general, es probable que loscontf?tos contingen~ la estrategia de la empresa, es óptimo para el trabajador aceptar. Si el
tes a determinadOs volú.menes de producción sean imperfectos (más que trabajador realiza un esfuerzo, está seguro que producirá al nivel alto,
completamente inviables), aunque los incentivos todavía pueden jugar un de forma que la empresa volverá a ofrecer w' yel trabajador volverá a
papel en el juego repetido estudiado aquí. enfrentarse en el periodo siguiente a la misma decisión sobre el esfuerzo
Consideremos las siguientes estrategias en el juego r~petido infinita- a realizar. Por tanto, si la decisión óptima dél trabajador es esforzarse, el
mente, que incluyen el salario 'W. >wo que se determinará más adelante. valor presente de las ganancias del trabajador es
Diremos que la historia del juego es de salarió álto y prod~c2ión alta si todas
las ofertas anteriores han sido 'W., todas las ofertas anteriores han sido Y.: = (w' - e) + 8y':,
aceptadas y todos los niveles de producción anteriores han sido altos. La
o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,
estrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecer
producirá al nivel alto con probabilidad p, en cuyo caso la misma decisión
w = 'W. en cada periodo siguiente siempre y cuando la historia del juego
con respecto al esfuerzo se dará en el próximo periodo, pero el trabajador
sea de salario alto, producción alta, pero ofrecer w = Oen caso contrario.
producirá el nivel bajo con probabilidad 1- p,en cuyo caso la empresa
La estrategia del trabajador es aceptar la oferta de la empresa si w ~_ Wo
ofrecerá w = O en lo sucesivo, de forma que en adelante el trabajador
(decidiendo trabajar como independiente en caso contrario) y realizar un
será independiente. Por tanto, si no esforzarse es la decisión óptima del
esfuerzo si la historia del juego, incluyendo la oferta presente, es de salario
trabajador, el valor presente (esperado) de las ganancias del trabajador es
alto y producción alta (no esforzándose en caso contrario).
La ~trategia de la empresa es análoga a las estrategias del dispara-
dor analIzadas en las dos secciones anteriores: jugar cooperativamente V. = w' + {j { pV.+ O -p\. wa_ }
{j'
w
*
2: Wo + '(1
1- p{j
p .
)e == Wo
(1 -
+ 1 + ---
(j
[jO - p)
e
)
(2.3.5)
suficientemente alta para lograr una cooperaclOn sostenIda.
. (j -
Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las
Por tanto, para inducir un esfuerzo, la empresa debe pagar no sólo Wo + e .estrategias que estamos considerando son un equilibrio de Nash: .Para
para compensar al trabajador por renunciar a la oportunidad de trabajar demostrar que estas estrategias son perfectas en subjuegos, defJmmos
como independiente y por la desutilidaddel esfuerzo, sino también por primero los subjuegos del juego repetido. Recordemos que cuan~'¡o el
la prima salarial O - {j)e/ [jO - p):NaturaImente, si p está cerca de uno (es juego de etapa obliga a decisiones simultáneas, lo~ subJuegos ~el Juego
',1'
decir, si no esforzarse es difícilmente detectable), la prima salarial debe repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode
ser extremadamente alta para inducir un esfuerzo. Si p == O, por otra parte, etapa de decisiones sucesivas considerado aquí, los subjuegos empIezan
esforzarse es la decisión óptima del trabajador si no sólo entre etapas sino también dentro de cada etapa, después de que el
trabajador observa el salario que la empresa ofrece. Dadas las estrategias
1 (* ) .,. fj de los jugadores, podemos agrupar los subjuegos en dos clases: los que
1 _ 6 w - e 2: w + 1- 6 wo, (2.3.6)
empiezan después de una historia de salario alto y producción alta, y los
análogamente a (2.3.1) y (2.3.2) en los casos con supervisión perfecta de que empiezan después de todas las demás historias. Hemos demosb'ado
las dos secciones anteriores, (2.3.6) es equivalente a ya que las estrategias de los jugadores son un equilibrio de Nash dada
una historia de la primera clase. Queda por hacer lo mismo cor~una
W* >
_wo+ '(1 1- 6)
.+-/5-. e,
historia del segundo tipo: como el trabajador no se esforzará l1\1nca,es
una decisión óptima de la empresa inducir al trabajador a trabajar como
queefectivamenfe es (2.3.5) con p == O. independiente; dado que la empresa ofrecerá V) == O en la siguiente etapa y
Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajador en lo sucesivo, el trabajador no debería esforzarse en esta etapa y debería
sea la mejor respuesta a la estrategia de la empresa, a la empresa tiene aceptar lá oferta presente sólo si 'w 2: O.
también que merecerle la pena pagar w::
Dada la estrategia del trabajador, En este equilibrio, trabajar como independiente es permanente: si se
el problema de la empresa en el primer periodo se c(;mcreta en escoger descubre al trabajador no esforzándose, la empresa ofrece 1J) == O en lo
entre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazando sucesivo; si la empresa se desvía alguna vez de ofrecer w ==. w*, el t.ra-
co~ ~espedir al trabajador si en algún momento la producción es baja, y bajador nunca volverá a esforzarse, de fiJrma quela empresa no puede
~eclbl~ndo por tanto la ganancia y - w* en cada periodo; y (2) pagar w == O, permitirse emplear al trabajador. Hay varias razC?naspara preguntarse
mdu~l~ndo con ello al trabajador a escoger trabajar como independiente, si es razonable que el trabajo como independiente sea permanente. En
y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Por nuestro modelo de una empresa y un trabajador, ambos jugadores pre-
tanto, la estrategia de la empresa es una mejor respuesta a la del traba- ferirían volver al equilibrio de salario alto y producción alta del juego
jador si repetido infinitamente, antes que jugar para siempre el resultado perfecto
en subjuegos del juego de etapa. Éste es el problema de la renegociación
y - w* 2: O. (2.3.7)
presentado en la sección 2.3.A. Recordemos que si los jugadores saben que
no se podrán hacer cumplir las penalizaciones, la cooperación inducida
Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador por la amenaza de estas penalizaciones ya no es un equilibrio.
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una En el contexto del mercado de trabajo, la empresa puede preferir no
condición más fuerte si estas estrategias han de formar un equilibrio de renegociar si emplea muchos trabajadores, ya que renegociar con un tra-
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican bajador puede estropear el equilibrio de salario alto y producción alta que
1-/5 se está todavía jugando (o aún sé ha de empezar a jugar) con los otros
Y-e>
- 'tilo + ---e
60 - p) , trabajadores. Si hay muchas empresas, la cuestión es si ~aempresa .i con-
,'.
'112 í JUEGOS DlNÁMJCOS CON INFORMACJÓN COMPLETA (c. 2) fllegos repetidos / 113
tratará a trabajadores empleados anteriormente en la empresa .¡. Pudiera la autoridad monetaria observa esta expectativa y escoge el nivel real de
ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de inflación, -¡r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,
salario alto y producción alta logrado con sus trabajadores, como en el los empresarios quieren simplemente prever correctamente el nivel de
caso de una única empresa. Algo así puede explicar la falta de movilidad inflación; alcanzan su ganancia máxima (que es cero) cuando -¡r= 7[e. A la .'
~:;,,
de los administrativos jóvenes y varones entre las grandes empresas en autoridad monetaria, por su parte, le gustaría que la inflación fuera cero
Japón. . pero que la producción estuviera en su ruvel de eficiencia (y*). Escribimos
Alternativamente,si los trabajadores despedidos pueden siempre en- la ganancia de la autoridad monetaria como
contrar nuevos empleos que sean preferibles a trabajar como independien-
tes, el salario en esos nuevos empleos (neto de cualquier desutilidad del U(-¡r,y),= ::-C'Tr2 _ (y _y*)2,
esfuerzo) es el que aquí juega el papel del salario en el trabajo por libre
lUo. En el caso extremo en el que un trabajador despedido no sufra nin-
donde el pªiá,meti-o c > O refleja el dilema de laaú,-t?I1d~dITl();l1~;~ria
~n~,~
S115 dos ~lJjeti~os'?llPo!;ga.mos q';le el verdad~!(): !ÚyeI d~ pr,c)~}lc.ción
guna pérdida, no existirán penaliza'ciones por no esforzarse en el juego
repetido infinitamente y, por consiguiente, no existirá ningún equilibrio es i~sigule;tefuIíd¿n del ~velde producción deseado'y de la in£l.ac.i~~
' iIDpfevista'; " , , ,
de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe
una aplicación elegante de estas ideas en el contexto de la deuda pública
y =by* + d(-¡r - -¡re),
externa en Bulow y Rogoff (1989): si un país endeudado puede conseguir
el importe de los créditos a largo plazo que recibe de los paíSes acreedores donde b < 1refleja ,la presencia de un poder de monopolio en los mer~
mediante transacciones a corto plazo por adelantado en el mercado inter- cados de productos (de forma. que si no hubiera inflación imprevista; se
nacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento produCiría a un nivel por debajO del de eficiencia) y d >' O mide el efecto de
de los términos de la deuda en el juego repetido infinitamente entre paíSes la iriflaciQrlin1prevista sobre.la producción a través de los salarios reales;
deudores y acreedores. tal ycomo se describió en el párrafo anterior. Podemos entonces reescribrr
la ganancia de la autoridad monetaria como. .
2.3.E Política monetaria estable en el tiempo
W(-¡r,7[e) = _c-¡r2 - [(b - l)y* +d(-¡r - 7[e)]2.
Consideremos un juego de decisiones sucesivas en el que empresarios y
trabajadores renegocian los salarios nominales, después de lo rualla auto- Para h~llar el resultadop;d~to en subjuego~A~:'~!~'jt;~~9. d~¿~~tp.J~
calculambs primero la elección óptima de-n: por Bme~ela,aut0!fd~9
ridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a
monetari~¡-a.adas l~s exp~étativas de los einpresarib~ -¡re.MaximiZando
de inflación. Si los contratos salariales no pueden' ser automáticamente
W(-¡r,-¡re) obtenemos
achlalizables, empresarios y trabajadores tratarán de prever la inflaCión
antes de fijar los salarios. Sin embargo, una vez se ha fijado el sala- d '
1l'*(-¡re)
= --:J?[(l - b)y* + d-¡re]. (2.3.8)
rio nominal, un nivel real de inflación superior al previsto erosionará el c+ u-
salario real, haciendo que los empresarios aumenten el empleo y la pro-
Dado qJle.los empresarios prevén que la autoridad monetaria escogerá
ducción. La autoridad monetaria, por tanto, se enfrenta aun dilema al -¡r*(-¡re),
i~$'empresarios escogerán la -¡reque maximice _[-¡r*(7[e)- -¡re]2,lo
tener que escoger entre los costes de la inflación y las ventajas de reducir
que da1r*(-¡re)= -¡re,o,.,
el paro y aumentar la producción ante una evolución impreVista del nivel
de inflación.
-¡re = ---y
d(1 - b) *' = ,-¡r.,
Como en Barro y Cardan (1983), analiZamos una versión en forma c
reducida de este modelo en el siguiente juego de etapa. Primero, los donde el subíndice s denota, "juego de etapa". De forma similar, podría
empresarios forman sus expectativas de inflación, -¡re.En segundo lugar, deCirse que la expectativa' niCiomilque los empresarios deben mantener
~
, ;:~;~~\:i!~W;Ú.;,~,\ ••~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;¡,,:,;1;'r,,,,l..l.'~I'
.••.,,.:.,,••;"" ••.:.:"'J.._~' ...•.•.•...•.
~-...:..!...~...:..-'~~L~,I _ •.~I;.l...;.'--:'<'~. ---.---------
nos juegos una de las dos formas es más apropiada que la otra. Vamos a Este árbol empieza con un nodo de decisión correspondiente al jugador
ver cómo los juegos estáticos pueden representarse utilizando la forma ex- 1, donde 1 escoge entre 1 y D. Si el jugador 1 escoge 1,se llega a un nodo
tensiva y cómo los juegos dinámicos pueden ser representados utilizando de decisión del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,
la forma normal. si el jugador 1 escoge D, se llega a otro nodo de decisión del jugador 2,
Recordemos de la sección l.1.A que la representación en forma normal donde 2 escoge entre l' y D'. Después de cada una de las decisiones de
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles 2 se llega a un nodo terminal (es decir, el juego termina) y se reciben las
de cada jugador y (3) las ganancias recibidas por cada jugador para cada gan¡mc;iasindicadas ..
combinación de estrategias posibles. Es inmediato extender el árbol de la figura 2.4.1 para representar
cualquier juego dinámiCo con información completa y perfecta, es decir,
Definición. La representación en fanna extensiva de un juego exige preci~ar: cualquier juego en el queros jugadores toman sus decisiones uno después
(1) los jugadores, (2a) cuándo tiene que jugar cada jtigador,(2b) lo qt{e cada del otro, todas las decisiones previas son información del dominio público
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada antes de realizar el siguiente movirnientoy las ganancias a los jugadores
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida con cada combinación factible ,de decisiones son información del domi-
por cada jugador para cada combinación posible de jugadas. nio público. (Los espacios. de-acciones continuos, como en el modelo de
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos 5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,
analizado varios j~egos representados en forma extensiva. La contri- presentan dificultades gráficas pero no conceptuales) Deriva~os segui-
bución de esta sección consi~te elldescribir estos juegos en forma deárbol d¡mWl1teJareprese~tfición.en forma ,normal del juego:de la figura 2.4.1.
en vez de utiliZár' palabr~s, porqtie el uso deárbo~es,.~ menudo'facilita C:0l1clpimospOI\últiIIÍ.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!á~cosc
tanto la explicaci6n co~o el análisis. ' .. , .> .,. - ' .. Plledel1represerÚarse enfofI!la extensiva y descnbiend() cómo represen~ .
Como ejemplo de un juego en formaextensiva, consideremóseI si- tar en formaext~nsiva l()s juegos dinámicos con información ~9rnpleta
glliente representante dé la clase de juegos en dos etapas 'con información pero imperfecta.
completa y perfecta presentada en la sección 2.1.A: Tal como parecen indicar las convenciones sobre nmneración ~l~)as
definiciones de las-formas no,rmaly extensiva, existe una íntiIna relaC;ión
1. El jugador 1 escoge una acción al del conjunto factible Al = {J,D}.
entre las estrategias f¡;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~
2. El jugador 2 observa al y escoge entonces una acción a2 del conjunto
nornal y la descripcipl1 de cu'ándo dec.ide un jugadorrcqu~'p:ll.~doe'):¡a<;£ú
,42 = {J',D'}.
qp.ésabe(apartados 2ª,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.tiñ
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el árbol de
juego dinámico en forma normal, necesitamos.h"aducirJ~Wof!!laciónen:
la figura 2.4.1.
forma e?'tensiva en términos de la descripción del espacio de estrategías'
<.. 2,') de cada jugador en la fórma~normal. Para hacer esto, recordemos la
definición de estrategia dada (formalmente) en la sección 2.3.B:
Figura 2.4.2
Defuliciónó Un conju~to de itlfonnación de un jugador es una colección de
nodos de decisió~ que satisface:
.Dados estos espacios dl7estrategias de los dos jugadores, eSÍnil1ediató
",.,' denvar la representación ,en forma normal del juego a partir de surepre- W al jugador le corresponde jugar ett-cada nodo del conjunto de informacióny.
(ii) cuarido en el transcu'rso del juego se llega a 11/1 nodo del conjunto de 111fOl-
¿
120/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Juegos dinámicos con información completa pero imperfecta / 121
mación, el jugador al que le corresponde decidir no sabe a qué nodo dentro del Como segundo ejemplo del uso de un conjunto de información para
conjunto de infonnación se ha (o no se ha) llegado. representar la ignorancia de las jugadas anteriores, consideremos el si-
guiente juego dinámico con información completa pero imperfecta:
La parte (ii) de esta definición significa que, en un conjunto de información,
el jugador debe tener el mismo conjunto de acciones factibles en cada nodo
de decisión; en caso contrario el jugador seria capaz de inferir a partir del 1. El jugador 1 escoge una acción al del conjunto factible Al = {l,D}.,
conjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s) 2. El jugador 2 observa al y escoge a continuación una acción a2 del
nodo(s). conjunto factible A2 = {J',D'}.
3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuación
Preso 1
una acción a3 del conjunto factible A3 = {I",D"}. -1
4 o 5 1 1 D
4 5 O 1 ':."'
Figura 2.4.3
3
En un juego el! forma extensiva, indicaremos que una colección de
nodos de decisióneonstituye un-conjunto de información con una línea
discontinua, como en la representación en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qué jugador- le corres-
ponde mover en los nodos del conjunto de información por medio de una
Figura 2.4.4
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la línea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretación del conjunto de información del preso 2 en la fi- Ahora que hemos definido la noción de conjunto de información, po-
gura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe demos ofrecer una definición alternativa de la distinción entre información
es que se ha llegado al conjunto de información (es decir, que el preso 1 perfecta e imperfecta. Definimos previamente la información perfecta di-
ha decidido), pero no a qué nodo se ha llegado (es decir, lo que ha hecho). ciendo que en cada jugada, el jugador al que le corresponde jugar conoce
Veremos en el capítulo 4 que el preso 2 puede tener una opinión de lo que toda la historia del juego hasta ese momento. Una definición equivalente
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta es que cada conjunto de información contiene un único elemento: Por
cuestión hasta entonces. el contrario, la información imperfecta significa que existe al menos un'
--~
122 / JUEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2) Juegos dinlÍmicos COI1infonl1nóón completa pero imperfecto / 123
cO~j~ntode informaci~n con má~ de un elemento,19Por tanto, la represen- (a) empieza en un nodo de decisión n que sea un conjunto de información con 1111
t~ClQnen forma extensiva de un Juego de decisiones simultáneas (como el único elemento (pero que no sea el primer nodo de decisión del juego),
~lle~a de l~s presos) es un juego con información imperfecta. De forma (b) incluye todos los nodos de decisión y terminales que siguen a n en el árbol
~lml1ar, l~: J~egos en dos etapas estudiados en la sección 2.2.A poseen. (pero no los nodos que no siguen a n) y
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son (e) no intersecta a ningún conjunto de información (es decir, si 1m nodo de
slmultaneas~ como también lo son las decisiones de los jug~dofes 3 y 4.. decisión n' sigue a n en el árbol, todos los otros nodos en el conjunto de
?e forma mas general, un juego dinámico con información co'mpleta pero información que contiene a n' deben también seguir a -n y, por tanto, deben
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos incluirse en el subjuego).
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la Debido al comentario entre paréntesis de la parte (a), no contamos el
figura 2.4.4. ." .... ,_. ..", .... ", "
juego completo como un subjuego, pero esto es sólo una cuestión de
" .: '. -- ". - ~
.
estiló: eliirtinar ese comentario entre paréntesis de la definición no tendría
2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~" ningúri efecto.
~ '-..:. Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
En la secció~ 2.3.B di~ós la définición generalder'eqtiilibriOdé~~shper: ~.". de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definición. En la
fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6í:lsóloa jueg(Js' . figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
repetido~ porque defimmos' los conceptos de estrategia' ysubjuego sólo' . decisión del jugador 2. En el dilema de los presos (o cualquier otro juego
para los Juego~repetidos. En la secCión2AA dimos la.definición gene" de decisión simultánea) no hay subjuegos. Para ilustrar la parte (c) de la
ral de ,estrategIa. Presentamos ahora la definieióngeneral de subjuego, definición', consideremos el juego de la figura 2.4.4. Sólo hay un subjuego,
despues de lo cual podremos aplicar la definición de equilibrio de Nash el que empieza en el nodo de decisión del jugador 3 que sigue a D por
perfecto en subjuegos a los juegos dinahúcos con inforinación completa parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
en general. este juego ningún subjuego empieza en ninguno de los nodos de decisión
del jugador 2, aun cuando estos dos nodos son conjuntos de información
, Recordemos que en la sección 2.3.Bdefinimos inforinalmertte un sub-
jue.go como la parte del ju~g,?que'q\teda'pórjugatecipeZáIldbeit cual- . de un único elemento.. .
"Vná trtanera de motivar la parte (c) consiste en áfumar que queremos
qUl~r momento en el que lá.~~storia éOrripletadeljuego has~a eritonces
poder ari~liiar ili1subju~gcipor sí mismo y que qti~rem6s que el a'náiisi's
sea mfo~~.c!6n deldoiriinióp~b~C~ entretbdosiosjugádor~tydiinós
un~ defimclOn formal en el caso de los juegos répetidos,que"eht6nces searei~vaiít~pai~el juego completo. En la figura 2.4.4, si intentáramos
definir un:'subjuego que empezara en el nodo de decisión del jugador 2
~stabam~s, co~sideran.do',Ofrecemos ahora una. definicióh fdrmál' para
Juegos dmarrucos con mformación completa en genera], en téI111iri6sdé la qué sigue a la decisión I del jugador 1, estaríamos creando un subjuego en
representación e.nforma extensiva del juego. el que el jugador 3 ignora la decisión del jugador 2 pero conoce la deeislón
del jugador.1. Tal subjuego no sería relevante para el juego completo
porque en ~ste lÍltimó el jugador 3 no conoce la jugadade 1, sino que tan
Definición. Un subjuego en un juego énforina extensiva
-~.--:': sólo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleEÚ-fsimojuego de etapa de 1.111 juego repetido no es en sí mismo
19 . '. ":.~:;C >0 ••••••••
, Est~ ~aracterización de la informaaón perfecta e imperfecta en términos de 20njuntos de un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
informaaon con ~o o más elementos está restringida a los juegos cón info~ació" complet; Otra m'anerade motivar la parte (c) es dándonos cuenta de que la
~~~te, com~.veremos en el c~pítulo,4, la ,repre~:,n;a,~ón.."n fonTlae.x.\é~~~~<'l'd{~ ju~i¿. parte (a) sólo garantiza que el jugador al que le corresponde jugar en el
formaclOn perfecta pero Incompleta tiene un conjunto de informaciÓn cóf(inái; dé' uti .
elemento. En este capítulo, sin embargo, restringimos nuestra atención a la infbrmacióh nodo n conoce la historia completa del juego hasta ese momento, no que
completa. ., los demás jugadores también conozcan la historia. La parte (c) garantiza
12~ / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2) JlIegos dinámicos con información completa pero imperfecta / 125
que la historia completa del juego hasta ese momento sea información del Hemos encontrado ya dos ideas íntimamente ligadas al equilibrio de
dominio público en el siguiente sentido: en cualquier nodo que sigue a Nash perfecto en subjuegos: el resultado por inducción hacia atrás defi-
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el nido en la sección 2.1.A y el resultado perfecto en subjuegos definido en
juego llegó al nadan. Por tanto, incluso si ni pertenece a un conjunto de la sección 2.2.A. En términos informales, la diferencia es que un equili-
información con más de un elemento, todos los nodos en ese conjunto de brio es una colección de estrategias (y una estrategia es un plan completo
información siguen a n, de forma que el jugador al que le corresponde de acción), mientras que un resultado describe lo que pasará sólo en las
decidir en ese conjunto de información sabe que el juego ha llegado a un contingencias que se espera que se den, no en cada posible contingencia.
nodo que sigue a n. (Si las dos últimas afirmaciones parecen difíciles es en Para ser más precisos sobre esta diferencia entre equilibrio y resultado, .....
"
parte porque la representación en forma extensiva de un juego especifica y para ilustrar.la noción de equilibrio de Nash perfecto en subjuegos,
lo que el jugadori sabe en cada uno de sus nodos de, decisión, pero no !econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.
hace explícito lo que el jugador i sabe en los nodoséfe decisión de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de Definición. En el juego en dos etapas con información completa y perfecta
cómo podría no cumplirse la parte (c). Podemos ahora reinterpretar este definido en la sección 2.1.A, el resultado por inducción hacia atrás es (aj',R2(aj'»
ejemplo: si caracterizásemos (informalmente)1o que el jugador 3 sabe pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al».
en el nodo de decisión del jugador 2 que sigue a la decisión 1 por parte
del jugador 1, diríamos que 3 no conoce la: historia del juego .hast~ ese .C;.,
En este juego, la acción aj' es una estrategia del jugador 1 porque sólo
momento, ya que 3 tiene otros nodos de decisión en lasque 3no sabe sil -hay una contingencia en la que le puede corresponder actuar, el principio
jugó 1 o D. ~;.
del juego. Sin embargo, del jugador 2, R2 (aj') es una acción (concretamente
Dada la definición general de subjuego, podemos;ahora aplicar la la mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~
definición de equilibrio de Nash perfecto en subjuegosde la sección 2,3.B. gia para el jugador 2 debe especificar la acción que 2 tomará después' de
cualquier posible decisión de 1 en la primera ronda. La función de mejor "
1',.,
Definición. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las respuesta R2(al), por otro lado, es una estrategia del jugador 2. En este
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego. juego, los subjuegos empiezan (y terminan) con el moVimiento del juga-
dor 2 en la segunda etapa. Hay un subjuego para cada acciónfactible,'al
Es inmediato demostrar que cualquier juego dinárrlicü:finito con.infor-
en Al, del jugador L Para demostrar que (aj',R2(al» esUILequilibrio de
mación completa (es decir, cualquier juego dinámico en él q~~ iffi ~&nero
Nash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at»"
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jéné
es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
yen un equilibrio de Nash en cada uno de estos subjuegos ... Como los
mixtas. El argumento procede por: construcción, utilizando un procedi-
subjuegos no son más que problemas de decisión unipersonales, se trata
miento parecido a la inducción hacia atrás, y está basad~. en dos o~stTrva-
de exigir que la decisión del jugador 2 sea óptima en cada subjuego, que
ciones. Primero, aunque presentamos el teorema de Nash en el contexto
es exactamente el problema que la función de mejor respuesta, R2(al),
de juegos estáticos con información completa, éste se extiend~ a'todo
juego finito en forma normal con informaciÓn complef~, y hemos visto
(donde un subjuego es un subjuego menor si na contiene más subjuegos). Sustituyamos
que estos juegos pueden ser estáticos o dinámicos. En segundo lugar, un entonces cada t¡no de estos ~up¡I.l~¡;'?~,!??rl~~ g~~S~!ls.de. uno d~7~ equilibrios de Nash. i"
juego dinámico finito con información completa tiene llÍl nÓínerq)lnito Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales en .'
~.'. '
de subjuegos, cada uno de los cuales cumple las hipótesisdelte~r~riía dé una versión truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores de
Nash.20 . -. - '. este juego truncado que contengan estas nadas' ~e~es Y: sustituyamos cada uno de estos
subjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta forma
:~
hacia atrás a lo largo del árbol, s<;9~tje,'!t¡ur ~qUlli~~o ~e Nash perfecto en sub¡uegos,porque
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos primero las estrategias de los jugadores con~tit;uY~)l, uneqllilibno de Nash (de hecho, un eqUlhbno de
t"dos los subjuegos menores que contienen nodos terminales en el árbol del. juego original Nash perfecto en subjuegosl en cada subjuego.- .
'<.;'
JlIegos di17ál17icos C017 i17forl17aeió17 completa pero imf,,:rfeela /127
126 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
terminal, mientras que el equilibrio también especifica la trayectoria en es equivalente a forzar al jugador a considerar una posible con~ngencia
negrita adicional que emana del nodo de decisión del jugador 2 que sigue a en la que le correspondería jugar, ya que si en el transcurso del Juego se
la decisión 1del jugador 1. Es decir, el equilibrio especifica una estrategia llega a ese conjunto de información, el jugador no sabe si se ha ~~~ado ~
completa del jugador 2. ese nodo de decisión o no, precisamente porque el nodo de deClslOnesta
contenido eh un conjunto de información con más de un elemento.
Pero, ¿qué pasa con el otro equilibrio de Nash, (/(D',D'»? En este
equilibrio, la estrategia del jugador 2 es jugar D' no sólo si el jugador 1 Una forma de tratar él problema de los conjuntos de información co~
escoge I (como también ocurría en el primer equilibrio) sino también si el más de un elemento cuando se utiliza inducción hacia atrás, es proce'-
der hacia atrás a lo largo de la forma extensiva hasta que se encuentre ::.:',,,
jugador 1 escoge D. Dado que D' (si sigue a D) conduce a una ganancia
de Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte del un conjunto de información con más de un elemento, pero saltándoselo
Jugador 2 es jugar I, consiguiendo con ello una ganancia de 1 (después de y siguiendo haóh arriba"en el árbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.
que el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguaje formación con unúniw elemento. Uegados ahíhabra que consIdera::'.
vago pero sugerente, podría decirse que el jugador 2 está amenazando no sólo lo que el jugador al que le corresponde jugar ené~ecónjUrit'ó"
con jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tiene de información con unúnicQ elemento haría'si sealCanzase:ésé itodó"de
la ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja una decisión, sino también la acción que tomaría el í~ga:dár al que le'córres~
acclOn. SI la tuviera, estaría incluida en la forma extensiva.) Si esta ame- ponde jugar en cada ~o de los conjuntos de informacióIl.c'o~.'~~~~e.~
naza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad de elemento que se han saltadO. "En térininospoco foIirlálés, este procedi~
llevar a cabo su amenaza. Sin embargo, la amenaza no debería funcionar miento proporciona un ~qiiilibrio de NashI'erféctd'en~subjuego~::}:J-:iíá
ya que no es creíble: si al jugador 2 se le diera la oportunidad de llevarl~ segunda manera de tratar el problema 'es proceder' haCi~atrás:<¡Íiló"Ya:rIfó
a cabo (es decir, si el jugador 1 jugara D), 2 decidiría jugar I' antes que D'. de la forma extensiva hasta 'encontrar un conjÜrito'dé-infomúiéioIi:'con ','.'
De un modo más formal, el equilibrio de Nash U,(D',D'» no es perfecto más de un elemento; Forzar entcmces al jugador'alqüe're"corrésp6fiCI~
(: '
en su.bjuegos, porque las estrategias de los jugadores no constituyen un jugar en ese conjunto' de illforma'cióna considerarlo qiieha'riiaellegarsi~
a ese conjunto de inforinádón:(Hacer esto requiere que eljugadot.tengá: .;:'
eqUlhbno de Nash en uno de los subjuegos. En particular, la elección de
D' por parte del jugador 2 no es óptima en el subjuego'que empieza (y una valoración probabilisticá'con reSpecto a:que'nodoseha;lle'g~d~e~:el
acaba) en el nodo de decisión del jugador 2 que sigue a la decisión D del conjunto de información.,Tal~ valoración dependerá Il.a~~eri~é~é,rá~
jugador 1. posibles decisiones de lo~ jugadores 'queestán pór~Círiia'~J:l!.:ékªf:tt~Y.,';g~'~
forma que una pasada de abajo arriba a.la lárgo deláTbol1ÍtiliZáhá:(l~st~:é.; " ,•....
En un juego con información completa y perfecta, la inducción hacia
método no puede proporcionar una solución-),~n.t~os'inf()iin~~I
atr~s elimina las amenazas que no son creíbles. I?ado que cada conjunto ,,'" -,
este procedimiento proporciona un equilibrio bayesiano perfedo.{véáse
de mformación contiene un único elemento, cada nodo de decisión del
árbol representa una contingencia posible en la que podría corresponderle capítulo 4).
actuar a un jugador. El proceso de moverse hacia atrás a lo largo de la
forma extensiva, nodo a nodo, se concreta por tanto en forzar a cada
2.5 Lecturas adicionales
jugador a considerar llevar a cabo todas y cada una de las amenazas que
.•..-•.,
el Jugador pudiera hacer. En un juego con información imperfecta, sin
Sección 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
embargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenal
tación sindical, véase ~ m~d~k, de negociación repetida en.Espinosa y
men~s ~n conjunto de información con más de un elem'ento. Aquí se
Rhee (1989; ejercicio 2,lO}y un'modelo de tina única negociación en el que
podna mtentar el mismo enfoque: proceder hacia atrás a lo largo de la
las empresas pueden escoger negociar sobre salarios y empleo o sólo sobre
forma extensiva y alcanzar eventualmente un nodo de decisión contenido
salarios, en Staiger (199¡), Sobre la negociación sucesiva, véase un modelo
en un conjunto de información con más de un elemento. Pero forzar al
al estilo de Rubinstein de negóciación entre una empresa y un sindicato en
jugador a considerar lo que haría si se llegase a ese nodo de decisión no
Ejercicios / 131
130 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)
2.6 Ejercicios
recibe ganancia alguna antes de que el proyecto se haya podido terminar. otro difícil (D), y que la preparación es útil en los dos empleos, pero más
El coste que queda hasta que el proyecto se complete es R. Ninguno de . en el difícil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
los socios puede comprometerse a hacer aportaciones futuras de cara a produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
completar el proyecto, de forma que deciden establecer el siguiente juego preparación de j (~ O o S). Supongamos que la empresa puede compro-
de dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de cara meterse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
a completar el proyecto. Si esta contribución es suficiente para completar ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
el proyecto, el juego se acaba y cada socio recibe V. Si esta contribución no del trabajador, que normalizamos a cero.
es suficiente para completar el proyecto (es decir, Cl < R), en el periodo El desarrollo temporal del juego es el siguiente: En el momento O la
2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto. empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~-
Si la suma (sin descontar) de las dos contribuciones es suficiente para mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
completar el proyecto, el juego acaba y cada socio recibe V. Si la suma el nivel de preparación S a un coste C. (Ignoramos laproducción'y los
es insuficiente para completar el juego, éste termina y ningún socio recibe salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
nada. aún la preparación, lo eficiente es que se le asigne el trabajo E.) Suponga-
Cada socio debe obtener el dinero con el que contribuye a financiar mos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
el proyecto de otras actividades lucrativas. La forma óptima de hacerlo la preparación. En el momento 2 la empresa observa si el trabajador ha
es sacar primero dinero de las alternativas menos rentables. El coste (de adquirido o no la preparación y decide entonces si concederle el ascenso
oportunidad) que resulta de una contribución es, por tanto, convexo con al trabajo D o no durante el segundo (y último) periodo de empleo qel
respecto al tamaño de la contribución. Supongamos que el coste de una trabajador.. "".':-
contribución e es e2para cada socio. Supongamos que el socio 1 descuenta Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
los beneficios del segundo periodo de acuerdo con el factor de descuento donde el trabajador realiza el trabajo 'i y tiene un nivel de preparación j.
5. Calcúlese el único resultado por inducción hacia atrás de este juego La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
de contribuciones de dos periodos para cada trío de parámetros (V,R,5); es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
véase el caso con horizonte infinito en Admati y Perry (1991). primer periodo. Hállese el resultado por inducción hacia atrás, Véase un
modelo más complejo en Prendergast (1992).
2.5 Supongamos que una empresa quiere que un trabajador adquiera !.:::' .
0'- .~.
la preparación necesaria para desarrollar una determinada tarea, pero 2.6 Tres oligopolistas operan en un mercado con una demanda inversa
dicha tarea eS tan inconcreta que ningún tribunal podría verificar si el dada por P(Q) = a - Q, donde Q = ql + q2 + q3 Y qj es la cantidad producida:.
trabajador ha adquirido o no la preparación necesaria. (Por ejemplo, por la empresa j. Cada empresa tiene un coste margipal de producción
la empresa podría pedir al trabajador que se familiarizase con "nuestra constante, e, sin costes fijos. Las empresas escogen sus cantidades de la
forma de h¡lCerlas cosas", o se hiciera un experto en "este nuevo mercado siguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3
en el que podríamos entrar".) La empresa,. por tanto, no puede firmar observanql y escogen entonces simultáneamente q2 y q3 respectivamente.
un contrato para reembolsar al trabajador el coste de esta preparación: ¿Cuál es el resultado perfecto en subjuegos?
incluso si el trabajador adquiere esta preparación, la empresa puede decir
que el trabajador no lo ha hecho, y ningún tribunal podría decidir quién 2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerza
tiene razón. Del mismo modo, el trabajador no puede firmar un contrato de trabajo de todas las empresas de un oligopolio, comO el. Sindicato
para adquirir esta preparación si se le ha pagado por adelantado. .Unido de Trabajadores del Automóvil en el caso de la General Motors,
La empresa podría utilizar, como incentivo para que el trabajador Ford, Chrysler y otras. Sea la sucesión temporal de las jugadas análog~ al
adquiera la preparación, promesas (creíbles) de ascenso de la siguiente modelo de la sección 2.1.C: (1) el sindicato realiza una demanda salanal,
forma. Supongamos que hay dos trabajos en la empresa, uno fácil (E) y "", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las
¡
ti:! I
134 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2) Eje,.cici()~ / 135
ganancias del sindicato escogen simultáneamente los niveles de empleo, resultado perfecto en subjuegos. Demuéstrese que los salarios, nivel de
.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa empleo y beneficios (y, por tanto, también la utilidad del sindicalo y el
es el salario que los miembros del sindicato podrían ganar en un empleo excedente del consumidor) aumentan cuando los aranceles desapilrecen.
alternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas, Véase otros ejemplos en la misma línea, en Huizinga (1989).
y los beneficios de la empresa i son i(w,Lí). A continuación se describen
. losdeterminantes de los beneficios de dicha empresa: todas las empresas 2.10 El juego de decisión simultánea que a continuación se describe se
..tienen la siguiente función de producción: el nivel de producción es igual juega dos veces, habiéndose observado el resultado de la primera etapa
al nivel de empleo; qí = Lí. El precio de equilibrio es P(Q) = Q, - Q antes de que empiece la segunda. No hay descuento. La variable T
cuando la cantidad agregada en el mercado es Q = q] + ... ' + qn. Para no es mayor que 4, de forma que (4, 4) no es una ganancia de equilibrio
complicar las cosas, supongamos que las empresas no tienen más costes del juego jugado una sola vez. ¿Para qué valores de x es la siguiente
que los salariales. ¿Cuál es el resultado petfeéto en subjuegos de este estrategia (jugada por ambos jugadores) un equilibrio de Nash perfecto
juego? ¿Cómo (y por qué) afecta el mimero de empresas a la utilidad del ensubjuegos?
sindicato en el resultado perfectb ..en subjuegos?
Jugar Qí en la primera etapa. Si el resultado de la primera etapa es
(Ql,Q2), jugar Pí en la segunda etapa. Si el resultado de la primera
2.8 Modifiquemos el modelo de torneos dé la sección 2.2.D de forma
.que la producción del trabajadori sea Yí == eí -'- (1/2)8j +Eí, donde Sj 2': ° etapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si el
resultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si en
representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo la segunda etapa. Si el resultado de la primera etapa es (y,z)donde
(productivo y destructivo) del jugador i es g(eí) + g(8í), como en Lazear
y =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.
(1989). Demúéstrese que elpremio óptimo WA -W13 es menor que cuando
no hay posibilidad de sabotaje (como en el texto).
2.12 ¿Qué es una estrategia en un juego repetido? ¿Qué es un subjuego en producción de monopolio, ¿cuál es el equilibrio de Nash perfecto en sub-
un juego repetido? ¿Qu¿ es un equilibrio de Nash perfecto en subjuegos? juegos simétrico más rentable al que puede llegarse utilizando estrategias
del disparador?
2.13 Recuérdese el modelo de duopolio de Bertrand estático (con pro-
j'.'
duetos homogéneos) del ejercicio 1.7: las empresas fijan los precios si- 2.16 En el modelo de salarios y nivel de empleo analizado en la sección
multáneamente; la demanda del producto de la empresa i es a - Pi si 2.1.C, el resultado por inducción hacia atrás no es socialmente eficiente.
Pi < Pj, es Osi Pi > Pj y es (a - p¡)/2 si Pi = Pj; los costes marginales son En la práctica, sin embargo, una empresa y un sindicato negocian hoy los
e < a:-Considérese el juego repetido infinitamente basado en este juego términos de un contrato por tres años, renegocian al cabo de tres años
de etapa. Demuéstrese que las empresas pueden utilizar estrategias del los términos de un segundo contrato y así sucesivamente. Por tanto, esta
disparador (que significan jugar para siempre el equilibrio de Nash del . relación se puede caracterizar con más o menos exactitud como un juego
juego de etapa después de cualquier desviación) para mantener--~lnivel repetido, como en Espinosa y Rhee (989)..,-'-"
de precios de monopolio de un equilibrio de Nashperfecto en subjuegos' En este problem~ se denvan condiciones bajo las cuales un eqUilibrio
si ys~lo si O ~ 1/2.' _ de Nash perfecto en subjUegos dél juego repetido infinitamente es superior:
en el, sentido de Paretoal resultado por inducción hacia atrás del juego
2.14 Supongamos que léldemanda fluctúa de formélaleatoria en el juego jugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidad
de Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada del sindicato y los beneficios de la empresa en el resultado por inducción
.periodo, el punto de interacción de la fu~ciónde dema;nda con el eje de hacia atrás del juego jugado una sola vez. Consideremos un par utilidad"-, ,
abcisas es aA. con probabilidad 'Ir.y aB « aA) co~ probabilidad 1 -::'Ir; las beneficio alternativo (U,'Ir) asociado con un par salariá-empleo alteíriatlvó :
demandas en los diferentes perlados son indep~nciientes. Supongamos (w,L). Supongamos que ambas partes tienen elmisinofador de descu~ií.to:
que en cada periodo el nivel de demanda es revelado a ambas empresas O (para cada periodo de tres años). Derívense condiciones sobre (w,L)
antes de que éstas escojan los precios de ese periodo. ¿Cuáles son los tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)
niveles de precios de monopolio (P.4 y PB) para los dos niveles de de- sea el resultado de un equilibrio de Nash perfecto en subjuegos del juego
manda? Calcúlese 0*, el fi1enor valorde 8 tal que las empresas pueden repetido infinitamente, donde se juega (U* ,'Ir*) para siempre después de
utilizar estrategias del disparador para mantener estos niveles de precios cualquier desviación. '.- -~
de monopolio (es decir, jugar Pi cuando la demanda es aú para i = A,E) '':'''. ":/."
en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de O 2.17 Consideremos el siguiente juego con horizonte infinIto entre una
entre 1í2 y 0* hállese el precio máximo p(o) tal que las empresas puedan única empresa y una sucesión de trabajadores, cada uno de los cuales vive
utilizar estrategias del disparador para mantener el precio p(o) cuando la durante un periodo del juego. En cada periodo, el trabajador decide. sí
demanda es alta y el precio P B cuando la demanda es baja en lln equilibrio esforzarse y producir por tanto a un nivel y con un coste por elesfuerzo
de Nash perfecto en subjuegos. (Véase Rotemburg y Saloner 1986.) de c, o no esforzarse, no producir nada y no incurrir en ningún coste. Lo
que se produzca es propiedad de la empresa, peto ésta puede compartirlo
2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. La con el trabajador pagándole un salario como se describe a continuación:
demanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,.. supongamos que al principio del periodo el trabajador dispone de una
Consideremos el juego repetido infinitamente basado en este juego de oportunidad alternativa con un valor de cero (neto del coste por el es-
etapa. ¿Cuál es el valor menor de -O tal que las empresas pueden utilizar fuerzo) y que no se puede obligar al trabajador a aceptar un salario por
estrategias del disparador para mantener el nivel de producción de mo- debajo de cero. Supongamos también que y > c de forma que esforzarse
nopolio en un equilibrio de Nash perfecto en subjuegos? ¿Cómo varía la es eficiente.
respuesta al cambiar -n? ¿Por qué? Si (j es demasiado pequeño para que Dentro de cada periodo, el desarrollo temporal es el siguiente: pri-
las empresas utilicen estrategias del disparador para mantener el nivel de mero el trabajador escoge un nivel de esfuerzo, a continuación tanto la (;::-:-'
:~
138 / JUEGOS OlNÁMICOS CON INFORMACIÓN COMPLETA (c. 2) Refrrencias /\39
empresa corno el trabajador observan el nivel de producción y finalmente de Nash en estrategias puras? ¿Cuál es el resultado por inducción hacia
la empresa escoge un salario para pagar al trabajador. Supongamos que , 7 'Cuál es el equilibrio deNash perfecto en subJuegos?
atraso ¿
no existe manera de hacer cumplIr los contratos salariales: no hay nin-
guna restricción sobre la elección del salario por parte de la empresa. 2.22Proporciónense las representaciones en for~~ae;xtensiva y,nonnal del
En el juego de un periodo, sin embargo, perfección en subjuegos implica . d 1 pánico bancario discutido en la seCCIOn2.2.B. ¿Cuales son Jos
que la empresa ofrecerá un salario de cero produzca lo que produzca e! Juego e .. 7
equilibrios de Nash perfectos en subjuegos en estrategIas puras.
trabajador, de forma que el trabajador no se esforzará.
Consideremos ahora el problema con horizonte infinito. Recordemos
2.23Un comprador y un vendedor desearían realizar un intercambio. An-
que cada trabajador vive sólo por un periodo. Supongamos, sin embargo,
tes de hacerlo, el comprador puede efectuar una inversión que aumenta
que al principio del periodo t, la historia del juego hasta el periodo t - 1 es
el valor que asigna al objeto a intercanlbiar. Esta inversión no pued: ser
conocida por el trabajador que trabajará eh el periodo t. (Pensemos como'
observada por el comprador y no afecta el valor que el vendedor aSIgna
si esta información.setransrnitiese de generación a generación entre los
al objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.
trabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdo
empresa que compra otra. En algún momento antes de la [uslon, el com-
con el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:
prador podría haber actuado en el sentido de cambiar los productos que
la empresa y de cada trabajador en un equilibrio perfecto en subjuegos
su empresa planea introducir en el mercado de forma que se complemen~
del juego cOllhorizonte infinito en las que en equilibrio cada trabajador
ten después de la fusión con los productos de la ~mpr~sa comprada. SI
se esfuerza y produce por tanto a un niyely, siempre y cuando el factor
el desarrollo de un producto lleva tiempo y el CIclovItal del producto
de descuento sea lo suficientemente alto. Dése una condición necesaria y
es corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~o
suficiente para ,que su equilibrio exista.
esta inversión después de la fusión.) Para el comprador el valor IIllClal
del objeto es v > O; una inversión de 1 aumenta est~ v~lor a '/)+ 1, ?ero
2.18 ¿Qué es una estrategia (en un juego arbitrario)? ¿Qué es un conjunto cuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmer
de información? ¿Qué es unsubjuego (eh un juego arbitrario)?
lugar, el comprador escoge un nivel de inversión 1e incurre en el cosle
12, En segundo lugar, el comprador no observa 1pero ofrece vender el
2.19En la versión de tres periodos del modelo de la negociación de Rubins- objeto por un precio p. En tercer lugar, el comprador a~epta o rechaza la
tein analizada en la sección 2.1.D, calculamos el resultado por inducción oferta del vendedor: si el comprador acepta, la ganancIa del comprador
hacia atrás. ¿Cuál es el equilibrio de Nash perfecto en subjuegos? es v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, é~tas
ganancias son _12 y cero respectivamente. Demuéstrese que .no eXIste
2.20 Consideremos las siguientes estrategias.en la versión de horizonte ningún equilibrio de Nash perfecto en subjuegos con estrate?las puras
infinito del modelo de la negociación de Rubinstein. (Recordemos la en este juego. Calcúlese el equilibrio de Nash perfecto en SUbJ1,legos. con
convención notacional de que la oferta (s,1 - s) significa que 'el jugador 1 estrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna
obtendrá s y el jugador 2 obtendrá 1 - s, independientemente de quien . probabilidad positiva a dos niveles de inversión y la e~trategla mIxta del
haga la oferta.) Sea s. = 1/(1 + ó). El jugador 1 siempre ofrece (s" ,1 - s.) vendedor sólo asigna probabilidad positiva a dos precIOS.
y acepta una oferta (s,l - s) sólo si s ~ ós •. El jugador 2 siempre ofrece
(1 - s. ,s*) y acepta una oferta (.s,l - s) sólo si 1 - s ~ 5s.: Demuéstrese
que estas estrategias son un equilibrio de Nash. Demuéstrese que este
equilibrio es perfecto en subjuegos.
2.7 Referencias
2.21 Proporciónense las representaciones en forma extensiva y normal del ABREU, D. 1986. "Extremal Equilibria of Oligopolistic Supergames." JOlll'1wl
juego de la granada descrito en la sección 2.1. ¿Cuáles son los equilibrios of Economic Theory 39:191-225.
".Ij
"'",'
140/ JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)
Referencias / 141
-. 1988. "On the Theory of lnfinitely Repeated Carnes with Discounting." FRIEDMAN, J. 1971. "A Non-cooperative Equilibrium for Supergames."
Ecollometrica 56:383-96.
Review o/ Economic Studies 38:1-12.
ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal Cartel Equilipria
FUDENBERG,D., Y E. MASKIN. 1986. 'The Folk Theorem in Repeated Carnes
with Imperfect Monitoring." ¡oumal o/ Economic Theonj 39:251-69.
with Discounting and Incomplete Inforrnation." Econometrica 54:533c54.
ADMATI, A., Y M. PERRY. 1991. "JointProjects without Commitment."
CREEN, E., YR. PORTER. 1984. "Noncooperative Collusion Under Irnperfect
Review o/ Economic 5tudies 58:259-76.
Pricelnformation," Econometrica 52:87-100.
AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the Labor 1;;
. ~,.
HUIZINGA, H. 1989. "Union Wage Bargaining and Industry Structure."
Market. Cambridge, Inglaterra: Cambridge University Press.
Stanford University, Mirneo.
BALL, L. 1990. "Tirne-Consistent Policyand Persistent Changes in In-
Hation." National Bureau of Econornic R.esearch Working Paper #3529 JACKLIN, c., y S. BHATTACHARYA. 1988. "DistinguishingPanics and In':
(Decernber). - formation~based Bank Runs: yYelfare and Policy Implications." ¡oumal of .
Political Economy 96:568~92.
BARRO, E., Y D. CORDON. 1983. "Rules, Discretion, and Reputation in a
Model of Monetary.Policy." ¡oumal of Monetanj Economics 12:101-21. KREPS, D. 1990. A Course in Microeconomie Theory. Princeton, NJ: Princeton
University Press.
BECKER, G. 1974. "A Theory of Social Interactions." ¡oumal of Political
Economy 82:1063-93. KREPS, D., Y R. WILSON. 1982. "Sequential Equilibrium:." Eeonometne~
. .' ~; :L'.iC,;
50:863-94.. .:/
BENOIT, J-P., y V Krishna. 1985. "Finitely Repeated Carnes." Econometrica
53:905-22. LAZEAR, E. i989. "Pay Equality and Industrial Politics." ¡oumal of Politieal
Eeonomy 97:561-80.
-. 1989. "Renegotiation in Finitely Repeated Carnes." Harvard Business
School Working Paper #89-004. . LAZEAR, E., Y S. ROSEN. 1981. "Rank-Order Tournarnents as Optimum:
Labor Contracts." ¡oumal of Politieal Eeonomy 89:841-64.
BUCHANAN, J. 1975. "The Sarnaritan'sDilernrna." In Altruism, Morality,
and Economic Theonj, E. Phelps, ed. New York: Russell Sage Foundation. LEONTIEF, W. 1946. "The Pure Theory of the Cuaranteed Annual Wage
Contract." ¡oumal of Political Eeonomy 54:76-79.
BULOW, J., y K. ROGOFF. 1989. "Sovereign Debt: Is to Forgive to Forget?"
American Economic Review 79:43- 50.
McMn:.LAN, J. 1986. Carne Theory in International Economies. ChUT, Suiza:
D[AMOND, D., Y P. DYBVIG. 1983. "Bank Runs, Deposit Insurance, and Harwood Acadernic Publishers.
Liquidity." ¡oumal of Political Economy 91:401~19.
OsBORNE, M., Y A. RUBINSTEIN. 1990. Bargaining and Markets. San Diego:
ESPJNOSA, M., y C. RHEE. 1989. "Efficient Wage Bargaining as a Repeated Acadernic Press.
Came." Quarterly ¡oumal o/ Economics104:565-88.
PRENDERGAST, e 1992. "The Role of Prornotíon in Inducing Specific Hu-
FARRELL,J., y E. MAsKIN. 1989. "Renegotiation in Repeated Carnes." Carnes man Capital Acquisition." De próxima aparición en Quarterly ¡oumal o/
¡¡lid t'conomic Behavior 1:327-60. Eeonomies.
FERNÁNDEZ, R., Y J. CLAZER. 1991. "Striking for a Bargain Between Two ROSEN, 5.1986. "Prizes and Incentives in Elimination Tournaments.'~ Ame-
Completely Informed Agents." American Economic Review 81:240-52. rican Economie Review 76:701-15.
142 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)
..
, ,'
,~:;
.~ ~i~TEN,R. 1965. "S~i~~~he~retis.che. Behandlung eines Oligopolmodells
24. Nachfragetraghelt. Zeltslzcrift für Gesamte Staatswissenschaft 121:301-
Con este capítulo comienza nuestro estudio de los juegos con ill!0r1110ÓÓIl
SHA~~D,.A., ~ J. SurrON. 1984. "Involuntary Unemployment as a Perfect incompleta, también llamados juegos bayesianos .. Recordemos que en un
Equzh?numm ~ Bargaining Model." Econometrica 52:1351-64. juego con infoIDlación completa las funciones de ganancias de. los juga~
dores son información del dominio público. Por el contrario, en un juego
S~IRO,C., yJ.'STIGLITZ.1984. "Equilibrium Unemployrnent as a D' '-
con información incompleta, al menos un jugador no está'seguro de la
plme Device." American Economic Review 74:433-44. ISCl
función de ganancias de otro jugador. Un ejemplo común de un juego
7 L y J. T~HASHI. 1983. "A MultistageModel
SOB _L, of Bargainin ." estático con información incompleta es una subasta de sobre cerrado:
Remew of Economlc Studies 50:411-26. g cada participante conoce su propia valoración del bien subastado, pero no
conoce las valoraciones de los otros participantes, y las pujas se entreg¡m
H. VON. 1934.. Marktform und Gleú:hgewicht.
STA~:I<ELBERG, Viena: Julius
en sobres cerrados, por lo que las decisiones de los jugadores pueden con-
Spnnger.
siderarse simultáneas. Sin embargo, la mayoría de los juegos bayesianos
STAIGER~D. 1991. "Why Do Union Contracts Exclude Employment?" Stan- con interés económico son dinámicos. Como veremos en el capítuJo,4,
ford Uruversity, Mimeo. la existencia de información privada conduce de forma natural a que las
partes informadas intenten comunicar (o a confundirlos), y que las par-
TIROLE,J. 1988. The Theory o/ Industrial Organization. C
Press. ambridge: MIT tes no informadas intenten conseguir información. Estas cuestiones son
intrínsecamente
.
dinámicas. '
En la sección 3.1, definimos la representación en forma normal de
un juego bayesiano estático y el equ.i1ib'nóbayesiano de Nash en dicil~
juego. Puesto que estas definiciones son abstractas y algo complejas,
introduciremos las ideas principales con un ejemplo sencillo, el de l~
.{,;',
competencia a la Cournot bajo información asimétrica.
En la sección 3.2 consideramos tres aplicaciones. En priiller lugar,
ofrecemos una discusión formal de la interpretación de las estrategias
mixtas dada en el capítulo 1: la estrategia mixta del jugador .i representa
la incertidumbre del jugador i con respecto a la estrategia pura que eligirá
j, y la elección de j depende de una cierta información privada. En
segundo lugar, analizamos una suba sta "de sobre cerrado en la que las
valoraciones de los participantes son información privada, mientras que
la valoración del vendedor es conocida. Finalmente, consideramos el
caso en el que un comprador y un vendedor tienen, cada UIlO de ellos,
información privada sobre sus valoraciones (como cuando una empresa
14.1/ JUEGOS EST..\TICOS CON INFOR,"IACláN INCOMPLETA (e. 3)
Teorla: ¡llegas bayesianos estáticos y equilibrio bayesimlO de Nash / 145
conoce el producto marginal de un trabajador y el trabajador conoce las
De modo similar, si el coste de la empresa 2 es bajo, q';(cB) será la solución
oporl1midades alternativas de que dispone). Analizamos un juego de
de
intercambio llamado subasta doble: el vendedor anuncia un precio de
venta y el comprador anuncia simultáneamente un precio de compra;
el intercambio tiene lugar al precio medio si el último es mayor que el
max[(a - qi - q2) - cBlq2'
q2
primero.
Finalmente, la empresa 1 sabe que el coste de la empresa 2 es alto con
En la sección 3.3 enunciamos y demostramos el Principio de revelación, probabilidad B y debería prever que la cantidad elegida por la empresa 2
e indicamos brevemente cómo puede aplicarse al diseño de juegos cuando será qi(CA) o qi(CB), dependiendo del coste de esta empresa. Por taJ;lto,la
los jugadores tienen información privada. empresa 1 elige qi que resuelve
3.1 Teoría: Juegos bayesianos estáticos y equilibrio bayesiano maxB [(a -, ql - qi(cA») ~ 'cJ ql + (l - B) [(a -ql - qi(CB») - c] ql
de Nash q¡
son
y la empresa 2 sabe que la empresa 110 sabe, y así sucesivamente. si los costes de las empresásson lo'suficientemente diferentes entre sí, la
(
Naturalmente, la empresa 2 querrá elegir una cantidad diferente (y empresa con el coste alto no produce nada en-equilibÍio. Corno ejeicíoo, "-'.-
presumiblemente menor) si su coste marginal es alto que si es bajo. Por hállese una condición suficiente para excluir aquí problemas análogos.)
su parte, la empresa 1 debería prever que la empresa 2 puede ajustar Las soluciones a las tres condiciones de primer orden son
su cantidad al coste de la manera indicada. Sean qi(CA) y qi(CB) las
cantidades elegidas en función de sus costes, y sea qi la cantidad elegida
por la empresa 1. Si el coste de la empresa 2 es alto, ésta elegirá qi(cA) tal
que sea una solución de
y
max[(a
q2
- qi - q2) - cAlq2- a - 2c +BCA + (l - B)cB
qi =- 3
.
Teoria: Juegos bayesw,lO s estlÍticos y eqllilib,'io bayesiallo de Nosl, ! 147
146/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)
la introducción ficticia del azar en (1) y (2), hemos descrito un juego con Además, los otros jugadores pueden calcular las distintas conjeturas que
información incompleta como un juego con información imperfecta, donde podría, formarse el jugador -i, dependiendo del tipo de i, concretame,nte
'1 Imaginemos que dos empresas están compitiendo por desarrollar una nueva'tecnologia.
2 La regla de Bayes es una fórmula para calcular P(AiB), la probablIidad (condidomida)
La posibilidad de éxito de cada empresa depende en parte de la dificultad en desarrollar la '
de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,El
tecnología, dificultad que es desconocida, Cada empresa sólo sabe si lo ha logrado o no, pero
las prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podido
no si la otra Jo ha conseguido. Sin embargo, si la empresa 1 ha tenido éxito; es más probable
ocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. La
que la tecnologia sea fádl de desarrollar y, por ello, también más probable que la' empresa 2
regla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicional
la haya desarrollado. Por lo tanto, la conjetura de la empresa 1 sobre el tipo de la empresa 2
d", que se dé /1es igual a la probabilidad de que se den tanto A como B, dividida por. la
depende del conocimiento por parte de la empresa 1 de su propio tipo.
pr~babilida'd a pri9ri de que ocurra B.
Teoria: Juegos bayesimws estáticos y eq¡lÍlibrio bayesúllIo de Nasl¡ / 151
150/ JUEGOS ESTt\TICOS CON INFORMACiÓN INCOMPLETA (c. 3)
tipos.
hará el jugador 'i para cada ti en Ti. Por 10 tanto, para decidir qué hacer
una v~i que un tipo ha sido elegido, el jugador i tendrá que pensar qué
3.1.C Definición del equilibrio bayesiano deNash
habría hecho vara cada otro tipo de Ti que podría haber sido elegido.
Consideremos, por ejemplo, el juego de Coumot con información
Ahora queremos definir el concepto de equilibrio de los juegos bayesiano~,
asimétrica de la sección 3.1.A. Argumentamos allí que la solución del juego
estáticos. Para ello, necesitarí1osd~finir primero los espacios de estrategias,
tonsiSté enlaelección de tres cantidades: qi(CA), qi(cs) y qj .En términos
de los jugadores en dicho juegó.~Retordemos de las setciones2.3.By:'
dél;:¡ defiJ:lidÓnde estrategia q~e acabani.ós de dar;ét'par (q~(cA),qi(cB»
2AB qtle la estrategia de unjtigadot'esun pÍartde acción completo, que; 1
esla estrategia de la empresa 2 y qj es la estrategia dedá,'empresa 1. Es
establece una accióh factible para cadá contihgenciaenla que el jugadót ¡".'~
fácilimagihar que la empresa2 elegirá dif~rentes c~tidaél~s' dependietlqÓ
podría tener que actuar: Dada la sécuencia temporal del juego estático ,¡
de su coste. Sin embargo, es igualmel1te importante darse c~enta de qDe
, ~ayesiáno<en ehual el azar comienza el juego eligiendo los tipos ¥~
los>':
li elecdón de la cantidad de la emp~és~í debería tener en cuenta quej~
Jugadores, una estrategi'a (pura)deljugadór i debe establecer una acci6i{ ,
. cantidad de la empresa 2 dependerá "üel coste de la empresa 2. PoP 16
posible para cadáunO de los tipos posibles del jugador i. ", i.
tanto, si nuestro concepto de equilibrio es requerir que la estrategiá"J~
-.-"{' ..~: . ,t '~' .. ,' .' :~' -
la empresa 1 sea tma mejor respuesta a la estrategia de la empresa;2;.Ia
DefinidÓri:Enet¡'uegobayesÍlm.iJestáticoG=={AI,:.A'TI
_ . , nI
I ' .. "' T 'PI
nI .".,'
1°."/
estrategia de la empresa 2 debe ser un par de cantidéldes, una para ca9a
P":; Ul~' .. ,U,;}, una'estrategia del jugador i es una funciÓn Si(t;) donde, para posible coste tipo, o si no, la empresa 1 no podría calCUlarsi su estrategia
cada tipo ti en Ti, Si(ti)'determiha la acciÓn del conjunto factible Ai que el tipo ti
es efectivamente una mejor respuesta a la estrategia dela empresa 2., .
elegiría si el azar determinara que el jugador es de este tipo. De forma más general, no podríamos apJicar la noción de equilibrio de
Nash a juegos bayesianos si permitiéramos que la estrategia de un jugadf?r
Al contrario que en lós juégos (tahto estáticos como dinámicos) con nóespedficara lo que el jugador haría si algunos tipós're~ultarap. el~gi40¡;
información completa, en 'un juego bayesiano; los espacios de estrategias por el azar. Este ~rgumento es análogo .~ ~no 'delcapífUl~ 2:' 'pll'ªdk
no se dan en la representaCión 'en forma normal del juego; sino que sé haber parecido Innecesario 'exigir que laestrateiíá derjtig:ádor i el1.t[;4
construyen a partir de los espacios de tipos y acCiones. El conjunto' de juego dinámico con informaciÓn completa especlfic';;;seuna acciÓnf<lctibie
posibles estrategias (puras) del jugador i, Sir es el conjunto de toda,s las para cada contingencia en la cual el jugador i podría haber tenido qúé
funciones posibles con dominio T; y recorrido Ai. Por ejemplo, en una jugar, pero no podríamos haber aplic<ldola noción de equilibrio de Nash
estrategia de separaciÓn, cada tipo ti en Ti elige una acción diferente ai a juegos dinámicos con información completa si hubiéramos permitido
d~ Ai. Por el contrario, en una estrategia de agrupaciÓn, todos los tipos que alguna estrategia dejara sin determinar las acciones del jugador en
elIgen la misma acción. Esta distinei6h entre estrategias de separación y
alguna contingencia.
de agrupación es importante para la discusión de los juegos dinámicos con . Una vez dada la definición de estrategia en un juego bayesiano, abor-
ir;£0rmación incompleta del capítulo 4. Introducimos la distinción aquí damosahora la definición del equilibrio bayesiano de Nash, A pesar d~
solo para ayudar a describir la'grart variedad de estrategias que'pueden la.complejidad notacibrial de la definición; la idea central es simple y fa-
construirse a partir de un determinado par de espacios de tipos y acciones; miliar: la estrategia de cada jDgador debe ser una mejor respuesta a las
TiyAi. _ ",' .
estrategias de los restantes jugadores. Es decir, un equilibrio bayesiaJio,.. '
I)u,~de parecer innecesari~ exigir que la estrategia dél jugador i deter- de Nash es simplemente un equilibrio de Nash en un juego bayesiano.'¡'
mine una acción factible para eada uno de los tipos posibles del jugado~
,'.'. '
152/ JUEGOS EST..i.TICOS CON INFORMACiÓN INCOMPLETA (e 3) Aplicaciones / 153
Definición. En el juego bayesiano estático G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .
)J" ;(¿I, ... ,1¿,,} las
estrategias ,,*= (.~1',... ,"~) forman un equilibrio bayesiano Pat
de Nash (con estrategias puras) si para cada jugador i y para cada uno" de sus Ópera Boxeo
tipos ti en Ti, si (ti) es una solución de
Ópera 2,1 0,0
Chris
Boxeo 0,0 1,2
Es inmediato dem'ostrar que en un juego bayesiano estático finito (es Ahora supongamos que, aunque se conocen desde hace mucho tiempo,
decir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todos Chris y Pat no están seguros ele las ganancias del otro. En particular.' su-
conjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez con pongamos que: -la ganancia de Chris si ambos van a la óp.era es 2+te, donde
estrategias mixtas. La demostración es muy similar a la de la existencia te es información privada de Chris; la ganancia de Pat SI ambos van al bo-
de un equilibrio de Nash con estrategias mixtas en juegos finitos con xeo es 2 + tp, donde tp es información privada de Pat, y te y tp se obtienen
información completa, por lo que la omitimos. independientemente de una distribución uniforme en [O,;:¡;]. (La elec~ó~.
de una distribución uniforme en [O,x] no es importante; la idea que quere-
3.2 Aplicaciones mos recoger es que los valores te y tp sólo afectan ligeramente a las ganan-
cias en el juego original, para lo cual podernos pensar que x es pequeña.)
3.2.A Revisión de las estrategias mixtas El resto de las ganancias son las mismas. En términos del juego bayesiano
estático abstracto en forma normal G = {Ae,Ap; Te,Tp; Pe,Pp; ue,up} los es-
Como mencionamos en la sección 1.3.A, Harsanyi (1973) interpretó la pacios de acciones son Ae = Ap = {ópera, boxeo}, los espacios de tipos
estrategia mixta del jugador j como la incertidumbre deTjugador i sobre son Te = Tp = [O,x], las conjeturas son Pe(tp) = )Jp(te) = l/~.para cada t~,Y
la estrategia pura elegida 'por el jugador j y que, a su vez; la elección de j tp, Ylas ganancias son las siguientes:
depende de cierta información privada. Ahora damos"i.m\~rúlI1ciádo'más
preciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~ Pat
juego con información completa puede (casi siempre) interpretarse como Ópera Boxeo
un equilibrio bayesiano de Nash con estrategias puras en un juego muy
similar con algo de información incompleta. (No tendrem9sen cuenta los Ópera 2 + te,l 0,0
casos raros en los cuales tal interpretación no es posible.) De un modo más Chris
evocador, la característica crucial de un equilibrio de Nashcori estrategias Boxeo 0,0 1,2 + tp
mixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadór
i no sabe con certeza la elección del jugador j. Esta falta de certeza puede
provenir de algún suceso aleatorio o (más probablemente) de tin poco de La batalla de los sexos con información incompleta
información incompleta, como en el siguiente ejemplo. --
Recordemos que en la batalla de los sexos existen dos equilibrios de Vamos a construir un equilibrio bayesiano de Nash con estrategias
Nash con estrategias puras, (ópera, ópera) y (boxeo, boxeo), y uno con puras de la versión c()n i,nforrnación incompleta de la batalla de l~~ sexos
estrategias mixtas, en el que Chris elige la ópera con probabilidad 2/3 y en el cual Chris elige la ópera si te es mayor que un valor cntico e -y
Pat elige el boxeo con probabilidad 2/3. elige el boxeo en cualquier otro caso, y Pat elige el boxeo si tp es mayor. ""';
.','.
","
Aplicaciones / 155
154/ ]VEGaS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)
\.~}
1
boxeo con probabilidad (x - p)/x. Vamos a demostrar que, cuando la
información incompleta desaparece (es decir, cuando x tiende a cero), el que tiende a 2/3 cuando :¡; tiende a cero. Por lo tanto, cuando la infor-
comportamiento de los jugadores en este equilibrio bayesiano de Nash en mación incompleta desaparece, el comportamiento de los jugadores en
estrategias puras tiende a su comportamiento en el equilibrio de Nash con este equilibrio bayesiano de Nash con eslrategias puras del juego con
estrategias mixtas del juego original con información completa. Es decir, información incompleta tiende a su comportamiento en el equilibrio de
tanto (x - el/x y (x - p)/xtienden a 2/3 cuando x tiende a cero. Nash con estrategias mixtas en el juego original con información completa,
Supongamos que Chris y Pat eligen las e;trategias qu~' acabamos de
describir. Para un valor dado de x vamos a determinar los valores de c y 3.2.B Una subasta
p tales que las~str:ategiasf~rm~!} c~~qt4.l,ilJp9 J?~ye~ia,it2,.~eI::f
a,~!t,9ada
la estrategia dé Pat, las gammcias esperadas de Clilis'"á(el~gir la6pera y Consideremos la siguiente subasta de sobre cerrado al primer precio. Hay
el boxeo son' ," ! .,
.d.osparticipantes qué denóminamos i = 1,2. El participante i tiene una
-. . , v~Íorad6n Vi del bien, es decir, si i consigue el bien y paga el precio
E.(2+tc)+
j; " .
[1- E...] .0=~(2:i-.t.c.)',< :'
X" x'
p;la gaiianCia' de i'es v; ~. 'p. Las valoraciones de los dos participantes
iistáfi urtiforÍnementedistribUidas de fotina independiente en [O,1]. Las
y pujas no pUEidenséfnegativas .. Los participantes entregan sus pujas
simultáneamente. La puja más alta gana la subastay el ganador paga el
x
°
E. . + [1 '- E.] . 1 = 1 - E..'
'. x x precio de su puja, mientras que el otro participante no obtiene nada ni paga
respectivamente. Por lo tanto, elegir la óperaes óptiII1;~.
si y sólo ?i nada. En caso de empate, el ganador se determina lanzando una moneda.
Los participantes son neutrales al riesgo. Todo esto es información del
(3.2.1) dominio público.
Para formular este problema como un juego bayesiano estático, debe~
De forma similar, dada la estrategia de Chris,lasg~~ancias~spera1a,s de mas identificar los espacios de acciones, los espacios de tipos, las conje-
Pat por elegir. el boxeo y la ópera son '. ' turas y las funciones de ganancias. La acción del jugador i es entregar
una puja bi (no negativa) y su tipo es su váloraciónvi' (En términos del
C]. e e., .'
juego abstraclo G = {A1,A2;T},1'z;Pl,P2;Ul,U2}' el espacio de acciones es
[ 1-- . O+ -(2 + tp) = -(2 + tp)
x x x Ai ~ [0,00) y el espacio de tipos es Ti = [0,1].) Como las valoraciones son
y . independientes, el jugador i cree que Vj está uniformemente dislribuido
en [0,1], independientemente del 'valor de '1)i' Finalmen.te, la función de
[ ee C]
1-- .1+-.0=1--,
x x x ganancias del jugador i es
respectivamente. Parlo tanto, elegir el boxeo es óptimo si y sólo si si bi > bj,
si bi = bj,
x
tp .;::: ..- :- 3 = p. (3.2,2) si bi < bj.
e
Resolviendo (3.2.1) y (3.2.2) simultáneamente obtenemos p = e y p2 + 3p- Para obtener un equilib~io bayesiano de Nash de este juego comen-
x= O.'Reiolvlendo la ecuaCión de segundo gradase demuestra que la zarnos construyendo los espacios de estrategias de los jugadores. Recor-
probabilidad:deque Chris elija la ópera; concretamente (x ::..c)/x, y la de demos que en un juego bayesiano estático, una estrategia es una función
que Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a. que va de tipos a acciones. Por lo tanto, para el jugador i una estrategia
156/ JUEGOS ESTÁTlCOSCON INFORMACIÓN INCOMPLETA Ce. 3)
Aplicaciones / 157
es una hmción bJv¡) que determina la puja que elegiría cada uno de los 5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo caso
tipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, la bi (V¡) no es lineal, sino plana al principio y con pendiente positiva después.
estrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2) Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,
del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2» centrándonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse en
constituye un equilibrio bayesiano de Nash si, para cada V¡ en [0,1], b;(vi) equilibrio: puesto que es óptimo para un tipo más alto pujar tanto al
es una solución de
menos corno la puja óptima del tipo más bajo, tenemos que Cj 2: O, pero
entonces aj 2: 1 implicaría que bj(Vj) 2: Vj, lo que no puede ser óptimo.
1 Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'
max(v.¡- b¡) Prob{b¡ > bj(vj)} + -(v.¡ - bi) Prob{bi = bj(uj)}.
caso b;(v.¡) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.
~ 2
R9\:h~f\19s.
reRe!ir el D.1ÍSmo análisis para el jugador j suponiendo que el
Simplificamos la exposición buscando un equilibrio lineal: bl (VI) = jugac!9i'iadOpta Iaéstrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,
al + clvl y ~(V2) = a2 + C2V2. Nótese que no estarnos limitando los espacios aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultados
de estrategias delos jugadores para incluir sólo estrategias lineales, sino tenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.
que estamos permitiendo que los jugadores elijan estrategias arbitrarias dijimos antes.
y nos preguntamos si existe un equilibrio lineal. Resulté!;que, puesto que Podríamos preguntarnos si hay otros equilibrios bayesianos de Nash
las valoraciones de los jugadores están uniformemente distribuidas, no en este juego, y también cómo las pujas en equilibrio cambian cuando
sólo existe un equilibrio lineal sino que éste es único (en un sentido que la distribución de las valoraciones de los jugadores cambia. Ningunacie
precisaremos). Veremos que b;(vi) = v;/2. Es decir, cada jugador,entrega estas cuestiones puede resólverse utilG:ando la técnica que acabaiTIosdi
una puja igual a la mitad de su. valoración ... Tal puja refleja el dilema aplicar (proponer estrategias .lineales y después derivar los coeficientes
fundamental al que se enfrenta cualquier participante en una subasta de que l~s cOnvierten enequllibrio). No conduce a niI:guna part~ inte~~..
este tipo: cuanto más alta sea la puja más posibilidades tiene de ganar; taradivinar todas las formas funcionales que podrían tener otros egi1i-
cuanto niás baja sea la puja, mayor será la ganancia si gana. librios de este j~ego, y no existe equilibrio lineal para ninguna otra dis-
Supongamos que el jugador j adopta la estrategia Qj(Vj) = aj + CjVj. tribución de valoraciones. En el apéndice, derivamos un equilibrio baye-
Para un valor dado Vi la mejor respuesta del jugador i es una solución de siano simétrico}. nuevamente para el caso de valoraciones uniformemente
distribuida¡;, Suponiendo _qu~.lasestrategias de los jugadores son estric~
n¡,ax(Vi - b¡) Prob{bi > aj + CjVj}, tamentecrecientes y diferenciables, demostrarnos que el únic,?equilibi;i,~
bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que yaÍ1errÍos' deri~
donde hemos utilizado el hecho de que Prob{bi = bj(vj)} =0 (puesto que vadO. La técnica que utilizarnos puede extenderse fácilmente a una clase
bj(v;)= aj + CjVj y Vj está uniformemente distribuida; también lo está bj). más amplia.de distribuciones de las valoraciones, y también al caso de n
Puesto que no ttene sentido que el jugador .i puje por debajo de la puja participil;ntes.4
mínima del jugador j y sería tonto por parte de ipujar por encima del
máximo del jugador j, tenemos que aj ::; bi ::; aj + Cj, por lo que
Sea b-1 (bj) la valoración-que el participante j debe tener para pujar bj; esto 3.2.C Una subasta doble
es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj está uniformemente clistribuida A continuación consideramos el caso en el cual un comprador y un ven-
en [O,ll,Prob{bi > b(1jÚt= Prob{b:2-I(b»> vü= b-1(bi). La condición de dedor tienen cada uno información privada sobre sus valoraciones, como
primer orden.para la opti~zación del probletriadél jugador ies en Chatterjee y Samuelson (1983). (En Hall y Lazear [1984] el compra-
. d' dor es una empresa y el vendedor un trabajador. La empresa conoce el
-b-1(bi) + (Vi ~ bi) db. b-¡(bi) = O. producto marginal del trabajador, y el trabajador conoce sus olras opor-
'1 .; •
tunidades. Véase el ejercicio 3.8.) Analizamos un juego de intercambio
Esta condi<:ió~es unaecÍlaciÓri iJ1pIícita d~ia m~jor~~sp'uesta del jugador
llamado subasta doble. El vendedor anuncia un precio de venta p." y el
ta .la estrategIa b(.) jugada por j dádoqil~ la Véiloracióndei es Vi. Si la ..
compradorsimuItáneamente anuncia un precio de compra p". Si Pb 2: P.,
estrategia bO tiene que ser un equilibrio bayesiano de Nash simétrico, es
el intercambio tiene lugar a un precio Ji = (Pb + Ji,) /2. Si Pb < ]J, no se da
necesario que la soluc_iónala condición de primer orden seab(vi). Es decir,
el intercambio.
para cada una de las posibles valoraciones del pujador 7" éste no quiere
La valoración por parte del comprador del bien del vendedor es /JI,;
desvIarse de laestrategia bOdado que el jugador j utiliza esta est;ate~a.
la del vendedor es v.•. Estas valoraciones son información privada y se
Para imponer este requisito, sustituimos bi b(Vi) en la condición" de
obtienen independientemente de distribuciones uniformes en [O,JI. Si el
primer orden, obtenielldo
comprador obtiene el bien por el precio p, su utilidad es v" - p; si no hélY
intercambio la utilidad del comprador es cero. Si el ,:,:endedor vende el
-b-l(b(~i» +(Vi - b(Vi» d: b-1(b(Vi» = O.
i bien por el precio p, su utilidad es Ji - v.; si no hay intercambio su utilidad
Por supuesto;b-1(b(vi»)'es simplemente v;. Además, d{b-1(/j(Vi»}/dbi =
es cero. (Cada. una de estas funciones de utilidad mide el cambio en la
.'.
'.'
l/b'(vi). Es decir, d{b-1(bi)}/dbi mide cuánto debe cambiar la valoraCión utilidad de cada parte. Si no hay intercambio, no hay cambio en utilidad.
del jugador i para producü: un cambio de una unidad en lapuja, mIentras No cambiaría nada definir, digamos, la utilidad del vendedor como Ji si
que b'(Vi) mide cuánto cambia Ía puja en respuesta a un cambio de u~a hay intercambio a till precio P y v .• si no hay intercambio.)
unidad en la valoración .. Por lo tanto, bO debe satisfacer la ecuación En este juego bayesiano estático, Í1naestrategia del comprador es una
diferencial de primer orden funciónp/,(vb) que determina el precio que el comprador ofrecerá para cada
una de sus posibles valoraciones. Del mismo modo, una estrategia del
1 vendedor es una función p,(v,) que especifique el precio que el vendedor
-Vi + (Vi - b(Vi»-b'( ) = O,
. t'i pedirá para cada una de sus posibles valoraciones. Un par de estrategias
la cual~e expresa de un modo más conveniente como b' (Vi)Vi +b( Vi) = Vi. La {Pb(Vb),p,(V,)} constituye un equilibrio bayesiano de Nash si se cumplen
parte izquierda de esta ecuación diferencial es precisamente d{ b(Vi )Vi} /dVi. las dos condiciones siguientes. Para cada Vb en [O,1], Pb(Vb) es una solución
Integrando ambas partes de la ecuación obtenemos de
1 max Pb [v b - Pb+E[P,(v,)IPb>¡,,(U,)J]
2
Prob{p
.
>p
1) - S
(7) )}
S ,
(3.2.3)
b(v)v'
7. 2 1_ + k ,
t = -'Il
16Ll ! JUEGOS ESTÁTICOS CON INFOI{,'"IAClÓN INCOMPLETA (e. 3)
Aplicaciones! 161
donde E[psCuJlpb 2':f'JuJJ es el precio esperado que pedirá el vendedor, del vendedor es una mejor respuesta a la del comprador, ya que para los
condicionado a que lo que pida sea menor que el precio ]lb ofrecido por el tipos del vendedor que hacen que el intercambio se prefiera a la ausencia
cumprador. Para cada Vs en [0,1], J!s(Vs)es una solución de de intercambio éste ocurre, y viceversa. El argumento análogo demuestra
que la estrategia del comprador es una mejor respuesta a la del vendedor,
por lo que estas estrategias forman un equilibrio bayesiano de Nash. En
(3.2.4) este equilibrio el intercambio se da para los pares (Vs¡Ub) indicados en la
figura 3.2.1; el intercambio sería eficiente para todos los pares (V"Vb) tales
donde E[Pb(Vb)lpb(Vb) 2':PsJ es el precio esperado que ofrecerá el compra- que Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.
dor condicionado a que lo que ofrezca sea mayor que el precio Ps que pide Ahora derivamos un equilibrio bayesiano de Nash lineal de la subasta
el vendedor.
doble. Como en la sección anterior, no restringimos los espacios de estrate-
giasdelos jugadores de nianera que se incluyan solamenre las estrategias
Vb
lin~ales, sino que pennitimos que los jugadores elijan estrategias arbitra-
rias pero nos preguntamos si existe un equilibrio que sea lineal. Existen ,','
<:.
muchos otros equilibrios además de los equilibrios de precio único y el
equilibrio lineal, pero el equilibrio lineal tiene propiedades de eficiencia
Intercamqio interesantes que describiremos más adelante.
x Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs' ;';:
Entonces Ps está uniformemente distribuido en [as,as + cs], por lo que ....
(3.2.3) se convierte en
as + Pb}]
max [Vb - -1 {Pb + .--- Pb - as
---,
Pb 2 2 Cs
2 1
Pb = 3"Vb + 3"as. (3.2.5)
"-; .:r.,:,,,: •.,;_._~_
v, v, = v, + 0/4)
y CLb = CLs /3, y (3.2.6) implica que Cs = 2/3 Y as = (ab + Ch) /3. Por lo tanto,
las estrategias de equilibrio lineal son
V,= v,
(3.2.7) Intercambio
2 1
p,,(v.) = 3v., + "4
como muestra la figura 3.2.2.
p"p,
3/4 v,
Figura 3.2.3
El principio de revelación, debido a Myerson (1979) en el contexto de Los juegos de esta clase (es decir, los juegos estáticos bayesianos en los
los juegos bayesianos (yen otros en contextos relacionados), es Un ins~ cuales la única acción del jugador es hacer una declaración sobre su tipo)
trumento importante para diseñar juegos cuando los jugadores tienen se llaman mecanismos directos.
información privada. Puede aplicarse a los problemas de las subastas La segunda manera en la que el vendedor puede utilizar el princi- r,:
y del intercambio bilateral descritos en las dos secciones anteriores, así pio de revelación es limitando su atención a los mecanismos directos, en ".'.
como a una amplia gama de problemas. En esta sec~ión enunciamos y los cuales decir la verdad constituye un equilibrio bayesiano de Nash
demostramos. el principio de revelación para juegos bayesianos estáticos. para cada participante, es decir, a l¡¡s funciones de oferta y de proba-
(La extensión de la demostración' a juegos bayesianos dinámicos es in" bilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'", taun)}
mediata.) No obstante, antes de hacerlo, vamos a indicar cómo se utiliza tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti
el principio de revelación en los problemas de subastas y de intercambio para cada ti en n. Un mecanismo directo en el cual decir la verdad cons-
bilateral. '
tituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.
Consideremos un vendedor que quiere diseñar una subasta que ma-
Fuera del contexto del diseño de una subasta, el principio de reve-
ximice sus ingresos. Sería una ardua tarea detallar todas y cada una de las
lación puede seguir siendo utilizado de estas dos maneras. Cu~lquier
diferentes subastas posibles. En la subasta dela sección ;3,2.B, por ejemplo,
equilibrio bayesiano de Nash de un juego bayesiano puede representarse
el participante que puja más alto paga al vendedor y consigue el bien
<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesiano
subastado, pero existen muchas otras posibilidades. Los participantes,
adecuadamente escogido, en el cual por "representado" queremos decir
por ejemplo, pueden tener que pagar una entrada, De forma más general,
que para cada posible combinación de tipos de los jugadores (tit ... ,tn),
algunos de los participantes que pierden pudieran tener que pagar dinero,
las acciones y las ganancias de los jugadores en el nuevo equilibrio son
tal vez en cantidades que dependan de sus pujas y de las de los demás.
idénticos a los del equilibrio original. IÍtdependientemente de cuál sea el
También podría el vendedor establecer un precio de reserva, un precio
juego original, el nuevo juego bayesiano es siempre un mecanismo directo;
mínimo por debajo del cual no se aceptaran pujas. De forma más general,
independientemente del equilibrio original, el nuevo equilibrio siempre
puede existir cierta probabilidad de que el vendedor se quede con el bien
consiste en decir la verdad. De manera más formal:
El principio de revelació" / 167
166/ JuEGOS ESTÁTICOS CON INFORMACIÓN INCOMPLETA (c. 3)
Teorema. (El principio de revelación). Cualquier equilibrio bayesiano de minan qué mecanismos directos tienen un equilibrio de decir la verdild.
Nash en un juego bayesiano puede representarse mediante un mecanismo directo Luego imponen la restricción de que cada tipo de cada parte quiera juga.r
de incentivos compatibles. (esdecir, que cada tipo de cada parte tenga una ganancia esperada en eqUl-
librio no inferior a la ganancia que ese tipo podría conseguir negándose
En la subast~ analizada en la sección 3.2.B supusimos que las valótació-' .. ' a jugar, concretamente cero para cada tipo de compra~or y is para el
nes de los párticipantes eran independientes entre sÍ. Tambiénsupusitnos ;; tipo de vendedor tB). Finalmente, demuestran qu~ en n1l1gl1l10de estos
(de forma implícita en la definición de las valoraciones de los partiCipan- mecanismos directos de incentivos compatibles, el mtercambJO se da con
',': tes) que conocerla-valoraCión del jugador j no éambiaria la valoracÍóiÍ.del probabilidad uno si y sólo si el intercambio es eficiente .. El.~rincipio ~e
jugador i (aunque tal con~chniento cart1biarianormalment~ la puja de i). revelación garantiza entonces que no hay juego de negOClaClonque qUJe-
ranseguir el comprador y el vendedor que tenga un equilibrio bayesiano
Caracterizamos estos dos supuestos diciendo que los participantes tienen
valores privadóseindep~ndientes. Eh'este caso, Myerson (1981)deter-' de Nash en el cual se dé el intercambio si y sólo si es eficiente.
mina quémecaÍüsmos directús"HénehUh ecjirilibrio de decirlaveidady Para dar un enunciado formal y una demostración del principio de re-
cuáles de estos equilibrios maximizan la ganancia esperada del vendedor. velación, consideremos el equilibrio bayesiano de Nash s' = (si, ... ,s;,) en
El principio de revelación garantiza entonces qué no hay otra subasta con el juego bayesianoestático G = {Al,'" ,An; TI,' .. ,Tn;Pl,'" ,Pn; nI, ... ,un}'
un equilibrio bayesiano de Nash que proporcione al vendedor una ga- Vamos a construir un mecanismo directo con un equilibrio de decir la
. nancia esperada más alta, puesto que el equilibrio de tal subasta habría verdad que represente s*. El mecanismo directo adecuado es un juego
sido representado por un equilibrio de decir la verdad de un mecanismo bayesiano estático con los mismos espacios de tipos y de conjeturas que
directo; y ya consideramos todos los mecartisr'nq~directos de incentivos G, pero con nuevos ~spacios de acciones y nuevas funciones de ganancias.
compátibles. TambIén déinuestra'Mye~son que el equilibrio bayesia~o d~ Los nuevos espacios de acciones son simples. Las acciones. factibles del
Nash simétrico de la subasta analizada en la sección 3.2.B es equivalente jugador i en el mecal1ismo directo son declaraciones (posiblemente falsas)
a este equilibrio de decir la verdad maximizador de la ganancia (como los sobre sus posibles tipos. Es decir, el espacio de acciones del jugador i es
equilibrios simétricos de otras conocidas subastas). Ti. Las nuevas funciones de ganancias son más complicadas. Dependen
tomo seglindoejemplo derprin~ipio derevelació.n, consideremos el no sólo del juego original G, sino también del equilibrio original en dicho
problema del ii1tercambiobilateral descrito en la sección 3.2.C. Allí ana~ juego, s". La idea crucial es utilizar el hecho de que s" es un equilibrio
lizamos Unjuego 'de 'intercambio entre un comprador y un vehdJdor, hí en G para garantizar que de<:irla verdad es un equilibrio del mecanismo
subasta doble. En ese juego; si había iiüercarnbio; el comprador pagaba al directo, como vemos a continuación.
vendedor,'mientras CJuesino; no había pagó; sin embargo existehmuchas Decir que s" es un equilibrio bayesiano de Nash de G, significa
otras posibilidádes.Podriá. haber pagos (del comprador al vendedor o que para cada jugador i, s; es la mejor respuesta de i a las estrate-
viceversa) incluso sin intercambio, y la probabilidad de un intercambio mas (s" s" s~ s") de los demás ]'ugadores. Más concretamente,
0& '1""/ t-1' 'l+l,""'n
podriaestar estrictamente entre cero,yuno. También, la regla para deter- para cada uno de los tipos ti en Ti de i, S;(ti) es la mejor acción de A¡
minar si va haber intercambio podría exigir que la oferta del comprador que puede elegir i, dado que las estrategias de los otros jugadores son
fuera mayor que la demanda del vendedor en una cierta cantidad (posi- (si, ... ,s:_l ,s:+l' ... ,s~). Por tanto, si el tipo de i es tú y permitimos ai ele-
tiva o negativa); dicha cantidad podría incluso variar dependiendo de los gir una acción de un subgrupo Ai que incluye .5; (ti), entonces la elección
precios anunciados por las partes. óptima de i sigue siendo 3;(ti), suponiendo de nuevo que las estrategias
de los otros jugadores son (si, ... ,.5;_1,3;+" ... ,s~). Las funciones de ga-
Podemos capturar estas posibilidades considerando la siguiente clase
nancias en el mecanismo directo se eligen para confrontar a cada jugador
,".
de mecanismos directos: el comprador y el vendedor realizan simultánea-
mente declaraciones sobre sus tipos, Tb y T.., tras lo cual el comprador paga con una elección exactamente de esta clase.
al vendedor x(Tb,T que puede ser positivo o negativo, y el comprador Definimos las ganancias en el mecan.isIl1o directo sustituyendo las
.. : .. B),
en las estrategias deequilibrio del juego original, 8*, Yluego sustituyendo 3.4 Lecturas adicionales
las acciones resultantes en el juego original 8*(T) = (sih), ... ,:5~(Tn» en
las funciones de ganancias del juego original. Formalmente, la función de Myerson (1985) ofrece una introducción más detallada a los juegos baye-
ganancias de .í es
sianos, el equilibrio bayesiano de Nash y al principio de revelación.
Consúltese McAfee y McMillan (1987) para un examen de la literatura
sobre subastas, incluyendo una introducción a la maldición del ganador.
Bulow y J(lemperer (1991) extienden el modelo de subastas de la sección
donde t = (t¡, ... ,tn). Se podría pensar que estas ganancias se dan porque
3.2.B para dar una interesante explicación de los pánicos y de los hundi-
un observador imparcial se acerca a los jugadores y pronuncia el siguiente ".,/
discurso: mientos racionales en los (digamos) mercados de valores. Sobre el em-
pl~o pajo información asimétrica consúltese Deere (1988),quien analiza un
Sé que ustedes ya conocen sus tipos y que van jugar el a modelo dinámico en el cual el trabajador va encontrándose con distintas
equilibno s' del juego G. Pero perIl1ítanme que lespre- eIIlpresa,s~ lo largod~l tiempo, cada una con su propio productonÍ.argmal
sente un nuevo juego, un mecanismo directo: En primer conocido de fOrmé:lprivada. Para aplicaciones del principio de revelación
lugar, cada uno de ustedes fírn;.ará un contrato que me c~nsúltese Baron:y Myerson (1982) sobre la regulación de un monópolio \ ..
permita a mí dictar la acción que tornarán ruando jugUe- con costes desconocidos, H¡¡rt (1983) sobre los contratos implícitos y el
mos e.En segundo lugar, cada uno de ustédes escribirá-' . paro inyolunté:lrioySappington (1983) sobre la teoría de la agencia.
una declaración sobre su tipo Ti y me la entregará~ Segui'-.
damente utilizaré la declaración del tipo de cada uno dé
ustedes en el nuevo juego, Ti, junto consúestfategia 'de ,; 35 Ejercicios
equilibno en el juego original, si, para ca1culiir-;'l~
acción
que habrían elegido en el equilibrio s' si su tipo fuera 3.1 ¿Qué es un juego bayesiano estático? ¿Qué es una estrategia (pura)
verdaderamente Ti, concretamente si (T¡). Finalmente, de- en tal juego? ¿Qué es un equilibrio bayesiano de Nash (con estrategias
terminaré que cada uno de ustedes torne la acción que puras) en dicho juego?
he calculado, y recibirán las ganancias resultantes (que \
dependerán de estas acciones y de sus tipos verdaderos). 3.2 Consideremos un duo polio de Cournot que opera en un mercado con
demanda inv~rsa P(Q) = a - Q, donde Q = qI + q2 es la cantidad agregada
Concluirnos esta sección (y la demostración del principio de reve-' en el mercado. Ambas empresas tienen unos costes totales de Ci(qi) = Cqi,
lación) demostrando que decir la verdad es un equilibrio bayesiano de pero la demanda es incierta: es alta (a = aA) con probabilidad O y baja
Nash de este mecanismo directo. Al declarar ser del tipo Ti de T¡, el juga~ (a. = aB) con probabilidad 1-0. Además, la información es asimétrica. La
dar i está en efecto escogiendo tornar la acción si'(Ti)deA¡. Si todos los, empresa 1 sabe si la demanda es alta o baja, pero la empresa 2 no lo sube.
demás jugadoresdicen la verdad, están efectivamente jugando las estr¡¡te-' Todo esto es información del dominio público. Las dos empresas eligen
gias (si" .. ,s:_¡,s~+I'" . ,si)' Pero discutirnos anteriormente que si juegan c~tidades,simultáneamente. ¿Cuáles son los espacios de estrategias de
esas estrategias, cuando el tipo de i es ti la mejor acción que puede elegir .¡-. g:ps'empresas? Háganse supuestos sobre aA, aB, e y C de manera que
lé:l~.
es ,st(t¡), 'Por tanto, si los otros jugadores dicen la verdad, cuando el tipo de todas las cantidades de equilibrio sean positivas. ¿Cuál es el equilibrio
i sea t, el mejor tipo del que se puede declarar seres ti. Es decir, decir laver~ bayesiano cie este juego?
dad es un equilibrio. De un modo más formal, jugar la estrategia de decir la
verdad T¡(ti) = ti para cada t.¡ en T¡ es un equilibrio bayesianode Nash del." 3.3 Consideremos el siguiente modelo de duopolio de Bertrand con infor-
juego bayesiano estático {TI," .,Tn;11, ... , Tn;PI," ',Pn;v¡, ... ,vn} para mación asimétrica y productos diferenciados. La demanda que se dirige
cada jugador i. a la empresa 'í es qi(P'¡,Pj) = a - Pi - bi . Pj. Los costes son cero para ambas
"1',
',.o',
170/ JUEGOS ESTÁTICOS CON INFORMACIÓN INCOMPLETA (c. 3) Ejercicios /171
empresas. La sensibilidad de la demanda de la empresa 'i al precio de la HáIlese un equilibrio bayesiano de Nash con estrategias puras del juego
empresa j es o alta o baja. Es decir, bi es o bA o bB, donde b,4. > bE > O. .':',::.' correspondiente con información incompleta tal ql~e, conforme la 111[0:-
Para cada empresa, bi = bAcon probabilidad IJ y b¡ '" b B con probabilidad. -' ;;i,;o,lIlación incompleta desaparece, la conducta de los Jugadores el: :1 ~qU1-
1 - IJ, independientemente de bj• Cada empresa conoce su propio biPe!6.,. ";"',',:
•.'UbriObayesiano de Nash tienda a su comportamIento en eJ.~qu¡Jlbno ele
no el de su competidora. Todo esto es información del dominio públiF ' ;¡(:"Nash con estrategias mixtas del juego original con mformaclOn completa,
¿Cuáles son los espacios de acciones, espacios de tipos, conjeturas y fUn~
ciones de utilidad en este juego? ¿Cuáles son los espacios de estrategias!. 3.6 Consideremos una subasta de sobre cerrado al primer precio en la cual
¿Qué condiciones definen un equilibrio bayesiano de Nash simétncú'é'8R las valoraciones de los participantes están distribuidas de forma indepen-
estrategias puras de este juego? Hállese dicho equilibrio .. " . diente y uniforme en [0,1]. Demuéstrese que si hay n participantes, la
""'¡<tr"t~giade Plljar (n - l)/n veces la propia valoración es un equilibrio
3.4 Hállense todosJos. equilibrios bayesianos de Nash con esrrategiasp •.~"yesiano de Nash simétrico.
.~; .
ras en el siguiente juego bayesiano estático: . ..tl~'f;'.~"
- ,
4. Las ganancias son las que se dan en el jueg¿<lu~.deterrhiná'éiaár:;.'¡ ~;'j:SCónsidérese al comprador y al vendedor de la subasta doble analizada
. en la sección 3.2.C como una empresa que conoce el producto marginal 111.
1 j) ID'- 'del trabajador y un trabajador que conoce su oportunidad alternativa 7),
como en Hall y Lazear (1984), En este contexto, un intercambio significa
A 1,1 0,0 A 0,0 á,o
q~El~l.tralJaj<\~orestá empleado por la empresa, y el precio al cual las
B 0,0 0,0 B 0,0 2,2 ;part~' negoCian es el salario del trabajador w. Si se da el intercambio,
Juega2 .... .,la ganancia de la empresa es m ~ w, y la del trabajador es w; si no hay
Juega 1 \,4itercambio, la ganancia de la empresa es cero y la del trabajador v.
. Supongamos que m y v son obtenidos independientemente segú n Ulla
3.5 Recordemos de la Sección 1.3 que el juegode las monedas (un juegó'. , distribución uniforme en [0,1] como en el texto. Con fines comparativos,
estático con información completa) no tiene equilibrios de Nash cori'és~.. ii;tálCúlense las ganancias esperadas de los jugadores en el equilibrio lineal
trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Iílixhis;':'; :'',de la subasta doble. Ahora consideremos los dos juegos de intercambio
cada jugador elige cara con probabilidad 1/2 .. 'siguientes como alternativas a la subasta doble.
""r"l,'
.; . ¡liega 1: Antes de que las partes conozcan su información privada,
Jugador 2 \:fitman un contrato aceptando que si el trabajador es empleado por la
cara cruz empresa, su salario será w, pero también que cualquiera de las partes
:':puede romper la relación de empleo sin coste alguno. Después de que
cara 1,-1 -1,1
las partes conocen los respectivos valores de su información privada,
Jugador 1
,~núncian simultáneamente si aceptan el salario 1)) o si lo rechazall, Si
cruz -1,1 1,-1
h':'áI;ól:5os anunCian que 10 aceptan, hay intercambio; si no, no, Dado 1.111
\ valor de v arbitrario en [0,1], ¿cuál es el eqtlilibrio bayesiano de Nash de
','
172/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)
Referencias / 173
3.6 Referencias SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal and
Agent." ¡oumal o/ Economic Theory 21:1-21.
~3
4. JUEGOS DINÁMICOS
CON INFORMACIÓN INCOMPLETA
"Figura 4.1.1
Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.
UtiÍiza~d¿ la rep!esent~ci6n'enfonnan9pnal de este juego4ad~~ sucesivamente racionales. Es decir, en cada conjunto de mformaclOn, la aCClO1l
la figura 4.1.2, observ~mq~ que existen~().seqüi1ibrios deNash con estra:;: tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.r
tegias puras, (1,1') y (D,D'),r~rá (ieterminat SI estos equiiibri~;'dé ],{f;h óptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~
son perfectos en subjuegos utiHz!Ull0slarepresentación en {antia e~t~ri~ guientes estrategias de los demás jugadores (donde una estra.tegla subslg,Ulente
'. ' "",' ,'" , , ", 'jl'!'
siva para definir los subjuegos del juego. Puesto que un' juego ,esdefÍr{j~9., es un plan de acción completo que cubre cada contmgencla que podna darse
de modo que comienza en, un nodo de decisión, que no es ~ás que~~: después de haberse alcanzado el conjunto de información).
conjunto deinformación cbn un único elemento (aunque no es eipri~EJ-,
n~do de decisión del jueg()), el juego'delafigura Ü.l no tiene subjuég~~~"
SI un juego no tiene subjuegos, el r~q,uisitode perfección en subjuegos . En la figura 4.1.1, el requisito 1 significa que si el juego alcanza el
(~o~cretamenteque las estrategias dé' los jugadores c~mstituyan un equi~ conjunto de información con más de un elemento del jugador 2, éste debe
hbno de Nash en cada subjuego) se cumple de forma trivia( Por tan£o: formarse una conjetura sobre el nodo que se ha alcanzado (o, de forma
encualquierjuego que no tenga subjuegos la definición de equilibrio de. equivalente, sobre si el jugador 1 ha jugado 1 o C).Esta conjetura se
Nash perfec~á en subjuegosles equivalenté a la definición de equilibriocl~ representa con las probabilidades p y 1 - p ligadas a los nodos relevilntes
Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios en el árbol, como muestra la figura 4.1.3.
'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramente .Dada la conjetura del jugador 2, la ganancia esperada porjugar D' es
d,euna amen,aza que nó resultacreíble: si llega el tumo del jugador 2,jugar p. 0+(1 - p).l = 1 - p, mientras que la ganancia esperada por jugar j' es
1 domma a Jugar D', por 10 que el jugador 1 no debería verse inducido a p.1 + (1- p) .2 = 2 - p. Puesto que 2 - p > 1 - p para cualquier valor
jugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover. ". de p, el requisito 2 hace que el jugador 2 no elija D'. AsÍ, basta con exigir
_. que cada jugador tenga una conjetura y actúe óptimamente de acuerdo
con ella para eliminar el equilibrio inverosímil (J],D') eneste ejemplo.
Jug~dor 2 , Lo~requisitos 1 y 2 insisten en que los jugadores se formen conjeturas
l' D' :y,actú~n de forma óptima según éstas, pero no que estas conjeturas sean
.,:'1:';'
'tazonables,.Para imponer requisitos adicionales a las conjeturas de los
1 2,1 0,0
.:.:J:" jt1gadót~s; distinguimos entre conjuntos de información que están en la
Jugadorl' C 0,2 0,1 trayectoria de equilibrio y los que están fuera de la trayectoria de equili-
D 1,3 1,3
.."í. brio. ,.
,;~~
Ii"
180 ! JUECOS DINÁ,VIICOS CON INFORMACIÓN INCOMPLETA (c. 4) Introducción al equilibrio bayesiano perfecto / 181
o sino que ahora también incluye una conjetura para cada jugador en cada
1 conjunto de informaciÓn en el que el jugador tenga que jugar.1 La ventaja
3
de hacer explícitas las conjeturas de los jugadores de esta manera es que,
igual que en capítulos anteriores insistimos en que los jugadores eligen
estrategias creíbles, ahora podemos insistir en que se forman conjeturas
,,
razonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3) ''-.'
como fuera de ésta (en el requisito 4 que sigue y en otros de la sección 4.4).
En aplicaciones económicas simples, que incluyen el juego de seña-
lización de la sección 4.2.A y el juego con parloteo de la sección 4.3.A,
o o los tres requisitos no sólo capturan el espíritu del equilibrio bayesiano '.' .
2 1 perfecto, sino que también constituyen su definición. Sin embargo, en
aplicaciones económicas más complejas, se necesita imponer másrequisi-
Figura 4.1.3 tos con objeto de eliminar equilibrios inverosímiles. Distintos autores han
utilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todas
Definición. Para un equilibrio dado en un cierto juego en fionna extensiv las definiciones incluyen los tres requisitos; algunas también incluyen el
c' t d . fi ',. , . . a, un
ollJun o e In onnaclOn esta en la trayectoria de equilibrio si' se . 1 requisito 4 y algunas imponen requisitos adicionales.2 En este capítulo
, '. b b Td d .. a canza
LOI/.pro.a 1 I a positiva cuando .el juego se desarrolla según las estrategias de tomamos los requisitos 1 a 4 como definición del equilibrio bayesiano
~qullzbrlO, ~ fuera de la trayectorza de equilibrio si es seguro que no se alcanza perfecto.3
Llllmdo el Juego se desarrolla según las estrateO"Ías de equilibrio (donde u .•
11' " " . . ó' ,equI-
1 mo. puede significar equilibrio de Nash, perfecto en subjuegos, bayesiano o
lmyeslano perfecto). 1 Kreps y Wilson formalizan esta perspectiva de equilibrio definiendo el equililJrio secuencial,
un concepto de equilibrio equivalente al equilibrio bayesiano perfecto en muchas aplicaciones
económicas, pero en algunos casos algo más restrictivo, El equilibrio secuencial es más
R "
equl~Ito 3. En conjuntos de infonnación sobre la trayectoria de equilibrio complicado de definir y aplicar que el equilibrio bayesiano perfecto, por lo que la mayoría de
las conJ~turas se determinan de acuerdo con la regla de Bayes y las estrategias d; los autores ahora utilizan este último. Algunos se refieren (de modo impreciso) al concepto de
eqllllzbrzo de los jugadores. equilibrio que aplican corno equilibrio secuencial. Kreps y Wilson muestran que en cualquier
juego finito (es decir, cualquier juego con un número finito de jugadores, tipos y jugadas
posibles) existe un equilibrio secuencial. Esto significa que en cualquier juego finito existe un
'. Por ejemplo, e~ el equilibrio de Nash perfecto en subjuegos (1,1') de la equilibrio bayesiano perfecto.
figur~ 4.?.3, la conjetura del jugador 2 debe ser p = 1: dada la estrategia de 2 Para dar una idea de las cuestiones que no son tratadas por los requisitos 1 a 4, supon-
,
gamos que los jugadores 2 y 3 han observado los mismos acontecimientos y a continuación '.
eqUIhbno del jugador 1 (concretamente 1), el jugador 2 sabe qué nodo se ha ambos observan una desviación del equilibrio por parte del jugador 1. En un juego con infor-
al~anz~~o en el conjunto de información. Como una segunda ilustración mación incompleta en el cual el jugador 1 tiene información privada, ¿deberían los jugadores
(lupotetica) del requisito 3, supongamos que en la figura 41 3 . t' 2 y 3 formarse la misma conjetura sobre el tipo del jugador 1? En un juego con información
u Tb . . . eXls lera completa, ¿deberían los jugadores 2 y 3 formarse la misma conjetura sobre las decisiones pre-
\~ ..'
Requisito 4. En conjuntos de información f/lera de la tral/eeto' t '¡'b ' l a 3, También satisfacen de forma trivial el requisito 4, puesto que
las eOn¡dl d na [ e eqru 1 no
, Iras se eterminan según ¡a regla de Bll1¡es y ¡as ' t' t ' d ' no existe ningún conjunto de información fuera de esta trayectoria de
Jugadores donde sea posible, - es la egzas e los equilibrio, por lo que constituye un equilibrio bayesiano perfecto.
Definición U q '¡'b . b
duras que s'at n¡, e ul¡1 no .ayesiano perfecto
•
consiste en estrategias y eon- 1 L
¡ lS aeen os requIsItos 1 a 4.
)
, Sería por supuesto útil enunciar el requisito 4 de un modo má ' A
, eVItando la vaga instrucción "donde sea posible" L h s preCISO,
•
una d 1 r ' . o aremos en cada L'
eas ap lCaClOneseconómicas analizadas en las siguientes se ' 2
P or ahora utir l'" CClOnes.
. Izaremos os Juegos de tres jugadores de las ti ras 4 1 4
~~.5 para Ilustra: y fundamentar el requisito 4. (De arriba abafc:se indi~a~
pagos de los Jugadores 1, 2 Y3 respectivamente.)
• L 2
O
O
,
2
Figura 4.1.5
•
Ahora consideremos las estrategias (L,!,!') junto con la conjetura p =
-,,} .. _---
O. Estas estrategias constituyen un equilibrio de Nash; ningún jugador
quiere desviarse unilateralmente. Estas estrategias Yla conjetura también
•)
satisfacen los requisitos 1 a 3; el jugador 3 tiene una conjetura y actúa
de forma óptima con respecto a ésta, y los jugadores 1 y 2 actúan de
forma óptima dadas las estrategias subsiguientes de los otros jugadores.
•••
1 O O
2 1 1 Pero este equilibrio de Nash no es perfecto en subjuegos, porque el único
1 2 1 equilibrio de Nash del único subjuego del juego es U,D'). Por tanto,
los requisitos 1 a 3 no garantizan que las estrategias de los jugadores
Figura 4.1.4 constituyan un equilibrio de Nash perfecto en subjuegos. El problema es
1
que la conjetura del jugador 3 (p = O) es inconsistente con la estrategia
con un ún' t
Este juego ti ne b' ,
un su Ju~go: comIenza en el conjunto de información del jugador 2 (l), pero los requisitos 1 a 3 no imponen restricciones a
la conjetura de 3 porque el conjunto de información de 3 no se alcanza
este sub' ICOe emento ~el Jugador 2. El único equilibrio de Nash en
Juego entre los Jugadores 2 3 (1 D' si el juego se desarrolla según las estrategias indicadas. No obstante, el
equilibrio de Nash e . y es , ), por lo que el único
requisito 4 fuerza a que la conjetura del jugador 3 esté determinada por
Estas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').
g¡ Y a conJetura p = 1 del jugador 3 satisfacen los requisitos la estrategia del jugador 2: si la estrategia de 2 es I, la conjetura debe ser
184/ JUEGOS DlNÁ,\;lICOS CON INFORMACIÓN INCOMPLETA (e. 4) Jllegos de señalización / 185
p = 1; si la estrategia de 2 es D, la conjetura de 3 debe ser p = O. Pero si que el equilibrio bayesiano perfecto hace que las conjeturas de los juga-
la conjetura de 3 es p = 1, el requisito 2 fuerza a que la estrategia de 3 sea dores sean explícitas, este equilibrio no puede reconstruirse procediendo
D', con lo que las estrategias (L,1,1') y la conjetura p = Ono satisfacen los hacia atrás en el árbol del juego, como hicimos para construir el equilibrio
requisitos 1 a 4. de Nash perfecto en subjuegos. El requisito 2 determina la acción de un
Como segunda ilustración del requisito 4, supongamos que la figura jugador en un conjunto de información.dado basado en parte en la con-
4.1.4 se modifica como muestra la figura 4.1.5. El jugador 2 dispone ahora jetura del jugador sobre dicho conjunto de información. Si el requisito 3
de una tercera acción po~ible, L' que termina el juego. (Para simplificar o el requisito 4 se aplican a este conjunto de información, determinan la
ignoramos las ganancias' en este juego.) Como antes, si la estrategia de conjetura del jugador a partir de las acciones de los jugadores situados
equilibrio del jugador 1 es L, el conjunto de información del jugador 3 está más arriba en el árbol. Pero el requisito 2 determina las acciones situadas
fuera de la trayectoria de equilibrio, pero ahora el requisito 4 puede no más arriba en el árbol, basándose en parte en las estrategias subsiguientes
determinar la conjetura de 3 a partir de la estrategia de 2. Si la estrategia de los jugadores, incluyendo la decisión en el conjunto de información
de 2 es L', el requisito 4 no pone restricciones en la conjetura de 3, pero si original. Esta circularidad implica que una sola pasada ha~a atrás a lo
la estrategia de 2 es jugar 1 con probabilidad q¡, D con probabilidad q2 y largo del árbol (normalmente) no es suficiente para calcular un equilibrio
£' con probabilidad 1 - ql - q2, donde ql + q2 > O,el requisito 4 dicta que bayesiano perfecto.
la conjetura de 3 sea p = q¡j(q¡ + q2).
Para concluir esta sección, relacionamos de modo informal el equili-
brio bayesiano perfecto con los conceptos de equilibrio presentados en los 4.2 Juegos de señalización
capítulos anteriores. En un equilibrio de Nash, la estrategia de cada juga-
dor debe ser una mejor respuesta a las estrategias de los otros jugadores, 4.2.A Equilibrio bayesiano perfecto en juegos de señalización
por lo que ningún jugador elige una estrategia estrictamente dominada.
En un equilibrio bayesiano perfecto, los requisitos 1 y 2 equivalen a exigir Un juego de señalización es un juego dinámico con información completa
que la estrategia de ningún jugador esté estrictamente dominada comen- y dos jugadores: un emisor (E) y un receptor (R). El desarrollo del juego
zando en cualquier conjunto de información. (Véase la :;ección 4.4 para , '!li
es el siguiente: .r'
una definición formal de dominancia estricta comenzando en un conjunto
de información.) El equilibrio de Nash y el equilibrio bayesiano de Nash
1. El azar escoge un tipo ti del conjunto de tipos factibles T = {tI,' .. ,tI} , 'Jt
no comparten esta característica en conjuntos de información situados
que asigna al siguiente emisor según una distribución de probabilidad (
fuera de la trayectoria de equilibrio, como los conjuntos de información
p(t;), donde p(ti) > Opara cada i y p(tl) + ... + p(tI) = 1. _rJ
que no están contenidos en ningún subjuego. El equilibrio bayesiano per- \
fecto tapa estos agujeros: los jugadores no pueden amenazar con jugar 2. El emisor observa ti y elige un mensaje mj del conjunto de mensajes
factibleslv! = {mI,' .. ,m}}. (
estrategias estrictamente dominadas al comienzo de cualquier conjunto
de información fuera de la trayectoria de equilibrio. 3. El receptor observa mj (pero no ti) y elige a continuación una acción \
Como indicamos anteriormente, una de las virtudes del concepto de Uk de un conjunto de acciones factibles A = {al" .. ,aK}.
(
equilibrio bayesiano perfecto es que hace explícitas las conjeturas de los 4. Las ganancias vienen dadas por UE(ti,mj,ak) y UR(ti,mj,ak).
(
jugadores para imponer no sólo los requisitos 3 y 4, sino también otros
requisitos (sobre conjeturas fuera de la trayectoria de equilibrio). Puesto En muchas aplicaciones, los conjuntos T, M Y A son intervalos de la
que el equilibrio bayesiano perfecto no permite que el jugador'í juegue una recta real, en lugar de conjuntos finitos como los considerados aquí. Es
estrategia estrictamente dominada comenzandQ en un conjunto de infor- inmediato permitir que el conjunto de mensajes factibles dependa del tipo J'
mación fuera de la trayectoria de equilibrio, tal vez no sea razonable que que determina el azar, y que el conjunto de acciones factibles dependa del
el jugador j crea que el jugador 'Í jugará tal estrategia. Sin embargo, puesto mensaje que envía el emisor.
186 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
Juegos de SeJllllizIlCi,ill / 187
Los modelos de señalizacion han sido aplicados extensamente en el expectativa de inflación por parte de los empresarios pre-
análisis económico, Para indicar la diversidad de posibles aplicaciones cede al juego de seii.alización, y la elección de la autoridad
mterpretamos brevemente la estructura formal en 1-4 en términos de las monetaria de inflación en el segundo periodo la sigue,
tres aplicaciones que serán analizadas en las secciones 4.2.B,4.2.C y 4.2.0.
En el modelo de señalización en el mercado de trabajo de En el resto de esta sección analizarnos el juego de seii.alización abs-
Spence (1973)elemisor esun trabajador, el receptor es el tracto dado en 1 a 4, más que estas aplicaciones. La figura 4.2.1 ofrece
mercado de posibles empresarios, el tipo es la capacidad una representación en forma extensiva (sin ganancias) de un caso simple:
productiva del trabajador, el mensaje es la elección' del T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Nótese que el juego
nivel de educaci9n.c;leltrabajador yla acción es el salario no se desarrolla desde el nodo inicial en la parte superior del árbol hasta
,pagado Eor el mercado. '" ". los nodos terminales en la parte inferior, sino desde una jugada inicial
"
;',
En el modelo deinversiórtempresarial y estruc~rade éiéterminada por el azar en mitad del árbol hasta los nodos terminales en
capital de Myers y Majluf (1984),el emisor es una empresa los extremos izquierdo y derecho.
que necesita capital para financiar WI nuevo proyecto, el Emisor
a,
receptor es un inversor potencial; el tipo es la rentabilidad a,
m, t, m,
de los activos existentes de la empresa, el mensaje es la
:- - .:.'
oferta de una participación en él beneficio de la empresa :
a cambio de financiación y lélacción es la decisión de si a, ¡J a, ~ ' •.
invertir ano por parte del inversor. ,
,
Azar Receptor
Receptor
,
E~ algunas aplicaciones, un juego de señaliza~ió~.f9rm~parte de un juego ,
mas complejo. Por ejemplo, el receptor pódría tóÍri~r ~udé'cisióll antes de ,
a, 1 - ¡J a,
que el emisor eligiese el mensaje en la segunda ~f~pa y~'elemisor podría
tornar su decisión después de que el receptor tomase la suya en la etap~ 3
(o simultáneamente). , m, t, m,
a,
ai
En el modelo de política monetaria de Vickers (1986), la Emisor
autoridad monetaria posee información privada sobre su
voluntad' de aceptar inflación para aumentar el nivel de Figura 4.2.1
empleo pero, por lo demás, el modelo es una versión en ,',
dos etapas del juego 'repetido con información completa Recordemos que (en cualquier juego) la estrategia de un jugador es un
del modelo analizado en la sección 2.3.E.Así, el emisor es plan de acción completo; una estrategia detalla una acción factible para
la autoridad monetaria'. el receptor es la patronal, el tipo la cada contingencia en la cual el jugador pudiera tener que actuar. Por lo
voluntad deja autoridad monetaria de aceptar una cierta tanto, en un juego de seii.alización, una estrategia pura del emisor es una
'. ,1: .~. inflación para aumentar el nivel de empleó, el mensaje la función m(ti) que especifica qué mensaje elegirá para cada tipo que el
elección deja inflación en el primer periodo por parte dela azar pueda detemIinar, y una estrategia pura del receptor es una función
autoridad monetaria y la acción la expectativa de inflación o.(mj) que especifica qué acción elegirá ante cada mensaje que .el emisor
en el segundo periodo' por parte de los empresarios. La pueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor como
el receptor cuentan con cuatro estrategias puras.
188/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4) Juegos de selialización / 189
Estrategia 1 del emisor: Jugar mI si el azar determina t] y jugar m] si el cuando se aplica al emisor. El receptor, por el contrario, elige una acción
azar determina t2. después de observar el mensaje del emisor pero sin conocer el tipo de éste,
Estrategia 2 del emisor: Jugar m] si el azar determina t] y jugar m2 si el por lo que la elección del receptor se da en un conjunto de información con
azar determina t2. más de un elemento. (Existe un conjunto de información de esa clase para
Estrategia 3 del emisor: Jugar TI12si el azar determina t] y jugar m] si el cada mensaje que pudiera elegir el emisor y cada uno de estos conjuntos de
azar determina t2' ' información tieneun nodo para cada tipo que pudiera haber determinado
Estrategia 4 del emisor: Jugar m2 si el azar determina t] y jugar m2 si el el azar.) Aplicando el requisito 1 al receptor obtenemos:
azar determina t2.
Estrategia 1 del receptor: Jugar a] si el emisor elige m] y jugar a] si el Requisito 1 de. señalización. Después de observar cualquier mensajemj d~
emisor elige m2. M, el receptor der~formarseuna conjetura sobre,qué tipos. podrían haberenVÚld~ ,'.
'.','
Estrategia 2 del receptor: Jugar a] si el emisor elige m] y jugár ai si el rn. Denotelrios'esta conNttira con la distribucióii de probabilidad¡¡(tilmjt
J .' .' ... ' ....•. ... .' . .. . ....' , .,'
d¡j~4e, .
'.'
emisor elige m2. . , ¡¡.(t;lmj)~Opara"cádati'im T y'" "
Estrategia 3 del receptor: Jugar a2 si el emisor elige m] y jugar a] si el
emisor elige m2. L ¡¡.(t¡jmj) = 1.
Estrategia 4 del receptor: Jugar a2 si el emisor elige m] y jugar a2 si el tiET
emisor elige m2.
Dados el mensaje del emisor y la conjetura del receptor, es inme~iat?
caracterizar la acción óptirrúl del receptor. " Aplicando el requisito','f::il:!-
Llamamos a las estrategias primera y cuarta del emisor de agrupación, ,.' "T'-, '.,;--:;,'.~t '
porque cada tipo envía el mismo mensaje, y a la segunda y a la tercera de receptor obtenemos: ", /~:
separacióll, porque cada tipo envía un mensaje diferente. En un modelo
con más de dos tipos también existen estrategias de agrupación parcial (o de Requisito fR de señalización. Para cada mj en NI, la acción del receP-!
semi-separación) en las cuales todos los tipos en un determinado conjunto tor a*(mj) debe maximizar la utilidad esperada del receptor dada la conjetura
de tipos envían el mismo mensaje, pero diferentes conjuntos de tipos ¡¡.(tdmj) sobre qué tipos podrían haber enviado "mj. Es decir, a*(mj) es una
envían mensajes diferentes. En el juego con dos tipos de la figura 4.2.1 solución de
existen estrategias mixtas análogas llamadas estrategias hfbridas, en las
cuales (digamos) t] juega m] pero t2 escoge aleatoriamente entre m] Y'1112.
Ahora traducimos los enunciados informales de los requisitos 1, 2 Y3
de la sección 4.1 a una definición fOfilal del equilibrio bayesiano perfecto
El requisito 2 también se élplica al emisor, pero éste tieneinf0:mac;:ión
en un juego de señalización. (La discusión sobre la figura 4.1.5 implica que completa (y por tanto una conjetura trivial), y además decide sorament~
el requisito 4 es vacuo en un juego de señalización.) Para simplificar las
al principio del juego, por lo que el requisito 2, e~ simplemen~e que la
cosas, limitamos nuestra atención a las estrategias puras; las estrategias estrategia del emisor sea óptima dadala estrategia dé! receptor:
hn)ridas se discutirán brevemente en el análisis de la señalización en el
mercado de trabajo de la próxima sección, Dejamos como ejercicio la
Requisito2E <leseñalización. Para cada ti enT: elmensaje del emisor m * (ti)
definición del equilibrio bayesiano de Nash en un juego de señalización
debe maximizar la utilidqd del emisor d,qda la estrategia del receptor a*(mj). Es
(véase el ejercicio 4.6).
decir, m~(ti) es una solución de
Puesto que el emisor conoce la historia completa del juego cuando
elige un mensaje, esta elección se da en un conjunto de información con
un lÍnico elemento. (Existe un conjunto de información de esa clase para
cada tipo que el azar pudiera determinar.) Por tanto, el requisito 1 es trivial
Juegos de se¡1alízaóólf / IlJ 1
190 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
del receptor a ,[ es a para cualquier valor de ) l ' 3. Dos empresas observan la educación del trabajador (pero no su capa-
equilibrio en el cual el " j y, por o tanto, no eXIsteun 4
emISOrJuegue (D,D). cidad) y entonces le hacen ofertas salariales de forma simultánea.
3. Separación con elección de I or a '. 4. El trabajador acepta la oferta salarial más alta, lanzando una moneda
la estrategia de separación U D) l Pd P rte de tI' SI.el emIsor elige en caso de empate. Sea -w el salario que acepta el trabajador.
receptor están en la tra t ~ :1' os os conjuntos de información del ",
yec ona l e equilib . l
se delenl1inan por la regl d BIno, por o que las conjeturas Las ganancias son las siguientes: -w - c('I),e) es la del trabajador, donde
y I} '" O Las' a e ayes y a estrategia del emisor: p '" 1
c(r¡,e) es el coste en el que incurre un trabajador con capacidad '1) para
a y b res~ectiva::~;:s drespuestas del receptor a dichas conjeturas _son
, ' ,e manera que ambos tipos del' . obtener una educación e; y(r¡,e) - -w es la de la empresa que emplea al
ganancias de 1 Qued . emIsor, conSIguen trabajador, donde y(r¡,e) es la producción de un trabajador con capacidad
dada la estrat~gia de~por compr(obar sIla estrategia del emisor es óptima
receptor a b) No lo es' si - l ti r¡ qu~ ha ot>!enido una educación e; y cero es la de la empresa que no
eligiendo I en lugar de DI' . . e po t2 se desvía
,e receptor responde con 1 empleaal trabajador.
una ganancia de 2 ' , a, con o que t2 recibe Vamos a centramos (aquí en cierto modo y más en la sección 4.4) en un
elegir D. ' que es mayor que la ganancia de 1 que recibe t2 al
equilibrio bayesiano perfecto en el cual las empresas interpretan la edu-
cación como una señal de capacidad y, en consecuencia, ofrecen un mayor
4. Separación con elección de D or d .
estrategia de separació (D I) 1 ~ parte e tI' SI el emisor elige la salario al trabajador con más educación. La ironía del trabajo de Spence
(/ _ 1 d ' n, ,as conjeturas del receptor deben ser p - O ,',,'-,
(1973) es que los salarios pueden aumentar con la educación incluso si la
- , e manera que la mejo dI' - y
consiguen unas ganancias d: r;s~~esta e re~eptor .e~(a,a) y ambos tipos educación no tiene efecto alguno sobre la productividad (es decir,irIcluso i
','
reaccionaría con a'la g . ci tI s~ deSVIaraelrgIendo 1, el receptor si la producción del trabajador con habilidad r¡ es y(r¡), independiente-
incentivo para qu~ 1 s:r;nCl~ de t s]ena ent~nces de 1,c,on lo que no hay mente de e). El trabajo de Spence (1974) generaliza el argumento al irIcluir
eSVIe e D Del rrusmo mod .t d '
de D, el receptor reaccio' .1 ' o, SI 2 se esviara la posibilidad de que la producción aumente no sólo con la. capacidad,
nana con a' a ganancia de t '
1, con lo que no existe' .' 2 sena entonces de sino también con la educación; la conclusión análoga es entonces que los
[(D,I),Ca,a),p = O _ 1] mcent1vo p.ar~ que t2 'se desvíe de l. Por lo tanto, salarios aumentan con la educación más de lo que puede explicarse por
,q - es un eqUIlIbno bayesiano perfecto de se paraclOn.
' .,
el efecto de la educación en la productividad. Seguimos este enfoque más
____________________ (:;:"
..J••.•
fuegos de sClia/ización /195
194 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
::.••••••••
v
las diferencias en e como diferencias en la calidad del rendimiento de un
estudiante, 110 como diferencias én la d~ración de la escolaridad de dicho
estudiante. Por tanto, ei juego en t-4 podría aplicarse a un grupo de
estudiantes que han. terminado los estudios mediO,s~esdecir, trabajadores
:""r con doce años. de educación exaCtamente) o.a tUl grupo de Íicenciados
~.
universitarios, o a un grupo de estudiantes con un máster en dirección de w,
empresas. Bajo esta interpretación, e mide el número y el tipo de asigna-
:.turas estudiadas y las notas y premios conseguidos durante un programa
académico de duración fija. Los costes de la enseñanza (si existen) son en-
tonces independientes de e, de manera que la función de costes c(7],e) mide
los costes no monetarios (o psíquicos): estudiantes cón una capacidad
más baja encuentran más difícil conseguir notas altas en una institución
determinada, y tainbién más difícil conseguir las mismas notas en una Figura 4.2.3
institución más competitiva. Así, la utilización de la educación por parte
de la empresa como señal, refleja el hecho de que las empresas contratan
y pagan m~s a los mejores estudiantes de una institución determinada y
a los estudiantes de las mejores instituciones.
También supone Spence que la competencia entre las empresas hará
El supuesto crucial en el modelo de Spence es que los trabajadorescon
que los beneficios esperados sean cero. Una forma de incorporar este
poca capacidad encuentran la señalización más cara que los trabajadores
supuesto a nuestro modelo sería sustituyendo las dos empresas en la
con capacidad más alta. De un modo más preciso, el coste marginal de
etapa (3) por un único jugador llamado mercado que hace una oferta .s~-
la educación es más alto para trabajadores de baja capacidad que para los
larial únic'a w y que recibe la ganancia -[Y(T7,e) - w]2 (Esto cOl1vertma
de capacidad alta: para cada e,
el modelo en uno de la clase de juegos de señalización con un receptor
definidos en la sección anterior.) Para maximizar la ganancia esperadil,
196/ JUEGOS DINÁMICOS CON INFORMACJÓN INCOMPLETA (e. 4)
Juegos de señalización / 197
Denotamos la solución con e*ü¡), como muestra la figura 4.2.4, siendo e*(B) e'(A) e
w*(-,¡) = Y['¡,e*Cr¡)].
Figura 4.2.5
Juegos de se>lalizacíóll / '199
198/ JUEGOS DINÁMICOS CON [NFORMAClÓN INCOMPLETA (c. 4)
La figura 4.2.6 describe el caso contrario, en el cual podría decirse Para completar la descripción de equilibrio bayesiano perfecto ele agru-
que el trabajador con capaCidad baja envidia el salario y nivel de edu~ pación nos falta (i) determinar la conjetura ele la~ empresas p,(A le) para
cación del trabajador con capacidad alta (es decir, ?U'(E) - dE,e'(E)] < las elecciones de educación e =1 ep fuera del eqUlltbno, que entonces de-
?U'(A) - dE,e'(A)]). Este último caso es más realista y (como veremos) termina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),
más interesante. En un modelo en el que la capacidad del trabajador tiene y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador a
más de dos valores, el primer caso se plantea sólo si cada valor posible de la estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1 e-
capacidad es suficientemente diferente de l~s valores posibles adyacentes. presentan los requisitos 1 y 2E de señalización respechvame~te: CO~l~O
Si la capacidad es una variable continua, por' ejemplo, entonces se da el apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2R de senaltzaclon
último caso. en este modelo con dos receptores.
Una posibilidad es que las empresas crean que cualquier niv.elde ed~l-
cación distinto de ep indica que el trabajador tiene Wla capaCIdad baja:
p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podría parecer ex-
traña, nada en la definición de equilibrio bayesiano perfecto la e~c1L1ye,
porque los requisitos del 1 al 3 no imponen restricci~~es a las conjeturas
situadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en un
juego de señalización. El refinamiento que aplicamos en la sección 4.4 res-
tringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en un
juego de señalización; en particular excluye la conJ::ura que anahzamos
aquí. En este análisis de los equilibrios de agrupaclOn ~~s cent:3mos en
esta conjetura para simplificar la exposición, pero tamblen conSIderamos
w*(B} __
,_,__
. brevemente conjeturas distintas.
Si la conjetura de la empresa es
apara e =1 ep (4.2.3)
e*(B} e*(A) ~L(Ale) = { q para e = ep
de indiferencia del trabajador con capacidad alta que pasa por el punto trab~jador constituyen otro equilibrio bayesiano de agrupación. Como
(ep'll)p) está por encima de la función de salario tu = y(B,e). ejemplo de lo último, supongamos que la conjetura de las empresas es
cOffi9 en (4.;2.3), con la excepción de que cualquier nivel de educación por
y (A,e) encima de el! se interpreta como que el trabajador se escoge al azar de la
distribu.ción de capacidades:
U
w(e) = wq para e = el'
e*(B) e' e para e> el!.
Wq
de las empresas constituyen un equilibrio bayesiano perfecto de agru- j'ldor. El requisito 3 de señalización determina entonces la conje~ de
pación.
---lasempresas después de observar cualquiera de estos dos niveles deedu-
Existen muchos otros equilibrios bayesianos perfectos de agrupación cación (concretamente ¡L[Ale'CB)] = OY ¡L[A\e'CA)] = 1), por lo que C4.2.1)
en el ejemplo definido por las curvas de indiferencia y las funciones de implica que w[e'CB)] = w'(B) y w[e'(A)l = w'CA). Corno enla discusión
producción de la figura 4.2.7. Algunos de estos equilibrios incluyen una de los equilibrios de agrupación, para completar la discusión de estos
elección de un nivel de educación diferente por parte del trabajador (es _.equilibriosbayesianos perfectos de separación nos queda: (i) establecer la ",<
decir, un valor de el' distinto del de la figura); otros incluyen la misma conjetura ¡L(A[e) de las empresas para elecciones deniveles de educación
elección de un nivel de educación pero difieren fuera de la trayectoria de f}1eradel equilibrio (es decir, valores de e Pistíntos de e'CB) o e'CA)), la
,'.
equilibrio. Como ejemplo de lo primero, sea e un nivel de educación entre - ~ c~al determina entonces el resto de las estrategias wCe) de las empresas a_ '.',',','
ep y el, donde el en la figura 4.2.7 es el nivel de educación en el eualla curva .. partir de (4.2.1), y (ii) demostrar que la mejor respuesta de un trabajador 1'.>.,
de indiferencia del trabajador de baja capacidad que pasa por el punto de capacidad r¡ a la estrategia w(e) de las empresas es elegir e = e'Cr¡).
(e'(B)¡w'(B») corta la función de salario w = q . y(A,e) + (l - q) . y(B,e). Una conjetura que cumple estas condiciones es que el trabajador tenga
01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategia
C" '.
capacidad alta si e es al menos e'CA), y capacidad baja en cualquier otro
resultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del caso:
"
________ .:..-- 1::'•••
202 / JUEGOS DlNÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4) Juegos de se¡laliznció" / 2m
y(A,e)
10
O para e < e'(A)
p,(Afe) = { 1 para e.2: e'(A). (4.2.6)
y(A,e,J
w'(A)
La estrategia de las empresas es entonces y(B,e)
Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta. e*(B) e'(A) es
a la función de salariosw = y(A,e), también es la mejor respuesta aquí.
Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuesta Figura 4.2.8
de dicho trabajador cuando la función de salarios eSw == y(E,e), de ma-
nera que w'(E) -e[B,e'(E)] es la mayor ganancia.que el trabajador puede ., de e uilibrio, de las conjeturas de las emjJr~sas
lograr de entre todas las elecciones de e < e'(A), Puesto que las cur~. Una expreslOn, fuera .q ., . Itrabajador tIene
que sustenta este comportamiento de e~Ulhbno es que ~o'
vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:
capacidad alta si e 2: e., y capacidad baja en caso contra .
diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] es
la mayor ganancia que puede conseguir; aquí un trabajador de baja ca- O para e < es
pacidad de entre todas las elecciones de e 2: e'(A). Por tanto, e'(E) p,(Aje) = { 1 para e 2: e.,.
es la mejor respuesta de un trabajador de baja capacidad, puest? qu~
w'(E) - dE,e'(E)] > w'(A) - dE,e'(A)] en el caso en que no hay envidia_ La estrategia de las empresas es entonces
A partir de aquí ignoramos el caso en el que no hay envidia. Como y(E ,e) para e < es
sugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es más inte"' -- w(e) = { y(A,e) para e 2: es.
resante. Ahora el trabajador con capacidad alta no puede ganar el salario
alto roCe) = y(A,e) simplemente eligiendo la educación e'(A) queelegiña . cidad baja tiene dos
Dada esta función de salarios, el trabaJado.r con capa. ar' (A,e,).
bajo información completa. En su lugar, para señalizar su capacidad, el ". .. . l . '(E) ganar 1}! (B) y elegIr es y gan.l/ .
mejores respuestas: e eglr e y . f d p'(JJ)' al.
trabajador con capacidad alta debe elegir e., > e'(A), .como muestra la ue esta indiferencia se resuelve en avor e ~ ,
Vamos a suponer q .' f dad arbitrariamente
figura 4.2.8, puesto que el trabajador con capacidad baja imitará cualquier . '" d 'amos aumentar es en una can 1 .
temativamente po n .. 'd d b J'aprefiriera estnc-
valor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tiene - d ue el trabajador con capaCl a a
pequena e manera q ,... 'd d alta las elecciones
capacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de' tamente e'(E), En cuanto al trabajador con capan a , .' d
separación incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabaja- . .
. de e > e son lnfenores a e" ya que e.,.
> e'(A). :Puesto que,
las LUlvas e
'j'
dor y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salarios s . 'dad baJ'a llenen mas pem lente que
indiferencia del trabaJador con capacI . 1 '1 .
de equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. Éste es .d d lta la curva de indiferenCla de u t11110
las del trabajador con capacl a a , ., 1 .'
el único comportamiento en equilibrio que sobrevive al refinamiento que »
que pasa por el punto ( e"y. (A ,es está por encima de la funclOn de s.a allos b"
aplicaremos en la sección 4.4. .
w = y(B,e) para e < e" por o
1 que las. elecciones de e < es son tam len
20-1 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4) Juegos de señaliznción / 205
inferiores. Por lo tanto, la mejor respuesta del trabajador con capacidad y la inferencia usual tras la separación da M(.4.leB) = O.Tres observaciones
alta a la estrategia de las empresas w(e) es e•. pueden ayudamos a interpretar (4.2.8): en primer lugar, puesto que el
Como en el caso de los equilibrios de agrupación, existen otros equi- trabajador con capacidad alta siempre elige eh, pero el trabajador con \:.'
librios de separación que incluyen diferentes elecciones de niveles de capacidad baja sólo lo hace con probabilidad 7f, observar eh indica que es
educación del trabajador con capacidad alta (el trabajador con capacidad más probable que el trabajador tenga capacidad alta, con lo que M(Aleh) >
baja siempre se separa en e*(B); véase lo que sigue) y otros equilibrios de q. En segundo lugar, cuando 7f tiende a cero, el trabajador con capacidad
separación que incluyen las elecciones de educación e*(E) y es pero di- baja nunca se agrupa con el de capacidad alta, por lo que ¡L(Aleh) tiende a
fieren fuera de la trayectoria de equilibrio. Como ejemplo de lo primero, urio. En tercer lugar, cuando 7f tiende a uno, el trabajador con capacidad
¡ "
sea e un nivel de educación mayor que es pero lo suficient~mente pe- baja casi siempre se agrupa con el de capacidad alta, por lo que M(Aleh)
queño como para que el trabajador con alta capacidad prefiera señalizar tiende a la conjetura a priori q.
su capacidad eligiendo e en lugar de inducir a pensar que tiene capaci- Cuando el trabajador con capacidad baja se separa del que tiene ca-
'.' ;;'
dad baja: y(A,e) - c(A,e) es mayor que y(B,e) - c(A,e) para cada e. Si pacidad alta eligiendo eB, la conjetura M(AleB) = O implica el salario
sustituirnos es por e en ¡L(Ale) y w(e) que acompañan a la figura 4.2.8, la w(eB) = y(B,eB)' Se deduce entonces que eB debe ser igual a e*(B): la
conjetura y la estrategia resultantes para las empresas, junto con la es- única elección del nivel de educación en la cual el trabajador con capaci-
trategia re(E) = e*(E),e(A) = e] del trabajador constituyen otro equilibrio dad baja puede ser inducido a separarse (probabilísticamente corno aquí
perfecto de Nash de separación. Corno ejemplo de lo último, sea la conje- o con certeza, corno en los equilibrios de separación discutidos anterior-
tura de las empresas sobre niveles de educación que están estrictamente mente) es la elección de educación con información completa e*(B) de
entre e*(A) y es estrictamente positiva pero lo suficientemente pequeña, dicho trabajador. Pa~a ve'r esto, supongamos que el trabajador con capa-
de manera que la estrategia resultante w(e) esté estrictamente por debajo ddad baja se separa eligiendo algún eB '1 e*(B). Tal separación alcanza la
de la curva de indiferencia del trabajador con baja capacidad que pasa por ganancia y(13,eB) - c(B,eB), pero de elegir e*(E) obtendría una ganancia
el punto (e* (B),w* (B». de al menos y[E,e*(B)] - c[E,e*(B)]Ca de más si la conjetura de lasem-
Concluirnos esta sección con una breve discusión sobre los equilibrios presas M[Aie* (E)] es mayor que cero) y la definición de e*(B) implica que
híbridos, en los cuales un tipo elige unnivel de educa<;ión con certeza, y[E,e*(E)] - c[E,e*(E)] es mayor que y(E,e) - c(E,e) para cada e '1 e*CB). " ,"
pero el otro tipo elige aleatoriamente entre la agrupación con el primer Por lo tanto, no existe una elección de nivel de educación eB '1 e*CE)
tipo (eligiendo el nivel de educación del primer tipo) y la separación del tal que el trabajador con capacidad baja pueda ser~inl:l1J:ci~?_ <l. separarse
primer tipo (eligiendo un nivel de educación diferente). Analizarnos el eligiendo eB.
caso en el cual el trabajador con baja capacidad escoge aleatoriamente; el Para que el trabajador con capaqgad baja esté dispuesto. aescoger ~ea-
ejercicio 4.7 trata el caso complementario. Supongamos que el trabajador toriamenteentre separarse en e*(E) y agruparse en eh, el salario w(eh) = Wh
con capacidad alta elige un nivel de educación eh (donde h quiere decir cl~behacer que el trabajador sea indiferente entre ambo~:
híbrido), pero el trabajador con capacidad baja elige aleatoriamente entre
eh (con probabilidad 7f) y eH (con probabilidad 1 - 7f). El requisito 3
w*(B) - c[B,e*(E)] = 'Wh - c(E,eh). (4.2.9)
de señalización (convenientemente extendido para incluirlas estrategias
mIxtas) determina entonces la conjetura de las empresas tras observar eh .Sin embargo, p?U'aque 'Whsea un salario de equilibrio para las empresas,
() ea. Con la regla de Bayes se obtiené
(4.2.1) y (4.2.8) implican que
, ....
(4.2.8)
q . (1 - q)7f
Wh = ---~. y(A,e¡.) + (1 ). y(E,eh). (4.2.10}
6 Recordemos de la nota 2 ele! capítulo 3 que la regla de Rayes establece que P(AIB) = q + (l - q)7f q + - q 7f
p(A.m/ P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).
1-'(04), por lo que P(AIE) = P(BIA). 1-'(04)/ P(B).
JlIegos de sel1alizIlciríll / 207
206 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
Para un valor determinado de eh, si (4.2.9) da que '/1)h < y(A,eh), entonces de la figura 4.2.8. Ciertamente, cuando eh tiende a es, r tiende al, :ie
(4.2.10) determina el valor único de que constituye un equilibrio híbrido
7["
manera que rrtiende a cero. Por tanto, el equilibrio de separación descnt~
en el cual el trabajador con capacidad baja escoge aleatoriamente entre en la figura 4.2.8 es el límite de los equilibrios híbridos conSIderados a~ul.
e*(E) y eh, mientras que si '/1)h > y(A,eh), no existe ningún equilibrio Para completar la descripción del equilibrio bayesiano perfe:to híb:ldO
híbrido que incluya eh. de la figura 4.2.9, sea la conjetura de las empresas que el trabajador t1ene
capacidad baja si e < eh yen cualquier otro caso, que tiene capacidad alta
con probabilidad r y baja con probabilidad 1 - r:
w
O para e < eh
y(A,e)
/.L(A\e) = { r para e 2': e".
restrlCclOn11Ih-< y(A,eh) es equivalente a eh < es, donde es es la educación nuevo proyecto es atractivo, supongamos que la inversión requerida es 1,
elegida por el trabajador con capacidad alta en el equilibrio de separación la ganancia será R, la rentabilidad alternativa para el inversor potencial r
o.'
::'08;' JUEGOS DINÁMICOS CON INfORMACiÓN INCOMPLETA (c. 4) Juegos de sel1aliZJlcián !209
2. El empresario conoce 1f y ofrece al inversor potencial una participación .' cumple sólo si
en los beneficios de la empresa, s, donde O::; s ::; 1. ., 1(1 + r)A
R - 1(1 + 1') 2: R - B. (4.2.14)
3. E~inversor observa s (pero no 1f) y decide si aceptar o rechazar la
oterta. Intuitivamente, la dificultad de un equilibrio de agrupación es que el tipo
4. Sí el inversor rechaza la oferta, su ganancia es lO + r) y la del empre- de beneficio alto debe subvencionar al tipo de beneficio bajo: haciendo
sano es 1f. Si el inversor acepta s, su ganancia es de s(1f + R) Yla del queq == pen (4.2.11) obtenemos s 2: 1(1 +1')/[pB+(1-p)A+RJ, mientras que
empresario O - s)(1f + R). si el inversor supiera con seguridad que 7r == A (es decir, q == O),. entonces
aceptaría una participación menor en los beneficios s 2: 1(1 +1')/(A+R). La
Myers y Majluf (984) analizan un modelo como éste, aunque conside- mayor participación en la empresa exigida por un equilibrio de agrupación
ran una empresa grande (con accionistas y un consejo de administración). es muy cara para la empresa con beneficios altos, tal vez tan cara como para
en lugar de un empresario (que es a la vez el director y el único accionista). hacer que la empresa con beneficios altos prefiera renunciar al proyecto.
Discuten diferentes supuestos sobre cómo lós intereses de los accionistas' Nuestro análisis muestra que existe un equilibrio de agrupación si pestá
podrían afectar la utilidad de los directivos; Dybvig y Zender (991) deri~. cerca de cero, por lo que el coste de la subvención es pequeño, o si (4.2.14)
van ~l contrato óptimo que los accionistas pueden ofrecer a los directiv~s .. se cumple, de manera que el beneficio del nuevo proyecto sobrepasa al
Este es un juego de señalización muy simple en dos aspectos: el coste de la subvención.
conjunto de acciones factibles del receptor es muy limitado, y el del emisor Si (4.2.13) no se cumple, no existe equilibrio de agrupación. Sin
es mayor pero poco influyente (cOri10veremos). Supongamos que tras embargo, siempre existe uno de separación. El tipo de beneficio bajo
reCIbir la oferta .5 el inversor cree que la probabilidad de que 1f == B es q. ofrece s == 1(1 + 1')/(B + R), que el inversor acepta y el tipo de beneficio
Entonces el inve,!sor aceptará s si y sólo si alto ofrece s < 1(1 + 1')/(A + R), queel inversor rechaza. En tal equilibrio
la inversión es ineficientemente baja: el nuevo proyec~o es rentable con
s[qB+ (l - q)A + R] 2: 1(1 + r). (4.2.11)
toda seguridad, pero el tipo de aÚo beneficio renuncia a la inversión. Este
equilibrio ilustra en qué sentido el conjunto de señales factibles del emi-
En cuanto al empresario, supongamos que los beneficios de la compañía sor es poco efectivo; el tipo de alto beneficio no tiene forma de sobresalir;
ant.es del proyecto son 1f, y consideremos si el empresario prefiere recibir unos términos de financiación que son atractivos para el tipo de beneficio
la financiación a cambio de la participación en los beneficios de la empresa alto son aún más atractivos para el de beneficio bajo. Como observan
o renunClar al proyecto. Lo primero es superior si y sólo si Myers y Majluf, en este modelo las empresas se ven empujadas hacia el
endeudamiento o hacia fuentes de financiación interna.
R Concluimos considerando brevemente la posibilidad de que el em-
s<-- (4.2.12)
-1f+R presario pueda tanto endeudarse como ofrecer participaciones en los be-
. En un equilibrio bayesiano perfecto de agrupación, la conjetura del neficios. Supongamos que el inversor acepta ofrecer un crédito D. Si el
Inversor debe ser q == p después de recibir la oferta de equilibrio. Como empresario no quiebra, la ganancia del inversor es D y la del empresario
la reslTÍcción en la participación (4.2.12) es más difícil de satisfacer para 1f + R - D; si el empresario quiebra, la ganancia del inversor es 1f + R
Ir == A q~e ~ara 1f == B, la combinación de (4.2.11) y (4.2.12) significa que Y la del empresario es cero. Como B > O, siempre existe un equilibrio
un equlhbno de agrupacióÍ1 sólo existe si de agrupación: los dos tipos de beneficios ofrecen el contrato de deuda
J¡¡egos de sáializnci')/1 I 211
210 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
D = JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficien- modelo con dos periodos es, por tanto, el siguiente:
temente negativo como para queR +B < JO + 7"), el tipo de beneficio
bajo no podría devolver su deuda, por lo que el inversor no aceptaría el 1. El azar determina el tipo e de la autoridad monetaria. La probabilidad
contrato. Aplicaríamos un argumehto'similar siH y A fueran benefiCiti;:' de que e =Des p.
esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ . 2. Los empresarios forman sus expectativas de inflación para el primer
que los beneficios actuales de !él empresa serán 1r+ J{ con probabilidad periodo, 1rj.
1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hay 3. La autoridad monetaria observa 1rj y escoge el nivel real de inflación
una probabilidad de 1/2 de qué el tipo de beneficio bajo no sea capaz del primer periodo, 1rI.
de devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptará el 4. Los empresarios observan 1rI(pero no e) y forman sus expectativas de
contrato. . inflación para el segundo periodo, 1r2.
5. La autoridad monetaria observa 1r2y escoge el nivel real de inflación
donde 1res elnivelreal de inflación, 1reesJa expectativa de inflación d~Jo~ 1r*(1re) = ~2[(l - b)y* + d1re].
c+d
empresarios e y* es el nivel eficiente de producción. Para los empresarios,:
la ganancia por periodo eS~(1r-1re)2; En nuestro modelo con dos periodos, El mismo argumento indica que si el tipo de la autoridad monetaria es c,
la ganancia de cada jugador es simplemente la suma de sus ganancias eh su elección óptima de 1r2dada la expectativa 1r2es
cada periodO('vV(1rI,1rj)+ W(1r2,1r2) y -(1rI _1rj)2 - (1r2 - 1r2)2, donde1rt es
el nivel.real de inflación en el periodo t y 1ri es la expectativa (al priricipio ~[O- b)y' + d1r21 =. 1r:i.(1r2'c).
del penado t) de inflación en el periodo~ por parte de los empresarios. c+d
El parámetro e en la función de ganancias W(1r¡rre) refleja el dilema de Previéndolo, si los empresarios empiezan el segundo periodo creyendo
la autoridad monetaria entre los objetivos de inflación cero y producción que la probabilidad de que e = D es ,!,se formarán la expectativan2(q) de
eficiente. En la sección 2.3.E, este parámetro era inlonnación del dominio forma que maximice
público. Suponemos ahora, en cambio, que esteparámetroes inlonnación
privada de la autoridad monetaria: e = Fa D (por "fuerte" y "débil'~ en (42.15)
la lucha contra la inflación); donde F > D > O. El desarrollo temporal del
•
~ 12 ! JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
Otras aplicaciones del equilibrio bayesiano perfecto! 213
En un equilibrio de agrupación, ambos tipos escogen la misma in- 4.3 Otras aplicaciones del equilibrio bayesiano perfecto
flación para el primer periodo, digamos 7r*,por lo que la expectativa de ,
los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria de
4.3.A Juegos con parloteo (cheap-talk games)
equilibrio, los empresarios empiezan el segundo periodo creyendo que la
probabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).
Los juegos con parloteo son análogos a los juegos de señalización, pero en
La autoridad monetaria de tipo c escoge entonces su inflación óptima para'
aquellos juegos los mensajes del emisor consisten en un mero parloteo (ca-
el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],fina- (i.
rente de coste alguno, que no es vinculante, y cuyo contenido son declara-
lizando con ello el juego. Para completar la descripción de este equilibrio,
ciones no verificables), Tal parloteo no puede ser informativo en el juego
queda (como siempre) definir las conjeturas del receptor fu~~a del equi-. de senalizacióh' de 'Spence: un trabajador que simplemente anuIlciara ,
Iibrio para calcular las correspondientes decisiones fuera del equilibrio ~.'.
"mi capacidades ?Ita" nI? sería creído. Sin embargo, eIl otros c:ontéxfos:
utilizando (4.2.15), y comprobar que estas decisiones no crean ningún
este tipo de comiúücacióri previa puede ser informativo. Como ejemplo "
':
incentivo a desviarse del equilibrio para ningún tipo del emisor.
sencillo, consideremos las posibles interpretaciones de la frase "sube la
En un equilibrio de separación, los dos tipos escogen niveles de in- bolsa"? En aplicaciones conrrf1iyor interés económico; Stein' (1989)'dec-
flación diferentes en el primer periodo, digamos 7[D y 7rF, por lo que la muestra que las meras declaraciones de la autoridad monetaria pueden
expectativa de los empresarios en el primer periodo es 7rí = P7[D+(1-phF. ser informativas aunque no puedan ser demasiado precisas, y Matthews
Después de observar 7[D, los empresarios empiezan el segundo periodq' (1989)estudia cómo una amenaza de veto por parte del presidente de los
creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9 Estados Unidos puede influir en la forma corno se aprueba el presupuesto,
modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo débil e~coge ei1~ en el Congreso norteamericano. Además de analizar elefecto,delparl6~
tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~
teo en:un contexto determinado, uno también puede preguntarse cómo
completar la descripción de este equilibrio,. no.'sólo queda, corno antes~
diseñar contextos para' aprovechar esta forma de comunicación~ En 'este
detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~
sentido, Austen-Smith (1990) demuestra que, en algunos casos, debates
probar que ningún tipo del emisor tiene incentivos para desviarse, sino
entre legisladores que actúan según su propio inh;rés acaban mejorando el
también comprobar que ningún tipo tiene incentivos pala imitar el cmn-,
valor social de la legislación que se aprueba, y Farrelly Gibbons (1991)de-
pOltamiento en equilibrio del otro. Aquí, por ejemplo, el tipo débil podría
muestran que, en algunos casos, la implantación sindical en uIla empresa
pensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !ª
mejora el bienestar social' (a pesar de la distorsión que crea:n el nivel .de
expectativa de los empresarios en el segurido periodo fuera 7[2(0),pero
empleo descrita en la sección2.1.C) porque facilita la coIIÍünicaciónentré
escoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuera la fuerza de trabajo y la dirección." ,c, ..
emisor, TI, envía un mensaje mI, mientras que otro subconjunto de tipos; de las fuerzas básicas que operan en los juegos con parloteo. En esta
sección, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamos
T2, envía o.tro mensaje, m2. (Cada Ti podría contener sólo un tipo, como
en un equilibrio de separación, o muchos tipos, como en un equilibrio de sólo juegos abstractos con parloteo, dejando las aplicaciones como lectura
separación parcial.) En equilibrio, el receptor interpretará que mi viene de adicional.
Ti y tomará por tanto la decisión óptima, aú dada su conjetura. Come:,to" El desarrollo temporal del juego con parloteo más sencillo es idéntico
dos los tipos del emisor tienen las mismas preferencias sobre las acciones al del juego de señalización más sencillo; sólo cambian las ganancias.
a tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen esta
preferencia y enviarán el mensaje mI en lugar de m2, destruyendo con ello 1. El azar escoge un tipo ti del emisor, de un conjunto de tipos factibles
el equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teo T = {tlJ ... ,tI}, de acuerdo con una distribución de probabilidad pe!,;),
resultara. en un mensaje indicativo <leun saJaria,alto, mientras que otro donde p(ti) > O para cada í y p(tl) + ... + ]J(t[) = 1.
tipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqúier ni- 2. El emisor observa ti y escoge Ul1 mensaje mj de un conjunto de lnen-
vel d~ capacidad enviarían.el primer ni.ensaje~porlo que nópuede' existir
sajes factibles M = {mI,' .. ,mj}.
,un equilibrio en el que. el parloteo afecte los salari()s. 3. El receptor observa mj (pero no ti) y escoge entonces una acción (J.k de
, Por 10 tanto, para que el parloteo sea informativo, una condición nece- un conjunto de acciones factibles A = {al,' .. ,al(}.
saria es que diferentes tipos del emisor tengan preferencias diferentes en 4. Las ganancias vienen dadas por U E(tiak) y U R(tiak).
relación con:las acciOliesdeLreceptor, Una segunda condición necesaria,
por supuesto, es que el.receptor prefiera acciones¡,giferentesdependiendo
del ti'pó:del emisor .. (Tanto la señálizacióncomQ;ja.comurucaciónp~yia La característica clave de este juego es que el mensaje no tiene efecto di-
son inútiles si las preferencias del receptor sobre sus acciones' son inde~ recto rusobre la ganancia del emisor ni sobre la del receptor. La única
pendientes del tipo del emisor.). Una terceracondicióitnecesaria para que manera en la que el mensaje puede importar es a través de su contenido
el parloteo sea 'informativo es que las preferencias del receptór sobre sus informativo: cambiando la conjetura del receptor sobre el tipo del emisor,
acciones nlJ sean completamente opuestás alasd~emisor. Para adelantar un mensaje puede cambiar la decisión del receptor y, por tanto, afectar
',.' un último. ejemplo,supongamos que elr~~epto{prefiere.acciones bajas indirectamente a las ganancias de los dos jugadores. Como la misma infor-
cuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemi- mación puede ser comurucada en diferentes lenguajes, diferentes espacios
sores de tipos bajos prefieren acciones baja~ y los de tipos altos acciones de mensajes pueden alcanzar los mismos resultados. El espíritu del parlo-
altas, puede haber comunicación, pero si efemisor tiene ias preferencias teo es que puede decirse cualquier cosa; en consecuencia, formalizar este
opuestas no puede existir comunicación, ya que al emisorle gustaría cone concepto exigiría que M fuera un conjunto muy grande. Por el contrario,
fundir al receptor. Crawford y Sobel (1982) élIlalizanunmodelc5 abstracto suponemos que M es lo suficientemente rico para decir lo que haga falta
,,/
que satisface estas tres condiciones necesarias y establecen d()s resultados decir; es decir, M = T. Para los propósitos de esta sección, este supuesto
intuitivos: en términos informales, puede existir más comunicación por es equivalente a permitir que se diga cualquier cosa; sin embargo, para
medio del parloteo cuando las preferencias. de las jugadores están más los propósitos de la sección 4.4 (refinamientos del equilibrio bayesiano
íntimamente relacionadas, pero no puede existir comunicación perfecta a perfecto), este supuesto debe ser reconsiderado.
no ser que las preferencias de los jugadores estén perfectamente alineadas .. Puesto que los juegos con parloteo y de señalización más sencillos
tienen el mismo desarrollo temporal, las definiciones de equilibrio ba-
Cada una de .las aplicaciones económicas que acabamos de. describir
(parloteo por parte de la autoridad monetaria, amenazas de veto, debates yesiano perfecto en los dos juegos son también idénticas: un equilibrio
parlamentarios y presencia sindical) incluyen no sólo un juego sencillo bayesianó perfecto con estrategias puras en un juego con parlol<;:oes un
con parloteo sino también una modelizacion más completade un entorno par de estrategias m'(ti) y a'(mj), y una conjetura ¡.t(tdm) que satisfacen
económico. Analizar una de estas apii<:acionesexigiría describir no s<$loel los requisitos (1), (2R), (2E) Y (3) de señalización, aunque las funciones
juego sino también el modelo completo, lo que desviaría núestr<i atención de ganancias U R(túmj,o,k) Y U ECtú111.j,G.k) en los requisitos (2F,)y (2E) de
216/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4) Otras aplicaciones del equilibrio bayesimlO perfecto / 217
señalizac.ión son ahora equivalentes a URUi,a¡J y Udt."rtk) respectiva- Como en nuestra discusión anterior sobre las condiciones necesarias
mente. Sm embargo, una diferencia entre los juegos de señalización y los para que el parloteo sea informativo, hemos escogido las ganancias del
Juegos con parloteo es que en estos últimos siempre existe un equilibrio receptor de forma que prefiera la acción baja (aB) cuando el tipo del
de agrupación. Puesto que los mensajes no tienen un efecto directo sobre emisor es bajo (tB) y la acción alta mando el tipo es alto. Para ilustrar
las' . dI' .
> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, la
la primera condición necesaria, supongamos que los dos tipos del emisor
atírupaclOn es una. mejor respuesta del emisor. Puesto que los mensajes no tienen las mismas preferencias respecto de las acciones: x > Z e y > "w,
tIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor está por ejemplo, de forma que los dos tipos prefieren aB a aA' Entonces,
jugando agrupación, ignorar todos los mensajes es una mejor respuesta a los dos tipos les gustaría que el receptor creyera que t = tB, por lo
del receptor. Formalmente, sea a* la acción óptima del.receptor en un que el recepto~ no puede creer tal afirmación. Para ilustrar la tercera
equIlIbno de agrupación; es decir, a* es una solución de conciición necesaria, supongamos que las preferencias de los jugadores
son totalmente opuestas; z > x e y > w, .deforma que eltipo bajo:
del emisor prefiere laacción alta y el tipo alto la. baja, Ep.t()nces,aJB
le gustaría que el receptor <;reyera que t = tA, Y a tA le gustaría que
creyera que t. = tB, por lo que el receptor no puede creer ninguna de
Es.un equilibrio b.ayesiano perfecto de agrupación que el emisor juegue estas afirmaciones. En este juego con dos tipos y dos acciones, el único
cu::.qL1lerestrategI~ de agrupac~ón, que el receptor mantenga la conjetura caso que cumple la primera y la tercera condiciones necesariasesx. ~~.z
a F¡IOn pU') despues de cualqUler mensaje (en la trayectoria de equilibrio e y ~ 'W (los intereses ci~los jugadores están perfectamente alineados en
~ fuer~ de ella) y ~~e.~l receptor tome la acción a* después de cualquier el sentido de que, dado el tipo del emisor,jos jugCl~~rescoincideIl~l1Ja
len~aje. La cuestion mteresante en un juego con parloteo, por tanto, es acción que debería tomarse) .. ' Formalmente, en un equilibrio bayesiano
SI eXIsten equilibrios de no agrupación. Los dos juegos abstractos con perfecto de separación de este juego COI1 parloteo, la estrategia del emisor:
~arloteo 5ue discutimos a continuación ilustran sobre los equilibrios de es [mUB) = tB,m(tA) ~ tAL las conjeturas deL receptor son¡.t(tB!tB)."")
separaclOn y de agrupación parcial respectivamente. . y¡.t(tB\tA) = 0, y la estrategia del receptor. es [a{tB)= aB,aUA) ,= aA]'
Em,pezamos con un ejemplo con dos tipos y dos acciones' T = {t t } Para que estas estrategias y conjeturas formen un equilibrio, cada tiPe>del
P l( ) " B, A ,
emisor, tú debe preferir de~iI:la verdad, induciendo con ello la accióI.\ui'
ro) tB ~ p, y A = {aB,a.,!}. Podríamos utilizar un juego de señalización
COl~dos tIpO.S,dos mensajes y dos acciones, análogo al de la figura 4.2,1 a mentir, induciendo con ello aj. Por lo tanto, un equilibrio cieseparación
pal a descnblr las ?anancias en este juego con parloteo, pero las ganancias existesiysólosix;:::iey~w.' .. ~ . ,';.,
del par .(t¡,ak) son mdependientes de qué mensaje fue escogido, por lo que Nuestro segundo ejemplo es un caso eSpecial del model~ de Craw-
descnblmos los pagos utilizando la figura 4.3.1. La primera ganancia en ford y Sobe!' Ahóra, lás espacios de tipos; mensajes y acciones son con-
cada caSIlla es la del emisor, y la segunda la del receptor, pero esta figura tinuos: el tipo del emisor se distribuye unifórni.emente entre cero y uno
//0 es un juego en forma normal, simplemente recoge las ganancias de los (formalmente, T = [0,1] Y p(t) = 1 para todo.terrT);,e1'espacio de men-
jugadores para cada par tipo-acción. sajes es el espacio de tipos (M = T); y el espacio de acciones es el inter-
valo de cero a uno (A = [0,1]). La furiCión de ganancias del receptor es
', .... '
UR(t,a) = -(a - t)2, Y la del emisor es UB(t,a) :"':"-[a ~ (t+ b)]2, de forma
tB tA
que cuando el tipo del emisores t, la acción óptima del receptor es a ';"t,
aB 1:,1 y,O a.
pero .1i:i acdón óptiina' del' e-mi'sores =- t + b. Por 10 tanto, diferentes
(LA Z,O "W,1 tipos dei emisor tienen diferentes preferencias respecto de las acciones
del receptor (más precisam~nte, tipos altos prefieren acciones altas), y \',"
los jugadores, cuando b está cerca de tero los intereses de los jugadores o Xl = 0/2) - 2&, Como el espacio de tipos es T = [0,1], T] debe ser
están más alineados),
positivo, por lo que un equilibrio de dos escalones existe sólo si .') < 1/4;
Crawford y Sobel demuestran que todos los equilibrios bayesianos para &:?: 1/4 las preferencias de los jugadores son demasIado cl1ferentes
perfectos en este modelo (yen una amplia clase de modelos relacionados) , para permitir incluso esta comunicación tan limitada.
son equivalentes a un equilibrio de agrupación parcial dé la siguiente
forma: el espacio de tipos está dividido en n intervalos [O,.');I),[XI,X2),' ."
[xn_l,l]; todos los tipos en un mismo intervalo envían el mismo mensaje, Punto medio
pero tipos en intervalos diferentes envían mensajes diferentes, Como
indicamos anteriormente, un equilibrio de agrupación (n = U'siempre
existe, Demostraremos que, dado el valor del parámetro de similitud de
preferencias b, ,existe uh número máximo de intervalos (o "escalones")
que pueden darse en equilibrio, denotado poi n*(b), y existen equilibrios
de agrupación parcial para cada n = 1,2,. , . ,n*(b), Una disminución de b
a=l
aumenta n*(b) (en este sentido, puede haber más comunicación a través
del parloteo cuando las preferencias de los jugadores están más alineadas),
Además, n*(b) es finito para todo b > 0, pero tiende a' ihfimto cuando b
t+b
tiende a cero (no puede existir comunicaciónperfect<:i a:no ser que las
preferencias de los jugadores estén perfecti¥llénte'alineadas), U,(t,a)
Concluimos esta sección caracterizando este equilibrio de agrupación
parcial, empezando con un equilibrio de dos escalones (n = 2) como Figura 4.3.2
ilustración. Supongamos que todos los tipos en el escalón [O,XI)envían
.t l
un mensaje mientras los que están en [xI,l] enví~n otro., Después de
recibir el mensaje de los tipos [O,XI),el receptor creE;;ráque el emisor está
distribuido uniformemente en [O,XI),poi 10 que su'.acción óptima será Para completar la discusión de este equilibrio de dos escalones, trata-
xJ/2;del mismo modo, 'después de recibir el mensaje de los tipos [Xi,l], mos el tema de los mensajes que están fuera de la trayectoria de equilibrio.
:' Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~e
".;.' la acción óptima del receptor será (Xl + 1)/2. Para que los tipos en [O/Xl)
,"
,,' quieran enviar su mensaje, debe pasar que todos estos tipos prefieran la estos mensajes no existan: todos los tipos t < X] escogen un mensaje
",:,"
acción xJ/2 a (Xl + 1)/2; del mismo modo, todos los tipos por encima de aleatoriamente de acuerdo con una dish'ibución uniforme en [O,X]); todos
Xl deben preferir (Xl+ 1)/2 a X] /2. los tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con una
Puesto que las preferencias del emisor son simétricas con respecto a distribución uniforme en [xI,l]. Como hemos supuesto que M = '1', no
su óptima acción, el tipo t del emisor prefiere xJ/2 a (Xl + 1)/2si el punto hay ningún mensaje del que podamos estar seguros que no se enviará en
medio entre estas dos acciones es mayor que la acción óptima de ese tipo, equilibrio, por lo que el requisito 3 de señalización detemüna la conjetura
t + b (como en la figura 4.3.2),pero prefiere (x] + 1)/2 a Xl/2 si t + b es mayor del receptor después de cualquier mensaje posible: la conjetu.ra del recep-
que el punto medio. Por lo tanto, para que exista un equilibrio de dos tor después de observar cualquier mensaje de [O,X]) es que t se distribuye
escalones, Xl debe ser el tipo t cuya acción óptima t + b sea exactamente uniformemente en [O,XI),y la conjetura del receptor después de observar
igual al punto medio entre las dos acciones: cualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.
(El uso de distribuciones uniformes en la estrategia mixta del emisor no
dadas las subsiguientes estrategias de los jugadores, podemos obtener + ÓW2(Wl) . Prob{la empresa no acepta Wl pero acepta 1JJ2}
.
....} Al (wll7f)para un valor arbitrário de '11)1: empresas con 'Ir>max{ 7f*(-Wl,'U)2) + Ó . O. Prob{la empresa no acepta 71Jlni W2}'
,wt} aceptarán Wl y empresas-con 7f <~ax {7f*(Wl, W2), wt} lo rechazarán,
donde W2 es la oferta salarial del sindicato,en el segundo periodo W2(Wl). Nótese que Prob{la empresa acepta IUl}no es simplemente la probabilidad
Podemos ahora obtener f-l2(?rlwl);la éonjetura del sinc;licatoen el se- de que 7fsea mayor que Wl, sino la probabilidad de que 7fsea mayor que
gundo periodo en el conjunto de iÍ1.formaciónal que se llega si la oferta Wl 7fl('11)1):
del primer periodo es rechilza-dir. El requisito 4 implica que la conjetura
7fA - 7fl(Wl)
correcta es qué ?rosedistribuya uniformemente en [O,7f(Wl»), donde 7f(Wl) Prob{la empresa acepta w¡} =7fA
es el valor de 7f que hace que la empresa sea indiferente entre aceptar
Wl y rechazarlo para aceptar f;;ierta ópti~a del sindicato en el segundo La solución de este problema de optimización es wi, dado al principio del
periodo dada esta conjetura (concretamente, W"(7f(Wl» = 7f(wl)/2, como análisis, y ~i ywi, dados por 7f¡(llJÍ)Y W2(Wi> respectivamente,
obtuvimos en el problema de un periodo), Para ver esto, recordemos
que el requisito 4 establece que la conjetura del sindicato debe obt~nerse 4.3.C La reputación en el dilema de los presos repetido finitamenle
a partir de la regla de Bayes'y de la estrategia de la empr~sa. Por lo
tanto, dada la primera parte-de la estrategia de la empresa A1(WII7f)que En el análisis de los juegos con información completa repetid~s finitaJ~el.'te
acabamos de hallar, la conjetura del sindicato debe ser que los tipos que de la sección 2.3.A, demostramos que si un juego de etapa tIene un UnJco
quedan en el segundoperiode;se distribuyen uniformemente eiJ.[O,7fl], equilibrio de Nash, cualquier juego repetido finitamente basa~o en este
donde?rl =max{ 7f*(W},W2),Wt} y W2 es la oferta salarial del sindicato en juego de etapa tiene un único equilibrio de Nash perfecto el~~u~Juegos: en
el se~do periodo W2(Wl).Dáda esta conjetura, la oferta óptima del sin- cada etapa, después de cualquier historia, se juega el eqUIlIbno de Nash
dicato en el segundo periodo debe ser W"(7fl) = 7ft/2, lo que proporciona del juego de etapa. En contraste con este resultado teórico, buena parte. ~e
una ecua,q.ón implícita de 7flen,función de Wl: la evidencia experimental sugiere que frecuentemente se da cooperacJOl1
(.
estrategia, pero con probabilidad p las ganancias del jugador son tales pas en las que ambos jugadores cooperan es grande. (KMRWestablecen
que la estrategia del Talión domina a cualquier otra estrategia del juego su resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~e
repetido. (La exposición se complica bajo este supuesto, porque una des- pueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~l
viación de la estrategia del Talión no hace que sea información del dominio argumento de KMRW son: (Osi el jugador fila se desvía de la estrategia
público que el jugador es racional.) Estas ganancias difieren de las que se del Talión,.pasa a ser información del dominio público que el jugador es
suponen nomlalmente en los juegos repetidos: para que la inütación de la racional, por lo que ningún jugador' cooperará en lo sucesivo, de manera
decisión previa del jugador columna sea un óptimo, las ganancias en este que el jugador fila racional tiene un incentivo para imitar la estrategia del
periodo del jugador fila deben depender de la jugada del jugador columna Talión, y (ii) dado un supuesto que i.I;npondreJI,t,osmás, adelante sobre las
en el periodo anterior. Como tercera posibilidad (de nuevo a costa de sa- ganancias del juego de etapa, la mejor respuest¡¡ del jugador columna a la
crificar simplicidad expositiva), se podría permitir que un jugador tuvief~ ~stategia del Talión sería coope~ar hasta. la última etapa del juego. .
información privada sobre sus ganancias en el juego de etapa, per()i~istir Para entendeú:uálésson los elementos básicos del modelo de KMWR,
8 Demo>tramos en la sección 2.3.Bque puede existir cooperación en el dilema de ló~pre'sos
con~iderarem~s eicompieII1ertt?riricie su ~áliSis:.en lugar de suponer q~e
repetido infinitamente. Algunos autores se refieren a tal equilibrio como un equilibrio de p es baja y analizar los juegos rep,etldc,>sdelarga duración, supondremos
"reputación", aun cuando las ganancias y oportUnidades de ambos jugadores son información qlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de
del dominio público. Por claridad, se podría describir ese equilibrio cómoun:~qciIibri~
.un juego repetido corto en el qud9!i dos jugadores cooperen en todas las
basado en "amenazas y promesas", reservando el término "reputación" a los jt¡egb~ 'en'los
que al menos un jugador tiene algo que aprender sobre otro, como ocurre en esta sección: ., etapas menos
.
en las dos
. .
úl9~Ilél.~,Empezamos con el caso de dos periodos.
Olras aplicaciones riel equilibrio bayesillllO perfecto / 231
230 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
2. Los jugadores fila y columna juegan al dilema de los presos. Sus Jugador racional fila NC NC
decisiones en esta etapa pasan a ser información del dornini.o público.
Jugador columna X NC
3. Los jugadores fiJa y columna juegan al dilema de los presos por se-
gunda y última vez.
4. Se reciben las ganancias. Para el jugador fila racional y el jugador Figura 4.3.5
columna éstas son la suma (sin descuento) de sus ganancias enJas dos
etapas. El juego de etapa se presenta en la figura 4.3:4.
Para hacer de este juego de etapa un dilema de los presos, suponemos que 1=1 1=2 1=3
a > 1 yb < O.KMRWtambién suponen que a + b < 2,de forma que (como
"o ";
indicamos anteriormente en (ii» la mejor respuesta del jugador columna Estrategia del Talión C C C
a la estrategia del Talión es cooperar hasta la últíini'etápa del juego; en NC
Jugador racional fila C NC
lugar de ir alternando entre cooperar y no cooperar.
Jugador columna C C NC
Columna
Cooperar,No coop~rar Figura 4.3.6
-, .,:
Jugador columna NC NC NC
Figura 4.3.8
Figura 4.3.7
Dada (4.3.2), una condición suficiente para que el jugador columIla no se
desvíe 'es ' , ';!
Nos ocupamos ahora de si el jugador columna tiene algún inéentivo
para desviarse. Si el jugador columna no coopera en el primer periodo;
la estrategia del Talión tampoco lo hará en el segundo, y el jugador fila a+b:::;1. '(4.3.4)
~'acional no cooperará en el segundo periodo, porque es' seguro que' el Hemos demostrado que si (4.3.2), (4.3.3)y (4.3.4) se cumplen, el desarrollo
Jugador columna no lo hará en el último periodo. No habiendo cooperado del juego descrito en la figura 4.3.6 es la trayectoria de equilibrio de un
,en el primer periodo, el jugador columna debe decidir si cooperar o no equilibrio bayesiano perfecto del dilema de los presos con tres periodos. (,
en ~l segundo periodo. Si el jugador columna no coopera en el segundÓ Dado un valor dep, las ganancias ay b satisfacen estas tres d'esigualdades
?enodo, la estrategia del Talión tampoco lo hará en el tercero, por lo queel si pertenecen a la región sombreada' d&la;figura 4.3.9. A medida que p
Juego se desarrollará corno indica la figura 4.3.7. La ganancia deljugador tiende a cero, la regtónsombreadaq,esapare.ce,consistentemente con la
columna por esta desviación es a, que es menor que su ganancia esperada observación anterior de queeri~stasecci6nanalli:amos la cooperación en
en equilibrio siempre que
el equilibrio en juegos cort~s con valores altos de p, mientras que KMRW
~e centran en juegos de larga duración con valores bajos de p. Por otra
1 + p + (l - p)b + pa ~ a. parte, si p es lo suficieht~mentealta. como para sustentar la cooperación
en un juego corto, es suficientemente' alta para hacerlo en un juego largo.
Otras aplicaciol1es del equilibrio bayesiano perfecto / 235
234 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
Formalmente, si a, by p satisfacen (4.3.2), (4.3.3) Y (4.3.4), para cualquier en el periodo T - 1, o (T - t - 1) + u, por lo que no cooperar no resulta
T > 3 finita existe un equilibrio bayesiano perfecto en el juego repetido T rentable para ningún t < T - 1. El argumento referente a.la figura 4.3.5
periodos, en el cual el jugador fila racional y el jugador columna cooperan implica que el jugador fila racional no tiene incentivos para desviarse en
hasta el periodo T - 2, tras el cual los periodos T - 1 Y T son tal como se los periodos T - 1 o T.
describen en la figura 4.3.5. (Véase el apéndice para una demostración de Demostramos a continuación que el jugador columna no tiene incenti-
esta afirmación.) vos para desviarse. El argumento referente a la figura 4.3.5 significa que el
jugador columna no tiene incentivos para desviarse cooperando hasta el
periodo T - 2 Ydejando de cooperar en el periodo T -1; el argumento re-
b a=l a=l/(l-p) ferente a la figura 4.3.6 implica que el jugador columna no tiene incentivos
para desviarse cooperando hasta el periodo T - 3 Y dejando de cooperar
a en el periodo T - 2. Por lo tanto, necesitamos demostrar que el jugador
columna ha tiene incentivos para desviarse cooperando hasta el periodo
t - 1 Y dejando de cooperar en el periodo t, donde 1 ::; t ::; T - 3.
Si el jugador columna no coopera en el periodo t, la estrategia del
Talión tampoco lo l~ará en el periodo t+ 1, por 10 que el jugador fija racional
tampoco lo hará (ya que no cooperar domina estrictamente a cooperar en
b = -p/(l-p) la (t + 1)-ésima etapa del juego, después de lo cual no cooperar de t + 2
a T proporciona una ganancia cero como mínimo, mientras que cooperar
en t + 1 haría que fuera información del dominio público que el jugador
fila es racional, resultando en una ganancia de exactamente cero a partir
Figura 4.3.9 de t.+ 2 hasta T). Dado que tanto la estrategia del Talión como el jugador
fila racional cooperan hasta elperiodo t y dejan de cooperar en el periodo
Apéndice t + 1, la conjetura del jugador columna al principio del periodo f; + 2 es
. ~
"'c ", que la probabilidad de que el jugador fija sea la estrategia del Talión es
p. Por lo tanto, si el jugador columna coopera en el periodo t + 1, el juego
Por razón de brevedad, nos referiremos a un e4u¡libri~~1yeSianoperfedO
del dilema de los presos repetido T periodos, como un equilíbrio cooperativo de continuación que etnpiezaen el periodo t + 2 será. idéntico a un juego
si el jugador fila racional y el jugador columna cooperan hasta el periodo de T periodos con T = T - (t + 2) + l. Por la hipótesis de inducción; existe
T - 2, tras lo cual los periodos T - 1 Y T se describen en la figura 4.3.5. un equilibrio cooperativo en este juego de continuación de T periodos;
Vamos a demostrar que si Ct, by p satisfacen (4.3,2),.(4.3.3) y (4.3.4), existe supongamos que se juega este equilibrio. Entonces1a ganancia del jugador
~nequilibrio cooperativo para cada T.;> :3 finito. Argumentamos por columna en los periodos t a T por no cooperar en el periodot y.cooperar
mducción: dado que para cada T = 2, 3, ... ,T ~ 1 existe un equilibrio coo- en el periodo t + 1 es
perativo en el juego con T periodos, demostramos que existe un
equilibrio
cooperativo en el juégo con T periodos.;. .... ..' a + b + [T - (t + 2) - 1] + 11 + (1 - p)b + pa,
Demostramos primero que el jugador fila raCio~~l no tiene incentivos
que es menor que la ganancia de equilibrio del jugador columna en los
para desviarse del equilibrio cooperativo en el juego con T periodos, Si
el jugador fila no fuera a cooperar en ningún periodó t < T'- 1, llegaría a periodos t a T,
ser del dominio público que el jugador fila esracional, por ló que recibiría
2 + [T.- (t + 2) - 11 + p + (1 - p)b + pu. (43.5)
una ganancia a en el periodo t y cero en cada periodo siguiente. Pero la
ganancia en equilibrio del jugador fila es 1 en los periodos t a T - 2, Y a
D6 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA Ce. 4) Refinamientos del equilibrio bayesimlO perfecto / 237
Hasta ahora hemos demostrado que el jugador columna no tiene in- el jugador 1 C es una estrategia estrictamente dominada: la ganancia de 2
centivos para desviarse cooperando hasta el periodo t - 1 Y dejando de por utilizar D es mayor que cualquiera de las ganancias que el jugador 1
cooperar en el periodo t, dado que se jugará el equilibrio cooperativo en recibiría por utilizar C, O y 1. Por tanto, no es razonable que el jugador 2
el juego de continuación que empieza en el periodo t + 2. Más en general, crea que el jugador 1 puede haber elegido C; formalmente, no es razonable
el jugador columna podría cooperar hasta el periodo t - 1, no cooperar que 1 - p sea positivo, por lo que p debe ser igual a 1. Si la conjetura
en los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Hay 1 - p > O no es razonable, tampoco lo es el equilibrio bayesiano perfecto
tres casos que son triviales: (1) si t + s = T (es decir, si el jugador columna (D,D',p ::;1/2), quedando (I,I',p = 1) como el único equilibrio bayesiano
nunca coopera después de no haberlo hecho en el periodo t), la ganancia perfecto que satisface este requisito.
es a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) si
t + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor que D
en (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l' 2
es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valores 2
de ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior con
s = O, existe un equilibrio cooperativo. en el juego de. continuación que
empieza en el periodo t + s + 2; supongamos que se juega este equilibrio.
Entonces, la ganancia del jugador columna en los periodos ta T por jugar
esta desviación es
---------------2 ------7
a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+ pg,
3 o 1 o
que es, de nuevo, menor que (4.3.5). 1 O O 1
Figura 4.4.1
4.4 Refinamientos del equilibrio bayesiano perfecto
En la sección 4.1 definimos un equilibrio bayesiano perfecto como las es- Otras dos características de este ejemplo merecen una breve mención.
trategias y las conjeturas que satisfacen los requisitos 1 a4, y'observamos En primer lugar, aunque C está estrictamente dominada, 1 no. Si Eestu~
que en tal equilibrio ninguna estrategia de ningún jugador puede estar es- viera estrictamente dominada (corno ocurriría si la ganancia de 3 por parte
trictamente dominada a partir de ningún conjunto de información. Ahora del jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicaría que
consideramos dos requisitos adicionales (sobre conjeturas fuera de la tra- no es razonable que p sea positiva, lo que implica que p debe ser cero, pero
yectoria de equilibrio), el primero de los cuales formaliza la idea siguiente: esto contradiría el resultado anterior de que p debe ser uno.,.En tal caso,
puesto que un equilibrio bayesiano perfecto impide que el jugador i jue- este requisito no restringiríé! lqs conj~turas fuera del equilibrio d~i jugador
glIe una estategia estrictamente dominada a partir de algún conjunto de 2. (Véase la definición formal'que damos más adelante)
,.1 .,_,'
, .í ..
. o. •
información, no es razonable que el jugador j crea que i utilizará esa En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicial-
estrategia. mente, porque C no sólo está estrictamente dC;IDinadaa partir de algún
Para concretar más esta idea, consideremos el juego de la figura 4.4.1. conjunto de info~ación, sino estrjctarr;f~t~~ominada en el sentido más
Existen dos equilibrios bayesianos perfectos en estrategias puras: (I,I',p = ." ~.
1) y (D,D',p ::; 1/2).9 La característica clave de este ejemplo es que para extensiva, ambos equilibrios de Nash sOn perfectos en subjuegos. En u,1') el conjunto de
información del jugador 2 está en la trayectpri", de equilibrio, por lo que el requisito 3 establece
. 9Derivar la representación en forma nonnal revela que existen en este juego dos equili- que p = L En (D,D') este conjunto d~ infqrm,!.ción está fuera de la trayectoria de. equilibrio,
bnos de Nash con estrategias puras: ([,JI) y (D,D/). Puesto que no hay subjuegos en la forma pero el requisito 4 no impone ningúna restricción a p. Por lo tanto, sólo requerimos que la
conjetura p de 2 haga que la acción D' sea óptima, es decir, p ~ 1/2.
Refil1amiel1lus riel equilibrio bayesial10 perfecto / 239
238 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)
Figura 4.4.2
Definición. Consideremos un conjunto de información en el cual le toca deci- Corno segunda ilustración del requisito 5 consideremos el juego ele
dir al jugador i:" La estrategia s; está estrictamente dominada a partir de señalizacion de la figura 4.4.2. Al igual que en la sección 4.2.A, la estrate-
este conjunto de. información s(existe otra estrategia Si tal que, para cada gia del emisor (m',m") significa' que el tipo t1 elige el mensaje m' y el tipo
conjetura que pudiera fonnarse i 'e-n el conjunto de información' dado, y para t2 elige m",y la esti:ategiá elel receptor (a' ,a") significa que el receptor elige
cada posible combinación' de las esttaiegiils subsiguientes de .los otros jugadores la acción a' siguiendo a J y a" siguiendo a D. Es inmediato comprobar que
(donde una "estrategia subsiguiente" es un plan completo de acción que cubre las estrategias y conjeturas [(I,I),(7J"d),p = O,5,q] constituyen un equilibrio
cada contingencia que pudiera presentarse una vez se ha alcanzado el conjunto bayesiano perfecto ele agrupación para cualquier q ~ 1/2. Sin embargo, la
de inforrr;zacióridado) la ganancia esperada de i al tomar la acción indicada por Si característica esencial de este juego de señalización es que no tiene sentido
en el conjunto de información dado 'y al jugar la estrategia subsiguiente indicada que t1 elija D. Formalmente, las estratégias del emisor (D,I) y (D,D) (es
por Si és :estr,ictamente ;nayor que la ganancia esperada al tomar la acción y jugar decir, las estrategias en las cuales tI elige D) están estrictamente domj-
la estrategia subsiguiente especificadas por s;.
2-10/ jGEGOS DIN;Í;¡;IICOS CON INFOR¡;.L..•.CIÓN INCOMPLETA (e. 4)
Refinamientos del equilibrio bayesiano perfecto / 241 ....
nadas a partir del conjunto de información del emisor correspondiente a en lugar de Oy 1 como en la figura 4.4.2. Ahora [(I,I),(u,d),p = 0,5,q] es
Por lo tanto, el nodo t¡ en el conjunto de información del receptor que
ti .10 un equilibrio bayesiano perfecto de agrupación para cualquier valor de
sigue a O se alcanza sólo si el emisor utiliza una estrategia que esté estric- q, por lo que [(I,I),(u,d),p = O,5,q = O]es un equilibrio bayesiano perfecto
tamente dominada a partir de algún conjunto de información. Además, que satisface el requisito 5 de señalización.
el nodo t2 en el conjunto de información del receptor que sigue a D puede En algunos juegos, existen equilibrios bayesianos perfectos que pare-
alcanzarse por medio de una estrategia que no está estrictamente domi- cen poco razonables y sin embargo satisfacen el requisito 5. Una de las
nada a partir de algún conjunto de información, concretamente U,D). Por áreas de investigación más activas en teoría de juegos se ha preocupado
In tanto, el requisito 5 establece que q = O. Como [U,I),(n,d),p = 0,5,q] es de las dos siguientes cuestiones: (i) cuándo es un equilibrio bayesiano
un equilibrio bayesiano perfecto sólo si q 2 1/2, tal equilibrio'no puede perfecto poco razonable y (ii) qué requisito adicional puede añadirse a
cumplir el requisito 5. la definición de equilibrio para eliminar estos equilibrios que no son ra-
Un modo equivalente de imponer el requisito Sal equilibrio baye- zonables~ Cho y Kreps (1987) hicieron una contribución original y muy
siano perfecto del juego de señalización definido en la sección 4.2.A es el influyente en está área. Vamos él concluir esta sección discutiendo tres
siguiente. aspectos de su trabajo: (1) el ju~go de señalización "cerveza y quiche",
que ilustra cómo ciertos equilibrios bayesianos perfectos quena son ra-
Definición. En un juego de señalización, el mensaje mj de lvI está dominado zonablespueden satisfacer el requisito 5 de señalización; (2) una versión
para el tipo ti de T si existe otro mensaje mj de M tal quela menor ganancia más fuerte (pero de ninguna manera la más fuerte posible) del requisito 5
posible de ti por utilizar mj es mlÍs alta que la mayor ganancia posible de ti por de señalización, llamada el criterio intuitivo; y (3) la aplicación del criterio
utilizar mj: intuitivo al juego de señalización en el mercado de trabajo de Spence ....
min U E(ti¡m j' ,CLk) > max U E(túmj,ak)' 1,1 Cobardica 0,1
akEA ukEA Duelo Duelo
Req uisito 5 de señalización. Si el conjunto de información que sigue a 'mj está [pI Quiche t, Cerveza [ql
fllera de la trayectoria de equilibrio y mj está dominado para el tipo ti, entonces ..
,
,
(si es posible) la conjetura del receptor j1.(t.; Imj) debería asignar ~robabilidad cero No : 0,5
al tipo ti. (Esto es posible siempre que m] no esté dominado para todos los tipos 3,0 .,, 2,0
,,
en T.) ,,
Receptor , Azar Réeeptor
,,
,, "
En el juego de la figura 4.4.2, el equilibrio bayesiano perfecto de separación ,, "::'"
rU,D),(u,n),p = 1,q = O]satisface el requisito 5 de señalización trivialmente 0,-1 1,-1
Duelo: , 0,5 Duelo
(porque no hay conjuntos de información fuera de esta trayectoria de ,
,
equilibrio). Como ejemplo de un equilibrio que satisface el requisito
5 de señalización de forma no trivial, supongamos que se invierten las
No
[l - pI Quiche 1, Cerveza [1 - qI
No
~:
...
ganancias del receptor cuando el tipo t2 juega D: 1 por jugar d y Opor'u, 2,0 Malas pulgas 3,0
10 Como el conjunto de infonnadón del emisor COITespo~diente a tI sólo tiene un elemento, Figura 4.4.3
las conjeturas del emisor no juegan ningún papel en la definidón de dominancia estricta a
partir de este conjunto de inforrnadón. Demostrar que (D,n y (D.D) están estrictamente
duminadas a partir de este conjunto de información se reduce a ofrecer una estrategia alter-
En el juego de señalización "cerveza y quiche", elemisor es uno de los
nativa al emisor que proporcione la ganancia mayor a tI para cada estrategia que el receptor dos tipos: t¡ ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"
pudiera jugar. (l,D) es esa estrategia: proporciona 2 a tI en el peor de los casos, mientras que (con probabilidad 0,9). El mensaje del emisor es su elección de cerveza
(D,)) y (D,D) propordonan 1 en el mejor de los casos.
c.
Refinamientos del equilibrio bayesimlO perjec/o / 24:1
242 / JUEGOS DINÁMICOS CON lNFORMAClÓN INCOMPLETA Ce. 4)
o quiche para desayunar; la acción del receptor es decidir si batirse en Si este discurso fuera creído, establecería que q = 0, lo que es incom-
duelo o no con el emisor. Las características cualitativas de las ganancias patible con este equilibrio bayesiano perfecto de agrupación.
.. ', son que el tipo cobardica preferiría tomar quiche para desayunar, el malas Podemos ahora generalizar este argumento a la clase de juegos de
'" ..:.; señalización definida en la sección 4.2.A; con ello obtenemos el requisito
pulgas preferiría cerveza, ambos preferirían no tener que batirse con el
emisor (y esto les importa más que sus desayunos), y el receptor preferiría 6 de señalización.
batirse con el cobardica antes que con el malas pulgas. (Por lo tanto,
utilizando la terminología más convencional para los tipos, mensajes; y Definición. Dado un equilibrio bayesiano perfecto en un juego de serlalizaciól1,
acciones, este juego podría ser un modelo de barreras de entrada, como el mensaje mj está dominado en equilibrio para el tipo ti de T si la gl7J1I1ncia
el de Milgrom y Roberts [1982].) En la representación en foÍmaeextensiva en equilibrio de tú que denotamos mediante U'(t;), es más alta que la mayor
de la figura 4.4.3, la ganancia por desayunar lo que se prefiere es 1 para ganancia posible para ti por utilizar 7)Ij:
ambos tipos del emisor, la ganancia adicional potevitar un duelo. es.de 2
para los dos tipos, Y las ganancias del receptor por, batirse en duelo con
el cobardica o con el malas pulgas son 1 o -1 respectivamente;. todas las
demás ganancias son cero. Requisito 6 de señalización. ("El criterio intuitivo", Cho y Kreps 198'7):
Si el conjunto de información que sigue a mj está fuera de la trayectoria de
En este juego, [(qui~he, quiche), (no~duel65, p''; Ó,9;q] es unequilibri¿ equilibrio y mj está dominado en equilibrio para el tipo tú entonces (si es lJOsilJle)
bayesiano perfecto de agrupación para q 2: 1tt~~dé.más, este equilibrio la conjetura del receptor IJ,(ti 1m) debería asignar probabilidad cero al tipa 1:;.
satisface elrequisit05de señalización,yaqu,é J~~lhYet~no estádominad~ (Esto es posible siempre que mj no esté dominado eH equilibrio para torios los
para ningiln tipo del emisor. En particular, nad¿' gár'ahtiza que el cobardica tipos de T.)
vaya a estar mejor por tomar quiche (una ganancia de 1 en el peor de los
casos) que portorriar cerveza (una ganariciade 2 en el mejor de los casos). Cerveza y quiche muestra que un mensaje mj puede estar dominado en
Por otra parte, la conjeturadel receptor fuera de léltraye~toria de equilibrio equilibrio para ti sin estar dominado para t;. Sin embargo, si mj está do-
parece sospechosa: si el receptor obserVa:inesp~}~dán;\ente que el emisor minado para tú mj debe estar dominado en equilibrio para tú por lo que
elige cerveza, concluye que es al menos tan próbable 'Itieel em~sor sea imponer el requisito 6 de señalización hace que el requisito 5 sea redun-
cobardica como que sea malas pulgas (es decir, q 2:1/2), aun cuando (a) dante. Cho y Kreps utilizan un resultado más poderoso debido a Kohlberg
el cobar~icano puede mejorar de ninguna manenl su ganancia de 3 en y Mertens(1986) para demostrar que cualqüier juego deseñalización de
equilibrio tomando cerveza en vez de quiche, mientras que (b) el malas la dase definida en la sección 4.2.A tiene un equilibrio bayesiano perfeetcJ
pulgas podría méjorar su ganancia de 2 en equilibrio y recibir una ganancia que satisface el requisito 6 de señalización. Se dice a veces que los argu-
de 3 si el receptor mantuviera la conjetura de que q < 1/2. Dados (a) y mentos de este tipo utilizan la inducción hacia delante, porque al interpretar
(b), cabría esperar que el malas pulgas escogiera cerveza y pronunciara el una desviación (esto es, al formarse la conjetura p,(t; ¡mj» el receptor se pre-
siguiente discurso: gunta si el comportamiento pasado del emisor podría haber sido racional,
mientras que en inducción hacia atrás se supone que el comportamiento
Verme escoger cerveza debería convencerte de que soy del futuro será racional,
tipo malas pulgas: escoger cerveza no podri'a de ninguna Para ilustrar sobre el requisito 6 de señalizaCión, lo aplicamos al caso
manera haber mejorado la ganancia del tipo cobardica, por con envidia del modelo de señalización en el mercado de trabajo, analizado
(a); y si escoger cerveza te convenciera de que soy del tipo en la sección 4.2.B.
.malas pulgas, e~tonces hacerlo mejoraría mi ganancia, por Recordemos que existe una enorme cantidad de equilibrios bayesia-
(b). nos perfectos de agrupación, de separación e luoridos en este modelo.
Sorprendentemente, uno de estos equilibrios es consistente con el rec¡ui-
.~,
/
, ~-'
(,,1
,','
2,1-1 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4) Refinamientos del eqllilibrio bayesial10 perfecto / 245 1,'.
sito 6 de señalización, el equilibrio de separación en el cual el trabajador cual el trabajador con capacidad alta escoge un nivel de educación e> es
;;',
con baja capacidad escoge el nivel de educación de información completa no puede satisfacer el requisito 5 de señalización, ya que en tal equilibrio ,
y el trabajador con capacidad alta escoge la educación mínima necesa- las empresas deben creer que J.l(Ale) < 1 para niveles de educación entre
ria para hacer que el trabajador con capacidad baja sea indiferente entre es y e. (Un enunciado preciso es: el requisito 5 de señalización implica
imitarle o no, como ilustra la figura 4.4.4. que J.l(Ale) = 1 para e > es siempre que e no esté dominado para el tipo
con capacidad alta, pero si existe un equilibrio de separación en el que el
trabajador con capacidad alta escoge un nivel de educación e > es enton-
1,
y (A,e) ces los niveles de educación entre es y e no están dominados para el tipo
w con capacidad alta, de forma que el argumento es válido.) Por lo tanto, el
único equilibrio de separación que satisface el requisito 5 de señalización
y(A, e,)----.-.----- es el equilibrio que se muestra en la figura 4.4.4.
Una segunda conclusión se deriva también de este argumento: en
cualquier equilibrio que satisfaga el requisito 5 de señalización, la utilidad
~Y(Bre)
del trabajador con capacidad alta debe ser como mínimo y(A,es) - c(A,e.).
A continuación demostramos que esta <;¡onclusiónsignifica que algunos
equilibrios lubridos y de agrupación no- pueden satisfacer el requisito 5
w*(B) de señalización_ Existen dos casos, dependiendo de si la probabilidad de
que el trabajador tenga capacidad alta (q) es lo suficientemente baja para
que la función de salario w = q . y(A,e) + (1- q) . y(B,e) esté por debajo de
e*(B) la curva de indiferencia del trabajador con alta capacidad que pasa por el
e. e
punto [e.,y(A,es)]'
Suponemos en primer l,ugar que q es baja, como se muestra en la figura
Figura 4.4.4 4.4.5. En este caso, :ningún equilibrio de agrupación satisface el requisito 5
de señalización, porque el trabajador con capacidad alta no puede alcanzar
En cualquier equilibrio bayesiano, si el trabajador escoge un nivel de la ~tilidad y(A,es) - c(A,es) en este equilibrio. Del mismo modo, ningún
educación e y las empresas creen en consecuencia que la probabilidad de eq~ilibrio lubrido en el que el trabajador con capacidadalta se comporte
que el trabajador tenga capacidad alta es ¡.t(Ale), el salario del trabajador aleat9riaIl1ente ?ª,tisface el requisito 5 de señalización, porque el punto
será (educación, salario) en el que hay agrupación en este equilibrio está por
debajo de la función de salario w = q. y(A,e) + (1 - q). y(B,e). Finalmente,
w(e) = ¡.t(Ale) . y(A,e) + [1 - J.l(Ale)] . y(B,e). :ningún equilibrio lubrido en el cual el trabajador con capacidad baja se
comporte aleatoriamente satisface el requisito 5 de señalización, porque
el punto (educación! salario) en el que hay agrupación en este equilibrio
Por lo tanto, la utilidad para el trabajador con capacidad baja al esco-
debe estar en la curva de indiferencia del trabajador con capacidad baja
ger e'(B) es corno mínimo yfB,e*(B)] - c[B,e*(B»), que es mayor que su
que pasa por el punto [e*(B),w*(B)], como en la figura 4.2.9, y está por
utilidad al escoger cualquier e > e., independientemente de lo que la
tanto por debajo de la curva de indiferencia del trabajador con capacidad
empresa crea después de observar e. Es decir, en términos del requisito 5
alta que pasa por el punto[es;y(A,es)]' Por lo tanto, en el caso de la figura
de señalización, cualquier nivel de educación e > es estádom:inado para
4.4.5, el único equilibrio bayesiano perfecto que satisface el requisito 6 de
el tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5
señalización es el equilibrio de separación que muestra la figura 4.4.4.
de señalización implica que la conjehlra de la empresa debe ser ¡.t(Ale) = 1
para e > e., lo que a su vez implica que un equilibrio de separación en el
Re!ill11111ielllos del equilibrio bayesiallo parcelo / 247
246 / JUEGOS DlNÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
y (A,e)
y (A,e)
w*(B)
w
y (A ,e, ) qy (A,e)
e*(B) e, e '
Figura 4.4.5
qy (A,e)
un "amigo" o un "enemigo" de un agente decisor desinformado en una
sucesión de juegos con parloteo. Finalmente, véase Cho y Sobel (1990)
para más información sobre refinamientos en los juegos de señalización,
incluyendo un refinamiento que selecciona el equilibrio de separación
eficiente del modelo de Spence cuando hay más de dos tipos.
y (B,e)
4.6 Ejercicios
a.
Figura 4.4.7 D
2
2
<0'
250 / JUEGOS DlNÁMfCOS CON INFORMACIÓN lNCOMPLETA (c. 4)
".,'
4.2 Demuéstrese que no existe ningún equilibrio bayesiano perfecto con
estrategias puras en el siguiente juego en forma extensiva. ¿Cuál es el
equilibrio bayesiano perfecto con estrategias mixtas?
1") b :
(1/3)
D
: b 0,0
D 1,0 :
,
2 Receptor , Receptor
2
2,1 • 1,1
a , a
1 1, D
(1/3)
, "
,."','.
'~4':.' b b
0,0 1,0
Receptor Receptor
3 O O k'
\$. ;t ¡
•• 0,0
O 1 1 O a Azar a
1 1, D
1,2 0,1
a a 4.4 Descnbanse todos los equilibrios bayesianos perfectos de agrupación y
1 1, D de separación con estrategias puras de los siguientes juegos de señalización.
b 0,5 b
3,0
a.
2,0 1,1 2,2
a a
Receptor 1 t, D
Receptor Azar
1,0 b 0,5 b
0,0 O,n
a 0,5 a 2,0
b,
30) IJ O
a
0,0
4.7 Dibújense las curvas de indiferencia y las funciones de producción
para un modelo de señalización en el mercado de trabajo con dos tipos.
Descríbase un equilibrio bayesiano perfecto hfbrido en el cual el trabajador
con capacidad alta se comporta aleatoriamente.
\.
0,5 b
1,1 , 4,1 4.8 Hállese el equilibrio bayesiano perfecto con estrategias puras en el
siguiente juego con parloteo. Cada tipo tiene la misma posibilidad de ser
Receptor Azar Receptor escogido por el azar. Como en la figura 4.3.1, la primera ganancia de cada
'.
casilla es la del emisor, y la segunda la del receptor, pero la figura no es
un juego en forma normal, sino que simplemente expresa las ganancias
'.
3,3. 1,2
a 0,5 a de los jugadores para cada par tipo-acción.
1 1, O
b b
0,1 2,0 ',',
0,1 0,0 0,0
1,0 1,2 1,0
4.5 Hállense todos los equilibrios bayesianos perfectos con estrategias
puras del ejercicio 4.3 (a) y (b). 0,0 0,0 2,1
4.6 El siguiente juego de señalización es análogo al juego dinámico con 4.9 Considérese el ejemplo del modelo con parloteo de Crawford y?obeI
infon11ación completa pero imperfecta de la figura 4.1.1. (Los tipos t¡ y discutido en la sección 4.3.A: el tipo del emisor se distribuye uniforri1e~
t2 son análogos a las jugadas 1 y e del jugador 1 en la figura 4.1.1; si
mente entre cero y uno (formalmente, T = [0,1] Yp(t) = 1 paratodo ten T);
el emisor escoge D en el juego de señalización, el juego se acaba, igual a
el espacio de acciones es el intervalo de cero uno (A = [0;1]); la furición
que cuando el jugador 1 escoge D en la figura 4.1.1.) Hállense (i) los de ganancias del receptor es UR (t,a) = - (a - t)2, Yla función de ganancias
equilibrios bayesianos de Nash con estrategias puras y (ti) los equilibrios del emisor es UE(t,a) = -[a - (t + b)]2. ¿Para qué v<ilóresdéb éxÍste:un
bayesianos perfectos con estrategias puras de este juego de señalización. equilibrio de tres escalones? ¿Es la ganancia esperada/del recepto~;már
Relaciónense (i) con el equilibrio de Nash y (ii) con el equilibrio bayesiano alta en un equilibrio de tres escalones que en uno de dos escalónes?'¿QUe
perfecto de la figura 4.1.1. tipos del emisor están mejor en un equilibrio de tres escalones que' eIi"t.mo
de dos escalones?
4.10 Dos socios deben disolver su sociedad. El socio 1 posee una par-
ticipación s en la sociedad, el socio 2 posee 1 - s.' Los socios están de
acuerdo en jugar el siguiente juego: el socio 1 anuncia un precio para la
sociedad, p, y el soci02 escoge entonces si comprar la participación de 1
por ps o vender la suya por pO - s). Supongamos que es información del
dominio público que las valoraciones de los socios de ser propietarios dé
toda la sociedad son independientes y se distribuyen uniformemente en.
[0,1], pero que la valoración deeada socio es información privada. ¿Cuál
es el equilibrio bayesiano perfecto?
.'
I\'.~J
Ejercicius / 255
254/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
Si el demandado rechaza 8, el demandante decide si ir a juicio, donde la (ii) determínese si el equilibrio puede ser sustentado por conjeturas que
ganancia del demandante será d - e y la del demandado -d, o retirar los satisfagan el requisito 6 de señalización (el criterio intuitivo).
cargos, en cuyo caso la gananéia cie ambos jugadores es cero.
En la etapa (3) si el demandante cree que existe una d* tal que el
demandad o aceptaría el acuerdo si y sólo si d > d*, ¿cuál es la decisión 4.7 Referencias
óptima del demandante con respecto al pleito? En la etapa 2, dada la
propuesta de acuerdo 8, si el demandado cree que la probabilidad de que AUSTEN-SMITH,
D. 1990. "Information Transrnission in Debate." American
el demandante vaya a juicio si 8 es rechazada es p, ¿cuál es la decisión ¡oumal o/ Political Science 34:124-52.
óptima para llegar a un acuerdo por parte del demandado de tipo d?
Dada una oferta s > 2c, ¿cuál es el equilibrio bayesiano perfecto del juego AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." Ame-
de continuación que comienza en la etapa 2? ¿Y dada una oferta s < 2c? rican Political Science Review 75:306-18.
¿Cuál es el equilibrio bayesiano perfecto del juego eompleto si e < J /3? BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lll-
¿Y si 1/3 < e < 1/2? fl~tion." National Bureau of13conornic Researeh Working Paper #3529
(December). .
4.15 Consideremos un proceso legislativo en el que las decisiones factibles
varían continuamente desde p = Ohasta p = 1. La decisión ideal desde el BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incom-
punto de vista del Congreso es e; pero el status quoes s, _dondeO < e < s < plete Information." ¡oumal o/ Monetary Economics 17:3-20.
1; es decir, la decisió;' ideal está a la izquierda del status quo. La deci¡;ión BHAITACHARYA; S. 1979. "Imperfect Information, Dividend Pólicy: ancÍ
ideal para el Presidente es ti que se distribuye uniformemente en [O,llpero the 'Bird in the Hand' Fallacy'" Bell ¡oumal of Economics 10:259-70: .. ,.. ~
es información privada del Presidente. El desarrollo temporal es simple: -.'
'.'
CHO, J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."
'-:. ~
.
el Congreso propone tma decisión p, que el presidente puede -ratificar
o vetar. Si p es ratificada las ganancias son -(e - p)2 para el congreso Quarterly ¡oumal of Economics 102:179-222.
y -(t - p)2 para el Presidente; si es vetada las ganancias son -(c - s)2 .':
CHO, l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signa- ¡:-',.
y ~(t - sf. ¿Cuál es el equilibrio bayesiano perfecto? Veriliquese que ling Carnes." ¡oumal o/ Economic Theory 50:381-413.
e < ji < s en equilibrio.
Supongamos ahora que el Presidente puede comunicarse (en el sentido CRAMTON, E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage BargainirÍg:
de enviar un mensaje del tipo que hemos llamado de parloteo).antes de Theory and Data." American Economic Review 82:100-21. '"
'i,;.
que el Congreso proponga una decisión. Consideremos un equilibrio v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."
CRAWFORO,
bayesiano perfecto de dos escalones en el que el Congreso propone PB o Econometrica 50:1431-51.
P.-I, dependiendo del mensaje que el Presidente envíe. Demuéstrese que tal
equilibrio no puede tener e < pa < PA < s. Explíquese por qué se deduce DYBVIG, E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevance
que no puede haber equilibrios que incluyan tres o más propuestas por with Asymmetric Information." Review o/ Financial Stlldies 4:201-19.
parte del Congreso. Derívense los detalles del equilibrio de d(?sescalones L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.
FARRELL,
en el que e = PB < PA < s: ¿qué tipos envían qué mensajes?, y ¿cuál es el
valor de PA.? (Véase Matthews, 1989.)_ FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium and
Sequential Equilibrium." ¡oumal o/ Economic Theory 53:236-60.
4.16 Considérese los equilibrios de agrupación descritos en el ejercicio 4.3 HARSANYI, J. 1967. "Carnes with Incornplete Information Played by Ba-
(a) y (b). Para cada equilibrio: (1)determínese si el equilibrio p~ecie ser yesian Players, Parts 1, n, and III." Management Science 14:159-82,320-34,
sustentado por conjeturas que satisfagan el requisito 5 de señalización; 486-502.
RefercI1cil15 I 259
258 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)
89-90,101-102,228n6
AN,\J.ÍTICO /263
l
Bhattacharya, S., 130, 248
véase también bayesiano, juego; bayesiano perfecto híbrido, equilibrio
Brandenburger, A., 47 en juegos repetidos finilamente con
información incompleta; ejercicio 4.7, 253
Brouwer, teorema de punto fijo de, 45 información completa, 82-86
bayesiano perfecto, equilibrio en señalización en el mercado de
Buchanan, J., 131 véase también repetido, juego
bayesiano dinámico, juego, véase trabajo, 205-207
Bulow, L 112, 130, 169 correlacionado, equilibrio, 35n 15
negociación, juego de; comunicación bayesiano perfecto con estrategias
correspondencia de mejor respuest~
previa, juego con; bayesiano mixtas, equilibrio
como función de mejor respuesl~,
perfecto, equilibrio; reputación; ejercicio 4.2, 250
colusión 42-43
señalización, juego de bayesiano perfecto de agrupación,
en el duopolio de Coumot definida, 36
bayesiano estático, juego equilibrio
dinámico, 101-106 de n jug~dores, 47
ejercicios 3.1-3.8,169-172 definición de, en juegos de
en modelos dinámicos de duopolio, intersecciones de, 39, 41
mecanismo directo;165 señalización, 190
105-10. representaciones gráfic~s de, 35, 38,
representación en forma normal de, ejercicios 4.3, 4.4, 4.16,250, 251, 256
véase también repetido, juego 42-44
146-50 ejemplo de, 191
compatibilidad de incentivos, 164-65 Cournot, A., 2, 11
subasta, 155-57 en juegos cOh p~r1oteo; 215~16
competencia internacional, 70 Coumot, juego de duopoli%ligopolio
en un juego de señalización de
subasta doble, 159-64 conjeturas. de
véase también bayesiano de Nash, estructura de capital, 208-10
en conjuntos de información con uno con información asimétrica, 143,
equilibrio; principio de revelación en un juego de señalización en
y más de un elemento, 179 144-146,147,151
bayesiano perfecto, equilibrio política inonetaria, 210
en equilibrio bayesiano con información complet~, 15-21,
construcción informal del, 129 en señalización en el mercado de
perfecto,181,185 59-62,75-76,145-146
definición del, 182 trabajo, 189.~201
en juegos bayesianos estáticos, 148 ejercicio 3.2, 169
definición del, en juegos con bayesiano perfecto de separación,
en refinamientos del equilibrio ejercicios 1.4-1.6, 48-49
parloteo, 215 equilibrio
bayesiano perfecto, 236-47 ejercicio 2.15, 176
definición del, en juegos de definición de~ en juegos de
véase también información imperfecta; en juegos repetidos, 101-106
señalización, 190 señalización, 190
información incompleta véase también juego de duopolio
ejercicios 4.1, 4.5, 4.6, 4.8, 4.10-4.15, ejemplo de,192
conjunto deinformación Cournot, equilibrio de, 60n4
48,249,252,253,253-56 ejercicio 4.4, 251
con más de un elemento,l22, 129, Cr~mton, P., 248
en el dilema de los presos repetido en juegos con parloteo, 217
176,178,189 Crawford, V., 177, 214,253
finitamentecon informadón en un juego de señalización
definido, con ejemplos, 222-23 credibilidad en los juegos dinámicos, 53
asimétrica, 227-36 en el m~rcado de trabajo, 199-204
en la definición deinformación véase también amenazas y promesas
en juegos dinámicos con . en un juego de señalización en
imperfectar.121 Criterio intuitivo, véase requisito 6 de
información completa pero estructura de capital, 208
en la definición de información señalización
imperfecta, 177-85 en un juego de señalización en
perfecta, 121
en juegos dinámicos con política monetaria, 211-12
véase también conjeturas; nodo de
información incompleta, 175-76 Becker, G., 130
decisión; trayectoria de equilibrio; Chatterjee, K., 159
en negociación sucesiva con béisbol, estrategias mixtas en el, 30, 40
información imperfecta; información Cho, l.-K., 177, 241, 243, 249
información asimétrica, 221-27 Benoit, J.-P., 130
incompleta
refinamientos del, 236-48 Bertrand, J., 2, 15n1
continuación, juego de, 176, 235
véase tambié/l negociación; juego de Bertrand, equilibrio de, 60n4
ejercicios 4.12, 4.14, 254, 256 lJ~sgupta, P. 48
la; conjeturas; parloteo, juegos con; Bertrand, juegode duopolio de, 21, 23;59
cooperación decisión, teoría de In, uni- frenle ~
híbrido; equilibrio; agrupación .. con información asimétrica: ejercicio
en el dilema de los presos repetido multi-personal, 61
parcial, equilibrio de; agrupación, 3.3,169-70
infinitainénte con información Deere, D., 169
equilibrio de; refinamiento;requisitos con productos homogéneos: ejercicio
asimétrica, 227-36 Diamond, D., 54, 73
1-4; separación, equilibno de; 1.7,49 dilema de los presos, el
en el modelo de salarios de
sucesivo, equilibrio; señalización, en juegos repetidos: ejercicios 2.13,
eficiencia,l07-108 cooperación en, 89-91, 227-236
juego de la; perfecto en subjuegos, 2.14,136 equilibrio de Nash en, 10
en juegos repetidos infinitamente,
equilibrio de Nash vease también duopolio, juego de
;,.
en el madela de duapalia de dudas sabre la racianalidad cama, Kakutani, tearema de, 45, 47
véase también amenazas y promesas
Caumat, 144-146 53nl Kennan, J., 248
Creen, E.,106
en el madela de negaciación en juegas can parla tea, 213-21 Klemperer, P., 169
sucesiva, :221-27 en la reinterpretación del equilibrio. K!vfRW (Kreps, Milgram, Raberts,
véase también infarmación incampleta; de Nash can estrategias mixtas, 40, Wilsan) madela de, 229-34
Hall, R., 159, 171
infarmación privada 152-55 Kahlberg, E., 243
Hardin, C"V., 27
infarmación campleta, 1, 143, véase en las juegas de señalización, Kreps, D., 48, 115n117, 130, 177, 180,
Harsanyi, J., 31, 148, 152, 176
también información incampleta 185-213,236-47 228,241,243
Hart, O., 168
información campleta y perfecta, juega en un juega estática, 146-150 KrisllOa, V., 130
hfbrida, estrategia, 188
morida, equilibrio., véase bayesiana can, 55, véase también inducción hacia véase también infarmación asimétrica;
perfecta, equilibrio.; hfbrida, atrás; repetida, juega; perfecta en ~ bayesiana de Nash, equilibrid;
subjuegas, equilibrio. dé Nash infarmación campleta; infarmación Lazear, E., 54, 77,130,134,159,171
estrategia
hipótesis de racianalidad; en inducción infarmación campleta.pero irriperféda, imperfecta; bayesiana perfecta, Leland, H., 248
juega can, 70, 120-121 . equilibrio.; infarmación privada; Leontief, W., 54,55,62
hacia atrás, 57-59
Hatelling, H., 50 en das etapas, 92, 117 . reputación; principia de revelación
Huizinga, H., 135 véase tainbién infarmaaón infarmación incampleta, juega can, 143,
Hume, D., 2, 27 impeTf~da; bayesiand pérfeCta, 176, véase también bayesiana, juega; McAfee, P., 169
.equillbda; repetida, juega; perfecta bayesiana de Nash, equilibrio.; McMillan, L 130, 169
en subjuegas, eijúilibria de Nash parlatea, juegas con; infarmación Majluf, N., 177, 186,208
infarmación del daminio pública, 7 incampleta; bayesiana perfecta, Maskin, E., 48, 86, 98, 130
ignarancia de jugadas anteriares, izO-21
véase también infarmación imperfecta en el juega de dúopalia de Caumat equilibrio.; señalización, juega de matriz binaria, 3
inducción hacia atrás con información asimétrica, 144 infarmación perfecta Matthews, S., 213, 248
en juegas can infúrmati6n corhpleta definida, 53, 121 mecanismo. directa;-165
en equilibrio. bayesiana perfecta, 185
y perfécta; 11i, 143 juega dinámico can, 54 campatibilidad de incentivas, 165
en equilibrio. de Nashperfecta en
sabre la racianalidad de las véase también inducción hacia atrás; decir la verdad en, 166-68
subjuegas, 124, 129
jugadares, 7, 56-59 dinámica can infarmación campleta para subasta dable, 166
en juegas dinámicas can infarmación
sabre,las fvncianes de ganancias de y perfecta, juega; Infarmación véase también principia de revelación
campleta y perfecta, 56
las juga49'res, 1 imperfecta; perfecta en su bjuegas, mensaje daminada, véase requisita 5
en juegas dinámicas can infarmación
incampleta, ejercicio. 3.8; 171-72 infarmación iÍl'iperfecta . equilibrio. de Nash de señalización
definida, 53 infarmación privada mensaje daminado en equilibrio,véase
hipótesis subyacentes de, 57-59
véase también resultada par inducción en el juega de las aranceles, 73-77 diseñando. juegas can, 164 requisita 6 de señalización
hacia atrás en el juego de las pánicas bancarias, ejercicias 3.6-3.8, 171 Mertens, J.-F., 243
inducción hacia adelante, 243 71-73 en subastas, 155-58 Milgrom, P., 177, 228, 241,248
en el juega de tameo, 77-80 en subastas dables, 159-64 Mincer, J., 193 .
infarmación
en tearía de la decisión uni- frente a en juegas repetidas finitamente, 80'87 véase también infarmación mixta, estrategia
multipersanal,61 en juegas repetidas infinitamente, asimétrica; bayesiana de Nash, definición de, 32
87-105 equilibrio.; infarmación incompleta; ejercicjo 2.23, 139
véase también infarmación asimétrica;
juegas dinámicas con; 10 bayesiana perfecta, equilibrio.; ejercicio. 3.5, 170-71
infarmación campleta; infarmación
véase también infamación completa principia de revelación ejercicio. 4.2,250
imperfecta; infarmación incampleta;
pera imperfecta, juego can; ejercicias 1.9-1.14, 50-51
infarmación perfecta; infarmación
información incompleta; canjunta de reinterpretación de, 40
privada
infarmación; bayesiana perfecta, Jacklin, C. 130 véase también Nash, equilibrio. de;
infarmación asimétrica
ejercicias 3.2, 3.3, 169 equilibrio.; infarmación perfecta/o ;. jugadares racianales, 4-7 Nash, tearema de; pura, estrategia;
ejercicio. 4.12, 254 perfecta en subjuegas, equilibrio. dé estrategia
en el dilema de las presas repetida Nash manedas, juega de las (matcJ¡i/¡g pe,mies), 29
finitamente,227,236 infarmación incampleta Kakutani, S., 45 carrespandencia de mejar respuesta
(
en el, 35 relación con eliminación pánicos bancarios, juego de los, 70, 71-73 probabilidad
equilibrio de Nash con estrategias iterativa de estrategias estrictamente ejercicio 2.22, 139 de que se acabe un juego repetido, 90
mixtas en el, 37-39 dominadas, 10-11, 12-15,19-21 parloteo, juego con (cheap-talk game),177, distribución, 24nll
eSlra legias mixtas en el, 39 véase tambié" bayesiano de Nash, 213-21 en estrategias mixtas, 31
ganan.:ias esperadas en el, 33 equilibrio; convenio; eliminación desarrollo temporal de, 215 función de densidad, 23n10
siendo más listo en el, 30 iterativa de estrategias estrictamente ejercicios 4.8,4.9,4.15,253,256 véase también regla de Bayes conjetura "\
Mont¿;omery, J., 51 dominadas; bayesiano perfecto, equilíbrio de agrupación parcial en, problema de teoría de juegos, 4
Myers, S., 177, 186,208 equilibrio; perfecto en subjuegos, 213-21, punto fijo, teorema del, 45-47
l'vIyerson, R., 163, 164, 166, 169 equilibrio de Nash equilibrio bayesiano perfecto en, 177, pura, estrategia:
Nash, teorema de, 33, 45, 124 215 definición de, 93, 117
demostración del, 45-47 véase también bayesiano, juego; ejercicio 2.18, 138
Nash, J., 2,11,45 extensión del, 47 bayesiano perfecto, lC'luilibrio; ejercicios 3.1, 3.3,169-70
Nash, equilibrio de negociación con horizonte finito, juego de señalízación, juego de. en juegos bayesianos estáticos, 151-52
con amenazas o promesas la Pearce, D., 321114,16. en juegos de señalízación, 188
increíbles, 53, 126-129 con información asimétrica, 221-27 penalización, 87 en juegos dinámicos con información
con estrategias mixtas, 10n4, 37-45 ejercicio 2.19,138 desencadenamiento accidental de completa, 93
definición de, con estrategias ejercicios 4.10-4.14, 253-56 una, 106 en juegos repetidos con información
mixtas, 37 resultado por inducción hacia atrás más fuerte creíble, 98, 104-105 completa, 93
definición de, con estrategias puras, 8 del,66-68 véase también palo y la zanahoria, véase también estrategia; mixta,
ejemplos de, 9-10 negociación con horiionte infinito, juego estrategia del; supervisión estrategia
ejercicio 2.21, 138-39 dela imperfecta, juego~~on; disparador, Pyle, D., 248
ejercicios 1.4-1.8,48-49 ejercicios 2.3, 2.20, 131, 138 estrategia pe! ., é ••
en el juego de arbitraje de oferta final, resultado por inducción hacia perfecto en subjuegos, equilibrio de
23-26 atrás de Rubinstein, 68-69 Nash, 57, 89:91, 99, 124-126 racionalídad.sucesiva, 179.
en el juego de duopolio de. negociación de Rubinstein, juego de la, definición de, 94; refinamiento
Berlrand, 21 54,55,66,88,117 ejercicios 2.10-2.13, 2.19-2.23, del equilibrio bayesianoperfecto,
en el juego de duopolio de ejercicios 2.3, 2.19, 2.20, 131, 138 135-36, 138-39 177,194,199,202,236,248
Cmrnot, 16-19 niño mimado, teorema del, 130 véase también inducción hacia atrás, del equilibrio de Nash, 84
en el juego de la moneda, 37-39 nodo de decisión resultado por inducción hacia atrás; ejercicio 4.16, 256
en el juego de los pánicos bancarios, en juegos en forma extensiva, 117, Nash, equilibrio de; resultadoperfecto regla de Bayes, 149112,180,204n6
72-73 119-21. Véase también conjeturas; en subjuegos; bayesiano perfecto, renegociación, 86-86, 11 ...
en juegos en dos etapas cen información imperfecta; conjunto de equilibrio repetido finitamente, juego:
información completa pero información; nodo terminal Perry, M., 132 con información completa, 80-87
imperfecta, 70-71, 72,74,76,78-79 nodo terminal póquer, 30 definición, 82
en juegos repetidos en dos etapas, 81, en juegos en forma extensiva, 117 Porter, R., 106 dilema de los presos con iriformación
83-8~ en subjuegos, 125n19 predicción incompleta, 227-36
en juegos repetidos infinitamente, véase también nodo de decisión; forma en teoría de juegos, 8, 9 renegociación en un, 86-87
90-91,99,102,109-111,114-15 extensiva, juego en equilibrio de Nash como, 7, 8 repetido infinitamente, juego: 87-101
existencia de, en juegos finitos, 33-45 Noldeke, G., 194 por inducción hacia atrás, 56-59 definido, 92
fundamentación del, 8-9 Prendergast, c., 133 estrategia del disparador en, 90
limitaciones del, 177 principio de revelación estrategia en, 93
múlliples, 11, Osbome, M., 130 en el diseño de subastas, 164-165; ganancias ené 95
na existencia con estra tegias puras, enunciado.fomlal del, 166 subjuego en, 94
29 véase también mecanismo directo, véase también ganancia media
reinterpretación con estrategias palo y la zanahoria, estrategia del, 105, compatibilídad de incentivos; cooperación; colusión; factor de
mixtas, 40, 152-155 106 información privada descuento; ganancia factible;
.....
't.a
te::.
ÍNDICE ANM.íII(,() /2'71
270 / ÍNDICE ANALÍTICO
~.)
'-"#;"
;-~;:C"l
¡
valor próente, 89
Van Damme, E., 194
variables de estado, juego con, 105-106
Vicker" J., 177, 186,210
(;~