Está en la página 1de 142

11trnt.f.vt! .s~~iD '.

e 11:1. O:J1J

GO./lhJ.o

ROBERf GIBBONS
Universidad

de Cornell

UN PRIMER CURSO

DE TEORA DE JUEGOS

I
&
,~-

TraducCin de
Paloma Calvo.
y Xavier ViJa

.i

Universidad de Northwestern

Antoni

Bosch

O editor

.J

:',

'lb
'1'(

I,

~/""

l.i5

CONTENIDO

"':'

,','

":.

Prefacio

Publicado por Antoni Bosch, editor


!vIanuel Cimna, 61 - 08034 Barcelona
T"i. (-134)93 206 0730 - Fax (+34) 93 206 0731
E-mai1: info@antonibosch.com
http://www.antonibosch.com
Ttulo original de la obra:
A Primer in Game Theory
@ 1992 by Robert Gibbons

<9de b edicin en castellano: Antoni Bosch, editor, S.A


ISBN: 84-85855-69-8
Depsito legal: B-13.841-2003
Diseo de la cubierta: Facing-bcn
Impresin y encuadernacin:
[mpreso en Espaa / Prinled

Liberdplex
i/1

Sl'aill

No se permite la reproduccin total o parcial de este libro, ni su incorporacin a un


:,st,ema Illformtico, ni su transmisin en cualquier forma o por cualquier medio sea
este electn
' .
,_
"
_ '.
'
.
l mco, mecaruco,
reprogranco, gramofolllco u otro, sm el permiso previo y
por escn to del editor.

Juegos estticos con informacin completa


1.1 Teora bsica: Juegos en'forma normal y equilibrio de Nash
1.1.A Representacin de los juegos en forma normal
ly}:-U Eliminacin iterativa de las estrategias
estrictamente dominadas
2Jr,Fundamentacin
y definicin del equilibrio de Nash
1.2 Aplicaciones
1.2.A Modelo de duo polio de Coumot
1.2.B Modelo de duo polio de Bertrand
1.2.C Arbritraje de oferta final
/ 1.2.D El problema de los ejidos
/3
Teora avanzada: Estrategias mixtas y existencia de
equilibrio
1.3.A Estrategias mixtas
1.3.B Existencia del equilibrio de Nash
1.4 Lecturas adicionales
1.5 :jercicios
1.6 Referencias
2 Juegos dinmicos con informacin completa
2.1 Juegos dinmicos con informacin completa y perfecta
2.1.A Teora: Induccin hacia atrs
2.1.B El modelo de duopolio de Stackelberg
2.1.C Salarios y nivel de empleo en una empresa con fuerte
implantacin salarial
2.1,D Negociacin secuencial
2.2 Juegos en dos etapas con informacin completa pero
imperfecta

IX
1

2V
2

(.

v""

15
15
21

23
27

29/

29
33/
47
48
51

"

~:.
r;~

53
55';/ /
55./

59
62
66
69

a.J

t
VI I

2.3

2.4

2.5
2.6
2.7

~
..

.....

2.2.A Teora: Perfeccin en subjuegos


2.2.B Pnico bancario
2.2.C Aranceles y competencia internacional imperfecta
2.2.D Torneos
Juegos repetidos
2.3.A Teora: Juegos repetidos en dos etapas
2.3.B Teora: Juegos repetidos infinitamente
2.3.C Colusin entre duopolistas de Cournot
2.3.D Salarios de eficiencia
2.3.E Poltica monetaria estable en el tiempo
Juegosdinmicos con informacin completa pero
imperfecta
2.4.A Representacin de losjuegos en forma extensiva
2.4.B Equilibrio de Nash perfecto en subjuegos
Lecturas adicionales
Ejercicios
Referencias

3 Juegos estticos con informacion incompleta


3.1 Teora: juegos bayesinos estticos y equilibrio bayesiano
de Nash
3.l.A Un ejemplo: Competencia a la Cournot bajo
informacin asimtrica'
3.1.B Representacin en forma normal de juegos
bayesianos estticos
3.l.C Definicin del equilibrio ~~siaI1() <:leNas!.
3.2 Aplicaciones
- - .--.----.-

3.3
3.4
3.5
3.6

'3.2.A Revisin de las estrategias mixtas


3.2.B Una subasta
3.2.C Una subasta doble
El principio de revelacin
Lecturas adicionales
Ejercicios
Referencias

4 Juegos dinmicoscon informacin incompleta


4.1 Introduccin al equilibrio bayesiano perfecto
4:2 Juegos de sealizacin
,4.2.A EqUilibrio bayesiano perfecto en juegos de
sealizacin
~,

.."

t
i

CONTENIDO

69 '
71
73
77
80
80
87
101
106
112
11.5
115
122
129:/
130
139
143
144
144
146
150
152
152
155
159
164
169
169
172
175
177
185
185

CONTENIDU

4.2.B
4.2.C
4.2.D
4.3 Otras
4.3.A
4.3.B
4.3.C

4.4
4.5
4.6
4.7

Sealizacin en el mercado de trabajo


Inversin empresarial y estructura de capital
Poltica monetaria
aplicaciones del equilibrio bayesiano perfecto
Juegos con parloteo (cheap-talk games)
Negociacin sucesiva bajo informacin asimtrica
La reputacin en el dilema de los presos repetido
finita mente
Refinamientos del equilibrio bayesiano perfecto
Lecturas adicionales
Ejercicios
Referencias

ndice analtico

/ Vll

192

207
2JO
213
213
221
227
236

248
249
257
261

PREFACIO

j,

La teora de juegos es el estudio de problemas de decisin multipersonales. Tales problemas se plantean frecuentemente en economa. Como,es
bien sabido, por ejemplo, en situaciones de oligopolio se dan tpicamente
problemas de este tipo (cada empresa debe tener en cuenta lo que harn
las dems). Pero muchas otras aplicaciones de teora de juegos surgen
en campos ajenos a la organizacin industrial. A nivel micro econmico,
. muchos modelos de intercambio (como los de negociacin y de subasta)
utilizan teora de juegos. A un nivel de agregacin intermedio, y en el
campo de la economa laboral o de la economa financiera se utiliza ll
teora de juegos en mode!os cJ.ecomportamiento de las empresas en los
mercados de factores, o pai~' dilucidar problemas de decisin multiperso~
nales dentro de ellas: varios trabajadores compitiendo por un ascenso,v~~
rios departamentos compitiendo por unos mismos recursos. Finalmente,
al nivel ms alto de agregacin, en el campo de la economa internacional,
se utiliza en modelos en los que los pases compiten (o coluden) en sus
decisiones arancelarias y, en general, en una poltica econmica exterior;
o en macroeconoma, para analizar los resultados de la poltica monetari!l
cuando el gobierno y los agentes que determinan los salaribs o los precios
se comportan estr,atgicamente.
Este libro est conc~bido para presentar la teora de juegos a quienes
mstarde construirn (o, al menos, consumirn) los modelos de la teora
de juegos en los mbitos aplicados de la economa. Se han procurado
resaltar en l las aplicaciones de la teora, tanto al menos .como la propia
teora, por tres razones. En primer lugar, porque las aplicaciones ayudan
a ensear la teora. En segundo lugar, porque las aplicaciones ilustran el
proceso de construccin de modelos; es decir, el proceso de traduccin
de la descripcin informal de una determinada situacin a un problema
formal de teora de juegos para ser analizado. En tercer lugar, porque
las diversas aplicaciones permiten comprobar que problemas similares
surgen en reas diferentes del anlisis econmico, y que los mismos ins~
trumentos de teora de juegos pueden apliCarse en cada sihacin."Para :..

,'.,

x/

PREFACIO

Prefacio

subrayar el amplio alcance potencial delos juegos los ejemplos habituales


de organizacin industrial han sido sustituidos en gran medida por aplicaciones en el mbito de la economia laboral, de la macroeconoma y de
otros campos aplicados detanlisis econmico]
Discutiremos cuatro tipos de juegos: juegos estticos con informacin
completa, juegos dinmicos con informacin completa, juegos estticos
con informacin incompleta y juegos dinmicos con informacin incompleta. (Un juego tiene informacin incompleta si un jugador no conoce las
ganancias de otro jugador, como ocurre en una subasta cuando uno de los
licitadores no sabe cunto est dispuesto a pagar otro licitador por el bien
subastado.) Correspondiendo a estas cuatro clases de juegos habr cuatro
nociones de equilibrio: equilibrio de Nash, equilibrio de Nash perfecto en
subjuegos, equilibrio bayesiano de Nash y equilibrio bayesiano perfecto.
Existen dos maneras (relacionadas) de entender estos conceptos' de
equilibrio. Primero, se puden entender como sucesIones de conceptos
de equilibrio cada vez ms poderosos, donde las definiciones ms poderosas {es decir, ms restrictiva.s) constituyen intentos de eliminar equilibrios
poco plausibles permitida'spor nociones de equilibrio ms dbiles. Veremos, por ejemplo, que el equilibrio de Nash perfecto en subjuegos es
ms poderoso que el equilibrio de Nash, y que 'el equilibrio bayesiano
perfecto es a su vez ms poderoso que el eqUilibrio de Nash perfecto en
subjuegos. Segundo, puede afirmarse que el concepto de equilibrio relevante es siempre el equilibrio bayesiano perfecto (o quizs un concepto
de solucin an ms poderoso), aunque ste es equivalente al equilibrio
de Nash en juegos estticos con informacin completa, equivalente a la
perfeccin en subjuegos ~n juegos dInmi~os con informacin completa (y
perfecta) y equivalente al equilibrio bayesiano de Nash en juegos estticos
con informacin incompleta ..
Este libro puede utilizarse de dos formas. A los estudiantes de economa de primer ao de doctorado, muchas de las aplicaciones les sern
ya familiares, por lo que la parte de teora de juegos se puede cubrir en
medio semestre, dejando muchas de las aplicaciones para ser estudiadas
fuera de clase. A los estudiantes de lIcenciatura, conviene presentarles
la teora un poco ms despacio, y clibrir en clase virtualmente todas las
aplic1l;ciones. El prerrequisito matemtico fundamental es el clculo diferEici!il"en"una variable; los rudimeJ1tos de probabilidad y anlisis se
introIucen'a.'medida que se necesitan.
"~';".~,:.'k:::~:t;;;::,~.::-::,:~:~;~~'~,-;
"
-

'c,,}' Un~,btena fuente de aplicaciones de leora de juegos en el mbito de la organizacin


industrial,es TC9rfa.d~la. organizacin industrial, de Tirole (Ariel, 1990).
';',J .~;I.~,

-~':. :

..~.>-.-'~;.~,-.~~."..:\~.~-

/ XI

Aprend teora de juegos con David Kreps, John Roberts y Bob Wilson
durante mis estudios de doctorado, y con Adam Brandemburger, Drew
Fudenberg y Jean Tirole ms adelante. A ellos debo la parte. terica el: e:te
libro. El nfasis en las aplicaciones y otros aspectos del estIlo pedagoglco
del libro, en cambio, se los debo en gran parte a los estudiantes del departamento de economa del M.l.I. quienes, de 19~5 a 1990, inspiraron y
moldearon los cursos que han culminado en este lIbro. Estoy muy agradecido a todos estos amigos por las ideas que han compartido conmigo
y el estmulo que siempre me han otorgado, as com? ~or los numerosos
comentarios tiles al borrador del libro que he reCIbIdo de Joe Farrell ,
Milt Harris, George Mailath, Matthew Rabin, Andy Weiss y varios rticos
annimos. Finalmente, me complace reconocer los consejos y apoyo que
he recibido de Jack Repcheck de Princeton University Press y la ayuda financiera de una beca Olin en economa del National Bureau of EconOlnic
Research.

\'

1. JUEGOS ESTTICOS
CON INFORMACIN COMPLETA
\

:";

"

En este captulo consideramos juegos simples de la siguiente forma::pri;".


mero los jugadores forman decisiones simultneamente; abjntfutici
reciben sus ganancias, que depnden de la combinacin de,ac.ciones'que ,
acaban de elegir, Dentro de la clase de estos juegos estticos (o'de(fecrsih
simultnea), restringimos nuestra atencin a los jueg~s 'ton :irioi-mai:~ '".,'
(
completa. Es decir, la' ftrncirr.de ganancias de cadajug~bi";:~k).fiifcip~~'jt\~c~~~It.r
que determina la ganancia de cada jugador a partir dIaoinbii:t:cr'Lc:.
'.?(.,
de acciones elegidas por los jugadores) es cor)dd'fp6:'10s'Jg'aq ,
'
Estudiamos los juegos dinmicos (o de toma'de. dedsioIi.eS'~ticeSivlfJ,',
los captulos 2 y 4, Y los' j~egos con' informaci6riiriOmpl~ti'(jt~gt~J'J:c"~.,
los cuales aI~n' jugaorno esta segUro' de la funCin,:de:g'aniiliCi~',"'... , ,"
,;<"fL

otr~ j~gador, como ocurre en ~I1asubasta en.la cual lo q~e ca~~Ii?t~~~~fo;:~fi:,,:.;:~:fi.;.


esta dIspuesto a pagar por el bIen subastacl.oes desconoCldo'pOr:rbS:0tro.S,:.'7,;~':;,;;,::~::}
licitadores) en los captulos 3 y 4.
';~;:jJ1.j;:)1:;~i\i;<~\':~.':~.j.~t.
En la seccin 1.1 entramos en las dos cuestiones bsicas de la tebr~~de':i:.\.;i:.t"~t'
juegos: cmo describir un j~~g9,ts,mo res~fYrE,~tR[?,bJ?~~4iJ~~~ttg""
de juegos resultante. Con este fin describimos los instrumentos que,t,it::~::~\i
..,;::i
lizaremos para analizar los juegos estticos con informacincompletJ;,y!<:'
sentaremos las' bases de la teora que utilizaremos para analizar jue'gos
ms ricos en captulos posteriores. Definimos tambinJa repre.se:rtacljn,e11
forma normal de un juego y la nocin de estrategia estrictamerzteti9mi.~
Demostramos ,que algunos juegos pueden resolverse mediq,nteja.; R1i;'
cacin de la idea de que los jugadores racionales no utiUzarlestr~te~
'
estrictamente dominadas, pero tambin que en otros 'juegos' est~',e&:~
que da lugar a predicciones muy imprecisas sobre el desarrollode1jj~o '
(algunas veces tan imprecisa como la afirmacin de q\le,"cuaIquiercqs,
puede ocurrir"), Despus, definimos el equilibrio de Nash,un concept2i.d~':",,~.,
solucin que da pie a predicciones mucho ms precisas,en una clase:j:l~:'>';
juegos muy amplia.
- ",,:, .. " >::c~':~~'

I JUEGOS

ESTTICOS CON INFORMACIN

En la seccin 1.2, utilizando los instrumentos desarrollados en la


seccin previa, analizamos cuatro aplicaciones: el modelo de competencia
imperfecta de Coumot (1838), el modelo de competencia imperfecta de
Bertrand (1883), el modelo de arbitraje de oferta final de Farber (1980)
y el problema de los ejidos (discutido por Hume [1739] y otros). En
cada aplicacin, en primer lugar traducimos la descripcin informal del
problema a una representacin en la forma normal del juego y despus
hallamos su equilibrio de Nash. (Cada una de estas aplicaciones tiene un
nico equilibrio de Nash, pero discutimos ejemplos en los cuajes esto no
ocurre.)
En la seccin 1.3 volvemos a la teora. En primer lugar definimos la
nocin de estrategia mixta, que interpretamos en trminos d.-ela falta de certeza de un jugador con respecto a lo que otro jugador har. Seguidamente,
enunciamos y discutimos el teorema de Nash (1950),el cual garantiza que
un equilibrio de Nash (que puede incluir estrategias mixtas) existe en una
amplia clase de juegos. Puesto que presentamos primero la teora bsica en la seccin 1.1, las aplicaciones en la seccin 1.2 y, finalmente, ms
teora en la seccin 1.3, resulta evidente que el conocimiento de la teora
incluida en la seccin 1.3 no constituye un requisito para entender las
aplicaciones de la seccin 1.2. Por otra parte, la idea de estrategia mixta y
la exis'tencia de equilibrio aparecen (ocasionalmente) en captulos posteriores.
Cada captulo concluye con ejercicios, sugerencias de ,lectura adicional
y referencias.

.~

1.1 Teora bsica: Juegos en forma normal y equilibrio de Nash


1.1.A Representacin de los juegos en forma normal

,-.:.,'

7eora bsica: luegos en {arma/normal

COMPLETA (e. 1)

En la representacin de un juego en forma normal cada jugador elige de


forma simultnea una estrategia, y la combinacin de las estrategias ele~
gidas por los jugadores determina la ganancia de cada jugador. Vamos
a ilustrar la representacin en forma normal con un ejemplo clsico; el
del dilema de los presos. Dos sospechosos son arrestados y acusados de
un: delltoo"rta polica no tiene evidencia suficiente para condenar a los
ssph:osOs,a menos que uno confiese.. La polica encierra a los sospe::'
;~osCJse!t"~~Idasseparadas y les explica las consecuencias derivadas de las
. \edsions" que formen. Si ninguno confiesa, ambos sern condenados por
un delito menor sentenciados a un mes de crcel. Si ambos, confiesan~

<

y.

y equilibrio de Nas/ I 3

sern sentenciados a seis meses de crcel. Finalmente, si uno confiesa y el


otro no, el que confiesa ser puesto en libertad inmediatamente y el otro
ser sentenciado a nueve meses en prisin, seis por el delito y tres ms
por obstFUccin a la justicia.
El problema de los presos puede representarse mediante la siguiente
matriz binaria. (Como matriz, una matriz binaria puede tener un nrnero
arbitrario de filas y columnas; binaria se refiere al hecho de que en un
juego de dos jugadores hay dos nmeros en cada casilla, las ganancias de
los dos jugadores).
Preso 2
Callarse Confesar
Callrse

Preso 1

-J,Q

-1,-1

Confesar (,'--c 9
"..

.',

-~'-

(6'-6
"\

El dilema de los presos

En este juego, cada jugador cuenta con dos estrategias posibles: confe~
sar y no confesar. Las ganancias de los dos jugadores cuando eligen un par
concreto de estrategias aparecen en la casilla correspondiente-de la ma~
triz binaria. Por convencin, la ganancia del llamado jugador-fila (aqu el.
preso,l) es la primera, ganancia, seguida, po~:la.gananciadeL jugador:,:
columna (aqu el preso 2). Por eso, si por.ejemp~o;el pre~oJ elige caUar.y.
el preso 2 elige confesar, el preso 1 recibe una ganancia de-9(que repre,
senta nueve, meses en prisin) y el preso 2 recibe una gananCia de O (que
representa la inmediata puesta en libertad),
Ahora abordamos el caso generaL .La representacin en forma normal
de un juego especifica: (1) los jugadores en el juego, (2) las estrategias
de que dispone cada jugador y (3) la ganancia de cada jugador en cada
combinacin posible de estrategias. A menudo discutiremos juegos con
un nmero n de jugadores, enlos cuales los jugadores estn numerados de
1 a n y ~ jugadL~bitrari~~s denominad.o_p;.g;do:r-i:)SeGei~onjunto
de estrategias con que cuenta el jugador i (llamado espacio de estrategia1
de i), y sea Si un elemento arbitrario de este conjunto. (Ocasionahnet'ie
escribiremos si E Si rara indicar que la estrategia Si es uh elemento
del conjunto Si.)Sea (sI,'" ,sn) una combin'acin de estrategias, una para;

<l/JUEGOS

ESTTICOS CON INFORMACIN

COMPLETA (c. 1)

cada jugador, y seaUi la funcin de ganancias del jugador i: '!ti(sl,


la ganancia del jugador i si los jugadores eligen las estrategias (SI,
Compilando toda esta informacin tenemos:

Teora bsica: Jllegos en formal normal y eqllilibrio de Nash I 5


,sn)

es

,sn)'

Definicin. La representacin
en forma nonnal de un juego con n jugadores
especifica los espacios de estrategias de los jugadores SI,' .. ,Sn y sus funciones
de ganancias '!tI, ... Un. Denotamos este juego con G = {SI, ... ,SIl;Ul, ... Un}.
Aunque hemos indicado que en un juego en forma norm~llos jugadores eligen sus estrategias de forma simultnea, esto no significa que las
partes acten necesariamente de fonna simultnea. Es suficiente que cada
parte elija la accin a seguir sin conocer las decisiones de los dems, como
sera aqu el caso si los presos tomasen una decisin en momentos arbitraTosen sus celdas separadas. Adems, aunque en este captulo utilizamos
juegos en forma normal para representar solamente juegos estticos en
los cuales los jugadores actan todos sin conocer las decisiones de los
dems jugadores, veremos en el captulo 2 que las representaciones en
forma normal pueden darse en juegos con tomas de decisin sucesivas,
pero tambin que una alternativa, la representacin en fonna extensiva del
juego, es a menudo un marco de trabajo ms conveniente para analizar
los aspectos din,IIri,cosde los juegos.
1.1.B Eliminacin iterativa de estrategias estrictamente dominadas

t l '::
~

Despus de describir un modo de representar un juego, ahora vamof? a


esbozar una forma de resolver un problema de-teoradejuegos.
Empezamos con el dilem de los presos, porque es fcil de resolver utilizando
nicamente la idea de que un jugador racional no utilizar una estrategia
estrictamente dominada ..
En el dilema de los presos, si un sospechoso va a confesar, sera mejor
para el otro confesar y con ello ir a la crcel seis meses, en lugar de callarse
y pasar nueve meses en prisin. Del mismo modor'siun sospechoso va a
callarse, para el otro sera mejor confesarycon el~os~r puesto en libertad
inmediatamente en lugar de callarse y permanecer en prisin durante
un mes. As, para el preso i, la estrategia de callarse est dominada
por la de confesar: para cada estrategia que el preso j puede elegir, la
ganancia del pnsionero i es menor si se calla que si cnfiesa. (Lo mismo
ocurrira en cualqUier matriz binaria en la cual las ganancias 0, "--:1; -6
Y -9 fueran reemplazadas por las ganancias T,R,P ePiespectivamente,

siempre que T > R > P > I, para plasmar las ideas de ganancias de
tentacin, recompensa, penalizacin e ingenuidad. De forma ms general:
Definicin. En el juego en forma normal G = {SI, ... ,Sn;Ul, ... ,lln}, sean s;
y s;' posibles estrategias del jugador i (por ejemplo, s; y s;' son elementos de Si).
La estrategia s; est estrictamente
dominada por la estrategia s;' si para cada
combinacin posible de las estrategias de los restantes jugadores la ganancia de i
por utilizar si es estrictamente menor que la ganancia de i por utilizar s;':

..
"::':.'

para cada (sIr' .. ,Si-l,Si+l,' .. ,sn) que puede ser construida a partir de los espacios de estrategias de los otros jugadores SI,'" ,Si~l,Si+l, ... ,Sn'
Los jugadores racionales no utilizan estrategias estrictamente dominadas, puesto que bajo ninguna conjetura que un jugador pudiera formarse
sobre las estrategias que elegirn los dems jugadores sera ptimo utilizar tales estrategias. 1. As, en el dilema de los presos, un jugador racional
elegir confesar, por lo que (confesar, confesar) ser el resultado alque lle-:
gan dos jugadores racionales, incluso cuando (confesar, confesar) supone
unas ganancias peores para ambos jugadores que (callar, callar). Como
el dilema de los presos tiene mltiples aplicaciones (que incluyen la carrera de armamentos y el problema del polizn en la provisin de bienes
pblicos) trataremos variantes del juego en los captulos 2 y 4. Por ahora
nos centraremos ms bien en si la idea de que jugadores racionales no utilizan estrategias estrictamente dominadas puede conducir a la solucin
de otros juegos.
Consideremos el juego abstracto de la figura 1.1.1.2 El jugador 1 tiene
dos estrategias y el jugador 2 tiene 3: Sr = {alta, baja} y S2 = {izquierda,
centro, derecha}. Para el jugador 1, ni alta ni baja estn estrictamente
1 Una cuestin complementaria tambin tiene inters: si no existe una conjetura que'el
jugador i pueda formarse sobre las estrategias de los dems jugadores, que haga ptimo elegir
la estrategia Si, podemos concluir que debe existir otra estrategia que domine estrictamente a
s.;? L;'respusta es afirmativa, siempre que adoptemos definidones adecuadas de "conj~tura';
y de "otra estrategia", trminos que incluyen la idea de estrategias mixtas que introduciremos
en la secdn 1.3.A.

1:::.-

2 La mayor parte de este libro considera aplicaciones econmicas ms:que ejemplos


abstractos, tanto porque las aplicaciones Son de inters por s mismas como porque, pa~~..
mchos lectores, las aplicaciones son a menudo un modo til de explicar la teora subyacente:;',
Sin embargo, cuando introduzcamos algunas ideas tericas bsicas, recurriremos a.eJe~p]' .. ,
abstractos sin una interpretacin econmica directa.
. ,".t,l"

:::--

1:

Teora bsica: fuegos en formal nonnal y equilibrio de Nas/ / 7

6 / JUEGOS ESTTICOS CON INFOR.MAClN COMPLETA (e. 1)

dominadas: alta es mejor que baja si 2 elige izquierda (porque 1 es mayor


que O),pero baja es mejor que alta si 2 elige derecha (porque 2 es mayor
que cero),

Jugador 2
Izquierda Centro
Jugador 1

Jugador 2
Izquierda' Centro Derecha
:Alta

"

1,0

12 ,

0,1

0,3

0,1

20

Figura .1.1

",

'

\~,'

Sin embargo, para el jugador 2, derecha est estrictamente dominada


por centro (porque 2 es mayo~ que 1 y 1 es mayor que O),por laque un
jugador racional 2 n{) elgii,:derecJ:.a. As, si el jugador 1 sabe que el
jugador 2 es racionatjjedeeliminar
derecha del espacio de estrategias
del jugador 2., Esto. es, si el jugador 1 sabe que el jugador 2 es ~~cional,
puede comportarse en eLjuegode la figura 1.1.1 como si estuviera ell el
juego de la figura 1.1.2.

..1l

']iigadr2
Izquierda Centro
Aita

"'1,0

'1,2'

0,3

0,1

!~gador 1
,"

Baja'

Figura 1.1.2

';":'~'.

'

,~,"'.
'

En lafigur~ 1.1.2, baja est ahora estrictamente dominada: por alta


BaJ;il,eljugadoiJ,.as que si el jugador 1 es rac,ional(y.eljugador lsabe
que el jugador 2es racional, parlo que se aplica el juego de la figura 1:12)
hceIegfr~baja~ Por eso; si el jugador 2 sabe que el fugador1, es :aciortal;
:y~'~]ug~5t?Fi
sabe que el jugador 1 sabe qt]e. el jugador 2 es racional
(pt'16~uee]tigador 2sabe que se aplica la figura 1.1.2),,el jugador 2
. peae:~~arl)aja
delespacio de estrategias del jugador 1, quedando el
.:....P.t~6"c8ffi'o'ii1diclafigura
1.1:3:Pro ahora, izqu\:la
'est estrictamente
'::;.;;" :~,r,.\~:,;,:"=t:_(dr"!'i-'~~d'tlt-;N~;t':-/:;..:-__. ,."
: ,:','
, ,
.
"': .."";.;~l~J?f;~~!Ip,.parael jugador 2, quedando (alta, centro) como el

,."~';~;"~~V
.. J~~r~~#ft."'
:,f.~,..

. -'~;. x"

,l'"

1_,0

1_,2_

Figura 1.1.3

Jugador1
Baja

Alta 1__

Este proceso se denomina eliminacin iterativa de las estrategias estrictamente dominadas. Aunque est basado en la atractiva idea de que los
jugadores racionales no, utilizan estrategias estrictamente dominadas, el
proceso presenta dos inconvenientes. En primer lugar, cada paso requiere
un supuesto adicional sobre lo que los jugadores saben acerca de la racionalidad del otro. Si queremos ser capaces de aplicar el proceso pata
un ntmero arbitrario de pasos, neceSitamos suponer que es informaci11
del dominio pblico que los jugadores son racionales. Esto es, necesitamos
suponer no slo que todos los jugadores son racionales, sino tambin que
todos lbs jugadores saben que todos los jugadores son racionales, y que
todos los jugadores saben que todos los jugadores saben que todos I~s
jugadores son racionales, y as ad infil1itUt1l (vase la defihicin fomiaI de
informacin del dominio pblico en Aumaim [1976]).
;
La segunda desventaja de la eliminacin iterativa de estrategias estrictamente dominadas es que el proceso conduce a menudo a una prediCd'ri
imprecisa sobre el desarrollo del juego. Por ejemplo~ consideremos el
juego de la figura 1.1.4. En-estejuego no hay estrategias estrictamente dominadas para ser eliminadas. (Puesto que no hemos fun'darnltado est
juego en absoluto, al lector puede parecerle' arbitrario 'oinclusopafokgico.
Para una aplicacin econmica en el mismo sentido, vase el caso de tres
o ms empresas en el modelo de Cournot incluido en la seccin 1.2.A)
Puesto que todas las estrategias en el juego sobreviven a la eliminacin
iterativa de las estrategias estrictamente dominadas, el proceso no permite
ninguna prediccin sobre el desarrollo del juego.
,I
'A

,':.~'

(j D

0.4. ,0 .~\3

M .1!i) 0,.4',5,3
B. 3,5 3,5

6.6

, 1-

Figura 1.1.4

8/

jUECOS ESTATICOS CON INFORMACIN COMPLETA (e. 1)

Teora bsica: Juegos en formal nonnai y equilibrio de Nash / 9

A continuacin abordamos el equilibrio de Nash, un concepto de solucin que da lugar a predicciones mucho ms precisas en una clase de
juegos muy amplia. Demostramos que el equilibrio de Nash es un cOncepto ~iesoluc(nms poderoso que la_e.liminaciniterativa de las.estra~
tegias estrictamente.dominadas, en el sentido 'de que las estrategias de los
jugadores en un equilibrio de Nash siempre sobreviven a la eliminacin
iterativa de las estrategias estrictamente domin<).das,~osa que no ocurre
a la inversa. En los captulos siguientes argmnentareinos que, en juegos
ms dcos, incluso el equilibrio de N ash da lugar p. predicciones demasiado
impn;cjsas sobre el desarrollo. del juego, por lo que definiIemos nociones
de equilibdo an ms poderosas, ms adecuadas para estos casos. ,,"
..

",

1.1.C Fundamentacin y definicin del equilibrio de Nash


Una manera de fundamentar la definicin del equilibrio de Nas1:l.~~el
argumento de q~e silateora de juegos ofrece un~ solu<:iIlrlica a un
determinado P\9plerna" esta solucin debe ser,un equilibJ:i<;>
9-c~._~a~!:u~n
el,siguiel1te sellti4o:, Supongamos que la Jeona de jlleg~~ h~~ ~,~!:l,~~
prediccin sobre las estrategias elegidas por los jllgadores. Pilr<).que eSta
prediccin sea correcta es necesario que cadajug?!~orest d~puesto a
elegir la'estrat~ga.p~edicha por la teora. Por ello, la estrategiapredi~
cha de cada jugador, debe ser la mejor respuesta de cada jugador. a)as
estrategias pre~ichas. de los otros jugadores. Tal predicc~n puede d~~ominarse estratgicame~teestable
o self-enforcing, puesto que ningn jugador
va a qUeJ;erdesviarse de la estritegi.apredicha paril }. Llamaremosatal
prediccin equilib.rio de Nash:
Definicin. En el juego en forma normal de n jugadores, G,=J SI,.~. ,Sn; Ul,
... ,un}, las fstrategas(;}, ... ,s;,) forman un equilibrio de Nasft si, para cada
jllgadrri, sr~es.la mejor respuesta del jugador i (o al menos una di?:ell(ls) {das
estrategias de los otros n - 1jugadores, (si, ... ,S7_1,s7+1' '" ,s~):

(EN)

para cada posible estrategia

Si

en Si; esto es,

si

es l/na solucin de

Para relacionar esta definicin con su fundamerltacin anterior, supongamos que la teora de juegos ofrece las estrategias (s~,
,s~) como
la solucin al juego en forma normal G =: {SI, ... ,Sn; 'Ul,
, un}' Decir
que (s~, ... ,s~) no constituyen un equilibrio de Nash de G es equivalente
a decir que existe algn jugador 'i tal que si no es la mejor respuesta a
(sl,/ ... ,si_l,si+I,
/
/
/') Esto es," eXIstea 1guna S'i en S,italque,.,
,.
... ,sn'
11

,\'
"',

As, si la teora ofrece las estrategias (s~, ... ,s~) como la solttdn pero estas
estrategias no constituyen un equilibrio de Nash, al menos un jugador
tendr un incentivo para desviarse de la prediccin de la teora, con lo
que la teora quedar desin~~tida por el desarrollo conCreto del juego.
Otra fundamentacin muy parecida del equilibrio de Nash incorpora la
idea de convenio: si surge un acuerdo sobre cmo comportarse en un
determinado juego, las estrategias fijadas por el convenio deben formar
un equil~bri~ de Nash;si no,-habr al menos un jugador que no se regir
por ~l,i:onv~nio.
'.
'
.
Para concretar, vamos a resolver unos cuantos ejemplos. COrisider~
moslos tr~-~eg~s en forma normal ya descritos: el dileIT;,adelos
y los de ia~j{iuras
1.1.1.
y 1.1.4. Una forma torpe de hallar los quili~
f ...
,
.
,
""
brios de Nash en un juego consiste simplemente en comprobar si cada
combinacin p~sible.de estTat~gias satisface la condicin'(EN) en la defi~
niciI1} En un juego de dos jugadores, esta forma dehlllarlos eqtrilibrios
co~~~del
modo siguiente: para cada jugador pa"rac~da estratep
posible ~onla que cuenta cada j"ugador se determina la mejo~ resp~sta
del 'otro 'juga.dor a-sa estrategia. En la figura 1.1.5 se representa esto en
el caso del juego definido en 1.1.4, subrayando la ganancia de la mejor
respuesta del jugador j a cada una de las posibles estrategias del jugador
i: Sj el jugador columna fuera a jugar 1, por ejemplo, la mejor respuesta
del jugador fila sera M, puesto que 4 es mayor que 3 y que O; por eo,
la gananCia q~e 4) proporciona al jugador fila en la casilla (M,I) de l
matriz binaria est subrayada.

p~es~~

3 En la seccin 1.3.A vamos a distinguir entre estrategias puras, y mixtas. Despus vamos
a ver que la definicin dada aqu describe equilibrios de Nash en estrategias puras, pero
que tambin puede haber equilibrios de Nash en estrategias mixtas. A menos que se.seale'
explcitamente de otro modo. todas las referencias'a los equilibrios de Nash en esta secci~.,~~C
refieren a equilibrios de Nash en estrategias puras.

la/JUEGOS

TeorIa bsica: Jllegos ell forma/Ilormal

ESTTICOS CON INFORMACIN COMPLETA (el)

equilibrio de Nash. Para ver esto ltimo recordemos que en la figura 1.1.4,
el equilibri.? de Nash ofrece una nica prediccin C8,D), mientrlS que la
eliminacin iterativa de las estrategias estrictamente dominadas ofrece
una prediccin con el mayor grado de imprecisin posible: no se elimina
ninguna.estrategia; puede ocurrir cUllquiercosa.
Tras demostrar que el equilibrio de Nash es un concepto de solucin
ms poderoso que la eliminacin iterativa de las estrategias estrictamente
dominadas tenemos que preguntarnos si el equilibrio de Nash no es un
concepto de solucin demasiado poderoso. Esto es podemos estar seguros de que el equilibrio de Nash existe? Nash (1950) dem\Jsti que en
cualquier juego finito (por ejemplo, un juego en el cual el nun1ero n de
jugadores y los conjuntos de estrategias SI,' .. ,Sn son todos finitos) existe
al menos un equilibrio de Nash. (Este equilibrio puede~!1Cluirestrltegias
mixtas, que discutiremos en la seccin 1.3.A. Paraun J~unciado preciso
del teorema de Nash vase la seccin 1.3.B.) COUlnot (1838) propuso la
misma nocin de equilibrio en el contexto delJ1 modelo particular de
duo polio y demostr (por construccin) que existe un equilibrio en este
modelo; vase la seccin 1.2.A. En cada aplicacin anazada en este libro,
seguiremos el ejemplo de Cqumot: demostraremo~ q~e existe un equiJibrio de Nash (o ms poderoso) mediante la construcin de uno. En
.algunas secciones tericas, no obstante, utilizaremo~ el teorema de Nash
(o su anlogo para conceptos de equilibrio ms poderosos) y simplemente
diremos que existe un equilibrio.
.,
Conclullnos esta seccin con otro ejemplo clsico, la bat~lla de los sexos.
Este ejemplo muestra que un juego puede tener mltipl~~equl1i'Griosae
Nsh, y tambin ser til en las discusiones sob~~~stTategias mixtas de las
secciones 1.3.B y 3.2.A. En la exposicin tradicionldel juego (que, quede
claro, data de los aos cincuenta), un hombre y una mujer estn tratando
de decidir qu harn esta noche; nosotros analizarnos uha versin del
juego que no tiene en cuenta el sexo de los participantes} En lugares
de trabajo sep:rados, Paty Chris deben elegir entre ir a.'la pera' o lun
combate de boxeo.. Arn,bos(as) jugldores(as) preferiran pasar la noche
juntos(as), pero Pat preferira estar juntos(as) en el boxeo, mientras que
Chris preferira estar juntos(as) en la pera, tal como representamos en la
matriz binaria que sigue:

Un par de estrategias satisface la condicin (EN) si la estrategia de


cada jugador es la mejor respuesta a la del otro, es decir, si ambas ganancias estr subrayadas en la casilla correspondiente de la matriz binaria.
. Por ello C8,D) es el nico par de estrategia~ que satisface (EN). Lo mismo
ocurre para (confesar, confesar) en el dilema de los presos y para (alta, centro)en la figura'1.1.1. Estos pares de estratgias son los nicos equilibrios
de Nash d estos juegos.4

:,

.,,>'

lA 0,1- 1-;0 5,3


M

1,0 0,1- 5,3

B 3,5 3,5

'~

Figura 1.1.5

A continuacin tratamos larel~dn entre el equili1:Jri2=c1..~


l':f-sh y la
, eliminacin iterativa de las estrategias estrictamente dominadas. Recordemos que las estrategias de equilibrio de Nsh n el dilema de los presos
yen1a figUra1.P -:-(col1fesar,confsar) (lta, entro)respectivamenfeesorilas nicas estrategias 'que sobreviven a la eliminacin iterativa de las
estrategias estrictamente dominadas. Este resultado puecl.egeneralizarse:
si la ~lirni1.acinih;;rativa de las estrategias estrictamente dominadas elimina tbdas las estrategias ~'enos las estrategias' (si, ... ,<), estas esfrategiasconstituyen el nico equilibrio de Nash del juego. (Vase el apndice
para'una demostraci'n de esta aflnnacin.) Sin embargo, puesto que la
eliminacin iterativa de las estrategias estrictamente dominadas ol frecuencia elimina ms que una combinacin de estrategias, es del mximo
in~ers el hecho de que elequilibno dNshsea un concepto de soluCin
ms poderoso que la eliminaCi6n iterativa de las estrategias estrictamente
dominadas en el siguiente sentido: si las estrategias si, ... ,s~ constituyen
il"equilibrio de Nash, sobreviven a la eliminacin iterativa de las estrategias,estrictament dominadas (vase apndiee para una demostracin),
pero pueden existir estrategias que sobrevivan a la eliminacin iterativa de
elitrategi~s,estrictamente dominadas pero que no formen parte de ningn

no

. ,~'

'..:::;:;

"t;Ut~{'~,\~J~~~t.:h~~\1i'\~~;;-\:c:
..', -,

:'

".

..;"",4:Estlafumadn es correcta incluso si no limitamos nuestra atendn al equilibrio de Nash


,'en:estx:~tegiaspuras; puesto que en estOs juegos no existen equilibrios de Nash en estrategias
i>''''fuXta&:Yasee! ejercido 1.10.
:. ','.
.
'-';)';".;'

'.'

y equilibrio de Nas" / ]]

.
s En ingls, los diminutivos Pat y Chris pueden referirse tanto a nombres masculinos
(Patrick y Christopher) como femeninos (Patricia y Christinal. (N. de los T.)

12/

JUEGOS ESr,\rICOS

CON INFOIUvlACJN COMPLETA (e. 1)

pera Boxeo

?,l

Boxeo

0,01,~

y equilibrio de Nash / 13

Apndice

Pat

pera

Teora bsica: fuegos en jonnalnol'mal

0,0

Chris

La batalla de los sexos


Ambos, (pera, pera) y (boxeo, boxeo) son equilibrios de Nash:
Hemos argumentado antes que"si la teorladejuegos ofrece una nica
solucin a un juego, sta debe ser un equilibiio de Nash. Este argumento
ignora la posibilidad de juegos en los cuales la teora de juegos no' ofrece
una solucin nica. Tambin hemos argumentado que si se llega a un
<;:ut:!"jg._~.!~_~~mo
comportarse en un juego, las strategias establecidos
.t:!l timergQ _d~~~~_se:-~.
t:g~lliPJi~2=~~:~E!' I?~!~._e?t~.a~~~~~h>7al
ig~~! que eL~t~r.i~!,ignoral~ p_~~i!?ili9.l~.~e
juegospara los cuais7~se_a!cance un -lc.~~~'!.<:Ea[gnSJs
j~~g~~~~mItipl~s'Ciciiil)ris~~f~"'asl1'.
s()~~~sa!e_~~_~9,~~~Lb!2~.
~o..mo)asol~.~in ms atT'a5.~Y.9~lj~o:l'Can
parte de la teora de los captulos posterl.oresci:mstuye'u~ esfu';Z'opa; .
identificar este equilibrio ms atractivo en diferentes clases de juegos.)
As, la existe.n.ciade mltiples equilibrios de Nash no es un problema en
s mismo. Sin embargo, en la batalla de los sexos, (pera, pera) y (boxeo,
boxeo) parecen iguahnente atractivos, lo que indica quepuien eXistir
juegos para los cuales la teora de juegos no ofrece una"solucir{nica y
en los que no se llegar a ningn acuerdo.6 En tales juegos, el equilibrio
de Nash pierde gran parte de su atractivo como prediccin del juego.

6 E
l
..
n a secaon 1.3.B describimos un tercer equilibrio de Nash (que incluye estrategias
nuxtas) en la batalla de los sexos. Al contrario que (pera,pera) y (boxeo,boxeo), este tercer.
eqUlhbno ofrece ganandas simtricas, como se podria esperar de la solucin nica a un juego
sunetnco. Por otro lado, el tercer equilibrio es tambin ineficiente, lo cual puede influir en
contra de que se llegue a un acuerdo para alcanzarlo. Cualquiera que sea nuestro juicio sobre
los eqUllibnos de Nash en la batalla de los sexos, la cuestin sigue en pie: pueden existir
Juegos para l~s cuales la teora de juegos no ofrezca una solucin nica y para los que no se
llegue a rungun acuerdo ..

Este apndice contiene d~ll1ostraciones de las dos proposiciones siguientes,


que fueron enun<;:iadasde manera informal en la seccin 1.1.C. Saltarse
estas demostraciones )1.0 jmpedir de forma sustancial la comprensin
del resto d~l libro. Sin embargo, para aquellos lectores no acostumbra~
dos a la manipulacin de definiciones formales y a la construccin de
demostraciones, el dominio de estas demostraciones constituye un valioso ejercicio.
Proposicin A. En el juego en forma normal con njugadores G= {Sr. ... ,
Sn; Ul,,; . ,Un L si la eliminacin iterativa de las estrategias estrictamente dominadas elimina todas las estrategiqs menos las (s1'" . ;s~),estas ltimas estrategias
constituyen el nico equilibrio de Nash del juego.
Proposicin B. En el juego en forma normal con n jugadores G = {SI,' .. ,Sn;
Ul, ... ,Un}, si las estrategias (S1' ... ,s~) forman un equilibrio de Nash; entonces
sobreviven a la eliminacin iterativa de las estrategias estrictamente dominadaS}'
,. .'.::t.

;'~-~~::~'li;r"

Puesto que la proposicin B es ms fcil de demostrar, comeriZalli~s


por ella para entrar en materia. El argumenta
por<co{tradldh
Esto es, vamos a suponer que una de las estrategias,en unequiIbri~
de Nash es eliminada por eliminacin iterativa de las estrategias'~stri'c-'
tamente dominadas, y despus demostraremos que llegaramos a urta
conqadicc~n si este supuesto ocurriera, demostrando as que el ~U:pti~sto
debe ser falso.'
.
..,
-..i~.K.,....
,. ' ",.,L '"-

"es

Supongamos que las estrategias (si,. e, e ,s;;') forman un equilibriCld~


Nash del juego en forma normal G= {SI," "Sn;Ui~; ;,un}, pero s:pon:
gamos tambin que (tal vez despus de que algunas estrategias distintas
de (s1" .. ,s~) hayan sido eliminadas) si es la primera de las estrat~gias
(s1' ... ,s~) en ser eliminada por ser estrictamente'dominada. Entonces,
debe existir una estrategia S~' que no ha sido an eliminada de Si que
domina estrictamente a si. Adaptando (DE) tenemos
., .'

(Li.l)
para cada (sI;' .. ,si-l,Si+l,' .. ,Sn) que puede ser construida a partir de las
estrategias que no han sido an eliminadas de los espacios de estrategias
de losatros jugadores. Puesto que si es la primera delas estrategias de

,',
'~:'~

.
I

14/

JUEGOS ESTTICOS CON INFORMACIN

COMPLETA (e. 1)

AplicaciO/leE'

equilibrio en ser eliminada, las estrategias de equilibrio de otros jugadores


no han sido eliminadas, por lo que una de las consecuencias de (1.1.1) es

(1.1.2)

Pero (1.1.2) es contradicha por (EN): si debe ser una mejor respuesta a
(si, ... ,s:~1,s:+l"" ,s~), por lo que no puede existir una estrategia
que
domine estrictamente a si. Esta contradiccin completa la demostracin.
Despus de haber demostrado la proposicin Bhemos ya demostrado
parte de la proposicin A; lo nico que nos queda demostrar es que si
la eliminacin iterativa de estrategias estrictamente dominadas elimina
todas las estrategias excepto (si, ... ,s~), estas estrategias forman un equilibrio de Nash. Por la proposicin B cualesquiera otros equilibrios de
Nash habran sobrevivido tambin, por lo que este equilibrio debe ser
nico. Suponemos aqu que G es finito.
El argumento es nuevamente por contradiccin. Supongamos que
la eliminacin iterativa de estrategias estrictamente dominadas elimina
todas las estrategias excepto (si, ... ,si'), pero estas estrategias no forman
un equilibrio de Nash. Entonces debe existir un jugador i y alguna estrategia factible Si en Si tal que (EN) no se cumpla, pero S debe haber sido
estrictamente dominada por alguna otra estrategia s; en algn punto de]
proceso. Los enunciados formales de estas dos observaciones son: existe
S en Si tal que

<'

(1.1.3)
y existe s; en el conjunto de estrategias del jugador i que queda en algn
punto del proceso tal que
.
(1.1.4)

para cada (S1,", ,S-1,Si+1," . ,sn) que puede ser construida a partir de las
estrategias que quedan en los espacios de estrategias de los otros jugadores
en ese punto del proceso. Puesto que las estrategias de los otros jugadores
(si, ... ,si_1,s:+1'" . ,s~) nunca son eliminadas, una de las implicaciones de
(1.1.4) es

(1.1.5)

/ 15

Si s; = si (es decir, si si es la estrategia que domina estrictamente a s;)


(1.1.5) contradice a (1.1.3),en cuyo caso la demostracin est completa. Si
s; I si alguna otra estrategia s;' debe ms tarde dominar estrictamente a
ya que s; no sobrevive al proceso. Por eSO, las desigualdades anlogas
a (1.1.4) y (1.1.5) se cumplen para s; y s;', que sustituyen a Si y -< respec. tivamente. Una vez ms, si s;' = si la demostracin est completa; si no,
pueden construirse otras dos desigualdades anlogas. Puesto que
es
la nica estrategia de S que sobrevive al proceso, la repeticin de este
argumento (en un juego finito) completa finalmente la demostracin.

s;,

.<

1.2 Aplicaciones
1.2.A Modelo de duopolio de Cournot
Como hemos indicado en la seccin previa, Cournot (1838) se anticip
a la definicin de equilibrio de Nash en ms de un siglo (pero slo en
el contexto de un modelo concreto de duopolio). Por ello, no es sorprendente que el trabajo de Cournot constituya uno de los clsicos dea
teora de juegos y una de las piedras angulares en organizacin industriaL
Consideramos aqu una versin muy simple del modelo de Cournot y
presentaremos variaciones del modelo en los captulos siguientes. En esta
seccin utilizamos el modelo para ilustrar: (a) la traduccin del enunciado
informal de un problema a.la forma normal de un juego; (b) los clculos
necesarios para hallar el equilibrio de Nash del juego y (c) la eliminacin
iterativa de las estrategias estrictamente dominadas.
Sean q1 y q2 las cantidades (de un producto homogneo) producid~~
por las empresas 1 y 2 respectivamente. Sea P(Q) = a - Q el precio
de equilibrio de mercado cuando la cantidad agregada en el mercado es
Q = q1 + q2. (Ms precisamente, P(Q) = a - Q para Q < a. y P(Q) = Opara
Q 2: a.) Supongamos que el coste total de produccin de la cantidad qi
por la empresa i es C(q) = eq. Es decir, no existen costes fijos y el coste
marginal es constante e igual a e, donde suponemos que e < D.. Siguiendo
a Cournot, suponemos que las empresas eligen sus cantidades de forma
simultnea?
. 7 En la seccin 1.2.B discutimos el modelo de Bertrand (1883), en el cual las empres"s
ehgen preaos en vez de cantidades, y en la seccin 2.1.B el modelo de Stackelberg (J 934), en
el cual las empresas eJ:gen cantidades, pero una empresa eHge antes que (y es observada por)
la otra. Finalmente, discutimos en la seccin 2.3.C el modelo de Friedman (1971). en el cual la
interaccin descrita en el modelo de Coumot ocurre repetidamente en el tiempo .

16,' JUECOS EST.S.TICOS CON INFORMACIN COMPLETA' (e. 1)

Aplicaciones / 17

Para encontrar el equilibrio de Nash en el juego de Cournot, primero


traducimos el problema a un juego en forma normal. Recordemos de
la seccin anterior que la representacin en forma normal de un juego
exige precisar: (1) los jugadores en el juego; (2) las estrategias de que
dispone cada jugador y (3) las ganancias recibidas por cada jugador con
cada combinacin de estrategias posibles. Hay dos jugadores en un juego
de duopolio: las dos empresas. En el modelo de Cournot las estrategias
de que dispone cada empresa son las diferentes cantidades que puede
producir, Vamos a suponer que el producto es continuamente divisible.
Naturalmente, no puede haber produccin negativa. Por ello, el espacio
de estrategias de cada empresa puede ser representado com? Si ':"[O,OO)!
los nmeros reales no negativos, en cuyo caso una estrtegiapica'~i es
la eleccin de una cantidad q. 2': O.Se podra argumentar que no se puede
disponer de cantidades demasiado grandes, por 10 que stas 'no deb'ran
incluirse en el espacio de estrategias de una empresa. No obstante, puesto
que P(Q) = para Q 2: a, ninguna empresa producir una cantidad qi > a.
Quedan por concretar las ganancias de la empresa . en funcin de las
estrategias elelsidas por dicha empresa y por la otra empresa, y definir
y hallar el equilibrio. Suponemos que las ganancias de la empresa son
simplemente su beneficio. Por ello, la ganancia lli(Si,Sj) en u:r'tjuego general en forma normal de dos jugadores puede expresarse de la sigiente
forma:8

En el modelo de duopolio de Cournot, el enunciado anlogo es que el par


de cantidades (qj,qi) forma un equilibrio de Nash si, para cada empresa
i, q7 es una solucin de

"

Suponiengo que qj < (bc(<;:omo demostraremos que ocurre), la condicin


de primer orden del problema de optimizacin dela empresa i es necesaria
y suficiente, con lo que se obtiene
1

qi = 2(a - qj - e).

As, si l phrdecantidades (qj,qi) ha de formarun'equilibrlo de Nash,Jas


canhdadeselegidas por las ettpresas deben cumplir
'
"

ql*

= 21(a -

q2 - e)

21( a -

ql - e .

y
q2 =

lri(qi,qj)

= q[P(q

+ qj) - el = gira - (qi + qj) - c].

Recordemos de la seccin previa que, en un juego en forma normal de


dos jugadores, el par de estrategias (si ,si) forn'1.a. un equilibrio de Nash si,
para cada jugador i,
(EN)

para cada posible estrategia S en Si. De la misma forma, para cada


jugador i, 87debe ser una solucin del problema de optimizacin
max

'lLi(8i,8j)'

',ES,
8 Obsrvese que hemos cambiado ligeramente la notacin al escribir Ui(Si,Sj)
en vez
de 'l/.(SI,s2)'
Ambas expresiones representan las ganancias del'jugador i en funcin de las
estrategias elegidas por todos los jugadores, Vamos a utilizar estas expresiones (y sus anlogas
con 11 jugadores) indistintamente.

i~~.,

Resolviendo este par de ecuaciones obtenemos


'a - e
ql = q2 = -3-'
>1<

"

,..

que es ciertamente menor que a - e, como habamos supuesto.


La interpretacin de este equilibrio es simple. Cada empresa quema
por supuesto tener el monopolio del mercado, en cuyo caso elegira qi para
maximizar 1f'i(qi,O), producira la cantidad de monopolio q';'= (a - e)/2 y
alcanzara un beneficio de monopolio 1f'i(qm,O) = (a - e)2 / 4. Dado que hay
dos empresas, los beneficios agregados del duopolio se veran maximizados fijando una cantidad agregada ql + q2 igual a la cantidad de monopolio
qm, como ocurrirla si qi = qm/2 para cada i, por ejemplo. El problema de
este arreglo es que cada empresa tiene un incentivo para desviarse de l,
puesto que la cantidad de monopolio es baja, el precio correspondiente
P(qm) es alto y, a este precio, cada empresa quema aumentar su cantidad,
pese a que tal incremento en la produccin bajaria el precio de equilibrio
de mercado. (Formalmente, utilcese (1.2.1) para comprobar que qm/2 no
es la mejor respuesta de la empresa 2 a la eleccin de qm/2 por parte de la
empresa 1.) En el equilibrio de Cournot, al contrario, la cantidad agregada
es ms alta, por lo que el precio correspondiente es ms bajo, con lo que la'

,',
.,'

i.:,.

18

I JUEGOS

ESTTICOS CON INFORMACIN

Aplicaciones

COMPLETA (c. 1)

tentacin de aumentar la produccin queda reducida justo lo preciso para


que cada empresa decida no hacerlo, al darse cuenta de que con ello caer
el precio de equilibrio de mercado. Vase el ejercicio 1.4 para un anlisis
de cmo la presencia de un nmero n d oligopolistas afecta al dilema
planteado en equilibrio por la tentaciri de aumentar la produccin y el
temor a reducir el precio de equilibrio de mercado.
En vez de hallar de forma algebraica el equilibrio de Nash del juego
de Cournot, se podra hallar grficamente del modo siguiente: la ecuacin
(1.2.1) proporciona la mejor respuesta de la empresa i a la estr'tegia de
equilibrio de la empresa j, q;. Un razonamiento anlogo conduce a la mejor
respuesta de la empresa 2 a cUalquier estrategia arbitraria de la empresa
1, y la mejor respuesta de la empresa 1 a cualquier estrategia arbitraria
de la empresa 2. Suponiendo que la estrategia de la empresa 1 cumple
ql < a - c, la mejor respuesta de la empresa 2 es

I 19

Como se muestra en la figura 1.2.1 estas dos funciones de mejor respuesta


se cortan slo una vez, en el par de cantidades de equilibrio (qi ,q;).
Un tercer modo de hallar este equilibrio de Nash es aplicar el proceso
de eliminacin iterativa de las estrategias estrictamente dominadas. Este
proceso ofrece una nica solucin que, por la proposicin A del apndice
de la seccin anterior, debe ser un equilibrio de Nash (qj',qi). El proceso
completo requiere un nmero infinito de pasos, cada uno de los cuales
elimina una fraccin de las cantidades que quedan en el espacio de estrategias de cada empresa. Vamos a discutir solamente los dos primeros
pasos. En primer lugar, la cantidad de monopolio qm = (a. - c)/2 domina
estrictamente a cualquier cantidad ms alta. Es decir, para cada :/; > 0,
'lri(qm,qj) > 'lri(qm + x,qj) para toda qj ~ o. Para comprobarlo, ntese que
Q = qm + X + qj < a, por lo que

y
del mismo modo, si q2 es menor que a. - c, la mejor respuesta de la empresa
les
-

y si Q = qm + X + qj ~ a, entonces P(q) = O, por lo que producir


cantidad menor aumenta el beneficio. En segundo lugar, puesto
las cantidades mayores que qm han sido eliminadas, la cantielad
c)/4 domina estrictamente a cualquier cantidad ms baja. Esto es,
cualquier x entre cero y (a - c)/4,'lri [(a. - c)/4,qj] > 'lri[(o. - c)/4- x,qjJ
cualquier qj entre cero y (a - c)/2. Para comprobarlo, ntese que

"',
",!

'

q,

..::;

'Ir- (~

(O, a - e)

,q]

_) _ a - e
4

[3(0_ -

c) _

una
que
(a -

para
para

_]
q]

y
(O, (a - e)/2)
7fi

...

',-

x,qj

[a-c
-4- - x ] [3(a-C)
---4-- + x

a. - e
='lri ( qm,qj ) - X [ -2-

.)~
.-

. a - c)/2, O)

.,):

o.-c
( -4- -

-; Figura 1.2.1

(a

c, O)'

q,

+x

- qj

- qj

Tras estos dos pasos, las cantidades que quedan en el espacio de estrategias
de cada empresa sonlas contenidas en el intervalo entre (0.-c)/4 y (a-c) /2 .
La repeticin de estos argumentos conduce a intervalos cada vez menores

20/

JUECOS ESrrlCOS

CON INfORMACIN

Aplicaciones / 21

COMPLETA (e. 1)

de las cantidades que quedan. En el lmite, estos intervalos convergen al


nico punto IJ.; = (a -c)/3.
La eliminacin iterativa de las estrategias estrictamente dominadas
tambin se puede representar en forma grfica utilizando la observacin
(incluida en la nota 1; vase tambin la discusin en la seccin 1.3.A) de
que una estrategia es estrictamente dominada si y slo si no existe ninguna
conjetura sobre las decisiones posibles de los dems jugadores para la cual
sea la mejor respuesta. Puesto que slo hay dos empresas en este modelo,
podemos reformular esta observacin del siguiente modo: una cantidad
q es estrictamente dominada si y sJo si no hay ninguna conjetura sobreqj
tal que q sea la mejor respuesta de la en1presa i. Nuevamente"discutimos
slo los dos primeros pasos del pr,?ceso iterativo. En primer lugar,:n11~a
es una respuesta mejor para la empresa i producir ms que la canti~~d de
monopolio qm = (a - c)/2. Para comprobarlo, consideremos, por ejemplo,
la funcin de mejor respuesta de la empresa 2: en la figura 1.2.1, R2(q)
es igual a qm cuando q = 0, y disminuye cuando q] aumenta. As, para
cualquier qj 2: 0, si la empresa i cree que la empresa j elegir qj, la mejor
respuesta de la empresa . es menor que o igual a qm. No existe qj tal que
la mejor respuesta de la empresa i sea' mayor que qm. En segundo lugar,
dada esta cota superior para la cantidad de la empresa j, podemos derivar
una cota ms baja a la mejor respuest~ de la empresa i: si qj ::; (a - e)/2,
entonces R;(qj) 2: (a - c)/4, como mostramos para la mejor respuesta de
la empresa 2 en la figura 1.2.2.9
q,
(0, (a - e) /2)

R,(q)

(O, (a - e)/4)

Como en el caso anterior, la repeticin de estos argumentos conduce a la


cantidad qi = (a - c)/3.
Concluimos esta seccin cambiando el modelo de Coumot, de forma
que la eliminacin iterativa de las estrategias estrictamente dominadas no
ofrezca una solucin nica. Para hacerlo, aadimos simplemente una o
ms empresas al duopolio existente, Vamos a comprobar que el primero
de los dos pasos discutidos en el caso del duo polio contina cumplindose,
pero el proceso termina ah. Por eso, cuando hay ms de dos empresas,
la eliminacin iterativa de las estrategias estrictamente dominadas ofrece
slo la prediccin imprecisa de que la cantidad de cada empresa no ex'ceder a la cantidad de monopolio(como enla figura 1.1.4, donde no se
eliminaba ninguna ~strategia durante el proceso).
Para ser ms concretos, consideramos el caso de tres empresas. Sea
elegidas por las empresas distintas de i, y
sea 1ri(qQ -i) = q.(a - qi - Q -i - e) siempre que qi + Q -i < a (mientras que
7fi(qi,Q-i) =-Cqi si qi + Q-i 2: a). Nuevamente es cierto que la cantidad
de monopolio qm = (a - e)/2 domina estrictamente cualquier cantidad
ms alta. Es decir, para cualquier x > 0, 1ri(qm,Q-i) > 1ri(qm + ;,Q-D
para todo Q-i 2: 0, C0Il10 en el prime~ paso delcaso de duopolio.'sik
embargo, puesto que hay dos empresas adems de la empresa i, lo nico
que podemos decir acerca de Q_; es que est entre cero y(a - e), porque q/
y qk estn entre cero y (a - c)/2. Pero esto implica.que ninguna cantidad
qi 2: es estrictamente dominada en el caso de la empresa i, porque para
cada qi entrecero y (a -c)/2 existe un valor de Q-i entre cero y (a ~ e)
(concretamente;Q_i=
a - e - 2qi), tal que qi es lamejor respuesta de la
emp;esa i a Q~i. Poi- ello, en lo sucesivo ya no se puede eliminar rtingUIl~'
estrategia.
.
.'.

".

,
.....

Q- la suma de las cantidades

\ ..

,o,.

1.2.BModelo de duopolio de Bertrand


", ...
((a - e) /2,0)

(a - e, O)

Figura 1.2.2

9 Estos dos argumentos son ligeramente incompletos, puesto que no hemos analizado
la mejor respuesta de la empresa i cuando no tiene la certeza de cul sea la cantidad qj'
Supongamos que la empresai no est segura de qj pero cree que el valoresper<ldo,de qj
es E(q.i)' Puesto que 1ri(Qi,Qj) es lineal en qj,!a mejor respuesta de la empresa -tdentrode
su incertidumbre es igual a su mejor respesta cuando tiene la certeza d que la "empresa j
elegir E(qj), caso' que hemos desarrollado en el texto.
."..
c....':~c.'""':'"

A continuacin consideramos un modelo diferente de la relacin que


puede ~xistir entre dos duopolistas, basado en la sugerencia de Bertrand
(1883) de que, de hecho, las empresas eligen precios, y no cantidades
como en el modelo de Coumot. Es importante observar que el modelo de
Bertrand constituye un juego difererite (ndelo de Coumot: los espacios
de estrategias son diferentes, las funciones de ganancias son diferentes
y (como se ver) el comportamiento de los equilibrios de Nash en los
dos modelos es diferente.' Algunos autores resumen estas diferencias hablando de los equilibrios de Coumot y de Bertrand. Pero esto puede crear

',"

,..:

22/

Aplicaciones!

JUEGOS ESTTICOS CON JNFORNIACJN COMPLETA (c. 1)

confusiones, puesto que existen diferencias entre los juegos de Bertrand


y Cournot y en el comportamiento de equilibrio en estos juegos, pero /10
existe diferencia en el concepto de equilibrio utilizado en ambos juegos.
En ambos el concepto de equilibrio utilizado es el equilibrio de Nash definido en
la seccin anterior.
Consideremos el caso de productos diferenciados. (Para el caso de
productos homogneos vase el ejercicio 1.7.) Si las empresas 1 y 2 eligen
los precios PI y P2 respectivamente, la cantidad demandada a la empresa
i por los consumidores es

empresai,

max

'

..

pI~ .,.,'~:'~!;"~',"rr;:.',,';'

As;:el par depreaos


,.

:.::,

(pi ,pi)

=[a ~

~i./b;j][;~~'fr'

constituye un equilibriddeN~~~sr'para
-

cada

max [u,
O::;Pi

-]Ji

+ upj](Pi

eJ,

<00

+ bp*. + e).
.
Por 10 tanto, si el par de precios (pi ,pi) ha de ser un equilibrio de Nash,
las decisiones de precios de las empresas deben cumplir
pi =

pi

Vamos a suponer nuevamente que la fu~ci6n'dega;ariCas de cada


empresa es simplemente su beneficio. El bereficfc)de lIbprei>a i cuando
eli~~';l precio Pi y su rival elige el precio
<',;,;:'f:f'F~;(Pi,Pj)= qi(Pi,Pj)[Pi - c]

"i(pi'));)

La solucin al problema de optimizacin de .ies

donde o > O refleja hasta qu punto el producto de la empresa i es un


sustituto del producto de laempresaj.(sta
esuilafuiH:in de demanda
irreal, puesto que la cantidad demandada dei piodtict~ de la empresa
i es positiva incluso cuando la empresa i fija un preci arbitrariamente
alto, siempre que la empresa j tambin fije un precio suficientemente
alto. Como se ver, el problema slo tiene sentido si b < 2.) Como en
la discusin del modelo de Cournot, suponemos que no existen costes
fijos de produccin y que los costes marginales son constantes e iguales
a c, donde c < a y las empresas deciden (por ejemplo: eligen los precios)
simultneamente.
Como antes, la primera tarea en el procso de hallar el equilibrio de
Nash es traducir el problema a un juego en forma norni.al. Tenemos
dos jugadores nuevamente: Sin embargo, esta vez las estrategias de que
dispone cada empre~ason los diferentes precios que' pueden fijar, en
vez de las diferentes cantidades que pueden producir. Vamos a suponer
que los precios negativos no son factibles, pero que cualquier precio no
negativo lo es; por ejemplo, no existe ninguna restricCn a los precios
expresados en cntimos. As, el espacio de estrategias de cada empresa
puede ser nuevamente representado como Si.~[~ff,2),)?~ n.meros reales
no negativos, y una estrategia tpica Si es ahora Jil decisin de un precio
.

pi es una solucin de
O::;Pi <00

qi(PPj) = a - Pi + bpj,

Pi ~ O.

23

~(iJ,

= ~(a +

0/2 + c)

y
pi = ~(a+opi

+c)

2
Resolviendo este par de ecuaciones obtenemos
*
p}

= P2 =

a+c

2 - b'

1.2.C Arbitraje de oferta final

,, .

A ciertos trabajadores del sector pblico no les est permitido declararse


en huelga; en su lugar, las disputas salariales se resuelven mediante una
decisin arbitral vinculante. (La liga def tbol es un ejemplo ms llamativo
que el del sector pblico, pero es sustancialmente menos importante desde
un punto de vista econmico.) Otras muchas disputas, entre las que
se encuentran los casos de negligencia mdica y las denuncias de los
inversores contra sus agentes de bolsa, tambin suelen resolverse por
decisin arbitral. Las dos formas principales de arbitraje son el arbilraje
convencional y el de oferta final. En el arbitraje de oferta final las dos partes
hacen ofertas salariales yel rbitro decide entre una de las ofertils. Por
el contrario, en un arbitraje convencional el rbitro tiene libertad pnra
imponer cualquier salario. A continuacin, vamos a derivar las ofertils
salariales de equilibro de Nash, en un modelo de arbitraje de oferta final
desarrollado por Farber (1980).10
10 Esta aplicacin incluye algunos conceptos bsicos de probabilidad: funcin de distri.
bucin de probabilidad, funcin de densidad de probabilidad y valor esperado. Daremos
definiciones sucintas cuando sean necesarias; para ms detalles, consltese cualquier texto ele
introduccin a la probabilidad.

\",

'.'

24/

JUEGOS ESTTICOS CON INFOR,'vIACIN COMPLETA (e. 1)

Aplicaciones / 25

Supongamos que las partes en disputa son una empresa y un sindicato,


y que la disputa es acerca de los salarios. Supongamos que el juego se
desarrolla de la siguiente manera: primero, la empresa yel sindicato realizan simultneamente ofertas, denominadas 'We y w . En segundo lugar,
el rbitro elige una de las dos ofertas. (Como' en muchos de los llamados juegos estticos, esto es en realidad un juego dinmico del tipo que
discutiremos en el captulo 2, pero aqu lo reducimos a un juego esttico
enlre la empresa y el sindicato al suponer una determinada conducta del
rbitro en la segunda etapa.) Supongamos que el rbitro tiene un acuerdo
ideal que le gustara imponer, que denominamos x. Supongamos adems
que, tras observar las ofertas de las partes, 'We y 'W., el rbitro elige simplemente la oferta ms cercana a x: siempre que 'We < 'W. (una intuicin
que demostraremos que se cumple) el rbitro elige 'We si x < ('We + 'W.)/2 Y
elige 1/J. si]; > (-we + 'W.)/2, como vemos en la figura 1.2.3. (Lo que ocurre
si 1; = (tue + 'W.)/2 es irrelevante; supongamos que el rbitro lanza una
moneda.)

IV,

es elegida

W,

Prob { weelegido}

1/Je +'W.}
Prob { x < --2-

(We

s)

+W

= F --2-

:.',

';-

y
Prob {. weelegldo}

e+ws)
1- F (1/J--2-

:':.'

As, el acuerdo salarial esperado es

We

Prob{ 'Weelegido}+w . Prob{ wselegido}

'We . F CUe;'Ws)

+ w .

[1 _ F (We; Ws)] .

Suponemos que la empresa quiere minimizar el salario esperado impuesto


por el rbitro y el sindicato quiere maximizarlo.
Si el par de ofertas (w:,w';) ha de constituir un equilibrio deNash del
juego entre la empresa y el sindiato,
debe ser una 'solucin d~ .

w:
. F(we+w;)
~:nwe'
--2-'-" +ws',[

es elegida

1-

F(we+w;)]
-'-2--

y w;debe ser una~oluc~l1 de


x
W,

(W,+W,)

/2

As, el par de ofertas salariales (w:,w;) debe ser una solucin de las condici~nes de primer orden de estos problemas de optimizacin:

(w;' - w:) . ~!(w: ; w;) = F (w; ; w;)

Figura 1.2.3

(!:,
(

y
El valor de x es conocido por el rbitro, pero no por las partes. Las parles creen que x se distribuye aleatoriamente segn una distribw,:in de probabilidad F(x), con la correspondiente funcin de densidad !(x).l1Dada
nuestra especificacin acerca del comportamiento del rbitro, si las ofertas
son UJe y w., las partes creen que las probabilidades Prob{we sea elegida}
y Prob{'Wssea elegida} pueden ser expresadas de la siguiente forma:'
Esto es, la probabilidad de que x sea menor que un valor arbitrario x' es F(x'),
Puesto q\le F(x') es una
probabilidad, tenemos que O ~ F(x') ~ 1 para cualquier x'. Adems, si. "," >. x',
H
F(x ) 2: F(x'); entonces Cc') 2: Opara cada x'.

(w; -

w:).~! ('W:; W;). [1- (w; ;w;)].

(....

(Posponemos la consideracip..de si estas condiciones de primer orden son


suficientes.) Puesto que los trminos de la izquierda de estas condiciones
de primer orden son iguales, los trminos de la derecha deben asimismo
ser iguales, lo que implica que

11

y la derivada de esta probabilidad con respecto a x" es (x').

12 Al formular los problemas de optimizacin de la empresa y el sindicato hemos supuesto


que la oferta de la empresa es menor que la oferta del sindicato. Es inmediato demostrar que
esta desigualdad se debe cumplir en equilibrio.

Aplicaco/les

26/ JUEGOS ESTTICOS CON INFOIUvlAClN COMPLETA (e ])

F(W;+W;)
2

=~.
2'

(1.2.2)

esto es, la oferta media debe ser igual a la mediana del acuerdo preferido
por el rbitro. Sustituyendo (1.2.2) en cualquiera de las condiciones de
primer orden obtenemos
W

-1))

* =

C,,;;w;

(1.2.3)

esto es, la distancia entre las ofertas debe serigual a la inversa del valor
de la funcin de densidad evaluada en la mediana del acuerdo preferido
por el rbitro ..
Consideremos el siguiente ejemplo, que ofrece un resultado de estatica
comparativa que resulta intuitivamente atractivo. Supongamos que el
acuerdo preferido por el rbitro se distribuye normalmente con media m
y varianza a2, en cuyo caso la funcin de densidad es
f(x) = _1_
exp { __ l_(x _
V2rra2
2a2

m)2}.

(En este ejemplo, se puede demostrar que las condiciones de primer orden
anteriormente dadas son suficientes.) Puesto que una distribucin normal
es simtrica con respecto a su media, la mediana de la distrjbuCn es igual
a su media, m. Por lo tanto, (1.2.2) se convierte en

W: 'w;

+
--2--=m

Y0.2.3) se convierte en
* __ 1__
~
we - f(m) - v2rra

*_

Ws

por lo que las ofertas de equilibrio de Nash son


w',= m
s'

+~,
'ff

w*=m
e

'-

ff'
2

rra .'

2 ,-

As, en equilibrio, las ofertas de las partes se centran alrededor de la


esperanza del acuerdo preferido por el rbitro (esddr, m), y la distancia
~~tre las .ofertas aumenta con la incertidumbre de ias partes acerca del
acuerdo preferido por el rbitro (es decir, ~2).

/ Z7

La interpretacin de este equilibrio es simple. Cada parte se enfrenta


a un dilema. Una oferta ms agresiva (es decir, una oferta ms baja
por parte de la empresa o una oferta ms alta por parte del sindicato)
genera unas ganancias mayores si es elegida por el rbitro, pero es menos
probable que sea elegida. (Veremos en el captulo 3 que un dilema similar
aparece en una licitacin a pliego cerrado y al precio ms alto: una puja
ms baja genera unas ganancias mayores si es la puja ganadora, pero
reduce probabilidad de ganar.) Cuando hay ms incertidumbre sobre el
acuerdo preferido por el rbitro (es decir, (J2 es ms alta), las partes pueden
permitirse ser ms agresivas, puesto que una oferta agresiva tiene menos
probabilidades de ser muy diferente del acuerdo preferido por el rbitro.
Por el contrario, cuando apenas hay incertidumbre, ninguna parte puede
permitirse hacer una oferta alejada de la media, porque es muy probable
que el rbitro prefiera acuerdos cercanos a '/1];
1.2.D El problema de los ejidos
Al menos desde Hume (1739), los filsofos polticos Y los economistas
han entendido que si los ciudadanos responden nicamente a incentivos
privados, habr un dficit en la provisin de bienes pblicos y los recursos
pblicos estarn sobreutilizados. Hoy en da, basta con fijarse en el medio
ambiente para constatar la fuerza de esta idea. Fue el trabajo ampliamente
citado de Hardin (968) el que fij la atencin de los no economistas sobre
el problema. A continuacin analizam.os un ejemplo buclico.
C.onsideremos los n habitantes de una aldea. Cada verano todos los
aldeanos llevan sus cabras a pastar en el ejido de la aldea. Denominamos
gi el nmero de cabras que el i-simo campesino posee y el nmero total
de cabras en la aldea G = .rJ] + ... + gn' El coste de comprar y cuidar una
cabra es e, independientemente de cuntas cabras se posean. El valor de
criar una cabra en el ejido cuando all se concentra un total de G cabras es
v(G) por cabra. Puesto que una cabra necesita al menos una cierta cantidad
de pasto para sobrevivir, existe Ull nmero mximo de cabras que pueden
pastar en el ejido, Gmax:v(G) > O para G < Gmax, pero 11(G) = O para
G::: Gmax. Por otra parte, puesto que las primeras cabras disponen de un
amplio espacio para pastar, aadir una ms no afecta a las que ya est n alJi,
pero cuando hay tantas cabras pastando que apenas pueden sobrevivir
(es decir, G est justo por debajo de Gmor), aadir una cabra ms afecta i1
las dems de forma dramtica. Formillmente: para G < Gmor., 1)';') < IJ

28/

JUEGOS ESTTICOS CON INFORMACiN

yul/(G)

Teora avanzada: Estrategias mixtas

COMPLETA (e. )),

< 0, como muestra la figura

1j

existencia de equilibrio / 29

1.2.4.,

max Gv(G) - Ge, .


O$G<oo

',.:,.

para la cual la condicin de primer orden es


v(C**) + G**v'(C**)

Figura 1.2.4
Durante la primavera, los aldeanos eligen simultneamente cuntas
cabras van a tener. Supongamos que las cabras son continuamente divisibles. Una estrategia del aldeano i es la decisin sobre el nmero de cabras
que llevar a pastar en el ejido, 9.. Suponer que el espacio de estrategias
es [0,00) cubre todas las opciones' del aldeano; [O,Gmax) tambin bastara.
Las ganancias del aldeano opor criar 9i cabras cuando el nmero de cabras
criadas por otros aldeanos es 91,' .. ,9';-1,9i+l .. o,9", es

- e=

(1.2.7)

La comparacin entre (1.2.6) y (1.2.7) muestra13 que G* > G**: en el


equilibrio de Nash se cran demasiadas cabras comparado con el ptimo
sociaL La condicin de primer orden (1.2.5) refleja los incentivos que tiene
un aldeano que Y'il est criando 9i eabr<;ispero considera aadir una ms
(o, de fOnn.ams precisa, una pequea fraccin de una ms). El valor de
la cabra adicional es V(9i + 9~i) ysu coste es e. El dao a las cabras ya
ex.jstelltesdel aldeano es V'(9i +9"-;> por cabra, o 9iV'(9i + 9,,-Jn totaL Los
recursos comunales estn sobreutilizados porque cada aldeano considera
slosu-propia situacin, y no el efecto de sus decisiones sobre los otros
aldeanos; de aqula presencia de G*v'(C*) In en (1.2.6), pero de G"*v'(G**)

<: "',

( ;.

en (1.2.7).
1.3 Teora avanzada: Estrategias mixtas y existencia de equilibrio
,':

'.

~'.'

1.3.A Estrategias mixtas


9iV(91,'"

,9i-l,9i + 9i+],'" + 9,,) - e9i.

(1.2.4)

As, si (9, ... ,g~) ha de constituir un equilibrio de Nash, para cada i, 9i


debe maximizar (1.2.4) dado que los otros aldeanos eligen (9, ... ,97-1'
97H'" .,9~)o La condicin de primer orden de este problema de optimizacin es

En la seccin 1.1.C hemos dinido Si como el conjunto de estrategias conque cuenta el jugador i, y la combiriacion de estrategias (si, ... ,s~) cono
un equilibrio deNash si, para cada jugador i,'.s7es la mejor respuesta' dt
jugador i a las estrategias de los otros n - 1jugadores:
(.

v(9' +

9~) + 9(U'(9 + 9~) - e = 0,

(1.2.5)

donde 9"-i denota 9 + ... + 97-1 + 97+1+ ... + 9~. Sustituyendo 9i en


0.2.5), sumando tod~s lascondicionesde primer orden de los n aldeanos
y dividiendo luego por n se obtiene
v(G*) + ~C'u'(G*)
n

- e = 0,

(1.2.6)

donde C* denota 91'+ o.. + 9~. Por el contrario, el ptimo social, denotado
con G**, es una solucin de

(EN)

para cada estrategia S en Si. Segn esta definicin no existe ningn


equilibrio de Nash en el siguiente juego conocido como el juego de las
monedas (matchng pennies).
. .,
13 Supongamos, a la inversa,que,q:"::$ C*~. ,Entoncesv(C*) ::::'v(C**), puesto que v' <O.
Del mismo modo, O > v'(C~) ::::v'<O*~),pu~sto que v" <O. Finalmente, C* /n < C**. As,
eltnnino de la izquierda de d..6) es~slridamente mayor que eltnnin~ de la izquierda de
(1.2.7), lo cual es imposible dado 'que ambos son iguales a cero.

:::

'~~.
".'

Teora avanzada:

30/ JUEGOS ESTTICOS CON JNFORJYIAClN COMPLETA (c. 1)

Jugador 2
Cara Cruz
Cara
"',

-1,1

1,~1

Cruz 1, -1

-1,1

Jugador 1

'.

El juego de las mOlledas

<~.'

En e~tej~ego el espacio~e estrategias de cada jugador es {cata, cruz}.


~a hl~tona que explica las ganancias en la matriz binaria
lasiguiente:
rmagmemos que cada jugador tiene una moneda y debe elegir ihostrar
una cara de la moneda. Si las dos monedas (:t)mciden, esto es; ambas
muestran la misma clra,71 jugador 2 gana la moneda del jugador]. Si las
caras de las monedas no coinciden entonces el jugador 1 gana la moneda
del jugador 2. No existe nihgn par de estrategias que pueda 'cumplir
(EN), puesto que si las estrategias de los jugadres coinciden (cara;cara)
o (cruz, cruz), el jugador 1 prefiere cambiar su estrategia, mientras que si
las e.strategias no coinciden (cara,cruz) o (cruz, cara), es el jugador 2 quien
prefiere cambiar su estrategia.
, .',
. ~l rasg~ distintivo de este juego es que. a cada ju~ad~r le gustara
adIvmar la Jugada del otro y que el otro no' adivinase la suya. Versiones
de este juego tambin se dan en el pquer, el bisbol, en las;ba.taBas y en
~tras situaciones. En el pquer, la cuestin anloga es con qu frecuencia
tirarse un farol: si se sabe que el jugador i nunca; se tira,-froles, sus
oponentes pasarn siempre que i apueste de formaagr~:i,j;~ci~~4o
que a i le convenga tirarse un farol de cuando en cuando" .. Por;'otra
parte, tirarse faroles con demasiada frecuencia cons~!Uye,~~';~~tr~t:egia
perdedora. En bisbol, supongamos que el lanzador puede lanzar la bolil
o bien de forma rpida o bien describiendo una curva, y que 'el bateador
puede darle a cualquiera de ellas si (y slo si) la prev CO~IIlente.
De
forma similar, en una batalla, podemos suponer que los ,a,tac,~~e~pueden
elegir entre dos objetivos (o dos rutas, como por tierrap;p!Jf}nr),yque
la defensa puede rechazar cualquiera de los dos ataqu; si (Y;.l>61QLsijs.te
es previsto de forma correcta.
' , ''':I;,~,toJ~1i\B~;,'.',;;"
(En cualquier juego en el cual a cada jugador le co~;~g)di~
l~
jugada del otro y que el otro no adivine la~uya;l:liJ1~~f~)\:tii~:~~~
brio de Nash (al menos tal como este conc~Pt\\g~," .11!-.-:::r,W;'ii<:'>'-''''.,.c~~

es

la seccin l.1.C), porque la solucin de tal jueg~1gW

. 7.~';'\f,-:1~~>7

..

:ei:e'

~~~:;t~f~;
,

Estrategias

mixtas y existencia

de equililnio

/ 31

un elemento de incertidumbre sobre lo que harn los jugadores. A continuacin, introducimos la nocin de estrategia mix/:a, que interpretamos en
trminos de la incertidumbre de un jugador respecto a lo que otro jugador
har. (Esta interpretacin fue avanzada por Harsanyi [1973];la discutiremos con ms detalle en la seccin 3.2.A,) En la prxima seccin vamos a
ampliar la definicin de equilibrio de Nash para que incluya estrategias
mixtas, incorporando con ello el elemento de incertidumbre inherente a la
solucin de juegos como el juego de las monedas, del pquer, del bisbol
y de las batallas.
Formalmente, para el jugador i una estrategia mixta es una distribucin de probabilidad sobre (algunas o todas) las estrategias en Si' De
aqu en adelante nos referiremos a las estrategias en Si como estrategias
puras del jugador i. En los juegos con decisin simultnea e informacin
completa analizados en este captulo, las estrategias puras de un jugador
son las diferentes decisiones que el jugador puede tomar. En el juego de
las monedas, por ejemplo, Si consiste en las dos estrategias puras cara y
cruz, as que una estrategia mixta para el jugador i es la distribucin de
probabilidad (q,1 - q), donde q es la probabilidad de elegir cara, 1 - q es
la probabilidad de elegir cruz, y S q S 1. La estrategia mixta (0,1) es
simplemente la estrategia pUra cruz; del mismo modo, la estrategia mixta
(1,0) es la estrategia pura cara.
Como un segundo ejemplo de estrategia mixta, recordemos la figura
1.1.1, en la que el jugador 2 cuenta con las estrategias puras izquierda,
centro y derecha. En este caso, para el jugador 2 una estrategia mixta es la
distribucin de probabilidad (q,r,l - q - r), en la que q es la probabilidad
de elegir izquierda, r es la probabilidad de elegir centro y 1 - q - 7" es la
probabilidad de elegir derecha. Como antes, S q S 1, Y ahora tambin
S r S 1 Y O S q + r S 1. En este juego la ~strategia mixta 0/3,1/3,1/3)
asigna la misma probabilidad a izquierda, centro y derecha, mientras que
(1/2,1/2,0) asigna la misma 'probabilidad a izquierda y centro, pero no
asigna ninguna probabilidad a derecha. Como siempre, las estrategias
puras de un jugador son simplemente los casos lmite de sus estrategias
mixtas (por ejemplo, aqu la estrategia pura izquierda del jugador 2 es la
estrategia mixta (1, 0, O,
,,'
De forma .ms general, supongamosq~e el jugador i cuenta con [(
estrategias puras: Si = {Sil,:" ,.me}. En este caso, para el jugadori
una estrategia mixta es una distribucin de probabilidad (Pi]" .. ,]J;f(), en
la que Pik es la probabilidad,A~: <J~el jugador i elija la estrategia 8;b
para k = 1, ... ,J(. Puesto que Pik'es una probabilidad, es necesi1rio que

32 / JLECOS EST.JCOS CON INFORtvJAClN COMPLETA (c. 1)

Teora avanzada: Estrategias mixtas y existencia de eqllil brio / 33

:S Pi, :S 1 para k = 1, ... ,Jo( Y Ji] + ... + Pi!,' = 1. Vamos a utilizar


para denotar una estrategia mixta del conjunto de distribuciones de
probabilidad sobre Si, del mismo modo que utilizamos Si para denotar
una estrategia pura de Si.

Ji

Definicin. En el juego en forma normal G '= {S], ... ,Sn; U], . , , /un} supongamos que Si = {Si], ... ,SiK }. En este caso para el jugador . una estrategia
mixta es lIna distribucin de probabilidad Vi = (P'i1" .. ,PiK), dnde
Pi, ::; 1
para k = 1, . , . ,K Y Pi] + . , , + Vil, = 1.

::;

Concluimos esta seccin volviendo brevemente a la nocin de estrategias estrictamente dominadas que introdujimos en la seccin 1.1.B,
con objeto de ilustrar el papel potencial de las estrategias mixtas en los
argumentos all utilizados. Recordemosque si una estrategia Si es estrictamente dominada, no existe ninguna conjetura que el jugador ' pueda
formarse (sobre las estrategias que elegirn los dems jugadores) tal que
hiciera ptimo elegir S". El argumento inverso tambin se cumple, siempre que permitamos estrategias mixtas: si no existe ninguna conjetura que
el jugador i pueda formarse (sobre las estrategias que elegirn los dems
jugadores) tal que hiciera ,ptimo elegir Si, existe otra estrategia que domina estrictamente a S.]4 Los juegos de las figuras 1.3.1 y 1.3.2 muestran
que este argumento inverso sera falso si limitramos nuestra atencin a
estrategias puras.
Jugador 2
1

. A 3,- 0,-

Jugador 1

!vI 0,- 3,B 1,- 1,-

Figura 1.3.1
I~ Pearce (l984) demuestra este resultado en el caso de dos jugadores, e indica que se
cumple para el caso de n jugadores siempre que las estrategias mixtas de los jugadores puedan
estar correlacionadas. Es decir, siempre que lo que suponga el jugador . sobre lo que har
el jugador j pueda estar correlacionado con lo que suponga el jugador i sobre lo que har el
jugador k. Aurnann (1987)sugiere que tal correlacin en los supuestos de i es completamente
natural, incluso si j, i Y k toman sus decisiones de fomla totalmente independiente: por
ejemplo, i puede saber que tanto j como k fueron a una escuela de direccin de empresas, o
incluso a la misma escuela, pero puede no saber lo que se ensea en ella.

La figura 1.3.1 muestra que una estrategia pura dada puede estar es'trictamente dominada por una estrategia mixta, incluso si la estrategia
pura no est estrictamente dominada por ninguna otra estrategia pura.
En este juego, para cualquier conjetura (q,l- q) que el jugador 1 pudiera
formarse sobre el juego del jugador 2, la mejor respuesta de 1 es o A
(si q ::::1/2) o !vI (si q ::; 1/2), pero nunca B. Sin embargo, B no est
estrictamente dOIInada ni por A ni por 1'1'1. La clave es que B est estrictamente dominada por una estrategia mixta: si el jugador 1 elige A
con probabilidad 1/2 y !vI con probabilidad 1/2, la ganancia esperada de
1 es 3/2, independientemente de qu estrategia (pura o mixta) utilice 2,y
3/2 es mayor que el pago a 1 que produce con certeza la eleccin de!?;
Este ejemplo ilustra el papel de las estrategias mixtas para encontrar "otra
estrategia que domine estrictamente a s/'.
Jugador 2

A 3,- 0,-

Jugador 1

!vI O~- 3,B 2,- 2~


,

Figura 1.3.2
La figura 1.3.2 muestra que una estrategia pura dada puede ser una
mejor respuesta a una estrategia IIxta,incluso si la estrategia pura no 'es
una mejor respuesta a ninguna otra estrategia pura. En este juego,'Bno
es una mejor respuesta para el jugador 1 a IoD deljugador 2, pero B E!s l
mejor respuesta del jugador 1 a la estrategia mixta (q,1 - q) del jugador 2,
siempre que 1/3 < q < 2/3. Este ejemplo ilustra el papel de las estrategias
mixtas en la "conjetura que se puede formar el jugador '".

i~

1.3.B Existencia del equilibrio de Nash


En esta seccin discutimos varios temas relacionados con la existencia del
equilibrio de Nash. En primer lugar, ampliamos la definicin de equilibrio de Na'sh dada en la seccin 1.1.C para inluir las estrategias mixtas.
En segundo lugar, aplicamos esta definiCin ampliada al juego de las monedas y a la batalla de los sexos. En tercer lugar, utilizamos un argumento
grfico para deIl10strar que cualquier juego de dos jugadores en el cual

e~

A_

\,

Teora avanzada:

34/ JUEGOS ESTTICOS CON [N FORMACIN COMPLETA (c. 1)

cada jugador cuenta con dos estrategias puras tiene un equilibrio de Nash
(que posiblemente incluya estrategias mixtas). Finalmente; enunciamos y
discutimos el teorema de Nash (1950), que garantiza que cualquier juego
finito (es decir, cualquier juego con un nmero finito de jugadores, cada
uno de los cuales cuenta con unnmero nito de estrategias puras) tiene
un equilibrio de Nash (que posiblemente iricluya estrategias mixtas),
Recordemos que la definicin de equilibrio de Nash dada en la seccin
1.1.C garantiza que la estrategia pura de cada jugadoI: consti,tuye una
mejor respuesta a las estrategias puras d los restantes jugaddres. Para
ampliar la definicin de modo que incluya estrategias mixtas, necesitamos simplemente que la e"strateiPaI"nixtade cada jugador sea.una mejor
respuesta a las estrategias mixtas de los otros jugadores. Puesto que cUale
quier estrategia pura puede ser representada <:'0#10 la estiit~gia que asigna
~a probabilidad cero a todas sus otras estrategias puras, esta definicin
ampliada incluye a la ari'terior.
. La forma de hallar la mejor respuesta del jugador i a una estrategia
mIXtadel jugador j se basa en la interpretacin de la estrategia mixta del
jugador j como representacin de la incertidumbre d~l Jugador i sobre lo
que har el jugador j. Continuamos con el juego de las monedas como
ejemplo. Supongamos que el jugador 1 cree que el jugador 2 elegir cara
con probabilidad '1 y cruz con probabilidad 1 - '1; esto es, 1 supone que
2 elegir la estrategia mixta ('1,1 - '1). Bajo,este supuesto, las ganancias
esperadas del jugador 1 son '1. (-1) + O - '1) . 1 = 1 - 2'1 eligiendo cara y
'1' 1 + 0- '1) . (-1) = 2'1 - 1 eligiendo cruz. Puesto que 1 - 2'1 > 2'1 -1 si
Yslo si '1 < 1/2, la mejor respuesta en estrategias puras del jugador.1 es
cara si '1 < 1/2 Ycruz si '1 > 1/2, Yel jugador 1 ser indiferente en.tre cara
y cruz si.'1 = 1/2. Nos quedan por considerar las estrategias mixtas del
jugador 1.
.
Sea (,,1 - ,) la estrategia mixta en la cual el j~gador 1 elige ~ara con
probabilidad ,. Para cada valor de '1 entre cero y uno, cakulamos.el(los)
valor(es) de" denotado(s) por ('1) tal que (,,1-,) sea una mejor respuesta
del jugador 1 a ('1,1 - '1) del jugador 2. Los resultados se r~cogen"~n la
figura 1.3.3. La ganancia esperada del jugador 1 al elegir (,,1-' ,) cuand~
2 elige ('1,1 - '1) es

,*

''1.(-1)+,0-

'1).1+(1-')'1,1

+(1-1')0 - '1).(-1) = (2'1-1)+,(2-4'1)"

0.3.1) .
~_ .~,~ 'c~~'

donde ''1 es la probabilidad de (cara, cara),


'0.':

f(1 -'1}

la probbil~daad

Estmtegil1S

mixtas y existencia

de c'1,llibrio / 3.5

(cara, cruz), y as sucesivamente.iS Puesto que la ganancia esperada del


jugador 1 es creciente en .,.si 2 - 4'1 > OYdecreciente en .,.si 2 - 41} < O,
la mejor respuesta del jugador 1 es T = 1 (es decir, cara) si r < 1/2 Y T = O
(es decir, cruz) si '1 > 1/2, como indican los dos segmentos horizontales
de ,*('1) en la figura 1.3.3. Esta afirmacin es ms poderosa que la afirmacin del prrafo anterior con la que est estrechamente relacionada:
en aqulla considerbamos solamente estrategias puras y encontrbamos
que si '1 < 1/2, cara era la mejor estrategia pura, y que si '1 > 1/2, cruz
era la mejor estrategia pura. En sta consideramos todas las estrategias,
puras y mixtas, pero encontramos nuevamente que si r < 1/2, cara es la
mejor estrategia de todas (puras o mixtas), y que si '1 > 1/2, cruz es la
mejor estrategia de todas.

,
,*('1)
(Cara)

(Cruz)

1/2

.1

'1

(Cara)

(Cruz)

Figura 1.3.3
La naturaleza de la mejor respuesta del jugador 1 a ('1,1 - '1) cambia
cuando '1 = 1/2. Como indicamos anteriormente, cuando r == 1/2 el
jugador 1 es indiferente entre las estrategias puras cara y cruz. Adems,
puesto que la ganancia esperada del jugador 1 en (1.3.1)es independiente
;';"",1;',"1",:

1, ,.1

15 Los sucesos A y B son indepimdientes'si


rrob{A y B} =Prob{A}.Prob{B).
As, ,1
escribir rq como la probabilidad de que r elij cara y 2 elija cara, estamos suponiendo que
1 y 2 toman sus decisiones de form independjente,
como corresponde a la deso"ipci611 que
dimos de los juegos de decisin Sill:'.\!Jt!\e.a.Consltese Aumann (1974) para la d"finiciu de
equilibrio correlacionado, que se'-!.tY~:;;T',it1:,gos en los cuales las decisiones de Jos jugadores
pueden estar correlacionadas, puest?,;qtif!js:rvan
el resultado de un suceso ale"lorio. como
el lanzamiento de una moneda, antes de elegIr sus respectivas estrategias.

36/

JuEGOS ESTTICOS CON INFORMACIN

COMPLETA (e. 1)

Teora avanzada: Estrategias mixtas y existencia de equilibrio / 37

der cuando q := 1/2, el jugador 1 es tambin indiferente entre todas las


estrategias mixtas (,.,1 - r). Es decir, cuando q := 1/2 la estrategia mixta
(r,1 - T) es la mejor respuesta a (q,1 - q) para cualquier valor de T entre
cero y uno. As, r* O /2) es todo el intervalo [O,1L como indica el segmento
vertical de r*(q) en la figura 1.3.3. En el anlisis del modelo de Coumot
en la seccin 1.2.A, llamamos a Ri(q) la funcin de mejor respuesta de la
empresa i. AqU, puesto que existe un valor de q tal que r*(q) tiene ms
de un valor, llamamos a r*(q) la correspondencia de mejor respuesta del
~~dm1.
J
Para derivar de forma ms general la mejor respu~sta del jugador
i a la estrategia mixta del jugador j, as como para dar un enunciado
formal de la definicin ampliada del equilibrio de Nash, limitamos ahora
nuestra atencin al caso de dos jugadores, que permite presentar las ideas
principales de modo ms sencillo. Sea J el nmero de estrategias puras
en .eh y J( el nmero de estrategias puras en S2. Vamos a escribir SI :=
{ SI j, , , . ,S1] } y S2 := {S21, ... ,S2K }, y vamos a utilizar Slj y S2k para denotar
las estrategias puras arbitrarias de SI y S2 respectivamente.
Si el jugador 1 cree que el jugador 2 utilizar las estrategias (S21, ... ,S2K)
con probabilidades (p21,' .. ,P2K), la ganancia esperada del jugador 1 por
utilizar la estrategia pura Slj es

LP2k'Ul(Slj,S2k)

~ LP2kUl(Sj~S2k)

k;l

k;1

para cada Slj' en SI' Esto es, para que una estrategia mixta sea una mejor
respuesta a P2 debe asignar una probabilidad positiva a una estrategia
pura concreta slo si sta es una mejor respuesta a P2. De forma inversa,
si el jugador 1tiene varias estrategias puras que son mejores respuestas a
P21 cualquier estrategia mixta que asigna toda su probabilidad a algunas
o ~ todas estas mejores respuestas en estrategias puras (y probabilidad
cero al resto de las estrategias puras) es tambin una mejor respuesta del
jugador 1 a P2.
Para dar un enunciado fonnal de la definicin ampliada del equilibrio
de Nash necesitamos calcular'la ganancia esperada del jugador 2 cuando
los jugadores 1 y 21;1tilizanlas estrategias mixtas PI y P2. Si el jugador 2 cree
que el jugad m 1 utilizar las estrategias (Sl1,' .. ,S1]) con probabilidades
(p11,' .. ,PIJ), la ganancia esperada del jugador 2 por utilizar las estrategias
(S21,' .. ,S2K) con probabilidades (p21," . ,P2K) es

V2(Pl,P:=

[ J

f;P2k

~PljU2(S1j,S2k)

:=

y la ganancia esperada del jugador 1 por utilizar la estrategia mixta PI


(Pll, ... ,Pu) es

VI (Pl,P2)

:=

:=

L
j;l

Plj

L
j;l

0,3.2)

P2kUI (Slj,S2k),

k;1

[ K
c

L P2kU (Slj,S2k)
k;l

K
L

Plj . P2k U2(Slj,S2k).

j;1 k;l
:=

(1.3.3)

Dadas VI (Pl,P2) Y V2(Pl,P podemos refommlar el requisito del equilibrio


de Nash de que la estrategia mixta de cada jugador tenga que ser una
mejor respuesta a la estrategia mixta de los dems jugadores: para que
el par de estrategias mixtas (pi ,pi) forme un equilibrio de Nash, pi debe
cumplir

L Plj . P2k'Ul Cslj,S2k),


k;l

(1.3.4)

donde Plj . P2k es la probabilidad de que 1 utilice Slj y 2 utilice S2k. La


ganancia esperada del jugador 1 con la estrategia mixta PI, dado en (1.3.3),
es la Suma ponderada de las ganancias esperadas con cada ~~a de las
estrategias puras {Sl1," . ,S1]} dada en (1.3.2), donde las ponderaciones
son las probabilidades (Pll,'"
,PIJ)'
As, para que la estratgia 'mixta
(Pll, ... ,PI J) sea una mejor respuesta del jugador 1 a la estrategia mixta P2
del jugador 2, debe cumplirse que Plj > Oslo si

para cada distribucin de probabilidad


vhi,pi)

PI

sobre

SI,

0.3.5)

~ v2(pi,P2)

c'

y pi debe cumplir

";:,-

para cada distribucin de probabilidad

P2 sobre

52.

Definicin. En el juego en forma normal de dos jugadores G := {S,S2; 'Ul/U2} las


estrategias mixtas (pi ,pi) fonnan un equilibrio de Nash si la estrategia rixta

38/ JUEGOS ESTTICOS CON INFORMACIN COMPLETA (e. ])

Teora avanzada:

de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador:
(1.3.4) y (1.3.5) deben cumplirse.
q
q*(r)

(Cara) 1

:'~:,

1/2

mixtas y existencia

de eqllilil".jrJ / 39

mejor respuesta del jugador. a la estrategiamixla del jugador j presellt~Ja


en la figura 1.3.3. Para complementar la figura 1.3.3 calculamos el(los)
valor(es) de '1, denotado(s) por '1*(1'), tal(es) que ('1,1 - '1) es una mejor
. respuesta del jugador 2 a (r,l - r) del jugador 1. Los resultados se recogen
en la figura 1.3.4. Si r < 1/2, la mejor respuesta de 2 es cruz, de forma que
q*(r) = O.Del mismo modo, si r > 1/2, la mejor respuesta de 2 es cara, de
forma que q*(r) = 1. Si r = 1/2, el jugador es indiferente no slo entre cara
y cruz sino tambin entre todas las estrategias mixtas ('1,1 - '1), de forma
que '1*0/2) es todo el intervalo [O,1].
Girando 90 grados la figura 1.3.4 y dndole la vuelta, obtenemos la
. figura 1.3.5. sta es menos adecuada que la figura 1.3.4 como representacin de la mejor respuesta del jugador 2 a la estrategia mixta del jugador
1, pero puede combinarse conla figura 1.3.3 para obtener la figura 1.3.6.

-------- ..-...'

(Cruz)

Estrategias

. (Cara)

(Cruz)

(Cara) 1

Figura 1.3.4
q*(r)

r
1/2

---_._---j ..... _------------------'

(Cara) 1

q*(r)

(Cruz)
1/2

1/2

(Cara)

(Cruz)

Figura 1.3.6
(Cruz)

q
(Cara)

(Cruz)

Figura 1.3.5

A continuacin, aplicamos esta definicin al juego de las monedas y a


la batalla de los sexos. Para ello, utilizamos la representacin grfica de la

La figura 1.3.6 es anloga a la figtira 1.2.1 del anlisis de Cournot


de la seccin 1.2.A. Igual que la interseccin de las funciones de mejor
respuesta R2(ql) y RI ('12) dio el equilibiio de. Nash del juego de Cournol,
la interseccin de las correspond~ncia,s d~ mejor respuesta r*(q) y q*(r)
nos da el equilibrio de Nash (ertestiategias mixtas) en el juego de las
monedas: si un jugador i elige 0./2,1 /2), (1/2,1/2) es la mejor respuesta
del jugador j, tal como lo exige elquilibrio de Nash.

40

JUEGOS ESTTICOS CON INfORMACIN

COMPLETA (c. 1)

Conviene resaltar que el equilibrio de Nash en estrategias mixtas no se


basa en que ningn jugador lance una moneda al aire, arroje unos dados o
elija de forma aleatoria una estrategia. Ms bien, interpretamos la estrategia mixta del jugador j como una representacin de la incertidumbre del
jugador i respecto a la decisin del jugador j sobre la estrategia (pura) que
va a seguir. En bisbol, por ejemplo, el lanzador puede decidir si lanzar
una bola rpida o una curva basndose en cmo le salieron los lanzamientos durante el entrenainiento. Si el bateador conoce el razonamiento del
lanzador pero no sabe qu ocurri durante su entrenamienfo, puede ser
que crea que existen las mismas posibilidades de que el lanzador lance
una bola rpida o Curva. Representaramos entonces la conjetura del bateador como la estrategia mixta del lanzador (1/2,1/2), cuando en realidad
el lanzador elige una estrategia pura basndose en la informacin que no
dispone el bateador.
Enunciado de un modo ms general, la idea consiste en dotar al jugador j de una cierta informacin privada de manera que, dependiendo de
cmo el jugador j entienda dicha informacin, se incline por una de las
estrategias puras posibles. Sin eh1bargo, puesto que el jugador i no dispone de la informacin privada de j,i contina con la incertidumbre de
no saber cul ser la decisin de j, y representamos dicha incertidumbre
de i como una estrategia mixta de j.' Ofrecemos un enunciado ms formal
de esta interpretacin de las estrategias mixtas en la seccin 3.2.A.
Consideremos la batalla de los sexos, de la seccin 1.1.c, como un
segundo ejemplo de equilibrio de Nash con estrategias mixtas. Sea (q,1- q)
la estrategia mixta en la cual Pat elige la pera con probabilidad q y sea
(1',1 - 1') la estrategia mixta en la cual Chris elige pera con probabilidad 'r.
Si Pat elige (l},l-q), 'las ganancias esperadas de Chris son q.2+(1-q)'0
= 2q
al elegir pera y q'O + (1 - q) . 1 = 1- q al elegir boxeo. As, si q > 1/3,
la mejor respuesta de Chris es pera (es decir, l' = 1); si q < 1/3 la mejor
respuesta de Chris es boxeo (es decir, l' = O) y, si q = 1/3, cualquier valor
de l' es una mejor respuesta. De modo similar, si Chris elige (1',1 - 1')
las ganancias esperadas de Pat son l' . 1 + O - 'r) . O = l' al elegir pera y
1'.0+(1 -1').2 = 20-r) al elegir boxeo. As, si l' > 2/3, la mejor respuesta de
Pat es pera (es decir, q = 1); si l' < 2/3 la mejor respuesta de Pat es boxeo
(es decir, q = O) y, si r = 2/3 cualquier valor de q es una mejor respuesta.
Como muestra la fig'ura 1.3.7, las estrategias mixtas (q,1 - q) = 0/3,2/3)
de Pat y (-1',1 - 1') = (2/3,1/3) de Chris forman, por lo tanto, un equilibrio
de Nash.
Al contrario que en la figura 1.3.6, donde slo exista una interseccin

Teora avanzada: Estrategias mixtas y existencia de equilibrio I 41

de las correspondencias de mejor respuesta de los jugadores, existen en la


figura 1.3.7 tres intersecciones de r*(q) y q*(r): (q = 0,1' = O), (q = 1,r = 1)
Y (q = 1/3,1' = 2/3). Las dos primeras intersecciones representan los
equilibrios de Nash en estrategias puras (boxeo, boxeo) y (pera, pera)
descritos en la seccin 1.1.c.
l'

r*(q)

(pera) 1
q*(r)

2/3

(Boxeo)

1/3

l:, .

(Boxeo)'

Figura 1.3.7
_.:,'

En cualquier juego, un equilibrio de Nash (que incluya estrategias puras o mixtas) aparece como una interseccin:,dJUas:.c.QITespon.dencias,de
mejor respuesta de los jugadores, induso cuando:hyms de dosjugdores y tambin cuando algunos o todos lsjugadores tienen ms de dos
estrategias puras. Por desgracia, los nicos juegos en los que las co~espondencias de mejor respuesta de los jugadores tienen representaciones'
grficas sencillas son los juegos de dos jugadores en:lasque cada jugador
slo tiene dos estrategias. Discutimos ahora con un argumento grfico que
cualquier juego de ese tipo tiene un equilibrio de Nash (que posiblemente
incluya estrategias mixtas).

Consideremos las gmancias del jugador) representadas en la figura


1.3.8. Hay dos comparacionesfu:1portantes:' x con z e y con w. Basndonos
en estas comparaciones, podemosdefi.iur cuatro casos principales: (i)
x > z e y > w; (ii) : < z e y < w; (iii) x > z e y < w, y (iv) x < z
e y > w. Discutimos primero estos cuatro casos y luego abordamos los
casos restantes en los qliex '=z' y

o =w, '

,~.

'i~i..

,----,

42/

JUEGOS ESTTICOS CON INFORMACIN

Teora avanzada: Estrategias. mixtas y existencia de equilibrio / 43

COMPLETA (e. 1)

En los casos (iii) y (iv), ni alta ni baja son estrictamente dominadas.


As, alta debe ser ptima para algunos valores de q y baja ptima pilfa los
dems. Sea ql = (w - y) /(x - Z + w - y). En el caso (iii) alta es ptima para
q> q' y baja para g < ql, mientras que en el caso (iv) ocurre lo contrario.
En ambos casos, cualquier valor de r es ptimo cuando q = q'. Estas
correspondencias de mejor respuesta se representan en la figura 1.3.10.

Jugador 2
Izquierda Derecha
Alta

x,--..:.

Baja

Z,-

y,-

.-

Jugador 1

10,-

(Alta)

.,',
.. ,'

(Alta)

r*( q)

r*( q)

Figura 13.8
En el caso (i) para el jugador 1 alta,domi~a estrictamente a baja, y en
el caso (ii) baja domina estrictamente a alta ...Recordemos de la seccin
previa que una estrategia es estrictamente dornin~da si y slo si no existe
una conjetura que el jugador i pudiera ~onrtaise(sobre las estrategias que
elegirn los dems jugadores) tal quehicier ptimo elegir Si. AS, si
(g,l - g) es una estrategia mixta del jugador 2, donde g es la probabilidad
de que 2 elija izquierda, en el caso (i) no existe un valor de g tal que baja
sea ptima para el jugador 1, y en el caso (ii)no existe un valor de g tal
que alta sea ptima. Si (r,l- r) denota una estrategia mixta del jugador 1
en la que r es la probabilidad de que 1 elija alta, podemos representar las
correspondencias de mejor respuesta para los casos (i) y (ii) como en la
figura 1.3.9.(En estos dos casos las correspon<:ienciasde mejor respuesta
son de hecho funciones: de mejorrespuesta, puesto que no existe un valor
de g tal que el jugador 1 tenga mltiples mejores respuestas.)
-r
(Alta) 1

(Alta) 1 f-c_=._=
... 7::"".__=.__=.__=._~_._-_ -~.

f------~

r*(q)

<Baja)
(Izquierda)

r*(q)

(Baja)
1 q
(Derecha)
Caso (i)

(Izquierda)

Caso (ii)

Figura 1.3.9

(Derecha)

._. __

(Baja)

(Baja)

q'
(Izquierda)

q'l

(Derecha)

(Izquierda)

(Derecha)
Caso (iv)

Caso (iii)

Figura 1.3.10
Puesto que ql = 1 si x = Z y ql = Osi y = w, las correspondencias de
mejor respuesta en los casos en que ocurra x = Z o y = w tienen forma de
L (es decir, dos caras adyacentes del cuadrado unitario), como ocurrira
en la figura 1.3.10 si ql = Oo 1 en los casos (iij) y (iv).
Aadiendo ganancias arbitrarias del jugador 2 a la figura 1.3.8 y realizando clculos anlogos obtenemos la mismas cuatro correspondencias
de mejor respuesta, con la salvedad de que en el eje horizontal se mide
r y en el vertical se mide q, como en la figura 1.3.4. Girando 90 grados
y dando la vuelta a esas cuatro figuras, como hicimos para obtener 1.3.5,
obtenemos 1.3.11 y 1.3.12. (En estas figuras r' se define de forma anloga
a q' en la figura 1.3.10.)
La cuestin crucial es que, dada cualquiera de estas cuatro correspondencias de mejor respuesta del jugador 1, r'(q) de las figuras 1.3.9 o
1.3.10, y cualquiera de las cuatro del jugador 2, q'(r) de las figuras 1.3.11
o 1.3.12, el par de correspondencias de mejor respuesta tiene al menos
una interseccin, por lo qtieel juego tiene al menos un equilibrio de Nash.
Comprobarlo para los di~cisis pares posibles de correspondencias de mejor respuesta se deja como ejercicio. En lugar de ello, nosotros vamos a

.H

I JUEGOS

ESTTICOS CON INFORMACiN

COMPLETA (e 1)

Teorla avanzada: Estrategias mixtas y existencia de equilibrio I 45

describir las caractersticas cualitativas que pueden resultar. Puede darse:


(l) un nico equilibrio de Nash en estrategias puras; (2)un nico equilibrio
de Nash en estrategias mixtas; o (3) dos equilibrios en estrategias puras y
un nico equilibrio en estrategias mixtas. Recordemos el caso de la figura
1.3.6, el juego de las monedas, que constituye un ejemplo del caso (2) y
el de la figura 1.3.7, la batalla de los sexos, que constituye un ejemplo del
caso (3). El dilema de los presos es un ejemplo del caso (1); se obtiene de
la combinacin del caso (i) o (ii) de T*(q) con el caso (i) o (ii) de q*(r).16
(Alta)

1-------"

(Alta)

1 f-.--"--_-----~

q*(I)

q*(r)

(Baja)

(Baja)
(Izquierda)

1 q

(Derecha)

Caso

(Izquierda).

(i)

(Derecha)

Caso (ii)

Figura 1.3.11
r

(Alta)

(Alta)

r'

Concluimos esta seccin con una discusin sobre la existencia del


equilibrio de Nash en juegos ms generales. Si formularnos los argumentos anteriores para juegos de dos por dos en forma matemtica en vez de
grfica, podernos generalizarlos para aplicarlos a juegos con n jugadores
con espacios de estrategias finitos y arbitrarios.
Teorema. (Nash (1950): En el juego en forma normal de n jugadores G :o
{S1,'" ,Sn; 'U1,'" ,un}, si n es un nmero finito y 9i es finito para cada i, existe
al menos un equilibrio de Nash, que posiblemente incluye estrategias mixtas.
L~ demstr~cin del t~orema de Nash utiliza un teorema de p~ntofij~.
Como ejemplo simple de un teorema de punto fijo,supongamos que f(x)
es un~funcin ctirma con"dominio [O, 1] Y recOrTid6[O, ir. El teorema
de punto fijo de Brouwer garantiza que existe al menos Un punto fijo, es
decir, existe al'~eno~' unvlot x* en [O, 1] tal que f(x*) = x*: Tenernos un
ejeiriplo 'de eIIc'
l~figura}.3~ 13.' .
. .

en

.-La api~acin d.eU~.~r~~~de punto fijo p~ademosi:rar. el ~~.oJ:~m~


~4~
Nfl;~hs~,h~ceen dos~~ap?s: (1) mostJ:ando que, cualquier PJP1.to,fijo.,:,~,~
una cierta corr~sponder:ciaes lll1 equilibrio,de Nash y (2}u~~aIlclp,l},I1
teorema de punto fijo ildecuado para demostrar que esta corresponden~a
debe tener un punto fijo. La correspondencia apropiada es la correspondencia de mejor respuesta de n jugadores, El teorema de punto fijo relevante se debe \KaJ~utani"(194l),quien gener\liz el teorema de Brom":er
co~ '~'lfin dilcIuir c'orr~sp~ndncias (de bueIl comportamiento) adei1{s
de funciones. Lacprresp()ndnciade mejor'r~spuesta de n jugadores
obtiene a partir de lasorr~sponqencias individuales de mejor respuest~

se

q*(r)
q*(r)

(Baja)

(Baja)

1
(Izquierda)

(Derecha)

Caso (iii~

1
(Izquierda)

(x)

(Derecha)

Caso (iv)

x*

Figura 1.3.12
16 Los casos que incluyen x ~ z o y ~ w no contradicen la afirmacin de que el par de
correspondencias de mejor respuesta tiene al menos una interseccin. _Al contrario, adems
de las caractersticas cualitativas descritas en el texto, pueden ahora darse dos equilibrios de
Nash en estrategias puras sin un equilibrio de Nash en estrategias mixtas, y un continuo de
equilibrios de Nash en estrategias mixtas.

x*

Figura 1.3.13

1"
',',.

Lecturas

46 I JUEGOS ESTTICOS CON INFORMACIN COMPLETA (e. 1)

de los n jugadores del modo siguiente: consideramos una combinacin


arbitraria de estrategias mixtas (Pl,' .. ,Pn)' Para cada jugador i derivamos
la mejor respuesta(s) de i a las estrategias mixtas de los otros jugadores
(Pl,'" ,Pi-l,P'i+l,' .. ,Pn)' Construimos a continuacin el conjunto de todas
las combinaciones posibles de dicha mejor respuesta para cada jugador.
(Formalmente derivamos la correspondencia de mejor respuesta de cada
jugador y luego construimos el producto cartesiano de estas n correspondencias individuales.) Una combinacin de estrategias mixtas (pi, ... ,p~)
es un punto fijo de esta correspondencia si (pi, ... ,p~) pertenece al conjunto de todas las combinaciones posibles de las mejores respuestas de los
jugadores a (pi, ... ,p~). Es decir, para cada i, pi debe ser la mejor (o una
de las mejores) respuesta(s) del jugador i a (pi,
,Pi-l,pi+l' ... ,p~), pero
esto es precisamente la afirmacin de que (pi,
,p~) es un equilibrio de
'Nash. Con ello, completamos la primera etapa. ; :
La segunda etapa utiliza el hecho de que la correspondencia de mejor respuesta de cada jugador es continua, en un sentido adecuado del
trmino. El papel de la continuidad en el teorema de punto fijo de Brouwer puede observarse modificando (x) en la figura 1.3.13: si (x) es
discontinua, no tiene necesariamente un punto fijo. En la figura 1.3.14,
por ejemplo, (x) > x para toda x < x', pero (x') < x' para x 2: x',17
1

(x)

x'

adicol1alfs

I 47

de la figura 1.3.10: para q == q', r*(q') incluye cero, uno y todo el interv1lo
entre ellos. (De modo un poco ms formal, r*(q') incluye el lmite ele I"(q)
cuando q tiende a q' por la izquierda, el lmite de r*(q) cuando q liende a
q' por la derecha, y todos los valores de r entre ambos lnites:) Si (:;I)
en la figura 1.3.14 se comportara de forma anloga a la correspondencia
de mejor respuesta del jugador 1, (x') incluira no slo el crculo negro
(como en la figura), sino tambin el crculo blanco y todo el intervillo entre
ellos, en cuyo caso (x) tendra un punto fijo en x'.
La correspondencia de mejor respuesta de cada jugador se com.portil
siempre como r*(q') en la figura 1.3.14: siempre incluye (las generalizilciones adecuadas de) el lmite por la izquierda, el lmite por la derecha
y los valores intermedios. El motivo de esto es que, como demostramos
anteriormente en el caso de dos jugadores, si el jugador i tiene varias estrategias puras que son mejores respuestas a las estrategias mixtas de los
dems jugadores, cualquier estrategia mixta Pi que asigna toda su probabilidad a algunas o a todas las mejores respuestas en estrategias puras
deljugador i (y probabilidad cero al resto de las estrategias puras de i.) es
tambin una mejor respuesta del jugador i. Puesto que la correspondencil.de mejor respuesta de cada jugador se comporta siempre delmisll10
modo, io mismo ocurre con la correspondencia de mejor respuesta de
los TI, jugadores. Estas propiedades cumplen las hiptesis del teoremil de
Kakutani, por lo que esta ltima correspondencia tiene un pu.nto fijo.
El teorema de Nash garantiza que existe un equilibrio en una ampliil
clase de juegos, pero ninguna de las ilplicaciones analizadas en la seccin
1.2 pertenece a esta clase (porque cada aplicacin tiene espacios de estrategias infinitos). Esto demuestra que lils hiptesis del teorema de NilSh son
condiciones suficientes pero no necesarias para que exista un equilibrio;
existen muchos juegos que no cumplen las hiptesis del teorema pero, no
obstante, tienen uno o ms equilibrios de Nash.

Figura 1.3.14
Para ilustrar las diferencias entre (x) en la figura 1.3.14y la correspondencia de mejor respuesta de un jugador, consideremos el caso (iii)
17 El valor de (x') se indica conel crculo 'negro. El circulo blanco indica qu (X') no
incluye este valor. La lnea discontinua se incluye nicamente para indicar que ambos crculos
se dan cuando x = x'; no indica valores adicionales de (x').

1.4 Lecturas adicionales


Consltese Brandenburger (1992) sobre los supuestos en que se fundamentan la eliminacin iterativa de las estrategias estrictamente dominadils y
el equilibrio de Nash, y tambin sobre la interpretacin de las estr1tegias
mixtas en trminos de las conjeturas de los jugadores. Sobre la relacin
entre los modelos (tipo Coumot),en los que las empresas eligen cantidildes y los modelos (tipo Bertrand), en los que las empresas eligen precios,

~8 / JUEGOS ESTTICOS CON INFOIUVIACJN COMPLETA (c. 1)

Ejercicios / 49

consJtese Kreps y Scheinkman (1983), quienes demuestran que en algunas circunstancias el resultado de Cournot se da en un modelo de tipo
Bertrand en el cual las empresas se enfrentan a restricciones de capacidad (que escogen a un cierto coste antes de elegir los precios). Sobre
el arbitraje, consltese Gibbons (1988), quien demuestra que el acuerdo
preferido por el rbitro puede depender del contenido informativo de las
ofertas de las partes, tanto en el arbitraje convencional como en el de oferta
final. Finalmente, consltese Dasgupta y Maskin (1986) sobre la existencia del equilibrio de Nash en juegos con espacios de estrategias continuos,
incluyendo equilibrios en estrategias puras.

1.5 Ejercicios
1.1 Qu es un juego en fonna normal? Qu es una estrategia estrictamen te dominada en un juego en forma normal? Qu es un equilibrio de
Nash con estrategias puras en un juego en forma normal?
1.2 En el siguiente juego en fonna normal, qu estrategias sobreviven
a una elirnin'.lcin iterativa de las estrategias estrictamente dominadas?
Cules son los equilibrios de Nash con estrategias puras?'

[ C D
A

2,0 1,1 4,2

M 3,4 1,2 2,3


B

por P(Q) = a - Q (suponiendo que Q < a; en el caso contrario P = O).


Supongamos que para la empresa .i el coste total de producir la cantidad qi
es Ci(qi) = cqi. Es decir, no hay costes fijos y el coste marginal es constante e
. igual a c, donde suponernos que e < a. Siguiendo a Coumot, supongamos
queas empresas eligen sus volmenes de produccin simultneamente.
(:ul es el equilibrio de Nash? Qu ocurre cuando n tiende a infinito?

1.4 Supongamos que existen n empresas en el modelo de oligopolio de


Cournot. Sea qi la cantidad producida por una empresa i, y sea Q =
!JI + ... + qn-la cantidad agregada .en el mercado.
Sea P el precio de
equilibrio de mercado"ysupongamos.que laderriandainversa viene dada

e..

1.5 Consideremos las dos versiones finitas siguientes del modelo de duopolio de Coumot. En primer lugar, supongamos que cada empresa debe
elegir o la mitad de la cantidad de monopolio, qm/2= (a -c)j4,o la-can~
tidad de equilibrio de Coumot, !Je = (a -c)/3. No pueden darse otras
cantidades, Demustrese que este juego con dos alternativas es, equivalente. al dilellla de los preso;>: cada eIIlpresa tiene una estrategia estrictamente dominada, y ambas estn peor en equilibrio que si cooperasen.
En segundo lugar, supongamos que cada empresa puede elegir o qm/2 o
qe, () una tercera cantid\idq' .. Hllese un valor de q' tal que el juego sea
equivl.1ehteal modelo de Coumot de la seccin 1.2.A, en el sentidq'de
que (qe,qe) sea un equilibrio de Nash nico y ambas empresas estn .pem;
en equilibrio de lo que estaran si cooperasen, pero ninguna de ellas tiene
una estrategia estrictamente dominada.
1.6 Considrese el modelo de duopolio de Coumot en el que la demanda
inversa es P(Q) = a - Q pero las empresas tienen costes marginales
asimtricos, Cl para la empresa 1 y C2para la empresa 2. Cul es el
equiJibrio de Nash si O < e.; < a/2 para cada empresa? Qu ocurre si
el < C2< a pero 2C2 > a + Cl?

1,3 0,2 3,0

1.3 Los jugadores 1 y 2 estn negociando cmo repartirse m! pesetas.


Ambos jugadores indican simultneamente la parte de las mil pesetas
que querran conseguir, SI y s2,donde O ~ 81,S2 ~ 1. Si SI + S2 ~ 1,
los jugadores ven cumplidos sus deseos; si SI + S2 > 1, ambos jugadores
reciben cero pesetas. Cules son 105 equilibrios de Nash con estrategias
puras de este juego?

(.

..,;.

1.7 En la seccin 1.2.Banalizamos el modelo de duopolio de Bertrand con


productos diferenciados. En el caso de productos homogneos se obtiene
un resultado poderoso. Supongamos que la cantidad que demandan los
consumidores a la empresa i esa - Pi cuando Pi < Pj, Ocuando Pi > Pj,
y (a - Pi)/2 cuando Pi =Pj.
Supongamos tambin que no hay costes
fijos y que los costes marginales son constantes e iguales a c, donde c < a.
Demustrese que si las empresas eligen precios simultneamente, el nico
equilibrio de Nash consiste en que ambas empresas fijen un precio c.
1.8 Considrese una poblacin votante uniformemente distribuida en el
espectro ideolgico que va de la izquierda (x = O)a la derecha (x = 1).
Cada uno de los candidatos para un nico puesto elige simultneamente

SO/JUEGOS

.'/}

ESTTICOS CON INFORMACIN

Referellcins / 51

COMPLETA (c. 1)

un programa electoral (es decir, un punto eh la lnea entre x = O Y x = 1).


Los votantes observan el programa de los candidatos y luego cada votante
vota por el candidato cuyo programa se acerque ms a su posicin en el
espectro. Si, por ejemplo, hay dos cahdidatos y eligen programas x] = 0,3
Y X2 = 0,6, todos los votantes a la izquierda de x = 0,45 votan al candidato
1, y todos los que estn a la derecha votan al candidato 2, y el candidato 2
gana la eleccin con un 55 por ciento de los votos. Supongamos que a los
~andidatos slo les importa ser elegidos; en realidad, su progr?ma no les
mteresa para nada. Si hay dos candidatos, caJ es el equilibrio de Nash
con estrategias puras? Si hay tres caIldidatos,indquese un equilibrio de
Nash con estrategias puras. (Supongamos qu cuarido vanos candidatos
eligen el mismo programa, los votos obtenidos por ese programa se dividen apartes iguales, y quelos empates entr'l?sqje~onsiguen ms votos
se resuelven a cara o,cruz.) VaseHotelling (1929)pa.ra un primer modelo
similar.
... " "~o " '1,;
.

J':

solicitar trabajo en una de las empresas. Los trabajadores deciden simultneamente si solicitar el trabajo de la empresa 1 o de la empresa 2.
Si slo un trabajador solicita trabajo en una de las empresas, dicho trabajador obtiene el trabajo. Si ambos trabajadores solicitan trabajo en la
misma empresa, la empresa contrata a uno de ellos aleatorialnente, y el
otro queda desempleado (lo que significa una ganancia cero). Hllense
los equilibrios de Nash del juego en forma normal. (Para ms informacin
sobre los salarios que fijarn las empresas, consltese Montgomery [1991J.)
Trabajador 2
Solicitar a Solicitar a
empresa 1 empresa 2
Solicitar a
empresa 1

2:7/11'2:W]

Solicitar a
empresa 2

W2,1.v]

'UJl,W2

Trabajador 1

1.9Qu es una estrategia mixta en un juego enfrma normal? Qu es Un


equilibrio de Nash con estrategias mixtas en un juego en forma normal?

2: 'UJ2, 2: 'UJ2
Fecha 2

1.10 Demustrese que no existen equilibrios de Nash con estrategias mixtas en los tres juegos en forma normal analizados en la seccin 1.1: El
dilema de los presos, el de la figura 1.1.1 y,el de la figura 1.1.4.
1:11 ~llese el equilibrio de Nash con estrategias mixta~ del juego del
eJerCICIO
1.2.

1.14 Demustrese que la proposicin B en el apndice a la seccin 1.l.C


se cumple tanto para equilibrios de Nash con estrategias puras como con
estrategias mixtas: las estrategias utilizadas con probabilidad positiva en
un equilibrio de Nash con estrategias mixtas sobreviven al proceso de
liminacin iterativa de las estrategias estrictamente dominadas.

1.12 Hllese el equilibrio de Nash con estrategias mixtas del siguiente


juego en forma normal:

1.6 Referencias

AUMANN,R. 1974, "Subjectivity and Correlation in Randomized Strategies" Journal of Mathematical Ecol1omcs 1:67-96.
-. 1976. "Agreeing to Disagree." Al1l1als of Statstics 4:1236-39.

A 2,1 0.2

B 1,~ 10
"

'

1.13 Dos empresas ofrecen un puesto de trabajo cada una. Supongamos


que (por razones que no discutimos aqu, pero que se refieren al grado
de importancia de que se ocupe el puesto) las empresas ofrecen salarios
dife~ntes: la empresa i ofrece el salario Wi, donde (1/2)w] < 'UJ2 < 2w] ..
Imagmemos que hay dos trabajadores, cada uno de los cuales slo puede

-. 1987. "Correlated Equilibrium as an Expression of Bayesian Rationality." Ecol1ometrica 55:1-18.


BERTRAND,T
1883. "Thorie Mathmatique de la Richesse SociaJe."]oumal
des Saval1ts 499-508.
BRANDENBURGER,
A. 1992. "Knowledge and Equilibrium in Carnes." De
prxima aparicin en Journal of Ecol1omic Perspectives.

52/

JUEGOS ESTTICOS CON INFORMACiN

,',

COMPLETA (e. 1)

'.'.'

COURNOT,A. 1838. l\echerches Sllr les Principes Mathmatiques de la Thorie


des Richesses. Edicin inglesa: Researches into the Mathematical Principies of
theon) of Wealth. Publicado por N. Bacon. New York: Macmillan, 1897.

2. JUEGOS DINMICOS
CON INFORMACIN COMPLETA

DASGUPTA,
P, y E. MASKIN,1986. "The Existence of Equilibrium in Discontinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.
FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal
flict Resolution 35:683-705.
FRIEDMAN,J. 1971. "A Noncooperative
Review of Economic Studies 28:1-12.

Equilibrium

for Supergames."

GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." AmerieclrlEconomic Review 78:896-912.


HARDIN,G. 19613."The Tragedyof

the Commons." Science 162:1243-48.

HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A New


Rationale for Mixed Strategy Equilibrium Points." International Journal of
Came Theory 2:1-23.
HOTELLING,H. 1929. ';Stability in Competition." Economic JournaI39:41-57.
HUME, D. 1739. A Treatise of Human Nature.
Dent. 1952.
KAKUTANl,S. 1941. "A Generalization
Dllke Mathematieal Joumal 8:457-59.

Reedicin.

Londres:

J. M.

of Brouwer' s Fixed Point Theorem."

KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Bertrand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics
4:326-37.
MONTGOMERY,
J. 1991. "Equilibrium Wage Dispersion and Interindustry
Wage Differentials." Qllarterly JOl/mal of Economics 106:163-79.
NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of the
National Aeademy of Sciences 36:48-49.
PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem of
Perfection." Econometrica 52:1029-50.
STACKELBERG,
H. VON, 1934, Marktfonn
Springer.

c\
'.','.

of Con-

L/nd Cleichgewicht.

Viena: Julius

Ijnestecaptulo
presentamos los juegos dinmicos. De nuevo, limi~amas nue~tra atencin a los juegos con informacin completa. (es ddr;
juegos en los que las fundones de ganancias de los jugadores so~ Wormacinqel dorinio pblico); vase una introduccin a 10s'jugOs con
informacin incompleta en el captulo 3. En la seccin 2.1 analiZarnos
los juegos dinmicos no slo con informacin completa, sino tambii:co~
informacin perfecta, lo que significa que en cada momentodeI'j1ego;~1
jugador a quien le corresponde decidir conoce la historia cmple'f:de
todas las decisiones tornadas hasta ese momento. En las secciries'i;2';
2.4, considercunos los juegos con informacin completa pero imperfet~:
en algn momento ~~l juego el jugador a quien le corresponde decidirno
conoce toda lahistoria del juego.
.
El tema central en todo juego dinmico es el de la credibilidad. Como
ejemplo de una amenaza que no resulta creble, consideremos el siguiente
juego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesets
al jugador 2 () no darle nada, n segundo lugar, el jugado.r2 observa la
decisiridel jugador 1 y de~ide si hacer estallar o no una granada que
los matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacer
estallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Si
el jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta es
la de pagar las 1.000 pesetas. Pero el jugador 1 no debera creerse una
amenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutar
dicha amenaza, escogera no hacerlo., Por tanto, el jugador 1 no debera'
pagar nada al jugador 2.1
En la seccin 2.1 analizamos los siguientes casos de juegos dinmicos
con informacin completa y perfecta: el jugador 1 decide primero, acto
seguido el jugador 2 observa la decisin dl jugador 1 y finalmente el juga1. El jugador 1 podra preguntarse si un o?>n~nie que amenaza con hacer explotar una'
granada est loco. Este tipo de dudas se modelali como informacin incompleta, porque el
jugador 1 no est seguro de la funcin d ganancias del jugador 2 (vase captulo 3).

(,

1",'

:',

'..

-,
1

54 / JUEGOS DINMICOS CON INFORMACIN

Juegos dillmicos

COMPLETA (e. 2)

dar 2 toma su decisin con lo que concluye el juego. Eljuego de la granada


pertenece a esta clase, como el modelo de duopolio de Stackelberg (1934) y
. el modelo de Leontief, (1946) de determinacin de salarios y nivel de empleo en una empresa con fuerte implantacin de un sindicato. Definimos
.' el resultado por induccin hacia atrs y consideramos brevemente su relacin
'" con el equilibrio de Nash (posponiendo la discusin de esta relacin hasta
la seccin 2.4). Resolvemos los modelos de Stackelberg y Leontief, utilizando este criterio. Derivamos tambin un resultado a~logo para el
modelo de negociacin de Rubinstein (1982), aun cuando ese juego tiene
una sucesin potencialmente infinita de tiradas y, por tanto, no pertenece
ala cl~se de juego,s considera~a, '.
. En la seccin 2.2 ampliamos la clas de juegos analizada en la seccin
anterior: primero ambos jugadores 1 y2 deciden simultneamente, acto
seguido los jugadores 3 y 4 observanlas decisiones de 1 y 2y finalmente,
los jugadores 3 y 4 deci~fensimultnemente'c!Jn lo que concluye el juego.
Como ya se explicar en la seccin 2.4, la simultaneidad de las decisiones
significa en este contexto que estos juegos son de informacin imperfecta,
Definimos el resultado perfecto en subjuegos d tales juegos, que es la extensin natural de la induccin hacia atrs. Resolvemos los modelos de
Diamond. y Dybvig (1983) de pnico bancario" un modelo de aranceles y
de competencia internacional imperfecta y el modelo de los torneos de
LazearyRosen (1981), utilizandoeste.criterio.
En la seccin 2.3 estudiamos los juegos repetidoS"; en los cuales un
grupo determinado de participantes juegan repetidamente un determinado juego, habiendo observado los resultados de las anteriores rondas
del juego antes de iniciar la siguiente. El tema del anlisis es que las amenazas y las promesas (crebles) sobre el comportamiento futuro pueden
afectar el comportamiento presente. Definimos el equilibrio de Nash perfecto
en subjuegos para juegos repetidos y lo relacionamos con los resultados de
la induccin hacia atrsy de la perfeccin en subjuegos definidos en las
secciones 2.1 y 2.2. Enunciamos y demostramos el teorema de tradicin
oral para juegos repetidos infinitamente y analizamos el modelo de Friedman (1971) de colusin entre duopolistas de Coumot, el de Shapiro y
Stiglitz (1984) de salarios de eficiencia y el de poltica monetaria de Barro
y Cardan (1983).
En la seccin 2.4 presentamos las herramientas necesarias para analizar en general un juego dinmico con informacin completa, ya sea con
informaci9n. perfecta o imperfecta. Definimos la representacipn de un
juego enformaextensivaylrelacionamos
con la representacin en forma

COI 'formacin

completa

y perfecta

/ 5.5

l presentada en el captulo 1. Definimos tambin el equilibrio de


.,
.,
1
Nash perfecto en subjuegos para juegos en general. La cuestlOn pnl~clpa
que un Juego
(tan to de esta seccin como del captulo en su cODjunto)es
h
'l'b'
d
dinmico con informacin completa puede tener muc os equt J nos e
Nash, pero algunos de ellos pueden incluir amenazas.o promesas que no
son crebles. Los equilibrios de Nash perfectos en subluegos son aquellos
que pasan la prueba de credibilidad.
norm a

2.1Juegos dinmicos con informacin completa y perfecta


2.1.A Teora: induccn hacia atrs

El juego de la granada es un representante de la siguiente clase de juegos


sencillos con informacin completa y perfecta:
1. El jugador 1 escoge una accin al del conjunto factible Al'
2. El jugador 2 observa 0'1 y escoge una accin o,z del conjunto factible
Az.
3. Las ganancias son

1J,1

(a1,o.z) y'Uz(al,o,z).

z
Muchos problemas econmicos se ajustan a esta descripcin. Dos ejemplos (que ms adelante discutiremos con mayor detalle) so~ el mo~elo d,e
duopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l de
empleo en una empresa con fuerte implantacin ~~ un smdIcato .. ?lros
problemas econmicos pueden modelarse si permItimOS una suce:J7n de
movimientos ms amplia, ya sea aadiendo ms jugadores o penmllendo
q~e los jugadores tiren ms de una vez. (El modelo de negoci~ci.nde Rubinstein discutido en la seccin 2.1.0 es un ejemplo de este ultImo caso.)
Las caractersti~as clave de un juego dinmico con informacin completa
y perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)
todas las decisiones anteriores son conocidas antes de tomar la deOSlon
2 Se podra permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la accin
del jugador 1, al' Tal dependencia podra d~notarse con AZ(aI) O podna Incorporarse en la
funcin de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) =
para valores de a2
do a Algunos movimientos del Jugador 1 podnan mcluso poner
que no son fac ti'bles d al'.'
. An
al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~nto
de acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tiene

-ex:

eleccin posible.

",.'.

56 / JUEGOS DINMICOS CON INFORMACiN COMPLETA (c. 2)

siguiente y (3) las ganancias de los jugadores para cada combinacin posible de jugadas son informacin del dominio pblico.
Resolvemos un juego por induccin hacia atrs de la siguiente forma:
cuando al jugador 2 le corresponda decidir en la segunda etapa del juego,
se enfrentar al siguiente problema, dada la accin al previamente adoptada por el jugador 1:
max

'u2(.l,az).

azEAz

Supongamos que para cada ajen Al, el problema de optimizacin del


jugador 2 tiene una nica solucin que podemos denotar con Rz(al)' sta
es la reaccin (o mejor respuesta) a la accin del jugador 1. Dado que
el jugador 1 puede resolver el problema de maximizacin del jugador 2
tanto como el propio jugador 2, el jugador 1 debera prever la reaccin del
jugador 2 a cada accin al que 1 pudiera tomar, de forma que el"problema
de 1 en la primera etapa se concreta en
max

'Ul (al,Rz(al).

alEA]

Supongamos que este problema de optimizacin del jugador 1 tiene


tambin una solucin lca que podemos denominar aj. Llamaremos
a (aj,Rz(aj
el resultado por induccin hacia atrs de este juego. El resultado
por induccin hacia atrs ignora las amenazas no crebles: el jugador 1
prev que el jugador 2 responder ptimamente a cualquier accin que 1
pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por parte
del jugador 2 que no favorezcan a 2 cuando el juego llegue a su segunda
etapa.
Recordemos que en el captulo 1 usamos la representacin en forma
. normal para estudiar juegos estticos con informacin completa y hos
concentramos en la nocin del equilibrio de Nash como concepto para solucionar tales juegos. Sin embargo, en la discusin sobre juegos dinmicos
de esta seccin no hemos hecho mencin alguna ni de la representacin
en forma normal ni del equilibrio de Nash. Al contrario, hemos dado una
descripcin verbal de un juego en (1)-(3) y hemos definido el resultado
por induccin hacia atrs como solucin del juego. En la seccin 2.4.A
veremos que la descripcin verbal en (1)-(3) es la representacin en forma
extensiva del juego. En esta seccin estableceremos la relacin entre las
representaciones en forma extensiva y normal, y veremos que para juegos
dinmicos la representacin en forma extensiva es a menudo ms conveniente. En la seccin 2.4.B definiremos el equilibrio perfecto de Nash

Juegos dinmicos con informacin completa y perfecta / 57

en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignora


las amenazas que no son crebles en un sentido que definiremos con ms
precisin. Veremos que pueden existir mltiples equilibrios de Nash en
un juego de la clase definida por (1)-(3)" pero que el nico equilibrio de
Nash perfecto en subjuegos es el equilibrio asociado con el resultado obtenido por induccin hacia atrs. ste es un ejemplo de la observacin,
hecha en la seccin 1.1.C, de que algunos juegos tienen mltiplesequili"
brios de Nash pero tienen un equilibrio que destaca como la solucinms
llamativa del juego.
Concluirnos esta seccin explorando los supuestos de racionalidad
inherentes en los argumentos de induccin hacia atrs. Considere~os
para ello elsiguiente juego de tres etapas en el que el jugador 1 decide dos
veces:
1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2
para el jugador 1 y Opara el jugador 2.
2. El jugador 2 observa la eleccin de 1. Si 1 escoge D entonces 2 escoge
J' o D', donde l' finaliza el juego con ganancias de 1 para ambos
jugadores.
3. El jugador 1 observa la eleccin de 2(y recuerda su propia decis~~t:J:
~
la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es
1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3
para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de O Y: 2
respectiv~mente.,;
,
,_.; _~

c.

: . ..;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:.'~..<S- .., .: l:..:'::.~~'

Esta descripcin verbal puede trlducirse al siguiente,juego en femp.dg


rbol. (sta es la representacin en forma extensiva que definiremos. de
forma ms general en la seccin 2.4.) La ganancia superior en el par .
de ganancias que aparecen en el extremo de cada rama del rbol es la
ganancia del jugador 1; la inferior es la del jugador 2, ~;,'
Para calcular el resultado por inducc:in hacia atrs de este' juego
empezamos por la tercera etapa (es dear,la segunda decisin deLjugador
1). Aqu el jugador 1 se enfrenta a una eleccin entre una ,ganancia de.3
por medio de 1" o una ganancia de Oa trays de 'J)"; de forma que!" ~
ptimo. Por tanto, en la segunda etapa, el jugador2 prev que si l jego
llega a su te;cera etapa el jugador 1 escoger J", lo que le proporcionara
una ganancia de O.Por tanto,~n la egunda etapala decisin del jugador 2
es entre una ganancia de 1 por medio d l' o una ganancia de Oa travs de
D', de forma que l' es ptimo. Consecuentemente, eh la primera etapa el

(,

...

58 / JUEGOS DINMICOS CON INFORMACIN

jugador 1 prev que si el juego llega a la segunda etapa el jugador 2 elegir


1', lo que le proporcionar una ganancia de 1. La eleccin del jugador 1
en la primera etapa es, por tanto, entre una ganancia de 2 por medio de I
o una ganancia de 1 a travs de D, de forma que I es ptimo.

Juegos

COMPLETA (e. 2)

::~::

dil1tmicos

COI1 il1formacill

completa

y perfecta

/ 59

.
dor 2 lo sea: si 1piensa que 2 podra no ser racionill,
ro no que el Juga
1"
O'
pe
.
ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO
'.
'
I"
1 tercera
se nda, dando con ello la oportunida~.a 1 de Jug~r.
~n.8
la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podra no ser racional, 1 podna. escoger /) en
pero pIensa
.
l
.
' tapa confiando en que 2 pensara que 1 no es raClona, y, por
la pnmera e
"1
t
El
.
DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara
1 '. d D
r 'parte
USO de la induccin.hacia
atrs presupone que la e eCClOn e po.
eda
explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu
.
l'
. D arque 1
sin embargo, podra ser ms razonable suponer que J~go
~.'
.
.
.'
1
En
tales
J'uegosel
uso
de
la
mducClon
hacla
es, efectivamente, lrraClOna .
, . .
..
atrs pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p
.'
una solucin nica y no cabe esperar acuerdo alguno enbe
proporclOna
los jugadores.
2.1.B El mod~lo de duopolio de Stackelberg

,.'0

Este argumento establece que el resultado por induccin hacia atrs


es que el jugador 1escoge I en la primera etapa y sacaba el'juegb: Aun
cuando el uso de la induccin hacia atrs establece que el juego s acaba
en la primera etapa, UIlaparte importante del'afgUiriento fthl d 10 que
ocurrira si el juego no se acabase en esta primera etapa. En la segunda
etapa, por ejemplo, cuando el jugador 2 prev que si el juego llega a la
terc;era etapa el jugador 1 elegir I" 2 est suponiendo que 1es racional.
Este supuesto puede parecer inconsistente coil el hecho de qu 2 tiene
la oportunidad de decidir en la segunda etapa slo si 1 se desVa del
resultado obtenido por induccin hacia atrs. Es decir, puede parecer que
si 1juega D en la primera etapa, 2 no puede suponer en la segunda etapa
que 1 sea racional, pero 'esto no es, as: si 1 juega D, en la primera etapa
est claro que no puede ser informacin del dominio pblico que los dos
jugadores sean racionales; pero existen razones para que 1escogietaD
que no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidad
es que sea informacin del dominio pblico que el jugador 1 es racional
3 Recordemos deI a discusin sobre l~elimiracin
dominadas (eIlla seccin 1.1.,B),que es lormacin
son racionales si todos los jugadores son rciomiis,
los jugadore,s son racionales y si todoS los jugadores
lodos los jugadores son racionales, etc; adinjiiltum.

itera tiva de las,."~tr~tegiasest:ric~~~ente


del domirti9pblic que Io~ jug-adores
y si todos los jugadfes S5~ft'qUe'tdos
saben que,todoslos jugadores slJe que
,
. ':!
",'

Stackelberg (1934) pr!Jpuso un modelo dinmico de duopolio en el cu~l


unae'mpresa dominante (o lder) decide primero y una empresa subordInada (o seguidora) decide en segundo lugar. En al~nosmome~os
de
la historia de la industria automovilstica estadourudense: por ~Jel1lplo,
General Motors parece haber jugado este papel de lder. Es mmedlat.o ampliar esta des~ripcin al caso en que haya ms de una empresa segUidora,
como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos el
modelo bajo el supuesto de que las empresas escogen cantidades, como en
el modelo de Coumot (donde las empresas deciden simultneamente en
.
ente como aqUlO. DeJ'amos
como ejercicio el desarrollo
veZ d e suceSlvam
,
de un modelo de tomas de decisiones sucesivas en el que las empresas
. s tal como
en el modelo ele
escogen 1os preclO
" lo hacen (simultneamente)
' ' .
Bertrartd.
El desarrollo

,
temporal del juego es el sig'uiente: (1) La empresa 1
escoge una can t'd
1 a d ql >
_ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
funcin de beneficio
'7ri(q;,qj)

donde P(Q)

= qi[P(Q)

el,

a - Q es el precio de equilibrio

de mercado cuando la

60 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

Juegos dinmicos con informacin completa y perfecta I 61

cantidad agregada es Q ==qI + q2, j e es el coste marginal constante de


produccin (siendo cero los costes fijos).
Para hallar el resultado por induccin hacia atrs de este juego, calculamos en primer lugar la reaccin de la empresa 2 a una cantidad arbitrariamente fijada por la empresa 1. R2(ql) es una solucin de
maX7r2(ql,q2)==maxq2[a
Q22:0

ql -

q2 -

qz 2:0

el,

lo que resulta en
R2(ql) =="

a-ql-e

'

siempre, queql < a-e .. La misma' ecuacin pr_aR2(ql) apareCi en


nuestro aniilisisdl' juego de Coumot con' qecisiones sinlultneas en la
seccin D.A. La diferencia' es que aqu R2(iJ.~)e~~eal~e~:lte la reaccin
por parte de la~mpresa 2: la cailtidadobservad~ que fijala empresa i,
mientras que en el anlisis de Coumot R2(qI) es la mejor respuestacle h:i
empresa 2 a una cantidad hipottica que'ser sil!lultneamenteescogida
por la empresa 1.
'."
Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa
2 tantoc0fi.lo,.l.a,propia e~p'~~a 2, I~, e0pres 1
debera prever q~e ia
eleccin:'del~antidad ql coinCidir co"nla reacinR2(ql)' Por tanto, el
problema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en
"maX7fl (ql,R2(ql)
'_Q2:0,

,.'

,.'

==maxqIfa - ql - R2(qi)
Ql2:0 .

. '.

-:- el
.

.. a- ql.""'"C
==maxql
'2
. ,.
Q2:0

lo que resulta' en
a-c

qi == -. -2-

a-c

R2(qi) ==-4-

que es el resultado por induccin hacia atrs del juego del duopolio de
Stackelberg.4
'..
'.
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren tpicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mencin
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en
vez de ~u:nultneas. Sin embargo, como se ha constatado en la secci'nanterior, los juegos
con deaslones sucesivas poseen a menudo mltiples equilibrios de Nash, de los cuales slo
uno est asociado can el resultado obtenido por induccin hacia atrs del juego, Por tanto, el
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al
uso de unrnterio de solucin ms poderoso que el mero equilibrio de Nash.

Recordemos que en el equilibrio de Nash del juego de Cournot del


captulo 1, cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregada
obtenida por induccin hacia atrs en el juego de Stackelberg, 3(a - e)/4,
es mayor que la cantidad agregada en el equilibrio de Nash del juego de
Cournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado es
inferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelberg
la empresa 1 poda haber escogido la cantidad correspondiente al juego
de Coumot, (a - e)/3, en cuyo caso la empresa 2 habra respondido con su
cantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1
podra haber alcanzado el nivel de beneficios de Coumot, pero escogi no
hacerlo, por lo que los beneficios de la empre~a 1 en el juego de Stackelberg
deben'ser mayores que sus beneficios en el juego de Cournot. Pero el
precio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que ros
beneficios agregados son menores. Por tanto, el hecho de que la empresa
1 est mejor implica que la empresa 2 est peor en el juego de Stackelberg
queen el jueg() de Coumot.
La observacin de que la empresa 2 se encuentra en peor situacin en
el juego de Stackelberg que en el juego de Coumot ilustra una diferencia
importante que existe entre los. problemas de decisin uni cimultiperL
sonale~:. En la teora de la decisin con un nico agente, eltenerms .
informacin nunca puede hacer que el agente decisor est peor. En teora
de juegos, sin embargo, tener ms informacin (o ms precisamente, que
otros jugadores sepan que uno tiene ms informacin) puede hacer que un
jugador est peor. '
Eil el juego de Stackelberg, la informacin en cuestin es la cantidad
de la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)
la empresa 1 sabe que la empresa 2 conoce l' Para ver el efecto que'
esta informacin tiene, consideremos un,juego de decisin suc~siva algo
distinto, en el que la empresa 1 escoge qr, despus de lo cual la empresa
2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 cree
que la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, la
mejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si la
empresa 1 prev que la empresa 2 creer que ello vaya a ser as y, por tanto,
escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a
(a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg
(a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1
escoja su cantidad de Stackelberg. Ms bien, el nico equilibrio de Nash de
este juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,
precisamente el equilibrio de Nash del juego de Cournot, en el que las dos

..

'

".

,"

Juegos dinmicos con infonlwcin completa y perfecta /

62 I JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

empresas deciden simu1tneamente.5 Por lo tanto, que la empresa 1 sepa


que la empresa 2 conoce q va en contra' de la empresa 2.

1\3

cuya condicin de primer orden es


R'(L) - w

= O.

2.1.C Salarios y nivel de empleo en una empresa con fuerte


implantacin sindical

Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicato


efecta una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yescoge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L).
Podemos decir bastantes cosas sobre el resultado por induccin hacia atrs
de este juego, aun sin haber supuesto ninguna forma funcional concreta
de U(w,L) y R(L), pero no podemos calcular el resultado explcitamente.
. En primer lugar caracterizamos la mejor respuesta de la empresa en la
etapa (2), L*(w), a una demanda salarial arbitraria por parte del sindicato
en la etapa (1), w. Dado w, la empresa escoge el nivel L*(w) que soluciona

=maxR(L)
L2:0

- wL,

En el modelo de Leontief, (1946) de relacin entre una empresa y un


nico sindicato (es decir, un sindicato que tiene el poder de monopolio de
ofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vo
sobre los salarios, pero la empresa tiene el nrrolexclusivo del nivel de
empleo. (Conclusiones cualitativamente similares emergen en un modelo
ms realista en el cual la empresa y el sindicato negocian los salarios,
pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) La
funcin de utilidad del sindicato es U(7JJ,L), donde w es el salario que el
sindicato pide a la empresa y L es el nivel de empleo. Supongamos que
U(w,L) es creciente en los dos argumentos w y L. La funcin de beneficios
de la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos que
la empresa obtiene si emplea L trabajadores (y toma de forma ptima las
correspondientes decisiones de produccin y de estrategia de mercado).
Supongamos que R(L) es creciente y cncava;

max7r(w,L)
L2:0

Pendiente =

R(L)

L * (w)

Figura 2.1.1
Para garantizar que la condicin de primer orden R'(L) -w =. O ~enga
solucin, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
figura 2.1.1.
La figura 2.1.2 representa L * (w) en funcin de tu (pero ~tiliza l~s e!es
de forma que faciliten la comparacin con grficos postenores) e lnchca
que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
en su punto mximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
mejor cuanto menor sea w, de forma que las curvas :sobenefIClo Dfenores
representan niveles de beneficio ms altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato est tanto mejor cuanto ms alto sea w, de forma que las curvas
de indiferencia ms altas corresponden a niveles de utilidad mayores del
sindicato.

Esto es un ejemplo de la afirmacin hecha en la seccin 1.1.A:en';,n Juego en forma normal


los jugadores escogen sus estrategias simultneamente, pero ello no implica necesariamente'
que acten simultneamente; es suficiente con que cada uno tome su decisin sin conocer las
decisiones de los dems. Vase la seccin 2.4.A para ms discusin sobre esta cuestin.
5

6 Esta
dado 'UJ.
concreta
beneficio

ltima propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
en la eleccin de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por

(L,u/) sea tangente a la restriccin

'UJ

1J)'.

64 / JUEGOS DfNAMICOS CON INFOR1ACIN COMPLETA (c. 2)

Juegos dinmicos con informacin completa y perfecta / 65

L *(w)

'

...'

Curva de indiferencia
del sindicato

w*

L*(w)

L
Curvas de isobeneficio de la empresa

L*

(w*)

Figura 2.1.2
'Figura

2.1.4.

,
w

L
Curvas de indiferencia del sindicato

Figura 2.1.3

Consideremos ahora el problema del sindicato en la etapa (1). Dado


que el sindicato puede resolver el problema de la.empresa en la segunda
etapa, tanto como la propia empresa, el sindicato deberla prever que la
reaccin por parte de la empresa a su demanda salarial w ser escoger el
nivel de empleo L*(w). Por tanto, el problema del sindicato en la primera
etapa se concreta en
maxU
lU~O

(w,L*(w).

En trminos de las curvas de indiferencia representadas en la figura


2.1.3, al sindicato le gustarla escoger la demanda salarial w que proporcione un resultado (w,L * (w que est en la curva de indiferencia ms alta
posible; La solucin al problema del sindicato es w*, la demanda salarial
que hace que la curva de indiferencia del sindicato que pasa por el punto
(w*,L*(w* sea tangente a L*(w) en ese punto (vase la figura 2.1.4)'- Por
lo tanto, (w* ,L*(w* es el resultado por induccin hacia atrs de este juego
de salarios y nivel de empleo.
Es fcil ver que (w* ,L * (w* es ineficiente: tanto la utilidad del sindicato como los beneficios de la empresa aumentaran si w y L estuvieran en
la regin sombreada de la figura 2.1.5. Esta ineficiencia hace que resulte
difcil de entender que en la prctica las empresas parezca que retienen
el control exclusivo sobre el nivel de ocupacin. (Si permitimos que la
empresa y el sindicato negocien los salarios pero mantenemos el control
exclusivo de la empresa sobre el nivel de empleo obtenemos un resultado
igualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicacin
a este enigma basada en el hecho de que el sindicato yla empresa negocian
repetidamente a lo largo del tiempo (normalmente cada tres aos en Estados Unidos). En ese juego repetido, siempre que la eleccin de.w por parte
del sindicato y la eleccin de L por parte de la empresa caigan en la regin
sombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esos
valores de w y L no pueden ser el resultado por induccin hacia atrs de
un~ nica negociacin. Consltese la seccin 2.3 sobre juegos repetidos y
el ejercicio 2.16 sobre el modelo de Espinosa-Rhee.

'.

',.,.,'

"~o

'.:

.'

66

1 JUEGOS

OlNMIC05

CON INFORMACIN

luegos dilllm.icos con informacin

COMPLETA (e. 2)

completa y I",rleeta

67

Una descripcin ms detallada de la secuencia temporal del juego de

w
Curva de beneficio

w*

de la empresa

L * (w*)

Figura 2.1.5
2.1.D Negociacin secuencial
Empezamos con un modelo de negociacin de tres periodos perteneciente
a la clase de juegos estudiada en la seccin 2.1.A. Pasamos luego a discutir el modelo de Rubinstein (1982), en el que. l nmero de periodos
. es (potencialmente) infinito. En ambos modelos se llega a un acuerdo
inmediatamente, no hay negociaciones prolongadas (como huelgas). En
el modelo de Sobel y Takahashi (1983) de negociacin secuencial con
informacin asimtrica, en cambio, pueden ocurrir huelgas en el nico
equilibrio (bayesiano perfecto) con probabilidad positiva (vase la seccin
4.3.B).

Los jugadores 1 y 2 negocian el reparto de una peseta. Hacen ofertas


alternativamente: primero el jugador 1 hace una propuesta que el jugador
2 puede aceptar o rechazar; si 2la rechaza, hace una propuesta que 1 puede
aceptar o rechazar, y as sucesivamente. Una vezqe una oferta ha sido
rechazada, deja de ser vinculante y es irrelevante en las siguientes rondas
del juego. Cada oferta corresponde a UI. periodo y los jugadores son
impacientes: desCuentan las ganancias obtenidas en periodos posteriores
de acuerdo con el factor , donde O < < 1.7
7 El factor de descuento reflej el' valr temporal del dinero. Una peseta: recibida al
principio deun periodopede ingresarse en un bancoy proporcionar intereses, digamos-que
a-un tipo r por period y, por tanto, tendr n vlor de 1 + r pesetas al principio de periodo
siguiente, De forma equivalente, una peseta que se reciba al principio del periodo siguiente
tiene ahora un valor de slo 1/0 + r) pesetas. Sea =' 1/0 + r); entonces na ganancia
.". obterlida en el prximo periodo tiene ahora ahora un valor de slo 6.".; una ganancia 7f
obtenida dentro de dos periodos tiene ahora un valor de s6lo 62."., yassucesivaI'nente. El
valor actual de una ganancia futura recibe el nombre de valor futuro de esa ganancia._

tres periodos es la siguiente:


(la) Al principio del primer periodo el jugador 1 propone quedarse con
una fraccin SI de una peseta, dejando 1 - SI para el jugador 2.
(lb) El jugador 2 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias SI y 1 - 81 inmediatamente) o
rechazarla (en cuyo caso el juego pasa al segundo periodo).
(2a) Al principio del segundo periodo el jugador 2 propone que el jugador) se quede con una fraccin 82 de una peseta, dejando 1 ~ 82 para
el jtgador 2. (Ntese la convencin de que 8t corresponde s_iempre
al jugdor 1, sea quien sea quien hace la oferta.)
(2b) El jugador 1 puede aceptar la oferta (en cuyo caso el juego finaliza
y los jugadores reciben las ganancias 82 y 1 - 82 inmediatamente) o
rechazarla (en cuyo caso el juego pasa al tercerperiodo).
(3) Al principio del tercer periodo el jugador 1 recibe una fraccin 8 de
una peseta, dejando 1 - S para el jugador 2, donde O < s < 1.
En este modelo de tres periOdos, el acuerdo a:Lque se llega en el tercer
periodo (s,1 - s) est fijado exgenamente. En el modelo con horizonte
infinito que consideraremos ms tarde, la ganancia 8 del tercer periodo
representa la ganancia del jugador 1 en lo que queda del juego si se llega
al tercer periodo (esto es, si las dos primeras ofertas son rechazadas).
Para calcular el resultado por induccin hacia atrs de este juego de
tres periodos, calculamos en primer lugar la oferta ptima por parte del
jugador 2 si llega al segundo periodo. El jugador 1 puede recibir .5en el
tercer periodo rechazando la oferta S2 del jugador 2 en este periodo, pero
el valor en este periodo de recibir s en el periodo siguiente es slo 8s. Por
tanto, el jugador 1 aceptar S2 si y slo si 82 :::::s: (Suponemos gue cada
jugador aceptar una oferta si es indiferente entre aceptarla o rechazarla.)
El problema de decisin del jugadOr 2 en el segundo periodo, por tanto,
se concreta en escoger entre 1 - s en este periodo (ofreciendo 82 = s al
jugador 1) o recibir 1 - s en el siguiente periodo (ofreciendo al jugador 1
cualquier S2 < s). El valor descontado de la ltima opcin es (l - s),
que- es menor que 1 -Os obtenible por medio de la primera opcin, de
forma quela oferta ptima del jugador 2 en el segundo periodo es 8i = ,)8.
Por tanto, si el juego llega al segundo periodo, el jugador 2 ofrecer si y
el jugador 1 aceptar .
Dado que el jugador 1 puede resolver el problema del jugador 2 en
el segundo periodo tan bien como el propio jugador 2, el jugador 1 sabe

se

68/ JUEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)

que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazando


la oferta S] del jugador 1 en este periodo, pero el valor en este periodo de
recibir 1 - si el periodo siguiente es slo de 50 - si). Por tanto, el jugador
2 aceptar 1 - s] si y slo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). El
problema de la decisin del jugador 1 en el primer periodo, por tanto, se
concreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo
1- SI = 50-si) al jugador 2) o recibir si en el prximo periodo (ofreciendo
cualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la ltima
opcin es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obtenible
por medio de la primera opcin, de forma que la oferta ptima del jugador
1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58).'Por tanto, en
el resultado por induccin hacia atrs de este juego de tres periodos, el
jugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.
Consideremos ahora el caso en que el horizonte es infinito. El desarrollo temporal es el mismo que hemos descrito anterio~ente, excepto que el
acuerdo exgeno del paso (3) esreemplazado por una sucesin infinita de
pasos (3a), (3b), (4), (4b) yassuesivamerite. El jugador 1 hacela"oferta
en los peripdiJsII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:in
con~
tina hasta que un9 elelos dos jugadore~ acepta,unt9f~rta. Nos gustara
hallar el resultado PO! induccin pacia atrs de esteJuego pe horizonte
infinito movil}-dcmoshacia atrs, tal como lo hemos hecho en los casos
analizados hasta ahora. Sin embargo, co~oel jueg~podra continuar
hasta el infinito, no existe un ltimo momento a partir del cual iniciar tal
anlisis. Afo~nadamente,
la,siguiente idea (aplicada.()riginalmente por
Shaked y Sutton [1~84])nos permit truncar el juego de horizonte infinito
y aplicar la lgica del Giso'en el que ell10rizonte ~. fui:to:el juego q~e
empieza en el,tercer periopo (si se alcanza) es idntico al jueg~ completo
(empezando desde el primer periodo); en ambos cas~s el jugador 1 hace
la primera oferta, los jugadores se alternan haciendo las siguientes ofertas
y la .negociacin contina hasta que un jugador acepta una oferta.
Dado que no hemos definido formalmente el resultado por induccin
hacia atrs de este juego 'de negociacin con horizonte infinito, nuestros
argumentos sern informales (pero pueden formalizarse). Supongamos
que existe un resultado por induccin hacia atrs del juego completo en
el que los jugadores- 1 y 2 reciben las ganancias s y 1 - s respectivamente.
Podemos utilizar estas ganancias en el juego que empieza en el tercer
periodo, si se alcanza, y proceder entonces hacia atrs hasta el priner penodo (como en el juego de tres periodos) para calcular un nuevo resultado
por induccin hacia atrs del juego completo. En este nuevo resultado

Juegos en dos etapas de informacin / 69

por induccin hacia atrs, el jugador 1 ofrecer el acuerdo (j(s),lf(s


en el primer periodo y el jugador 2 aceptar, donde fes) = 1 - 50 - os)
es la fraccin del jugador 1 en el primer periodo del juego anterior de tres
periodos cuando el acuerdo (s,1 - s) se impona exgenamente en el tercer
periodo.
Sea s A la ganancia ms alta que el jugador 1 puede recibir en cualquier
resultado por induccin hacia atrs del juego completo. Consideremos el
uso de SA como la ganancia del jugador1 en el tercer periodo, tal como
lo hemos descrito anteriormente; esto producir un nuevo resultado por
induccin hacia atrs en el que" la ganancia en el primer penado del
jugador 1 es fCsA).Dado
que fes) = 1- 5 + 02Ses creciente'en s; f(sA)
es la ganancia en el primer periodo ms alta posible; ya quesA es la
ganancia ms alta posible en el tercer periodo. Pero SA es tambin la
ganancia ms alta posible en el primer periodo; de forma que!(sA) =
SAo Argumentos similares demuestran que f(sB)
= SB, donde SB es la
ganancia ms baja posible que el jugador 1 puede obtener en cualquier
resultado por induccin hacia atrs del juego completo. El nico valor de
s que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;
sA = SE 0= s. de forma que, existe un nico resultado por induccin hacia
atrs d~l juego completo: en el primer periodo el jugador 1 ofrece un
acuerdo (s' = 1/(1+0),1- s'" = 5/0 + o al jugador 2, quien acepta.

'"

1',

\.'
,

'"

2.2 Juegos en dos etapas con informacin completa


.pero imperfecta :,
2.2.A.Teoa: Perfeccin en subjuegos .
Enriquecemos ahora la clase de juegos analizacia eIlla seccin anterior:
Como en los juegos dinmIcos con informacin completa y perfecta, continuamos suponiendo que el jUego sigue una sucesin de etapas, habiendo
los jugadores observado las decisiones formads~ las etapas previas antes del comienzo de una nueva etapa. Sin embargo, a diferencia de los
juegos analizados en la seccin anterior, peImit:iritos qe haya decisiones
simultneas en cada etapa .. t:omo explicaremos ,en la seccin 2.4; esta
simultaneidad de decisiones significa que los juegos analizados en esta
seccin tienen informacin imperfecta. Noobstante, estos juegos compar"ten caractersticas importantes con los"juegos con irLformacin perfecta
considerados en la secclnanterior.

,~
"

Juegos elldos etapas de illfomwcilI

'70 I JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

Analizaremos el siguiente juego sencillo, al cual (sin mucha inspiracin) llamaremos juego en dos etapas con informacin perfecta pero
incompleta:
1. Los jugadores 1 y 2 escogen simultneamente las acciones al y az de
los conjuntos factibles Aly Az respectivamente.
2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), y
escogen entonces simultneamente las acciones 0.3 y 0.4 de los conjuntos
factibles A3 y A4 respectivamente.
.
~
3. Las ganancias sonui(al,az,a3,a4)
para i = 1,2,3,4.
Muchos problemas econmicos se ajustan a esta descripcin.8 Tres ejemplos (que discutiremos ms adelante con mayor detalle) son los pnicos
bancarios, los aranceles y la competencia internacional imperfecta y los
torneos (por ejemplo, la lucha entre varios vicepresidentes de una empresa
por ser el prxno presidente). Otros problemas e~xJl1micospueden modelarse si permitimos una mayor complejidad, ya sea aadiendo ms
jugadores o permitiendo que los jugadores jueguen en ms de una etapa.
Podra incluso hab~r~enos jugadores: en algunas aplicaciones.los jugadores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 no
aparece.
Resolvemos un juego de esta clase utiizando un enfoque parecido
~!_qe la induccin haci~ atrs, pero est~ vez, el primer paso quedamos
cuando nos movemos hacia atrs desde el final del juego exige la resolucin de un juego real(el juego siinultneoentre los jugadores 3 y 4 en
la segUnda etapa, dado el resultado de la primera etapa) en vez de resolver un problema de optnizacin para un nico individuo como en la
seccin anterior. P.arano complicar las cosas; supondremos en esta seccin
que para cada resultado factible de la primera etapa, (0.1,0.2), el juego que
queda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene un
nico equilibrio de Nash que denominam()s (a;(al,az),a(al,az.
~ la
seccin 2.3.A (sobre juegos repetidos) consideramos las consecuencias de
prescindir de este supuesto.
Si los jugadores 1 y 2 prevn que el comportamiento en la, segunda
etapa de los jugadores 3 y 4 vendr dado por (a;(al,a2~,-a(al,az,
la interaccin entre los jugadores 1 y 2 en la primera etapa se concreta en el
siguiente juego de decisiones simultneas:
8 Como en la seccin anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 en
la segunda etap~, A:>! A4, podran depender del resultado de la primera etapa (al,a2)' En
particular, podnan eX1stirvalores (al,a2) que finalizaran el juego.

.. ,:'

1. Los jugadores 1 y 2escogen simultneamente las acciones


los conjuntos factibles Al Y Az respectivamente.
2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z
parai = 1,2.

1/,1

TI

"-z de

Supongamos que (0.1,0.2) es el nico equilibrio de Nash de este juego de


decisiones simultneas. Llamaremos a (o,i,0,2'0.; (al' 0.2),0,4 (al ,(1,2 resultado
perfecto en subjuegos de este juego en dos etapas. Este resultado es el
nalogo natural del resultado por induccin hacia atrs en los juegos con
informacin completa y perfecta, y esta analoga se refiere tanto a sus
canietersticas atractivas como a las que no lo son tanto. Los jugadores 1 y
2 no deberan creer ninguna amenaza por parte de los jugadores 3 y 4 que
correspondiera a acciones que no fueran el equilibro de Nash del juego
que queda en la segunda etapa, ya que cuando el juego llegue realmente a
la segunda etapa, al menos uno de los jugadores 3 o 4 no querr cumplir su
amenaza (precisamente porque no es un equilibrio de Nash del juego que
queda en la segunda etpa).Por otra parte, supongamos que el jugador
1 es tambin el jugador 3, y que el jugador 1 no juega 0'1 en la primera
etapa: el jugador 4 puede querer entonces reconsiderar el supuesto de que
el jugador 3 (es decir, el jugador 1) jugar a;(0,1,o.Z) en la segunda etapa.
2.2.B Pnico bancario
Dos inversores han depositado cada uno de ellos una cantidad D en un
banco. El banco ha invertido estos depsitos en un proyecto a largo plazo.
Si el banco se ve obligado a liquidar su inversin antes de que el proyecto
venza, puede recuperar un total de 2r, donde D > r > D /2. Sin embargo,
si el banco deja que la inversin llege a su vencimiento, el proyecto rendir
un total de 2R, donde R > D.
Existen dos fechas en las cuales los iiwersores pueden sacar dinero del
banco: la fecha 1 es anterior al vencimiento de la inversin del banco, la
fecha 2 es posterior. Para simplificar, supondremos que no hay descuento.
Si ambos inversores sacan dinero en la fecha 1, cada uno recibe r y el juego
se acaba. Si slo un inversor saca dinero en la fecha 1, ese inversor recibe
D, el otro recibe 2r - D Y el juego se acaba. Finalmente, si ninguno de
los inversores saca dinero en la fecha 1, el proyecto JJega a su vencimiento
y los inversores deciden si sacar el dinero o no en la fecha 2. Si los dos
inversores sacan el dinero en la fecha 2, cada rula de ellos recibe R y el
juego se acaba.' Si slo un inversor saca el dinero en la fecha 2, ese inversor
recibe 2R - D, el otro recibe D y el juego se acaba. Finalmente, si ninguno

72 / JUEGOS DINMICOS CON INFOJ<MAClN COMPLETA (c. 2)

de los inversores saca el dinero en la fecha 2, el banco devuelve R a cada


inversor y el juego se acaba.
En la seccin 2.4 discutiremos cmo representar formalmente este
juego. Sin embargo, por ahora procederemos de modo informal. Representemos las ganancias de los dos inversores en las fechas 1 y 2 (en funcin
de sus decisiones sobre sacar dinero en esas fechas) con el siguiente par
de juegos en forma normal. Ntese que el juego en forma normal correspondiente a la fecha 1 no es tpico: si ambos inversores escogen no
sacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que los
inversores pasan al juego en forma normal correspondiente a la fecha 2.

JlIegos en dos etapas de infonnacin / 73

ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha


1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) en
la fecha 2.

Sacar

Sacar

No sacar

r,r

D,2r - D

No Sacar 2r - D,D

R,R

Figura 2.2.1
Sacar

No sacar

Sacar

T,T

D,2r-'--D

No Sacar

2r - D,D

siguiente etapa

Fecha 1

Sacar
Sacar

R,R

NoSacar

D,2R - D,

No sacar
2R-

D,D

R,R

Fecha 2
Para analizar este juego procedemos hacia atrs. Considrese el juego
en forma normal correspondiente a la fecha 2. Como R > D (y por
tanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de forma
que existe un nico equilibrio de Nash de este juego: ambos inversores
sacan el dinero, lo que conduce a unas ganancias de (R,R). Como no hay
descuento, podemos simplemeI1te sustituir estas ganancias en el juego en
forma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1.
Dado que r < D (y por tanto 2r - D < 1'), esta versin de un periodo del
juego de dos periodos tiene dos equilibrios de Nash en estrategias puras:
(l) ambos inversores sacan el dinero, lo que conduce a unas ganancias
de (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva a
unas ganancias de (R,R). Por tanto, el juego original del pnico bancario
de dos periodos tiene dos resltados perfectos en subjuegos (y, por tanto,
no se ajusta totalmente a la clase de juegos definida en la seccin2.2.A):
(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas

El primero de estos resultados puede interpretarse. como el de un


pnico bancario. Si el inversor 1 cree que el inversor 2 sacar su dinero
en la fecha 1, su mejor respuesta es sacar tambin el dinero, aun cuando
a ambos les ira mejor si esperasen a la fecha 2 para sacar el dinero. Este
juego del pnico bancario difiere del dilema de los presos discutido en el
. captulo 1 en un aspecto importante: ambos juegos poseen un equilibrio de:
Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.a
de los presos ste es el nico equilibrio (y loes en estrategias dominantes),
mientras que en este juego existe tambin un segundo eqUilibrio qe
es eficiente. Por tanto, este modelo no predce cundo va a ocurrir un
pnico bancario, pero muestra que es un fenmeno que'p~~de ocurrir en
equilibrio. Vase un modelo ms rico en Diamond y DybVig (1983):.
/,

2.2.C Aranceles y competencia internacional imperfecta


Nos ocupamos ahora de una aplicacin de economa internacional. Consideremos dos pases idnticos, que denominamos con i = 1,2. Cada pas
tiene un gobierno que escoge un arancel, una empresa que produce tanto
para el consumo interno como para la exportacin y unos consumidores
que compran en el mercado interno, ya sea de la empresa nacional o efe
la extranjera. Si la cantidad total en el mercado del pas i es Qir el precio
de equilibrio del mercado es Pi(Qi) = a - Q.. La empresa del pas i (que
en adelante llamaremos empresa ~)produce hi para el consumo interior
y ei para la exportacin. Por tanto, Q = h + ej. Las empresas tienen
un coste marginal constante e y no tienen costes fijos. Por tanto, el coste
total de produccin de la empresa i es C(h,ei) = c(h + e). Las empresas
tambin incurren en un coste arancelario sobre las exportaciones: si la

-,

.,
fllegos

74 I JUEGOS DINMICOS CON INFORMACiN COMPLETA Ce. 2)

empresa iexporta ei al pas ,7 cuando el gobierno j ha establecido una tasa


arancelaria de tj, la empresa i debe pagar tjei al gobierno j,
, El desarrollo temporal del juego es el siguiente: Primero, ambos gobIernos escogen simultneamente las tasas arancelarias tI y t2. En segundo lugar, las empresas observan las tasas arancelarias y escogen sim~:neamente las cantidades para el consumo interno y para la exportacIOn, (hI,eI) y (h2,e2). En tercer lugar, las ganancias son los beneficios
de la empresa i y el bienestar total del gobie.r:noi, donde el bienestar total
del pas i es la suma de los excedentes de los consumidor~s9 del pas i,
los ~eneficios recibidos por la empresa i y el ingreso arancelario que el
gobIerno ~recauda de la empresa j:

.....

...,.'

1r'i(ttj,hi,ehj,ej)

=[0. - (hi+ ej)Jhi + [a - (ei + hj)Jei


- c(hi

",
Wi(ttj,h"e"hJ,ej)

+ e;) -

tje

='2Qf

+ 1r'i(titjhi,ei,hj,ej)

+ tiej,

Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si


es un equilibrio de Nash del juego (de dos mercados) restante
entrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar
(hj,ej,hi,ei)

'!'~

Como 1r'i(t"tj,h"e"h;,e;)
puede escribi~e como la sum~ de los benefi~io,sde la empresa i en ~l.mercado i (los cuales son funcin de hi y e;
Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cuales son funcin, de ei, h;.y tj. nicamente), el problema de optimizacin
en los dos mercados para la empresa i se simplifica al separarse en dos
problemas, uno para cada mercado: hi debe solucionar
, max
h,::::O

.-~

+ eJ~)-

hi[a - (hi

'

cL

y ei debe solucionar
maxei[a

<,::::0

- (ei

+ 11,*) - el J

te'.
J

'

9 S'
.
1 un consUffildor compra un bien a un, precio,p cua~dohab'r
estado dispuesto a
pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deinilcla inversa
Pi(Qi) ~ a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que el
excedente agregado del consumidor es (l/2)Qr

Suponiendo que

e; :::;a -

eH

dos etapas de

ill{omlOc/I

I 75

c, tenemos que

1(
,,)
11,; =
a - ej - e ,

'2

(22,1)

y suponiendo que 11,; :::; a - e - tj, tenemos que


1('o, - 1*
ei = '2
tj

e - tj ) .

(2.22)

(Los resultados que derivamos son coherentes con ambos supuestos,) Las
dos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse para
cada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incgnitas
(hi,ei,hi,ei).
Afortunadamente, este sistema de ecuaciones puede simplificarse dividindose en dos grupos de dos ecuaciones con dos incgnitas,
Las soluciones son
h~ =
,

0.-

'3

+ ti

ei

0.-

C -

2tj

(2,23)

Recordemos (en la seccin 1.2.A) que la cantidad de equilibrio escogida


por las dos'empresas en el juego de Cournot es (a - c)/3, pero que este
resultado se obtuvo bajo el supuesto de costes marginales simtricos. En
el equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelarias
de los gobiernos hacen que los costes marginales sean asimtricos (como
en el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal ele
la empresa i .es c, pero el delaempresa j es c + ti. Como el coste de la
empresa j es ms alto, sta quiere producir menos .. Pero si la empresa j
va a producir menos, el precio de ,equilibrio ser'.Il~J~al~~,deforma que la
empresai querr producir ms, en cuyo caso la empresa j querr producir
menos todava. Por tanto, en equilibrio, hi crece con ti y e; decrece (a un
ritIno ms rpido) con ti, como indica (2.2.3).
Una vez resuelto el juego entre las dos empresas que queda en la
segunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,
podemos ahora representar la interaccin entre los dos gobiernos en la
primera etapa con el siguiente juego de decisiones simultneas. Primero,
los gobiernos escogen las tasas aran,celarias tI y t2 simultneamente. En
segundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei)
para el gobierno
i = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),
Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.
Para simplificar la notacin, suprimiremos la dependencia de 11.; de f'i
y de ei de tj: con W;(ti,tj)genotamos
a Wi(ti,tj,hi,ei,hi,ei),
la ganancia
del gobierno i cuando eS.<;9ge1a
tasa arancelaria ti, el gobierno .i escoge t j

/,-.

76/

JUEGOS DINJVlICOS CON INFORMACIN COMPLETA

Ce.

2)

Juegos en dos etapas de informacin / 77

y las empresas i y jse comportan segn el equilibrio de Nash dado por

(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos,
entonces, para cada i, ti debe solucionar
max

W;*(ti,t*).

ti~O

Pero

W;*(t,tiJ

es igual a

(2(a - e) - ti?

(a - e + ti)2 + (a - e - 2t~?
1

18

+ t(a
t

- e - 2t)1

del libre comercio). (Si es factible tener aranceles negativos, es decir,


subsidios, el ptimo social consiste en que los gobiernos escojan tI =
t2 = -(a - e), lo que hace que la empresa nacional no, produzca nada
para el consumo interior y exporte la cantidad de competencia perfecta
al otro pas.) Por lo tanto, dado que las empresas i y j se comportan
segn el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,
la interaccin entre los gobiernos en la primera etapa es un dilema de los
presos: el nico equilibrio de Nash lo es en estrategias dominantes, y es
socialmente ineficiente.

3'

por tanto

2.2.0 Torneos
a-e

t~ =--

para cada i, independientemente de tj. En consecuencia, en este modelo


escoger una .tasa arancelaria de (a - e)j3 es una estrategia dominante
de cada gobIerno. (En otros modelos, por ejemplo cuando los costes
margInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos no
son domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3) obtenemos
hi = 4(a -:-e)

e~ = a - e

como las cantidades escogidas por las empresas en la segunda etapa. Por
tanto, el resultado perfecto en subjuegos de este juego -de aranceles es
(ti
(a - e)j3,hj=hi=
4(u-:- e)j9,ej = ei = (a --' e)j9)~
'
En el resultado perfecto en subjuegos, la cantidad agregada en cada
mercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogido
unas tasas, ar~ncelarias iguales a cero, la cantidad agregada en cada mercado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cournot. Por tanto, el excedente de los consumidores en el mercado i (el cual,
como hemos visto anteriormente, es simplemente la mitad del cuadrado
de la cantidad agregada en el mercado i) es menor, cuando los gobiernos
esc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que
~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos aranceles
Iguales a cero son socialmente ptimos en el sentido de

=5 =

max

W(t],t2)

Consideremos a dos trabajadores y su capataz. El producto del trabajador i (i = 1 o 2) es Yi = ei + E donde ei es esfuerzo y Ei es ruido. El
proceso de produccin es el siguiente: Primero, los trabajadores escogen
simultneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'
gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,
de acuerdo con una funcin dedensidad f(E) con media cero. Entercer
lugar, el producto de los trabajadores es obsen:ado pe~ono su
Los salarios de los trabajadores,' por tanto, pueden depender de lo que
han producido, pero no (directamente) de su esfuerzo.
Supongamos que el capataz decide inducir a los trabajadores a esforzarse ms y para ello les hace competir en un torneo;.tal y como originalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por el
vencedor del torneo (es decir, el trabajador quems:produica)eswA;"el
salario recibido por el perdedor es WB. La ganancia:deun trabajador que
reciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde la
desutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Y
g"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.
Transcribimos ahora esta aplicacin'a lostrininos de la clase de juegos
discutida en la seccin 2.2.A. El capat~~'~"eIRg~dor 1~cuya accin al es
escoger lbs salarios W A y W B que se pagarn en el torneo. No hay jugador
2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .
escogidos en la primera etapa y deci~e,!-1~n.t,?~cessnultneamente sus
acciones a3 Y a4, es decir los esfur~o~'~l'y'~:(Consideraremos ms de-

e~fu~i~o~

+ Wi(t2,tl),

tl,t2~O

de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdo


en el que se comprometan a eliminar los aranceles (es decir, en favor

lO Para no complicar la exposicin de esta aplicacin; ignoramos varios detalles tcnicos,


tales como las condiciones bajo las cuales la 'condicin de primer orden del trabajador es
suficiente. No obstante, el anlisis eXige illI mayor clculo de probabilidades que en los casos
anteriores. Esta aplicacin puede saltarse sin prdida de continuidad.
'

... ".

78 / ]VEGaS

DINMICOS CON INFORMACIN

Juegos el1 das etapas de ,[anuaciru ! 79

COMPLETA (e. 2)

lante la posibilidad de que, dados los salarios elegidos por el capataz, los
trabajadores prefieran no participar en el torneo y acepten en cambio una
oferta de empleo alternativo.) Finalmente, las ganancias de los jugadores
son las establecidas anteriormente. Dado que lo que se produce (y por
tanto tambin los salarios) es funcin no slo de las decisiones de los jugadores sino tambin de los trminos de ruido El y (.2,operaremos con las
ganancias esperadas de los jugadores.
Supongamos que el capataz ha elegido los salarios WA y WB. Si el
par de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entre
los trabajadores, para cada i, ei ha de maximizar el salario esperado del
trabajador i menos la desutilidad del esfuerzo: ei debe ser una solucin
dell

,','

-_:;,'

Prob{Yi(e;) >

Yj(ej)}

=Prob{Ei >

' =1

ej +

e;}

Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj

. j

/[1 -

F(ej

- ei

+ Ej)JJ(Ej)dEj,

de forma que la condicin de primer orden de (2.2.5) se convierte en


(WA -

WB)

J(e;

- ei + Ej)f(Ej)dEj

= g'(ei)'

En un equilibrio de Nash simtrico (es decir, ei = ei = e') tenemos que


max WA Prob{Yi(ei) >

e,,,=O

, = (WA
::.

donde

"',1::'"

Yi(ei)

- WB)

Yj(e;)}

+ 1)1B Prob{Yi(ei) ::; YjCe;)}

Prob{Yi(ei) >

,,',

Yj(e;)}

+ WB

-' g(ei)

(WA - WB)

(2.2.4)

~ g(ei),

Como

= ei + Ei',La condicin de primer orden de (2.2.4) es'

-,,) :

(WA _

,-,~~tl

~~~,
.,::- ..'

~:',

.",.!:.'

--");
"
__
,~i

:;
~~','

"o,}'
,)~

.~}
,",.l~

'. '-,'
'

..../

~_l.>t'

)8Prob{Yi(ei) >
WB
8
ei

Yj(e;)}

- 9

'(

,)
e,.

(2.2.5)

.'
Es decir, el trabajador i escoge ei de forma que la desutilidad marginal de
un esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzo
adicional, que es el producto de lo que se gana en salario por venCer en el
torneo, WA '-w B, y el aumento marginal de la probabilidad de ganar.
Por la regla de Bayes,12
11 Al escribir (2.2.4),supusimos
que la funcin de densidad del ruido (e) es tal que el
suceso en el qU lostrabaj~dores producen exactamente lo mismo OCurrcon probabilidad
cero y, por tanto;no es necesario considerarlo en la funcin de utilidad esperada del trabajador
i. (Ms formalmente, suponemos que la funcin de densidad (E) es no atmica) En una
descripcin completa del torneo, sera natural (pero innecesario) especificar que el ganador se
determina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadores

reciben(wA

+wB)/2

J(Ej) 2 dEj -- 9 '(')e

(2.26)

es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valor


esfuerzo, cosa harto
mtU.lliva. Por
) I'nduce a un mayor
mayor d eWA-WB
'
,
tra parte con un mismo premio, no vale tanto la pena esforzarse cuando
ruido e~ muy fuerte, porque es probable que elresultado del to:neo se
determine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,
si Ese distribuye normalmente con varianza a2, entonces
g(e)

:1

"

;:\

. j

l2La regla de Bayes proporciona una frmula para P(AIB), la probabilidad (condicional)
de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B)
las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayan
tenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurran
respectivamente.
La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, la
probabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurran
dividida por la probabilidad a priori de que B ocurra.

que decrece en a, de forma que E' efectivamer:te decrece en a..


Procedemos ahora hacia atrs, hasta la pnmera etapa del Juego. Suacuerdan
participar
en el torneo
pongamos que SI,. 1os trabaJ'adores
'
' '
,
. (en
lternativo)
responderan
a
los
salanos
',I! A
mpleo
a
t
vez d e acep ar un e,
,
.
.
d
1
'libn'o
de
Nash
simtrico
caractenzado
por
(2.2.6).
y W B lugan ,o e eqw,
.. ' .
.,.
(1gnoramos, por t anto , la posibilidad de equihbn, os asrmetncos y,de un
,
equilibrio en el que la eleccin de los es~erzos por parte de los trabaJadores venga dada por la solucin de esquma el = e2 = en vez de por la
condicin de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlunI'd a d d e emp 1ea alternativo proporcionan' a una utilIdad Un' Como
, en' el
.
equilibrio de Nash simtrico cada jugador gana el tor~eo con probal:lhdad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI capataz qUJ~re
inducir a los trabajadores a participar en el torneo debera escoger salanos

?:

:1

que satisfagan

80 / JUEGOS DlNAMICOS CON INFORMACIN COMPLETA (c. 2)

-w,
2 ,~ + 2-wB

- g(e*)

>- Ua.

Juegos repetidos / 81

(2.2.7)

ganancias del juego completo son simplemente la suma de las ganancias


de cada etapa (es decir, no hay descuento).
(

Suponiendo que Ua sea lo suficientemente pequea corno para que el


capataz quiera inducir a los trabajadores a participar en el torneo, ste
escoger los salarios que maximicen el beneficio esperado, 2e* -"illA - WB,
sujeto a (2.2.7). En el ptimo, (2.2.7) se satisface con igualdad:

Jugador 2
(

Iz

D2

1,1 5,0

Jugador 1
WB

= 2Ua

+ 2g(e*) -

WA.

El beneficio esperado es entonces 2e* - 2Ua - 2g(e*), de forma que el


capataz quiere escoger unos salarios tales que el esfuerzo inducido, e*,
maximice e* - g(e*). El esfuerzo inducido ptimo, por tanto, satisface
la condicin de primer orden l(e') = 1. Sustituyendo esto en (2.2.6) se
obtiene que el premio ptimo, WA - WB, es una solucin de
(WA -

WB)

f(j)2dj

1,

Y (2.2.8)determina entonces

0,5 4,4

(2.2.8)

WA Y"illB.

2.3Juegos repetidos
En esta seccin analizarnos si las amenazas y promesas sobre el comportamiento futuro pueden influir en el comportamiento presente en situaciones que se repiten en el tiempo. Buena parte de lo que hay que entender
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas
nuevas se requieren para entender los juegos con un horizonte infinito.
Hemos definido tambin el equilibrio de Nash perfecto en subjuegos. Esta
defircin tiene una expresin ms sencilla para el caso especial de los juegos repetidos que en el general de los juegos dinmicos con informcin
completa que considerarnos en la seccin 2.4.B. La introducirnos aqu para
tacilitar la exposicin posterior.
. '.
2.3.A Teora: Juegos repetidos en dos etapas
Consideremos el dilema de los presos dado en forma normal de la figura
2.3.1. Supongamos que hay dos participantes en este juego que deciden
simultneamente en dos ocasiones, habiendo observado el resultad"ode li,'l
primera decisin antes de decidir por segunda vez, y supongamos que las

('.
Figura 2.3.1
Jugador 2
Iz

D2

2,2 6,1
Jugador 1
1,6 5,5

Figura 2.3.2
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
Este juego pertenece a la clase de los juegos analizada en la seccin 2.2.A.
Aqu los jugadores 3 y 4 son idnticos a los jugadores 1 y 2, los espaCios
de acciones A3 y A4 son idnticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
son simplemente la suma de las ganancias en la'pnmera etapa (i.;a2)
y en la segunda etapa (a3,a4)' Adems, el dilema de los presos en d.s
etapas satisface el supuesto que hicimos en la seccin 2.2.A: para cada
resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
en la segunda etapa entre los jugadores 3 y 4 tiene un nico equilibrio
de Nash, que denotamos por (a3(al,a21,a,i(al,a2'
De hecho, el dilema
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la seccin 2.2.A peTInitini.osla posibilidad de
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aqu la notacin (a; (al ,a2) ,a (al ,a2
en vez de simplemente (aj,a). (En el juego de los aranceles, por ejemplo;
las cantidades de equilibrio escogidas por las empresas en la segunda
etapa dependan de los aranceles escogidos por los gobiernos en la primera
etapa.) Sin embargo, en el dilema de los presos en dos tapas, el nico

~'.

[IleSOS
82 / JuEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)

equilibrio del juego de la segunda etapa es (I,h), independientemente


del resultado de la primera etapa.
Siguiendo el procedimiento descrito en la seccin 2.2.A para calcular el
resultado perfecto en subjuegos de tal juego, analizamos la primera etapa
del dilema de los presos en dos etapas teniendo en cuenta que el resultado
del juego restante en la segunda etapa ser el equilibrio de Nash de ese
juego, es decir, (IIJ con ganancias de (1,1). Por tanto, la interaccin en
la primera etapa entre los jugadores en el dilema de los p~esos en dos
etapas se concreta en el juego de una jugada de la figura 2.3.2, en el que
las ganancias 0,1) de la segunda etapa se han sumado ' cada par de
ganancias de la primera etapa. El juego de la figura 23.2 tiene tambin un
nico equilibrio de Nash: (IIJZ). Por tanto, el nico resultado perfecto en
subjuegos del dilema de los presos en dos etapas es (Jz) en la primera
etapa, seguidC? de (IJz) en la segunda etapa. No se puede conseguir
cooperacin, es decir, (DI,Dz) en ninguna etapa del resultado perfecto en
subjuegos.
Este argumento contina siendo vlido en situaciones ms generales.
(Aqu nos apartamos momentneamente del caso de dos periodos para
permitir cualquier nmero finito de repeticiones, T.) Denotemos con
G = {A, ... , An; Ul; ... ,un} un juego esttico con informacin completa
en el que los jugadores 1 a n escogen simultneamente las acciones a a an
de los espacios de acciones A a An respeftivamente, siendo las ganancias
U(al;', . ,an) a un(a, ... ,an). Llamaremos al juego G, juego deetapadel
juego repetido.

...

}:

Definicin. Dado un juego de etapa G, G(T) denota el juego r.epetido finitamente en el que G se juega T veces, habiendo los jugadores observado los
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
etapa.
Proposicin. Si el juego de etapa G .tiene un nicQequilibrio de Nash, entonces,
para cualquier T finito, el juego repetido G(T) tiene un ~ico resultado perfecto
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3
13 Se ~btienen resUltados anlogos si el juego de etapa G es un jego dinmic con informadn completa. Supongamos que G es un juego dinmico con inJonndn completa y
perfecta de la clase definida en la secdn 21.A. Si G tiene un rjco resultado por inducdn
hada atrs, G(T) tiene un nico resultado perfecto en subjuegos: en cada etapa se juega el
resultado por inducdn hacia atrs de G. Sinillarmente, supongamos que G es un juego en

repef idos / 83

lora al caso de dos periodos, pero consideramos la posi.. vodlvdemqo:::1 J'uego de etapa G tenga mltiples equilibrios :le ..NilSh,
blhda
e
. d
. d
[y C ll1utan 1
3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 ..,
. 1
como
enOJ1Unal
.
de los presos d e l a fi gura 23.. I , pero las estrategias
. 'b .ilS
dIlem; sido aadidas al juego de forma que ahora existen dos eqUlh nos
Di ha
'.
(1 J) como en el dilema de los presos, y
,2
.
"1'
I
N h en estrategIas puras.
de as d
1
' (D D) Natura men te, es artl' f)' cial aadir un eqUllt mo a
a~ora a de~as pr~~os2de esta manera, pero nuestro inters en este juego
dIlema, e os 't'vo que sustan h' va. En la prxima seccin veremos que
es mas exposll
, 'h d
uilibrios
.
tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe
'1'
d etapa que se repiten infinitamente tienen
. "
u'Iti les mc1uso SI os Juegos e
m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq.
.
de etapa artificial en el contexto Sl1nple
. , n analIZamos un Juego
est~::cC1:riodos, y nos preparamos con ello para el anlisis poster~or de
de
p
..'
'co en un contexto con honzonte
un juego de etapa con mteres economl ,
infinito.

1,1 5,0 0,0


0,5 4,4 0,0
0,0 0,0 3,3
Figura 2.3.3

Supongamos que el juego de etapa de la figura 2.3.3 s.ejuega dos veces,


h b' do los J'ugadores observa d o e1 resu lt a d o de la .pnmera etapa antes
a len
.
l
d Demostraremos que existe. un nico resultado
de que empIece a segun a.
. (c c)
erfecto en subjuegos de este juego, en el que el par de estrategIas
1, 2
P
.
l'
etapa
14 Corno en la seccin 2.2.A, supongamos que
se Juega en a pnmera
.
. .
.. 22 A Si G tiene un nico resultado perfecto en
dos etapas de la clase defin~da en Ia.s~cClon ~lt~d'o perfecto en subjuegos: en cada etapa se
subjuegos, entonces G(T) hene un unlCOres
juega .el resultado perfecto en subjuegOdsfide.~. la nodn de resultado perfecto en subjuegos
14E '-' tamente hablando hemos e ni o
S'HC
' '. 'd
l
.. 22 A El dilema de los presos en dos etapas
l
1 1 se de juegos defim a en a seccJOn . . .
.
s o para a e a
da resultado factible del juego de la primera eta pa eXlste
pertenece a esta clase, porque para ca
d
l
gunda etapa Sin embarg0. el
Tb'
d N sh en el juego que que a en a se
.
un nico eqU11 no e ~
. n el . e o de e~apa de la figura 2.3.3 no pertenece a
juego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extender
tIque
el U.ego de etapa ene m.
. 11
es a c ase, por
b'
os de forma que sea apiJea ) e a
formalmente la definicin del resultado perfecto en su Jueg

84 / JUEGOS DlN,vllCOS CON INFORfvIACN COMPLETA (e. 2)

en la primera etapa los jugadores prevn que el resultado de la segunda


etapa ser un equilibrio de Nash del juego de etapa. Puesto que este
Juego de etapa tiene ms de un equi.librio de Nash, ahora es posible que
los Jugadores prevean que a resultados diferentes en la primera etapa
les sIguen equilibrios diferentes del juego de etapa en la segunda etapa.
Supongamos, por ejemplo, que los jugadores prevn que (Dl,Dz) ser el
resultado de la segunda etapa si el de la primera etapa es (Cl,CZ), pero
que (II,1z) ser el resultado de la segunda etapa si el resultado de la
primera etapa es cualquiera de los ocho restantes. La interaccin entre
los jugadores en la primera etapa se concreta entonces en el juego de una
etapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1)
se ha sumado a las otras ocho casillas.

2,2 g,1 1,1

1-:'"

--

1,6

]1 1,1

1,1 1,1

~''!.

Figura 2.3.4
Existen tres equilibrios de Nash con estrategias puras en el juego
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2,
los equilibrios de Nash de este juego de una etapa corresponden a los
resultados perfectos en subjuegos del juego repetido original. Denotemos
con w,x),(y,z)
un resultado del juego repetido: (w,x) en la primera etapa
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4
corresponde al resultado perfecto en subjuegos (1],[Z),(1],[2 del juego
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z)
como consecuencia de cualquier resultado en la primera etapa excepto de
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura
~.3.4 corresponde al resultado perfecto en subjuegos Dl,Dz),(11'!Z
del
Juego repetido. Estos dos resultados perfectos en subjuegos del juego
repehdo simplemente enlazan los resultados de los equilibrios de Nash
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones
mduso mas generales.

Juegos rq;elidos / 85
2.3.4 corresponde al resultado perfecto en subjuegos Cl,Cz),(D],D2)
del
juego repetido, puesto que el resultado previsto en la segunda etapa es
(Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
anteriormente, se puede alcanzar la cooperacin en la primera etapa de
un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
de un resultado ms general: si G = {Al,'"
,An; uI- ... ,un} es un juego
esttico con informacin completa que tiene mltiples equilibrios, pueden
existir resultados perfectos en subjuegos del juego repetido G(T) en los
que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
de Nash de G. Volveremos sobre esta idea en el anlisis de un juego con
horizonte infinito en la prxima seccin.

La conclusin principal que debemos sacar de este ejemplo es que


las amenazas o las promesas crebles sobre el comportamiento futuro
pueden influir en el c~mportamiento presente. Sin emba'rgo, desde otra
perspectiva, puede que quizs el concepto de perfeccin en subjuegos
no utilice una definicin de credibilidad lo suficientemente fuerte. Al
derivar el resultado perfecto en subjuegos C],CZ),(D1,Dz, por ejemplo,
hemos supuesto que Jos'jugadores prevn q~e (DI,Dz) s~r el resultacl,
de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~
(I'!z) ser el resultado en la segunda etapa si eIde la primera ronda es
cualquiera de los ()chorestantes. Pero jugar (11,!2)enli.se~da etapa, con
unas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),
con una ganancia de (3, 3), est tambin dispnible cci~oe'luilibrio de
Nash del juego de etapa que queda. Dicho en trminos poco preciSos.
parecera natural que los jugadores renegocii-an:15.SiJC1,cz) no es'~i
resultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~
(I'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;
pasado est, y que se debe jugar el eqilibriodel juegbdeetapa (Dl,D~)
unnimemente preferido. Pero si (DI,Dz)va
a serelr~sltado de la
segunda etapa independientemente de cul sea el rescltadoenla primera
ronda, el incentivo para jugar (Cl,Cz) en ia prir~~et~p.a_desaparece: la
interaccin entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duce
al juego
de una etapa en el que la gnancia (3, 3Yse'ha~st1adacada casilla del
juego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta a
Cj del jugador i.
' '. . ."._..
'.
','

15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadn (o incluso


negodadn) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debera aadirse a
la descripdn y anlisis del jue;m.'Aqu spimemos que no es as, de forma que lo que
entendemos por "renegodar" no-esotra cosa que un ejerddo de introspeccin.

Juegos repetidos / 87

86 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e 2)

JI 1,1 5,0 0,0 0,0 0,0

Cl 0,5 4,4 0,0 0,0 0,0


DI 0,0 0,0 3,3 0,0 0,0
/:;~

PI 0,0 0,0 0,0 4,! 0,0


Ql

0,0 0,0 0,0 0,0 !,4


Figura 2.3.5

Para acercamos a la solucin de este problema de renegociacin,-con~


sideremos el juego de la figura 2.3.5, que es an ms artificial qu l j\.tego
de la figura 2.3.3. Una vez ms, huestro inters en este juego' ~s ms
expositivo que econmico. Las lciJ~squstamosdesarrollnd pi~-tTa:
tar l tema de la renegociacin en est juego artificial se pueden aplicar
tambin a la renegociacin en juegos infinitamente repetidos; vase Fairell
y Maskin (1989),por ejemplo.
"
Eneste juego de etapa se aaden las estrategi~s Pi y Qia1juego de
etapa de la figUra 2.:5.3.Existen cuatro equilibrios de Nash con estrategias
purasdeljuego de etapa: (IJ,h)' (Dr,1J2) Y ahora tambin (Pl,P2) y (Ql,Q2)'
Como antes, los)ugadores prefieren unnimemente\D1,D2) a (h,h). Ms
importante an, no hay ningn equilibrio de Nash (x,y) en llfigUra 2.3.5
t~l que los jugadores prefieran unnimemente (x,y) a (Pl,P2); (Q1;Q2) o
(Dl;D2). Decimos entonces que (Dl,D2) domina en el sentidO de Peto' a
(IJ,h), y que (P1,P2),(Ql,Q2) y (Dl,D2) estn en a fronterade Paretode las
ganancias de los equilibrios de Nash del juego de etapa de la figtira2.3.5.
Supongamos que el juego de etapa de la figura 2.3.5 se'juega dos
veces, habiendo los jugadores observado el resultado de la prirnfa\511da
antes de
empiece la segunda. Supongamos adicion~J~erit~gue los
jugadores prevn' que el resultado de la segundatapa ser el sigUi~nte:
(DJ,D2) si el resultado dela primera etapa es (Cl,C2); (PI ,P2) sieiis'U1tad
de la primera etpa es (Cj,w), donde 1JJ puede ser cualquierco~amE:los
C2; (Ql,Q2) si el resultado de la primera etapa eS (x,C2), donde x puede ser
cualquier cosa menos Cl y (DJ,D2) si el resultado de la primera etapa es
(y,z), donde y puede ser cualquier cosa menos
y zpuedes~;, ctialquier
cosa menos C2. Entonces Cl,C2),(Dl,D2 es un result<l:dpeasto'en
subjuegosdeljuego repetido porque cada jugador obtiene 4+3l jugare;

que

el

seguido de Di peros~lo 5 +1/~ a.ljugar Ji en :a primera ~tapa (e i.ncluso


menos con otras deCISIOnes).Mas Importante aun, el problema del eJemplo
, terior no aparece aqu. En el juego repetido en dos etapas basado en la
an
figura 2.3.3, la nica forma de castigar a un jugador por desviarse en la
, primera etapa era jugar ~n equilibrio .~ominado en :1 sentido de Par,eto
en la segunda etapa, cashgandotamblen con ello al Jugador que casllga,
Aqu, en cambio, existen tres equilibrios en la frontera de Pareto -uno
para recompensar el buen comportamiento de ambos jugadores en la
primera etapa y los otros dos para ser utilizados no slo para castigar al
~Ti;;~):Jugador que se desva en la primera etapa, sino tambin para recom pensar
'."'2E::.aiillgdor que castiga. Por tanto, si se requiere una penalizacin en la
Y';~">Segunda ronda, no existe otro equilibrio del juego de etapa preferido por
!-F ' ., .eljugador que castiga, de forma que no se puede persuadir al jugador que
castiga de que renegocie la penalizacin.
2.3.B Teora:Juegos

repetidos

infinitamente

Pasamos ahora a los juegos repetidos' infinitamente. Como en el caso


de un horizonte finito, el tema principal es el de que las amenazas o las
promesas, crebles sobre el comportamiento futuro pueden influir en el
comportamieritopresente\ En el caso de un horizonte finito vimos que si
existen equilibrios de Nash mltiples del juego de etapa G, pueden existir
resultados perfedos en subjuegos del juego repetido G(T) en los que, para
,rualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G.
~ Untesultado ms poderoso se da en los juegos repetidos infinitamente:
intruso si el juego de etapa tiene un nico equilibrio de Nash, pueden
','e3dstir muchos resultados perfectos en subjuegos en los que ning'uno de
los resultados en cada etapa sea un equilibrio de Nash de G,
_ Empezamos con el estudio del dilem de los presos repetido in rinitamente. Consideramos a continuacin la clase de juegos repetidos infini, tamente anloga a la clase de juegos repetidos finita mente definida en la
o" :,'sccin anterior:' un juego esttico con informacin completa, G, se repi te
t:r;~LIfullutamente, habiendo los jugadores observado 10s'resultados de todas
,
las rondas anteriores antes de que empiece la etapa siguiente. Para esta
. "cIase de juegos repetidos finita e infinitamente, definimos los conceptos
de estrategia de un jugador, de subjuego y de equilibrio d Nash perfecto
el).,"sbjuegos.(En la seccin 2.4.B definimos estos conceptos para juegos
, dinmicos con informacin completa en general, no slo para esta clase
de juegos repetidos.) Utilizamos despus estas definiciones para enuncia r
.;

(
''-.(,

~
..

1'.

~,

~8 / JUEGOS DINMICOS CON INFORMACIN

]egos repetidos /89

COMPLETA (c. 2)

y demostrar el teorema de Friedman (1971) (tambin llamado teorema de

tradicin oral o teorema folk).I6

Jugador 2

D2

el valor presente de las ganancias, es decir, la ganancia total que podra


ingresarse en un banco ahora de forma que produjera el mismo saldo al
final de la sucesin.
Definicin. Dado un factor de descuento 5, el valor presente
infinita de pagos 7f,7f2,7f3,'
.. es

1,1 5,0
0,5 4,4

Figura 2.3.6

Supongamos que el dilema de los presos de la figura 2.3.6 se repite


infinitamente y que, para cada t, los resultados de las t - 1 jugadas anteriores del juego de etapa se han observado antes de que la t-sima etapa
empiece. Sumar simplemente las ganancias de esta sucesin infinita de
juegos de etapa no proporciona una medida til de la ganancia de un
jugador en el juego repetido infinitamente. Recibir una ganancia de 4 en
cada periodo es mejor que recibir una ganancia de 1 en cada periodo, por
ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recordemos (en el modelo de negociacin de Rubinstein <;lela seccin 2.1.D)
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de inters
por periodo. Dados un factor de descuento y las ganancias de un jugador
obtenidos de una sucesin infinita de juegos de etapa, podemos calcular

16 El teorema de tradicin oral original se referia a las ganancias en todos los equilibrios
de Nash de un,juego repetido infinitamente. A este resultado se le llam teorema de tradicin
oral por ser ampliamente conocido entre los tericos de juegos de os "aos cincuenia, aun
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgnancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y,
por tanto, refuerza el teorema de tradicin oral original al utilizar un criterio de solucin ms
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo,
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradicin oral, aun cuando' no hayan sido ampliamente
conocidos entre los tericos de juegos antes de ser publicados.

de la sucesin

00

7fi+ 57f2+ 527f3+ ...

Jugador 1

.'

L 5 l7f
t

t.

t=I

Tambin podemos utilizar 5 para reinterpretar lo que l~amamos un


juego repetido infinitamente como un juego repetido que se acaba despus
de un nmero aleatorio de repeticiones. Supongamos que al finalizar cada
etapa se lanza una moneda (trucada) para determinar si el juego se acaba
~ no. Si la probabilidad de que el juego se acabe inmediatamente es p y,
por tanto, 1 - p es la probabilidad de que el juego continue al menos una
etapa ms, una ganancia de,7f a recibir en la siguiente etapa (si se juega)
tiene un valor de slo O-p)7f /0 +1')antes de efectuar el lanzamiento del~
moneda correspondiente a esta etapa. Del mismo modo, una gan~cia de
7fa recibir dentro en dos etapas (si ambas etapas se juegan) tiene un:valor
de slo 0- p)27f/0 + 1')2antes de efectuar el lanzamiento de la moneda
correspondiente a esta etapa. Sea 5 = O - p)/O + 1'). Entonces el valor
presente 7f1+ 57f2+ 527f3+ ... refleja tanto el valor temporal del dinero como
la posibilidad de que el juego se acabe.
Consideremos el dilema de los presos repetido infinitalIlente en elque
el factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugador
en el juego repetido es el valor presente de las ganan.ciasdel jugad()f,ep
los juegos de etapa. Demostraremos que la cooperacin, es decir,(D1,D2),
puede ocurrir en cada etapa de un resultado perfecto en subjuegos del
juego repetido infinitamente, aun cuando el nico equilibrio de Nash
del juego de etapa es la no cooperacin, es decir, (1},h) El argumerlto
es del mismo estilo que nuestro anlisis del juego repetido en dos etapas
basado en la figura 2.3.3 (el juego de etapa en el que aadimos un segundo
equilibrio de Nash al dilem,! de los presos): si los jugadores cooperan
hoy entonces juegan un equilibrio con ganancias altas maana; en caso
contrario juegan un equilibrio Con ganancias bajas maana. La diferencia
entre el juego repetido en dos etapas y el juego repetido infinitamente es
que aqu el equilibrio con ganancils ltasquepodra jugarse maana no
se ha aadido artificialmente, sirlOque representa continuar cooperando
a partir de maana y en lo Sucesivo.

c..
';-',

"'~'-

,,",

'.'

Juegos repetidos ! 91

90 I JUEGOS D'\JMICOS CON INFORMACIN COMPLETA (c. 2)

Supongamos que el jugadori empieza el juego repetido infinitamente


cooperando y sigue cooperando en cada juego de etapa siguiente si y slo
si ambos jugadores han cooperado en cada ronda previa. Formalmente,
.Ia estrategia, del jugador i es:

ue el jugador j recibe por realizar esta eleccin de forma ptima (ahora


q cada vez que aparezca). Si jugar Dj es ptimo entonces
y
,
V=4+l/,

o V = 4/(1- ), ya que jugar Dj conduce a la misma decisin en la sig"uiente


Jugar Di en la primera etapa. En la t-sima etapa, si
el resultado de todas las t - 1 etapas anteriores ha sido
(Dl,D2) entonces jugar Di; en caso contrario, jugar h

etapa. Si jugar Ij es ptimo entonces


.

Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel
disparador(trigger strategy);.
'llamadaas p'orque el jugad~i coopera hastaquealguieridefa de Cooperar,
lo qu~Aesencadena' la;dcisln'de. rtovivi '~'.'cooperair.Utlcaffis: Si
ambos jugadores adoptnla, estrat~gia derdlsparador, el resUltado d~l"
juegorepeti~o inffuitamertte ser (Dl,D~)enCdaetapa.' Yerembs pnmeio
que si o est' lo suficientemente Cerca de uno, el hecho de que los dos
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
juegorepetid infinitamente. Veremos a contiriu~cin que este equilibrio
de Nash es'perfecto en subjuegos, en un sentido que se precisar ms
adelante.
Para demostrar que la adopcin de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido
infinitamente, supondremos que el jugador i ha adoptado la estrategia
del disparador ydemostraremos a'continuacin, siempre que o est lo
suficientemente cerca de uno, que adoptar esta estrategia es tambin la
mejor respuesta del jugador j. Dado que el jugador i jugar I para
siempreeuand el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionara
una ganancia de 5 en esta etapa, pero desencadenara la riocooperacin
del jugador"i (y, por tanto, tambin del jugador j) enio sucesivo, de forma
que la ganancia en cada etapa futUra sera 1: Comd'1++2+:. /=1/(1-0),
el valor presente de esta:sucesin de ganancias es
5 + 0.1 +

.::

..,'

_.

o'

coma obtuvimos antes. Por tanto, jugar Dj es ptimo si y slo si


4
1_ o

5 + 1 _ '

(2.3.1)

o ~ 1/4. Por tanto, en la primera etapa, y en cualquier ronda tal que


todos los resultados anteriores hayan sidoCDl,D2), la decisin ptima del
jugador j (dado que el jugador i ha adoptado lestrategia del disparador)
es Dj si y slo si ~ 1/4. Combinando esta observacin con el hecho
de que la m~jor respuesta de j es jugar siempre Ij cuando el resultado
de alguna etapa difiera de (Dl,D2), tenemos que el que los dos jugadores
jueguen la estrategia del disparador es un equilibrio de Nash si y slo si
1/4.
Vamos a ver ahora que este equilibrio de Nash es perfecto en sub.juegos. Para hacerlo, definimos el concepto de estrategia en un juego
repetido, de subjuego en un juego repetido y de equilibrio de Nash perfecto en subjuegos en un juego repetido. Para ilustrar estos conceptos
con ejemplos sencillos de las secciones anteriores, los definiremos para
juegos repetidos tanto finita como infinitamente. En la seccin anterior
definimos el juego repetido finitamente G(T) basado en un juego de etapa
G = {Al,'"
,An; 'ul,' .. ,un), un juego esttico con informain completa
en el que los jugadores 1 a n eligen simultneamente las acciones al a (1."
de los espacios de acciones Al a An respectivamente, y las ganancias son
Ul (al, ... ,an) a Un (al, ... ,O'n)' Definimos ahora el juego anlogo repetido
infinitamente.17
~

Definicin. Dado un juego de etapa G, denominamos G(co,o) al juego repetido


.infinitamente en el que G se repite por siempre y los jugadores tienen el mismo

.0

.1 + ... = 5 + -"-.

1-0
17 Naturalmente se puede definir tambin un juego repetido basado en un juego de etapa
dihInico, En esta seccin limitamos nuestra atencin a juegos de etapa estticos para poder
presentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y
2.3.E son juegos repetidos basados en juegos de etapa dinmicos.

Alternativamente, jugarD j proporcionara una gananCiade 4 enit'etapa


y conducira a exactamente lafuis~a eleccirtentre Ijy Dj en lasigtiiente
etapa. Llamemos V al val,or ptesert!e de la sucesin infinIta degahnia's
.

V =5+ 1_

. _

'.

"'.~

~,.~-

;.0

<

,"

92 I JUEGOS DfNMICOS CON INFORMACiN COMPLETA (e. 2)

Juegos repetidos I 93

clor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
jllego de etapa son conocidos antes de que empiece la t-sima etapa. La ganancia
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesin infinita de juegos de etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
plan completo de accin, es decir, especifica una accin factible del jugador
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
forma algo ms frvola, si un j~ga_dordejara una estrateg!a a su abogado
anles de que el juego empezase, el abogado podra sustituir al jugador
en el juego, sin necesitar en ningn caso de instrucciones adicionales
sobre cmo jugar. En un juego esttico con informacin completa, por
ejemplo, una estrategia es simplemente una accin. (Por esto describimos
lal juego como G = {S,,,,,Sn;'U,
... ,un} en el capitulo t pero aqu
pu:de describirse tambin como G = {A], ... ,An; U, '" ,un}: en un juego
estallco con informacin 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinmico, una estrategia es ms complicada.
Consideremos el dilema de los presos en dos etapas analizado en la
seccin anterior. Cada jugador acruados veces, de forma que podra
pensarse que una estrategia es simplemente un par d irIstrucciones (b,c),
donde b es la decisin en la primera etapa y e es la decisin en la segunda
elapa. Pero existen cuatro resultados posibles de la pr11leraetapa, (1,1z),
U,Dz),(D1,1 y (D,D, que representan cuatro contingencias diferentes
en las que al jugador l~ podra corresponder actuar. Por tanto, la estrategia
de cada jugador consta de cinco instrucciones, que indicamos mediante
(VW,x,y,z), donde v es la decisin en la primera etapa y w,x,y y zson''!as
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (DJz) y
(D,Dz) respectivamente. Usando esta notacin, las instrucciones "jugar b
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
se describen como (b,c,c,c,c), pero esta notacin tambin puede expresar
estrategias en las que la decisin de la segunda etapa es contingente del
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
de cada Jugador consta de diez instrucciones, una decisin en la primera
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
resultado posible de la primera etapa. Recordemos que al analizar el

juego repetido en dos etapas consideramos una estrategia en la que la


decisin del jugador . en la segunda etapa era contingente del resultado
de la primera etapa: jugar Ci en la primera etapa y jugar li en la segunda
a menos que el resultado de la primera sea (C,Cz), en cuyo caso jugar Di
en la segunda etapa.
En el juego repetido finitamente G(T) o en el repetido infinitamente
G(co/i), la historia de! juego hasta la etapa t es el registro de las decisiones
de los jugadores desde la etapa 1 hasta la t. Los jugadores podran haber escogido (un, ... ,un) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y
(Uu ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapa
s la accin Uis pertenece al espacio de acciones Ai.
Definicin. En e! juego repetido finitamente G(T) o en el juego' repetido infinitamente G(co,8), la estrategia de un jugador determina la accin que el jugador
realizar en cada etapa para cada posible historia de/juego hasta la etapa anterior.
Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,
la parte que queda por jugar empezando en cualquier momento en el que
la historia completa del juego hasta entonces sea informacin deI'doIro
pblico entre los jugadores. (Ms adelante en esta seccin damos una
definicin precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(i
seccin 2.4.B damos una definicin precisa para juegos dinmicos con informacin completa en general.) En el dilema de los presos en dos etapas,
por ejemplo, hay cuatro subjuegos que corresponden a los juegos de la
segunda etapa que siguen a los cuatro resultados posibles de la primera
etapa. Del mismo modo, en el juego repetido en dos etapas basado en
la figura 2.3.3, hay nueve subjuegos que corresponden a los nueve resultados posibles en el juego de la primera etapa. En el juego repetido
finita mente G(T) yen el juego repetido infinitamente G(co,8)la definicin
de estrategia est ntimamente ligada a la definicin de subjuego: la estrategia de un jugador determina las acciones que el jugador realizar en
la primera etapa del juego repetido y enla primera etapa de cada uno de
sus subjuegos.
Definicin. En e/juego repetido finitamente G(T), un sllbjllego que empieza en
la etapa t + 1 es e! juego repetido en e! que G se juega T - t veces y que designamos
por G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t + 1, uno para
cada una de las posibles historias de! juego hasta la etapa t. En e! juego repetido
infinitamente G(co,8), cada subjuegoque
empieza en la etapa t + 1 es idntico

liegos "e'e/idos

94 / JUEGOS DINMICOS CON INFOI~MAClN COMPLETA (e. 2)

al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del
juego hasta la etapa t.
Obsrvese que la t-sima etapa de un juego repetido no es por s misma
un subjuego del juego repetido (suponiendo que t < T en el caso finito).
Un subjuego es una parte del juego original que no slo empieza en un
momento en que la historia del juego hasta entonces es informacin del
domino pblico entre todos los jugadores, sino que tambin incluye todas
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-sima etapa aisladamente sera equivaierit~a considerar la t-sima etapa
corno la etapa final del juego repetido .. Tal anlisis podra llevarse a cabo
pero no sera relevante para el juego repetido original.
Estamos ahora preparados para la definicin de equilibrio de Nash
perfecto en subjuegos, la cual depende a su vez de la definicin de equilibrio de Nash. Esta ltima no 11acambiado desde el captulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinmico: en cualquier juego, un equilibrio de Nash es una coleccin de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los dems jugadores.
Definicin. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego.
'
,
,

qs

Si el jugador adopta la estrategi~ del disparador p~ra el juego


entonces (i) las estrategias del Jugador en un subluego de la
comp leto ,
1
. era clase son de nuevo la estrategia del disparador, que ya 1e11l0S
nm
Pd strado que es un equilibrio de Nash del juego completo, y (H) la,s
emo
.
1
t
estrategias del jugador en un juego de la segunda clase son slmp eme:1.e
repetir en lo sucesivo el equilibrio del juego de etapa (1,1z), que e: ~a,~blen
un equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. de
Nash en las estrategias del disparador del dilema de los presos repetido

(Dl,Dz).

infinitamente es perfecto en subjuegos.


Ganancia al jugador 2

(0,5)

(5,0)

Ganancia al
jugador 1

Figura 2.3.7

'

El equilibrio de Nash perfecto en subjuegos es un refinamiento del


equilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategias
de los jugadores deben ser primero un equilibrio de Nash y pasar luego
una prueba adicionaL
Para demostrar que el equilibrio de Nash en las estrategias del disparador deLdilema de los presos repetido infinitamente es perfecto en
subjuegos, debernos demostra'r que las estrategias del disparador constituyen un equilibrio de Nash en cada subjuego de este juego repetido
infinitamente. Recordemos que cada subjuego de un juego repetido infinitamente es idntico al juego completo. En el equilibrio de Nash en las
estrategias del disparador del dilema de los presos repetido infinitamente,
estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los que
todos los resultados de las etapas anteriores han sido (D,D2), y (ii) subjuegos en los que el resultado de al menos una etapa anterior difiere de

Aplicamos seguidamente argumentos anlogos al juego repet.do infi'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
(1971) para juegos repetidos infinitamente. Para enunciar' el teorema, necesitarnos dos ltimas definiciones. Primero, llamamos factIbles a las ga. (Xl,"" x n ) en ell'uego de etapa G si son una combinacin
convexa
nanCIas
.
(es decir, una media ponderada donde las ponderaciones son no-negativas
y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
regin sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
(1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
, ) para 1 < .,x < 4 que resultan de las medias ponderadas de (1,
pares (X,X
1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
de) la regin sombreada de la figura 2.3.7 son medIas ponderadas de las

96 / JUEGOS DfNMICOS CON INFORMACIN COMPLETA (e. 2)

Juegos repetidos / 97

ganancias de ms de dos estrategias puras. Para conseguir una media


ponderada de las ganancias de estrategias puras, los jugadores podran
ulilizar un mecanismo aleatorio pblico: jugando U],D2) o (D],h) dependiendo del lanzamiento de una moneda (no trucada), por ejemplo,
consiguen ganancias esperadas de (2,5,2,5).
La segunda definicin que necesitamos para poder enunciar el teorema de Friedman es un reajuste de las ganancias a los jugadores: Continuamos definiendo las ganancias de cada jugador en el juego repetido
infinitamente G(oo,ti) como el valor presente de la sucesin infinita de
ganancias del jugador en el juego de etapa, pero es ms conveniente expresar este v.alor en trminos de la ganancia media de la'misma sucesin
infinita de juegos de etapa, la ganancia que se tendra que recibir en cada
etapa de forma que resultara en el mismo valor presente. Sea 8 el factor de
descuento. Supongamos que la sucesin infinita de ganancias 7f'1f2,1f3, ...
tiene un valor presente de V. Si se recibiese una ganancia 7f en cada etapa,
el valor presente sera 1fjO - 8). Para que, 1f sea la ganancia media de
la sucesin infinita 7f1,1f2,7f3, ... con un factor de descuento 8, estos dos
valores presentes han de ser iguales, por tanto 1f = VO - 8). Es decir, la
ganancia media es O - 8) veces elv~lOr presente:
Definicin. Dado el factor de descuento 8, la ganancia
infinita de ganancias 1f],1f2,1f3,' .. es

media de la sucesin

00

O -

8)

8t-]7ft._

t=1

La ventaja de la ganancia media con respecto del valor presente es que


el primero es directamente comparable con las ganancias del juego de
etapa. En el dilema de los presos de la figura 2.3.6, por ejemplo, ambos
jugadores podran recibir una ganancia de 4 en cada periodo. Tal sucesin
infinita 0e ganancias tiene una ganancia media de 4 pero un valor presente
de .4/0 - 8). Sin embargo, como la ganancia media no esms que un
reajuste del valor presente, maximizar la ganancia media es equivalente a
maximizar el valor presente.
Estamos finalmente preparados para enunciar el resultado principal
en nuestra discusin sobre juegos repetidos infinitamente.
leorema. (Friedman 1971): Sea G un juego finito, esttic~y con informacin
completa. Denominemos (e], ... ,en) a las ganancias en un equilibrio de Nash de
G, y (x 1, ... ,xn) a otras ganancias factibles cualesquiera de G. Si Xi > ei para

cada jugador ' y si (j est lo suficientemente cerca de uno, existe UI1 equilibrio de
Nash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza
(X], ... ,xn) como ganancia media.
'
Pago al jugador 2

(0,5)

(.

(5,0)

Ganancia-al
jugador 1

Figura 2.3.8
La demostracin de este teorema repite los argumentos ya dados para
el dilema de los presos repetido infinitamente, de forma que la relegamos
al apndice, Es conceptualmente inmediato pero algo complicado de notacin extender el teorema a los juegos de etapa de buen comportamiento
que'~~ ~~~ni,finitosni ~iticos (veremos algunos ejemplos ~n las apli7
caciones d las tres prximas secciones). En el contexto del dilema de
lo~p~sos de la fisuril 2.3.6.- el teorema de Friedman garantiza que puede
alcanzarse cualquier punto en la regin ms oscura de la figura 2.3.8como
ganancia media en Un equilibrio de Nash perfecto en subjuegos del juego
rep~tido, siempre y cuando el factor de descuento est lo suficientemente
cerca de uno.
, Concluimos esta seccin esbozando dos derivaciones adicionales de la
teora de juegos repetidos infinitamente, que se complican al aadrseles
la siguiente caracterstica especial del dilema de los presos. En el dilema
de los presos (de una etapa) de la figura 2.3.6, el jugador i puede estar
seguro de recibir,como mnimo la ganancia de 1 del equilibrio de Nash,
jugando 1;. En un juego de duopolio de Cournot de una etapa (como
el descrito en la seccin 1.2.A), por el contrario, una empresa no puede
estar segura de obtener los beneficios del equilibrio de Nash produciendo

,, .:.

<,'

, .~t~;

'b:

~t::
98 I

JUEGOS DlNMIICOS

CON INFORMACIN

la cantidad del equilibrio de Nash; ms bien, el nico beneficio que una


empresa puede estar segura de recibir es cero, produciendo cero, Dado
un juego de etapa arbitario G, denotamos con Ti la ganancia de reserva del
jugador ' -la ganancia ms alta que el jugador ' puede estar seguro de
recibir, hagan lo que hagan el resto de los jugadores, Debe ser el caso que
Ti :::; ei (donde e es la ganancia del jugador ' en el equilibrio de Nash
utilizado en el teorema de Friedman), ya que si Ti fuera mayor que e no
sera la mejor respuesta del jugador ' jugar su estrategia dl:iJ equilibrio de
Nash, En el dilema de los presos, Ti = ei, pero en el juego del duopolio de
Co1irnot (y tpicamente), Ti < ei. "
'-"")': .
Fudenberg yMaskin (1986) demuestt~Il,qyeenjuegos con dos Jugado~
res, las ganancias de reserva (Tl,T2)'pi.led~~rerripla'zaia las gananCias de
equilibrio (q,'en el enunciado del teterna.deFriedman.
Es decir, si
(Xl,X2)
es una ganancia factible deO, C011Xi' > Ti para cada ', para 5 lo
suficIentemente cerca de uno, existe un equilibrio de Nash perfecto en
subjuegos de 0(00,5) que al~ania (Xl,X2) como ganancia media, incluso si
Xi < ei para alguno de los jugadores, En juegos con ms de dos jugadores,
Fudenberg y Maskin ofrecen una condicin dbil bajo la cual las ganancias
de reserva (TI," "Tn) pueden reemplazar a I",sganancias de equilibrio en
el enunciado del teorema.

,',
... ,-,'
. "
'

Juegos

COMPLETA (e. 2)

Tambin tiene inters la siguiente pregunta complementaria: qu


ganancias medias pueden alcanzarsetoh un equilibrio de Nash perfecto
en subjuegos cuando el factor de descunto no est 10 "suficientemente
cerca de Uno"? Una manera de abordar esta cuestin es considerar un
valor fijode5 y determinar las gnaitcis medias que pueden alcanzarse
si los jugadores usan las estrategias del dsparador qu se desplazan para
siempre al equilibrio'de Nashdel juego de'etapa despuS de cualquier
desviacin. Valores menores de 5 hacen queuna penalizacin que empiece
en el prximo periodo sea menos efectiva para evitar una desviacin en
este periodo ..'No obstante;ls jugadores pueden tlpicamernte hacer algo
mejor que simplemente jugar un equilibrio de Nash del juego de etapa.
Un segundo enfoque, iniciado por Abreu (1988), se basa en la idea de
que la forma ms: efectiva de evitar que jm jugador- se desVe de una
estrategia propuesta es amenazarlo con administrar la penalizacin creble
ms dura en el caso que se desVe (es decir, amenazar con responder a
una desviacin jugando el equilIbrio de Nash perfecto en subjuegos del
juego repetido infinitamente que proporciona la ganancia menor entre
todos esos equilibrios al jugador que se desva). En la mayora de juegos,
desplazarse para siempre al equilibrio de Nsh del juego de etapa no es

I'qJef

idos I 99

, 'o'n creble ms fuerte' por tanto, utilizando el enfoque de


la pena 1IzaCI
' ",
'.,
a!1Zarse ganancias medIas que no podnan alcanzill se
Abreu pue den alc
'
,
'l'
do el enfoque de la estrategia del disparador. En el ddema de
utl Izan
"
,
.
. os SI'n embargo el equilibrio de Nash del Juego de etapa genera
los pies ,
'
cias de reserva (esto es, ei = T;) tales que los dos enfoques son
unas g anan
, ,
equivalentes, En la prxima seccin damos ejemplos de los dos enfoques.
Apndice
ste
apndice demostramos el teorema de Friedman, Sea (ael,'"
,o'e,,)
Ene
d
'l'b'
el equilibrio de Nash de G que proporciona las ganancias e equJ 1 no
(el,-'"' e)TI. Del mismo modo, sea (0.",1,' .. ,0,,,,,,) la coleccin de acciones
que proporciona las ganancias factibles,(xl, ... ,xn), ,(La:U~a ~o.tacin es
slo indicativa porque ignora el mecamsmo aleatono publIco l1plCamente
necesario para alcanzar cualquier ganancia factible.) Consideremos la
siguiente estrategia del disparador en el caso del jugador ':
Jugar axi en la primera etapa. En la t-sima etapa, si
el resultado de todas las t - 1 etapas anteriores ha sido
(O.xl" .. ,0.",,,) jugar an; en caso contrario jugar o.ei'
Si ambos jugadores adoptan esta estrategia, el resultado en cada etar,J1
del
juego repetido infinitamente ser (0,,,,1,' .. ,0,,,,,,). Argu~1entaJllOs pnmero
que si ti est lo suficientemente cerca de uno, el que lo~Jugadores ~d()pten
esta estrategia constituye un equilibrio de Nash del Jueg~ re~eltdo, Argumentamos a continuacin que esta estrategia es un equillbno de Nash
perfecto en subjuegos.
,
'
Supongamos que todos los jugadores excepto el J~g~dor ,han, adoptado la estrategia del disparador. Dado que los demas Jugaran Stempl.e
(o.el,'" ,o.e i-l,ae i+l, ... ,aen) siempre si el resultado de alguna etapa dIfiere de (a~l,' .. ,~xn), la mejor respuesta del jugador ' esjugar siempre (J'e;
si el resultado en alguna ronda difiere de (a"l,' .. ,o.xn)' Queda por determinar la mejor respuesta del jugador ' en la primera ronda yen cualquier
etapa en la que todos los resultados anteriores hayan sido (a",l, . ' . ,().",,,),
Sea adi la mejor desviacin de (0.",1, ... ,0.",") que puede adoptar el jugador
'.

Esto es,

adi

es una solucin de
max lLi(o.xl, - -'

,o,x,i_l,ai,o..T:i+l,'"

,o.xn).

a,EA,

Sea

di

la ganancia a -i con esta desviacin:

di = v,;(axl,'

, . ,o,,,,,i-l ,0.di,0'x,;+1

100/

JUECOS DINMICOS CON INFORMACIN

COMPLETA (e. 2)

Juegos repetidos / 101

(Ignoramos de nuevo el papel del'


.
. . 'i - . "
mecamsmo aleatorlO'la meJOIl eSVlaClOny su
",
~
.
ganancIa puellen depender de que' estr t .
hay
l .
d
a egIa pura
a se eCClOna el mecanismo aleatorio)
.,...
"/L(a.
a.
.
lenemos que di ?: x.; =
.. , el",.,.,).

.eL ... , x '-1


I

a XlI. a X'l+
. 1I

...

a)xn

>

e,

Ui

((le]"

...

,aen).

Jugar adi proporcionar una ganancia de di en esta etapa pe d


cadena (ael,' .. ,a.
a.
.
ro esen.
e,,-I, e,-.+L ... ,ae.,.,)en lo sucesIvo por parte de los d
'
Jugadores, ante lo cual la mejor respuesta del J' d'
emas
l'
uga or z es ae;, de forma
que a,gadnanClaen. cada etapa futura ser e'i. El valor presente de esta
SuceSlOn e gananCIas es

(dado que los dems jugadores han adoptado la estrategia del disparador)
es axi si y slo si { ?: (di - xi)/(di - ei).
Combinando esta observacin con el hecho de que la mejor respuesta
de 'i es jugar aei para siempre si el resultado de alguna etapa difiere de
(axIJ' .. ,axn), conc'uimos que jugar la estrategia del disparador por parte
de todos los jugadores es un equilibrio de Nash si y slo si
,
u

?: max
1

d".,+ u . e.,' + u,2 . e. +

'

= d., + 1 _o oei.

'"

(Dad~ ~ue cualquier desviacin desencadena la mismarespuest. d 1


demas Jugad
1"
d
. '.'
,
a e os
.
ores, a umca esviacin que necesitamos considerar es la '
ventaJosa) Alt
ti
.'
mas
"
.
ema vamente, Jugar axi proporcionar una ganancia de x.
en esta et~pa y conducir a exactamente la misma eleccin entre a.
a'
sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~
(e Juego de etapa que el Jugador i recibe por elegir ptimament (h
Ycada vez
t
.
e a ora
que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti'
entonces
" X>
P mo,

,~I:/~

o V,-,- x

,/0

,) S"1Jugar
u.

adi

Vi = Xi + oVi,
es. ptimo, entonces

Vi

= di

+ --e.
1-0'"

como obtuvimos p'


(
.
rio no est co 1 ~eVl~ment~. Supongamos que el mecanismo aleato'
. rre aClOna o senalmente. Es suficiente entonces que d. sea
la ganancIa mayor a la
. d
. ., d
'
.
'.
. meJor. eSVlaClOn el jugador i entre las difere _
:~:a~:~:;n~clOnes de es~at~gias puras seleccionadas por el mecanismno
. n consecuencIa, Jugar axi es ptimo si y slo si
{

Xi

-->d+-1 - { - " 1 _

o e,,,.

o>

d; -

Xi

di -

ei'

Por tanto, en la pri..


'
.
.
.
m.ra etapa, y en cualqwer etapa tal que todos los resultal:los antenores hayan 'd (
'"
, .
.
SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i

d,; - Xi
-d--'
i - ei

Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,
de foim que eI~valormximo de esta fraccin para cualquier jugador sea
tambin estrictamente menor que 1.
Queda por demostrar que este equilibrio de Nash es perfecto en subjuegos. Es deCir,'que las estrategias del disparador deben constituir un
equilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cada
subjuegode 0(00,0) idntico al propio G(oo,o). En el equilibrio de Nash
con estrategias del disparador estos subjuegos pueden agruparse en dos
clases: (i) subjuegos en los que los resultados de las etapas anteriores han
sido (axl, .. -: ;a~n), y (ji) subjuegos'en los
el resultado de al menoS.ri{
etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'del
disparador en el juego completo, (i) las estrategias'd los jugadores riun'
subjuego de la primera etapa son de nuevo las estrategias del disparador
que, tal como acabamos de demostrar, constituyen un equilibrio de Nash
del juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle .
la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiieg
de etapa (ael,' .. ,aen), lo que tambin es un equilibrio de Nash d~l jrieg;;~"
completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Parador
del juego repetido infinitamente es perfecto en subjuegOs.

es

qu

':,.,

....... '

':.."

2.3.C Colusin entre duopolistas de Coumot


Friedman (971) fue el primero en demostrar que podria alcanzarse la
cooperacin en un juego repetido infinitamente utilizando estrategias que
consistieran en elegir para siempre el equilibrio de Nash del juego de etapa
despus de cualquier desviacin. Originalinente se aplic a los casos de
colusin en un oligopolio de Cmimot, del siguiente modo:
Recordemos el juego deCoumot esttico de la seccin 1.2.A: Si la
cantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,
suponiendo que Q < a. Cada empresa tiene un,coste marginal e y no tiene

--------

102 / JUEGOS DINMICOS CON INFORMACIN

COMPLETA (c. 2)

Jllegos repel idos / 103

costes fijos. Las empresas escogen sus cantidades simultneamente, En el


nico equilibrio de Nash, cada empresa produce una cantidad (a - c)/3;
a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dado
que en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que la cantidad
de monopolio, qm == (a- c)/2, ambas empresas estaran mejor si cada una
produjera la mitad de la cantidad de monopolio, q = qm/2.

"
",',

Consideremos el juego repetido infinitamente basado en este juego


de etapa de Cournot, cuando las dos empresas tienen el mismo factor de
descuento 6. Calculemos ahora los valores de 6 para los <fue,cuando las
dos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de '
Nash perfecto en subjuegos de este juego repetido infinitamente:
'
Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~n
e! primer periodo. En el t-sim,o perido~producir qm/"Z
SI ambas empresas han producido qm/2 en cada uno d~
los t- 1 periodos anteriores; en caso ntnirio producir,
la cantidad de Cournot, qc.
,
Puesto,qu~ e,!argumento e~ paralelo al dado para eldilem~de los pres;s
de la seccin anterior, seremos breves en la discusin.
'"
El beneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es
c)2/8,.que denotaremos por 1r m/2. ~l beneficio deuna empresa cuando
ambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, si
la empresa i vaa producir qm/2 en este periodo, la cantidad que maximiza
los beneficios de la empresa j en este periodo es uria sohicin de
'
(a -

max
qj

(a -

q'

La solucin es qj = 3(0. - c)/8, con un beneficio de 9(0. - c)2/64, que


denotamo~ mediante 11"d ("d" por desviacin). ' Por tanto, que las dos!
empresas Jueguen la estrategia del disparador expuesta anteriormente es
un equilibrio de N ash siempre que
' ,
116
1- 6 ' 2"11"m

',':.'

:::

7rd

+ 1 _ 6 . 11"c,

Producir q*
producir q*
uno de los
producir la

en el primer periodo. En el t-simo periodo,


si ambas empresas han producido q* en cada
t ~,1 periodos anteriores; en caso contrario,
cantidad de Coumot, k

El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, que


denotaremos mediante 11"*. Si la empresa i va a producir q* en este periodo,
la cantidad que maximiza los beneficios de la empresa j en este periodo
es una solucin de

_.

max (a, -

qj - q* - c)qj.

qj

La solucin es qj = (a. - q* - e)/2, con un beneficio de (a - q* - c)2/4, que


de nuevo denotamos por 11" d. Que las dos empresas jueguen las estrategias
del disparador dadas anteriormente es un eql,tilibriode Nash siempr que

_l,q
~ c)q,
2'
m

Tambin podemos preguntarnos qu pueden conseguir las empresas si


6< 9/17. Exploraremos los dos enfoques descritos en la seccin ante.rior.
Determinamos en primer lugar, para un valor dado de , la cantIdad
ms rentable que las empresas pueden producir si ambas siguen una
~ trategia del disparador que transforman para siempre en la cantidad .de
Cournot despus de cualquier desviacin. Sabemos que estas estrategIas
no pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dad
de monopolio, mientras que para cualquier valor de 6, repetIr la cantIdad
de Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.
Por tanto, la cantidad ms rentable que puede darse con las estrategias del
clispradoresfentre q;,{/2 y qc. Para calcular esta cantidad, consideramos
la estrategia del disparador siguiente:

'(2.3.2)

anloga a (2.3.1)en el anlisis del dilema de los pr~~9S; S~stitu~e~do los


valores de11"m, -rrd y 11"cen (2.3.2)obtenemos que 6::: 9/1'1. Poi-as mi;mas
razones que en la seccin anterior, este equilibrio d~ Nash es perfecto en
subjuegos.
"..,'
' "

1
1-8

--

'11"*

>
-

7rd

8
1-6

+ --'

7rc,

Despejando q* en la ecuacin de segundo grado resultante se obtiene que


el valor menor de q* para el que las estrategias del disparador dadas
ant~riormente son un equilibrio de Nash perfecto en subjuegos es
9 - 56
q* = 3(9 _ ) (a - e),

que decrece montonamente con , tiende a qm/2 cuando tiende a 9/17


y tiende a qc cuando 6 tiende a cero.

10'1.1 JUEGOS DINMICOS CON INFORMACIN

J !legos repetidos /

COMPLETA (c. 2)

105

Exploramos ahora el segundo enfoque, que incluye la amenaza de


hacer efectiva la penalizacin ms fuerte creble. Abreu (1986) aplica esta
Idea a unos modelos de Cournot ms generales que el nuestro, utilizando
un factor de descuento arbitrario; nosotros simplemel1te demostramos
que el enfoque de Abreu permite que en nuestro modelo se obtenga el
resultado de monopolio cuando f = 1/2 (que es menor que 9/17). Consideremos la siguiente estrategia del "palo y la zanahoria"):

perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash en


cada clase de subjuegos. En los subjuegos de colusin, cada empresa
debe preferir recibir la mitad del beneficio de monopolio en lo sucesivo a
recibir 7f d este periodo y el valor presente por penalizacin en el periodo

Producir la mitad de la cantidad de monopolio, qm/2, en


el primer periodo. En el t-simo periodo, producir qm/2
si ambas empresas produjeron qm/2 en el periodo t - 1,
qm/2 si ambas empresas produjeron x en el periodo t - 1,
Y x en cualquier otro caso.

En los subjuegos de penalizacin, cada empresa debe preferir administrar


el castigo a recibir 71" dp este periodo y empezar de nuevo la penalizacin
en el siguiente periodo:

Esta estrategia incluye una fase de penalizacin (de un periodo) en la que


la empresa produce x y una fase de colusin (potencialmerite infinita) en la
que la empresa produce qm/2. Si cualquiera de las dos empresas se desva
de la fase de colusin, empieza la fase de penalizacin. Si cualquiera de las
d~)sempresas se desva de la fase de penalizacin, sta vuelve a empezar.
SInmguna empresa se desva de la fase de penalizacin, empieza de nuevo
la fase de colusin.
El beneficio de una empresa si ambas producen x es (a - 2x - e)x, que
denotaremos mediante 7f(x). Sea V(x) el valor presente de recibir 7f(x) en
este periodo y la mitad del beneficio de monopolio en 16 sucesivo:
V(x)

= 7f(x) + --

. -7f
2

m.

Si la empresa 'i va a producir x en este periodo, la cantidad que maximiza


el beneficio de la empresa j este periodo es la solcin de
max

siguiente:
--

1-5

V(x)

Sustituyendo

V(x)

(2.3.3)

> 7rd + 8V(x).

. -7r

m_

(2.3.4)

?: 7r dp(X) + 5V(x).

en (2.3.3) obtenemos
5 G7rm

-7r(X)

?: 7rd -

~7fm.

Es decir, lo que se gana en este periodo por desviarse no debe ser mayor
que el valor descontado de la prdida en el periodo siguiente debida a
la penalizacin. (Siempre y cuando ninguna de las empresas .se desvi
de la fase de penalizacin, no hay ninguna prdida a parlii dl si~ente
periodo, ya que la fase de penalizacin termina y las empresas velven
al resultado de monopolio, como si no hubiera habido desviacin.) Dl
mismo modo, (2.3.4) puede reescribirse como
.

1-

-":

(a - qj - x - e)qj.

qj

Esta solucin es qj = (a - x - e)/2, con un beneficio de (a - x - c)2/4, que


deno~amos por 7r dp(X), donde dp significa desviarse de la penalizacin.
SI arr:ba.s .empresas juegan esta estrategia, los subjuegos del juego
repet~~o mfulltamente pueden agruparse en dos clases: (i) subjuegos de
coluslon:.en los que el resultado del periodo anterior fue (qm/2,qm/2) o
(x,x),y (n) subjuegos de penalizacin, en los que el resultado del periodo
~ntenor no fue ni (qm/2,qm/2) ni (x,x). Para que el que las dos empresas
jueguen la estrategia del palo y la zanahoria sea un equilibrio de Nash

5 G7fm

7r(x)

?: 7rdP

~ 7f(x?::

con una interpretacin anloga. Para 5 = 1/2, (2.3.3)se cumple simp~e y


cuando x/(a - e) no est entre 1/8 y3/8, Y (2.3.4)se'C{unplesix/(a - e)
est entre 3/10 y 1/2. Por tanto, pa~a 5 = 1/2, la,estrafgia del palo y la
zanahoria consigue que el resultado de mO1.<)polio"
sea un equilibrio de
Nash perfecto en subjuegos, siempre y cuando 3/Ss x/(a - e) S 1/2.
Existen otros muchos modelos de oligopolio dinmico que enriquecen
el modelo simple desarrollado aqu. Concluirns esta seccin discutiendo
brevemente dos clases de estos modelos: los modelos con variables de estado y los modelos con supervisin imperfecta. Las dos clases de modelos
tienen muchas aplicaciones que trascienden el mbito del oligopolio;por
ejemplo, el modelo de salaribs de eficiencia de la prxima seccin es un
caso de supervisin imperfecta. ','

..

',

106 / JuEGOS DINMICOS CON INFORMAcrN

COMPLETA (c. 2)

Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusin en el


ciclo econmico, permitiendo que la interseccin con el eje de abci~as de
la funcin de demanda flucte aleatoriamente de un periodo al otro. En
cada periodo, todas las empresas observan la interseccin con el eje de abcisas de la funcin de demanda en ese periodo antes de tornar decisiones;
en otras aplicaciones,los jugadores observan otras variables de estado
al principio de cada periodo. El incentivo a desviarse de una estrategia
pactada depende tanto del valor de la demanda en este periodo corno
de los posibles valores de la demanda en periodos futuros. (Rotemberg
y Salonersuponen que la demanda no est correlacionada serialmente
de forma que esta ltima consideracin ,es independiente del valor pre~
sente de la demanda, pero otros autores posteriormente han relajado este
supuesto.)
Green y Porter (1984) estudian la colusin cuando las desviaciones
no se pueden detectar perfectamente: en vez de observar las cantidades
escogi~~s ~or la otra empresa, cada empresa observa tan slo el precio
de eqwlibno del mercado, que cada periodo recibe sacudidas debidas a
una perturbacin aleatoria inobservable. En este contexto, las empresas
no puede,n distinguir cundo un precio de equilibrio bajo se debe a que
una ~ ,mas empresas se han desviado de la estrategia pactada o a que
oc:un0 una perturbacin adversa. Green y Porter examinan los equilibnos con estrategias del disparador tales que c~alquier precio por debajo
de un nivel crtico dispara un periodo de penalizacin durante el cual
las empresas juegan sus cantidades de Coumot. En equilibrio, ninguna
empresa se desva. No obstante, una perturbacin especialmente mala
puede hacer que el precio caiga por debajo del nivel crtico, desencadena~do un periodo de penalizacin. Como algunas penalizaciones ocurren
acc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en el
anahSls de las estrategias del disparador no son ptimas. Estrategias de
dos ~ases del tipo ,analizado por, Abreu podran parecer prometedoras;
efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que pueden
ser optimas.
2.3.D Salarios de eficiencia
En los modelos de salariOs de eficiencia, lo que producen los trabajadores
de una empresa depende del salario que la empresa paga. En el contexto. de lo: pases en vas de desarrollo, esto se explicara porque unos
salan os mas altos podran conducir a una mejor nutricin; en los pases

Jllegos

repel ido< / 107

W10S salarios ms altos podran inducir a que los trilbajadodesarro 11ildos ,


,
. .
.' preparados solicitasen empleo en la empresa que los ofrecIelil,
res mejor
.
,.
o podran inducir a los trabajadores ya empleados a trabajar mas mtensa-

mente.
Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inmico en el q.ue
l empresas inducen a los trabajadores a trabajar mas pagando salanos
:r:os y amenazando con despedir a los que sean descubiertos trabajando
poco. Como consecuencia de estos salarios altos, las empresas reducen su
demanda de trabajo, de forma que a1g1.mostrabajadores tendrn empleo
n salarios altos mientras que otros estarn (involuntariamente) parados.
ca
d
,.
1
Cuanto mayor sea el nmero de trabajadores para os, mas tIempo e
llevar a un trabajador que haya sido despedido encontrar un nuevo
empleo, de forma que la amenaza de despido resulta ms. efectiva. En
el equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a los
trabajadores a esforzarse, de tal forma que la demanda de trabajO de las
empresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.
Vamos a estudiar los aspectos de este modelo que tienen que ver co~
los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'
competitivo) analizando el caso de una empresa y un trabajador.
, Consideremos el siguiente juego de etapa. En primer lugar, la empresa
ofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptao
rechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerte en
un trabajador independiente con un salario Wo. Si el trabajador acepta UI,
escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no
(lo que no le produce desutilidad). La decisin tornada por el traba~ador
sobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdor
produce es observado tanto por la empresa como por el.!!abajador. La
produccin puede ser alta o baja; para simplificar, suponemos que el
nivel bajo de produccin es cero y escribimos, eLnivel~1to como y > O.
Supongamos que si el trabajador realiza un esfuerzo, la produccin es ~J,ta
con probabilidad 1, pero que si el trabajador no se esfuerza, la producClon
es alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, en
este modelo, un nivel bajo de produccin es signo inequvoco de falta de
esfuerzo.
.tI
Si la empresa emplea al trabajador con un salario w, las gananciils a
lbs jugado~es si el trabajador realiza un esfuerzo ~ la pro~uccin e: alta
son y - w para la empresa y w -'- e para el trabajador. SI el trabaJildor
no se esfuerza, e es cero; si la produccin es baja, y es cero. Suponemos
que y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr

Jllegos repetidos / 109

108/ JUEGOSDINMICOS CON INFOI~lyIACINCOMPLETA (c. 2)

empleado en la empresa y realizar un esfuerzo, aunque tambin le resulta


m~jor ponerse de independiente a estar empleado en la empresa y no
estorzarse.
El resultado perfecto en subjuegos de este juego de etapa es ms
bien poco prometedor: dado que la empresa pagaw por adelantado, el
trabajador no tiene ningn incentivo para esforzarse, de forma que la
empresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajar
como independiente. Sin embargo, en el juego repetido infinitamente, la
empresa puede inducir un esfuerzo pagando un salario wsuprior a Wo y
amenazando con despedir al trabajador en cuanto la produccin sea baja.
Demostramos que para algunos valores de los parmetros, la empresa
encuentra que vale la pena inducir un esfuerzo pagando ese salario.
Uno podra preguntarse por qu la empresa y el trabajador no pueden
firmar un contrato c-6mpensatorio que dependa de la produccin, deforma
que induzca al esfuerzo. Una razn por la que estos contratos podran
no ser viables es que a un tribunal le resulta muy dificil. hacer que se
cumplan, quizs porque una medida adecuada de la produccin incluye
la calidad, las dificultades inesperadas en las condiciones de produccin,
etc. De un-aforr1.ams general, es probable que loscontf?tos contingen~
tes a determinadOs vol.menes de produccin sean imperfectos (ms que
completamente inviables), aunque los incentivos todava pueden jugar un
papel en el juego repetido estudiado aqu.
Consideremos las siguientes estrategias en el juego r~petido infinitamente, que incluyen el salario 'W. >wo que se determinar ms adelante.
Diremos que la historia del juego es de salari lto y prod~c2in alta si todas
las ofertas anteriores han sido 'W., todas las ofertas anteriores han sido
aceptadas y todos los niveles de produccin anteriores han sido altos. La
estrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecer
w = 'W. en cada periodo siguiente siempre y cuando la historia del juego
sea de salario alto, produccin alta, pero ofrecer w = Oen caso contrario.
La estrategia del trabajador es aceptar la oferta de la empresa si w ~_ Wo
(decidiendo trabajar como independiente en caso contrario) y realizar un
esfuerzo si la historia del juego, incluyendo la oferta presente, es de salario
alto y produccin alta (no esforzndose en caso contrario).
La ~trategia de la empresa es anloga a las estrategias del disparador analIzadas en las dos secciones anteriores: jugar cooperativamente
siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
pero escoger en lo sucesivo el resultado perfecto en subjuegos del juego
de etapa si alguna vez se rompe la cooperacin. La estrategia del jugador

es tambin anloga a estas estrategias del disparador, pero es ligeramente


ms sutil ya que el trabajador decide en segundo lugar en el juego de etapa
de decisin sucesiva. En un juego repetido basado en un juego de etapa de
decisin simultnea, las desviaciones se detectan slo al final de la ronda;
sin embargo, cuando el juego de etapa es de decisin sucesiva, una desviacin del primer jugador se detecta (y debera ser contestada) durante
la misma ronda. La estrategia del trabajador es jugar cooperativamente
siempre y cuando todas las jugadas anteriores hayan sido cooperativas,
pero responder de forma ptima a cualquier desviacin de la empresa,
sabiendo que el resultado perfecto en subjuegos del juego de etapa se
jugar en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,
el trabajador acepta la oferta de la empresa pero no se esfuerza.
Derivamos ahora las cond,iciones bajo las cuales estas estrategias son
un equilibrio de Nash perfecto en subjuegos. Como en las dos secciones
anteriOres, el argumento consta de dos partes: (i) la derivacin de las
condiciones bajo las cuales estas estrategias son un equilibrio de Nash, y
() la demostracin de que es perfecto en subjuegos.
Supongamos que la empresa ofrece w. en el primer periodo. Dada
la estrategia de la empresa, es ptimo para el trabajador aceptar. Si el
trabajador realiza un esfuerzo, est seguro que producir al nivel alto,
de forma que la empresa volver a ofrecer w' yel trabajador volver a
enfrentarse en el periodo siguiente a la misma decisin sobre el esfuerzo
a realizar. Por tanto, si la decisin ptima dl trabajador es esforzarse, el
valor presente de las ganancias del trabajador es
Y.: = (w' -

e)

+ 8y':,

o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,


producir al nivel alto con probabilidad p, en cuyo caso la misma decisin
con respecto al esfuerzo se dar en el prximo periodo, pero el trabajador
producir el nivel bajo con probabilidad 1- p,en cuyo caso la empresa
ofrecer w = O en lo sucesivo, de forma que en adelante el trabajador
ser independiente. Por tanto, si no esforzarse es la decisin ptima del
trabajador, el valor presente (esperado) de las ganancias del trabajador es
V. = w' + {j { pV.+ O
o V. = [0- 8)'W' + {jO - p)71Jo]/(l ptimo para el trabajador si Ve ~ V.,

{jp)O
O

-p\. wa_ }
{j'

8). Realizar un esfuerzo es

'\."

w
.

',1'

1-

2: Wo + '(1
(j

p{j

)e

p .

Juegos repelidos /

COMPLETA (c. 2)

110 / JUEGOS DINMICOS CON INFORMACIN

(1 -

+ 1 + ---

== Wo

(j

[jO - p)

(2.3.5)

Por tanto, para inducir un esfuerzo, la empresa debe pagar no slo Wo + e


para compensar al trabajador por renunciar a la oportunidad de trabajar
como independiente y por la desutilidaddel esfuerzo, sino tambin por
la prima salarial O - {j)e/ [jO - p):NaturaImente, si p est cerca de uno (es
decir, si no esforzarse es difcilmente detectable), la prima salarial debe
ser extremadamente alta para inducir un esfuerzo. Si p == O, por otra parte,
esforzarse es la decisin ptima del trabajador si
1 (*
)
.,.
fj
1 _ 6 w - e 2: w + 1- 6 wo,

(2.3.6)

anlogamente a (2.3.1) y (2.3.2) en los casos con supervisin perfecta de


las dos secciones anteriores, (2.3.6) es equivalente a
W*

>
_wo+

'(1 1- 6)

.+-/5-. e,

queefectivamenfe es (2.3.5) con p == O.


Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajador
sea la mejor respuesta a la estrategia de la empresa, a la empresa tiene
tambin que merecerle la pena pagar
Dada la estrategia del trabajador,
el problema de la empresa en el primer periodo se c(;mcreta en escoger
entre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazando
co~ ~espedir al trabajador si en algn momento la produccin es baja, y
~eclbl~ndo por tanto la ganancia y - w* en cada periodo; y (2) pagar w == O,
mdu~l~ndo con ello al trabajador a escoger trabajar como independiente,
y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Por
tanto, la estrategia de la empresa es una mejor respuesta a la del trabajador si

w::

y - w*

2: O.

(2.3.7)

Recordemos que supusimos que y - e > Wo (es decir, que para el trabajador
es eficiente estar empleado por la empresa y esforzarse). Necesitamos una
condicin ms fuerte si estas estrategias han de formar un equilibrio de
Nash perfecto en subjuegos: (2.3.5) y (2.3.7) implican
Y-e>
- 'tilo +

1-/5

---e
60 - p)

111

que puede interpretarse como la restriccin f~~liar de que fj debe ser lo


suficientemente alta para lograr una cooperaclOn sostenIda.
Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las
.estrategias que estamos considerando son un equilibrio de Nash: .Para
demostrar que estas estrategias son perfectas en subjuegos, defJmmos
primero los subjuegos del juego repetido. Recordemos que cuan~'o el
juego de etapa obliga a decisiones simultneas, lo~ subJuegos ~el Juego
repetido empiezan entre las etapas del juego repetido. Para el Jue1?ode
etapa de decisiones sucesivas considerado aqu, los subjuegos empIezan
no slo entre etapas sino tambin dentro de cada etapa, despus de que el
trabajador observa el salario que la empresa ofrece. Dadas las estrategias
de los jugadores, podemos agrupar los subjuegos en dos clases: los que
empiezan despus de una historia de salario alto y produccin alta, y los
que empiezan despus de todas las dems historias. Hemos demosb'ado
ya que las estrategias de los jugadores son un equilibrio de Nash dada
una historia de la primera clase. Queda por hacer lo mismo cor~una
historia del segundo tipo: como el trabajador no se esforzar l1\1nca,es
una decisin ptima de la empresa inducir al trabajador a trabajar como
independiente; dado que la empresa ofrecer V) == O en la siguiente etapa y
en lo sucesivo, el trabajador no debera esforzarse en esta etapa y debera
aceptar l oferta presente slo si 'w 2: O.
En este equilibrio, trabajar como independiente es permanente: si se
descubre al trabajador no esforzndose, la empresa ofrece 1J) == O en lo
sucesivo; si la empresa se desva alguna vez de ofrecer w ==. w*, el t.rabajador nunca volver a esforzarse, de fiJrma quela empresa no puede
permitirse emplear al trabajador. Hay varias razC?naspara preguntarse
si es razonable que el trabajo como independiente sea permanente. En
nuestro modelo de una empresa y un trabajador, ambos jugadores preferiran volver al equilibrio de salario alto y produccin alta del juego
repetido infinitamente, antes que jugar para siempre el resultado perfecto
en subjuegos del juego de etapa. ste es el problema de la renegociacin
presentado en la seccin 2.3.A. Recordemos que si los jugadores saben que
no se podrn hacer cumplir las penalizaciones, la cooperacin inducida
por la amenaza de estas penalizaciones ya no es un equilibrio.
En el contexto del mercado de trabajo, la empresa puede preferir no
renegociar si emplea muchos trabajadores, ya que renegociar con un trabajador puede estropear el equilibrio de salario alto y produccin alta que
se est todava jugando (o an s ha de empezar a jugar) con los otros
trabajadores. Si hay muchas empresas, la cuestin es si ~aempresa .i con-

,'.

'112

JUEGOS DlNMJCOS CON INFORMACJN

COMPLETA (c. 2)

tratar a trabajadores empleados anteriormente en la empresa .. Pudiera


ser que la empresa j no lo hiciera, por miedo a estropear el equilibrio de
salario alto y produccin alta logrado con sus trabajadores, como en el
caso de una nica empresa. Algo as puede explicar la falta de movilidad
de los administrativos jvenes y varones entre las grandes empresas en
Japn.
Alternativamente,si los trabajadores despedidos pueden siempre encontrar nuevos empleos que sean preferibles a trabajar como independientes, el salario en esos nuevos empleos (neto de cualquier desutilidad del
esfuerzo) es el que aqu juega el papel del salario en el trabajo por libre
lUo. En el caso extremo en el que un trabajador despedido no sufra ninguna prdida, no existirn penaliza'ciones por no esforzarse en el juego
repetido infinitamente y, por consiguiente, no existir ningn equilibrio
de Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existe
una aplicacin elegante de estas ideas en el contexto de la deuda pblica
externa en Bulow y Rogoff (1989): si un pas endeudado puede conseguir
el importe de los crditos a largo plazo que recibe de los paSes acreedores
mediante transacciones a corto plazo por adelantado en el mercado internacional de capitales, no hay posibilidad de penaliZ~r eliricumplimiento
de los trminos de la deuda en el juego repetido infinitamente entre paSes
deudores y acreedores.

fllegos repetidos / 113

la autoridad monetaria observa esta expectativa y escoge el nivel real de


inflacin, -r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,
los empresarios quieren simplemente prever correctamente el nivel de
inflacin; alcanzan su ganancia mxima (que es cero) cuando -r= 7[e. A la
autoridad monetaria, por su parte, le gustara que la inflacin fuera cero
. pero que la produccin estuviera en su ruvel de eficiencia (y*). Escribimos
la ganancia de la autoridad monetaria como
U(-r,y),=

::-C'Tr2

_ (y _y*)2,

donde el pi,meti-o c > O refleja el dilema de laa,-t?I1d~dITl();l1~;~ria


~n~,~
S115 dos ~lJjeti~os'?llPo!;ga.mos
q';le el verdad~!(): !yeI d~ pr,c)~}lc.cin
es i~sigule;tefuIdn
del ~velde produccin deseado'y de la inl.ac.i~~
' iIDpfevista';
"
,
, ,
+ d(-r - -re),

y =by*

donde b < 1refleja ,la presencia de un poder de monopolio en los mer~


cados de productos (de forma. que si no hubiera inflacin imprevista; se
produCira a un nivel por debajO del de eficiencia) y d >' O mide el efecto de
la iriflaciQrlin1prevista sobre.la produccin a travs de los salarios reales;
tal ycomo se describi en el prrafo anterior. Podemos entonces reescribrr
la ganancia de la autoridad monetaria como.
.

2.3.E Poltica monetaria estable en el tiempo


W(-r,7[e)

Consideremos un juego de decisiones sucesivas en el que empresarios y


trabajadores renegocian los salarios nominales, despus de lo rualla autoridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'a
de inflacin. Si los contratos salariales no pueden' ser automticamente
achlalizables, empresarios y trabajadores tratarn de prever la inflaCin
antes de fijar los salarios. Sin embargo, una vez se ha fijado el salario nominal, un nivel real de inflacin superior al previsto erosionar el
salario real, haciendo que los empresarios aumenten el empleo y la produccin. La autoridad monetaria, por tanto, se enfrenta aun dilema al
tener que escoger entre los costes de la inflacin y las ventajas de reducir
el paro y aumentar la produccin ante una evolucin impreVista del nivel
de inflacin.
Como en Barro y Cardan (1983), analiZamos una versin en forma
reducida de este modelo en el siguiente juego de etapa. Primero, los
empresarios forman sus expectativas de inflacin, -re.En segundo lugar,

+d(-r - 7[e)]2.

_c-r2 - [(b - l)y*

d~~~tp.J~

Para h~llar el resultadop;d~to


en subjuego~A~:'~!~'jt;~~9.
calculambs primero la eleccin ptima de-n: por Bme~ela,aut0!fd~9
monetari~-a.adas l~s exp~tativas de los einpresarib~ -re.MaximiZando
W(-r,-re) obtenemos

'

1l'*(-re)
= --:J?[(l c+ u-

b)y*

+ d-re].

(2.3.8)

Dado qJle.los empresarios prevn que la autoridad monetaria escoger


-r*(-re),
i~$'empresarios escogern la -reque maximice _[-r*(7[e)- -re]2,lo
que da1r*(-re)= -re,o,.,
d(1 - b) *' = ,-r.,
-re = ---y
c

donde el subndice s denota, "juego de etapa". De forma similar, podra


deCirse que la expectativa' niCiomilque los empresarios deben mantener

.'

~:;,,

~
,

;:~;~~\:i!~W;.;,~,\

~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;,,:,;1;'r,,,,l..l.'~I'
..,,.:.,,;"" .:.:"'J.._~'

~-...:..!...~...:..-'~~L~,I
.........
_ .~I;.l...;.'--:'<'~.

---.---------

Juegos dil1micos

COll

il1fOI'llWI1 completa pero illlpe,.[eda

/ 115

114 / JUEGOS DINMICOS CON TNFORMAClN COMPLETA (c. 2)

<...

".-,:

. ,~.;.
'.":.'

es la que ser confirmada en lo sucesivo por la autoridad monetaria, de


form~ que "*("e) =: ".e, y por tanto ".e = "'s' Cuando los empresarios
mantIenen esta expectativa ".e =: "'s, el coste marginal en que incurre la
autoridad monetaria al fijar". ligeramente por encima de ".s compensa
exactamente el beneficio marginal de la inflacin imprevista. En este
resultado perfecto en subjuegos, se espera que la autoridad monetaria
cree inflacin y as lo hace, pero estara mejor si pudiera comprometerse a
no ~rear inflacin. Efectivamente, si los empresarios tuvieran expectativas
racIOnales (esdecir, rr =: ".e), una inflacin cero maximiza la ganancia de la
autoridad monetaric:.(es;decir, W(". ,'" e) = _c".2 - (b - 1)2y*2 cuando". = ".e,
defonna que"..==O~s1'5tiroo).,
... .. .
.. . C6risi~~r~n10sah~ra!erjeg() rer'etidO infinitam,ente en el que ambos
. Jugadores tienen el rmsmo factor de descuento . Derivaremos condiciones bajo las cuales". = ".e.=: Oen cada periodo de un equilibrio de Nash
per~ecto en subjuegos que incluya las siguientes estrategias. En el primer
penado, los empresarios mantienen la expectativa ".e =: O. En periodos
sucesivos.mantienen1a expectativane =;'O siempre y cuand todas las
expectativas anteriores hayan sido ne=: .}' todos los niveles de inflacin
a~teriores.hayan sido e0ctivamente ". =: O;en caso contrario, los empresanos.mantienenJa'exp'ectativaie
=:".. (la expectativa racional en el juego
de etapa), De forma similar, la autoridad monetaria fija". = Osiempre
y cuando la expectativa presente sea ne,.", O;todas las expectativas ante~ores hay.an sido ".e = OY todos los niveles de inflacin anteriores hayan
sIdo efectIvamente". = O;en caso contrario, laautorid'ad monetaria fija
".=: ".*(nC}(sumejor respuesta a las expectativas de l()s empresarios, tal
como se indica en (23.8. ..
',.' ";
. .
.
Supongamo~que los empresarios mantienen la eXpectativa ".e = O
en el primer periodo. Dada la estrategia de los empresarios (es decir,
la forma en que los empresarios actualizan sus expectativas despus de
obse~a~ el nivel verdadero de inflacin), la autoridad monet~riapuede
restrmgr su atencin a dos decisiones: (1)". =: O, lo que conducir a
ne = Oe~periodo siguiente y, por tanto, a la misma decisin por. parte de
la autondad monetaria en el siguiente periodo; y (2) n = ".*(0)utilizando
(2.3.8),10 que conducir a".e
en lo su~esi~o,'en cuyo caso la autoridad
monetaria encontrar que es ptimo en lo sucesivo escoger n =: ". . En
con~ecuen~ia, fijar". =: Oen este periodo resulta en la ganancia W(O,O) por
p~n~do, mIentras que fijar" =: ".*(0)eneste periodo resulta en la ganancia
W (". (O),O)eneste periodo, pero W(". .,".) en lo sucesivo. Parlo tanto, la
est:rategia de la autoridad monetaria es la mejor respuesta

="..

_l_W(O
1-b

O)

'-

>

(".+(0),0)

+ _rS_vV("',""'s),
1-15

(2,39)

que es anloga a (2.3.6).


2
Simplificando (2.3.9) obtenemos b 2: c/(2e + d ). Cada u~o de los parmetros c Y d tiene dos efectos. Un aumento en d, por ejemplo, hace
que la inflacin imprevista sea ms efectiva de cara al aumento de ~a
produccin, y resulta por tanto ms tentador para la autondad mon:tana
ser indulgente con la inflacin imprevista, aunque por la mIsma razon, un
aumento en d tambin aumenta el resultado del juego de etapa"" lo que
hace que la penalizacin sea ms dolorosa para la autoridad monetria,
Dl mismo modo, un aumento de c hace que la inflacin sea ms dolorosa,
por lo que la inflacin imprevista resulta m~n~s tentadora, pero ~ambin
hace que".. disminuya. En ambos casoS, el ultImo efecto pesa mas que :1
primero, de forma que el valor crtico del factor de descuento necesarIO
para mantener este e.quilibrio, c/(2c + d2), decrece c~n d y crece c.onc.
Hasta ahora hemos demostrado que la estrategIa de la autondad monetaria es una mejor respuesta a la estrategia de los empresarios si (2.3.9)s~
cumple. Para demostrar que stas estrategias son un equilibrio ~e Nash,
queda por demostrar que la ltima es una mejor resp.uesta ~ la pnmera,.lo
cual se deriva de la observacin de que los empresanos obtIenen su mejor
ganancia posible (que es cero) e.\lcada periodo. Demostrar q~e :stas estrategias son perfectas en subjuegos requiere argumentos analogos a los
de la seccin anterior.

2.4 Juegos dinmicos

con infoIDlacin

completa

pero imperfecta

2.4.A Representacin de los juegos en fonna extensiva


En el captulo 1 estudiamos juegos estticos representndolos en forma
normaL Analizamos ahora juegos dinmicos representndolos en forma
extensiva.19 Este enfoque expositivo puede hacer que parezca que los
juegos ~stticos tienen que representarse en fo~a nom:al y los juegos
dinmicos en forma extensiva, pero esto no es asI. CualqUJer Juego puede
representarse tanto en forma normal como extensiva, aunque para algu-

19

Damos una descripcin ;'formaJ de la forma extensiva; p'ara un tratamienTo preciso

consltese Kreps y Wilson (1982).

116/

JUEGOS DINMICOS CON INFORMACIN

COMPLETA (c. 2)

Juegos dinmicos con informacin completa pero imperfecta / 117

nos juegos una de las dos formas es ms apropiada que la otra. Vamos a
ver cmo los juegos estticos pueden representarse utilizando la forma extensiva y cmo los juegos dinmicos pueden ser representados utilizando
la forma normal.
Recordemos de la seccin l.1.A que la representacin en forma normal
de un juego requiere precisar: (1) los jugadores, (2) las estrategias posibles
de cada jugador y (3) las ganancias recibidas por cada jugador para cada
combinacin de estrategias posibles.
Definicin. La representacin en fanna extensiva de un juego exige preci~ar:
(1) los jugadores, (2a) cundo tiene que jugar cada jtigador,(2b) lo qt{e cada
jugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cada
jugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibida
por cada jugador para cada combinacin posible de jugadas.
ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemos
analizado varios j~egos representados en forma extensiva. La contribucin de esta seccin consi~te elldescribir estos juegos en forma derbol
en vez de utiliZr' palabr~s, porqtie el uso derbo~es,.~ menudo'facilita
tanto la explicaci6n co~o el anlisis.
' .. , .> .,.
' ..
Como ejemplo de un juego en formaextensiva, consideremseI siglliente representante d la clase de juegos en dos etapas 'con informacin
completa y perfecta presentada en la seccin 2.1.A:
1. El jugador 1 escoge una accin al del conjunto factible Al = {J,D}.
2. El jugador 2 observa al y escoge entonces una accin a2 del conjunto
,42 = {J',D'}.
3. Las ganancias son Ul (al,az) y -uz(al,a2), como se indica en el rbol de
la figura 2.4.1.
<..

2,')

Este rbol empieza con un nodo de decisin correspondiente al jugador


1, donde 1 escoge entre 1 y D. Si el jugador 1 escoge 1,se llega a un nodo
de decisin del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,
si el jugador 1 escoge D, se llega a otro nodo de decisin del jugador 2,
donde 2 escoge entre l' y D'. Despus de cada una de las decisiones de
2 se llega a un nodo terminal (es decir, el juego termina) y se reciben las
ganmc;iasindicadas ..
Es inmediato extender el rbol de la figura 2.4.1 para representar
cualquier juego dinmiCo con informacin completa y perfecta, es decir,
cualquier juego en el queros jugadores toman sus decisiones uno despus
del otro, todas las decisiones previas son informacin del dominio pblico
antes de realizar el siguiente movirnientoy las ganancias a los jugadores
con cada combinacin factible ,de decisiones son informacin del dominio pblico. (Los espacios. de-acciones continuos, como en el modelo de
5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,
presentan dificultades grficas pero no conceptuales) Deriva~os seguidmWl1teJareprese~tficin.en forma ,normal del juego:de la figura 2.4.1.
C:0l1clpimospOI\ltiII.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!~cosc
Plledel1represerarse enfofI!la extensiva y descnbiend() cmo represen~ .
tar en formaext~nsiva l()s juegos dinmicos con informacin ~9rnpleta
pero imperfecta.
Tal como parecen indicar las convenciones sobre nmneracin ~l~)as
definiciones de las-formas no,rmaly extensiva, existe una ntiIna relaC;in
entre las estrategias f;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~
nornal y la descripcipl1 de cu'ndo dec.ide un jugadorrcqu~'p:ll.~doe'):a<;
qp.sabe(apartados 2,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.ti
juego dinmico en forma normal, necesitamos.h"aducirJ~Wof!!lacinen:
forma e?'tensiva en trminos de la descripcin del espacio de estrategas'
de cada jugador en la frma~normal. Para hacer esto, recordemos la
definicin de estrategia dada (formalmente) en la seccin 2.3.B:
Definicin. Una estrategia de un jugador es un plan de accin completo, es
decir, e~pecifica una accin factible de/jugador en cada contingenCia en la que al
jugador le pudiera corresponder actuar.
l'
-.'

Ganancia al jugador 1:
Ganancia al jugador 2:

2
1

Figura 2.4.1

o
O

. Puede parecer innecesario exigir que la estrategia de un jugador es-p~tmque una accin factible, para cada contingencia en la que al jugadb~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no
. ,poarqlOs aplicar lanociri de equilibrio de Nash a los juegos dinmicos

118/

JUEGOS DINMICOS CON INFORMACfN

COMPLETA (c. 2)

Juegos dinmicos

con informacin completa si permitiramos que las estrategias de un jugador ~epran sin especificar sus acciones en algunas contingencias. Para
que el Jugador j calcule una mejor respuesta a la estrategia del jugador i,
puede que j necesite considerar cmo,actuara i en todas y cada una de las, '
contingencias, no slo en las contingencias que i o j creen que es posible'
~~~.

En el juego de la figura 2.4.1, el jugador 2 puede tomar dos acciones, ,'c:


pero ppsee cuatro estrategias, puesto que hay dos contingencias diferentes'
(concretamente, despus de observar que el jugador 1 ~scoge Iy despus
de observar que el jugador 1 escoge D) en las que podra corresponder
actuar al jugador 2.
,_.
-.e., . '"
",
,
'. ~'

..

, o.'.

,!strategial: Si el jugador 1 juega [,entonces jugar!'; si el jugado~l


Juega D, entonces jugar !', 10que denotamos por (JI,!').
,
,!strategia 2: Si el jugador 1 juega 1, entonces jugar 11; si el jugador 1
, Juega D, entonces jugar DI, 1() que denotamos por (JI,DI).
,!strategil3: Si el jugador 1juega!, entonces jugar DI; si el jugador T
Juega D, entoncesjugar !', lo que denotamos por (DI,!I). ,

COI!

informaci, comFleta Fero imFerfecta / 119

, .,
forma extensiva. Denominemos las filas de la forma normal
entaClonen
.
I
d
sd aCuerd oc on las estrategias factibles del Jugador 1 y las ca umnas e
e d o con las estrategias factibles del jugador.. 2, y calculemos las gana 11euer
a.
en cada combinacin posIble de estrategIas,
~aoo 1 J'ugadores
'
" como se
. dica en la figura 2.4.2.
111 Una vez mostrado que un juego dinmico puede rep~esentars: .en
seguidamente a demostrar cmo un Juego
formano,rmal pasemos
,
, estatIco
'
.
de
decisiones
simultneas)
puede
representarse
en
forma
(es d eClr, ,
'
.,
'.
, extensiva. Para ello, nos basamos len la observaoon hecha en la sec~IOn ] .l.A
(en conex'o'ncon el dilema de los presos) de que
, no es necesano que los
.
, 'dores acten simultneamente: es suficiente con que cada uno escoJa
ugaestrateoia sin conocer la decisin del otro, como sera el caso en el
una
o~
d ..
Id
dilema de los presos silos presos tomaran sus eCSlO~eSen cea: :eparadas. Por tanto, podemos representar un juego de (dgamos) deosJOnes
simultneas entre los jugadores 1 y 2 como sigue:

''!stratega 4: Si elJugador 1 juegaI, Emtonce~jugar DI; si el jugador 1


Juega D,entonces jugar DI; lo que denotamos por (DI,DI).
~l jugad~r 1, sin embargo, tiene dos acciones pero slo dos estrategias:
Jugar 1 yJugar D. La raz~ por la cual el jugador 1slo tiene dos estrategias
:s que solo hay una contingencia en la que pudiera torresponder jugar al
Jugador 1 (concretamente, la primera jugada, que corresponde al jugador
1), de.forma que el espacio de estrategias del jugador1 es equivalente al
espacIO de acciones Al == {1,D}. ,.
.
Jugador 2
(JI,!') (J';DI) (DI,!')

3,1

Jugador 1

3,1

(DI,DI)

1,2
"

1,2

',---.../

2,1

0,0

2,1

')

0,0

1. El jugador 1 escoge una accin al del conjunto factible Al'


2. El jugador 2 no observa la decisin del jugador 1, pero escoge una
accin az del conjunto factible Az3. Las ganancias son tI'l (aj,az) y uz(al,az).
Alternativamente, el jugador 2 podra jugar primero y el jugador 1 podra
decidir sin obervar la accin de 2. Recordemos que en la seccin 2.1.B
demostramos que un juego consiste en escoger cantidades con esta f.or111a
temporal y estructUra informativa difiere significativa,mente del J~Jego
de Stackelberg, que tiene la misma forma temporal pero, una estructura
informativa taL quedacempresa 2 observa la decisin de la empresa ?_
Hemos visto que el juego de decisiones sucesivas y ac~n del contrano
no observada tiene el mismo equilibrio de Nash que el Juego de COUlnot
de decisin simultnea.
Para represen:tar este tipo de ignorancia sobre los mo~i~ientos anteriores en un juego en forma extensiva, introducimos la nOC1On
de conjunto
de informacin de un jugador.

"",.;

Figura 2.4.2

",.,'

.Dados estos espacios dl7estrategias de los dos jugadores, eSnil1ediat


denvar la representacin ,en forma normal del juego a partir de surepre-

de

Defulicin Un conju~to
itlfonnacin
nodos de decisi~ que satisface:

de un jugador es una coleccin de

W al jugador le corresponde jugar ett-cada nodo del conjunto de informaciny.


(ii) cuarido en el transcu'rso del juego se llega a

11/1

nodo del conjunto de 111fOl-

Juegos dinmicos con informacin completa pero imperfecta / 121

120/ JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

macin, el jugador al que le corresponde decidir no sabe a qu nodo dentro del


conjunto de infonnacin se ha (o no se ha) llegado.
La parte (ii) de esta definicin significa que, en un conjunto de informacin,
el jugador debe tener el mismo conjunto de acciones factibles en cada nodo
de decisin; en caso contrario el jugador seria capaz de inferir a partir del
conjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s)
nodo(s).

Como segundo ejemplo del uso de un conjunto de informacin para


representar la ignorancia de las jugadas anteriores, consideremos el siguiente juego dinmico con informacin completa pero imperfecta:
1. El jugador 1 escoge una accin al del conjunto factible Al = {l,D}.,
2. El jugador 2 observa al y escoge a continuacin una accin
conjunto factible A2 = {J',D'}.

a2

del

3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuacin


una accin a3 del conjunto factible A3 = {I",D"}.

Preso 1

-1
.

La representacin en forma extensiva de este juego (ignoramos las ganancias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;
el jugador 3 tiene dos conjuntos de informacin: uno con un nico elemento que sigue a D por parte del jugador 1 y DI por parte del jugador
2 y otro con ms de un elemento que incluye los dems nodos en los que
le corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3
observa es si (al,a2) = {D,D'} o no ..
1

4
4

5
O

':."'

Figura 2.4.3
En un juego el! forma extensiva, indicaremos que una coleccin de
nodos de decisineonstituye un-conjunto de informacin con una lnea
discontinua, como en la representacin en forma extensiva del dilema de
los presos de la figura 2.4.3. Indicaremos a veces a qu jugador- le corresponde mover en los nodos del conjunto de informacin por medio de una
leyenda, como en la figura 2.4.3; alternativamente, podemos simplemente
dar nombre a la lnea discontinua que une esos'nodos, como en la figura
2.4.4. La interpretacin del conjunto de informacin del preso 2 en la figura 2.4.3 es que cuando al preso 21e corresponde decidir, todo lo que sabe
es que se ha llegado al conjunto de informacin (es decir, que el preso 1
ha decidido), pero no a qu nodo se ha llegado (es decir, lo que ha hecho).
Veremos en el captulo 4 que el preso 2 puede tener una opinin de lo que
el preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos esta
cuestin hasta entonces.

Figura 2.4.4
Ahora que hemos definido la nocin de conjunto de informacin, podemos ofrecer una definicin alternativa de la distincin entre informacin
perfecta e imperfecta. Definimos previamente la informacin perfecta diciendo que en cada jugada, el jugador al que le corresponde jugar conoce
toda la historia del juego hasta ese momento. Una definicin equivalente
es que cada conjunto de informacin contiene un nico elemento: Por
el contrario, la informacin imperfecta significa que existe al menos un'

--~
122 / JUEGOS DINMICOS CON INFORMAcrN

Juegos dinlmicos

COMPLETA (c. 2)

cO~j~ntode informaci~n con m~ de un elemento,19Por tanto, la represent~ClQnen forma extensiva de un Juego de decisiones simultneas (como el
~lle~a de l~s presos) es un juego con informacin imperfecta. De forma
~lml1ar, l~: J~egos en dos etapas estudiados en la seccin 2.2.A poseen.
l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 son
slmultaneas~ como tambin lo son las decisiones de los jug~dofes 3 y 4..
?e forma mas general, un juego dinmico con informacin co'mpleta pero
lm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntos
de mformaclOn con mas de un elemento para indicar lo que cada jugador
sabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en la
figura 2.4.4.
."
....
,_.
..",
.... ", "
"

2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~"

.: '.

--

". -

~
.

'-..:.

En la secci~ 2.3.B di~s la dfinicin generalder'eqtiilibriOd~~shper:


~.".
fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6:lsloa
jueg(Js' .
repetido~ porque defimmos' los conceptos de estrategia' ysubjuego slo' .
para los Juego~repetidos. En la secCin2AA dimos la.definicin gene"
ral de ,estrategIa. Presentamos ahora la definieingeneral de subjuego,
despues de lo cual podremos aplicar la definicin de equilibrio de Nash
perfecto en subjuegos a los juegos dinahcos con inforinacin completa
en general.
, Recordemos que en la seccin 2.3.Bdefinimos inforinalmertte un subjue.go como la parte del ju~g,?que'q\teda'prjugatecipeZIldbeit
cual- .
qUl~r momento en el que l.~~storia Orripletadeljuego has~a eritonces
sea mfo~~.c!6n deldoiriinip~b~C~ entretbdosiosjugdor~tydiins
un~ defimclOn formal en el caso de los juegos rpetidos,que"eht6nces
~stabam~s, co~sideran.do',Ofrecemos ahora una. definicih fdrml' para
Juegos dmarrucos con mformacin completa en genera], en tI111iri6sd la
representacin e.nforma extensiva del juego.
Definicin. Un subjuego

en un juego nforina extensiva


-~.--:':

19
.
'. ":.~:;C
,
Est~ ~aracterizacin de la informaan perfecta e imperfecta en trminos de 20njuntos de
informaaon con ~o o ms elementos est restringida a los juegos cn info~aci" complet;
>0

com~.veremos en el c~ptulo,4, la ,repre~:,n;a,~n.."n fonTlae.x.\~~~~<'l'd{~ ju~i.


formaclOn perfecta pero Incompleta tiene un conjunto de informacin cf(ini; d' uti .
elemento. En este captulo, sin embargo, restringimos nuestra atencin a la infbrmacih
completa.
.,
~~~te,

COI1infonl1nn

completa

pero imperfecto

/ 123

(a) empieza en un nodo de decisin n que sea un conjunto de informacin con 1111
nico elemento (pero que no sea el primer nodo de decisin del juego),
(b) incluye todos los nodos de decisin y terminales que siguen a n en el rbol
(pero no los nodos que no siguen a n) y
(e) no intersecta a ningn conjunto de informacin (es decir, si 1m nodo de
decisin n' sigue a n en el rbol, todos los otros nodos en el conjunto de
informacin que contiene a n' deben tambin seguir a -n y, por tanto, deben
incluirse en el subjuego).
Debido al comentario entre parntesis de la parte (a), no contamos el
juego completo como un subjuego, pero esto es slo una cuestin de
estil: eliirtinar ese comentario entre parntesis de la definicin no tendra
ningri efecto.
Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presos
de la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definicin. En la
figura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos de
decisin del jugador 2. En el dilema de los presos (o cualquier otro juego
de decisin simultnea) no hay subjuegos. Para ilustrar la parte (c) de la
definicin', consideremos el juego de la figura 2.4.4. Slo hay un subjuego,
el que empieza en el nodo de decisin del jugador 3 que sigue a D por
parte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), en
este juego ningn subjuego empieza en ninguno de los nodos de decisin
del jugador 2, aun cuando estos dos nodos son conjuntos de informacin
de un nico elemento..
.
"Vn trtanera de motivar la parte (c) consiste en fumar que queremos
poder ari~liiar ili1subju~gcipor s mismo y que qti~rem6s que el a'niisi's
searei~vait~pai~el juego completo. En la figura 2.4.4, si intentramos
definir un:'subjuego que empezara en el nodo de decisin del jugador 2
qu sigue a la decisin I del jugador 1, estaramos creando un subjuego en
el que el jugador 3 ignora la decisin del jugador 2 pero conoce la deeisln
del jugador.1. Tal subjuego no sera relevante para el juego completo
porque en ~ste lltim el jugador 3 no conoce la jugadade 1, sino que tan
slo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecido
porelqlleE-fsimojuego de etapa de 1.111 juego repetido no es en s mismo
un stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.
Otra m'anerade motivar la parte (c) es dndonos cuenta de que la
parte (a) slo garantiza que el jugador al que le corresponde jugar en el
nodo n conoce la historia completa del juego hasta ese momento, no que
los dems jugadores tambin conozcan la historia. La parte (c) garantiza

12~ / JUEGOS DINMICOS CON INFORMACIN

COMPLETA (c. 2)

que la historia completa del juego hasta ese momento sea informacin del
dominio pblico en el siguiente sentido: en cualquier nodo que sigue a
/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que el
juego lleg al nadan. Por tanto, incluso si ni pertenece a un conjunto de
informacin con ms de un elemento, todos los nodos en ese conjunto de
informacin siguen a n, de forma que el jugador al que le corresponde
decidir en ese conjunto de informacin sabe que el juego ha llegado a un
nodo que sigue a n. (Si las dos ltimas afirmaciones parecen difciles es en
parte porque la representacin en forma extensiva de un juego especifica
lo que el jugadori sabe en cada uno de sus nodos de, decisin, pero no
hace explcito lo que el jugador i sabe en los nodosfe decisin de j,)
Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo de
cmo podra no cumplirse la parte (c). Podemos ahora reinterpretar este
ejemplo: si caracterizsemos (informalmente)1o que el jugador 3 sabe
en el nodo de decisin del jugador 2 que sigue a la decisin 1 por parte
del jugador 1, diramos que 3 no conoce la: historia del juego .hast~ ese
momento, ya que 3 tiene otros nodos de decisin en lasque 3no sabe sil
jug 1 o D.
~;.
Dada la definicin general de subjuego, podemos;ahora aplicar la
definicin de equilibrio de Nash perfecto en subjuegosde la seccin 2,3.B.
Definicin. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si las
estrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego.
Es inmediato demostrar que cualquier juego dinrrlic:finito con.informacin completa (es decir, cualquier juego dinmico en l q~~ iffi ~&nero
finito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jn
un equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegias
mixtas. El argumento procede por: construccin, utilizando un procedimiento parecido a la induccin hacia atrs, y est basad~. en dos o~stTrvaciones. Primero, aunque presentamos el teorema de Nash en el contexto
de juegos estticos con informacin completa, ste se extiend~ a'todo
juego finito en forma normal con informacin complef~, y hemos visto
que estos juegos pueden ser estticos o dinmicos. En segundo lugar, un
juego dinmico finito con informacin completa tiene lll nnerq)lnito
de subjuegos, cada uno de los cuales cumple las hiptesisdelte~r~ria d
Nash.20
. -.
- '.
20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos
primero
t"dos los subjuegos menores que contienen nodos terminales en el rbol del. juego original

JlIegos dinmicos con informacin completa pero imperfecta / 125

Hemos encontrado ya dos ideas ntimamente ligadas al equilibrio de


Nash perfecto en subjuegos: el resultado por induccin hacia atrs definido en la seccin 2.1.A y el resultado perfecto en subjuegos definido en
la seccin 2.2.A. En trminos informales, la diferencia es que un equilibrio es una coleccin de estrategias (y una estrategia es un plan completo
de accin), mientras que un resultado describe lo que pasar slo en las
contingencias que se espera que se den, no en cada posible contingencia.
Para ser ms precisos sobre esta diferencia entre equilibrio y resultado,
y para ilustrar.la nocin de equilibrio de Nash perfecto en subjuegos,
!econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.

"
.....

Definicin. En el juego en dos etapas con informacin completa y perfecta


definido en la seccin 2.1.A, el resultado por induccin hacia atrs es (aj',R2(aj'
pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al.
En este juego, la accin aj' es una estrategia del jugador 1 porque slo
-hay una contingencia en la que le puede corresponder actuar, el principio
del juego. Sin embargo, del jugador 2, R2 (aj') es una accin (concretamente
la mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~
gia para el jugador 2 debe especificar la accin que 2 tomar despus' de
cualquier posible decisin de 1 en la primera ronda. La funcin de mejor
respuesta R2(al), por otro lado, es una estrategia del jugador 2. En este
juego, los subjuegos empiezan (y terminan) con el moVimiento del jugador 2 en la segunda etapa. Hay un subjuego para cada accinfactible,'al
en Al, del jugador L Para demostrar que (aj',R2(al esUILequilibrio de
Nash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at"
es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~
yen un equilibrio de Nash en cada uno de estos subjuegos ... Como los
subjuegos no son ms que problemas de decisin unipersonales, se trata
de exigir que la decisin del jugador 2 sea ptima en cada subjuego, que
es exactamente el problema que la funcin de mejor respuesta, R2(al),

.C;.,

"
1',.,

(donde un subjuego es un subjuego menor si na contiene ms subjuegos). Sustituyamos


entonces cada tno de estos ~upI.l~;'?~,!??rl~~
g~~S~!ls.de. uno d~7~ equilibrios de Nash.
Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales en
una versin truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores de
este juego truncado que contengan estas nadas' ~e~es
Y: sustituyamos cada uno de estos
subjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta forma
hacia atrs a lo largo del rbol, s<;9~tje,'!tur ~qUlli~~o ~e Nash perfecto en subuegos,porque
las estrategias de los jugadores con~tit;uY~)l,
uneqllilibno de Nash (de hecho, un eqUlhbno de
Nash perfecto en subjuegosl en cada subjuego.- .

i"

.'

~.'.

'

:~
'<.;'

JlIegos di17l17icos C017 i17forl17aei17 completa

pero imf,,:rfeela

/127

126 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (c. 2)

,/,'

soluciona. Finalmente, (ai,R:z(al)) es un equilibrio de Nash porque las


estrategias de los jugadores son mejor respuesta la una a la otra: o.i es una
mejor respuesta a R2(al), es decir, o.i maximiza 1J,1 (0.1,R2(0.1)), y R2(0.1) es
,',una mejor respuesta a ai, es d~dr,R2(ap maximiza do.i ,0.2)'
Los argumentos son anlogos' para los juegos considerados en la
seccin 2.2.A, de forma que nos ahorramos los detalles.
Definicin. En el juego en dos etapas con infonnacin'completa pero imperfecta
definido en la seccin 2.2.A, el resultado perfecto en subjuegos es {o.i ,o.i,0.3 (0.1' o.i),
0.4:(a1,ai)), pero el equilibrio de Nnshperfeeto
en subjuegos es (o.i,0.2;0.; (al ,0.2),

y D (que conduce a una ganancia de 2 por parte del jugador] despus


de que 2 juege 1'). Por tanto, la mejor respuesta de. 1 al comportamiento
previsto del jugador 2 es jugar D en la primera etapa, de forma que el
resultado por induccin hacia atrs del juego es (D,1'), como se indica con
la trayectoria en negrita que empieza en el nodo de decisin del jugador
1 en la figura 2.4.5. Hay una trayectoria en negrita adicional que emana
del nodo de decisin del jugador 2 que sigue a la de~isin 1 del jugildor 1.
Esta trayectoria parcial a lo largo del rbol indica que el jugador '2 habra
escogido D' sise hubiera llegado a ese nocla de decisin.

'a4:(aT~0.2)).

"'-:,'

En este juego, el par de acciones (a3(ai,a2),o,4:(a1,0.2


es el equilibrio de Nash del subjuego que juegan por separado los jugadores 3 y
4 (concretamente, el juego que queda despus de que los jugadores 1 y
~.escogen (ai,ai)), mientras que (aj(aJ,a2},a4:(al,0.i))
es una estrategia del
jugador 3 y una estrategia para el jugador 4, es decir unos planes de.accin
2ompletos que describen una respuesta a cada par de movimientos facFblesde los jugadores 1 y 2. En este juego, los subjuegos consisten en
la interaccin en la segunda etapa entre los jugadores 3 y 4, dadas las
acciones tomadas por los jugadores 1 y 2 en la primera ronda. Tal y como
exige.el equilibrio de Nash perfectO'en subjuegos, el par de estrategias
(a;(al,a,a'(al,a)
especifica un equilibrio de Nash,en cada uno de esto
subjuegos.
'Coriduim~sesta
seccin (y est:~aptulo) con un ejemplo que ilustra
el tema~principal del captulo: la perfeccin en los subjuegos elimina
los equilibrios de Nashque.s basan en'promesas o amenazas que no
son crebles. Recordemos el juego en forma extensiva de l figura 2.4.1.
Si hubiramos encontrado este juego en la seccin 2.1.A, lo habramos
resuelto poririduccin hacia atrs del siguente;nodo:
si el jugador 2
alcanza el riada de decisin que sigue a la decisin 1 del jugador 1, la
mejor respuesta de 2 es jugar D' (lo que proporciona una ganancia de 2)
en vez de jugar l' (que proporciona tina ganancia de 1). Si 2alcanza el nodo
de decisi.nque sigue al decis~nD..del jugador 1, la mejor respuesta de 2
es jugar l' (lo qu proporciotui\cii gahancia de l)'en vez de jugar Di (que
proporciona una ganancia de O). Dado que el jugador 1 puede resolver
el problema del jugador 2 tanto como el propio jugador 2, el problema
de 1 ,~I11a prrn~ra nmdas~ c~~Cre.ta en esoger entr r (que conduce a
gananCia. de 1 por parte del jugador 1 despus de que 2 juege D')

una

3
1

1
2

o
O

Figura 2.4.5

Recordemos que la representacin en forma normal de este juego se


dio en la figura 2.4.2. Si hubiramos encontrado este juego en forma
normal en la seccin 1.1.C, habramos hallado sus equilibrios de Nash
(con estrategias puras). stos son (D/D',!' e (!,(D',D')). Podemos
ahora comparar estos equilibrios de Nash en el juego en forma norIllal de
la figura 2.4.2 con los resultados del procedimiento por induccin hacia
atrs en el juego en forma extensiva de la figura 2.4.5: el equilibrio de Nash
(D,(D',J')) en la representacin en forma normal corresponde a todas las
trayectorias en negrita de la figura 2.4.5. En la seccin 2.1.A llamamos
a (D,J') el resultado por induccin hacia atrs del juego. Sera natural
llamar a (D,(D',1') el equilibrio de Nash por induccin hacia atrs del
juego, pero utilizaremos una terminologa ms general y lo lJamaretnos el
equilibrio de Nash perfecto en subjuegos. La diferencia entre e1resultado
y el equilibrio es que el resultado slo especifica la trayectoria en negrita
que empieza en el primer nodo de decisin del juego y acaba en un nodo

Lecturas adicionales / 129


128 / JUEGOS DIN..MICOS CON INFORMACIN

COMPLETA (e. 2)

terminal, mientras que el equilibrio tambin especifica la trayectoria en


negrita adicional que emana del nodo de decisin del jugador 2 que sigue a
la decisin 1del jugador 1. Es decir, el equilibrio especifica una estrategia
completa del jugador 2.
Pero, qu pasa con el otro equilibrio de Nash, (/(D',D'?
En este
equilibrio, la estrategia del jugador 2 es jugar D' no slo si el jugador 1
escoge I (como tambin ocurra en el primer equilibrio) sino tambin si el
jugador 1 escoge D. Dado que D' (si sigue a D) conduce a una ganancia
de Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte del
Jugador 2 es jugar I, consiguiendo con ello una ganancia de 1 (despus de
que el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguaje
vago pero sugerente, podra decirse que el jugador 2 est amenazando
con jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tiene
la ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja una
acclOn. SI la tuviera, estara incluida en la forma extensiva.) Si esta amenaza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad de
llevar a cabo su amenaza. Sin embargo, la amenaza no debera funcionar
ya que no es creble: si al jugador 2 se le diera la oportunidad de llevarl~
a cabo (es decir, si el jugador 1 jugara D), 2 decidira jugar I' antes que D'.
De un modo ms formal, el equilibrio de Nash U,(D',D' no es perfecto
en su.bjuegos, porque las estrategias de los jugadores no constituyen un
eqUlhbno de Nash en uno de los subjuegos. En particular, la eleccin de
D' por parte del jugador 2 no es ptima en el subjuego'que empieza (y
acaba) en el nodo de decisin del jugador 2 que sigue a la decisin D del
jugador 1.
En un juego con informacin completa y perfecta, la induccin hacia
atr~s elimina las amenazas que no son crebles. I?ado que cada conjunto
de mformacin contiene un nico elemento, cada nodo de decisin del
rbol representa una contingencia posible en la que podra corresponderle
actuar a un jugador. El proceso de moverse hacia atrs a lo largo de la
forma extensiva, nodo a nodo, se concreta por tanto en forzar a cada
jugador a considerar llevar a cabo todas y cada una de las amenazas que
el Jugador pudiera hacer. En un juego con informacin imperfecta, sin
embargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenal
men~s ~n conjunto de informacin con ms de un elem'ento. Aqu se
podna mtentar el mismo enfoque: proceder hacia atrs a lo largo de la
forma extensiva y alcanzar eventualmente un nodo de decisin contenido
en un conjunto de informacin con ms de un elemento. Pero forzar al
jugador a considerar lo que hara si se llegase a ese nodo de decisin no

es equivalente a forzar al jugador a considerar una posible con~ngencia


en la que le correspondera jugar, ya que si en el transcurso del Juego se
llega a ese conjunto de informacin, el jugador no sabe si se ha ~~~ado ~
ese nodo de decisin o no, precisamente porque el nodo de deClslOnesta
contenido eh un conjunto de informacin con ms de un elemento.
Una forma de tratar l problema de los conjuntos de informacin co~
ms de un elemento cuando se utiliza induccin hacia atrs, es proce'der hacia atrs a lo largo de la forma extensiva hasta que se encuentre
un conjunto de informacin con ms de un elemento, pero saltndoselo
y siguiendo hah arriba"en el rbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.
formacin con unniw elemento. Uegados ahhabra que consIdera::'.
no slo lo que el jugador al que le corresponde jugar
~ecnjUrit'"
de informacin con unnicQ elemento hara'si sealCanzase:s itod"de
decisin, sino tambin la accin que tomara el ~ga:dr al que le'crres~
ponde jugar en cada ~o de los conjuntos de informaciIl.c'o~.'~~~~e.~
elemento que se han saltadO. "En trininospoco foIirlls, este procedi~
miento proporciona un ~qiiilibrio de NashI'erfctd'en~subjuego~::}:J-:i
segunda manera de tratar el problema 'es proceder' haCi~atrs:<il"Ya:rIf
de la forma extensiva hasta 'encontrar un conjrito'd-infomiioIi:'con
ms de un elemento; Forzar entcmces al jugador'alqe're"corrsp6fiCI~
jugar en ese conjunto' de illforma'cina considerarlo qiieha'riiaellegarsi~
a ese conjunto de inforindn:(Hacer esto requiere que eljugadot.teng:
una valoracin probabilistic'con reSpecto a:que'nodoseha;lle'g~d~e~:el
conjunto de informacin.,Tal~ valoracin depender Il.a~~eri~~,r~
posibles decisiones de lo~ jugadores 'queestn pr~Criia'~J:l!.:kf:tt~Y.,';g~'~
forma que una pasada de abajo arriba a.la lrgo delTbol1tiliZh:(l~st~:.; "
mtodo no puede proporcionar una solucin-),~n.t~os'inf()iin~~I
este procedimiento proporciona un equilibrio bayesiano perfedo.{vse

::.:',,,

en

','.'

(: '
.;:'

,....

,,'"

-,

captulo 4).

2.5 Lecturas adicionales


...-.,

Seccin 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:
tacin sindical, vase ~ m~d~k, de negociacin repetida en.Espinosa y
Rhee (1989; ejercicio 2,lO}y un'modelo de tina nica negociacin en el que
las empresas pueden escoger negociar sobre salarios y empleo o slo sobre
salarios, en Staiger (199), Sobre la negociacin sucesiva, vase un modelo
al estilo de Rubinstein de negciacin entre una empresa y un sindicato en

Ejercicios
130 / JUEGOS DINMICOS CON INFORMACIN

",

.',.-.

/ 131

COMPLETA (c. 2)

Fernndez y Glazer (1991), con la caracterstica nueva de que el sindicato


debe decidir si convocar o no una huelga despus de que el sindicato o
la empresa rechacen una oferta. Existen mltiples equilibrios perfectos
en subjuegos efi~ientes que incorporan, ~ su vez, equilibrios perfectos en
subjuegos ineficientes (es decir, que incluyen huelgas), aun cuadohaya "
informacin completa. El libro de Osborney Rubinstein (1990) examina'
muchos modelos de negociacin en teora de juegos, los relaciona con el
enfoque axiomtico de Nash sobre la negociaci6n y utiliza los modelos de
negociacin como base de la teora del mercad~.
',~
Seccin 2.2: Sobr~ los pnicos. bancarios, va~e JaCkJiny ,Bhattachary
(1988). El libro de, McJ\.1illan(1986)e.xmina l;ls.prjmer;lsapliciK~Qries-'d teora de juegos a la economainternaciolv~i;:vaseuntrabajo'ths
rec~ente sobre la deuda exterior en Bu19W..y Rogff(1989) .. Sobre los
torneos, consltese un modelo en el qu lbs trabajadores pueden tanto
aumentar su produccin como sabotear la de los dems, en Lazar (1989;
ejerc~cio2.8). Vaseen Rosen (1986) el tem.ade los premios necesarios
paraIT)antener los incentivos en Una,sucesi8n de torneos en los' que los
perdedores en una etapa no pasan a la siguiente.
.
Seccin 2.3: Benoit y Krishna (1985)analizan juegos repetidos finitos,
Sobre larenegociacin en los juegos repetidos finitos, consltese Benoit
y Krishna (1989), y en los juegos repetidos infinitos vase el artculo panormico de Farrell y Maskin (1989). :Tirole(1988, captulo 6) examina
modelos dinmicos de oligopolio. El libro de Akerlof y Yellen (1986) recoge algunos de los tra~ajos ms importantes sobre salarios de eficiencia
y frece una introduccin integradora. Sobre poltica monetaria, vase
en Ball (1990) un resumen de los hechos estilizados, una revisin de los
modelos existentes y un modelo que explica la trayectoria temporal de la
inflacin.
Seccin 2.4: Vase un tratamiento formal de los juegos en forma extensiva en Kreps y Wilson (1982), y un enfoque ms verbal en Kreps (1990,
captulo 11).

ingresOs [A e Ip y escoge una herencia,B, que dejar al hijo. La ganancil


del hijo es UUR + B); la del padre es VUp - 13)+ /,;UUR + B), donde /,;> O
refleja la preocupacin del padre por el bienestar del hijo. Supongamos
que la accin es un nmero no negativo, A ::::0, que las funciones de
ingreso I H(A) e Ip(A) son estrictamente cncavas Y tienen un Imximo
en AH >
Y Ap >
respectivamente, que la herencia B puede ser
positiva o negativa y que las funciones de utilidad U y V son crecientes
y estrictamente cncavas. Demustrese el teorema del "nif1o mimado":
en el resultado por induccin hacia atrs, el hijo escoge la accin LJue
maximiza elingreso agregado de la familia fH(A) + Ip(A), a pesilr de que
slo la funcin de ganancias del padre es de alguna forma altruista,

2.2 Supongamos ahora que padre e hijo juegan un juego diferente, analizado originalmente por Buchanan (1975). Los ingresos IH e Ip estn
fijados exgenamente. Primero, el hijo decide qu parte del ingreso If{
ahorrar (S) para el futuro, consumiendo el resto UR - S) hoy. En segundo lugar, el padre observa la eleccin de S por parte del hijo y escoge una herencia, B. La ganancia del hijo es la suma de las utilidades
presente y futura: Ul UR - S) + U2(S + B). La ganancia del padre es
V(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones de
utilidad Ul, U2, y V son crecientes yestrictamente cncavas. Demustrese
que hay un "dilema del samaritano": en el resultado por induccin hacia
atrs, el hijo ahorra demasiado poco, para inducir al padre a dejarle una
herencia mayor (es decir, tanto las ganancias del padre corno las del hijo
podran aumentar si S fuera convenientemente ms alto y B convenientemente ms bajo).
2.3 Supongamos que los jugadores en el juego de la negociacin con horizonte infinito de Rubinsteintienen factores de descuento diferentes: 81
corresponde al jugador 1 y {j2 al jugador 2. Adptese el argumento dado
en el texto para demostrar que en el resultado por induccin hacia atrs,
el jugador 1 ofrece el acuerdo

2.6 Ejercicios
2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,
anahzado originalmente por Becker (1974). Primero el hijo toma una
accin, A, que.resulta en un ingreso para l, IR (A), yen un ingreso para
el padre;Jp(A).
(Pensemos en I H(A) corno el ingreso dl hijo, neto de
cualquier coste de, la accin A.) En segundo lugar, el padre bserv los

al jugador 2, quien lo acepta.


2.4 A dos socios les gustara completar un proyecto. Cada socio recibe la
ganancia V una vez el proyecto ha sido completado, pero ninguno de ellos

132/

JUEGOSDINMICOS CON I~JFOR\'IACINCOMPLETA (c. 2)

recibe ganancia alguna antes de que el proyecto se haya podido terminar.


El coste que queda hasta que el proyecto se complete es R. Ninguno de
los socios puede comprometerse a hacer aportaciones futuras de cara a
completar el proyecto, de forma que deciden establecer el siguiente juego
de dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de cara
a completar el proyecto. Si esta contribucin es suficiente para completar
el proyecto, el juego se acaba y cada socio recibe V. Si esta contribucin no
es suficiente para completar el proyecto (es decir, Cl < R), en el periodo
2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto.
Si la suma (sin descontar) de las dos contribuciones es suficiente para
completar el proyecto, el juego acaba y cada socio recibe V. Si la suma
es insuficiente para completar el juego, ste termina y ningn socio recibe
nada.
Cada socio debe obtener el dinero con el que contribuye a financiar
el proyecto de otras actividades lucrativas. La forma ptima de hacerlo
es sacar primero dinero de las alternativas menos rentables. El coste (de
oportunidad) que resulta de una contribucin es, por tanto, convexo con
respecto al tamao de la contribucin. Supongamos que el coste de una
contribucin e es e2para cada socio. Supongamos que el socio 1 descuenta
los beneficios del segundo periodo de acuerdo con el factor de descuento
5. Calclese el nico resultado por induccin hacia atrs de este juego
de contribuciones de dos periodos para cada tro de parmetros (V,R,5);
vase el caso con horizonte infinito en Admati y Perry (1991).
2.5 Supongamos que una empresa quiere que un trabajador adquiera
la preparacin necesaria para desarrollar una determinada tarea, pero
dicha tarea eS tan inconcreta que ningn tribunal podra verificar si el
trabajador ha adquirido o no la preparacin necesaria. (Por ejemplo,
la empresa podra pedir al trabajador que se familiarizase con "nuestra
forma de hlCerlas cosas", o se hiciera un experto en "este nuevo mercado
en el que podramos entrar".) La empresa,. por tanto, no puede firmar
un contrato para reembolsar al trabajador el coste de esta preparacin:
incluso si el trabajador adquiere esta preparacin, la empresa puede decir
que el trabajador no lo ha hecho, y ningn tribunal podra decidir quin
tiene razn. Del mismo modo, el trabajador no puede firmar un contrato
para adquirir esta preparacin si se le ha pagado por adelantado.
La empresa podra utilizar, como incentivo para que el trabajador
adquiera la preparacin, promesas (crebles) de ascenso de la siguiente
forma. Supongamos que hay dos trabajos en la empresa, uno fcil (E) y

Ejercicios I 133

otro difcil (D), y que la preparacin es til en los dos empleos, pero ms
. en el difcil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajador
produce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel de
preparacin de j (~ O o S). Supongamos que la empresa puede comprometerse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; pero
ningl,J.n9de estos dos salarios puede ser menor que el salario alternativo
del trabajador, que normalizamos a cero.
El desarrollo temporal del juego es el siguiente: En el momento O la
empresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~mento 1 el trabajador entra a formar parte de la empresa y puede adqumr
el nivel de preparacin S a un coste C. (Ignoramos laproduccin'y los
salarios en el primer periodo. Puesto que el trabajador no ha adqUirido
an la preparacin, lo eficiente es que se le asigne el trabajo E.) Supongamos que YDS - YEO > e, de forma que al trabajador leconyiene adquirir
la preparacin. En el momento 2 la empresa observa si el trabajador ha
adquirido o no la preparacin y decide entonces si concederle el ascenso
al trabajo D o no durante el segundo (y ltimo) periodo de empleo qel
trabajador..
"".':Los beneficios de la eID:presa en el segundo periodo son Yij- 'W;,
donde el trabajador realiza el trabajo 'i y tiene un nivel de preparacin j.
La ganancia del trabajador por realizar eltrabajo i en el segundo periodo
es 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en el
primer periodo. Hllese el resultado por induccin hacia atrs, Vase un
modelo ms complejo en Prendergast (1992).
!.:::' .
0'-

.~.

2.6 Tres oligopolistas operan en un mercado con una demanda inversa


dada por P(Q) = a - Q, donde Q = ql + q2 + q3 Y qj es la cantidad producida:.
por la empresa j. Cada empresa tiene un coste margipal de produccin
constante, e, sin costes fijos. Las empresas escogen sus cantidades de la
siguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3
observanql y escogen entonces simultneamente q2 y q3 respectivamente.
Cul es el resultado perfecto en subjuegos?
2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerza
de trabajo de todas las empresas de un oligopolio, comO el. Sindicato
.Unido de Trabajadores del Automvil en el caso de la General Motors,
Ford, Chrysler y otras. Sea la sucesin temporal de las jugadas anlog~ al
modelo de la seccin 2.1.C: (1) el sindicato realiza una demanda salanal,
"", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las

ti:! I

134 / JUEGOS DINMICOS CON INFORMACIN

Eje,.cici()~ / 135

COMPLETA (e. 2)

ganancias del sindicato escogen simultneamente los niveles de empleo,


.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa
es el salario que los miembros del sindicato podran ganar en un empleo
alternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas,
y los beneficios de la empresa i son i(w,L). A continuacin se describen
. losdeterminantes de los beneficios de dicha empresa: todas las empresas
..tienen la siguiente funcin de produccin: el nivel de produccin es igual
al nivel de empleo; q = L. El precio de equilibrio es P(Q) = Q, - Q
cuando la cantidad agregada en el mercado es Q = q] + ... ' + qn. Para no
complicar las cosas, supongamos que las empresas no tienen ms costes
que los salariales. Cul es el resultado petfeto en subjuegos de este
juego? Cmo (y por qu) afecta el mimero de empresas a la utilidad del
sindicato en el resultado perfectb ..en subjuegos?
2.8 Modifiquemos el modelo de torneos d la seccin 2.2.D de forma
.que la produccin del trabajadori sea Y == e -'- (1/2)8j +E, donde Sj 2':
representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo
(productivo y destructivo) del jugador i es g(e) + g(8), como en Lazear
(1989). Demstrese que elpremio ptimo WA -W13 es menor que cuando
no hay posibilidad de sabotaje (como en el texto).

.".,;.,'

2.9 Consideremos dos pases. En la fec;l1a1, ambos pases tienen aranceles


.tan altos que no hay comercio entre ellos. Dentro de cada pas, los salarios
y el nivel de empleo se determinan como en el modelo de monopolio y
sindicato de la seccin 2.l.C. En la fecha 2, todos los aranceles desaparecen,
ahora cada sindicato fija el salario en su pas, pero cada empresa produce
para los dos mercados.
Supongamos que en cada pas la demanda inversa es P(Q) = Q, - Q,
donde Q es la cantidad agregada en el mercado de ese pas. Sea q = L la
funcin de produccin de cada empresa, de forma que los slariosson el
nico coste dela empresa, y sea U(w,L) = (w -wo)L la funci6n de utilidad
del sindicato, donde 71Jo es un salario alternativo para los trabajadores.
Calclese el resultado por induccin hacia atrs en la fecha l.
Considrese ahora el siguiente juego en la fecha 2. Primero, los dos
sindicatos escogen simultneamente los salarios, 1J)] y 1J)2. Las empresas
observan los salarios y escogen los niveles de produccin para los mercados interior y exterior, que denotamos mediante h y e en el caso de
la empresa del pas i. Toda la produccin de la empresa se realiza en
su propio pas, de fo.rma que el coste total es Vi(h + e). Calclese el

resultado perfecto en subjuegos. Demustrese que los salarios, nivel de


empleo y beneficios (y, por tanto, tambin la utilidad del sindicalo y el
excedente del consumidor) aumentan cuando los aranceles desapilrecen.
Vase otros ejemplos en la misma lnea, en Huizinga (1989).
2.10 El juego de decisin simultnea que a continuacin se describe se
juega dos veces, habindose observado el resultado de la primera etapa
antes de que empiece la segunda. No hay descuento. La variable T
es mayor que 4, de forma que (4, 4) no es una ganancia de equilibrio
del juego jugado una sola vez. Para qu valores de x es la siguiente
estrategia (jugada por ambos jugadores) un equilibrio de Nash perfecto
ensubjuegos?
Jugar Q en la primera etapa. Si el resultado de la primera etapa es
(Ql,Q2), jugar P en la segunda etapa. Si el resultado de la primera
etapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si el
resultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si en
la segunda etapa. Si el resultado de la primera etapa es (y,z)donde
y =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.

2,2

x,O

-1,0

0,0

O,x

4,4

-1,0

0,0

0,0

0,0

0,2

0,0

0, -1

0, -1

-1, -1

2,0

2.11 El juego de decisin simultnea que a continuacin se describe se


juega dos veces, habindose observado el resultado de la primera etapa
antes de que empiece la segunda. No hay descuento. Puede alcanzarse
en la primera etapa la ganancia (4,4) en un equilibrio de Nash perfecto en
subjuegos con estrategias puras? En caso afirmativo, especifquense las
estrategias que lo pem1ten. En caso negativo, demustrese por qu no.
1

A 3,1 0,0 5,0

lvI 2,1 1,2 3,1


B 1,2 0,1 4,4

136 I JUEGOS DINMICOS CON INFORMACIN COMPLETA Ce. 2)

2.12 Qu es una estrategia en un juego repetido? Qu es un subjuego en


un juego repetido? Qu es un equilibrio de Nash perfecto en subjuegos?
2.13 Recurdese el modelo de duopolio de Bertrand esttico (con produetos homogneos) del ejercicio 1.7: las empresas fijan los precios simultneamente; la demanda del producto de la empresa i es a - Pi si
Pi < Pj, es Osi Pi > Pj y es (a - p)/2 si Pi = Pj; los costes marginales son
e < a:-Considrese el juego repetido infinitamente basado en este juego
de etapa. Demustrese que las empresas pueden utilizar estrategias del
disparador (que significan jugar para siempre el equilibrio de Nash del
juego de etapa despus de cualquier desviacin) para mantener--~lnivel
de precios de monopolio de un equilibrio de Nashperfecto en subjuegos'
si ys~lo si O ~ 1/2.'
_
2.14 Supongamos que lldemanda flucta de formlaleatoria en el juego
de Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada
.periodo, el punto de interaccin de la fu~cinde dema;nda con el eje de
abcisas es aA. con probabilidad 'Ir.y aB aA) co~ probabilidad 1 -::'Ir; las
demandas en los diferentes perlados son indep~nciientes. Supongamos
que en cada periodo el nivel de demanda es revelado a ambas empresas
antes de que stas escojan los precios de ese periodo. Cules son los
niveles de precios de monopolio (P.4 y PB) para los dos niveles de demanda? Calclese 0*, el fi1enor valorde 8 tal que las empresas pueden
utilizar estrategias del disparador para mantener estos niveles de precios
de monopolio (es decir, jugar Pi cuando la demanda es a para i = A,E)
en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de O
entre 12 y 0* hllese el precio mximo p(o) tal que las empresas puedan
utilizar estrategias del disparador para mantener el precio p(o) cuando la
demanda es alta y el precio P B cuando la demanda es baja en lln equilibrio
de Nash perfecto en subjuegos. (Vase Rotemburg y Saloner 1986.)
2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. La
demanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,..
Consideremos el juego repetido infinitamente basado en este juego de
etapa. Cul es el valor menor de -O tal que las empresas pueden utilizar
estrategias del disparador para mantener el nivel de produccin de monopolio en un equilibrio de Nash perfecto en subjuegos? Cmo vara la
respuesta al cambiar -n? Por qu? Si (j es demasiado pequeo para que
las empresas utilicen estrategias del disparador para mantener el nivel de

Ejercicios I 137

produccin de monopolio, cul es el equilibrio de Nash perfecto en subjuegos simtrico ms rentable al que puede llegarse utilizando estrategias
del disparador?
j'.'

2.16 En el modelo de salarios y nivel de empleo analizado en la seccin


2.1.C, el resultado por induccin hacia atrs no es socialmente eficiente.
En la prctica, sin embargo, una empresa y un sindicato negocian hoy los
trminos de un contrato por tres aos, renegocian al cabo de tres aos
los trminos de un segundo contrato y as sucesivamente. Por tanto, esta
. relacin se puede caracterizar con ms o menos exactitud como un juego
repetido, como en Espinosa y Rhee (989)..,-'-"
En este problem~ se denvan condiciones bajo las cuales un eqUilibrio
de Nash perfecto en subjUegos dl juego repetido infinitamente es superior:
en el, sentido de Paretoal resultado por induccin hacia atrs del juego
jugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidad
del sindicato y los beneficios de la empresa en el resultado por induccin
hacia atrs del juego jugado una sola vez. Consideremos un par utilidad"-, ,
beneficio alternativo (U,'Ir) asociado con un par salari-empleo alteriatlv :
(w,L). Supongamos que ambas partes tienen elmisinofador de descu~i.to:
O (para cada periodo de tres aos). Dervense condiciones sobre (w,L)
tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)
sea el resultado de un equilibrio de Nash perfecto en subjuegos del juego
repetido infinitamente, donde se juega (U* ,'Ir*) para siempre despus de
cualquier desviacin.
'.- -~
'':'''. ":/."

2.17 Consideremos el siguiente juego con horizonte infinIto entre una


nica empresa y una sucesin de trabajadores, cada uno de los cuales vive
durante un periodo del juego. En cada periodo, el trabajador decide. s
esforzarse y producir por tanto a un nivel y con un coste por elesfuerzo
de c, o no esforzarse, no producir nada y no incurrir en ningn coste. Lo
que se produzca es propiedad de la empresa, peto sta puede compartirlo
con el trabajador pagndole un salario como se describe a continuacin:
supongamos que al principio del periodo el trabajador dispone de una
oportunidad alternativa con un valor de cero (neto del coste por el esfuerzo) y que no se puede obligar al trabajador a aceptar un salario por
debajo de cero. Supongamos tambin que y > c de forma que esforzarse
es eficiente.
Dentro de cada periodo, el desarrollo temporal es el siguiente: primero el trabajador escoge un nivel de esfuerzo, a continuacin tanto la

(;::-:-'

:~

138 / JUEGOS OlNMICOS CON INFORMACIN

empresa corno el trabajador observan el nivel de produccin y finalmente


la empresa escoge un salario para pagar al trabajador. Supongamos que
no existe manera de hacer cumplIr los contratos salariales: no hay ninguna restriccin sobre la eleccin del salario por parte de la empresa.
En el juego de un periodo, sin embargo, perfeccin en subjuegos implica
que la empresa ofrecer un salario de cero produzca lo que produzca e!
trabajador, de forma que el trabajador no se esforzar.
Consideremos ahora el problema con horizonte infinito. Recordemos
que cada trabajador vive slo por un periodo. Supongamos, sin embargo,
que al principio del periodo t, la historia del juego hasta el periodo t - 1 es
conocida por el trabajador que trabajar eh el periodo t. (Pensemos como'
si esta informacin.setransrnitiese de generacin a generacin entre los
trabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdo
con el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:
la empresa y de cada trabajador en un equilibrio perfecto en subjuegos
del juego cOllhorizonte infinito en las que en equilibrio cada trabajador
se esfuerza y produce por tanto a un niyely, siempre y cuando el factor
de descuento sea lo suficientemente alto. Dse una condicin necesaria y
suficiente para ,que su equilibrio exista.
2.18 Qu es una estrategia (en un juego arbitrario)? Qu es un conjunto
de informacin? Qu es unsubjuego (eh un juego arbitrario)?
2.19En la versin de tres periodos del modelo de la negociacin de Rubinstein analizada en la seccin 2.1.D, calculamos el resultado por induccin
hacia atrs. Cul es el equilibrio de Nash perfecto en subjuegos?
2.20 Consideremos las siguientes estrategias.en la versin de horizonte
infinito del modelo de la negociacin de Rubinstein. (Recordemos la
convencin notacional de que la oferta (s,1 - s) significa que 'el jugador 1
obtendr s y el jugador 2 obtendr 1 - s, independientemente de quien
haga la oferta.) Sea s. = 1/(1 + ). El jugador 1 siempre ofrece (s" ,1 - s.)
y acepta una oferta (s,l - s) slo si s ~ s . El jugador 2 siempre ofrece
(1 - s. ,s*) y acepta una oferta (.s,l - s) slo si 1 - s ~ 5s.: Demustrese
que estas estrategias son un equilibrio de Nash. Demustrese que este
equilibrio es perfecto en subjuegos.
2.21 Proporcinense las representaciones en forma extensiva y normal del
juego de la granada descrito en la seccin 2.1. Cules son los equilibrios
".Ij

"'",'

Refrrencias

COMPLETA (c. 2)

/\39

de Nash en estrategias puras? Cul es el resultado por induccin hacia


, 7 'Cul es el equilibrio deNash perfecto en subJuegos?
atraso

2.22Proporcinense las representaciones en for~~ae;xtensiva y,nonnal del


.
d 1 pnico bancario discutido en la seCCIOn2.2.B. Cuales son Jos
Juego e
..
7
equilibrios de Nash perfectos en subjuegos en estrategIas puras.
2.23Un comprador y un vendedor desearan realizar un intercambio. Antes de hacerlo, el comprador puede efectuar una inversin que aumenta
el valor que asigna al objeto a intercanlbiar. Esta inversin no pued: ser
observada por el comprador y no afecta el valor que el vendedor aSIgna
al objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.
empresa que compra otra. En algn momento antes de la [uslon, el comprador podra haber actuado en el sentido de cambiar los productos que
su empresa planea introducir en el mercado de forma que se complemen~
ten despus de la fusin con los productos de la ~mpr~sa comprada. SI
el desarrollo de un producto lleva tiempo y el CIclovItal del producto
es corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~o
esta inversin despus de la fusin.) Para el comprador el valor IIllClal
del objeto es v > O; una inversin de 1 aumenta est~ v~lor a '/)+ 1, ?ero
cuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmer
lugar, el comprador escoge un nivel de inversin 1e incurre en el cosle
12, En segundo lugar, el comprador no observa 1pero ofrece vender el
objeto por un precio p. En tercer lugar, el comprador a~epta o rechaza la
oferta del vendedor: si el comprador acepta, la ganancIa del comprador
es v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, ~tas
ganancias son _12 y cero respectivamente. Demustrese que .no eXIste
ningn equilibrio de Nash perfecto en subjuegos con estrate?las puras
en este juego. Calclese el equilibrio de Nash perfecto en SUbJ1,legos.
con
estrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna
. probabilidad positiva a dos niveles de inversin y la e~trategla mIxta del
vendedor slo asigna probabilidad positiva a dos precIOS.

2.7 Referencias
ABREU,

D. 1986. "Extremal Equilibria of Oligopolistic Supergames."

of Economic Theory 39:191-225.

JOlll'1wl

140/

-.

JUEGOS DfNMICOS CON INFORMACiN

1988. "On the Theory of lnfinitely

COMPLETA (e. 2)

Repeated

Referencias / 141

Carnes with Discounting."

Ecollometrica 56:383-96.
ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal
with Imperfect

o/ Economic

Cartel Equilipria

oumal o/ Economic Theonj 39:251-69.

Monitoring."

ADMATI, A., Y M. PERRY. 1991.

Review

"JointProjects

without

Commitment."

5tudies 58:259-76.

BALL, L. 1990. "Tirne-Consistent


Policyand
Persistent
Changes
Hation." National
Bureau of Econornic R.esearch Working Paper
(Decernber).
-

in In#3529

BARRO, E., Y D. CORDON. 1983. "Rules, Discretion, and Reputation


Model of Monetary.Policy."
oumal of Monetanj Economics 12:101-21.
"A Theory

o/ Economic

"A Non-cooperative

Equilibrium

for Supergames."

Studies 38:1-12.

FUDENBERG,D., Y E. MASKIN. 1986. 'The Folk Theorem


with Discounting

AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the Labor
Market. Cambridge, Inglaterra: Cambridge University Press.

BECKER, G. 1974.

FRIEDMAN, J. 1971.

Review

and Incomplete

CREEN, E., YR. PORTER. 1984. "Noncooperative


Pricelnformation,"
Econometrica 52:87-100.
HUIZINGA, H. 1989. "Union
Stanford University, Mirneo.

in Repeated

Carnes

Econometrica 54:533c54.

Inforrnation."

Collusion

Wage Bargaining

Under Irnperfect

and Industry

Structure."

JACKLIN, c., y S. BHATTACHARYA. 1988. "DistinguishingPanics


formation~based
Bank Runs: yYelfare and Policy Implications."
Political Economy 96:568~92.

and In':

oumal of .

in a
KREPS, D. 1990. A Course in Microeconomie Theory. Princeton,
University Press.

NJ: Princeton

oumal of Political

of Social Interactions."

Economy 82:1063-93.

KREPS, D., Y R. WILSON.

1982.

"Sequential

Equilibrium:."

Eeonometne~
. .' ~;

BENOIT, J-P., y V Krishna.


53:905-22.

1985. "Finitely

-. 1989. "Renegotiation
in Finitely
School Working Paper #89-004.

Repeated

Econometrica

Carnes."

50:863-94..

E. i989. "Pay Equality


Eeonomy 97:561-80.

LAZEAR,
Repeated

Carnes."

Harvard
.

Business

BUCHANAN, J. 1975. "The Sarnaritan'sDilernrna."


In Altruism, Morality,
and Economic Theonj, E. Phelps, ed. New York: Russell Sage Foundation.
BULOW, J., y K. ROGOFF. 1989. "Sovereign

Debt:

Is to Forgive

to Forget?"

American Economic Review 79:43- 50.


D[AMOND, D., Y P. DYBVIG. 1983. "Bank Runs,
Liquidity." oumal of Political Economy 91:401~19.

Deposit

ESPJNOSA, M., y C. RHEE. 1989. "Efficient Wage Bargaining

Insurance,

and

as a Repeated

Carnes."

Carnes

lid t'conomic Behavior 1:327-60.


FERNNDEZ, R., Y J. CLAZER. 1991. "Striking for a Bargain Between
Completely
Informed Agents." American Economic Review 81:240-52.

Politics." oumal of Politieal

LEONTIEF, W. 1946. "The Pure Theory of the Cuaranteed


Contract." oumal of Political Eeonomy 54:76-79.
McMn:.LAN, J. 1986. Carne Theory in International
Harwood Acadernic Publishers.

as Optimum:

Annual

Wage

Economies. ChUT, Suiza:

OsBORNE, M., Y A. RUBINSTEIN. 1990. Bargaining and Markets. San Diego:


Acadernic Press.
PRENDERGAST,

in Repeated

and Industrial

LAZEAR, E., Y S. ROSEN. 1981. "Rank-Order


Tournarnents
Labor Contracts." oumal of Politieal Eeonomy 89:841-64.

Came." Quarterly oumal o/ Economics104:565-88.


FARRELL,J., y E. MAsKIN. 1989. "Renegotiation

:L'.iC,;

.:/

man Capital

e 1992.

Acquisition."

"The Role of Prornoton


De prxima

in Inducing

aparicin

Specific Hu-

en Quarterly oumal o/

Eeonomies.
Two

ROSEN, 5.1986.

"Prizes and Incentives

rican Economie Review 76:701-15.

in Elimination

Tournaments.'~

Ame-

1;;
. ~,.

142 / JUEGOS DINMICOS CON INFORMACIN COMPLETA (e. 2)

ROTEMBERG,
J., y G. SALONER.1986. "A Supergame-Theoretic Model of
Busmess Cycles and Price Wars during Booms." American Economic Review
76:390-407.

3. JUEGOS ESTTICOS
CON INFORMACIN INCOMPLETA

RUB~STEJ.'\I,
A. 1982. "Perfect Equilibrium in a Bargaining Model." Econometrzca 50:97-109.
..

, ,'

.~

,~:;

~i~TEN,R. 1965. "S~i~~~he~retis.che.


Behandlung eines Oligopolmodells
24. Nachfragetraghelt. Zeltslzcrift fr Gesamte Staatswissenschaft 121:301SHA~~D,.A., ~ J. SurrON. 1984. "Involuntary Unemployment as a Perfect
Equzh?numm ~ Bargaining Model." Econometrica 52:1351-64.
S~IRO,C., yJ.'STIGLITZ.1984. "Equilibrium Unemployrnent as a D' 'plme Device." American Economic Review 74:433-44.
ISCl
SOB _L,
L y J. T~HASHI. 1983. "A MultistageModel
Remew of Economlc Studies 50:411-26.

of Bargainin ."
g

STA~:I<ELBERG,
H. VON. 1934.. Marktform und Gle:hgewicht.
Spnnger.

Viena: Julius

STAIGER~
D. 1991. "Why Do Union Contracts Exclude Employment?" Stanford Uruversity, Mimeo.
TIROLE,J. 1988. The Theory o/ Industrial Organization.
Press.

.{,;',

ambridge: MIT

Con este captulo comienza nuestro estudio de los juegos con ill!0r1110Il
incompleta, tambin llamados juegos bayesianos .. Recordemos que en un
juego con infoIDlacin completa las funciones de ganancias de. los juga~
dores son informacin del dominio pblico. Por el contrario, en un juego
con informacin incompleta, al menos un jugador no est'seguro de la
funcin de ganancias de otro jugador. Un ejemplo comn de un juego
esttico con informacin incompleta es una subasta de sobre cerrado:
cada participante conoce su propia valoracin del bien subastado, pero no
conoce las valoraciones de los otros participantes, y las pujas se entregm
en sobres cerrados, por lo que las decisiones de los jugadores pueden considerarse simultneas. Sin embargo, la mayora de los juegos bayesianos
con inters econmico son dinmicos. Como veremos en el captuJo,4,
la existencia de informacin privada conduce de forma natural a que las
partes informadas intenten comunicar (o a confundirlos), y que las partes no informadas intenten conseguir informacin. Estas cuestiones son
intrnsecamente
dinmicas.
.
'
En la seccin 3.1, definimos la representacin en forma normal de
un juego bayesiano esttico y el equ.i1ib'nbayesiano de Nash en dicil~
juego. Puesto que estas definiciones son abstractas y algo complejas,
introduciremos las ideas principales con un ejemplo sencillo, el de l~
competencia a la Cournot bajo informacin asimtrica.
En la seccin 3.2 consideramos tres aplicaciones. En priiller lugar,
ofrecemos una discusin formal de la interpretacin de las estrategias
mixtas dada en el captulo 1: la estrategia mixta del jugador .i representa
la incertidumbre del jugador i con respecto a la estrategia pura que eligir
j, y la eleccin de j depende de una cierta informacin privada. En
segundo lugar, analizamos una suba sta "de sobre cerrado en la que las
valoraciones de los participantes son informacin privada, mientras que
la valoracin del vendedor es conocida. Finalmente, consideramos el
caso en el que un comprador y un vendedor tienen, cada UIlO de ellos,
informacin privada sobre sus valoraciones (como cuando una empresa

14.1/

JUEGOS EST..\TICOS CON INFOR,"IAClN

INCOMPLETA (e. 3)

Teorla: llegas bayesianos estticos y equilibrio bayesimlO de Nash / 145

conoce el producto marginal de un trabajador y el trabajador conoce las


oporl1midades alternativas de que dispone). Analizamos un juego de
intercambio llamado subasta doble: el vendedor anuncia un precio de
venta y el comprador anuncia simultneamente un precio de compra;
el intercambio tiene lugar al precio medio si el ltimo es mayor que el
primero.
En la seccin 3.3 enunciamos y demostramos el Principio de revelacin,
e indicamos brevemente cmo puede aplicarse al diseo de juegos cuando
los jugadores tienen informacin privada.

De modo similar, si el coste de la empresa 2 es bajo, q';(cB) ser la solucin


de
max[(a

Competencia a la Cournot bajo informacin asimtrica


Consideremos un modelo de duopolio de COlirnot con demanda inversa
dada por P(Q) = a - Q, donde Q = ql + q2 es la cantidad agregada en
el mercado. La funcin de costes de la empresa 1 es CI (ql) = cql. Sin
embargo, la funcin de costes de la empresa 2 es C2(q2) = crlq2 con probabilidad f) y C2(q2) = CM2 con probabilidad 1- B, donde CB < CA. Adems,
la informacin es asimtrica: la empresa 2 conoce su funcin de costes y
la de la empresa 1, pero la empresa 1 slo conoce su funcin de costes y
que el coste marginal de la empresa 2 es CA con probabilidad e y CB con
probabilidad 1- e. (La empresa 2 podra ser nueva en el sector o haber desarrolJado una nueva tecnologa.) Todo esto es informacin del dominio
pblico: la empresa 1sabe que la empresa 2 cuenta con mejoiinformacin,
y la empresa 2 sabe que la empresa 110 sabe, y as sucesivamente.
Naturalmente, la empresa 2 querr elegir una cantidad diferente (y
presumiblemente menor) si su coste marginal es alto que si es bajo. Por
su parte, la empresa 1 debera prever que la empresa 2 puede ajustar
su cantidad al coste de la manera indicada. Sean qi(CA) y qi(CB) las
cantidades elegidas en funcin de sus costes, y sea qi la cantidad elegida
por la empresa 1. Si el coste de la empresa 2 es alto, sta elegir qi(cA) tal
que sea una solucin de

qi -

q2) - cBlq2'

Finalmente, la empresa 1 sabe que el coste de la empresa 2 es alto con


probabilidad B y debera prever que la cantidad elegida por la empresa 2
ser qi(CA) o qi(CB), dependiendo del coste de esta empresa. Por taJ;lto,la
empresa 1 elige qi que resuelve

3.1 Teora: Juegos bayesianos estticos y equilibrio bayesiano


de Nash
3.1.A Un ejemplo:

q2

maxB
q

[(a -, ql - qi(cA)

'cJ ql

+ (l -

B) [(a -ql

q2

qi -

c] ql

para maximizar el beneficio esperado.


. , .,
Las condiciones de primer orden de estos problemas de optinuzaclOn
son

q2(CA) -

a -

qi -

CA

a-

qi -

CB

-2

qi(c~)

.,"

L...

B [a - qi(cA)

ql =

c]

+ (l 2

B)-[a - qi(CB) ~c]

'

Supongamos que estas condiciones de primeror.den caracteriz~i~isoluciones de los problemas de 'optimizacin anterires, '\Recotdem:~s.~el
ejercicio 1.6 que, en un duopolio de Coumot .C?-!1 ~oI1llacin.co.~gl~ta,
si los costes de las empressson lo'suficientemente diferentes entre s, la
empresa con el coste alto no produce nada en-equilibio. Corno ejeicoo,
hllese una condicin suficiente para excluir aqu problemas anlogos.)
Las soluciones a las tres condiciones de primer orden son

y
max[(a

- qi(CB) -

q2) - cAlq2-

qi =-

a -

2c +BCA + (l 3

B)cB

"

1 .:.::-

(
"-'.-

146/

(..,

JUEGOS ESTTICOS CON INFORMACiN

.
s estlticos y eqllilib,'io bayesiallo de Nosl, ! 147
Teoria: Juegos bayesw,lO

INCOMPLETA (c. 3)

Comparemos q2:(CA), q2:(CB) y qj con el equilibrio de Cournot con


informacin completa y costes el y ez, Suponiendo que los valores de et y
Cz son tales que ambas cantidades de equilibrio son positivas, la empresa
i produce q = (a - 2Ci + cj)/3, en este caso con informacin completa, Por
el contrario, en el caso con informacin incompleta, q2:(cA) es mayor gue
(a - 2CA + c)/3 y qi(CE) es menor que (a - 2CB + c)/3, Esto ocurre porque la
empresa 2 no slo ajusta su cantidada su coste, sino que tambin respohde
al hecho de que la empresa 1 no puede hacerlo. Por ejemplo, si el coste
de la empresa 2 es alto, sta produce menos porque su costE4'esalto, pero
por otro lado produce ms porque sabe que la empresa 1 producir una
cantidad que maximice su beneficio esperado y qu, por ello, es menor
delo que producira sisupier que ~l cbstede la empresa 2 es alto, (Una
cara:tersticade este ejemplo que puede prestarse a confusin, es que qi es
exactamenteigliala las cantidades deC:ournot espetadas que la empresa 1
producira en los'dos juegos correspondientes con informacin completa.
Esto no es cierto normalmente; consideremos por ejemplo el caso en el
cual el coste total
la empresa i es cq'f)

de

3.1.B Representacin en forma nlirmal de los juegos bayesianos


estticos
Recordemos que la representacin en fOI1Jlanormal de un juego con informacin completa de n jugadores es G = {SI' , , . ,S~; u], ' , . 11,n}, donde S es
el espacio de estrategias del jugador i y 11,(Sl, ,., ,sn) es laganancia al jugador i cuando los jugadores ligen ras estrategias (S], ~.: ,~~),'S~
e~~~rgo,
como discutimos en la seccin 2,3,13" en un juego d decisin siriitnea
con informacin completa, para un jugador una estra~egia ~~s{mplemente
una accin, por laque podemos escribir G'; {Al .... ~,A~;11,],... 'Un}'
donde Ai es el espacio de acciones dei y 1Li(a], .. , ,an) es la ganancia
del jugador i cuando lo,sjugadores eligen las acciones (a]" , "an), Para
preparar nuestra descripcin del desarrollo temporal de un juego esttico
con informacin incompleta,describimos
la secuencia temporal de un juego
esttico con informacin completa del siguiente'modo: (1) ios jugadores
toman simultneam:ente sus decisiones (el jugador i elige del conjunto
factible A), y luego (2) reciben las ganancias 11,i(a], ' , . ,an).

a;

""-

Ahora queremos representar en forma normal un juego d decisin simultnea con informacin incompleta, tambin llamado juego bayesiano
esttico, El primer paso consiste en representar la Idea de que cadajugadar conoce su funcin de ganancias, pero puede no conocer las de otros

'bl es fun.,dones de ganancias de ., /),;(0.], ... ,0,,,; /,,),'


Sean la POSI
ugad ores.
,
'd'
pertenece a un conjunto de tlPOSPOS1.
!ttpO del Juga or 1" que
. .
donde t es e
'1
esponde a una de las fUllcJOlles
.
es aGiode tipos) 7';. Clda tIpO 'i corr ,
bies (o PI'
ador i podna tener.
de ganancias diferente que e Jug
~os que el J'ugador i tiene dos posi, plo abstracto, supongar.
. ,
Como eJem
'D"
s en este caso que el jugador'/. tlene
'ones
de
gananCIas.
]namo
.
.
J
}
f
l'
de tipos del J'ugador '1 es Ti = l.til,liz
.bies unCI
's
t. Y h que e espaCIO
. )
dos hpO, ,1
'~d
ias del jugador i son 11,i(al,' .. ,0,,,, til Y
Yque las dos funcpIOndesoesgua:::r la idea de que cada uno de los tipo.s
(
a 't-z)
o em
"d 1 f nciones de gananCIas
. d'fJ 'eren t e
tii al,' , ., "",
'
dar corresponde a una e as u
1'
d.e Juga
. ,
1fin de representar
de que
.
'. laposibilidad
.
1, ador podna tener, con e
que
e
ug
.
d'f
tes
conJ'untos
de
acciones
factibles,
como
.
d'
ador puede tener 1 eren
1
ca
a
Jug
,
"
.
S
s
por
eJ'emplo,
que
el
conjunto
.
os a contmuaCIOn, upongamo,
} ee
vereID
,
d ar t. es {b}
con probabilidad q y {o"b,c con
.
factibles del Juga
a,
(
aCCIOnes
d
afirmar que i tiene dos tipos ti1
bTd dI Entonces po emos
,
proba 11 a a r~babi1idad de til es q) y podemos decir que el conjunto
~:i~C:i:~:

~ac~bles de i es {a,b,c} para amb~s tipos, pero hacer que la


. d d 1 gir c sea -00 para el tlpO til'
ganancia de,nva l~ :: ;oncreto consideremos el juego de Cournot de la
p
Como
eem . Las aCCIones
'd'
, , nterior
e 1a s empresas son sus decisiones sobre
secclOn a
'L
2 tiene dos posibles funciones de costes
las cantidades ql y qZ' a empresa
.
y, por ello, dos posibles funciones de beneficios o gananCIas:
'1rZ('1l,'1Z; cn) = [(a - '11 - qz) - CE) qZ

y
1rZ(ql,qZ;

CA) = [(a, - '11 - '1z) - CA) '12

La empresa 1 slo tie~e una funcin de ganancias posible:


'1rl(ql,Qz;C)

= [(a - ql - '1z) -

e)

ql

. que e 1 espaCIO
'de tipos
de" la empresa 2 es Tz = {CB,CA} y
Podemos deCIr
.
qu el espacio de tipos de la empresa 1 es 7] = {c}',
l'
d
'"
del.' tipo de un jugador, decrr
Da d a esta d e fimCIOn
'1 que e ' Juga~' or
,.
.-'
.-';, d"e gananCIas
'es
equivalente " a deCIr que e Jugalor /.
1 conoce su fuhcIOn
" '.
,
d ..decir que el Jugador '1, puede no estar
conoce su tIpo, Del rmsmo mo o,
, I t .
de otros J'ugadores es
seguro d e las fuh'CIonesed ganancI'as
.
. equwa ene
d
'
a decir que puede no estar
seguro. de los tipos de otros Jugadores,
, r, e-I
t ). Utilizamos T-i para mucar e
notados por t- = (t],., . ,/i_l,t,+l".
.. , 'n

148/

JUEGOS ESTTICOS CON INFORMACiN

INCOMPLETA (c. 3)

conjunto de todos los posibles valores de L y utilizamos la distribucin


de probabilidad Pi(LtlU para designar la conjetura sobre los tipos de los
otros jugadores, L, dado el conocimiento del jugador i de su tipo ti. En
cada aplicacin analizada en la seccin 3.2 (yen la mayor parte de la
literatura), los tipos de los jugadores son independientes, en cuyo caso
p(LtlU no depende de t'i, por lo que podemos escribir la conjetura del.
jugador i como Pi(Li). Sin embargo, hay contextos en los que los tipos
de los jugadores estn correlacionados, por lo que deberemos tenerlo en
cuenta en nuestra definicin de juego bayesiano esttico, escribiendo la
conjetura del jugador i como Pi(Ltlt;).1
Uniendo los nuevos conceptos de tipos y conjeturas con los elementos
ya familiares de la representacin en forma normal de un juego esttico
con informacin completa, obtenemos la representacin en forma normal
de un juego esttico bayesiano.
Definicin. La representacin ell onll a 110m/al deun juego bayesiano esttico
de JI jugadores exige concretar los espacios de acciones de los jugadores Al, ... ,An,
sus espacios de tipos T1, ... ,Tn, sus conjeturas PI/"',Pn
y sus fUnciones de
ganancias ul, ... ,un. El tipo del jugador i, t es collocido slo por el jugador
i, detennina la funcin de ganancias del jugador i, 'U(al, ... ,an; ti), y es un
elemento del conjunto de tipos posibles T;. La cOlljetura del jugador i, Pi(L Iti),
describe la incertidumbre de i respecto a los posibles tipos de 'los otros 1'1 - 1
jugadores, L dado el propio tipo de i, ti. Denotamos este juego como G
{Al,'"

,An;TI, ... ,Tn;PI,'"

,p,,;lL], ... Un}.

Siguiendo a Harsanyi (1967), suponemos que el desarrollo temporal


de un juego bayesiano esttico es la siguiente: (1) el azar determina un
vector de tipos t = (tI,' .. ,tn), donde ti se obtiene del conjunto de tipos
posibles Ti; (2) el azar revela ti al jugador i, pero a ningn otro jugador; (3)
los jugadores toman sus decisiones simultneamente; el jugador i elige ai
del conjunto factible A, y (4) se recibt;.nlas ganancias 'ui(a, ... ,an; ti). Con
la introduccin ficticia del azar en (1) y (2), hemos descrito un juego con
informacin incompleta como un juego con informacin imperfecta, donde
'1 Imaginemos que dos empresas estn compitiendo por desarrollar una nueva'tecnologia.
La posibilidad de xito de cada empresa depende en parte de la dificultad en desarrollar la '
tecnologa, dificultad que es desconocida, Cada empresa slo sabe si lo ha logrado o no, pero
no si la otra Jo ha conseguido. Sin embargo, si la empresa 1 ha tenido xito; es ms probable
que la tecnologia sea fdl de desarrollar y, por ello, tambin ms probable que la' empresa 2
la haya desarrollado. Por lo tanto, la conjetura de la empresa 1 sobre el tipo de la empresa 2
depende del conocimiento por parte de la empresa 1 de su propio tipo.

Teora: Juegos bayesianos estticos y equilibrio bayesiano de Nash / 149

con informacin imperfecta queremos decir (como en el captulo 2) que en


alguna ronda del juego el jugador al que le corresponde decidir no conoce
la historia completa del desarrollo anterior del juego. Aqu, como el azar
revela el tipo del jugador i al jugadori pero no al jugador j en el paso
(2),el jugador j no conoce la historia completa del juego cuando toma sus
decisiones en el paso (3).
Necesitamos tratar otras dos cuestiones algo ms tcnicas para completar la discusin sobre la representacin en forma normal de los juegos
bayesianos estticos. En primer lugar, existen juegos en los cuales el jugador i tiene informacin privada no slo sobre su propia funcin de
gananci.s,sino tambin sobre la funcin de ganancias de otro jugador.
Por ejemplo, en el ejercicio 3.2, cambiamos la informacin asimtrica del
modelo de Coumot de lasecin, 3.1.A de manera que los costes son
simtricos y del dominio pblico, pero una empresa conoce el nivel de
demanda y la otra no. Puesto que el nivel de demanda afecta lasfun~
ciones de ganancias de ambos jugadores, el tipo de la empresa informada
aparece en la funcin de ganancias de la empresa no informada. En el caso
de 1'1 jugadores, capturamos esta posibilidad permitiendo que la ganancia
del jugador i dependa no slo de las acciones (al,'.' ,an), sino
tambin de todos los tipos (tl, ... ,tn). Escribimos esta ganancia como
ui(at,

... ,an;tl,

,tn).

La segunda cuestin tcnica se refiere a las conjeturas Pi(Ltlti). SupOl\emos que es del dominio pblico que en el paso (1) del desarrollo
temporal del juego esttico bayesiano, el azar escoge un vector de, ,tipos
t = (tI, ... ,tn) de acuerdo con la distribucin a priori de probabilidad p(t\
Cuando el azar revela ti al jugador i, ste puede calcular laconjel:tiiPi(Lilti) utilizando la regla de Bayes:2'

a, "

Pi(Li Iti) =

p(L;,ti)
P(ti)

p(L;,ti)
p(L;,ti) .

t_iET_i

Adems, los otros jugadores pueden calcular las distintas conjeturas que
podra, formarse el jugador -i, dependiendo del tipo de i, concretame,nte
2 La regla de Bayes es una frmula para calcular P(AiB), la probablIidad (condidomida)
de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,El
las prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podido
ocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. La
regla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicional
d", que se d /1es igual a la probabilidad de que se den tanto A como B, dividida por. la
pr~babilida'd
pri9ri de que ocurra B.

150/

JUEGOS ESTt\TICOS CON INFORMACiN

Teoria: Juegos bayesimws estticos y eqllibrio bayesllIo de Nasl / 151

INCOMPLETA (c. 3)

para cada ti en Ti' Como ya indicamos, vamos a suponer a


menudo que los tipos de los jugadores son independientes, en cuyo caso.
p;(Li) no depende de ti, pero se obtiene a partir de la distribucin a priori
p(t). En este caso, los otros jugadores conocen la conjetura de i sobre sus
tipos.
Pi(Lilti)

.,
"

3.1.C Definicin del equilibrio bayesiano deNash


Ahora queremos definir el concepto de equilibrio de los juegos bayesiano~,
estticos. Para ello, necesitar1osd~finir primero los espacios de estrategias,
de los jugadores en dicho jueg.~Retordemos de las setciones2.3.By:'
2AB qtle la estrategia de unjtigadot'esun partde accin completo, que; 1
establece una accih factible para cad contihgenciaenla que el jugadt ".'~
podra tener que actuar: Dada la scuencia temporal del juego esttico
, ~ayesino<en ehual el azar comienza el juego eligiendo los tipos
los>':
Jugadores, una estrategi'a (pura)deljugadr i debe establecer una acci6i{ ,
posible para cadunO de los tipos posibles del jugador i.
",
i.
,

-.-"{'

..~:

. ,t '~' .. ,' .' :~'

Definidri:Enet'uegobayeslm.iJestticoG=={AI,:.A'TI
.".,'
nI
' .. "' T 'PI
P":; Ul~' .. ,U,;}, una'estrategia
del jugador i es una funcin Si(t;) donde, para
cada tipo ti en Ti, Si(ti)'determiha la accin del conjunto factible Ai que el tipo ti
elegira si el azar determinara que el jugador es de este tipo.
_

nI

1."/

Al contrario que en ls jugos (tahto estticos como dinmicos) con


informacin completa, en 'un juego bayesiano; los espacios de estrategias
no se dan en la representaCin 'en forma normal del juego; sino que s
construyen a partir de los espacios de tipos y acCiones. El conjunto' de
posibles estrategias (puras) del jugador i, Sir es el conjunto de toda,s las
funciones posibles con dominio T; y recorrido Ai. Por ejemplo, en una
estrategia de separacin, cada tipo ti en Ti elige una accin diferente ai
d~ Ai. Por el contrario, en una estrategia de agrupacin, todos los tipos
elIgen la misma accin. Esta distinei6h entre estrategias de separacin y
de agrupacin es importante para la discusin de los juegos dinmicos con
ir;0rmacin incompleta del captulo 4. Introducimos la distincin aqu
solo para ayudar a describir la'grart variedad de estrategias que'pueden
construirse a partir de un determinado par de espacios de tipos y acciones;
TiyAi.
_ ",'
.
I)u,~de parecer innecesari~ exigir que la estrategia dl jugador i determine una accin factible para eada uno de los tipos posibles del jugado~
,'.'.

'

/. Despus de todo, una vez el azar ha elegido un tipo particular y se


lo ha revelado a un jugador, puede parecer que el jugador no necesita
preocuparse por las acciones que podra haber tomado de haber salido
elegido otro tipo. Sin embargo, el jugadori necesita tener en cuenta lo que
harn los otros jugadores, y lo que harn depende de lo que piensen que
har el jugador 'i para cada ti en Ti. Por 10 tanto, para decidir qu hacer
una v~i que un tipo ha sido elegido, el jugador i tendr que pensar qu
habra hecho vara cada otro tipo de Ti que podra haber sido elegido.
Consideremos, por ejemplo, el juego de Coumot con informacin
asimtrica de la seccin 3.1.A. Argumentamos all que la solucin del juego
tonsiSt enlaeleccin de tres cantidades: qi(CA), qi(cs) y qj .En trminos
dl;: defiJ:lidnde estrategia q~e acabani.s de dar;t'par (q~(cA),qi(cB
esla estrategia de la empresa 2 y qj es la estrategia ded,'empresa 1. Es
fcilimagihar que la empresa2 elegir dif~rentes c~tidal~s' dependietlq
de su coste. Sin embargo, es igualmel1te importante darse c~enta de qDe
li elecdn de la cantidad de la emp~s~ debera tener en cuenta quej~
. cantidad de la empresa 2 depender "el coste de la empresa 2. PoP 16
tanto, si nuestro concepto de equilibrio es requerir que la estrategi"J~
la empresa 1 sea tma mejor respuesta a la estrategia de la empresa;2;.Ia
estrategia de la empresa 2 debe ser un par de cantidldes, una para ca9a
posible coste tipo, o si no, la empresa 1 no podra calCUlarsi su estrategia
es efectivamente una mejor respuesta a la estrategia dela empresa 2., .
De forma ms general, no podramos apJicar la nocin de equilibrio de
Nash a juegos bayesianos si permitiramos que la estrategia de un jugadf?r
nespedficara lo que el jugador hara si algunos tips're~ultarap. el~gi40;
por el azar. Este ~rgumento es anlogo .~ ~no 'delcapfUl~ 2:' 'pll'dk
haber parecido Innecesario 'exigir que laestratei derjtig:dor i el1.t[;4
juego dinmico con informacin completa especlfic';;;seuna accinf<lctibie
para cada contingencia en la cual el jugador i podra haber tenido q
jugar, pero no podramos haber aplic<ldola nocin de equilibrio de Nash
a juegos dinmicos con informacin completa si hubiramos permitido
que alguna estrategia dejara sin determinar las acciones del jugador en
alguna contingencia.
. Una vez dada la definicin de estrategia en un juego bayesiano, abordamosahora la definicin del equilibrio bayesiano de Nash, A pesar d~
la.complejidad notacibrial de la definicin; la idea central es simple y familiar: la estrategia de cada jDgador debe ser una mejor respuesta a las
estrategias de los restantes jugadores. Es decir, un equilibrio bayesiaJio,.. '
de Nash es simplemente un equilibrio de Nash en un juego bayesiano.''

152/

JUEGOS EST..i.TICOS CON INFORMACiN

Aplicaciones / 153

INCOMPLETA (e 3)

Definicin. En el juego bayesiano esttico G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .
estrategias
= (.~1',... ,"~) forman un equilibrio bayesiano
de Nash (con estrategias puras) si para cada jugador i y para cada uno" de sus
tipos ti en Ti, si (ti) es una solucin de

)J" ;(I, ... ,1,,} las

,,*

Pat
pera Boxeo
pera

2,1

0,0

Boxeo

0,0

1,2

Chris
Es decir, ningn jugador quiere cambiar su estrategia, incluso si el cambio supone
cambiar slo una accin para un tipo.
Es inmediato dem'ostrar que en un juego bayesiano esttico finito (es
decir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todos
conjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez con
estrategias mixtas. La demostracin es muy similar a la de la existencia
de un equilibrio de Nash con estrategias mixtas en juegos finitos con
informacin completa, por lo que la omitimos.
3.2 Aplicaciones
3.2.A Revisin de las estrategias mixtas
Como mencionamos en la seccin 1.3.A, Harsanyi (1973) interpret la
estrategia mixta del jugador j como la incertidumbre deTjugador i sobre
la estrategia pura elegida 'por el jugador j y que, a su vez; la eleccin de j
depende de cierta informacin privada. Ahora damos"i.m\~rlI1cido'ms
preciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~
juego con informacin completa puede (casi siempre) interpretarse como
un equilibrio bayesiano de Nash con estrategias puras en un juego muy
similar con algo de informacin incompleta. (No tendrem9sen cuenta los
casos raros en los cuales tal interpretacin no es posible.) De un modo ms
evocador, la caracterstica crucial de un equilibrio de Nashcori estrategias
mixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadr
i no sabe con certeza la eleccin del jugador j. Esta falta de certeza puede
provenir de algn suceso aleatorio o (ms probablemente) de tin poco de
informacin incompleta, como en el siguiente ejemplo.
-Recordemos que en la batalla de los sexos existen dos equilibrios de
Nash con estrategias puras, (pera, pera) y (boxeo, boxeo), y uno con
estrategias mixtas, en el que Chris elige la pera con probabilidad 2/3 y
Pat elige el boxeo con probabilidad 2/3.

La batalla de los sexos


Ahora supongamos que, aunque se conocen desde hace mucho tiempo,
Chris y Pat no estn seguros ele las ganancias del otro. En particular.' supongamos que: -la ganancia de Chris si ambos van a la p.era es 2+te, donde
te es informacin privada de Chris; la ganancia de Pat SI ambos van al boxeo es 2 + tp, donde tp es informacin privada de Pat, y te y tp se obtienen
independientemente de una distribucin uniforme en [O,;:;]. (La elec~~.
de una distribucin uniforme en [O,x] no es importante; la idea que queremos recoger es que los valores te y tp slo afectan ligeramente a las ganancias en el juego original, para lo cual podernos pensar que x es pequea.)
El resto de las ganancias son las mismas. En trminos del juego bayesiano
esttico abstracto en forma normal G = {Ae,Ap; Te,Tp; Pe,Pp; ue,up} los espacios de acciones son Ae = Ap = {pera, boxeo}, los espacios de tipos
son Te = Tp = [O,x], las conjeturas son Pe(tp) = )Jp(te) = l/~.para cada t~,Y
tp, Ylas ganancias son las siguientes:
Pat
pera

Boxeo

pera

2 + te,l

0,0

Boxeo

0,0

1,2 + tp

Chris

La batalla de los sexos con informacin incompleta


Vamos a construir un equilibrio bayesiano de Nash con estrategias
puras de la versin c()n i,nforrnacin incompleta de la batalla de l~~ sexos
en el cual Chris elige la pera si te es mayor que un valor cntico e -y
elige el boxeo en cualquier otro caso, y Pat elige el boxeo si tp es mayor.

""';

.','.
","

154/

,'.

\.~}

]VEGaS

Aplicaciones

INCOMPLETA (c. 3)

ESTTICOS CON INFORMACiN

que un valor crtico p y elige la pera en cualquier otro caso. En tal


equilibrio, Chris elige la pera con probabilidad (x - el/x y Pat elige el
boxeo con probabilidad (x - p)/x. Vamos a demostrar que, cuando la
informacin incompleta desaparece (es decir, cuando x tiende a cero), el
comportamiento de los jugadores en este equilibrio bayesiano de Nash en
estrategias puras tiende a su comportamiento en el equilibrio de Nash con
estrategias mixtas del juego original con informacin completa. Es decir,
tanto (x - el/x y (x - p)/xtienden a 2/3 cuando x tiende a cero.
Supongamos que Chris y Pat eligen las e;trategias qu~' acabamos de
describir. Para un valor dado de x vamos a determinar los valores de c y
p tales que las~str:ategiasf~rm~!} c~~qt4.l,ilJp9 J?~ye~ia,it2,.~eI::f
a,~!t,9ada
la estrategia d Pat, las gammcias esperadas de Clilis'"(el~gir la6pera y
el boxeo son'
,"
!

-.

E.(2+tc)+
j;

"

.,

[1- E...] .0=~(2:i-.t.c.)',< :'


X"

E. . + [1 '- E.] . 1 = 1 - E..'


'.

respectivamente. Por lo tanto, elegir la peraes ptiII1;~.


si y slo ?i
(3.2.1)

De forma similar, dada la estrategia de Chris,lasg~~ancias~spera1a,s


Pat por elegir. el boxeo y la pera son
'. '

[ 1--

C].
x

. O+ -(2 +

tp)

e.,
= -(2

de

.'

+ tp)

C]

ee
1-- .1+-.0=1--,
x
x
x

respectivamente. Parlo tanto, elegir el boxeo es ptimo si y slo si


x

tp .;::: ..-

:-

3 = p.

2:1;

+4:;
"

que tiende a 2/3 cuando :; tiende a cero. Por lo tanto, cuando la informacin incompleta desaparece, el comportamiento de los jugadores en
este equilibrio bayesiano de Nash con eslrategias puras del juego con
informacin incompleta tiende a su comportamiento en el equilibrio de
Nash con estrategias mixtas en el juego original con informacin completa,
3.2.B Una subasta

Consideremos la siguiente subasta de sobre cerrado al primer precio. Hay


.d.osparticipantes qu denminamos i = 1,2. El participante i tiene una
v~orad6n Vi del bien, es decir, si i consigue el bien y paga el precio
p;la gaiianCia' de i'es
'p. Las valoraciones de los dos participantes
iistfi urtifornementedistribUidas de fotina independiente en [O,1]. Las
pujas no pUEidensfnegativas .. Los participantes entregan sus pujas
simultneamente. La puja ms alta gana la subastay el ganador paga el
precio de su puja, mientras que el otro participante no obtiene nada ni paga
nada. En caso de empate, el ganador se determina lanzando una moneda.
Los participantes son neutrales al riesgo. Todo esto es informacin del
dominio pblico.
Para formular este problema como un juego bayesiano esttico, debe~
mas identificar los espacios de acciones, los espacios de tipos, las conjeturas y las funciones de ganancias. La accin del jugador i es entregar
una puja bi (no negativa) y su tipo es su vloracinvi' (En trminos del
juego abstraclo G = {A1,A2;T},1'z;Pl,P2;Ul,U2}'
el espacio de acciones es
Ai ~ [0,00) y el espacio de tipos es Ti = [0,1].) Como las valoraciones son
. independientes, el jugador i cree que Vj est uniformemente dislribuido
en [0,1], independientemente del 'valor de '1)i' Finalmen.te, la funcin de
ganancias del jugador i es

v; ~.

x'

-3 +)9

1------

/ 155

si bi > bj,
si bi = bj,
(3.2,2)

Resolviendo (3.2.1) y (3.2.2) simultneamente obtenemos p = e y p2 + 3px= O.'Reiolvlendo la ecuaCin de segundo gradase demuestra que la
probabilidad:deque Chris elija la pera; concretamente (x ::..c)/x, y la de
que Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a.

si bi

<

bj.

Para obtener un equilib~io bayesiano de Nash de este juego comenzarnos construyendo los espacios de estrategias de los jugadores. Recordemos que en un juego bayesiano esttico, una estrategia es una funcin
que va de tipos a acciones. Por lo tanto, para el jugador i una estrategia

156/

JUEGOS ESTTlCOSCON

INFORMACIN

INCOMPLETA Ce. 3)

Aplicaciones / 157

es una hmcin bJv) que determina la puja que elegira cada uno de los
tipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, la
estrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2)
del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2
constituye un equilibrio bayesiano de Nash si, para cada V en [0,1], b;(vi)
es una solucin de

max(v.-

b)

Prob{b >

bj(vj)}

-(v. - bi)

Prob{bi

= bj(uj)}.

Simplificamos la exposicin buscando un equilibrio lineal: bl (VI) =


+ clvl y ~(V2) = a2 + C2V2. Ntese que no estarnos limitando los espacios
de estrategias delos jugadores para incluir slo estrategias lineales, sino
que estamos permitiendo que los jugadores elijan estrategias arbitrarias
y nos preguntamos si existe un equilibrio lineal. Result!;que, puesto que
las valoraciones de los jugadores estn uniformemente distribuidas, no
slo existe un equilibrio lineal sino que ste es nico (en un sentido que
precisaremos). Veremos que b;(vi) = v;/2. Es decir, cada jugador,entrega
una puja igual a la mitad de su. valoracin ... Tal puja refleja el dilema
fundamental al que se enfrenta cualquier participante en una subasta de
este tipo: cuanto ms alta sea la puja ms posibilidades tiene de ganar;
cuanto nis baja sea la puja, mayor ser la ganancia si gana.
Supongamos que el jugador j adopta la estrategia Qj(Vj) = aj + CjVj.
Para un valor dado Vi la mejor respuesta del jugador i es una solucin de
al

n,ax(Vi - b) Prob{bi

>

aj

+ CjVj},

donde hemos utilizado el hecho de que Prob{bi = bj(vj)} =0 (puesto que


= aj + CjVj y Vj est uniformemente distribuida; tambin lo est bj).
Puesto que no ttene sentido que el jugador .i puje por debajo de la puja
mnima del jugador j y sera tonto por parte de ipujar por encima del
mximo del jugador j, tenemos que aj ::; bi ::; aj + Cj, por lo que
bj(v;)

P. ro b{b

.i

>

aj +Cjv]

} --

p.10 b { Vj

bi < ---

aj } = ---o
bi - aj

Cj

Por lo tanto, la mejor respuesta del jugador i es


si v. > a.JI
si Vi <aj.
l

5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo caso
bi (V) no es lineal, sino plana al principio y con pendiente positiva despus.
Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,
centrndonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse en
equilibrio: puesto que es ptimo para un tipo ms alto pujar tanto al
menos corno la puja ptima del tipo ms bajo, tenemos que Cj 2: O, pero
entonces aj 2: 1 implicara que bj(Vj) 2: Vj, lo que no puede ser ptimo.
Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'
caso b;(v.) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.
R9\:h~f\19s.
reRe!ir el D.1Smo
anlisis para el jugador j suponiendo que el
jugac!9i'iadOpta Iastrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,
aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultados
tenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.
dijimos antes.
Podramos preguntarnos si hay otros equilibrios bayesianos de Nash
en este juego, y tambin cmo las pujas en equilibrio cambian cuando
la distribucin de las valoraciones de los jugadores cambia. Ningunacie
estas cuestiones puede reslverse utilG:ando la tcnica que acabaiTIosdi
aplicar (proponer estrategias .lineales y despus derivar los coeficientes
que l~s cOnvierten enequllibrio).
No conduce a niI:guna part~ inte~~..
taradivinar todas las formas funcionales que podran tener otros egi1ilibrios de este j~ego, y no existe equilibrio lineal para ninguna otra distribucin de valoraciones. En el apndice, derivamos un equilibrio bayesiano simtrico}. nuevamente para el caso de valoraciones uniformemente
distribuida;, Suponiendo _qu~.lasestrategias de los jugadores son estric~
tamentecrecientes y diferenciables, demostrarnos que el nic,?equilibi;i,~
bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que ya1erros' deri~
vadO. La tcnica que utilizarnos puede extenderse fcilmente a una clase
ms amplia.de distribuciones de las valoraciones, y tambin al caso de n
participil;ntes.4

Cj

3 Un equilibrio bayesiano de Nash se denomina simtrico si las estrategias de los jugadores


son idnticas. Es decir, en un equilibrio bayesiano de Nash simtrico existe una sola funcin
b(Vi) tal que la estrategia b(v) del jugador 1 es b(v) y la estrategia bz(vz) del jugador 2 es
b(vz), y esta nica estrategia es una mejor respuesta a s misma. Por supuesto, puesto que
las valoraciones de los jugadores sern normalmente diferentes, sus pujas tambin lo sern,
incluso si ambos utilizan la misma estrategia.
4 La omisin de este apndice no impedir la comprensin del resto del libro.

AplicacirJlles

/ 159

.158 I JUEGOS ESTTICOS CON INFORMACiN INCOMPLETA (e. 3)

Apndice
Supongam.os queel jugador j adopta la estrategia bO y supongamos que
N.) es estnctamente creciente y diferenciable. Entonces', para un valor
dado de Vi la puja ptima del jugador ies una solucin de

>

maX(Vi - bi) Prob{bi

b(vj)}.

donde k es una constante de,integracin. Para eliminar k necesitamos una


condicin de frontera. Afortunadamente, un razonamiento econmico
simple nos ofrece una: ningn jugador debera pujar por encima de su
propia valoracin. Por tanto, debe cumplirse que b(Vi) ::; Vi para cada
Vi.
En particular, debe ocurrir que b(O) ::; O. Puesto que las pujas estn
restringidas a ser no negativas, esto implica que b(O) = O,Yentonces k = ()
y b(Vi) = vf2, como dijimos.

bi

Sea b-1 (bj) la valoracin-que el participante j debe tener para pujar bj; esto
es, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj est uniformemente clistribuida
en [O,ll,Prob{bi > b(1jt= Prob{b:2-I(b> v= b-1(bi). La condicin de
primer orden.para la opti~zacin del probletriadl jugador ies
.

-b-1(bi)

d'
+ (Vi ~ bi) db. b-(bi)
'1

= O.

.;

Esta condi<:i~es unaeclaciri iJ1pIcita d~ia m~jor~~sp'uesta del jugador


ta .la estrategIa b(.) jugada por j ddoqil~ la Viloracindei es Vi. Si la ..
estrategia bO tiene que ser un equilibrio bayesiano de Nash simtrico, es
necesario que la soluc_inala condicin de primer orden seab(vi). Es decir,
para cada una de las posibles valoraciones del pujador 7" ste no quiere
desvIarse de laestrategia bOdado que el jugador j utiliza esta est;ate~a.
Para imponer este requisito, sustituimos bi
b(Vi) en la condicin" de
primer orden, obtenielldo
+(Vi - b(Vi d: b-1(b(Vi
i

-b-l(b(~i
.'.
'.'

O.

Por supuesto;b-1(b(vi)'es simplemente v;. Adems, d{b-1(/j(Vi}/dbi


=
l/b'(vi).
Es decir, d{b-1(bi)}/dbi
mide cunto debe cambiar la valoraCin
del jugador i para produc: un cambio de una unidad en lapuja, mIentras
que b'(Vi) mide cunto cambia a puja en respuesta a un cambio de u~a
unidad en la valoracin .. Por lo tanto, bO debe satisfacer la ecuacin
diferencial de primer orden
1
-Vi + (Vi - b(Vi-b'(
.

t'i

) = O,

la cual~e expresa de un modo ms conveniente como b' (Vi)Vi +b( Vi) = Vi. La
parte izquierda de esta ecuacin diferencial es precisamente d{ b(Vi )Vi} /dVi.
Integrando ambas partes de la ecuacin obtenemos
1

b(v)v'
7.
t = -'Il
2 1_ + k ,

3.2.C Una subasta doble


A continuacin consideramos el caso en el cual un comprador y un vendedor tienen cada uno informacin privada sobre sus valoraciones, como
en Chatterjee y Samuelson (1983). (En Hall y Lazear [1984] el comprador es una empresa y el vendedor un trabajador. La empresa conoce el
producto marginal del trabajador, y el trabajador conoce sus olras oportunidades. Vase el ejercicio 3.8.) Analizamos un juego de intercambio
llamado subasta doble. El vendedor anuncia un precio de venta p." y el
compradorsimuItneamente anuncia un precio de compra p". Si Pb 2: P.,
el intercambio tiene lugar a un precio Ji = (Pb + Ji,) /2. Si Pb < ]J, no se da
el intercambio.
La valoracin por parte del comprador del bien del vendedor es /JI,;
la del vendedor es v.. Estas valoraciones son informacin privada y se
obtienen independientemente de distribuciones uniformes en [O,JI. Si el
comprador obtiene el bien por el precio p, su utilidad es v" - p; si no hlY
intercambio la utilidad del comprador es cero. Si el ,:,:endedor vende el
bien por el precio p, su utilidad es Ji - v.; si no hay intercambio su utilidad
es cero. (Cada. una de estas funciones de utilidad mide el cambio en la
utilidad de cada parte. Si no hay intercambio, no hay cambio en utilidad.
No cambiara nada definir, digamos, la utilidad del vendedor como Ji si
hay intercambio a till precio P y v . si no hay intercambio.)
En este juego bayesiano esttico, 1naestrategia del comprador es una
funcinp/,(vb)
que determina el precio que el comprador ofrecer para cada
una de sus posibles valoraciones. Del mismo modo, una estrategia del
vendedor es una funcin p,(v,) que especifique el precio que el vendedor
pedir para cada una de sus posibles valoraciones. Un par de estrategias
{Pb(Vb),p,(V,)}
constituye un equilibrio bayesiano de Nash si se cumplen
las dos condiciones siguientes. Para cada Vb en [O,1], Pb(Vb) es una solucin
de

max Pb [v b -

Pb+E[P,(v,)IPb>,,(U,)J]
2

Prob{p
.

>p

1) -

(7) )}
S

(3.2.3)

16Ll ! JUEGOS ESTTICOS CON INFOI{,'"IAClN INCOMPLETA (e. 3)

Aplicaciones!

donde E[psCuJlpb
2':f'JuJJ es el precio esperado que pedir el vendedor,
condicionado a que lo que pida sea menor que el precio ]lb ofrecido por el
cumprador. Para cada Vs en [0,1], J!s(Vs)es una solucin de

(3.2.4)

donde E[Pb(Vb)lpb(Vb)
2':PsJ es el precio esperado que ofrecer el comprador condicionado a que lo que ofrezca sea mayor que el precio Ps que pide
el vendedor.
Vb

Intercamqio
x

161

del vendedor es una mejor respuesta a la del comprador, ya que para los
tipos del vendedor que hacen que el intercambio se prefiera a la ausencia
de intercambio ste ocurre, y viceversa. El argumento anlogo demuestra
que la estrategia del comprador es una mejor respuesta a la del vendedor,
por lo que estas estrategias forman un equilibrio bayesiano de Nash. En
este equilibrio el intercambio se da para los pares (VsUb) indicados en la
figura 3.2.1; el intercambio sera eficiente para todos los pares (V"Vb) tales
que Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.
Ahora derivamos un equilibrio bayesiano de Nash lineal de la subasta
doble. Como en la seccin anterior, no restringimos los espacios de estrategiasdelos jugadores de nianera que se incluyan solamenre las estrategias
lin~ales, sino que pennitimos que los jugadores elijan estrategias arbitrarias pero nos preguntamos si existe un equilibrio que sea lineal. Existen
muchos otros equilibrios adems de los equilibrios de precio nico y el
equilibrio lineal, pero el equilibrio lineal tiene propiedades de eficiencia
interesantes que describiremos ms adelante.
Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs'
Entonces Ps est uniformemente distribuido en [as,as + cs], por lo que
(3.2.3) se convierte en
as + Pb}]
max [Vb - -1 {Pb + .--Pb
2
2

(3.2.5)
"-; .:r.,:,,,: .,;_._~_

V.

Figura 3.2.1

Por lo tanto, si el vendedor utiliza una estrategia lineal, la mejor respueSt''


del comprador tambin es lineal. Anlogamente, supongamos. qtieJa.
estrategia del comprador es Pb(Vb) = ab + CbVb. Entonces, P~ est iUforrne.:mente distribuido en [ab,ab + Cb], por lo que (3.2.4) se convierte en
1{

Existen muchsimos equilibrios bayesianos de Nash de este juego.


Consideremos, por ejemplo, el siguiente equilibrio de precio nico en
el cual el intercambio ocurre a U!l nico precio si es que ocurre. Para
cualquier valor de x en [0,1], sea la estrategia del comprador ofrecer x
si Vb 2': x y ofrecer cero en cualquier otro caso, y sea la estrategia del
vendedor pedir x si Vs ::; x y pedir uno en cualquier otro caso. Dada la
estrategia del comprador, las posibilidades del vendedor se concretan en
un intercambio a x o en que no haya intercambio, por loque la estrategia

max [ -2 Ps +

. p,

Ps + ab + Cb }

....

Cs

Pb = 3"Vb + 3"as.

;';:

Pb - as
---,

cuya condicin de primer orden consiste en


2

,','

<:.

cuy? condicin de primer orden es


P. = ~vs + ~(ab + Cb).

(3.2:6)"

Por lo tanto, si el comprador utiliza una estrategia lineal, la mejor respuesta


del vendedor tambin es lineal. Si las estrategias lineales de los jugadores
han de ser mejores respuestas la una a la otra, (3.2.5) implica que Cb = 2/3

Apl icnCollcs
162/

JUEGOS ESTTlCOS CON INFORMACIN

163

INCOMPLETA (c. 3)

y CLb = CLs /3, y (3.2.6) implica que Cs = 2/3 Y as


las estrategias de equilibrio lineal son

(ab

Ch)

/3. Por lo tanto,

(3.2.7)

v,

v, = v, + 0/4)

V,=

v,

Intercambio

p,,(v.) =

3v., + "4

como muestra la figura 3.2.2.


p"p,
1

v,

3/4

Figura 3.2.3

3/4

1/4
".'
;..J'

V"

Vb

"
,

Figura

3.2.2

Recordemos que el intercambio en ia subasta doble se da si y slo si


Ph ~ P . Manipulando (3.2.7) y (3.2.8) se demuestra que el intercambio
ocurre en el equilibrio lineal si y slo si Vh ~ V. + (1/4), como muestra

l~ figura 3.2.3. (De acuerdo con esto, la figura 3.2.2 revela que, para los
tIpos del vendedor por encima de 3/4, se realizan demandas por encima
de la oferta ms alta del comprador Pb(l) = 3/4, Yque para los tipos del
vendedor por debajo de 1/4 se realizan ofertas por debajo de la oferta ms
baja del vendedor, P. (O) = 1/4.)

Comparemos las figuras 3.2.1 y 3.2.3 (las descripciones de los pares


de valoraciones para los cuales el intercambio aCUITeen los equilibrios
de precio nico y simtrico respectivamente). En ambos casos se da el
intercambio posible ms valioso (concretamentev. = O Y Vh.,= 1), Pero al
equilibrio de precio nic le faltanalgunos intercambiosyaliosos (corno
v. == O Y Vh = X - E, dnde E, es pequeo, y logra ,algunos intercambios
que casi no valen nada (como v. = x - E Y Vh = X +.E). Por el contra~io,
al equilibrio lineal le faltan todos los intercambios que casi no valen riada
pero logra todos los intercambios de valor al menos 1/4. Esto sugiere
que el equilibrio lineal puede dominar los equilibrios de precio nico
en trminos de las ganancias esperadas de los jugadores, pero tambin
plantea la posibilidad de que los jugadores pudieran estar incluso mejor
en un equilibrio alternativo.
Myerson y Satterthwaite (1983) demuestran que, para distribuciones
uniformes de las valoraciones como las consideradas aqu, el equilibrio
lineal consigue ganancias esperadas mayores que ningn otro equilibrio
bayesiano de Nash en subasta doble (incluyendo equilibrios mltiples).
Esto significa que no existe un equilibrio bayesiano de Nash en subasta
doble tal que el intercambio ocurra si y slo si es eficiente (es'decir, si y.slo

lb4 / JUEGOS

ESTTICOS

CON

INFOI<iVIACIN

INCOMPLETA

(e. 3)

El principio de revelacin / 165

si /lb 2:

ti..).

Tambin demuestran que este ltimo resultado es muy general:

SiUb est distribuida de forma continua en [Xb,YbJ y 'u" est distribuida de

forma continua en [:l:s,ys], donde Ys > Xb e Yb > x" no existe ningn juego
de negociacin al que quisieran jugar el comprador y el vendedor que
tenga un equilibrio bayesiano de Nash en el que el intercambio ocurra si
y slo si es eficiente. En la prxima seccin vamos a indicar cmo puede
utilizarse el principio de revelacin para demostrar este resultado general.
Concluimos esta seccin aplicando este resultado al modelo de empleo de
Hall y Lazear: si la empresa tiene informacin privada sobre el producto
marginal m del trabajador y el trabajador tiene informacin privada sobre
una oportunidad alternativa ti, no existe ningn je'gode negociacin que
la empresa y el trabajador quisieran jugar que 'produZca empleo si y slo
si es eficiente (es decir, si y slo si m2: v).

3.3 El principio

de revelacin

El principio de revelacin, debido a Myerson (1979) en el contexto de


los juegos bayesianos (yen otros en contextos relacionados), es Un ins~
trumento importante para disear juegos cuando los jugadores tienen
informacin privada. Puede aplicarse a los problemas de las subastas
y del intercambio bilateral descritos en las dos secciones anteriores, as
como a una amplia gama de problemas. En esta sec~in enunciamos y
demostramos. el principio de revelacin para juegos bayesianos estticos.
(La extensin de la demostracin' a juegos bayesianos dinmicos es in"
mediata.) No obstante, antes de hacerlo, vamos a indicar cmo se utiliza
el principio de revelacin en los problemas de subastas y de intercambio
bilateral.
'
Consideremos un vendedor que quiere disear una subasta que maximice sus ingresos. Sera una ardua tarea detallar todas y cada una de las
diferentes subastas posibles. En la subasta dela seccin ;3,2.B, por ejemplo,
el participante que puja ms alto paga al vendedor y consigue el bien
subastado, pero existen muchas otras posibilidades. Los participantes,
por ejemplo, pueden tener que pagar una entrada, De forma ms general,
algunos de los participantes que pierden pudieran tener que pagar dinero,
tal vez en cantidades que dependan de sus pujas y de las de los dems.
Tambin podra el vendedor establecer un precio de reserva, un precio
mnimo por debajo del cual no se aceptaran pujas. De forma ms general,
puede existir cierta probabilidad de que el vendedor se quede con el bien

o de que ste no siempre vaya a quien puje ms alto. Afortunadamente,


el vendedor puede utilizar el principio de revelacin para simplificar
considerablemente este problema de dos maneras. En primer lugar, el
vendedor puede limitar su atencin a la siguiente clase de juegos:
1. Los participantes hacen declaraciones (posiblemente falsas) sobre sus
tipos (es decir, sus valoraciones). El jugador i puede declarar ser cualquier tipo Ti del conjunto Ti de posibles tipos de i, independientemente
de cul sea el verdadero tipo i, k
2; Dadas las declaraciones de los participantes (TI,' .. ,Tn), el jugadori
ofrece Xi(Tlt .. "Tn) y recibe el bien subastado con probabilidad qih,
. .. ,Tn). Para cada posible;ombinacin de declaraciones h, ...,Tn),la
suma de las probabjlidades ql (TI,' , . ,Tn) + ". + qn(Tl," .,Tn) debe ser
menor o igual a uno.

Los juegos de esta clase (es decir, los juegos estticos bayesianos en los
cuales la nica accin del jugador es hacer una declaracin sobre su tipo)
se llaman mecanismos directos.
La segunda manera en la que el vendedor puede utilizar el principio de revelacin es limitando su atencin a los mecanismos directos, en
los cuales decir la verdad constituye un equilibrio bayesiano de Nash
para cada participante, es decir, a ls funciones de oferta y de probabilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'",
taun)}
tales que la estrategia de equilibrio de cada jugador i sea declarar Ti (t;) =ti
para cada ti en n. Un mecanismo directo en el cual decir la verdad constituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.
Fuera del contexto del diseo de una subasta, el principio de revelacin puede seguir siendo utilizado de estas dos maneras. Cu~lquier
equilibrio bayesiano de Nash de un juego bayesiano puede representarse
<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesiano
adecuadamente escogido, en el cual por "representado" queremos decir
que para cada posible combinacin de tipos de los jugadores (tit ... ,tn),
las acciones y las ganancias de los jugadores en el nuevo equilibrio son
idnticos a los del equilibrio original. Itdependientemente de cul sea el
juego original, el nuevo juego bayesiano es siempre un mecanismo directo;
independientemente del equilibrio original, el nuevo equilibrio siempre
consiste en decir la verdad. De manera ms formal:

r,:

".'.

166/

JuEGOS ESTTICOS CON INFORMACIN

INCOMPLETA (c. 3)

Teorema. (El principio de revelacin). Cualquier equilibrio bayesiano de


Nash en un juego bayesiano puede representarse mediante un mecanismo directo
de incentivos compatibles.

',':

En la subast~ analizada en la seccin 3.2.B supusimos que las valtaci-' .. '


nes de los prticipantes eran independientes entre s. Tambinsupusitnos
;;
(de forma implcita en la definicin de las valoraciones de los partiCipantes) que conocerla-valoraCin del jugador j no ambiaria la valoraci.del
jugador i (aunque tal con~chniento cart1biarianormalment~ la puja de i).
Caracterizamos estos dos supuestos diciendo que los participantes tienen
valores privadseindep~ndientes.
Eh'este caso, Myerson (1981)deter-'
mina qumecasmos directs"HnehUh ecjirilibrio de decirlaveidady
cules de estos equilibrios maximizan la ganancia esperada del vendedor.
El principio de revelacin garantiza entonces qu no hay otra subasta con
un equilibrio bayesiano de Nash que proporcione al vendedor una ga. nancia esperada ms alta, puesto que el equilibrio de tal subasta habra
sido representado por un equilibrio de decir la verdad de un mecanismo
directo; y ya consideramos todos los mecartisr'nq~directos de incentivos
comptibles. TambIn dinuestra'Mye~son que el equilibrio bayesia~o d~
Nash simtrico de la subasta analizada en la seccin 3.2.B es equivalente
a este equilibrio de decir la verdad maximizador de la ganancia (como los
equilibrios simtricos de otras conocidas subastas).
tomo seglindoejemplo derprin~ipio derevelaci.n, consideremos el
problema del ii1tercambiobilateral descrito en la seccin 3.2.C. All ana~
lizamos Unjuego 'de 'intercambio entre un comprador y un vehdJdor, h
subasta doble. En ese juego; si haba iiercarnbio; el comprador pagaba al
vendedor,'mientras CJuesino; no haba pag; sin embargo existehmuchas
otras posibiliddes.Podri. haber pagos (del comprador al vendedor o
viceversa) incluso sin intercambio, y la probabilidad de un intercambio
podriaestar estrictamente entre cero,yuno. Tambin, la regla para determinar si va haber intercambio podra exigir que la oferta del comprador
fuera mayor que la demanda del vendedor en una cierta cantidad (positiva o negativa); dicha cantidad podra incluso variar dependiendo de los
precios anunciados por las partes.

,".

..

.. :

Podemos capturar estas posibilidades considerando la siguiente clase


de mecanismos directos: el comprador y el vendedor realizan simultneamente declaraciones sobre sus tipos, Tb y T.., tras lo cual el comprador paga
al vendedor x(Tb,T
que puede ser positivo o negativo, y el comprador
recibe el bien coh probabilidad q(Tb,Ts)' Myerson y Satterthwaite deterB),

El principio de revelaci" / 167

minan qu mecanismos directos tienen un equilibrio de decir la verdild.


Luego imponen la restriccin de que cada tipo de cada parte quiera juga.r
(esdecir, que cada tipo de cada parte tenga una ganancia esperada en eqUllibrio no inferior a la ganancia que ese tipo podra conseguir negndose
a jugar, concretamente cero para cada tipo de compra~or y is para el
tipo de vendedor tB). Finalmente, demuestran qu~ en n1l1gl1l10de estos
mecanismos directos de incentivos compatibles, el mtercambJO se da con
probabilidad uno si y slo si el intercambio es eficiente .. El.~rincipio ~e
revelacin garantiza entonces que no hay juego de negOClaClonque qUJeranseguir el comprador y el vendedor que tenga un equilibrio bayesiano
de Nash en el cual se d el intercambio si y slo si es eficiente.
Para dar un enunciado formal y una demostracin del principio de revelacin, consideremos el equilibrio bayesiano de Nash s' = (si, ... ,s;,) en
el juego bayesianoesttico G = {Al,'"
,An; TI,' .. ,Tn;Pl,'"
,Pn; nI, ... ,un}'
Vamos a construir un mecanismo directo con un equilibrio de decir la
verdad que represente s*. El mecanismo directo adecuado es un juego
bayesiano esttico con los mismos espacios de tipos y de conjeturas que
G, pero con nuevos ~spacios de acciones y nuevas funciones de ganancias.
Los nuevos espacios de acciones son simples. Las acciones. factibles del
jugador i en el mecal1ismo directo son declaraciones (posiblemente falsas)
sobre sus posibles tipos. Es decir, el espacio de acciones del jugador i es
Ti. Las nuevas funciones de ganancias son ms complicadas. Dependen
no slo del juego original G, sino tambin del equilibrio original en dicho
juego, s". La idea crucial es utilizar el hecho de que s" es un equilibrio
en G para garantizar que de<:irla verdad es un equilibrio del mecanismo
directo, como vemos a continuacin.
Decir que s" es un equilibrio bayesiano de Nash de G, significa
que para cada jugador i, s; es la mejor respuesta de i a las estratemas (s"
s"
s~
s") de los dems ]'ugadores. Ms concretamente,
0&
'1""/
t-1' 'l+l,""'n
para cada uno de los tipos ti en Ti de i, S;(ti) es la mejor accin de A
que puede elegir i, dado que las estrategias de los otros jugadores son
(si, ... ,s:_l ,s:+l' ... ,s~). Por tanto, si el tipo de i es t y permitimos ai elegir una accin de un subgrupo Ai que incluye .5; (ti), entonces la eleccin
ptima de i sigue siendo 3;(ti), suponiendo de nuevo que las estrategias
de los otros jugadores son (si, ... ,.5;_1,3;+" ... ,s~). Las funciones de ganancias en el mecanismo directo se eligen para confrontar a cada jugador
con una eleccin exactamente de esta clase.
Definimos las ganancias en el mecan.isIl1o directo sustituyendo las
declaraciones de tipos de Jos jugadores en el nuevo juego T = (TI, ... ,Tn)

W3 / JUEGOS EST..\'"ICOS CON INFORMACiN

INCOMPLETA (e. 3)

Ejercicios I 169

en las estrategias deequilibrio del juego original, 8*, Yluego sustituyendo


las acciones resultantes en el juego original 8*(T) = (sih), ... ,:5~(Tn en
las funciones de ganancias del juego original. Formalmente, la funcin de
ganancias de . es

donde t = (t, ... ,tn). Se podra pensar que estas ganancias se dan porque
un observador imparcial se acerca a los jugadores y pronuncia el siguiente
discurso:

S que ustedes ya conocen sus tipos y que van jugar el


equilibno s' del juego G. Pero perIl1tanme que lespresente un nuevo juego, un mecanismo directo: En primer
lugar, cada uno de ustedes frn;.ar un contrato que me
permita a m dictar la accin que tornarn ruando jugUemos e.En segundo lugar, cada uno de ustdes escribir-' .
una declaracin sobre su tipo Ti y me la entregar~ Segui'-.
damente utilizar la declaracin del tipo de cada uno d
ustedes en el nuevo juego, Ti, junto consestfategia 'de ,;
equilibno en el juego original, si, para ca1culiir-;'l~
accin
que habran elegido en el equilibrio s' si su tipo fuera
verdaderamente Ti, concretamente si (T). Finalmente, determinar que cada uno de ustedes torne la accin que
he calculado, y recibirn las ganancias resultantes (que
dependern de estas acciones y de sus tipos verdaderos).
Concluirnos esta seccin (y la demostracin del principio de reve-'
lacin) demostrando que decir la verdad es un equilibrio bayesiano de
Nash de este mecanismo directo. Al declarar ser del tipo Ti de T, el juga~
dar i est en efecto escogiendo tornar la accin si'(Ti)deA.
Si todos los,
dems jugadoresdicen la verdad, estn efectivamente jugando las estrte-'
gias (si" .. ,s:_,s~+I'"
. ,si)' Pero discutirnos anteriormente que si juegan
esas estrategias, cuando el tipo de i es ti la mejor accin que puede elegir .-.
es ,st(t), 'Por tanto, si los otros jugadores dicen la verdad, cuando el tipo de
i sea t, el mejor tipo del que se puede declarar seres ti. Es decir, decir laver~
dad es un equilibrio. De un modo ms formal, jugar la estrategia de decir la
verdad T(ti) = ti para cada t. en T es un equilibrio bayesianode Nash del."
juego bayesiano esttico {TI," .,Tn;11, ... , Tn;PI," ',Pn;v, ... ,vn} para
cada jugador i.

3.4 Lecturas adicionales


Myerson (1985) ofrece una introduccin ms detallada a los juegos bayesianos, el equilibrio bayesiano de Nash y al principio de revelacin.
Consltese McAfee y McMillan (1987) para un examen de la literatura
sobre subastas, incluyendo una introduccin a la maldicin del ganador.
Bulow y J(lemperer (1991) extienden el modelo de subastas de la seccin
3.2.B para dar una interesante explicacin de los pnicos y de los hundimientos racionales en los (digamos) mercados de valores. Sobre el empl~o pajo informacin asimtrica consltese Deere (1988),quien analiza un
modelo dinmico en el cual el trabajador va encontrndose con distintas
eIIlpresa,s~ lo largod~l tiempo, cada una con su propio producton.argmal
conocido de fOrm:lprivada. Para aplicaciones del principio de revelacin
c~nsltese Baron:y Myerson (1982) sobre la regulacin de un monpolio
con costes desconocidos, Hrt (1983) sobre los contratos implcitos y el
paro inyolunt:lrioySappington (1983) sobre la teora de la agencia.

".,/

\ ..

35 Ejercicios
3.1 Qu es un juego bayesiano esttico? Qu es una estrategia (pura)
en tal juego? Qu es un equilibrio bayesiano de Nash (con estrategias
puras) en dicho juego?
\

3.2 Consideremos un duo polio de Cournot que opera en un mercado con


demanda inv~rsa P(Q) = a - Q, donde Q = qI + q2 es la cantidad agregada
en el mercado. Ambas empresas tienen unos costes totales de Ci(qi) = Cqi,
pero la demanda es incierta: es alta (a = aA) con probabilidad O y baja
(a. = aB) con probabilidad 1-0. Adems, la informacin es asimtrica. La
empresa 1 sabe si la demanda es alta o baja, pero la empresa 2 no lo sube.
Todo esto es informacin del dominio pblico. Las dos empresas eligen
c~tidades,simultneamente.
Cules son los espacios de estrategias de
l:l~.
g:ps'empresas? Hganse supuestos sobre aA, aB, e y C de manera que
todas las cantidades de equilibrio sean positivas. Cul es el equilibrio
bayesiano cie este juego?
3.3 Consideremos el siguiente modelo de duopolio de Bertrand con informacin asimtrica y productos diferenciados. La demanda que se dirige
a la empresa ' es qi(P',Pj) = a - Pi - bi . Pj. Los costes son cero para ambas
"1',

',.o',

Ejercicios

170/ JUEGOS ESTTICOS CON INFORMACIN INCOMPLETA (c. 3)

empresas. La sensibilidad de la demanda de la empresa 'i al precio de la


empresa j es o alta o baja. Es decir, bi es o bA o bB, donde b,4. > bE > O.
Para cada empresa, bi = bAcon probabilidad IJ y b '" b B con probabilidad. -'
1 - IJ, independientemente de bj Cada empresa conoce su propio biPe!6.,.
no el de su competidora. Todo esto es informacin del dominio pbliF '
Cules son los espacios de acciones, espacios de tipos, conjeturas y fUn~
ciones de utilidad en este juego? Cules son los espacios de estrategias!.
Qu condiciones definen un equilibrio bayesiano de Nash simtnc''8R
estrategias puras de este juego? Hllese dicho equilibrio .. "
3.4 Hllense todosJos. equilibrios bayesianos de Nash con esrrategiasp
ras en el siguiente juego bayesiano esttico:
.
1. El azar determina si las gananCias son Como en' el juego 1 o como, '
erjuego 2, siendo cada juego igttalmenfeprobable.,
2. El jugador lse entera de si el zarhaescgidoel
jUego! o el 2, per.
el jugador 2';0.
,. '"
.
.
. 3. El jugador. 1 elige A o B; simultneamente el jugador 2 elige Do 1.
4. Las ganancias son las que se dan en el jueg<lu~.deterrhin'iar:;.'
1

ID'-

j)

,o

A 1,1 0,0

A 0,0

B 0,0 0,0

B 0,0 2,2

Juega

Juega2

....

3.5 Recordemos de la Seccin 1.3 que el juegode las monedas (un jueg'.
esttico con informacin completa) no tiene equilibrios de Nash cori's~..
trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Ilixhis;':';
cada jugador elige cara con probabilidad 1/2 ..
Jugador 2
cara cruz
cara 1,-1

-1,1

Jugador 1
cruz -1,1 1,-1
','

/171

HIlese un equilibrio bayesiano de Nash con estrategias puras del juego


.':',::.' correspondiente con informacin incompleta tal ql~e, conforme la 111[0:;;i,;o,lIlacin incompleta desaparece, la conducta de los Jugadores el: :1 ~qU1";"',',:
.'UbriObayesiano de Nash tienda a su comportamIento en eJ.~quJlbno ele
;(:"Nash con estrategias mixtas del juego original con mformaclOn completa,

3.6 Consideremos una subasta de sobre cerrado al primer precio en la cual


las valoraciones de los participantes estn distribuidas de forma indepen. diente y uniforme en [0,1]. Demustrese que si hay n participantes, la
""'<tr"t~giade Plljar (n - l)/n veces la propia valoracin es un equilibrio
.~"yesiano de Nash simtrico.
.

.~;

..tl~'f;'.~"

r$.7Cbnsideremos una subasta de sobre cerrado al primer precio en la cual


'.ias:va10iacionesde los participantes estn distribuidas indnticamente y
':deJorma independiente segn la densidad estrictamente positiva !(-u;) en
11~Calclese un equilibrio bayesiano de N ash simtrico para el caso de
"'dos partiCipantes .
"\ : .

;10;
..

~;'j:SCnsidrese al comprador y al vendedor de la subasta doble analizada


la seccin 3.2.C como una empresa que conoce el producto marginal 111.
'del trabajador y un trabajador que conoce su oportunidad alternativa 7),
como en Hall y Lazear (1984), En este contexto, un intercambio significa
q~El~l.tralJaj<\~orest empleado por la empresa, y el precio al cual las
;part~' negoCian es el salario del trabajador w. Si se da el intercambio,
.,la ganancia de la empresa es m ~ w, y la del trabajador es w; si no hay
\,4itercambio, la ganancia de la empresa es cero y la del trabajador v.
. Supongamos que m y v son obtenidos independientemente seg n Ulla
, distribucin uniforme en [0,1] como en el texto. Con fines comparativos,
ii;tlClense las ganancias esperadas de los jugadores en el equilibrio lineal
:'',de la subasta doble. Ahora consideremos los dos juegos de intercambio
'siguientes como alternativas a la subasta doble.
""r"l,'
.; . liega 1: Antes de que las partes conozcan su informacin privada,
\:fitman un contrato aceptando que si el trabajador es empleado por la
empresa, su salario ser w, pero tambin que cualquiera de las partes
:':puede romper la relacin de empleo sin coste alguno. Despus de que
las partes conocen los respectivos valores de su informacin privada,
,~nncian simultneamente si aceptan el salario 1)) o si lo rechazall, Si
h':'I;l:5os
anunCian que 10 aceptan, hay intercambio; si no, no, Dado 1.111
\ valor de v arbitrario en [0,1], cul es el eqtlilibrio bayesiano de Nash de

. en

172/

JUEGOS ESTTICOS CON INFORMACiN

INCOMPLETA (c. 3)

Referencias

este juego? Dibjese un diagrama anlogo a la figura 3.2.3 mostrando los


pares de tipos para los que hay intercambio. Hllese el valor de 'lO que
maximiza la suma de las ganancias esperadas de los jugadores y calclese
esta Suma.
2: Antes de que las partes conozcan su informacin privada,
firman un contrato aceptando que el siguiente juego dinmico se utilizar
para determinar si el trabajador se une a la empresa y, si lo hace, con
qu salario. (Estrictamente hablando, este juego pertenece al captulo
4. Vamos a adelantamos al captulo 4 aduciendo que este juego puede
resolverse combinando las lecciones de este captulo con las del captulo 2.)
Una vez que las partes conocen los respectivos valores de su informacin.
privada, la empresa elige un salario 'lO que ofrece al trabajador, salario
que el trabajador acepta o rechaza. Analcese este juego utilizando el
procedimiento de induccin hacia atrs, tal como hicimos en la seccin
2.1.A con los juegos anlogos de informacin completa. Dados 'lO yv, qu
har el trabajador? Si la empresa prev lo que har el trabajador, dado m
qu har la empresa? Cul es la suma de las ganancias esperadas de los
jugadores?
[llego

3.6 Referencias

/ 173

_. 1973. "Carnes with Randomly Disturbed Payoffs: A New Rationale for


Mixed Strategy Equilibrium Points." International oumal of Game TheonJ
2:1-23.
HART,O. 1983. "Optimal Labour Contracts under Asymmetric Information." Review of Economic Studies 50:3-35.
McAFEE, P. y J. McMILLAN. 1987. "Auctions and Bidding." oumal of
Economic Uterature 25:699-738.
MYERSON,R. 1979. "Incentive Compatability and the Bargaining Problem."
Econometrica 47:61-73.
-. 1981. "Optimal Auction Design." Mathematics
6:58-73~

of Operations Research

-. 1985. "Bayesian Equilibrium and Incentive Compatibility: An I.ntroduction." In Social Goals and Social Organization. L. Hurwicz, D. Schmeldler,
y H. Sonnenschein, eds. Cambridge: Cambridge University Press.
MYE~N, R., Y M. SATTERHWAlTE.
1983. "Efficient Mechanisms for Bilateral Trading." oumal of Economic Theory 28:265-81.
SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal and
Agent." oumal o/ Economic Theory 21:1-21.

BA1<ON,
D., Y R. MYERSON.1982. "Regulating a Monopolist with Unknown
Costs." Econometrica 50:911-30.
BULOW,J., y P. KLEMPERER.1991. "Rational Frenzies and Crashes." Stanford University Craduate School of Business Research Paper #1150.
CHATTERjEE,K., Y W. SAMUELSON.1983. "Bargaining under Incomplete
Informabon." Operations Research 31:835-51.
DEmE, D. 1988. "Bilateral Trading as an Efficient Auction over Times."
[ol/rIlal of Political Economy 96:100-15.
.
HALL,R., Y E. LAZEAR.1984. "The Excess Sensitivity of Layoffs and Quits
lu Demand." [ournal of Labor Econ01nics 2:233-57.
HARSANYI,J. 1967. "Cames with Incomplete Information Played by Bayesian Players Parts 1 II and I1I." Management Science 14:159-82, 320-34~
486-502.

~3

4. JUEGOS DINMICOS
CON INFORMACIN INCOMPLETA

En este captulo presentamos un concepto ms de equilibrio, el equilibrio


bayesiano perfecto, con lo que tenemos cuatro conceptos de equilibrio en
cuatro captulos: el equilibrio de Nash en los juegos estticos con informacin completa, el equilibrio de Nash perfecto en subjuegos enlos juegos
dinmicos con informacin completa, el equilibrio bayesiano de Nash en
los juegos estticos con informacin incompleta y el equilibrio bayesiano
perfecto en los juegos dinmicos con informacin incompleta. Podra parecer que nos inventamos un nuevo concepto de equilibrio para cada clase
de juegos que estudiamos pero, de hecho, estos conceptos de equilibrio
estn estrechamente relacionados. A medida que vamos considerando
juegos ms completos, vamos reforzando el concepto de equilibrio para
excluir los equilibrios poco verosmiles que sobreviviran en los juegos
ms ricos si aplicramos los conceptos de equilibrio adecuados a los juegos ms simples. En cada caso, el concepto de equilibrio ms poderoso
difiere del ms dbil slo en los juegos ms ricos, no en los ms simples;
En particular, el equilibrio bayesiano perfecto es equivalente al equilibrio bayesiano de Nash en ios juegos estticos con ,informacin completa,
equivalente al equilibrio de Nash perfecto en subjuegos en los juegos
dinmicos con informacin perfecta y completa (yen muchos juegos
dinmicos con informacin perfecta pero incompleta, entre los que se
incluyen los que hemos discutido en las secciones 2.2 y 2.3) y equivalente
al equilibrio de Nash en los juegos estticos con informacin completa.
El equilibrio bayesiano perfecto se invent para refinar (es decir, para
reforzar los requisitos de) el equilibrio bayesiano de Nash, del mismo
modo que elequilibrio de Nash perfecto en subjuegos refina el equilibrio
de Nash. Igual que introdujimos la perfeccin en subjuegos en juegos
dinmicos con informacin completa porque el equilibrio de Nash no
capturaba la idea de que las amenazas y promesas deban ser crebles,
ahora limitamos nuestra atencin al equilibrio bayesiano perfecto en jue-

176

I J;ECOS

OIN,\IICOS CON I.\iFOR,\'/AClN

L\iCOMPLETA (e. 4)

gas dinmicos con informacin incompleta porque el equilibrio bayesiano


de Nash presenta el mismo inconveniente. Recordemos que si las estrategias de los jugadores han de formar un equilibrio de Nash perfecto
en Subjuegos, no slo deben formar un equilibrio de Nash en el juego
completo, sino tambin constituir un equilibrio de Nash en cada subjuego. En este captulo reemplazamos la idea de Subjuego por la idea
ms general de juego de continuacin, que puede comenzar en cualquier
conjunto de informacin (ya sea de un nico elemento o no), y no slo en
conjuntos de informacin con un nico elemento. A continuacin procedemos por analoga: si las estrategias de los jugadores tienen que formar
un equilibrio bayesiano perfecto, no slo deben Constituir un equilibrio
bayesiano de Nash para el juego completo, sino tambin constituir un
equilibrio bayesiano de Nash en cada juego de continuacin.
En la seccin 4.1 presentamos de modo informal las principales caractersticas de un equilibrio bayesiano perfecto. Para ello, adoptamos
temporalmente una segunda perspectiva (complementaria) que cambia
el nfasis anterior: el equilibrio bayesiano perfecto refuerza los requisitos
del equilibrio de Nash perfecto en Subjuegos analizando explcitamente
las conjeturas de los jugadores, Como en un equilibrio bayesiano de Nash.
Esta segunda perspectiva surge porque, siguiendo a Harsanyi (1967),describimos un juego con informacin incompleta como si fuera un juego Con
informacin imperfecta; el azar revela el tipo del jugador i a i pero no a i,
por 10que j no conoce la historia completa del juego. Por lo tanto, un Concepto de equilibrio diseado para reforzar el equilibri~ bayesiano de Nash
en los juegos dinmicos con informacin incompleta puede tambin reforzar el equilibrio de Nash perfecto en subjuegos en los juegos dinmicos
con informacin completa pero imperfecta.
En la seccin 4.2 analizaremos la cla?e de juegos Con informacin incompleta aplicada con ms frecuencia: los juegos de seiializacin. Enunciado
de un modo abstracto, un juego de sealizacin consta de dos jugadores
(uno Con informacin privada, el otro sin ella) y dos rondas (primero una
seal enviada por el jugador informado y despus una respuestaadop_
tadapor el jugador desinformado). La idea clave es que la comunicacin
puede darse si un tipo de jugador informado quiere enviar una seal que
sera demasiado cara de enviar por parte de otro tipo. En primer lugar
definiremos el equilibrio bayesiano perfecto en juegos de sealizacin y
describiremos los distintos tipos de equilibrios (que corresponden a distintos grados de comunicacin, entre cero y completa) que pueden existir.
A continuacin consideraremos el modelo original de sealizacin en el

__

eM@_!.O!' ~!i!!!E'!!!!!'!'!!'!'

:t,"""'~ ..""__..

._.

."_

Introduccin

al equilibrio bayesl/lO pertixto

I 177

merca do de trabaJ'ode Spence (1973), el modelo de inversin'. empresarial


de Myers y Majluf (1984) y el modelo de poltica monetana de Vlckers
(1986).

En la seccin 4.3 describiremos otras aplicaciones del equilibrio bayesiano perfecto. Comenzaremos c0r:. el. an~~isis de juegos con parloteo
(cheap-talk games) (es decir, juegos de sena1JZacJOnen los cuales los mensajes no cuestan nada), entre cuyas aplicac.ion~sse incluyen 1.asamenazas d~
to
ve Presidencial a las decisiones del legIslativo norteamencano, los
. anun
.
cios de poltica por parte de la autoridad monetaria y las comurucaclOnes
(o "voz") en las organizaciones. En los juegos con parloteo, el ~cance de
la comunicacin se determina por los intereses comu~es de los Ju~adores
ms que por los costes de las seales de los diferentes tipos. EstudIaremo~
a continuacin el modelo de negociacin sucesiva de Sobel y Takahashi
(1983), en el cual una empresa debe tolerar una huelga para den:ostrar
que no puede permitirse pagar salarios ms .altos.(cfr. el.mo~elo ge negociacin con informacin completa de Rubmstem que mclwmos en la
secclOn
. en equilibrio). Finalmente,
..
.
" 2.1.D , en el cual las huelgas no se dan
exploraremos la explicacin clsica de Kreps, Milgrom, ~~bert~ y WIlson
(1982)del papel de la reputacin en el logro de la coopera~~~ raCJOnale~,el
dilema de los presos repetido finitamente (cfr. la proposlclon en ~asecCloIl
2.3.A concerniente al nico equilibrio de Nash perfecto en subJueg~s .de
un juego repetido finitamente basado en un juego de etapa con un m:1CO
equilibrio de Nash).
.:,
En la seccin 4.4 volveremos a la teora. Aunque es la seccin final
del libro, sirve para indicar lo que podra venir a continuaciIl.~~ql.!~
como culminacin de los temas analizados. All describireII10seustraremos dos refinamientos (sucesivos) del equilibrio bayesiano perfecto, el
segundo de los cuales es el criterio intuitivo de Cho y Kreps (1987).

4.1 Introduccin al equilibrio bayesiano perfecto


Consideremos el siguiente juego dinmico con informacin :ompleta pero
imperfecta. En primer lugar, el jugador 1 elige en~e tres acclO~es,~,Cy D.
Si el jugador 1 elige D, se acaba el juego sin que Juegue el 2. 51el Jugador
1 elige 1 o C, el jugador 2 se da cuenta de que D no ha sido .elegida,(per?
no de si ha sido elegida lo C) y entonces elige entre dos aCCIOnes,
1 yD,
tras lo cual se termina el juego. Las ganancias se muestran en la forma
extensiva de la figura 4.1.1.

. Introduccin

178 I JUEGOS, PINA1v[jCO~ CON INFORMACIN INCOMPLETA (C 4)

o'

O
2

O
1

Utiiza~d la rep!esent~ci6n'enfonnan9pnal
de este juego4ad~~
la figura 4.1.2, observ~mq~ que existen~().seqi1ibrios deNash con estra:;:
tegias puras, (1,1') y (D,D'),
(ieterminat SI estos equiiibri~;'d ],{f;h
son perfectos en subjuegos utiHz!Ull0slarepresentacin en {antia e~t~ri~
'.
'
"",'
,'"
,
, ", 'jl'!'
siva para definir los subjuegos del juego. Puesto que un' juego ,esdefr{j~9.,
de modo que comienza en, un nodo de decisin, que no es ~s que~~:
conjunto deinformacin cbn un nico elemento (aunque no es eipri~EJ-,
n~do de decisin del jueg()), el juego'delafigura .l no tiene subjug~~~"
SI un juego no tiene subjuegos, el r~q,uisitode perfeccin en subjuegos
(~o~cretamenteque las estrategias d' los jugadores c~mstituyan un equi~
hbno de Nash en cada subjuego) se cumple de forma trivia( Por tano:
encualquierjuego que no tenga subjuegos la definicin de equilibrio de.
Nash perfec~ en subjuegosles equivalent a la definicin de equilibriocl~
Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios
'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramente
d,euna amen,aza que n resultacreble: si llega el tumo del jugador 2,jugar
1 domma a Jugar D', por 10 que el jugador 1 no debera verse inducido a
jugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover.

r~r

Jug~dor 2

D'
.,:'1:';'

2,1

0,0

0,2

0,1

1,3

.:.:J:"

Jugadorl'

,;~~

Ii"

1,3

I liCJ

"t
1 En cada conj'unto de inFormacin el j'ugador que decide debe
RequISl o .
' J'
'
.
formarse una conjetura sobre el nodo del conjunta ~te injorm,acln al que se 1m
llegado en el juego. Para un conjunto de 111f~,:maclOncon mas de un ele1l1:/lfO,
una conjetura es una distribucin de probabl11dad sobre los nodos del conju/lto
de infonnacin; para un conjunto de informacin con un nico. el:mento, la
conjetura del jugador asigna probabilidad uno al nico nodo de declslO11.

"Figura 4.1.1

l'

perj)"

Una manera de reforzar el concepto de equilibrio para excluir el equi. d Nash perfecto en subJ'uegos (D D') de la figura 4.1.1 es imponer
libno e
' ,
los dos requisitos siguientes:

'o

2
1

,,1 c'1'lliIJl'io bayesiallo

..".

Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.
sucesivamente
racionales.
Es decir, en cada conjunto de mformaclOn, la aCClO1l
tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.r
ptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~
guientes estrategias de los dems jugadores (donde una estra.tegla subslg,Ulente
es un plan de accin completo que cubre cada contmgencla que podna darse
despus de haberse alcanzado el conjunto de informacin).

. En la figura 4.1.1, el requisito 1 significa que si el juego alcanza el


conjunto de informacin con ms de un elemento del jugador 2, ste debe
formarse una conjetura sobre el nodo que se ha alcanzado (o, de forma
equivalente, sobre si el jugador 1 ha jugado 1 o C).Esta conjetura se
representa con las probabilidades p y 1 - p ligadas a los nodos relevilntes
en el rbol, como muestra la figura 4.1.3.
.Dada la conjetura del jugador 2, la ganancia esperada porjugar D' es
p. 0+(1 - p).l = 1 - p, mientras que la ganancia esperada por jugar j' es
p.1 + (1- p) .2 = 2 - p. Puesto que 2 - p > 1 - p para cualquier valor
". de p, el requisito 2 hace que el jugador 2 no elija D'. As, basta con exigir
_. que cada jugador tenga una conjetura y acte ptimamente de acuerdo
con ella para eliminar el equilibrio inverosmil (J],D') eneste ejemplo.
, Lo~requisitos 1 y 2 insisten en que los jugadores se formen conjeturas
:y,act~n de forma ptima segn stas, pero no que estas conjeturas sean
'tazonables,.Para imponer requisitos adicionales a las conjeturas de los
jt1gadt~s; distinguimos entre conjuntos de informacin que estn en la
trayectoria de equilibrio y los que estn fuera de la trayectoria de equilibrio. ,.

180

! JUECOS

DIN,VIICOS CON INFORMACIN

INCOMPLETA (c. 4)

Introduccin

o
1

o
2

o
1

Figura 4.1.3

Definicin. Para un equilibrio dado en un cierto juego en fionna extensiv


t d . fi
',.
,
. .
a, un
ollJun o e In onnaclOn esta en la trayectoria
de equilibrio si' se . 1
, '.
b b Td d
..
a canza
LOI/.pro.a 1 I a positiva cuando .el juego se desarrolla segn las estrategias de
~qullzbrlO, ~ fuera de la trayectorza de equilibrio si es seguro que no se alcanza
Llllmdo el Juego se desarrolla segn las estrateO"as de equilibrio (donde u .
11' "
"
.
. '
,equI1 mo. puede significar equilibrio de Nash, perfecto en subjuegos, bayesiano o
lmyeslano perfecto).
c'

"
equl~Ito 3.

En conjuntos de infonnacin sobre la trayectoria de equilibrio


las conJ~turas se determinan de acuerdo con la regla de Bayes y las estrategias d;
eqllllzbrzo de los jugadores.
'. Por ejemplo, e~ el equilibrio de Nash perfecto en subjuegos (1,1') de la
figur~ 4.?.3, la conjetura del jugador 2 debe ser p = 1: dada la estrategia de
eqUIhbno del jugador 1 (concretamente 1), el jugador 2 sabe qu nodo se ha
al~anz~~o en el conjunto de informacin. Como una segunda ilustracin
(lupotetica) del requisito 3, supongamos que en la figura 41 3 . t'
u
Tb .
. . eXls lera
n eqUl I no en estrategias mixtas en el cual el J'ugador 1 elein'a 1
.
o.
con
Prob ~.b IT1d a d ql, e con probabilidad q2 y D con probabilidad
1- q -'
El
requisito 3 obligaria a que la conjetura del jugador 2 fuera p = q /~q ~. ).
Los tr
. '.
1
1 q2
es reqUlsItos capturan el espritu de un equilibrio bayesiano
perfecto. La nueva caracterstica crucial de este concepto de eqw'll'b .
debe Kr
.
no se
a eps y Wllson (1982): en la definicin de equilibrio las conJ'etur
~&.. va.n a)'111lve de importancia de las estrategias. Formalmente u
eqUIlIbno ya no consiste simplemente en una estrategia para cada jugad:

al equilibrio

bayesiano

perfecto / 181

sino que ahora tambin incluye una conjetura para cada jugador en cada
conjunto de informacin en el que el jugador tenga que jugar.1 La ventaja
de hacer explcitas las conjeturas de los jugadores de esta manera es que,
igual que en captulos anteriores insistimos en que los jugadores eligen
estrategias crebles, ahora podemos insistir en que se forman conjeturas
razonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3)
como fuera de sta (en el requisito 4 que sigue y en otros de la seccin 4.4).
En aplicaciones econmicas simples, que incluyen el juego de sealizacin de la seccin 4.2.A y el juego con parloteo de la seccin 4.3.A,
los tres requisitos no slo capturan el espritu del equilibrio bayesiano
perfecto, sino que tambin constituyen su definicin. Sin embargo, en
aplicaciones econmicas ms complejas, se necesita imponer msrequisitos con objeto de eliminar equilibrios inverosmiles. Distintos autores han
utilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todas
las definiciones incluyen los tres requisitos; algunas tambin incluyen el
requisito 4 y algunas imponen requisitos adicionales.2 En este captulo
tomamos los requisitos 1 a 4 como definicin del equilibrio bayesiano
perfecto.3

1 Kreps y Wilson formalizan esta perspectiva de equilibrio definiendo el equililJrio secuencial,


un concepto de equilibrio equivalente al equilibrio bayesiano perfecto en muchas aplicaciones
econmicas, pero en algunos casos algo ms restrictivo,
El equilibrio secuencial es ms
complicado de definir y aplicar que el equilibrio bayesiano perfecto, por lo que la mayora de
los autores ahora utilizan este ltimo. Algunos se refieren (de modo impreciso) al concepto de
equilibrio que aplican corno equilibrio secuencial. Kreps y Wilson muestran que en cualquier
juego finito (es decir, cualquier juego con un nmero finito de jugadores, tipos y jugadas
posibles) existe un equilibrio secuencial. Esto significa que en cualquier juego finito existe un
equilibrio bayesiano perfecto.
2 Para dar una idea de las cuestiones que no son tratadas por los requisitos 1 a 4, supongamos que los jugadores 2 y 3 han observado los mismos acontecimientos y a continuacin
ambos observan una desviacin del equilibrio por parte del jugador 1. En un juego con informacin incompleta en el cual el jugador 1 tiene informacin privada, deberan los jugadores
2 y 3 formarse la misma conjetura sobre el tipo del jugador 1? En un juego con informacin
completa, deberan los jugadores 2 y 3 formarse la misma conjetura sobre las decisiones previas no observadas del jugador 1? De modo similar, si los jugadores 2 y 3 han observado los
mismos acontecimientos y entonces el jugador 2 se desvia del equilibrio, debera el jugador
3 cambiar su conjetura sobre el tipo del jugador 1 o sobre las decisiones no observadas del

jugador 1?
3 Fudenberg y TIrole (1991) dan una definicin formal del equilibrio bayesiano perfecto
para una amplia clase de juegos dinmicos con informacin incompleta. Su definicin trata
cuestiones como las que hemos planteado en la nota 2. Sin embargo, en los juegos simples
analizados en este captulo. estas cuestiones no se plantean, por lo que su definicin es equivalente a los requisitos 1 a 4; Fudenberg y TIrole ofrecen condiciones bajo las cuales su equilibrio
bayesiano perfecto es equivalente al equilibrio sucesivo de Kreps y Wilson.

,,
''-.'

'.'

'.

\~ ..'

182 / JUEGO 5 DINA.\IICOS


''
-

CON INFOR,\IAClN

INCO~II'LET,\

Introduccin

re .)

Requisito 4. En conjuntos de informacin f/lera de la tral/eeto'


t
''b '
d
na [ e eqru 1 no
,
Iras se eterminan segn a regla de Bll1es y as ' t' t ' d
'
Jugadores donde sea posible,
es la egzas e los
las eOndl

Definicin U q ''b . b
duras que s'at n, e ul1 no .ayesiano perfecto

lS aeen os requIsItos 1 a 4.

consiste en estrategias y eon-

, Sera por supuesto til enunciar el requisito 4 de un modo m


'
eVItando la vaga instruccin "donde sea posible" L h
s preCISO,
una d 1
r
'
. o aremos en cada
eas
ap lCaClOneseconmicas analizadas en las siguientes se '
or
ahora
utir
l'"
CClOnes.
P
. Izaremos os Juegos de tres jugadores de las ti ras 4 1 4
~~.5 para Ilustra: y fundamentar el requisito 4. (De arriba abafc:se indi~a~
pagos de los Jugadores 1, 2 Y3 respectivamente.)
L

ni equilibrio

bnycsinno

perfccto

/ 183

l a 3, Tambin satisfacen de forma trivial el requisito 4, puesto que


no existe ningn conjunto de informacin fuera de esta trayectoria de
equilibrio, por lo que constituye un equilibrio bayesiano perfecto.

A
2

L'

O
O
A

Figura 4.1.5

Ahora consideremos las estrategias (L,!,!') junto con la conjetura p =


O. Estas estrategias constituyen un equilibrio de Nash; ningn jugador

-,,} .. _---

O
1
1

Figura 4.1.4

Este juego ti ne
b'
,
con un n'
un su Ju~go: comIenza en el conjunto de informacin
este sub' ICOe emento ~el Jugador 2. El nico equilibrio de Nash en
Juego entre los Jugadores 2 3
(1 D'
equilibrio de Nash e
. y es , ), por lo que el nico
Estas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').
g Y a conJetura p = 1 del jugador 3 satisfacen los requisitos

quiere desviarse unilateralmente. Estas estrategias Yla conjetura tambin


satisfacen los requisitos 1 a 3; el jugador 3 tiene una conjetura y acta
de forma ptima con respecto a sta, y los jugadores 1 y 2 actan de
forma ptima dadas las estrategias subsiguientes de los otros jugadores.
Pero este equilibrio de Nash no es perfecto en subjuegos, porque el nico
equilibrio de Nash del nico subjuego del juego es U,D'). Por tanto,
los requisitos 1 a 3 no garantizan que las estrategias de los jugadores
constituyan un equilibrio de Nash perfecto en subjuegos. El problema es
que la conjetura del jugador 3 (p = O) es inconsistente con la estrategia
del jugador 2 (l), pero los requisitos 1 a 3 no imponen restricciones a
la conjetura de 3 porque el conjunto de informacin de 3 no se alcanza
si el juego se desarrolla segn las estrategias indicadas. No obstante, el
requisito 4 fuerza a que la conjetura del jugador 3 est determinada por
la estrategia del jugador 2: si la estrategia de 2 es I, la conjetura debe ser

184/

JUEGOS DlN,\;lICOS CON INFORMACIN

Jllegos de sealizacin / 185

INCOMPLETA (e. 4)

= 1; si la estrategia de 2 es D, la conjetura de 3 debe ser p = O. Pero si


la conjetura de 3 es p = 1, el requisito 2 fuerza a que la estrategia de 3 sea
D', con lo que las estrategias (L,1,1') y la conjetura p = Ono satisfacen los
requisitos 1 a 4.

Como segunda ilustracin del requisito 4, supongamos que la figura


4.1.4 se modifica como muestra la figura 4.1.5. El jugador 2 dispone ahora
de una tercera accin po~ible, L' que termina el juego. (Para simplificar
ignoramos las ganancias' en este juego.) Como antes, si la estrategia de
equilibrio del jugador 1 es L, el conjunto de informacin del jugador 3 est
fuera de la trayectoria de equilibrio, pero ahora el requisito 4 puede no
determinar la conjetura de 3 a partir de la estrategia de 2. Si la estrategia
de 2 es L', el requisito 4 no pone restricciones en la conjetura de 3, pero si
la estrategia de 2 es jugar 1 con probabilidad q, D con probabilidad q2 y
' con probabilidad 1 - ql - q2, donde ql + q2 > O,el requisito 4 dicta que
la conjetura de 3 sea p = qj(q + q2).
Para concluir esta seccin, relacionamos de modo informal el equilibrio bayesiano perfecto con los conceptos de equilibrio presentados en los
captulos anteriores. En un equilibrio de Nash, la estrategia de cada jugador debe ser una mejor respuesta a las estrategias de los otros jugadores,
por lo que ningn jugador elige una estrategia estrictamente dominada.
En un equilibrio bayesiano perfecto, los requisitos 1 y 2 equivalen a exigir
que la estrategia de ningn jugador est estrictamente dominada comenzando en cualquier conjunto de informacin. (Vase la :;eccin 4.4 para
una definicin formal de dominancia estricta comenzando en un conjunto
de informacin.) El equilibrio de Nash y el equilibrio bayesiano de Nash
no comparten esta caracterstica en conjuntos de informacin situados
fuera de la trayectoria de equilibrio, como los conjuntos de informacin
que no estn contenidos en ningn subjuego. El equilibrio bayesiano perfecto tapa estos agujeros: los jugadores no pueden amenazar con jugar
estrategias estrictamente dominadas al comienzo de cualquier conjunto
de informacin fuera de la trayectoria de equilibrio.
Como indicamos anteriormente, una de las virtudes del concepto de
equilibrio bayesiano perfecto es que hace explcitas las conjeturas de los
jugadores para imponer no slo los requisitos 3 y 4, sino tambin otros
requisitos (sobre conjeturas fuera de la trayectoria de equilibrio). Puesto
que el equilibrio bayesiano perfecto no permite que el jugador' juegue una
estrategia estrictamente dominada comenzandQ en un conjunto de informacin fuera de la trayectoria de equilibrio, tal vez no sea razonable que
el jugador j crea que el jugador ' jugar tal estrategia. Sin embargo, puesto

que el equilibrio bayesiano perfecto hace que las conjeturas de los jugadores sean explcitas, este equilibrio no puede reconstruirse procediendo
hacia atrs en el rbol del juego, como hicimos para construir el equilibrio
de Nash perfecto en subjuegos. El requisito 2 determina la accin de un
jugador en un conjunto de informacin.dado basado en parte en la conjetura del jugador sobre dicho conjunto de informacin. Si el requisito 3
o el requisito 4 se aplican a este conjunto de informacin, determinan la
conjetura del jugador a partir de las acciones de los jugadores situados
ms arriba en el rbol. Pero el requisito 2 determina las acciones situadas
ms arriba en el rbol, basndose en parte en las estrategias subsiguientes
de los jugadores, incluyendo la decisin en el conjunto de informacin
original. Esta circularidad implica que una sola pasada ha~a atrs a lo
largo del rbol (normalmente) no es suficiente para calcular un equilibrio
bayesiano perfecto.

4.2 Juegos de sealizacin


4.2.A Equilibrio bayesiano perfecto en juegos de sealizacin
Un juego de sealizacin es un juego dinmico con informacin completa
y dos jugadores: un emisor (E) y un receptor (R). El desarrollo del juego
es el siguiente:

, '!li
.r'

1. El azar escoge un tipo ti del conjunto de tipos factibles T = {tI,' .. ,tI}


que asigna al siguiente emisor segn una distribucin de probabilidad
p(t;), donde p(ti) > Opara cada i y p(tl) + ... + p(tI) = 1.

2. El emisor observa ti y elige un mensaje


factibleslv! = {mI,' .. ,m}}.

mj

del conjunto de mensajes

3. El receptor observa mj (pero no ti) y elige a continuacin una accin


Uk de un conjunto de acciones factibles A = {al" .. ,aK}.
4. Las ganancias vienen dadas por

UE(ti,mj,ak)

UR(ti,mj,ak).

En muchas aplicaciones, los conjuntos T, M Y A son intervalos de la


recta real, en lugar de conjuntos finitos como los considerados aqu. Es
inmediato permitir que el conjunto de mensajes factibles dependa del tipo
que determina el azar, y que el conjunto de acciones factibles dependa del
mensaje que enva el emisor.

, 'Jt
_rJ

\
(
(

J'

Juegos de SeJllllizIlCi,ill / 187

186 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (e. 4)

Los modelos de sealizacion han sido aplicados extensamente en el


anlisis econmico, Para indicar la diversidad de posibles aplicaciones
mterpretamos brevemente la estructura formal en 1-4 en trminos de las
tres aplicaciones que sern analizadas en las secciones 4.2.B,4.2.C y 4.2.0.
En el modelo de sealizacin en el mercado de trabajo de
Spence (1973)elemisor esun trabajador, el receptor es el
mercado de posibles empresarios, el tipo es la capacidad
productiva del trabajador, el mensaje es la eleccin' del
nivel de educaci9n.c;leltrabajador yla accin es el salario
,pagado Eor el mercado.
'"
".
"

;',

:- - .:.'

En el modelo deinversirtempresarial
y estruc~rade
capital de Myers y Majluf (1984),el emisor es una empresa
que necesita capital para financiar WI nuevo proyecto, el
receptor es un inversor potencial; el tipo es la rentabilidad
de los activos existentes de la empresa, el mensaje es la
oferta de una participacin en l beneficio de la empresa
a cambio de financiacin y llaccin es la decisin de si
invertir ano por parte del inversor.

expectativa de inflacin por parte de los empresarios precede al juego de seii.alizacin, y la eleccin de la autoridad
monetaria de inflacin en el segundo periodo la sigue,

En el resto de esta seccin analizarnos el juego de seii.alizacin abstracto dado en 1 a 4, ms que estas aplicaciones. La figura 4.2.1 ofrece
una representacin en forma extensiva (sin ganancias) de un caso simple:
T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Ntese que el juego
no se desarrolla desde el nodo inicial en la parte superior del rbol hasta
los nodos terminales en la parte inferior, sino desde una jugada inicial
iterminada por el azar en mitad del rbol hasta los nodos terminales en
los extremos izquierdo y derecho.
Emisor
a,

a,
m,

:
a,

'. ,1: .~.

'

,
,
Receptor

Azar
,
,
,

1 - J

a,

m,

t,

ai

En el modelo de poltica monetaria de Vickers (1986), la


autoridad monetaria posee informacin privada sobre su
voluntad' de aceptar inflacin para aumentar el nivel de
empleo pero, por lo dems, el modelo es una versin en ,',
dos etapas del juego 'repetido con informacin completa
del modelo analizado en la seccin 2.3.E.As, el emisor es
la autoridad monetaria'. el receptor es la patronal, el tipo la
voluntad deja autoridad monetaria de aceptar una cierta
inflacin para aumentar el nivel de emple, el mensaje la
eleccin deja inflacin en el primer periodo por parte dela
autoridad monetaria y la accin la expectativa de inflacin
en el segundo periodo' por parte de los empresarios. La

a,

Receptor

E~ algunas aplicaciones, un juego de sealiza~i~.f9rm~parte de un juego


mas complejo. Por ejemplo, el receptor pdra tri~r ~ud'cisill antes de
que el emisor eligiese el mensaje en la segunda ~f~pa y~'elemisor podra
tornar su decisin despus de que el receptor tomase la suya en la etap~ 3
(o simultneamente). ,

m,

t,

a,

m,
a,

Emisor

Figura 4.2.1
Recordemos que (en cualquier juego) la estrategia de un jugador es un
plan de accin completo; una estrategia detalla una accin factible para
cada contingencia en la cual el jugador pudiera tener que actuar. Por lo
tanto, en un juego de seii.alizacin, una estrategia pura del emisor es una
funcin m(ti) que especifica qu mensaje elegir para cada tipo que el
azar pueda detemIinar, y una estrategia pura del receptor es una funcin
o.(mj) que especifica qu accin elegir ante cada mensaje que .el emisor
pueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor como
el receptor cuentan con cuatro estrategias puras.

188/

JUEGOS DINMICOS CON INFORMACIN

Estrategia 1 del emisor: Jugar


azar determina t2.

INCOMPLETA (e. 4)

Juegos de selializacin / 189

si el azar determina t] y jugar m] si el

mI

Estrategia 2 del emisor: Jugar m] si el azar determina t] y jugar


azar determina t2.

m2

si el

Estrategia 3 del emisor: Jugar TI12si el azar determina t] y jugar m] si el


azar determina t2'
'
Estrategia 4 del emisor: Jugar
azar determina t2.

m2

si el azar determina t] y jugar

m2

si el

Estrategia 1 del receptor: Jugar a] si el emisor elige m] y jugar a] si el


emisor elige m2.
Estrategia 2 del receptor: Jugar a] si el emisor elige m] y jugr
emisor elige m2.
.
,

ai si el

Estrategia 3 del receptor: Jugar a2 si el emisor elige m] y jugar a] si el


emisor elige m2.
Estrategia 4 del receptor: Jugar
emisor elige m2.

a2

si el emisor elige m] y jugar a2 si el

Llamamos a las estrategias primera y cuarta del emisor de agrupacin,


porque cada tipo enva el mismo mensaje, y a la segunda y a la tercera de
separacill, porque cada tipo enva un mensaje diferente. En un modelo
con ms de dos tipos tambin existen estrategias de agrupacin parcial (o de
semi-separacin) en las cuales todos los tipos en un determinado conjunto
de tipos envan el mismo mensaje, pero diferentes conjuntos de tipos
envan mensajes diferentes. En el juego con dos tipos de la figura 4.2.1
existen estrategias mixtas anlogas llamadas estrategias hfbridas, en las
cuales (digamos) t] juega m] pero t2 escoge aleatoriamente entre m] Y'1112.
Ahora traducimos los enunciados informales de los requisitos 1, 2 Y3
de la seccin 4.1 a una definicin fOfilal del equilibrio bayesiano perfecto
en un juego de sealizacin. (La discusin sobre la figura 4.1.5 implica que
el requisito 4 es vacuo en un juego de sealizacin.) Para simplificar las
cosas, limitamos nuestra atencin a las estrategias puras; las estrategias
hn)ridas se discutirn brevemente en el anlisis de la sealizacin en el
mercado de trabajo de la prxima seccin, Dejamos como ejercicio la
definicin del equilibrio bayesiano de Nash en un juego de sealizacin
(vase el ejercicio 4.6).
Puesto que el emisor conoce la historia completa del juego cuando
elige un mensaje, esta eleccin se da en un conjunto de informacin con
un lnico elemento. (Existe un conjunto de informacin de esa clase para
cada tipo que el azar pudiera determinar.) Por tanto, el requisito 1 es trivial

cuando se aplica al emisor. El receptor, por el contrario, elige una accin


despus de observar el mensaje del emisor pero sin conocer el tipo de ste,
por lo que la eleccin del receptor se da en un conjunto de informacin con
ms de un elemento. (Existe un conjunto de informacin de esa clase para
cada mensaje que pudiera elegir el emisor y cada uno de estos conjuntos de
informacin tieneun nodo para cada tipo que pudiera haber determinado
el azar.) Aplicando el requisito 1 al receptor obtenemos:
Requisito 1 de. sealizacin.
Despus de observar cualquier mensajemj d~
M, el receptor der~formarseuna
conjetura sobre,qu tipos. podran haberenVld~
rn. Denotelrios'esta conNttira con la distribuciii de probabilidad(tilmjt
dj~4e, .
J
.'
.' ... '
.....
...
.'
.
..
. ....'
,
.,'
'.'
.(t;lmj)~Opara"cdati'im
T y'"
"

L .(tjmj)

1.

tiET

Dados el mensaje del emisor y la conjetura del receptor, es inme~iat?


caracterizar la accin ptirrl del receptor. " Aplicando el requisito','f::il:!,.'
"T'-, '.,;--:;,'.~t '
receptor obtenemos:
", /~:
Requisito fR de sealizacin.
Para cada mj en NI, la accin del receP-!
tor a*(mj) debe maximizar la utilidad esperada del receptor dada la conjetura
.(tdmj) sobre qu tipos podran haber enviado "mj. Es decir, a*(mj) es una
solucin de

El requisito 2 tambin se lplica al emisor, pero ste tieneinf0:mac;:in


completa (y por tanto una conjetura trivial), y adems decide sorament~
al principio del juego, por lo que el requisito 2, e~ simplemen~e que la
estrategia del emisor sea ptima dadala estrategia d! receptor:
Requisito2E <lesealizacin.
Para cada ti enT: elmensaje del emisor m * (ti)
debe maximizar la utilidqd del emisor d,qda la estrategia del receptor a*(mj). Es
decir, m~(ti) es una solucin de

,'.
'.','

Juegos de se1alzalf
190 / JUEGOS DINMICOS CON INFORMACIN

:," >

~inalmente, dada la estrategia del emisor m *( ,


'
j
tipos que envan el mensaje m Es de'
t
t.), sea T el conjunto de
T si m*(l)
= m.
S' T
'J' ,
,Clr, .i es un elemento del conjunto
,
J'
1 j no esta vaclO, el con'
t d .
.,
j
rrespon,diente al mensaJ'e mj es t'a en 1a trayect Jun
co'd o e mformaclOn
'"
contrario ningu'n tl'PO' ,
ona e eqUIlIbno; en caso
,
enVla m. por lo qu 1
.
correspondiente est fu
d' 1 J'
, e e conjunto de informacin
era e atrayectona de e Tb'
en la trayectoria deequI'll'b'no 1a ap l'IcaClondel
.,
qUI..1 no,
3 Para mensajes
del receptor resulta en:
reqUISIto a las conjeturas
Requisito 3 de seializacin. Para cada m.'
"
'
.
n:*(ti) .~ mj, la c01"ijetu;adel re;'ton;n el'c/: en M, s~ eXIste t~/n Ttal que
dIente a mj debe derivarsed . l
P, d'
. yunto de tnformaclOn correspone a reg a B~yes y la estrategia del emisor:
'
,

/.'

'

P(ti)

E.p(ti) .
".

;':
'\.

"

/ IlJ 1

INCOMPLETA (c. 4)

t,ET,

Definicin, Un equilibrio
bayesiano
erfi t
.'.
.
juego de sealizacin consiste en ," dP ec o ,CO~l estrategIas puras en un
' t
unpar eestrategzasm*(t')ya*(m)
je ura At 1m )
. fi
'j
,yen una
con
(3).
' 'J que satls acen los requisitos de sealizacin (1), (2R), (2E) Y

Si la estrategia del emisor es de agrupacin o de separacin, llamamos


al equilibrio de agrupacin o de separacin, respectivamente.
Concluimos esta seccin hallando los equilibrios bayesianos perfectos
en estrategias puras en el ejemplo con dos tipos de la figura 4.2.2. Ntese
que cada tipo tiene las mismas posibilidades de ser elegido al azar; utlizam<?s(p,l _ p) y (q,1 - q) para denotar las conjeturas del receptor en sus
dos conjuntos de informacin.
Los cuatro posibles equilibrios bayesianos perfectos con estrategias
puras de este juego con dos mensajes Y dos tipos son: (1) Agrupacin en
Ii (2) AgrUpacin en Di (3) Separacin con tl eligiendo J Y t2 eligiendo
D, y (4) Separacln con tl eligiendo D Y t2 eligiendo J. A continuacin
analizamOs estas posibilidades.
1. Agrupacin en J. Supongamos que hay un equilibrio en el cual
la estrategia del emisor es U,!), donde (mi ,-m") significa que el tipo 1.1
elige m' Y el tipo t2 elige mil. Entonces, el conjunto de informacin del
receptor que corresponde a J est en la trayectoria de equilibrio, por lo que
la conjetura del receptor (p,l - p) en este conjunto de informacin viene
determinada por la regla de Bayes y la estrategia del emisor: p = 0,5, que
es la distribucin a priori. Dada esta conjel1.lra(o cualquier otra conjetura),
la mejor respuesta del receptor que sigue a J es elegir a, de manera que
105 tipos del emisor tl y t2 alcanzan ganancias de 1 y 2respectivanlPnte.
Para determinar si ambos tipos del emisor quieren elegir J, necesitamos
establecer cmo reaccionara el receptor a D. Si la r~spuesta del receptor
a D es a, el pago al tipo ti por elegir D es 2, 10 que es mayor que el pago
de 1 que recibe por elegir J. Pero si la respuesta del receptr a D es b,
h Y t2 alcanm unas ganancias de y 1 respectivamente por elegir D,
mientras queson de 1 y 2 respectivamente por elegir J. Por lo tanto, si
existe Ufl equilibrio en el cual la estrategia delenisor es U,I), la respuesta
del receptor a D debe ser b, de manera. que la estrategia del receptor debe
ser (o.,b), donde (e' ,e") significa que el receptor elige c' despus de r y
e" despus de D. Queda por considerar la conjetura del receptor en el
conjunto de informacin correspondiente a D y la optimalidad de elegir
b dada esta conjetura. Puesto que elegir 1) es ptimo para el receptor
para cualquier q S 2/3, tenemos que [U,J),(o.,b),p == 0,5,q] es un equilibrio

'.\

bayesiano perfecto de agrupacin para cada q S 2/3.


2. Agrupacin en D. A continuacin supongamos que la estrategia
del emisor es (D,D). Entonces q = 0,5, de manera que la mejm respuesta
del receptor a D esb, obtenindose unas ganancias de para l., y 1 pnra
t2. Pero ti puede conseguir 1 eligiendo J, puesto que la mejor respuesta

1)12 JUEGOS DINMICOS CON INFOI~IVI~C10'N


I';CO
'"tvIPLETA

Liegos de sealizacin / 193

(e. 4)

del receptor a ,[ es a para cualquier valor de )


l
'
equilibrio en el cual el
"
j y, por o tanto, no eXIsteun
emISOrJuegue (D,D).
3. Separacin con eleccin de I or a
'.
la estrategia de separacin U D) l Pd P rte de tI' SI.el emIsor elige
receptor estn en la tra
t ~ :1' os os conjuntos de informacin del
yec ona l e equilib .
l
se delenl1inan por la regl d BIno,
por o que las conjeturas
y I} '" O Las'
a e ayes y a estrategia del emisor: p '" 1
a y b res~ectiva::~;:s
drespuestas del receptor a dichas conjeturas _son
, '
,e manera que ambos tipos del'
.
ganancias de 1 Qued
.
emIsor, conSIguen
dada la estrat~gia de~por compr(obar sIla estrategia del emisor es ptima
receptor a b) No lo es' si - l ti
eligiendo I en lugar de DI'
.
.
e po t2 se desva
,e receptor responde con
1
una ganancia de 2
' ,
a, con o que t2 recibe
elegir D.
' que es mayor que la ganancia de 1 que recibe t2 al
4. Separacin con eleccin de D or
d
.
estrategia de separaci (D I) 1
~ parte e tI' SI el emisor elige la
(/ _ 1 d
'
n,
,as conjeturas del receptor deben ser p - O
- , e manera que la mejo
dI'
- y
consiguen unas ganancias d: r;s~~esta e re~eptor .e~(a,a) y ambos tipos
reaccionara con a'la g
. ci
tI s~ deSVIaraelrgIendo 1, el receptor
incentivo para qu~ 1 s:r;nCl~ de t s]ena ent~nces de 1,c,on lo que no hay
eSVIe e D Del rrusmo mod
.t
d
'
de D, el receptor reaccio'
.1
' o, SI 2 se esviara
nana con a' a ganancia de t
'
1, con lo que no existe'
.'
2 sena entonces de
[(D,I),Ca,a),p = O _ 1] mcent1vo p.ar~ que t2 'se desve de l. Por lo tanto,
,q es un eqUIlIbno bayesiano perfecto de se paraclOn.
'
.,
4.2.B Sealizacin en el mercado de trabajo
La Senorme
literatura sobre' Juegos d e senalrzaclOn
_.
. , comienza con el model
de
'
pence (1973), que precedI tanto ala amplia utilizacin dI'
o
e los Juegos en
f orma extensiva para des cn'b'Ir pro bl emas econmic
de conceptos de equilib .
1d
'"
os como a a definicin
no como e e eqUIlrbno bayesiano perfecto
" replanteamos el modelo d S
.
_ En esta seCClOn
'.
lorma extensiva y luego d
'b'
l
e pence como un Juego en
escn IrnOSa gunos de sus
'l'b'
b
perfectos' en la s
.,
.,eqm
1 nos ayesianos
ba
.'
_ eCClOn4,.4 aplrcaremos un refinamiento del eq 'I'b .'
yesIano perlecto a est'
El
m 1 no
e Juego.
desarrollo temporal es el siguiet:lte:
1. El azar determin

puede ser o alta ~; ~?~Cl~)d rOdUCtiv~ ~e un trabajador, 1), la cual


2. El'
aja
. a probabIlIdad de que 1) = A es q.
trabajador averigua
'd d
'
cacin e ~ O.'
su capacI a y entonces elige un nivel de edu-

':.

3. Dos empresas observan la educacin del trabajador (pero no su capa4


cidad) y entonces le hacen ofertas salariales de forma simultnea.
4. El trabajador acepta la oferta salarial ms alta, lanzando una moneda
en caso de empate. Sea -w el salario que acepta el trabajador.
",

Las ganancias son las siguientes: -w - c('I),e) es la del trabajador, donde


c(r,e) es el coste en el que incurre un trabajador con capacidad '1) para
obtener una educacin e; y(r,e) - -w es la de la empresa que emplea al
trabajador, donde y(r,e) es la produccin de un trabajador con capacidad
r qu~ ha ot>!enido una educacin e; y cero es la de la empresa que no
empleaal trabajador.
Vamos a centramos (aqu en cierto modo y ms en la seccin 4.4) en un
equilibrio bayesiano perfecto en el cual las empresas interpretan la educacin como una seal de capacidad y, en consecuencia, ofrecen un mayor
salario al trabajador con ms educacin. La irona del trabajo de Spence
(1973) es que los salarios pueden aumentar con la educacin incluso si la
educacin no tiene efecto alguno sobre la productividad (es decir,irIcluso
si la produccin del trabajador con habilidad r es y(r), independientemente de e). El trabajo de Spence (1974) generaliza el argumento al irIcluir
la posibilidad de que la produccin aumente no slo con la. capacidad,
sino tambin con la educacin; la conclusin anloga es entonces que los
salarios aumentan con la educacin ms de lo que puede explicarse por
el efecto de la educacin en la productividad. Seguimos este enfoque ms
general.s
Es un hecho bien establecido que los salarios son mayores (en promedio) para los trabajadores con ms aos de escolaridad (por ejemplo,
vase Mincer [1974]). Este hecho invita a irIterpretar la variable- e como
los aos de escolaridad. En un equilibrio de separacin podramos pensar que un trabajador con capacidad baja tiene una educacin de grado
medio y que un trabajador con capacidad alta tiene una educacin universitaria. Desgraciadamente, interpretar e como los aos de escolaridad
plantea cuestiones dinmicas que no tratamos en el juego simple en 1--4,
como la posibilidad de que una empresa haga una oferta salarial despus

,',,'-,
i

','

4 La presencia de dos empresas en el papel del receptor deja este juego ligeramente fuera
de la clase de juegos analizada en la seccin previa; pero vase la discusin que precede a la

ecuacin (4.2.1).
5 Formalmente, suponemos que trabajadores con alta capacidad sbn ms productivos (es
decir, y(A,e) > 'y(I3,e) para toda e), y que la educacin no reduce la productividad (es decir,
Ye(TI,e) ~ Opara cada 'TI y cada e, donde ye('r,e) es la productividad
marginal de la educacin

",

para un trabajador de capacid"d TI con una educacin e).

____________________

(:;:"
..J.

fuegos de sClia/izacin
194

:""r

JUEGOS DINMICOS CON INFORMACIN

/195

INCOMPLETA (c. 4)

del primer ao de universidad de un trabajador (es decir, despus de


que un trabajador de baja capacidad haya terminado sus estudios pero
antes de que uno de alta capacidad lo haya hecho). En un juego ms
complejo el trabajador podra elegir cada ao si aceptar la mejor oferta
del momento o volver a estudiar otro ao. Noldeke y Van Damme (1990)
analizan un juego ms rico en esta lnea demostrando que: (i) hay muchos .
equilibrios bayesianos perfectos; (ji) despus de aplicar un refinamiento
estrechamente relacionado cbn el que aplicaremos en la seccin 4.4, slo
uno de estos equilibrios sobrevive, y (iii) este equilibrio que 'sobrevive es
idntico al nico.equilibrio del juegosimple en 1,-4 quesobrevive despus
de aplicar el refinamiento de la seccin. 4.4, ..Por lo tanto, podriamos interpretar vagamente e como los aos deescoiaridad enel juego simple en
1,-4, porque los resultados son lbs mismos. en el juego ms rico.
En su lugar; vamos a evitar estas cuestiones dinmicas interpretando
las diferencias en e como diferencias en la calidad del rendimiento de un
estudiante, 110 como diferencias n la d~racin de la escolaridad de dicho
estudiante. Por tanto, ei juego en t-4 podra aplicarse a un grupo de
estudiantes que han. terminado los estudios mediO,s~esdecir, trabajadores
con doce aos. de educacin exaCtamente) o.a tUl grupo de icenciados
universitarios, o a un grupo de estudiantes con un mster en direccin de
empresas. Bajo esta interpretacin, e mide el nmero y el tipo de asigna:.turas estudiadas y las notas y premios conseguidos durante un programa
acadmico de duracin fija. Los costes de la enseanza (si existen) son entonces independientes de e, de manera que la funcin de costes c(7],e) mide
los costes no monetarios (o psquicos): estudiantes cn una capacidad
ms baja encuentran ms difcil conseguir notas altas en una institucin
determinada, y tainbin ms difcil conseguir las mismas notas en una
institucin ms competitiva. As, la utilizacin de la educacin por parte
de la empresa como seal, refleja el hecho de que las empresas contratan
y pagan m~s a los mejores estudiantes de una institucin determinada y
a los estudiantes de las mejores instituciones.
El supuesto crucial en el modelo de Spence es que los trabajadorescon
poca capacidad encuentran la sealizacin ms cara que los trabajadores
con capacidad ms alta. De un modo ms preciso, el coste marginal de
la educacin es ms alto para trabajadores de baja capacidad que para los
de capacidad alta: para cada e,

donde Ce (''I,e) denota el coste marginal de la educacin de un trabajador de


capacidad 7] y educacin e.Para interpretar este supuesto consideremos
un trabajador con educacin el al que se le paga un salano 11J], como
muestra la figura 4.2.3,y calculemos el aumento salarial que sera necesario
para compensar a este trabajador por un aument~ eneducac~nde el a
e2. La respuesta depende de la capacidad del trabajador: tra~~Jado:'~scon
capacidad baja encuentran ms difcil adquirir una educaClon adlCJonal,
or lo que requieren un aumento salarial ms alto (hasta IJ)B en lugar de
~lo hasta WA) para compensarles por ello. La interpretacin grfica de
este supu.esto e~q}le}s~ trabajadores con capacidad baja tienen c:Jrvas de
indiferencia '~ii.'mayorpendiente que los trabajadores con capaCIdad alta
(compresej~

co~ IAenlafigura).

.
IR
lA

::.
v
w,

~.

Figura 4.2.3

Tambin supone Spence que la competencia entre las empresas har


que los beneficios esperados sean cero. Una forma de incorporar este
supuesto a nuestro modelo sera sustituyendo las dos empresas en la
etapa (3) por un nico jugador llamado mercado que hace una oferta .s~larial nic'a w y que recibe la ganancia -[Y(T7,e) - w]2 (Esto cOl1vertma
el modelo en uno de la clase de juegos de sealizacin con un receptor
definidos en la seccin anterior.) Para maximizar la ganancia esperadil,

196/

JUEGOS DINMICOS CON INFORMACJN

INCOMPLETA (e. 4)

Juegos de sealizacin / 197

como pide el requisito 2R de sealizacin, el mercado ofrecera un salario


ib'lJal al producto esperado de un trabajador con educacin e, dada la
conjetura de! mercado acerca de la capacidad del trabajador despus de
observar e:

w(e)

= .L(Ale)

. y(A,e)

+ [1 -

.L(Ale)] . y(E,e),

Curvas de
indiferencia
para capacidad

(4.2.1)
y(n,e)

donde .(.4Ie) es la probabilidad que el mercado asigna a que la capacidad


del trabajador sea A. El propsito de tener dos empresas compitiendo
entre ellas en la etapa (3) es conseguir el mismo reslta.dosm '~t::~mr a.
un jugador ficticio llamado mercado. Sin embargo, par g.arimftzar que
las empresas siempre ofrezcan un salario igual al produtoesperado del
trabajador, necesitamos imponer otro supuesto: tras observar la eleccin
de educacin e, ambas empresas se forman la misma conjetura sobre la
capacidad del trabajador, nuevamente denotada por .L(Ale). Puesto que
e! requisito 3 de sealizacin determina la conjetura que ambas empresas deben formarse despus de observar la eleccin de e que est en la
trayectoria de equilibrio, nuestro supuesto es realmente que las empresas
tambin comparten una misma conjetura tras observar la eleccin de e que
est fuera de la trayectoria de eqllibrio. Dado este supuesto, ~e deduce
que en cualquier equilibrio bayesiano perfecto ambas empresas ofrecen
e! salario w(e) dado en (4.2.1), tal como en el modelo de Bertrand de la
seccin 1.2.Blas empresas ofrecen ambas un precio igual al coste marginal
de produccin. Por tanto, (4.2.1) sustituye al requisito 2R de seal.izacin
en el modelo con dos receptores de esta seccin.
Para preparamos para el anlisis de los equilibrios bayesianos perfectos ele este juego de sealizacin, consideramos primero el juego anlogo
con informacin completa. Es decir, suponemos temporalmente que la
capacidad del trabajador es informacin del dominio pblico entre los
jugadores, en vez de infoffi1acin privada del trabajador. En este caso, la
competencia entre las dos empresas en la etapa (3) implica que un trabajador con capacidad TI y educacin e recibe el salario w(e) = Y(TI,e)~ Parlo
tanto, un tTabajador con capacidad TI elige e, que soluciona

e*(iz)

(';,
;

Figura 4.2.4
Ahora volvemos (deforma permanente) al supuesto de que la capacidad del trabajador es informacin privada. Esto abre la posibilidad d~ que.
un trabajador con capacidad baja pueda tratar de pasar por un trabaJa~or
de capacidad alta. Pueden plantearse dos casos. La ~gura 4.2.5 des~nbe
el caso en el que le resulta demasiado caro a un trabajador con capacIdad
baja adquirir una educacin e*(A), incluso si esto permitier~ engaa~ a las
empresas y hacer que le pagaran el salario w*(A). Es deCIr,en la figura
4.2.5, w*(B)

- c[B,e*(B)]

>

w*(A)

- c[E,e*(A)].
'-:

lA
y(A,e)

w
w*(A)

,',

y(B,e)

w*(B)
e

w*(-,) = Y[',e*Cr)].

e*),

como muestra la figura 4.2.4, siendo

e*(B)

e'(A)

Figura 4.2.5

"

'".'

e')

max y(-r,e) - c(-r,e).

Denotamos la solucin con

},

':,:,

,,

Juegos de se>lalizacll

198/ JUEGOS DINMICOS CON [NFORMAClN INCOMPLETA (c. 4)

La figura 4.2.6 describe el caso contrario, en el cual podra decirse


que el trabajador con capaCidad baja envidia el salario y nivel de edu~
cacin del trabajador con capacidad alta (es decir, ?U'(E) - dE,e'(E)]
<
?U'(A) - dE,e'(A)]).
Este ltimo caso es ms realista y (como veremos)
ms interesante. En un modelo en el que la capacidad del trabajador tiene
ms de dos valores, el primer caso se plantea slo si cada valor posible de
capacidad es suficientemente diferente de l~s valores posibles adyacentes.
Si la capacidad es una variable continua, por' ejemplo, entonces se da el
ltimo caso.

w*(B}

Para completar la descripcin de equilibrio bayesiano perfecto ele agrupacin nos falta (i) determinar la conjetura ele la~ empresas p,(A le) para
las elecciones de educacin e =1 ep fuera del eqUlltbno, que entonces determina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),
y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador a
la estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1 epresentan los requisitos 1 y 2E de sealizacin respechvame~te: CO~l~O
apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2R de senaltzaclon
en este modelo con dos receptores.
Una posibilidad es que las empresas crean que cualquier niv.elde ed~lcacin distinto de ep indica que el trabajador tiene Wla capaCIdad baja:
p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podra parecer extraa, nada en la definicin de equilibrio bayesiano perfecto la e~c1L1ye,
porque los requisitos del 1 al 3 no imponen restricci~~es a las conjeturas
situadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en un
juego de sealizacin. El refinamiento que aplicamos en la seccin 4.4 restringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en un
juego de sealizacin; en particular excluye la conJ::ura que anahzamos
aqu. En este anlisis de los equilibrios de agrupaclOn ~~s cent:3mos en
esta conjetura para simplificar la exposicin, pero tamblen conSIderamos
brevemente conjeturas distintas.
Si la conjetura de la empresa es

__
,_,__
.

e*(B}

/ '199

~L(Ale)

e*(A)

apara
e =1 ep
{ q para e = ep

(4.2.3)

entonces (4.2.1) implica que la estrategia de las empresas es


Figura 4.2.6
w(e)
;: ..
'.:.",'

-.':: .

Como describimos en la seccin anterior, en este modelo pueden existir tres casos de equilibrios bayesianos petf~i:tos: de' ~i;rupacin, de separacin e hbrido. Normalmente existen numerososdsos de cada clase de
equilibrio; aqu l~mitamos nuestra atertci6riiirios cant~s ejemplos. En
un equilibrio de agrupacin, los dos tipos del trabajador eligen un nivel de
educacin nico, digamos ep' Elrequisit03'de seilicin impli<;aque
la conjetura de las empresas despus de observar ep debe ser lac'onjetura
a priori p,(Alep) = q, que, a su vez, exige que el salario ofrecido despus de
observarep
sea
(4.2)

_ {Y(E ,e)
wp

Un trabajador con capacidad

7]

para e =1 ep
para e,. -- e-p'

(4.2.4)

escoge por lo tanto e como solucin de

max'w(e)

- c(7/,e).

(4.2.5)

La solucin de (4.2.5) es simple: un trabajador con capacidad 7] elige o


epa el nivel de educacin que maximiza 'y(13,e) - c(T/,e). (Este ltimo es
precisamente e'(E) en el caso del trabajador de capacidad baja.) E.n el
ejemplo descrito en la figura 4.2.7, lo primero es ptimo para .ambos t.lpOS
del trabajador: la curva de indiferencia del trabajador de baja capaCldad
que pasa por el punto [e'(B),w'(B)
queda por debajo de la curva de
indiferencia del mismo tipo que pasa por el punto (ep,wp), y la curva

2(JO ! JUEGOS DINMICOS CON INfORMACiN

INCOMPLETA (c. 4)

Juegos de seiializncin / 201

de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'll)p)
est por encima de la funcin de salario tu = y(B,e).

trab~jador constituyen otro equilibrio bayesiano de agrupacin. Como


ejemplo de lo ltimo, supongamos que la conjetura de las empresas es
cOffi9 en (4.;2.3), con la excepcin de que cualquier nivel de educacin por
encima de el! se interpreta como que el trabajador se escoge al azar de la
distribu.cin de capacidades:

y (A,e)

O
q y(A,e)
+ ( 1 - q)

L(Ale) =
y(R,e)

e'

para e :S el! excepto cuando e =


para e = el'
para e > el!;

el'
"
1.:.;.

donde el! en la figura 4.2.7 es el nivel de educacin en el cual la curva


de indiferencia del trabajador con capacidad alta que pasa por el punto
(ep'wp) corta la funcin de salarios w = q . y(A,e) + (l - q) . y(B,e).
La
estrategia de las empresas es entonces

(R,e)

.
e*(B)

q
{ q

w(e)

{Y(B,e)
wq
Wq

para e :S el! excepto cuando e =


para e = el'
para e> el!.

el'

-,.Esta conjetura y esta estrategia de las empresas, y la estrategia (e(B) =


-e;,e(A)
= el') deltrabajdor constituyen un tercer equilibrio bayesiano
perfecto de agrupacin.
Ahora vamos a tratar equilibrios de separacin. En la figura 4.2.5;
(el caso donde no hay envidia) el equilibrio natural bayesiano perfecto
~-d~
separacin incluye la estrategia [e(B) = e'(B),e(A)
= e'(A)] del tTab'i.
j'ldor. El requisito 3 de sealizacin determina entonces la conje~
de
---lasempresas despus de observar cualquiera de estos dos niveles deeducacin (concretamente L[Ale'CB)] = OY L[A\e'CA)] = 1), por lo que C4.2.1)
implica que w[e'CB)] = w'(B) y w[e'(A)l
= w'CA). Corno enla discusin
de los equilibrios de agrupacin, para completar la discusin de estos
_.equilibriosbayesianos perfectos de separacin nos queda: (i) establecer la
conjetura L(A[e) de las empresas para elecciones deniveles de educacin
f}1eradel equilibrio (es decir, valores de e Pistntos de e'CB) o e'CA)), la
- ~ c~al determina entonces el resto de las estrategias wCe) de las empresas a_
.. partir de (4.2.1), y (ii) demostrar que la mejor respuesta de un trabajador
de capacidad r a la estrategia w(e) de las empresas es elegir e = e'Cr).

Figura 4.2.7
En resumen, dadas las curvas de indiferencia, las funciones de produccin y el valor de el' en la figura 4.2.7,la estrategia [efE) = ep,e(A) = el']
del trabajador, y la conjetura L(Ale) en (4.2.3)y la estrategia w(e) en (4.2.4)
de las empresas constituyen un equilibrio bayesiano perfecto de agrupacin.
Existen muchos otros equilibrios bayesianos perfectos de agrupacin
en el ejemplo definido por las curvas de indiferencia y las funciones de
produccin de la figura 4.2.7. Algunos de estos equilibrios incluyen una
eleccin de un nivel de educacin diferente por parte del trabajador (es
decir, un valor de el' distinto del de la figura); otros incluyen la misma
eleccin de un nivel de educacin pero difieren fuera de la trayectoria de
equilibrio. Como ejemplo de lo primero, sea e un nivel de educacin entre
ep y el, donde el en la figura 4.2.7 es el nivel de educacin en el eualla curva
de indiferencia del trabajador de baja capacidad que pasa por el punto
(e'(B)w'(B)
corta la funcin de salario w = q . y(A,e) + (l - q) . y(B,e).
C"
'.
01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategia
resultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del

(,',

"
0'

",<

,'.
'.',',','

1'.>.,

Una conjetura que cumple estas condiciones es que el trabajador tenga


capacidad alta si e es al menos e'CA), y capacidad baja en cualquier otro
caso:
"

________

.:..--

1::'

202 / JUEGOS DlNMICOS CON INFORMACIN

Juegos de selaliznci"

INCOMPLETA (e. 4)

2m

y(A,e)

O
p,(Afe) = { 1

para e < e'(A)


para e.2: e'(A).

10

(4.2.6)

La estrategia de las empresas es entonces

( _ { y(E,e)
we ) y(A,e)

para e < e'(A)


para e 2: e'(A).

Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta.
a la funcin de salariosw = y(A,e), tambin es la mejor respuesta aqu.
Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuesta
de dicho trabajador cuando la funcin de salarios eSw == y(E,e), de manera que w'(E) -e[B,e'(E)]
es la mayor ganancia.que el trabajador puede
lograr de entre todas las elecciones de e < e'(A), Puesto que las cur~.
vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:
diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] es
la mayor ganancia que puede conseguir; aqu un trabajador de baja capacidad de entre todas las elecciones de e 2: e'(A).
Por tanto, e'(E)
es la mejor respuesta de un trabajador de baja capacidad, puest? qu~
w'(E) - dE,e'(E)]
> w'(A) - dE,e'(A)] en el caso en que no hay envidia_
A partir de aqu ignoramos el caso en el que no hay envidia. Como
sugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es ms inte"'
resante. Ahora el trabajador con capacidad alta no puede ganar el salario
alto roCe) = y(A,e) simplemente eligiendo la educacin e'(A) queelegia
bajo informacin completa. En su lugar, para sealizar su capacidad, el
trabajador con capacidad alta debe elegir e., > e'(A), .como muestra la
figura 4.2.8, puesto que el trabajador con capacidad baja imitar cualquier
valor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tiene
capacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de'
separacin incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabajador y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salarios
de equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. ste es
el nico comportamiento en equilibrio que sobrevive al refinamiento que
aplicaremos en la seccin 4.4.

y(A,e,J

w'(A)
y(B,e)

w'

(L)

e*(B)

e'(A)

es

Figura 4.2.8
.,
de e uilibrio, de las conjeturas de las emjJr~sas
Una expreslOn, fuera
.q
., .
Itrabajador tIene
que sustenta este comportamiento de e~Ulhbno es que ~o'
capacidad alta si e 2: e., y capacidad baja en caso contra .
O
para e
p,(Aje) = { 1 para e

< es
2: e.,.

La estrategia de las empresas es entonces


y(E ,e)
-- w(e) = { y(A,e)

para e < es
para e 2: es.

.
cidad baja tiene dos
Dada esta funcin de salarios, el trabaJado.r con capa.
ar' (A,e,).
". .. .
l . '(E)
ganar 1}! (B) y elegIr es y gan.l/
.
mejores respuestas: e eglr e
y
.
f
d p'(JJ)' al.
ue esta indiferencia se resuelve en avor e ~
,
Vamos a suponer q
.'
f dad arbitrariamente
. '"
d 'amos aumentar es en una can 1
.
temativamente po n
..
'd d b J'aprefiriera estnc- d
ue el trabajador con capaCl a a
pequena e manera q
,...
'd d alta las elecciones
tamente e'(E), En cuanto al trabajador con capan a
,
.'
d
.
.
> e'(A). :Puesto que
las LUlvas e
. de e > e son lnfenores a e" ya que e.,.
,
'j'
s
.
'dad baJ'a llenen mas pem lente que
indiferencia del trabaJador con capacI
.
1 '1 .
.d d lta la curva de indiferenCla de u t11110
las del trabajador con capacl a a ,
.,
1 .'
que pasa por el punto ( e"y. (A ,es est por encima de la funclOn de s.a allos
b"
.
1 que las. elecciones de e < es son tam len
w = y(B,e) para e < e" por o

Juegos de sealizncin / 205

20-1 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)

inferiores. Por lo tanto, la mejor respuesta del trabajador con capacidad


alta a la estrategia de las empresas w(e) es e.
Como en el caso de los equilibrios de agrupacin, existen otros equilibrios de separacin que incluyen diferentes elecciones de niveles de
educacin del trabajador con capacidad alta (el trabajador con capacidad
baja siempre se separa en e*(B); vase lo que sigue) y otros equilibrios de
separacin que incluyen las elecciones de educacin e*(E) y es pero difieren fuera de la trayectoria de equilibrio. Como ejemplo de lo primero,
sea e un nivel de educacin mayor que es pero lo suficient~mente pequeo como para que el trabajador con alta capacidad prefiera sealizar
su capacidad eligiendo e en lugar de inducir a pensar que tiene capacidad baja: y(A,e) - c(A,e) es mayor que y(B,e) - c(A,e) para cada e. Si
sustituirnos es por e en L(Ale) y w(e) que acompaan a la figura 4.2.8, la
conjetura y la estrategia resultantes para las empresas, junto con la estrategia re(E) = e*(E),e(A) = e] del trabajador constituyen otro equilibrio
perfecto de Nash de separacin. Corno ejemplo de lo ltimo, sea la conjetura de las empresas sobre niveles de educacin que estn estrictamente
entre e*(A) y es estrictamente positiva pero lo suficientemente pequea,
de manera que la estrategia resultante w(e) est estrictamente por debajo
de la curva de indiferencia del trabajador con baja capacidad que pasa por
el punto (e* (B),w* (B.
Concluirnos esta seccin con una breve discusin sobre los equilibrios
hbridos, en los cuales un tipo elige unnivel de educa<;in con certeza,
pero el otro tipo elige aleatoriamente entre la agrupacin con el primer
tipo (eligiendo el nivel de educacin del primer tipo) y la separacin del
primer tipo (eligiendo un nivel de educacin diferente). Analizarnos el
caso en el cual el trabajador con baja capacidad escoge aleatoriamente; el
ejercicio 4.7 trata el caso complementario. Supongamos que el trabajador
con capacidad alta elige un nivel de educacin eh (donde h quiere decir
hbrido), pero el trabajador con capacidad baja elige aleatoriamente entre
eh (con probabilidad 7f) y eH (con probabilidad 1 - 7f). El requisito 3
de sealizacin (convenientemente extendido para incluirlas estrategias
mIxtas) determina entonces la conjetura de las empresas tras observar eh
() ea. Con la regla de Bayes se obtien

y la inferencia usual tras la separacin da M(.4.leB) = O.Tres observaciones


pueden ayudamos a interpretar (4.2.8): en primer lugar, puesto que el
trabajador con capacidad alta siempre elige eh, pero el trabajador con
capacidad baja slo lo hace con probabilidad 7f, observar eh indica que es
ms probable que el trabajador tenga capacidad alta, con lo que M(Aleh) >
q. En segundo lugar, cuando 7f tiende a cero, el trabajador con capacidad
baja nunca se agrupa con el de capacidad alta, por lo que L(Aleh) tiende a
urio. En tercer lugar, cuando 7f tiende a uno, el trabajador con capacidad
baja casi siempre se agrupa con el de capacidad alta, por lo que M(Aleh)
tiende a la conjetura a priori q.
Cuando el trabajador con capacidad baja se separa del que tiene capacidad alta eligiendo eB, la conjetura M(AleB) = O implica el salario
w(eB) = y(B,eB)'
Se deduce entonces que eB debe ser igual a e*(B): la
nica eleccin del nivel de educacin en la cual el trabajador con capacidad baja puede ser inducido a separarse (probabilsticamente corno aqu
o con certeza, corno en los equilibrios de separacin discutidos anteriormente) es la eleccin de educacin con informacin completa e*(B) de
dicho trabajador. Pa~a ve'r esto, supongamos que el trabajador con capaddad baja se separa eligiendo algn eB '1 e*(B). Tal separacin alcanza la
ganancia y(13,eB) - c(B,eB), pero de elegir e*(E) obtendra una ganancia
de al menos y[E,e*(B)]
- c[E,e*(B)]Ca
de ms si la conjetura de lasempresas M[Aie* (E)] es mayor que cero) y la definicin de e*(B) implica que
y[E,e*(E)]
- c[E,e*(E)]
es mayor que y(E,e) - c(E,e) para cada e '1 e*CB).
Por lo tanto, no existe una eleccin de nivel de educacin eB '1 e*CE)
tal que el trabajador con capacidad baja pueda ser~inl:l1J:ci~?_
<l. separarse
eligiendo eB.
Para que el trabajador con capaqgad baja est dispuesto. aescoger ~eatoriamenteentre separarse en e*(E) y agruparse en eh, el salario w(eh) = Wh
cl~behacer que el trabajador sea indiferente entre ambo~:
w*(B)

- c[B,e*(E)]

= 'Wh - c(E,eh).

\:.'

"

;;'

'.'

,"

"

(4.2.9)

.Sin embargo, p?U'aque 'Whsea un salario de equilibrio para las empresas,


(4.2.1) y (4.2.8) implican que
,

(4.2.8)
Recordemos de la nota 2 ele! captulo 3 que la regla de Rayes establece que P(AIB) =
p(A.m/
P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).
1-'(04), por lo que P(AIE) = P(BIA).
1-'(04)/ P(B).
6

q
Wh = ---~.
q + (l - q)7f

.
y(A,e.)

(1 - q)7f
q

(1

).
7f

y(E,eh).

(4.2.10}

....

JlIegos de sel1alizIlcirll / 207


206 / JUEGOS DINMICOS CON INFORMACIN

INCOMPLETA (c. 4)

Para un valor determinado de eh, si (4.2.9) da que '/1)h < y(A,eh), entonces
(4.2.10) determina el valor nico de que constituye un equilibrio hbrido
en el cual el trabajador con capacidad baja escoge aleatoriamente entre
e*(E) y eh, mientras que si '/1)h > y(A,eh),
no existe ningn equilibrio
hbrido que incluya eh.
7["

de la figura 4.2.8. Ciertamente, cuando eh tiende a es, r tiende al, :ie


manera que rrtiende a cero. Por tanto, el equilibrio de separacin descnt~
en la figura 4.2.8 es el lmite de los equilibrios hbridos conSIderados a~ul.
Para completar la descripcin del equilibrio bayesiano perfe:to hb:ldO
de la figura 4.2.9, sea la conjetura de las empresas que el trabajador t1ene
capacidad baja si e < eh yen cualquier otro caso, que tiene capacidad alta
con probabilidad r y baja con probabilidad 1 - r:

O
/.L(A\e) = { r

y(A,e)

para e < eh
para e 2': e".

La estrategia de las empresas es entonces

r y(A,e)
+ O - r)

y(E,e)
w(e) = { r . y(A,e)

.
y(B,e)

+ (l - r) . y(B,e)

para e <
para e 2':

eh
eh.

Slo queda por comprobar que la estrategia del trabajador (e(B) = e" con
probabilidad 7[",e(B)
e*(E) con probabilidad 1 - 7[";e(A) = eh) es una
mejor respuesta a la estrategia de las empresas. Para'el trabajador con
capacidad baja,la e < eh ptima es e*(B) y la e 2': eh ptima es el~' Para el
trabajador con capacidad alta, eh es superior a todas las alternatlvas.

w~

q y(A,e)

+,0-

q) y(B,)

,
,,
,

4.2.C Inversin empresarial y estructura de capital

y(B,e)
'~

. 1:,

w*(B)
' ..

'

'.'

e*(B)

Figura 4.2.9

La figura 4.2.9 ilustra de forma implcita el valor consistente con el


valor indicado de eh. Dado eh, el salario 11Ihes una solucin de (4.2.9); por
lo que el punto (eh/wh) est en la curva de indiferencia del trabajador con
baja capacidad que pasa por el punto [e*(E),11I*(E)].
Dado 11Ih < y(A,eh),
la probabilidad r es una solucin de r . y(A,eh) + (l - r) . y(E,eh) = 11Ih.
Esta pr~ba~~lidad es la conjetura en equilibrio de las empresas, por lo que
(4.2.~)s~~fica que = q(l-r)/r(l
- q). La figura tambin muestra que la
restrlCclOn11Ih-< y(A,eh) es equivalente a eh < es, donde es es la educacin
elegida por el trabajador con capacidad alta en el equilibrio de separacin
7["

.....

7["

o.'

Consideremos un empresario que ha formado una empresa pero necesita


financiacin exterior para llevar a cabo un nuevo y atractivo proyecto. El
empresario tiene informacin privada sobre la rentabilidad actual de la
empresa, pero la ganancia del nuevo proyecto no se puede separar d: ~a
ganancia de la empresa; lo nico que se puede observa:..es el benefJC~o
agregado de la empresa. (Podramos permitir tambin que el empresano
tuviera informacin privada sobre la rentabilidad del nuevo proyecto,
pero sera una complicacil innecesaria.) Supongamos que el e~l~resario
ofrece a un inversionista potencial una participacin en los benefiCJosde la
empresa a cambio de la financiacin necesaria. Bajo qu circunstancias
se llevar a cabo el nuevo proyecto y cul ser la participacil11"enlos
beneficios de la empresa?
Para transcribir este problema a un juego de sealizacin, suponga IDOS
que los beneficios de la empresa antes del proyecto pueden ser altos o
bajos:
= A b E, donde A > B > O. Para capturar la idea de que el
nuevo proyecto es atractivo, supongamos que la inversin requerida es 1,
la ganancia ser R, la rentabilidad alternativa para el inversor potencial r
7["

::'08;' JUEGOS DINMICOS CON INfORMACiN

)' n

Juegos de sel1aliZJlcin

INCOMPLETA (c. 4)

> JO + 1'). Describimos a continuacin el desarrollo temporal

y las

ganancias:
pB

1. El azar determina el beneficio de la empresa antes del proyecto. La


probabilidad de que 1f == B es p.
2. El empresario conoce 1f y ofrece al inversor potencial una participacin .'
en los beneficios de la empresa, s, donde O::; s ::; 1.
.,
3. E~inversor observa s (pero no 1f) y decide si aceptar o rechazar la
oterta.
4. S el inversor rechaza la oferta, su ganancia es lO + r) y la del empresano es 1f. Si el inversor acepta s, su ganancia es de s(1f + R) Yla del
empresario O - s)(1f + R).
Myers y Majluf (984) analizan un modelo como ste, aunque consideran una empresa grande (con accionistas y un consejo de administracin).
en lugar de un empresario (que es a la vez el director y el nico accionista).
Discuten diferentes supuestos sobre cmo ls intereses de los accionistas'
podran afectar la utilidad de los directivos; Dybvig y Zender (991) deri~.
van ~l contrato ptimo que los accionistas pueden ofrecer a los directiv~s ..
Este es un juego de sealizacin muy simple en dos aspectos: el
conjunto de acciones factibles del receptor es muy limitado, y el del emisor
es mayor pero poco influyente (cOri10veremos). Supongamos que tras
reCIbir la oferta .5 el inversor cree que la probabilidad de que 1f == B es q.
Entonces el inve,!sor aceptar s si y slo si
s[qB+

(l - q)A + R]

2:

1(1 + r).

(4.2.11)

En cuanto al empresario, supongamos que los beneficios de la compaa


ant.es del proyecto son 1f, y consideremos si el empresario prefiere recibir
la financiacin a cambio de la participacin en los beneficios de la empresa
o renunClar al proyecto. Lo primero es superior si y slo si
R

s<--1f+R

(4.2.12)

En un equilibrio bayesiano perfecto de agrupacin, la conjetura del


debe ser q == p despus de recibir la oferta de equilibrio. Como
la reslTccin en la participacin (4.2.12) es ms difcil de satisfacer para
Ir == A q~e ~ara 1f == B, la combinacin de (4.2.11) y (4.2.12) significa que
un equlhbno de agrupaci1 slo existe si
Inversor

1(1 +1')
R
.
< --o
+ (1 - p)A + R - A + R

!209

(4.2.13)

Si p est lo suficientemente cerca de cero, (4.2.13) se cumple porque R >


1(1 + 1'). Sin embargo, si p est lo suficientemente cerca de uno, (4.2.13) se
cumple slo si
R - 1(1 + 1') 2:

1(1 + r)A
R
- B.

(4.2.14)

Intuitivamente, la dificultad de un equilibrio de agrupacin es que el tipo


de beneficio alto debe subvencionar al tipo de beneficio bajo: haciendo
queq == pen (4.2.11) obtenemos s 2: 1(1 +1')/[pB+(1-p)A+RJ,
mientras que
si el inversor supiera con seguridad que 7r == A (es decir, q == O),. entonces
aceptara una participacin menor en los beneficios s 2: 1(1 +1')/(A+R). La
mayor participacin en la empresa exigida por un equilibrio de agrupacin
es muy cara para la empresa con beneficios altos, tal vez tan cara como para
hacer que la empresa con beneficios altos prefiera renunciar al proyecto.
Nuestro anlisis muestra que existe un equilibrio de agrupacin si pest
cerca de cero, por lo que el coste de la subvencin es pequeo, o si (4.2.14)
se cumple, de manera que el beneficio del nuevo proyecto sobrepasa al
coste de la subvencin.
Si (4.2.13) no se cumple, no existe equilibrio de agrupacin. Sin
embargo, siempre existe uno de separacin. El tipo de beneficio bajo
ofrece s == 1(1 + 1')/(B + R), que el inversor acepta y el tipo de beneficio
alto ofrece s < 1(1 + 1')/(A + R), queel inversor rechaza. En tal equilibrio
la inversin es ineficientemente baja: el nuevo proyec~o es rentable con
toda seguridad, pero el tipo de ao beneficio renuncia a la inversin. Este
equilibrio ilustra en qu sentido el conjunto de seales factibles del emisor es poco efectivo; el tipo de alto beneficio no tiene forma de sobresalir;
unos trminos de financiacin que son atractivos para el tipo de beneficio
alto son an ms atractivos para el de beneficio bajo. Como observan
Myers y Majluf, en este modelo las empresas se ven empujadas hacia el
endeudamiento o hacia fuentes de financiacin interna.
Concluimos considerando brevemente la posibilidad de que el empresario pueda tanto endeudarse como ofrecer participaciones en los beneficios. Supongamos que el inversor acepta ofrecer un crdito D. Si el
empresario no quiebra, la ganancia del inversor es D y la del empresario
1f + R - D; si el empresario quiebra, la ganancia del inversor es 1f + R
Y la del empresario es cero. Como B > O, siempre existe un equilibrio
de agrupacin: los dos tipos de beneficios ofrecen el contrato de deuda

Jegos de sializnci')/1

210 I JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)

JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficientemente negativo como para queR +B < JO + 7"), el tipo de beneficio
bajo no podra devolver su deuda, por lo que el inversor no aceptara el
contrato. Aplicaramos un argumehto'similar siH y A fueran benefiCiti;:'
esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ .
que los beneficios actuales de !l empresa sern 1r+ J{ con probabilidad
1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hay
una probabilidad de 1/2 de qu el tipo de beneficio bajo no sea capaz
de devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptar el
contrato.
.
D =

I 211

modelo con dos periodos es, por tanto, el siguiente:


1. El azar determina el tipo e de la autoridad monetaria. La probabilidad
de que e =Des p.
2. Los empresarios forman sus expectativas de inflacin para el primer
periodo, 1rj.
3. La autoridad monetaria observa 1rj y escoge el nivel real de inflacin
del primer periodo, 1rI.
4. Los empresarios observan 1rI(pero no e) y forman sus expectativas de
inflacin para el segundo periodo, 1r2.
5. La autoridad monetaria observa 1r2y escoge el nivel real de inflacin
del segundo periodo, 1r2.

4.2.D Poltica monetaria


~n esta seccin aadimos informacin pTivada ~ unaver~in condospe~,
nodos del juego repetido de poltical)1onetaria analizado. en la stdif
2.3.E. Como en el modelo de Spence, eXisten mucho~ equilibrios baye~ia~'
nosperfectosd agrupacin,lubridos yde s~parac!r( Como ya discti'G
mas estos' equilibrios con detalle enJa seccin4.2.S; aqu slo esb~zillio~>
los tenasms'importantes.VaseVlckers
(986) piriFlos detlle~de~
un anlisis similar con dos periodos yBarro (986) para un modelo de,.
reputacin con muchos periodos.
Recordemos, de la seccin 2.3.E, que la ganancia por periodo de la
autoridad' monetaria es
.

Como indicamos en la seccin 4.2.A, hay un juego de sealizacin de un


periodo incluido en este juego de poltica monetaria con dos periodos. El
mensaje del emisor es la eleccin de la inflacin por parte de la autoridad
monetaria en elprimer periodo, 1rI-y la accin del receptor es la expectativa
de inflacin' de los empresarios en el segundo periodo, 1r2. La expectativa
dlos empresarios en el primer periodo y la eleccin del nivel de inflacin
de la autoridad monetaria en el segundo preceden y siguen al juego de
sealizacin respectivamente.
Recordemos que en el problema con un periodo (es decir, en el juego
de etapa del juego repetido analizado en la seccin 2.3.E) la eleccin
ptima de. 7r por parte de la autoridad monetaria dada la expectativa
de los empresarios, 1re, es
'

'"t

donde 1res elnivelreal de inflacin, 1reesJa expectativa de inflacin d~Jo~


empresarios e y* es el nivel eficiente de produccin. Para los empresarios,:
la ganancia por periodo eS~(1r-1re)2;
En nuestro modelo con dos periodos,
la ganancia de cada jugador es simplemente la suma de sus ganancias eh
cada periodO('vV(1rI,1rj)+ W(1r2,1r2) y -(1rI _1rj)2 - (1r2 - 1r2)2, donde1rt es
el nivel.real de inflacin en el periodo t y 1ri es la expectativa (al priricipio
del penado t) de inflacin en el periodo~ por parte de los empresarios.
El parmetro e en la funcin de ganancias W(1rrre) refleja el dilema de
la autoridad monetaria entre los objetivos de inflacin cero y produccin
eficiente. En la seccin 2.3.E, este parmetro era inlonnacin del dominio
pblico. Suponemos ahora, en cambio, que esteparmetroes inlonnacin
privada de la autoridad monetaria: e = Fa D (por "fuerte" y "dbil'~ en
la lucha contra la inflacin); donde F > D > O. El desarrollo temporal del

1r*(1re) = ~2[(l
c+d

- b)y* + d1re].

El mismo argumento indica que si el tipo de la autoridad monetaria es c,


su eleccin ptima de 1r2dada la expectativa 1r2es
~[O-

c+d

b)y' + d1r21

=. 1r:i.(1r2'c).

Previndolo, si los empresarios empiezan el segundo periodo creyendo


que la probabilidad de que e = D es ,!,se formarn la expectativan2(q) de
forma que maximice
(42.15)

~ 12

! JUEGOS

DINMICOS CON INFORMACIN

INCOMPLETA (e. 4)

En un equilibrio de agrupacin, ambos tipos escogen la misma inflacin para el primer periodo, digamos 7r*,por lo que la expectativa de ,
los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria de
equilibrio, los empresarios empiezan el segundo periodo creyendo que la
probabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).
La autoridad monetaria de tipo c escoge entonces su inflacin ptima para'
el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],finalizando con ello el juego. Para completar la descripcin de este equilibrio,
queda (como siempre) definir las conjeturas del receptor fu~~a del equi-.
Iibrio para calcular las correspondientes decisiones fuera del equilibrio
utilizando (4.2.15), y comprobar que estas decisiones no crean ningn
incentivo a desviarse del equilibrio para ningn tipo del emisor.
En un equilibrio de separacin, los dos tipos escogen niveles de inflacin diferentes en el primer periodo, digamos 7[D y 7rF, por lo que la
expectativa de los empresarios en el primer periodo es 7r = P7[D+(1-phF.
Despus de observar 7[D, los empresarios empiezan el segundo periodq'
creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9
modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo dbil e~coge ei1~
tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~
completar la descripcin de este equilibrio,. no.'slo queda, corno antes~
detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~
probar que ningn tipo del emisor tiene incentivos para desviarse, sino
tambin comprobar que ningn tipo tiene incentivos pala imitar el cmn-,
pOltamiento en equilibrio del otro. Aqu, por ejemplo, el tipo dbil podra
pensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !
expectativa de los empresarios en el segurido periodo fuera 7[2(0),pero
escoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuera
demasiado baja para el tipo dbil, la expectativa consiguiente 7[2(0)podra
ser tan baja que el tipo dbil recibiera una ganancia enorme debido a la
inflacin inesperada 7[i[7[2(O),D] - 7r2(O) en el segundo periodo. En un
equilibrio de separacin, la inflacin escogida en el primer periodo por el
tipo fuerte debe ser lo suficientemente baja corno para que el tipo d~bil
no sienta la tentacin de imitarle, a pesar del ben~ficio que obtendra por
la inflacin inesperada en el segundo periodo. Para muchos valores de
los parmetros, esta restriccin hace que 7[F sea menor que ei nivel d~
inflacin que el tipo fuerte elegira bajo informacin completa, delrrJsmo
modo que el trabajador con capacidad alta invierte ms de la cuenta en
educacin en un equilibrio de separacin del modelo de Spence.

Otras aplicaciones del equilibrio bayesiano perfecto! 213

4.3 Otras aplicaciones

del equilibrio

bayesiano

perfecto

4.3.A Juegos con parloteo (cheap-talk games)


Los juegos con parloteo son anlogos a los juegos de sealizacin, pero en
aquellos juegos los mensajes del emisor consisten en un mero parloteo (carente de coste alguno, que no es vinculante, y cuyo contenido son declaraciones no verificables), Tal parloteo no puede ser informativo en el juego
de senalizacih' de 'Spence: un trabajador que simplemente anuIlciara
"mi capacidades ?Ita" nI? sera credo. Sin embargo, eIl otros c:ontxfos:
este tipo de comicaciri previa puede ser informativo. Como ejemplo
sencillo, consideremos las posibles interpretaciones de la frase "sube la
bolsa"? En aplicaciones conrrf1iyor inters econmico; Stein' (1989)'decmuestra que las meras declaraciones de la autoridad monetaria pueden
ser informativas aunque no puedan ser demasiado precisas, y Matthews
(1989)estudia cmo una amenaza de veto por parte del presidente de los
Estados Unidos puede influir en la forma corno se aprueba el presupuesto,
en el Congreso norteamericano. Adems de analizar elefecto,delparl6~
teo en:un contexto determinado, uno tambin puede preguntarse cmo
disear contextos para' aprovechar esta forma de comunicacin~ En 'este
sentido, Austen-Smith (1990) demuestra que, en algunos casos, debates
entre legisladores que actan segn su propio inh;rs acaban mejorando el
valor social de la legislacin que se aprueba, y Farrelly Gibbons (1991)demuestran que, en algunos casos, la implantacin sindical en uIla empresa
mejora el bienestar social' (a pesar de la distorsin que crea:n el nivel .de
empleo descrita en la seccin2.1.C) porque facilita la coIInicacinentr
la fuerza de trabajo y la direccin."
,c,
..
El parloteo no puede ser informativo en el modelo de Spence porque todos los tipos del emisor tienen las mismas preferencias en relacin
con las posibles acciones del receptor: 'todos los trabajadores prefieren
salarios altos, independientemente de su capacidad. ~ara ver por qu tal
uniformidad de preferencias entre los tipos del emisor vicia el parloteo
(en el modelo de Spence y ms en general), supongamos que existiera un
equilibrio con estrategias puras en el cual uri subconjunto de los tipos del
7 En la versin en ingls
bus!", que puede traducirse
de endiendo del contexto.
ca~ellano que puede tener
sta es la idea que el autor

del libro, la frase que originalmente aparece es "Hey, look out for that
como "Cuidado con ese autobs!" o como "Espera ese autobs!",
La fraseqe nosotros incluimos aqu es una de las muchas frases en
signifiadosc?mpl"tamente
diferentes dependiendo del contexto. '
quiere eXpresar. (N. de los T.).

(i.

,
~.'.
"

':

,r.

Otras aplicaciones
214 / JUEGOS DINMICOS CON INFORMACIN

emisor, TI, enva un mensaje mI, mientras que otro subconjunto de tipos;
T2, enva o.tro mensaje, m2. (Cada Ti podra contener slo un tipo, como
en un equilibrio de separacin, o muchos tipos, como en un equilibrio de
separacin parcial.) En equilibrio, el receptor interpretar que mi viene de
Ti y tomar por tanto la decisin ptima, a dada su conjetura. Come:,to"
dos los tipos del emisor tienen las mismas preferencias sobre las acciones
a tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen esta
preferencia y enviarn el mensaje mI en lugar de m2, destruyendo con ello
el equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teo
resultara. en un mensaje indicativo <leun saJaria,alto, mientras que otro
tipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqier nivel d~ capacidad enviaran.el primer ni.ensaje~porlo que npuede' existir
,un equilibrio en el que. el parloteo afecte los salari()s.
,

',.'

,,/

del equilibrio

bayesinno

prr!,'cfo

/ 215

INCOMPLETA (c. 4)

Por 10 tanto, para que el parloteo sea informativo, una condicin necesaria es que diferentes tipos del emisor tengan preferencias diferentes en
relacin con:las acciOliesdeLreceptor, Una segunda condicin necesaria,
por supuesto, es que el.receptor prefiera acciones,giferentesdependiendo
del ti'p:del emisor .. (Tanto la selizacincomQ;ja.comurucacinp~yia
son intiles si las preferencias del receptor sobre sus acciones' son inde~
pendientes del tipo del emisor.). Una terceracondiciitnecesaria para que
el parloteo sea 'informativo es que las preferencias del receptr sobre sus
acciones nlJ sean completamente opuests alasd~emisor. Para adelantar
un ltimo. ejemplo,supongamos que elr~~epto{prefiere.acciones bajas
cuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemisores de tipos bajos prefieren acciones baja~ y los de tipos altos acciones
altas, puede haber comunicacin, pero si efemisor tiene ias preferencias
opuestas no puede existir comunicacin, ya que al emisorle gustara cone
fundir al receptor. Crawford y Sobel (1982) lIlalizanunmodelc5 abstracto
que satisface estas tres condiciones necesarias y establecen d()s resultados
intuitivos: en trminos informales, puede existir ms comunicacin por
medio del parloteo cuando las preferencias. de las jugadores estn ms
ntimamente relacionadas, pero no puede existir comunicacin perfecta a
no ser que las preferencias de los jugadores estn perfectamente alineadas ..
Cada una de .las aplicaciones econmicas que acabamos de. describir
(parloteo por parte de la autoridad monetaria, amenazas de veto, debates
parlamentarios y presencia sindical) incluyen no slo un juego sencillo
con parloteo sino tambin una modelizacion ms completade un entorno
econmico. Analizar una de estas apii<:acionesexigira describir no s<$loel
juego sino tambin el modelo completo, lo que desviara nestr<i atencin

de las fuerzas bsicas que operan en los juegos con parloteo. En esta
seccin, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamos
slo juegos abstractos con parloteo, dejando las aplicaciones como lectura
adicional.
El desarrollo temporal del juego con parloteo ms sencillo es idntico
al del juego de sealizacin ms sencillo; slo cambian las ganancias.

1. El azar escoge un tipo ti del emisor, de un conjunto de tipos factibles


T = {tlJ ... ,tI}, de acuerdo con una distribucin de probabilidad pe!,;),
donde p(ti) > O para cada y p(tl) + ... + ]J(t[) = 1.
2. El emisor observa ti y escoge Ul1 mensaje mj de un conjunto de lnensajes factibles M = {mI,' .. ,mj}.
3. El receptor observa mj (pero no ti) y escoge entonces una accin
un conjunto de acciones factibles A = {al,' .. ,al(}.
4. Las ganancias vienen dadas por U E(tiak) y U R(tiak).

(J.k

de

La caracterstica clave de este juego es que el mensaje no tiene efecto directo rusobre la ganancia del emisor ni sobre la del receptor. La nica
manera en la que el mensaje puede importar es a travs de su contenido
informativo: cambiando la conjetura del receptor sobre el tipo del emisor,
un mensaje puede cambiar la decisin del receptor y, por tanto, afectar
indirectamente a las ganancias de los dos jugadores. Como la misma informacin puede ser comurucada en diferentes lenguajes, diferentes espacios
de mensajes pueden alcanzar los mismos resultados. El espritu del parloteo es que puede decirse cualquier cosa; en consecuencia, formalizar este
concepto exigira que M fuera un conjunto muy grande. Por el contrario,
suponemos que M es lo suficientemente rico para decir lo que haga falta
decir; es decir, M = T. Para los propsitos de esta seccin, este supuesto
es equivalente a permitir que se diga cualquier cosa; sin embargo, para
los propsitos de la seccin 4.4 (refinamientos del equilibrio bayesiano
perfecto), este supuesto debe ser reconsiderado.
Puesto que los juegos con parloteo y de sealizacin ms sencillos
tienen el mismo desarrollo temporal, las definiciones de equilibrio bayesiano perfecto en los dos juegos son tambin idnticas: un equilibrio
bayesian perfecto con estrategias puras en un juego con parlol<;:oes un
par de estrategias m'(ti) y a'(mj), y una conjetura .t(tdm) que satisfacen
los requisitos (1), (2R), (2E) Y (3) de sealizacin, aunque las funciones
de ganancias U R(tmj,o,k) Y U ECt111.j,G.k) en los requisitos (2F,)y (2E) de

216/

JUEGOS DINMICOS CON INFORMACIN

INCOMPLETA (e. 4)

sealizac.in son ahora equivalentes a URUi,aJ y Udt."rtk) respectivamente. Sm embargo, una diferencia entre los juegos de sealizacin y los
Juegos con parloteo es que en estos ltimos siempre existe un equilibrio
de agrupacin. Puesto que los mensajes no tienen un efecto directo sobre
las'
. dI'
.
> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, la
atrupaclOn es una. mejor respuesta del emisor. Puesto que los mensajes no
tIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor est
jugando agrupacin, ignorar todos los mensajes es una mejor respuesta
del receptor. Formalmente, sea a* la accin ptima del.receptor en un
equIlIbno de agrupacin; es decir, a* es una solucin de

Es.un equilibrio b.ayesiano perfecto de agrupacin que el emisor juegue


cu::.qL1lerestrategI~ de agrupac~n, que el receptor mantenga la conjetura
a FIOn pU') despues de cualqUler mensaje (en la trayectoria de equilibrio
~ fuer~ de ella) y ~~e.~l receptor tome la accin a* despus de cualquier
len~aje. La cuestion mteresante en un juego con parloteo, por tanto, es
SI eXIsten equilibrios de no agrupacin. Los dos juegos abstractos con
~arloteo 5ue discutimos a continuacin ilustran sobre los equilibrios de
separaclOn y de agrupacin parcial respectivamente.
.
Em,pezamos con un ejemplo con dos tipos y dos acciones' T = {t t }
P l( )
"
B, A ,
ro) tB ~ p, y A = {aB,a.,!}. Podramos utilizar un juego de sealizacin
COl~dos tIpO.S,dos mensajes y dos acciones, anlogo al de la figura 4.2,1
pal a descnblr las ?anancias en este juego con parloteo, pero las ganancias
del par .(t,ak) son mdependientes de qu mensaje fue escogido, por lo que
descnblmos los pagos utilizando la figura 4.3.1. La primera ganancia en
cada caSIlla es la del emisor, y la segunda la del receptor, pero esta figura
//0 es un juego en forma normal, simplemente recoge las ganancias de los
jugadores para cada par tipo-accin.

tB

tA

aB

1:,1

y,O

(LA

Z,O "W,1

Figura 4.3.1

Otras aplicaciones del equilibrio bayesimlO perfecto / 217

Como en nuestra discusin anterior sobre las condiciones necesarias


para que el parloteo sea informativo, hemos escogido las ganancias del
receptor de forma que prefiera la accin baja (aB) cuando el tipo del
emisor es bajo (tB) y la accin alta mando el tipo es alto. Para ilustrar
la primera condicin necesaria, supongamos que los dos tipos del emisor
tienen las mismas preferencias respecto de las acciones: x > Z e y > "w,
por ejemplo, de forma que los dos tipos prefieren aB a aA' Entonces,
a los dos tipos les gustara que el receptor creyera que t = tB, por lo
que el recepto~ no puede creer tal afirmacin. Para ilustrar la tercera
conciicin necesaria, supongamos que las preferencias de los jugadores
son totalmente opuestas; z > x e y > w, .deforma que eltipo bajo:
del emisor prefiere laaccin alta y el tipo alto la. baja, Ep.t()nces,aJB
le gustara que el receptor <;reyera que t = tA, Y a tA le gustara que
creyera que t. = tB, por lo que el receptor no puede creer ninguna de
estas afirmaciones. En este juego con dos tipos y dos acciones, el nico
caso que cumple la primera y la tercera condiciones necesariasesx. ~~.z
e y ~ 'W (los intereses ci~los jugadores estn perfectamente alineados en
el sentido de que, dado el tipo del emisor,jos jugCl~~rescoincideIl~l1Ja
accin que debera tomarse) .. ' Formalmente, en un equilibrio bayesiano
perfecto de separacin de este juego COI1 parloteo, la estrategia del emisor:
es [mUB) = tB,m(tA) ~ tAL las conjeturas deL receptor son.t(tB!tB)."")
y.t(tB\tA)
= 0, y la estrategia del receptor. es [a{tB)=
aB,aUA) ,= aA]'
Para que estas estrategias y conjeturas formen un equilibrio, cada tiPe>del
emisor, t debe preferir de~iI:la verdad, induciendo con ello la acciI.\ui'
a mentir, induciendo con ello aj. Por lo tanto, un equilibrio cieseparacin
existesiyslosix;:::iey~w.'
.. ~ .
,';.,
Nuestro segundo ejemplo es un caso eSpecial del model~ de Crawford y Sobe!' Ahra, ls espacios de tipos; mensajes y acciones son continuos: el tipo del emisor se distribuye unifrni.emente entre cero y uno
(formalmente, T = [0,1] Y p(t) = 1 para todo.terrT);,e1'espacio de mensajes es el espacio de tipos (M = T); y el espacio de acciones es el intervalo de cero a uno (A = [0,1]). La furiCin de ganancias del receptor es
UR(t,a) = -(a - t)2, Y la del emisor es UB(t,a) :"':"-[a ~ (t+ b)]2, de forma
que cuando el tipo del emisores t, la accin ptima del receptor es a ';"t,
pero .1i:i acdn ptiina' del' e-mi'sores =- t + b. Por 10 tanto, diferentes
tipos dei emisor tienen diferentes preferencias respecto de las acciones
del receptor (ms precisam~nte, tipos altos prefieren acciones altas), y
las preferencias de los jugadores no son completamente opuestas (ms
precisamente, el parmetro b'> o mide la similitud de las preferencias de

',

.... '

a.

\',"

..

218

!JUEGOS

DlNMICOS CON INFORMAClN'lrKOMPLETA

(c. 4)

los jugadores, cuando b est cerca de tero los intereses de los jugadores
estn ms alineados),

.t

:'
".;.'
,"
,,'
",:,"

Crawford y Sobel demuestran que todos los equilibrios bayesianos


perfectos en este modelo (yen una amplia clase de modelos relacionados) ,
son equivalentes a un equilibrio de agrupacin parcial d la siguiente
forma: el espacio de tipos est dividido en n intervalos [O,.');I),[XI,X2),'
."
[xn_l,l];
todos los tipos en un mismo intervalo envan el mismo mensaje,
pero tipos en intervalos diferentes envan mensajes diferentes, Como
indicamos anteriormente, un equilibrio de agrupacin (n = U'siempre
existe, Demostraremos que, dado el valor del parmetro de similitud de
preferencias b, ,existe uh nmero mximo de intervalos (o "escalones")
que pueden darse en equilibrio, denotado poi n*(b), y existen equilibrios
de agrupacin parcial para cada n = 1,2,. , . ,n*(b), Una disminucin de b
aumenta n*(b) (en este sentido, puede haber ms comunicacin a travs
del parloteo cuando las preferencias de los jugadores estn ms alineadas),
Adems, n*(b) es finito para todo b > 0, pero tiende a' ihfimto cuando b
tiende a cero (no puede existir comunicacinperfect<:i a:no ser que las
preferencias de los jugadores estn perfectillnte'alineadas),
Concluimos esta seccin caracterizando este equilibrio de agrupacin
parcial, empezando con un equilibrio de dos escalones (n = 2) como
ilustracin. Supongamos que todos los tipos en el escaln [O,XI)envan
un mensaje mientras los que estn en [xI,l] env~n otro., Despus de
recibir el mensaje de los tipos [O,XI),el receptor creE;;rque el emisor est
distribuido uniformemente en [O,XI),poi 10 que su'.accin ptima ser
xJ/2;del mismo modo, 'despus de recibir el mensaje de los tipos [Xi,l],
la accin ptima del receptor ser (Xl + 1)/2. Para que los tipos en [O/Xl)
quieran enviar su mensaje, debe pasar que todos estos tipos prefieran la
accin xJ/2 a (Xl + 1)/2; del mismo modo, todos los tipos por encima de
Xl deben preferir (Xl+ 1)/2 a X] /2.
Puesto que las preferencias del emisor son simtricas con respecto a
su ptima accin, el tipo t del emisor prefiere xJ/2 a (Xl + 1)/2si el punto
medio entre estas dos acciones es mayor que la accin ptima de ese tipo,
t + b (como en la figura 4.3.2),pero prefiere (x] + 1)/2 a Xl/2 si t + b es mayor
que el punto medio. Por lo tanto, para que exista un equilibrio de dos
escalones, Xl debe ser el tipo t cuya accin ptima t + b sea exactamente
igual al punto medio entre las dos acciones:

Xl

+b =

1]

X] +
2:1 [X]2 + -2-

Otras aplicaciolles

o Xl = 0/2)
positivo, por
para &:?: 1/4
para permitir

del equilibrio

bayesiallo

pa/cfo

! 219

- 2&, Como el espacio de tipos es T = [0,1], T] debe ser


lo que un equilibrio de dos escalones existe slo si .') < 1/4;
las preferencias de los jugadores son demasIado cl1ferentes
incluso esta comunicacin tan limitada.

Punto medio

a=l

t+b
U,(t,a)

Figura 4.3.2

Para completar la discusin de este equilibrio de dos escalones, tratamos el tema de los mensajes que estn fuera de la trayectoria de equilibrio.
Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~e
estos mensajes no existan: todos los tipos t < X] escogen un mensaje
aleatoriamente de acuerdo con una dish'ibucin uniforme en [O,X]); todos
los tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con una
distribucin uniforme en [xI,l]. Como hemos supuesto que M = '1', no
hay ningn mensaje del que podamos estar seguros que no se enviar en
equilibrio, por lo que el requisito 3 de sealizacin detemna la conjetura
del receptor despus de cualquier mensaje posible: la conjetu.ra del receptor despus de observar cualquier mensaje de [O,X]) es que t se distribuye
uniformemente en [O,XI),y la conjetura del receptor despus de observar
cualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.
(El uso de distribuciones uniformes en la estrategia mixta del emisor no
tiene nada que ver con el supuesto de una distribucin uniforme del tipo
del emisor; la estrategia mixta del emisor podra utilizar tambin cualquier
otra densidad de probabilidad estrictamente positiva sobre los intervalos

220/

JUEGOS DINM1COS CON INFORMACiN

INCOMPLETA (e. 4)

indicados.) Como alternativa al enfoque de Crawford y Sobel, podramos


determinar una estrategia pura del emisor pero escoger conjeturas del receptor ['uera de la trayectoria de equilibrio. Por ejemplo, sea la estrategia
del emisor que todos los tipos t < Xl enven el mensaje Oy que todos los
tipos t ~ :1:1 enven el mensaje Xl, y sea la conjetura del receptor fuera
de la trayectoria de equilibrio despus de observar cualquier mensaje de
(0,:1:1) que t se distri~uye uniformemente
en [O,XI), y despus de observar
cualquier mensaje de (Xl)] que t se distribuye uniformemente en [XI,1].
Para caracterizar un equilibrio de n escalones, aplicamos repetidamente la siguiente observacin sobre el equilibrio de dos escalones: el
escaln superior, [Xbl], es 4b ms grande que el inferior, [O,XI)' Esta observacin se deriva del hecho que, dado el tipo del emisor (t), su accin
ptima (t + b) es mayor que la accin ptima del receptor (t) en b. Por
lo tanto, si dos escalones adyacentes tuvieran la misma longitud, el tipo
frontera entre los escalones (Xl en el equilibrio de dos escalones) preferira estrictamente enviar .el mensaje asociado con el escaln superior;
efectivamente, los tipos ligeramente por debajo del tipo frontera tambin
lo preferiran. La nica forma de hacer que el tipo frontera sea indiferente
entre los dos escalones (y conseguir con ello que los tipos por encima y por
debajo de la frontera prefieran estrictamente sus respectivos escalones) es
hacer que el escaln superior sea convenientemente ms grande que el
inferior, de la siguiente forma.
Si el escaln [Xk-I,Xk)
tiene una longitud de c (es decir, X* - Xk-l = c),
la accin ptima del receptor correspondiente a este escaln (concretamen
te, h;k + Xk_I)/2)
est (c/2) + b. por debajo de la accin ptima del tipo.
frontera Xk (concretamente, Xk + b). Para hacer que el tipo frontera sea
indiferente entre los escalones [Xk-I,Xk)
Y [Xk,Xk+I), la accin del receptor
correspondiente al ltimo escaln debe estar (c/2) + b por encima de la
accin ptima para :;k:

Xk+l

+ :1;k
2
-

(
Xk

b)

= 2: +

Olras aplicaciones del equilibrio bayesimlO pelfeclo ! 221

\~.

En un equilibrio de n escalones, si el primer escaln tiene una longitud ti,el segundo debe tener una longitud d + 4b, el tercero d + 8b Y as
sucesivamente. El n-simo escaln debe acabar exactamente en 1, por lo
que de~emosterer
~. d + (d + 4b) + ... + [d + (n - 1)4b] = 1.

Utilizando el hecho de que 1 + 2 ~ ... + (n


n .d

+ n(n

- 1) = n(n - 1)/2,

- 1) . 2.b

= 1.

tenemos que
(4.3.1)

Dado c~aiquiern tal que n(n -1). 2b < 1,existe' un vaJor de d cue~luci0I1a
(4.3.1). Es decir, para cualquier n talque n(n-l).2b
<1, existeunequilibri
de agrupaci~parcial de n escalones, y la longitud del primer escaln es
el valor de d que soluciona (4.3.1). Corno la longitud del primer escaln
debe ser positiva, el nmero mximo de escalones en este equilibri?, n *(b);
es el valor msaIto den tal que n(n - 1) .2b < 1. Utilizando la frmula
de la ecu"acin "de segundo grado, se obtiene que n*(b) es el mayor enter?
por debajo de

~.[1 + JI

+ (2/b)}.

Consistente con la derivacin del equilibrio de dos escalones, n*(b) = 1


para b ~. 1/4: no hay comunicacin posible si las. preferencias de J<)S
jugadores son demasiado diferentes. As mismo, corno hemos dicho aI\!~.s~
n*(b) es decreciente en b pero tiende a infinito slo cuandob
tiende.a
cero: puede haber ms comunicacin a trav~s del parloteo cuand() l~s
preferencias de los jugadores estn ms alineadas, pero no puede existir
comunicacin perfecta a no ser que las preferencias de los jugadores estn
perfectamente alineadas.
4.3.B Negociacin sucesiva bajo informacin asimtrica

Por lo tanto, cada escaln debe ser 4b ms largo que el anterior.

Consideremos una empresa y un sindicato negociando sobre salarios.


Para simplificar, supongamos que el nivel de empleo es fijo. El salario de
reserva del sindicato (es decir, la cantidad que los miembros del sindicato
ganan si no son empleados por la empresa) es wr. Los beneficios de la
empresa, que <;ienotamos mediante 'Ir, se distribuyen uniformemente en
hB,KA], pero el valor real de K es conocido slo por la empresa. Esta
infom1acin privada podra, por ejemplo, reflejar un mejor conocimiento

(,

222 / JUEGOS DINMICOS CON INFORMACIN

por parte de la empresa de los nuevos productos en fase de planificacin.


Simplificarnos el anlisis suponiendo que wr = 1rB = O.
El juego de negociacin dura dos periodos corno mximo. En el primer periodo, el sindicato realiza una oferta salarial, Wl' Si la empresa
acepta esta oferta el juego concluye: la ganancia del sindicato es Wl y la
de la empresa 1r - Wl' (Estas ganancias son los valores presentes de las
sucesiones de salarios y beneficios [netos] que los jugadores acumulan a
lo largo de la duracin del contrato que se est negociando, normalmente
tres aos en Estados Unidos.) Si la empresa rechaza esta ofe~ta, entonces el juego pasa al segundo periodo. El sindicato realiza una segunda
oferta salarial, W2. Si la empresa acepta la oferta, los valores presentes de
las ganancias de los jugdores (medidas tm el primer periodo) so~ 8w~
pa.:a el sindicato y 8('Ir- W2) para la empresa, dond~ 8 refleja tanto el
descuento corno la corta vida de lo que queda de contrato despus dei
primer periodo. Si la empresa rechaza la segunda ofertadel sindicato,
el juego finaliza y las ganancias son cera pa ambos jugado~es: Un modelo J!1srealista podra permitir que la I).egbci~cineontinuara hasta que
una oferta furaaceptada, o podra obligar las 'partes a someterse a una
decisin arbitral vinculante despus de una hulga prolongada. Aqt sacrificamos realismo para ganar claridad. (Vase Sobel y Takahashi [1983]
, y el ejercicio 4.12 para un anlisis con horizonte infinito.)
Definir y hallar un equilibrio bayesiano perf~cto es algo eomplicado en
estemodelo; pero la solucin eventual es simpl'~;eintuitiva, Empezarnos,
por lo tanto, esbozando el nico equilibrio b!yesiano perfecto de este
juego.
'
"'
La oferta salarial del sindicato en el primer periodo es

};~

'11)1

(2 - 8)2
=

2(4 -38)

'Ir

A.

Si el beneficio de la empresa es mayor que

1rl

Otras aplicaciol1es del equilibrio bayesial10 perfeclo ! 223

INCOMPLETA (c. 4)

2w
2- 8
= 2-8 = 4-"381rA

J~ empresa acepta wj; encaso contrario, la empresa rechaza wj.


SI su oferta es rechazada en el primer periodo, el sindicato actualiza
su conjetura sobre los beneficios de la empresa: el sindicato cree que
1r se distribuye uniformemente en [O,irjJ.
'
La oferta salarial del sindicato en el segundo periodo (condicionada a
que wj sea rechazada) es

UJ2

1rj

2=

Si el beneficio de la empresa,
en

Caso

2 -
-2-(4---3--)
1r,

/'
KA

,ltJ],

es mayor que

1))2'

sta acepta la oferta;

contrario, la rechaza.

. do las empresas con beneficios altos aceptan


Por lo tanto, en cad a peno ,
la oferta del sindicato, mientras que las de beneficios bajos la rechazan, y
la oferta del sindicato en el segundo periodo refleja el hec~10de q~e las
empresas con beneficios altos aceptaron la oferta en e~ pnme: p:n~do.
(Ntese el ligero cambio en la terminologa: n~s .refenr:mos l1llhstmtamente a una empresa con muchos tipos de beneficlOs pOSIbleso.a.m~lchas
empresas cada una con su propio nivel de beneficios.) En .eqUlhbno, las
empresas con beneficios bajos toleran una huelga de.un p:nodo para canindicato de que tienen beneficios bajos e mduClr con ello a una
vencer al S
. d S'
oferta salarial menor por parte del sindicato en el segundo pe~o o.. 111
embargo, las empresas con beneficios muy bajos encuentran que mclus~;a
oferta del segundo periodo es intolerablemente alta y, por tanto, tambIen
la rechazan.
Empezamos nuestro anlisis describiendo las estrategia~ y conjeturas
de los jugadores, tras lo cual definimos un equilibrio b~yesIano perfe:l:o.
La figura 4.3.3ofrece una representacin en forma extenSIVade una.ver.slon
simplificada del juego: slo hay dos valores de 'Ir(1r B Y 1rA), Yel smdlCato
slo tiene dos ofertas salariales posibles (lUB y WA)'
En este juego simplificado, al sindicato le co~espo~de decidir en tres
conjuntos de informacin, por lo que su estrategIa conSIste en tres ofertas
salariales: la oferta del primer periodo, WJ, y dos ofertas en el ,segundo
periodo, W2 despus de que Wl = WA sea rechazada y W2 despues ~e que
Wl = WB sea rechazada. Estas tres decisiones tienen lugar en tres conjuntos
de informacin con ms de un elemento, en los que las conjetura.s del
sindicato son (p,1 - p), (q,l - q) y (r,1 - r) respectivamente. En el J:lego
completo (a diferencia de lo que pasa en el juego simplicad~ de la fJ~ura
4.3.3), una estrategia del sindicato es una oferta w~ en el pnmer pe:l0do
y una funcin de oferta W2(Wl) en el segundo penado que deternuna la
oferta lU2 a realizar despus de que cada oferta Wl sea recha~:da. Cac~a
una de estas decisiones tiene lugar en un conjunto de informaCll111
COll.mils
de un elemento. Hay un conjunto de in.formacin en el seguJldo per~odo
para cada oferta salarial que el sindicato podr~ hacer e~:l pruner perto::lo
(por lo que hay un continuo de conjuntos de mformaClon en vez de solo

224/

JUeCOS DIN;MICOS CON INFOI<,\IAClN

Otras aplicaciones del equilibrio bayesillno perfecto / 225

INCOMPLETA (c. 4)

Azar

lO,
,WE}

lC,1 -

wa

7tH

'- wB

juego completo, denotamos la conjetura del sindicato en el primer periodo,


mediante l(T), y la del segundo (despus de que la oferta lOl del primer
periodo haya sido rechazada) con JL2(Tlwl).
Una estrategia de la empresa incluye dos decisiones (tanto en el juego
simplificado como en el completo). Sea Al (wll'lr) igual a uno si la empresa
aceptase la oferta Wl del primerperiodo cuando su beneficio es T;y cero si
la empresa rechazase Wl cuando su beneficio es T. Del mismo modo, sea
A2(W2IT/Wl)igual a uno si la empresa aceptase la oferta 'W2 del segundo
periodo cuando su beneficio es 'Iry la oferta del primer periodo fue lOl,Y
cero si la empresa rechazase '!U2 en tales circunstancias. Una estrategia de
la empresa es un par de funciones [Al(lOll-ir),A2(102iT,lOl)J.
Puesto que la
empresa tiene informa~incorripleta durante iodo el juego, sus c~jehIias
son triviales.
Las estrategias ['Wl/W2(lOl>f
y [Al(WllT),A2(W2IT,Wl)],
y las conjetur~s
[JL 1(T), J.l2(TIWl)] constituyen un equilibrio bayesiano perfecto si satisfacen'
los requisitos 2,}, y4 dy las.eccin 4.1. (El requisito 1 se satisfac~:p~I
la simple existencia de las~onjeturas del sindicato.) Vamos ae~?straE
que existe un nico equilibrio bayesiano, perfe00, L(1parte ITI~j'~~Hlf
del arguplentoes aplicar el reqllisito 2 ala decisind~la empr~:;;aen.el
segundo periodo A2(102IT/Wl):
puesto q~~ ~te. es liltimo'Il}?~iirri:i~\~.
del juego, la d,ecisin ptima de la empresa es aceptar lO2 sLY:.,~lo.~~
T~ lO2; lOl es irrelevante. Dada ~sta parte de la estrategia dela
es inmediato aplicar el requisito 2 a la elec~in' de' ~na ~ferta:sai~i;
por parte del sindicato en el segundo periodo:.102 deb~r~ ".!"'''''~-'''''~'''''''!~h~t:};
ffi'~t'/:i~:,,'..:~~::ganancia esperada pore~ sindic~to, dada la contetura d~~~~~ J:?-L7rJ'W~r,x:;:.',' , ;'"
la consiguiente estrategia de la empresa A2(10217l:,lOl)' :L,apart;e
WE.iPHPI;~;",;t;"1:;,:,
.. 1.".,,,
.,..>.',~_ ...,...'-'>.":".~,.":'~~~;:~~~~:.;-._~.~~::.,.~
..~:.~-',.:.-.-~'
del argumento es deterIninar la c;onjetura JL2(:r1'UJ1)d~f_
Il1od(),.~igpf~I1t.~;J]~:t'?,~?~~)
Comenzamos considerando momentneamen,t~ el siguiel.'\te,Pll~lZ~:"""
,...
de negociacin de un periodo, (Utilizaremos IJ;lstarsIe l?s~e.~~t~~P~,tr'
este problema como la solucin en el segundo periodo del juegomndos
periodos.) En el problema con un periodo/supo~garnos
que.~_s~~~~i?
cree que el beneficio de la empresa se distribuY~UI;iformement. en [9~1[A
donde Tl es por el momento arbitrario. Si el sindicato ofrece ,w, la mej?X
respuesta de la empresa, es clara: aceptar lO~iys910 si T~ 'w. Por lotapt9'
el problema del sindicato puede formularse co~o:;
",,'

ei,

O.
O

lO"
IT, - lO,

O
O

e~p're~~:

O
O

lO,
1t.~- IVg

,.

,,-

O
O

Figura 4.3.3
dos com.o en la figura 4.3.3). En cada conjunto de informacin, la conjetura
del sIndIcato es una distribucin de probabilidad sobre estos nodos. En el

O
O

'_.

-,>.

_.

o'"

-'

..
'

maxUJ'
w

Prob{la empresa acepta

lO}

+ O. Prob{la empresa no acepta

.'

lO},
;.

donde Prob{la empresa acepta w} = (TI-'w) /Tl para los valores relevantes

.....

...

....

Otras aplicacio'l1es del equilibrio bayesiano perfecto / 227

226 / JUEGOS DINMICOS CON lJ'JFORMAClN INCOMPLETA (e. 4)

,','

,~,',

de las ofertas salariales (concretamente, O ~ W ~ 7fl)' La oferta salarial


ptima es, por lo tanto, W*(7fl) = 7f1l2.
Volvemos ahora (definitivamente) al problema con dos periodos. Demostramos en primer lugar que, para valores arbitrarios de Wl y W2, si el
sindicato ofrece Wl en el primer periodo y la empresa espera que ofrezca
W2 en el segundo periodo, todas las empresas con beneficios lo suficientemente altos aceptarn Wl y todas las dems lo rechazarn. Las posibles
ganancias de la empresa son 7f-Wl por aceptar '11)1, (7f - W2) por rechazar
Wl y aceptar W2, y cero si rechaza ambas ofertas. Por lo tanto, la empresa
prefiere aceptar Wl a aceptar W2 si 7f- Wl > (7f - W2), o

....}

;-

y la empresa prefiere aceptar W1 a rechazarlas do~oferta~ si 7f-W1 > O.por


lo tanto, para valores arbitrarios dewl y W2, empresas con 1i" >mx{ 7f*(Wl,
W2), Wl} aceptarn Wl y empresas con 7f <1l].!,\x{7r*(Wl,Wi),W1}
lo rechazarn. Como elrequisito 2 establece que la inpresa acta ptimamente
dadas las subsiguientes estrategias de los jugadores, podemos obtener
Al (wll7f)para un valor arbitrrio de '11)1: empresas con 'Ir>max{ 7f*(-Wl,'U)2)
,wt} aceptarn Wl y empresas-con 7f <~ax {7f*(Wl, W2), wt} lo rechazarn,
donde W2 es la oferta salarial del sindicato,en el segundo periodo W2(Wl).
Podemos ahora obtener f-l2(?rlwl);la onjetura del sinc;licatoen el segundo periodo en el conjunto de i1.formacinal que se llega si la oferta Wl
del primer periodo es rechilza-dir. El requisito 4 implica que la conjetura
correcta es qu ?rosedistribuya uniformemente en [O,7f(Wl),
donde 7f(Wl)
es el valor de 7f que hace que la empresa sea indiferente entre aceptar
Wl y rechazarlo para aceptar f;;ierta
pti~a del sindicato en el segundo
periodo dada esta conjetura (concretamente, W"(7f(Wl = 7f(wl)/2, como
obtuvimos en el problema de un periodo), Para ver esto, recordemos
que el requisito 4 establece que la conjetura del sindicato debe obt~nerse
a partir de la regla de Bayes'y de la estrategia de la empr~sa. Por lo
tanto, dada la primera parte-de la estrategia de la empresa A1(WII7f)que
acabamos de hallar, la conjetura del sindicato debe ser que los tipos que
quedan en el segundoperiode;se
distribuyen uniformemente eiJ.[O,7fl],
donde?rl =max{ 7f*(W},W2),Wt} y W2 es la oferta salarial del sindicato en
el se~do
periodo W2(Wl).Dda esta conjetura, la oferta ptima del sindicato en el segundo periodo debe ser W"(7fl) = 7ft/2, lo que proporciona
una ecua,q.n implcita de 7flen,funcin de Wl:

7fl= max{7f"(w,7f,j2),Wl}'
Para resolver esta ecuacin implcita, supongamos que Wl ~ 7f"('U],irtl2).
7f*(Wl,7fl/2). Por lo tanto,
7fl -- Wl, lo que contradice Wl >
Enances
t
Wl

< 7f"(W},7fl/2),de manera que 7fl = 7f*(1JJl:rj2),o


21JJl
7fl(Wl)=2_

Wl

W2(w1)=2_'

Hemos reducido el juego a un problema de optimizacin en un periodo para el sindicato: dada la oferta salarial del sindicato en el prime.r
periodo, 1JJl,hemos hallado la respuesta p~m~ ~e la empresa en e~pnmer periodo, la conjetura del sindicato al pnnc~plO del segundo p:n~do,
la oferta ptima del sindicato en el segundo penado y la respuesta 0.pt1ll1a
de la empresa en el segundo periodo. Por lo tanto,.l,a oferta salanal del
sindicato en el primer periodo debera ser una soluclOn de

max. Prob{la empresa acepta 1IJ}


w

+ W2(Wl)

Prob{la empresa no acepta

Wl

+ . O. Prob{la empresa no acepta 71Jlni

pero acepta 1JJ2}


.

W2}'

Ntese que Prob{la empresa acepta IUl}no es simplemente la probabilidad


de que 7fsea mayor que Wl, sino la probabilidad de que 7fsea mayor que
7fl('11)1):
7fA - 7fl(Wl)
Prob{la empresa acepta w}

=7fA

La solucin de este problema de optimizacin es wi, dado al principio del


anlisis, y ~i ywi, dados por 7f(llJ)Y W2(Wi> respectivamente,
4.3.C La reputacin en el dilema de los presos repetido finitamenle
En el anlisis de los juegos con informacin completa repetid~s finitaJ~el.'te
de la seccin 2.3.A, demostramos que si un juego de etapa tIene un UnJco
equilibrio de Nash, cualquier juego repetido finitamente basa~o en este
juego de etapa tiene un nico equilibrio de Nash perfecto el~~u~Juegos: en
cada etapa, despus de cualquier historia, se juega el eqUIlIbno de Nash
del juego de etapa. En contraste con este resultado terico, buena parte. ~e
la evidencia experimental sugiere que frecuentemente se da cooperacJOl1

(.

228/

JUEGOS DIN'>'MICOS CON INFOllMACIN

INCOlvlPLETA (e. 4)

en dilemas de los presos repetidos finitamente, especialmente en etapas


que no estn demasiado cerca del final. (Vase algunas referencias en
Axelrod [1981].) Kreps, Milgrom, Roberts y Wilson (1982) demuestran
que un modelo de reputacin ofrece una explicacin de estos hechos.8
La explicacin ms simple de un equilibrio de reputacin en el dilema
de los presos repetido finitamente incluye una manera nueva de modelar
la informacin asimtrica. En lugar de suponer q\le un jugador tiene
informacin privada sobre sus ganancias, supondremos que el jugador
tiene informacin privada sobre sus estrategias factibles. En particular,
supondremos que con probabilidad p, el jugad~)Tfilapuede jug~sqlo l?
estrategia del Talin(tit-fot-tat) (qll~ empieza el juego repetido cooperando
e imita en lo sucesivo la jugada q~lterior de su oponente), rnjent:rasque
con probabilidad 1 - pel jugadqr fila puede utilizar cualquit:~rade las
estrategias disponibles en eljuego rep~tido infinitamente (incluida la del
Talin). De acuerdo con la terminologa habitual, llamaremos "racional"
al jugador fila. La ventaja expositiva de esta fommlacinse debe al hecho
de que si el jugador fila se desva alguna vez de la estrategia del Talin,
pasa a ser informacin del dominio pblico que el jugador fila es radonal.
La estrategia del Tali9n es simple y atractiva, y fue adems la ganadora
en el torneo del dilema de los' presos de Axelrod. No obstante, se podra
cuestionar el supuesto de que un jugador tiene slo una estrategia, incluso
si sta es atractiva. A costa de perder algo de simplicidad expositiva, se
podra suponer que ambos tipos del jugador fila pueden jugar cualquier
estrategia, pero con probabilidad p las ganancias del jugador son tales
que la estrategia del Talin domina a cualquier otra estrategia del juego
repetido. (La exposicin se complica bajo este supuesto, porque una desviacin de la estrategia del Talin no hace que sea informacin del dominio
pblico que el jugador es racional.) Estas ganancias difieren de las que se
suponen nomlalmente en los juegos repetidos: para que la intacin de la
decisin previa del jugador columna sea un ptimo, las ganancias en este
periodo del jugador fila deben depender de la jugada del jugador columna
en el periodo anterior. Como tercera posibilidad (de nuevo a costa de sacrificar simplicidad expositiva), se podra permitir que un jugador tuvief~
informacin privada sobre sus ganancias en el juego de etapa, per()i~istir
8 Demo>tramos en la seccin 2.3.Bque puede existir cooperacin en el dilema de l~pre'sos
repetido infinitamente. Algunos autores se refieren a tal equilibrio como un equilibrio de
"reputacin", aun cuando las ganancias y oportUnidades de ambos jugadores son informacin
del dominio pblico. Por claridad, se podra describir ese equilibrio cmoun:~qciIibri~
basado en "amenazas y promesas", reservando el trmino "reputacin" a los jtegb~ 'en'los
que al menos un jugador tiene algo que aprender sobre otro, como ocurre en esta seccin: .,

Otras aplicaciones del equilibrio bayesiano perfecto / 229


1\

en que la ganancia en una etapa dependa slo de las jugadas de esa etapa,
y que la ganancia total del juego repetido sea la suma de las ganancias en
cada una de las etapas del juego. En particular, se podra suponer que
con probabilidadp la mejor respuesta del jugador fila a la cooperacin
es la cooperacin. Kreps, Milgrom, Roberts y Wilson (KMRW en lo sucesivo) demuestran que la existencia de informacin asimtrica unilateral
de este tipo no es suficiente para producir la cooperacin en el equilibrio;
al contrario, no cooperar (confesar) es lo que ocurre en cada etapa, al igual
que bajo informacin completa. Sin embargo, tambin demuestran que si
la asimetra informativa es bilateral (es decir, existe tambin una probabilidad q de qli.e'la mejor respu~sta del jugador columna a la cooperacin
sea la cooperacin) puede existir entonces un equilibrio en el que los dos
jugadores cooperen hasta que;uede muy poco para que el juego se acabe.
Para repetirlo otra vez, supondremos que con probabilidad p el jugador fila slo puede jugar la estrategia del Talin. El espritu del anlisis
de KMRW' es que' incluso si p es muy pequea (es decir, incluso si el
jugador' colrnna tiene slo una ligera sospecha de que el jugador fila
podra no ser racional) ,sta incertidumbre puede tener un gran 'efecto"e:n
el siguiente sentido. KMRW demuestran que existe una cofa superior,.al
nmero de etapas en las que algn jugador no coopera en equilibrio. Esta
coti;lsuperior depende de p y de las ganancias en el juego de etapa, pero
no del nmero de etapas en el juego repetido. Por lo tanto, en cualquier
equilibrio de un juego repetido lo suficientemente largo, la fraccin deetapas en las que ambos jugadores cooperan es grande. (KMRWestablecen
su resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~e
pueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~l
argumento de KMRW son: (Osi el jugador fila se desva de la estrategia
del Talin,.pasa a ser informacin del dominio pblico que el jugador es
racional, por lo que ningn jugador' cooperar en lo sucesivo, de manera
que el jugador fila racional tiene un incentivo para imitar la estrategia del
Talin, y (ii) dado un supuesto que i.I;npondreJI,t,os
ms, adelante sobre las
ganancias del juego de etapa, la mejor respuest del jugador columna a la
~stategia del Talin sera coope~ar hasta. la ltima etapa del juego.
.
Para entende:ulsson los elementos bsicos del modelo de KMWR,
con~iderarem~s eicompieII1ertt?riricie su ~liSis:.en lugar de suponer q~e
p es baja y analizar los juegos rep,etldc,>sdelarga duracin, supondremos
qlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de
.un juego repetido corto en el qud9!i dos jugadores cooperen en todas las
etapas menos
en las dos
l9~Ill.~,Empezamos con el caso de dos periodos.
.
.
.

,(

Olras aplicaciones

riel equilibrio

bayesillllO perfecto

/ 231

230 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)

initada por la estrategia del Talin en el segundo periodo, como se ve en


la trayectoria de equilibrio en la figura 4.3.5.

El desarrollo temporal es:


1. El azar determina un tipo para el jugador fila. Con probabilidad p, el
jugador fila slo dispone de la estrategia del Talin; con probabilidad
1 - p, puede jugar cualquier estrategia. El jugador fiJase entera de su
tipo, pero el jugador columna no se entera del tipo del jugador fila.
2. Los jugadores fila y columna juegan al dilema de los presos. Sus
decisiones en esta etapa pasan a ser informacin del dornini.o pblico.
3. Los jugadores fiJa y columna juegan al dilema de los presos por segunda y ltima vez.
4. Se reciben las ganancias. Para el jugador fila racional y el jugador
columna stas son la suma (sin descuento) de sus ganancias enJas dos
etapas. El juego de etapa se presenta en la figura 4.3:4.

"o

";

1=2

1=1

Estrategia del Talin

Jugador racional fila

NC

NC

Jugador columna

NC

Figura 4.3.5

Para hacer de este juego de etapa un dilema de los presos, suponemos que
a > 1 yb < O.KMRWtambin suponen que a + b < 2,de forma que (como
indicamos anteriormente en (ii la mejor respuesta del jugador columna
a la estrategia del Talin es cooperar hasta la ltini'etpa del juego; en
lugar de ir alternando entre cooperar y no cooperar.

1=1

1=2

1=3

Estrategia del Talin

Jugador racional fila

NC

NC

Jugador columna

NC

Columna
Figura 4.3.6

Cooperar,No coop~rar

-,

.,:

Cooperar

1,1

b,a

No cooperar

a,b

0,0

Fila

Figura 4.3.4
Al igual que en el ltimo periodo de un dilema de los presos rejJetido
finitamente coninformacin completa, no cooperar (NO) driliaestric
tamente a cooperar (O) en l~ltima etapa de este juegod~ dos'peii6dos
con informacin incompleta; tanto para el jugador fila r.;tcional
para
el jugador column. Dado que el jugador columna no coopetaren"la
ltima etapa, no existe ninguna razn para que el jug~dorfila r~ional10
hagaen larrimera etapa. Ahora bien, la estrategia delTalin empieza
el juego con cooperacin. Por lo tanto, la nica decisi6n que hace falta
determinar es la del jugador columna en el primer periodo, (X), 'que ser

c?mo

"

Escogiendo X = O, el jugador columna recibe la ganancia esperada


1 + (1 - p) . b en el primer periodo, y p . a. en el segundo. (Cmno la
estrategia del Talin y el jugador fila racional eligen jugadas diferentes
en el primer periodo, el jugador columna empezar el segundo periodo
sabiendo si el jugador fila es racional o juega la estrategia del Talin. La
ganancia esperada en el segundo periodo p . a refl~ja la incertidumbre
del jugador columna sobre el tipo del jugador fila a la hora de decidir si
cooperar o no en el primer periodo.) Escogiendo X = NO, en cambio, el
jugador columna recibe p . a en el primer periodo y cero en el segundo.
Por lo tanto, el jugador columna cooperar en el primer periodo siempre

p .

que
p + (1 - p)b

O.

Supondremos en lo sucesivo que (43.2) se cumple.

(4.32)

232/

JUECOS DINMICOS CON INFORMACIN

INCOMPLETA (c. 4)

Otras aplicaciones del equilibrio bayesiano pe/feelo / 233

Consideremos ahora el caso con tres periodos. Dado (4.3.2), si el


jugador columna y el jugador fila racional cooperan en el primer periodo,
la trayectoria de equilibrio en el segundo y tercer periodos vendr dada
por la figura 4.3.5, con x= e y los nmeros de los periodos cambiados.
Derivaremos condiciones suficientes para que el jugador columna' y el
Jugador fila racional cooperen en el primer periodo, como se indica en la
trayectoria de equilibrio de tres periodos en la figura 4.3.6.
En este equilibrio, la ganancia del jugador fila racional es 1 + a y la
8.anancia esperada del jugador columna es 1 +p+ (1- p)b+pa. Si el jugador
tila racional no coopera en el primer periodo, pasa a ser informacin del
dominio pblico que el jugador fila es racional. Por lo tanto, la 'ganancia
del jugador fila racional por no cooperar en el primer periodo es a~'que
es menor que la ganancia 1 + a de equilibrio, por lo que el jugador fila
racional no tiene incentivos para desviarse de la estrategia implcita en la
figura 4.3.6.

Dada (4.3.2), una condicin suficiente para que el jugador columna no se


desve es
1 + pa ~ a.

(4.3.3)

Alternativamente, el jugador columna podra desviarse no cooperando


en el primer periodo pero cooperando en el segundo, en cuyo caso la
estrategia del Talin cooperara en el tercer periodo, por lo que el desarrollo
del juego sera como se indica en la figura 4.3.8. La ganancia esperada del
jugador columnap?r esta desviacin es a + b + pa, que es menor que su
glnanciaesperada en' equilibrig siempre que

,'o,,'

',,-;.",

1 + p + (1 - p)b + pa ~, a + b + pa.

1= 1

1= 2

1= 3

Estrategia del Tali6n

NC

Jugador raCional fila

NC

NC

Jugador columna'

NC

NC

-.

1= 1

1= 2

Estrategia del Talin

NC

Jugador racional fila

NC

1=3

NC

"---'

Jugador columna

NC

NC

NC
Figura 4.3.8

Figura 4.3.7

Nos ocupamos ahora de si el jugador columna tiene algn inentivo


para desviarse. Si el jugador columna no coopera en el primer periodo;
la estrategia del Talin tampoco lo har en el segundo, y el jugador fila
~'acional no cooperar en el segundo periodo, porque es' seguro que' el
Jugador columna no lo har en el ltimo periodo. No habiendo cooperado
,en el primer periodo, el jugador columna debe decidir si cooperar o no
en ~l segundo periodo. Si el jugador columna no coopera en el segund
?enodo, la estrategia del Talin tampoco lo har en el tercero, por lo queel
Juego se desarrollar corno indica la figura 4.3.7. La ganancia deljugador
columna por esta desviacin es a, que es menor que su ganancia esperada
en equilibrio siempre que
1 + p + (l - p)b + pa ~ a.

Dada (4.3.2), una condicin suficiente para que el jugador columIla no se


desve 'es
'
, ';!

a+b:::;1.

'(4.3.4)

Hemos demostrado que si (4.3.2), (4.3.3)y (4.3.4) se cumplen, el desarrollo


del juego descrito en la figura 4.3.6 es la trayectoria de equilibrio de un
equilibrio bayesiano perfecto del dilema de los presos con tres periodos.
Dado un valor dep, las ganancias ay b satisfacen estas tres d'esigualdades
si pertenecen a la regin sombreada' d&la;figura 4.3.9. A medida que p
tiende a cero, la regtnsombreadaq,esapare.ce,consistentemente
con la
observacin anterior de queeri~stasecci6nanalli:amos
la cooperacin en
el equilibrio en juegos cort~s con valores altos de p, mientras que KMRW
~e centran en juegos de larga duracin con valores bajos de p. Por otra
parte, si p es lo suficieht~mentealta. como para sustentar la cooperacin
en un juego corto, es suficientemente' alta para hacerlo en un juego largo.

(,

234 / JUEGOS DINMICOS CON INFORMACIN

Otras aplicaciol1es del equilibrio bayesiano perfecto / 235

INCOMPLETA (c. 4)

Formalmente, si a, by p satisfacen (4.3.2), (4.3.3) Y (4.3.4), para cualquier


T > 3 finita existe un equilibrio bayesiano perfecto en el juego repetido T
periodos, en el cual el jugador fila racional y el jugador columna cooperan
hasta el periodo T - 2, tras el cual los periodos T - 1 Y T son tal como se
describen en la figura 4.3.5. (Vase el apndice para una demostracin de
esta afirmacin.)

a=l

a=l/(l-p)

= -p/(l-p)

Figura 4.3.9

Apndice

"'c

",

Por razn de brevedad, nos referiremos a un e4ulibri~~1yeSianoperfedO


del dilema de los presos repetido T periodos, como un equilbrio cooperativo
si el jugador fila racional y el jugador columna cooperan hasta el periodo
T - 2, tras lo cual los periodos T - 1 Y T se describen en la figura 4.3.5.
Vamos a demostrar que si Ct, by p satisfacen (4.3,2),.(4.3.3) y (4.3.4), existe
~nequilibrio cooperativo para cada T.;> :3 finito. Argumentamos por
mduccin: dado que para cada T = 2, 3, ... ,T ~ 1 existe un equilibrio cooperativo en el juego con T periodos, demostramos que existe
equilibrio
cooperativo en el jugo con T periodos.;.
....
..'

en el periodo T - 1, o (T - t - 1) + u, por lo que no cooperar no resulta


rentable para ningn t < T - 1. El argumento referente a.la figura 4.3.5
implica que el jugador fila racional no tiene incentivos para desviarse en
los periodos T - 1 o T.
Demostramos a continuacin que el jugador columna no tiene incentivos para desviarse. El argumento referente a la figura 4.3.5 significa que el
jugador columna no tiene incentivos para desviarse cooperando hasta el
periodo T - 2 Ydejando de cooperar en el periodo T -1; el argumento referente a la figura 4.3.6 implica que el jugador columna no tiene incentivos
para desviarse cooperando hasta el periodo T - 3 Y dejando de cooperar
en el periodo T - 2. Por lo tanto, necesitamos demostrar que el jugador
columna ha tiene incentivos para desviarse cooperando hasta el periodo
t - 1 Y dejando de cooperar en el periodo t, donde 1 ::; t ::; T - 3.
Si el jugador columna no coopera en el periodo t, la estrategia del
Talin tampoco lo l~ar en el periodo t+ 1, por 10 que el jugador fija racional
tampoco lo har (ya que no cooperar domina estrictamente a cooperar en
la (t + 1)-sima etapa del juego, despus de lo cual no cooperar de t + 2
a T proporciona una ganancia cero como mnimo, mientras que cooperar
en t + 1 hara que fuera informacin del dominio pblico que el jugador
fila es racional, resultando en una ganancia de exactamente cero a partir
de t.+ 2 hasta T). Dado que tanto la estrategia del Talin como el jugador
fila racional cooperan hasta elperiodo t y dejan de cooperar en el periodo
t + 1, la conjetura del jugador columna al principio del periodo f; + 2 es
que la probabilidad de que el jugador fija sea la estrategia del Talin es
p. Por lo tanto, si el jugador columna coopera en el periodo t + 1, el juego
de continuacin que etnpiezaen el periodo t + 2 ser. idntico a un juego
de T periodos con T = T - (t + 2) + l. Por la hiptesis de induccin; existe
un equilibrio cooperativo en este juego de continuacin de T periodos;
supongamos que se juega este equilibrio. Entonces1a ganancia del jugador
columna en los periodos t a T por no cooperar en el periodot y.cooperar
en el periodo t + 1 es

un

Demostramos primero que el jugador fila raCio~~l no tiene incentivos


para desviarse del equilibrio cooperativo en el juego con T periodos, Si
el jugador fila no fuera a cooperar en ningn period t < T'- 1, llegara a
ser del dominio pblico que el jugador fila esracional, por l que recibira
una ganancia a en el periodo t y cero en cada periodo siguiente. Pero la
ganancia en equilibrio del jugador fila es 1 en los periodos t a T - 2, Y a

+ b + [T

- (t

+ 2) - 1] + 11 + (1 -

p)b

+ pa,

que es menor que la ganancia de equilibrio del jugador columna en los


periodos t a T,
2 + [T.-

(t

+ 2) - 11 + p + (1 -

p)b

+ pu.

(43.5)

D6 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA Ce. 4)

Refinamientos

Hasta ahora hemos demostrado que el jugador columna no tiene incentivos para desviarse cooperando hasta el periodo t - 1 Y dejando de
cooperar en el periodo t, dado que se jugar el equilibrio cooperativo en
el juego de continuacin que empieza en el periodo t + 2. Ms en general,
el jugador columna podra cooperar hasta el periodo t - 1, no cooperar
en los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Hay
tres casos que son triviales: (1) si t + s = T (es decir, si el jugador columna
nunca coopera despus de no haberlo hecho en el periodo t), la ganancia
es a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) si
t + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor que
en (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l'
es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valores
de ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior con
s = O, existe un equilibrio cooperativo. en el juego de. continuacin que
empieza en el periodo t + s + 2; supongamos que se juega este equilibrio.
Entonces, la ganancia del jugador columna en los periodos ta T por jugar
esta desviacin es
a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+

el jugador 1 C es una estrategia estrictamente dominada: la ganancia de 2


por utilizar D es mayor que cualquiera de las ganancias que el jugador 1
recibira por utilizar C, O y 1. Por tanto, no es razonable que el jugador 2
crea que el jugador 1 puede haber elegido C; formalmente, no es razonable
que 1 - p sea positivo, por lo que p debe ser igual a 1. Si la conjetura
1 - p > O no es razonable, tampoco lo es el equilibrio bayesiano perfecto
(D,D',p ::;1/2), quedando (I,I',p = 1) como el nico equilibrio bayesiano
perfecto que satisface este requisito.
D
2
2

---------------2

pg,

que es, de nuevo, menor que (4.3.5).


4.4 Refinamientos del equilibrio bayesiano perfecto
En la seccin 4.1 definimos un equilibrio bayesiano perfecto como las estrategias y las conjeturas que satisfacen los requisitos 1 a4, y'observamos
que en tal equilibrio ninguna estrategia de ningn jugador puede estar estrictamente dominada a partir de ningn conjunto de informacin. Ahora
consideramos dos requisitos adicionales (sobre conjeturas fuera de la trayectoria de equilibrio), el primero de los cuales formaliza la idea siguiente:
puesto que un equilibrio bayesiano perfecto impide que el jugador i jueglIe una estategia estrictamente dominada a partir de algn conjunto de
informacin, no es razonable que el jugador j crea que i utilizar esa
estrategia.
Para concretar ms esta idea, consideremos el juego de la figura 4.4.1.
Existen dos equilibrios bayesianos perfectos en estrategias puras: (I,I',p =
1) y (D,D',p ::; 1/2).9 La caracterstica clave de este ejemplo es que para
. 9Derivar la representacin en forma nonnal revela que existen en este juego dos equilibnos de Nash con estrategias puras: ([,JI) y (D,D/). Puesto que no hay subjuegos en la forma

del equilibrio bayesimlO perfecto / 237

3
1

------7

Figura 4.4.1
Otras dos caractersticas de este ejemplo merecen una breve mencin.
En primer lugar, aunque C est estrictamente dominada, 1 no. Si Eestu~
viera estrictamente dominada (corno ocurrira si la ganancia de 3 por parte
del jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicara que
no es razonable que p sea positiva, lo que implica que p debe ser cero, pero
esto contradira el resultado anterior de que p debe ser uno.,.En tal caso,
este requisito no restringir! lqs conj~turas fuera del equilibrio d~i jugador
2. (Vase la definicin formal'que damos ms adelante)
,
.
1
.,_,'
En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicialmente, porque C no slo est estrictamente dC;IDinadaa partir de algn
conjunto de info~acin, sino estrjctarr;f~t~~ominada en el sentido ms
,.

. ..

."

o.

~
.

extensiva, ambos equilibrios de Nash sOn perfectos en subjuegos. En u,1') el conjunto de


informacin del jugador 2 est en la trayectpri", de equilibrio, por lo que el requisito 3 establece
que p = L En (D,D') este conjunto d~ infqrm,!.cin est fuera de la trayectoria de. equilibrio,
pero el requisito 4 no impone ningna restriccin a p. Por lo tanto, slo requerimos que la
conjetura p de 2 haga que la accin D' sea ptima, es decir, p ~ 1/2.

Refil1amiel1lus riel equilibrio bayesial10 perfecto / 239

238 / JUEGOS DINMICOS CON INFORMACIN INCOMPLETA (c. 4)

pleno. Para ver la diferencia, recordemos de la seccin 1.1.B que una


estrategia .5; es estrictamente dominada si existe otra estrategia Si tal que
para cada posible combinacin de estrategias de los dems jugadores, la
ganancia de 'i por jugar Si es estrictamente mayor que la ganancia por
jugar
Ahora consideremos una versin expandida del juego en la
figura 4.4.1, en la cual el jugador 2 tiene que jugar antes que el jugador 1,
y cuenta con dos opciones en esta jugada ihcial: acabar el juego o pasar
el control de ste a 1 en el conjunto de informacin de 1 tal como aparece
en la figura. En este juego expandido, e est an estrictamente ltominada
a partir de algn conjunto de informacin, pero no est estrictamente
dominada, puesto que si 2 termina el juego en el nodo inicial, J, e y D
obtienen la misma ganancia.
Puesto que e est estrictamente dominada en la figura 4.4.1, no es
razonable que el jugador 2 crea que 1 puede haber elegido e, pero la dominancia estricta es una condicin demasiado fuerte y, por lo tanto, hace
que este requisito sea demasiado dbiL (Puesto que hay ms estrategias
estrictamente dominadas a partir de algn conjlmto de informacin que
estrategias estrictamente dominadas,. requerir, qi, jno !=reaque. i puede
haber elegido una de las primeras pone ms restricciones sobre las conjeturas de j de las que habra si j no creyera que i pueda haber utilizado
una de las ltimas.) Seguidamente, nos quedarnos con el requisito tal
corno lo enunciamos originalmente: el j';lgador j no debera creer que
el jugador i ha elegido una estrategia estrictamente dom1;ada a partir de
algn conjunto de informacin. A continuacin enunciamos este requisito
formalmente.

s;.

",

Requisito 5. Si es posible, cada una de las conjetllras del jugador fuem de In


trayectoria de equilibrio debera asignar una probabilidad cero a los nodos que
se alcanzan slo si otro jugador utiliza una estrategia que est estrictamente
dominada a partir de algn conjunto de informacin.
La expresin "si es posible" en el requisito 5 incluye el caso que podra
plantearse en la figura 4.4.1 si D dominara tanto a e corno a J, como
ocurnra si la ganancia de 3 del jugador 1 fuera 3/2. En tal caso, el
requisito 1 precisa que el jugador 2 tenga una conjetura, pero no es posible
que esta conjetura asigne una probabilidad cero a los nodos que siguen a
e y a J, por lo que el requisito 5 no se aplicara en este caso.
3,2
a
1,

[pI
b

2,0
Receptor

1,0

[}- pI

1,

1,1

Figura 4.4.2
Definicin. Consideremos un conjunto de informacin en el cual le toca decidir al jugador i:" La estrategia s; est estrictamente
dominada a partir de
este conjunto de. informacin
s(existe otra estrategia Si tal que, para cada
conjetura que pudiera fonnarse i 'e-n el conjunto de informacin' dado, y para
cada posible combinacin' de las esttaiegiils subsiguientes de .los otros jugadores
(donde una "estrategia subsiguiente" es un plan completo de accin que cubre
cada contingencia que pudiera presentarse una vez se ha alcanzado el conjunto
de inforrr;zaciridado) la ganancia esperada de i al tomar la accin indicada por Si
en el conjunto de informacin dado 'y al jugar la estrategia subsiguiente indicada
por Si s :estr,ictamente ;nayor que la ganancia esperada al tomar la accin y jugar
la estrategia subsiguiente especificadas por s;.

Corno segunda ilustracin del requisito 5 consideremos el juego ele


sealizacion de la figura 4.4.2. Al igual que en la seccin 4.2.A, la estrategia del emisor (m',m") significa' que el tipo t1 elige el mensaje m' y el tipo
t2 elige m",y la esti:ategi elel receptor (a' ,a") significa que el receptor elige
la accin a' siguiendo a J y a" siguiendo a D. Es inmediato comprobar que
las estrategias y conjeturas [(I,I),(7J"d),p = O,5,q] constituyen un equilibrio
bayesiano perfecto ele agrupacin para cualquier q ~ 1/2. Sin embargo, la
caracterstica esencial de este juego de sealizacin es que no tiene sentido
que t1 elija D. Formalmente, las estratgias del emisor (D,I) y (D,D) (es
decir, las estrategias en las cuales tI elige D) estn estrictamente domj-

2-10/

jGEGOS DIN;;;IICOS CON INFOR;.L...CIN INCOMPLETA (e. 4)

nadas a partir del conjunto de informacin del emisor correspondiente a


Por lo tanto, el nodo t en el conjunto de informacin del receptor que
sigue a O se alcanza slo si el emisor utiliza una estrategia que est estrictamente dominada a partir de algn conjunto de informacin. Adems,
el nodo t2 en el conjunto de informacin del receptor que sigue a D puede
alcanzarse por medio de una estrategia que no est estrictamente dominada a partir de algn conjunto de informacin, concretamente U,D). Por
In tanto, el requisito 5 establece que q = O. Como [U,I),(n,d),p
= 0,5,q] es
un equilibrio bayesiano perfecto slo si q 2 1/2, tal equilibrio'no puede
cumplir el requisito 5.
Un modo equivalente de imponer el requisito Sal equilibrio bayesiano perfecto del juego de sealizacin definido en la seccin 4.2.A es el
siguiente.
ti .10

Definicin. En un juego de sealizacin, el mensaje mj de lvI est dominado


para el tipo ti de T si existe otro mensaje mj de M tal quela menor ganancia
posible de ti por utilizar mj es mls alta que la mayor ganancia posible de ti por
utilizar mj:
min U E(tim

akEA

j'

,CLk) >

max U E(tmj,ak)'

Refinamientos del equilibrio bayesiano perfecto / 241

en lugar de Oy 1 como en la figura 4.4.2. Ahora [(I,I),(u,d),p


= 0,5,q] es
un equilibrio bayesiano perfecto de agrupacin para cualquier valor de
q, por lo que [(I,I),(u,d),p
= O,5,q = O]es un equilibrio bayesiano perfecto
que satisface el requisito 5 de sealizacin.
En algunos juegos, existen equilibrios bayesianos perfectos que parecen poco razonables y sin embargo satisfacen el requisito 5. Una de las
reas de investigacin ms activas en teora de juegos se ha preocupado
de las dos siguientes cuestiones: (i) cundo es un equilibrio bayesiano
perfecto poco razonable y (ii) qu requisito adicional puede aadirse a
la definicin de equilibrio para eliminar estos equilibrios que no son razonables~ Cho y Kreps (1987) hicieron una contribucin original y muy
influyente en est rea. Vamos l concluir esta seccin discutiendo tres
aspectos de su trabajo: (1) el ju~go de sealizacin "cerveza y quiche",
que ilustra cmo ciertos equilibrios bayesianos perfectos quena son razonablespueden satisfacer el requisito 5 de sealizacin; (2) una versin
ms fuerte (pero de ninguna manera la ms fuerte posible) del requisito 5
de sealizacin, llamada el criterio intuitivo; y (3) la aplicacin del criterio
intuitivo al juego de sealizacin en el mercado de trabajo de Spence ....
1,1

ukEA

Req uisito 5 de sealizacin. Si el conjunto de informacin que sigue a 'mj est


fllera de la trayectoria de equilibrio y mj est dominado para el tipo ti, entonces
(si es posible) la conjetura del receptor j1.(t.; Imj) debera asignar ~robabilidad cero
al tipo ti. (Esto es posible siempre que m] no est dominado para todos los tipos

Duelo

[pI
,
,

Quiche

t,

[ql

Cerveza

..
No

0,5

:
.,,

3,0

Receptor

10 Como el conjunto de infonnadn


del emisor COITespo~diente a tI slo tiene un elemento,
las conjeturas del emisor no juegan ningn papel en la definidn de dominancia estricta a
partir de este conjunto de inforrnadn.
Demostrar que (D,n y (D.D) estn estrictamente
duminadas a partir de este conjunto de informacin se reduce a ofrecer una estrategia alternativa al emisor que proporcione la ganancia mayor a tI para cada estrategia que el receptor
pudiera jugar. (l,D) es esa estrategia: proporciona 2 a tI en el peor de los casos, mientras que
(D,)) y (D,D) propordonan
1 en el mejor de los casos.

0,1

Cobardica
Duelo

en T.)

En el juego de la figura 4.4.2, el equilibrio bayesiano perfecto de separacin


rU,D),(u,n),p = 1,q = O]satisface el requisito 5 de sealizacin trivialmente
(porque no hay conjuntos de informacin fuera de esta trayectoria de
equilibrio). Como ejemplo de un equilibrio que satisface el requisito
5 de sealizacin de forma no trivial, supongamos que se invierten las
ganancias del receptor cuando el tipo t2 juega D: 1 por jugar d y Opor'u,

....

0,-1

2,0

,,
,,
,
,,
,,
,,

"

"::'"

1,-1
0,5

Duelo: ,

,
,

[l No
2,0

Reeptor

Azar

pI

Quiche

1,

Duelo

Cerveza

Malas pulgas

[1 -

~:
...

qI
No
3,0

Figura 4.4.3
En el juego de sealizacin "cerveza y quiche", elemisor es uno de los
dos tipos: t ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"
(con probabilidad 0,9). El mensaje del emisor es su eleccin de cerveza

c.

242 / JUEGOS DINMICOS CON lNFORMAClN

..
'"

',

..:.;

o quiche para desayunar; la accin del receptor es decidir si batirse en


duelo o no con el emisor. Las caractersticas cualitativas de las ganancias
son que el tipo cobardica preferira tomar quiche para desayunar, el malas
pulgas preferira cerveza, ambos preferiran no tener que batirse con el
emisor (y esto les importa ms que sus desayunos), y el receptor preferira
batirse con el cobardica antes que con el malas pulgas. (Por lo tanto,
utilizando la terminologa ms convencional para los tipos, mensajes; y
acciones, este juego podra ser un modelo de barreras de entrada, como
el de Milgrom y Roberts [1982].) En la representacin en fomaeextensiva
de la figura 4.4.3, la ganancia por desayunar lo que se prefiere es 1 para
ambos tipos del emisor, la ganancia adicional potevitar un duelo. es.de 2
para los dos tipos, Y las ganancias del receptor por, batirse en duelo con
el cobardica o con el malas pulgas son 1 o -1 respectivamente;. todas las
dems ganancias son cero.
En este juego, [(qui~he, quiche), (no~duel65, p''; ,9;q] es unequilibri
bayesiano perfecto de agrupacin para q 2: 1tt~~d.ms, este equilibrio
satisface elrequisit05de sealizacin,yaqu, J~~lhYet~no estdominad~
para ningiln tipo del emisor. En particular, nad' gr'ahtiza que el cobardica
vaya a estar mejor por tomar quiche (una ganancia de 1 en el peor de los
casos) que portorriar cerveza (una ganariciade 2 en el mejor de los casos).
Por otra parte, la conjeturadel receptor fuera de lltraye~toria de equilibrio
parece sospechosa: si el receptor obserVa:inesp~}~dn;\ente que el emisor
elige cerveza, concluye que es al menos tan prbable 'Itieel em~sor sea
cobardica como que sea malas pulgas (es decir, q 2:1/2), aun cuando (a)
el cobar~icano puede mejorar de ninguna manenl su ganancia de 3 en
equilibrio tomando cerveza en vez de quiche, mientras que (b) el malas
pulgas podra mjorar su ganancia de 2 en equilibrio y recibir una ganancia
de 3 si el receptor mantuviera la conjetura de que q < 1/2. Dados (a) y
(b), cabra esperar que el malas pulgas escogiera cerveza y pronunciara el
siguiente discurso:
Verme escoger cerveza debera convencerte de que soy del
tipo malas pulgas: escoger cerveza no podri'a de ninguna
manera haber mejorado la ganancia del tipo cobardica, por
(a); y si escoger cerveza te convenciera de que soy del tipo
.malas pulgas, e~tonces hacerlo mejorara mi ganancia, por
(b).

Refinamientos

INCOMPLETA Ce. 4)

del equilibrio

bayesimlO perjec/o

/ 24:1

Si este discurso fuera credo, establecera que q = 0, lo que es incompatible con este equilibrio bayesiano perfecto de agrupacin.
Podemos ahora generalizar este argumento a la clase de juegos de
sealizacin definida en la seccin 4.2.A; con ello obtenemos el requisito
6 de sealizacin.
Definicin. Dado un equilibrio bayesiano perfecto en un juego de serlalizacil1,
el mensaje mj est dominado en equilibrio para el tipo ti de T si la gl7J1I1ncia
en equilibrio de t que denotamos mediante U'(t;), es ms alta que la mayor
ganancia posible para ti por utilizar 7)Ij:

Requisito 6 de sealizacin. ("El criterio intuitivo", Cho y Kreps 198'7):


Si el conjunto de informacin que sigue a mj est fuera de la trayectoria de
equilibrio y mj est dominado en equilibrio para el tipo t entonces (si es lJOsilJle)
la conjetura del receptor IJ,(ti 1m) debera asignar probabilidad cero al tipa 1:;.
(Esto es posible siempre que mj no est dominado eH equilibrio para torios los
tipos de T.)
Cerveza y quiche muestra que un mensaje mj puede estar dominado en
equilibrio para ti sin estar dominado para t;. Sin embargo, si mj est dominado para t mj debe estar dominado en equilibrio para t por lo que
imponer el requisito 6 de sealizacin hace que el requisito 5 sea redundante. Cho y Kreps utilizan un resultado ms poderoso debido a Kohlberg
y Mertens(1986) para demostrar que cualqier juego desealizacin de
la dase definida en la seccin 4.2.A tiene un equilibrio bayesiano perfeetcJ
que satisface el requisito 6 de sealizacin. Se dice a veces que los argumentos de este tipo utilizan la induccin hacia delante, porque al interpretar
una desviacin (esto es, al formarse la conjetura p,(t; mj el receptor se pregunta si el comportamiento pasado del emisor podra haber sido racional,
mientras que en induccin hacia atrs se supone que el comportamiento
futuro ser racional,
Para ilustrar sobre el requisito 6 de sealizaCin, lo aplicamos al caso
con envidia del modelo de sealizacin en el mercado de trabajo, analizado
en la seccin 4.2.B.
Recordemos que existe una enorme cantidad de equilibrios bayesianos perfectos de agrupacin, de separacin e luoridos en este modelo.
Sorprendentemente, uno de estos equilibrios es consistente con el recui-

.~,
/
,

~-'

(,,1

2,1-1 / JUEGOS DINMICOS CON INFORMACIN

Refinamientos

INCOMPLETA (c. 4)

sito 6 de sealizacin, el equilibrio de separacin en el cual el trabajador


con baja capacidad escoge el nivel de educacin de informacin completa
y el trabajador con capacidad alta escoge la educacin mnima necesaria para hacer que el trabajador con capacidad baja sea indiferente entre
imitarle o no, como ilustra la figura 4.4.4.

1,

(A,e)

y(A, e,)----.-.-----

~Y(Bre)

w*(B)

e*(B)

e.

Figura 4.4.4

En cualquier equilibrio bayesiano, si el trabajador escoge un nivel de


educacin e y las empresas creen en consecuencia que la probabilidad de
que el trabajador tenga capacidad alta es .t(Ale), el salario del trabajador
ser
w(e) = .t(Ale) . y(A,e)

+ [1 -

J.l(Ale)] . y(B,e).

Por lo tanto, la utilidad para el trabajador con capacidad baja al escoger e'(B) es corno mnimo yfB,e*(B)]
- c[B,e*(B),
que es mayor que su
utilidad al escoger cualquier e > e., independientemente de lo que la
empresa crea despus de observar e. Es decir, en trminos del requisito 5
de sealizacin, cualquier nivel de educacin e > es estdom:inado para
el tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5
de sealizacin implica que la conjehlra de la empresa debe ser .t(Ale) = 1
para e > e., lo que a su vez implica que un equilibrio de separacin en el

del eqllilibrio bayesial10 perfecto / 245

cual el trabajador con capacidad alta escoge un nivel de educacin e> es


no puede satisfacer el requisito 5 de sealizacin, ya que en tal equilibrio
las empresas deben creer que J.l(Ale) < 1 para niveles de educacin entre
es y e. (Un enunciado preciso es: el requisito 5 de sealizacin implica
que J.l(Ale) = 1 para e > es siempre que e no est dominado para el tipo
con capacidad alta, pero si existe un equilibrio de separacin en el que el
trabajador con capacidad alta escoge un nivel de educacin e > es entonces los niveles de educacin entre es y e no estn dominados para el tipo
con capacidad alta, de forma que el argumento es vlido.) Por lo tanto, el
nico equilibrio de separacin que satisface el requisito 5 de sealizacin
es el equilibrio que se muestra en la figura 4.4.4.
Una segunda conclusin se deriva tambin de este argumento: en
cualquier equilibrio que satisfaga el requisito 5 de sealizacin, la utilidad
del trabajador con capacidad alta debe ser como mnimo y(A,es) - c(A,e.).
A continuacin demostramos que esta <;onclusinsignifica que algunos
equilibrios lubridos y de agrupacin no- pueden satisfacer el requisito 5
de sealizacin_ Existen dos casos, dependiendo de si la probabilidad de
que el trabajador tenga capacidad alta (q) es lo suficientemente baja para
que la funcin de salario w = q . y(A,e) + (1- q) . y(B,e) est por debajo de
la curva de indiferencia del trabajador con alta capacidad que pasa por el
punto [e.,y(A,es)]'
Suponemos en primer l,ugar que q es baja, como se muestra en la figura
4.4.5. En este caso, :ningn equilibrio de agrupacin satisface el requisito 5
de sealizacin, porque el trabajador con capacidad alta no puede alcanzar
la ~tilidad y(A,es) - c(A,es) en este equilibrio. Del mismo modo, ningn
eq~ilibrio lubrido en el que el trabajador con capacidadalta se comporte
aleat9riaIl1ente ?,tisface el requisito 5 de sealizacin, porque el punto
(educacin, salario) en el que hay agrupacin en este equilibrio est por
debajo de la funcin de salario w = q. y(A,e) + (1 - q). y(B,e). Finalmente,
:ningn equilibrio lubrido en el cual el trabajador con capacidad baja se
comporte aleatoriamente satisface el requisito 5 de sealizacin, porque
el punto (educacin! salario) en el que hay agrupacin en este equilibrio
debe estar en la curva de indiferencia del trabajador con capacidad baja
que pasa por el punto [e*(B),w*(B)],
como en la figura 4.2.9, y est por
tanto por debajo de la curva de indiferencia del trabajador con capacidad
alta que pasa por el punto[es;y(A,es)]'
Por lo tanto, en el caso de la figura
4.4.5, el nico equilibrio bayesiano perfecto que satisface el requisito 6 de
sealizacin es el equilibrio de separacin que muestra la figura 4.4.4.

,','

1,'.

;;',

246 / JUEGOS DlNMICOS CON INFORMACIN

Re!ill11111ielllos

INCOMPLETA (e. 4)

qy

(A,e,)

parcelo / 247

bayesiallo

(A,e)

del equilibrio

(A,e)

(B,e)

si e' < e < e", el requisito 6 de sealizacin implica que la conjetura de


la empresa debe ser L(Ale) = 1, lo que a su vez significa que el equilibrio
de agrupacin indicado no puede satisfacer el requisito 6 de sea lizacin,
ya que en tal equilibrio las empresas deben creer que L(Ale) < 1 para las
elecciones de educacin entre e' ye". Este argumento puede repetirse par8
todos los equilibrios de agrupacin e hbridos en la regin sombreada de
la figura, por lo que el nico equilibrio bayesiano perfecto que satisface el
requisito 6 de sealizacin es el equilibrio de separacin mostrado en la
figura 4.4.4.

y
w*(B)

(A,e)

e,

e*(B)

e '

qy

y (A ,e, )

(A,e)

Figura 4.4.5

Suponemos ahora que q es alta, como se indica en la gura 4.4.6. Como


antes, los equilibrios hbridos en los que el tipO ~on capacidad baja se comporta aleatoriamente no pueden satisfacer el requisito 5 de sealizacin,
pero ahora los equilibrios de agrupacin y eqtiilibris lubri<losen los que
el tipo con capacidad alta se orripOrta aleatoriamente pueden satisfacer
este requisito si la agrupiiie da en un ptirito (educacin, salario) de la
regin sombreada de la figura. Sin embargo, estos equilibrios no pueden
satisfacer el requisito 6 de sealizacin.
Consideremos el equilibrio de agrupacin en ea mostrado en la figura
4.4.7. Las elecciones de nivel de educacin e > e' estn dominadas en equilibrio para el tipo con baja capacidad porque incluso el salario ms alto
que podra pagarse a un trabajador con educacin e, concretamente y(A,e),
da un punto (educacin, salario) por debajo de la curva de indiferencia del
trabajador con baja capacidad que pasa por el punto de equilibrio (ea,11Ja).
Las elecciones de nivel de educacin entre e' y e" no estn dominadas en
equilibrio pa~a el tipo con capacidad alta. Sin embargo, si esta eleccin
convence a las empresas de queel trabajador tiene capacidad alta, stas
ofrecern el salariO y(A,e), lo que har que el trabajador con capacidad
alta est mejor que en el equilibrio de agrupacin indicado. Por lo tanto,

y U3,e)

w*(B)

e,

e*(B)

Figura 4.4.6

24j /

J llEGOS

DINMICOS CON INFORMACIN

Ejercicios / 249

INCOMPLETA (c. 4)

(A,e)

qy

(A,e)

nes" se dan frecuentemente y que su modelo puede explicar muchos de


los datos empricos sobre huelgas. Sobre reputacin, vase la "teora de
la credibilidad" de Sobel (1985), en la cual una parte informada puede ser
un "amigo" o un "enemigo" de un agente decisor desinformado en una
sucesin de juegos con parloteo. Finalmente, vase Cho y Sobel (1990)
para ms informacin sobre refinamientos en los juegos de sealizacin,
incluyendo un refinamiento que selecciona el equilibrio de separacin
eficiente del modelo de Spence cuando hay ms de dos tipos.

(B,e)

4.6 Ejercicios
4.1 En los siguientes juegos en forma extensiva, dervese el juego en forma
normal y hllense todos los equilibrios de Nash con estrategias puras, los
perfectos en subjuegos y los bayesianos perfectos.
e* (L)

ep

e'

e"

e,

e
,-.. .-;:"

a.
D

Figura 4.4.7

2
2

4.5 Lecturas

adicionales

MilgTOny Roberts (1982) ofrecen una aplicacin clsica de los juegos de


sealizacin en temas de organizacin industrial. En economa financiera,
Bhaltacharya (1979)y Leland y Pyle (1977) analizan la poltica de dividendos y de propiedad empresarial (respectivamente) utilizando modelos de
sealizacin. Sobre poltica monetaria, Rogoff (1989) pasa revista a los
juegos repelidos, los de sealizacin y los modelos de reputacin, y Ball
(1990) utiliza cambios (inobservables) en el tipo de la autoridad monetaria
para explicar la trayectoria temporal de la inflacin. Para aplicaciones de
juegos con parloteo, vanse los trabajos de Austen-Smith (1990), Farrell
y Gibbons (1991), Matthews (1989), y Stein (1989) descritos en el texto.
Kennan y Wilson (1992) examinan la literatura sobre los modelos tericos
y empricos de negociacin bajo informacin asimtrica, subrayando sus
aplicaciones a huelgas y pleitos. Cramton y Tracy (1992) permiten que
un sindicato escoja entre ir a la huelga y continuar trabajando al salario
vigente; muestran que, de acuerdo con los datos, estas "ltimas sihlacio-

4
1

O
1

3
O

b.

D
2
4

1
3

1
2

4
O

4
O

3
3

.-;,":
",:.,

Ejercicios / 251

250 / JUEGOS DlNMfCOS CON INFORMACIN lNCOMPLETA (c. 4)

".,'

1")

4.2 Demustrese que no existe ningn equilibrio bayesiano perfecto con


estrategias puras en el siguiente juego en forma extensiva. Cul es el
equilibrio bayesiano perfecto con estrategias mixtas?

(1/3)

1,0

: b

Receptor
1,1

2,1

, a

a
1

1,
(1/3)

, "
,."','.
'~4':.'

0,0

,
,

Receptor

2
2

<0'
b

1,0

0,0

O
1

3
O

\$.

k'

;t

Receptor

Receptor

4.3 a. Descnbase un equilibrio bayesiano perfecto de agrupci6n en el que


los dos tipos del emisor juegan D en el siguiente juego de sealizacin.

Azar

1,
(1/3)

a
1

0,5

4.4 Descnbanse todos los equilibrios bayesianos perfectos de agrupacin y


de separacin con estrategias puras de los siguientes juegos de sealizacin.

1,

3,0

2,0

a.

2,2

1,1

a
1

Receptor

Azar

Receptor

1,

0,5

O,n

2,0

Receptor

Azar

Receptor

t,

1,0

0,5

1
3,1

2,1

0,0

0,1

1,2

0,0

0,0

2,2

b. El siguiente juego de sealizacin con tres tipos empieza con una


jugada del azar, que no aparece' en el rbol y que determina uno de los tres
tipos con igual probabilidad. Descnbase un equilibrio bayesiano perfecto
de agrupacin en el que los tres tipos del emisor juegan J.

0,0

1
0,1

0,5

t,

.1,0

1,1

252 /

b,

J UECOS I)IN,vllCOS

30)

0,0

a
O

IJ

0,5
1,1

4,1

3,3.

0,5

Receptor

Azar

Receptor

0,1

Ejercicios / 253

CON INFORMACiN INCOMPLETA (e. 4)

1,

1,2

4.7 Dibjense las curvas de indiferencia y las funciones de produccin


para un modelo de sealizacin en el mercado de trabajo con dos tipos.
Descrbase un equilibrio bayesiano perfecto hfbrido en el cual el trabajador
con capacidad alta se comporta aleatoriamente.
4.8 Hllese el equilibrio bayesiano perfecto con estrategias puras en el
siguiente juego con parloteo. Cada tipo tiene la misma posibilidad de ser
escogido por el azar. Como en la figura 4.3.1, la primera ganancia de cada
casilla es la del emisor, y la segunda la del receptor, pero la figura no es
un juego en forma normal, sino que simplemente expresa las ganancias
de los jugadores para cada par tipo-accin.

\:,.'

\.

'.

'.

b
2,0

4.5 Hllense todos los equilibrios bayesianos perfectos con estrategias


puras del ejercicio 4.3 (a) y (b).
4.6 El siguiente juego de sealizacin es anlogo al juego dinmico con
infon11acin completa pero imperfecta de la figura 4.1.1. (Los tipos t y
t2 son anlogos a las jugadas 1 y e del jugador 1 en la figura 4.1.1; si
el emisor escoge D en el juego de sealizacin, el juego se acaba, igual
que cuando el jugador 1 escoge D en la figura 4.1.1.) Hllense (i) los
equilibrios bayesianos de Nash con estrategias puras y (ti) los equilibrios
bayesianos perfectos con estrategias puras de este juego de sealizacin.
Relacinense (i) con el equilibrio de Nash y (ii) con el equilibrio bayesiano
perfecto de la figura 4.1.1.

',',

0,1 0,0 0,0


1,0 1,2 1,0
0,0 0,0 2,1

4.9 Considrese el ejemplo del modelo con parloteo de Crawford y?obeI


discutido en la seccin 4.3.A: el tipo del emisor se distribuye uniforri1e~
mente entre cero y uno (formalmente, T = [0,1] Yp(t) = 1 paratodo ten T);
el espacio de acciones es el intervalo de cero uno (A = [0;1]); la furicin
de ganancias del receptor es UR (t,a) = - (a - t)2, Yla funcin de ganancias
del emisor es UE(t,a) = -[a - (t + b)]2. Para qu v<ilresdb xste:un
equilibrio de tres escalones? Es la ganancia esperada/del recepto~;mr
alta en un equilibrio de tres escalones que en uno de dos escalnes?'QUe
tipos del emisor estn mejor en un equilibrio de tres escalones que' eIi"t.mo
de dos escalones?

4.10 Dos socios deben disolver su sociedad.

El socio 1 posee una participacin s en la sociedad, el socio 2 posee 1 - s.' Los socios estn de
acuerdo en jugar el siguiente juego: el socio 1 anuncia un precio para la
sociedad, p, y el soci02 escoge entonces si comprar la participacin de 1
por ps o vender la suya por pO - s). Supongamos que es informacin del
dominio pblico que las valoraciones de los socios de ser propietarios d
toda la sociedad son independientes y se distribuyen uniformemente en.
[0,1], pero que la valoracin deeada socio es informacin privada. Cul
es el equilibrio bayesiano perfecto?
.'

I\'.~J

Ejercicius / 255
254/

JUEGOS DINMICOS CON INFORMACIN

INCOMPLETA (e. 4)

4.11 Un comprador y un vendedor tienen valoraciones 'Ve y Vv respectivamente, Es informa,cin del dominio pblico que el intercambio es
rentable (es decir, que Ve > vv), pero la magnitud de esta rentabilidad es
informacin privada de la siguiente manera: la valoracin del vendedor se
distribuye uniformemente en [0,1];la valoracin del comprador Ve = k '1)",
donde k > 1 es informacin del dominio pblico; el vendedor conoce Vv
(y por tanto ve) pero el comprador no conoce Ve (o vv)' Supongamos que
el comprador realiza una nica oferta p que el vendedor acepta o rechaza.
Cul es el equilibrio bayesiano perfecto cuando k < 2? Ycuando k> 2?
(Vase Samuelson 1984.)

del sindicato, cuando los beneficios de la empresa estn uniformemenle


distribuidos entre cero y 1r*,es V(7r') = d7r', Demustrese que b = 2d,
c= 1/[1 +~]
yqued= [~(1- 6)/25.
4.13 Una empresa y un sindicato juegan el siguiente juego de la negociacin con dos periodos. Es informacin del dominio pblico que el
beneficio de la empresa, 1r,est uniformemente distribuido entre cero y
uno, que el salario de reserva del sindicato es 1JJr y que slo la empresa
conoce el verdadero valor de 1r. Supongamos que O < Wr < 1/2. Hllese
el equilibrio bayesiano perfecto del siguiente juego:
1. Al comienzo del primer periodo, el sindicato realiza una oferta salarial

..

,,)

4.12 Este problema considera la versin con horizonte infinito del juego
de la negociacin con dos periodos analizado en la seccin 4.3.B. Como
antes, la empresa tieneinformacin privada sobre sus beneficios' (1r),que
estn uniformemente distribuidos en [O,1ro],
y elsindicafo realiza todas las
ofertas salariales y tiene un s~Jariode. rese~.va JJr ":::O. ,l
En el juego candas periodos, la ~npre~Kacepta la, primera oferta del
sindicato (Wl) si 1r'> 71'1,donde el tipo con:beneficlos,.1rl es indiferente
entre (i) aceptar Wl y (ii) rechazar Wl pero aceptar la oferta del sindicato en
el segundo. periodo (W2), y W2 es la oferta ptima del sindicato dado que
los bem~ficiosde la empresa estn uniformemente distribuidos en [O,1rl]
y que slo queda un periodo de negociacin. En cambio, en el juego
con horizonte infinito, W2 ser la oferta ptima del sindicato 4ado que el
beneficio deja emprsaest uniformemente distribuido en [O,1rl]y que
queda un n~er6infi.nito,de periodos de negociacin (potencial). Aunque
el tipo con beneficlos 1rlserotra vezndiferente entre las opciones (i) y
(ii), el cambio en W2 harq~e cambie el vlor de 1rl.
El juego de continuacin que empieza en el segundo periodo del
juego de horizonte infinito es una versin a escala del juego completo:
existe un nmero infinito de periodos de negociacin (potencial), y los
beneficios de la empresa estn otra vez uniformemente distribuidos entre
Oy una cota superior; la nica diferencia es que la cota superior es ahora
1rl en lugar de1ro. Sobel y Takahashi (1983)demuestran que el juego
con horizonte infinito tiene un equilibrio bayesiano perfecto estacionario.
En este equilibrio, si los beneficios de la empresa estn uniformemente
distribuidos entre Oy 1r*,elsindicato realiza una oferta salarial w(7r*) = b1r*,
por lo que la:primera oferta es b1ro, la segunda b1rl' etc. Si el sindicato utiliza
esta estrategia estacionaria, la mejor respuesta de la empresa proporciona
1rl = C7ro,7r2= C7rl,etc., y el valor presente esperado de las ganancias

a la empresa, Wl'
2. La empresa o acepta o rechaza 1JJI' Si acepta, hay produccin en
los dos periodos, por lo que las ganancias son 2WIpara el sindicalo
y 2(1r- Wl) para la empresa. (No hay descuento.) Si la empresa no
acepta 1))1,no hay produccin en el primer periodo, y las ganancias del
primer periodo son cero tanto para la empresa como para el sindicato,
3. Al comienzo del segundo periodo (suponiendo que la empresa rechaz Wl) la empresa realiza una oferta salarial al sindicato, W2. (Al
contrario que en el modelo de Sobel y Takahashi, el sindica to no realiza
la oferta.)
4. El sindicato o acepta o rechaza W2. Si lo acepta hay produccin en
el segundo periodo, con lo que las ganancias del segun<:ioperiodo (y
totales) son W2 para el sindicato y 7r- W2 para la empresa. (Recordemos
que las ganancias del primer periodo fueron cero.) Si el sindicato
rechaza W2 no hay produccin, por lo que el sindicato gana un salario
alternativo Wr en el segundo periodo y la empresa cierra y gana cero.
4.14 Nalebuff (1987) analiza el siguiente modelo de la negociacin previo
a un posible pleito entre un demandante y un demandado. Si el caso
va a juicio, el demandado se ver obligado a pagar al demandante una
cantidad d por daos. Es informacin del dominio pblico que d est
uniformemente distribuida en [0,1] y que slo el demandado conoce el
verdadero valor de d. Ir a juicio le cuesta al demandante C < 1';2, pero
(por simplicidad) no le cuesta nada al demandado.
El desarrollo temporal es el siguiente: (1) El demandante propone
un acuerdo, s. (2) El demandado o acepta el acuerdo (en cuyo caso la
ganancia del demandante es s y la del demandado es -s) o lo rechaza. (3)

<.256 / JUECOS DlNivllCOS CON lNFORivlAClN

INCOMPLETA (e. 4)

Si el demandado rechaza 8, el demandante decide si ir a juicio, donde la


ganancia del demandante ser d - e y la del demandado -d, o retirar los
cargos, en cuyo caso la ganania cie ambos jugadores es cero.
En la etapa (3) si el demandante cree que existe una d* tal que el
demandad o aceptara el acuerdo si y slo si d > d*, cul es la decisin
ptima del demandante con respecto al pleito? En la etapa 2, dada la
propuesta de acuerdo 8, si el demandado cree que la probabilidad de que
el demandante vaya a juicio si 8 es rechazada es p, cul es la decisin
ptima para llegar a un acuerdo por parte del demandado de tipo d?
Dada una oferta s > 2c, cul es el equilibrio bayesiano perfecto del juego
de continuacin que comienza en la etapa 2? Y dada una oferta s < 2c?
Cul es el equilibrio bayesiano perfecto del juego eompleto si e < J /3?
Y si 1/3 < e < 1/2?
4.15 Consideremos un proceso legislativo en el que las decisiones factibles
varan continuamente desde p = Ohasta p = 1. La decisin ideal desde el
punto de vista del Congreso es e; pero el status quoes s, _dondeO < e < s <
1; es decir, la decisi;' ideal est a la izquierda del status quo. La deci;in
ideal para el Presidente es ti que se distribuye uniformemente en [O,llpero
es informacin privada del Presidente. El desarrollo temporal es simple:
el Congreso propone tma decisin p, que el presidente puede -ratificar
o vetar. Si p es ratificada las ganancias son -(e - p)2 para el congreso
y -(t - p)2 para el Presidente; si es vetada las ganancias son -(c - s)2
y ~(t - sf. Cul es el equilibrio bayesiano perfecto? Veriliquese que
e < ji < s en equilibrio.
Supongamos ahora que el Presidente puede comunicarse (en el sentido
de enviar un mensaje del tipo que hemos llamado de parloteo).antes de
que el Congreso proponga una decisin. Consideremos un equilibrio
bayesiano perfecto de dos escalones en el que el Congreso propone PB o
P.-I, dependiendo del mensaje que el Presidente enve. Demustrese que tal
equilibrio no puede tener e < pa < PA < s. Explquese por qu se deduce
que no puede haber equilibrios que incluyan tres o ms propuestas por
parte del Congreso. Dervense los detalles del equilibrio de d(?sescalones
en el que e = PB < PA < s: qu tipos envan qu mensajes?, y cul es el
valor de PA.? (Vase Matthews, 1989.)_
4.16 Considrese los equilibrios de agrupacin descritos en el ejercicio 4.3
(a) y (b). Para cada equilibrio: (1)determnese si el equilibrio p~ecie ser
sustentado por conjeturas que satisfagan el requisito 5 de sealizacin;

Referencias

/ 257

l
"'

..

(ii) determnese si el equilibrio puede ser sustentado por conjeturas que


satisfagan el requisito 6 de sealizacin (el criterio intuitivo).

4.7 Referencias
AUSTEN-SMITH,
D. 1990. "Information Transrnission in Debate." American
oumal

o/ Political

Science 34:124-52.

AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." American Political Science Review 75:306-18.

BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lllfl~tion." National Bureau of13conornic Researeh Working Paper #3529
(December).
.
BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incomplete Information." oumal o/ Monetary Economics 17:3-20.
BHAITACHARYA;
S. 1979. "Imperfect Information, Dividend Plicy: anc
the 'Bird in the Hand' Fallacy'" Bell oumal of Economics 10:259-70:
.. ,.. ~
CHO, J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."

-.'
'.'
'-:.

~
.

Quarterly oumal of Economics 102:179-222.

CHO, l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signaling Carnes." oumal o/ Economic Theory 50:381-413.
CRAMTON,
E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage Bargainirg:
Theory and Data." American Economic Review 82:100-21.

.':
:-',.

'"
'i,;.

CRAWFORO,
v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."
Econometrica 50:1431-51.

DYBVIG,
E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevance
with Asymmetric Information." Review o/ Financial Stlldies 4:201-19.
FARRELL,
L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.
FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium and
Sequential Equilibrium." oumal o/ Economic Theory 53:236-60.
HARSANYI,
J. 1967. "Carnes with Incornplete Information Played by Bayesian Players, Parts 1, n, and III." Management Science 14:159-82,320-34,
486-502.

RefercI1cil15

258 I JUEGOS DINMICOS CON INFORMACIN

I 259

INCOMPLETA (e. 4)

50BEL, J., Y 1. TAKAHASHI. 1983. "A mullistage


Review of Economic StLuties 50:411- 26.

KENNAN,J., y R. WILSON. 1992. "Bargaining with Priva te Information."


De prxima aparicin en Joumal of Economic Literature.

Model of Bargaining,"

SPENCE,A. M. 1973. "Job Market Signaling." Quarterly oumal of EcolllIlics


KOHLBERG,E., YJ.-F. MERTENS.1986. "On the 5trategic 5tability of Equili-

87:355-74.

bria." Econometrica. 54:1003-38.


1<REPS,D., Y R. WILSON. 1982. "5equential Equilibrium."

5PENCE,A. M. 197+. "Competitive and Optimal Responses to Signaling:


An Analysis of Efficiency and Distribution." Joumal of ECOllomic T11eory

Econometrica

50:863-94.

8:296-332.

1<REPS,
D., P. MILGROM,J. ROBERTS,y R. WILSON. 1982. "Rational Cooperation in the Finitely Repeated Prisioners' Dilernma." Joumal of Economic
Theory 27:245-52.
.
..,

STEIN,J. 1989. "Cheap Talk and the Fed: A Theory of 1mprecise Policy
Announcements." American Ecol1omic Review 79:32-42.

VICKERS,J. 1986. "Signalling in a Model of Monetary Policy with Incol1lplete Information." Oxford Economic Papers 38:443-55.

LELAND,H., y' [). PYLE.. 1977. "Ihf~rmatior\.~l Asymmetries, Financial


5tructure, and Financial intermedi~tin." Jouma/of Finance 32:371-87.;
MATIHEWS,S. 1989. "VetoTI1reats: Rhetoric in a Bargaining Game." Quarterly Joumal of Econoinics 104:347-69.
'
MILGROM,P.i Y J. ROBERTS.1982., "Limit Pricing and Entry under Incomplete Information: AnEquilibrium Analysis." Economeica40:443-59.
,
MINSER,J, 1974: E)chooling; Experience, and Eamings. New York: Coiumbia
University Press for the NBER.
.. .
.'.
MYERS,S., Y N. MAJLUF. 1984. "Corporate Financing and Investment
Decisions When Firms Have lnformation that Iilvestors Do Not Have;"
Joumal of Financial Economics 13:187-221.
.:-'.

NALEBUFF,B. 1987. "Credible Pretrial Negotiation." Rnnd Joumal of Econo~


mics 18;198-210.
NOLDEKE,G., Y E. VANDAMME. 1990. "5ignalling in a Dynamic Labour
Market." Review of Econ01nic 5tudies 57:1- 23.
ROGOFF,K. 1989. "Reputation, Coordination, and Monetary Policy." En
Modem Business Cycle Theory. R. Barro, ed. Cambridge: Harvard University Press.
5AMUELSON,
W.1984. "Bargaining Under Asyrnmetric Information." conometrica 52:995-1005.'
SOBEL,J. 1985. "A Theory of Credibility." Review of Economic 5tudies 52:557-

'

.,

INDICE ANALTICO

Abreu, D., 98, 104,106

Axelrod, R., 228


Ball, L., 130, 248
BaCon, 0.,169
Barro, R., 54, 112, 210
batalla de los sexos, la:
con informacin incompleta, 153-54
ejemplo de juego con mltiples
equilibrios de Nash, 11-12
ejemplo de equilibrio de Nash con
estrategias mixtas, 12116,40-45, 152

acuerdo, sobre ,mo jugar un juego


posibilidad d;q~e no haya acuerdo,
12n6,59
relacin con el equilibrio de Nash,
9,12
Admati, A., 132
agrupacin, equilibrio de, vase
agrupacin parcial, eq~ilibrio de;
bayesian~ perfecto,' equilibri~;
agrupacin estrategia de
agrupacin, estrategia de, 150~188
vase tambin bayesiano ~rfecto,
equilibrio; agrupacin, equilibrio de
agrupacin parcial, equilibrio de
en el juego de Crawford y Sobel, 28
juegos con parloteo~ 216'
vase tambin bayesiano perfecto,
equilibrio
Akerlo, G., 130
amenazas y promesas, credibilidad de
las, 53, 55, 85, 87, 126
aranceles, juego de los, 73-77
ejercido 2.9,134-35
arbitraje
convencional, 23
contenido informativo de las ofertas,
48
.~ .;-~
ofertas salariales de equilibrio de
Nash en oferta final, 23-27
rbol del juego, 56, 116-17,vase tambin
forma extensiva, juego en
Aumann, R., 7, 32n14, 35n15
Austen-Smith, D., 213, 248

.,'

'".'

batallas, estrategias mixtas en, 31

"\

bayesiano, juego, 143,vase tambin


informacin in-completa, juego con;
informacin incompleta
bayesiano de Nash,'equilibrio
compatibilidad de incentivos, 161 -.
definido, 148-52
ejercicios 3.1-3.8,1690172
ejercicio 4.6,.249
en el principo de revelacin, 165
en la batalla de los sexos con
informacin incompleta, 153-55
en subasta doble, 159
en subastas, 155
limitaciones del, 174
lineal, en subasta, 155-57
lineal, en subasta doble, 159-61
precio nico, en subasta doble, 160
relacin con el equilibrio bayesiano
perfecto, 175-76
simtrico, en subasta, 157-58, 166-67,
157n3,

":'.

NDICE

262 /

NDICE

AN,\J.TICO

/263

ANALT1CO

vase tambin bayesiano, juego;


informacin incompleta;
bayesiano perfecto, equilibrio
bayesiano dinmico, juego, vase
negociacin, juego de; comunicacin
previa, juego con; bayesiano
perfecto, equilibrio; reputacin;
sealizacin, juego de
bayesiano esttico, juego
ejercicios 3.1-3.8,169-172
mecanismo directo;165
representacin en forma normal de,
146-50
subasta, 155-57
subasta doble, 159-64
vase tambin bayesiano de Nash,
equilibrio; principio de revelacin
bayesiano perfecto, equilibrio
construccin informal del, 129
definicin del, 182
definicin del, en juegos con
parloteo, 215
definicin del, en juegos de
sealizacin, 190
ejercicios 4.1, 4.5, 4.6, 4.8, 4.10-4.15,
48,249,252,253,253-56
en el dilema de los presos repetido
finitamentecon informadn
asimtrica, 227-36
en juegos dinmicos con .
informacin completa pero
imperfecta, 177-85
en juegos dinmicos con
informacin incompleta, 175-76
en negociacin sucesiva con
informacin asimtrica, 221-27
refinamientos del, 236-48
vase tambi/l negociacin; juego de
la; conjeturas; parloteo, juegos con;
hbrido; equilibrio; agrupacin ..
parcial, equilibrio de; agrupacin,
equilibrio de; refinamiento;requisitos
1-4; separacin, equilibno de;
sucesivo, equilibrio; sealizacin,
juego de la; perfecto en subjuegos,
equilibrio de Nash

bayesiano perfecto hbrido, equilibrio


ejercicio 4.7, 253
en sealizacin en el mercado de
trabajo, 205-207
bayesiano perfecto con estrategias
mixtas, equilibrio
ejercicio 4.2, 250
bayesiano perfecto de agrupacin,
equilibrio
definicin de, en juegos de
sealizacin, 190
ejercicios 4.3, 4.4, 4.16,250, 251, 256
ejemplo de, 191
en juegos cOh p~r1oteo; 215~16
en un juego de sealizacin de
estructura de capital, 208-10
en un juego de sealizacin en
poltica inonetaria, 210
en sealizacin en el mercado de
trabajo, 189.~201
bayesiano perfecto de separacin,
equilibrio
definicin de~ en juegos de
sealizacin, 190
ejemplo de,192
ejercicio 4.4, 251
en juegos con parloteo, 217
en un juego de sealizacin
en el m~rcado de trabajo, 199-204
en un juego de sealizacin en
estructura de capital, 208
en un juego de sealizacin en
poltica monetaria, 211-12
Becker, G., 130
bisbol, estrategias mixtas en el, 30, 40
Benoit, J.-P., 130
Bertrand, J., 2, 15n1
Bertrand, equilibrio de, 60n4
Bertrand, juegode duopolio de, 21, 23;59
con informacin asimtrica: ejercicio
3.3,169-70
con productos homogneos: ejercicio
1.7,49
en juegos repetidos: ejercicios 2.13,
2.14,136
vease tambin duopolio, juego de

Bhattacharya, S., 130, 248


Brandenburger, A., 47
Brouwer, teorema de punto fijo de, 45
Buchanan, J., 131
Bulow, L 112, 130, 169

colusin
en el duopolio de Coumot
dinmico, 101-106
en modelos dinmicos de duopolio,
105-10.
vase tambin repetido, juego
compatibilidad de incentivos, 164-65
competencia internacional, 70
conjeturas.
en conjuntos de informacin con uno
y ms de un elemento, 179
en equilibrio bayesiano
perfecto,181,185
en juegos bayesianos estticos, 148
en refinamientos del equilibrio
bayesiano perfecto, 236-47
vase tambin informacin imperfecta;
informacin incompleta
conjunto deinformacin
con ms de un elemento,l22, 129,
176,178,189
definido, con ejemplos, 222-23
en la definicin deinformacin
imperfectar.121
en la definicin de informacin
perfecta, 121
vase tambin conjeturas; nodo de
decisin; trayectoria de equilibrio;
informacin imperfecta; informacin
incompleta
continuacin, juego de, 176, 235
ejercicios 4.12, 4.14, 254, 256
cooperacin
en el dilema de los presos repetido
infinitainnte con informacin
asimtrica, 227-36
en el modelo de salarios de
eficiencia,l07-108
en juegos repetidos infinitamente,

89-90,101-102,228n6
en juegos repetidos finilamente con
informacin completa, 82-86
vase tambin repetido, juego
correlacionado, equilibrio, 35n 15
correspondencia de mejor respuest~
como funcin de mejor respuesl~,
42-43
definida, 36
de n jug~dores, 47
intersecciones de, 39, 41
representaciones grfic~s de, 35, 38,
42-44
Cournot, A., 2, 11
Coumot, juego de duopoli%ligopolio
de
con informacin asimtrica, 143,
144-146,147,151
con informacin complet~, 15-21,
59-62,75-76,145-146
ejercicio 3.2, 169
ejercicios 1.4-1.6, 48-49
ejercicio 2.15, 176
en juegos repetidos, 101-106
vase tambin juego de duopolio
Cournot, equilibrio de, 60n4
Cr~mton, P., 248
Crawford, V., 177, 214,253
credibilidad en los juegos dinmicos, 53
vase tambin amenazas y promesas
Criterio intuitivo, vase requisito 6 de
sealizacin

Chatterjee, K., 159


Cho, l.-K., 177, 241, 243, 249

lJ~sgupta, P. 48
decisin, teora de In, uni- frenle ~
multi-personal, 61
Deere, D., 169
Diamond, D., 54, 73
dilema de los presos, el
cooperacin en, 89-91, 227-236
equilibrio de Nash en, 10

;,.

26-1 / NDICE

estrategia dd disparador en, 90


estrategia del Talin en, 228
estrategias dominadas en, -1
ganancia de reserva en,81-82
repetido finilamente, 80-82
repdido finilamente con informacin
asimtrica, 227-36
repetido infinitamente, 87-90, 90.95
representacin
de, 120

en forma extensiva

representacin en forma normal de,


213
dilema del samaritano, 131
dinmico, juego
con informacin completa pero
imperfecta, 70, 120-121
con informacin completa y perfecta,
55

con informacin incompleta, 176


estrategia en, 91,117
vase tamu" induccin hacia atTs;
fDrma extensiva, juego en; bayesiano
perfcto, quilibrio; repetido juego;
perfCto en subjuegos, equilibrio de
Nash
disparad(r (/rigger), estrategia del, 90,
95,99, 103,106, vase tambin
repetido, juego
dmninada, estrategia, vase
estriclalllt.~nte donnada, estrategia
duopolio, juego de,vase Bertrand,
jUgn de duo polio de; Coumot, juego
de duopoli%ligopolio
de;
supervisin imperfecta, juegos con;
Stackelberg, juego de duopolio de;
variables de estado, juego con
Dybvig, 1'.5-1,73, 208

ejid'ls, el prublema de los, 27-28


elilninacin

NDICE

ANALTICO

iterativa de estrategias

estrictamente dominadas; 4-8, 13-15


en juegos de aligo polio de Coumot,
19.21

vase tamu" estrictamente


dominada, estrategia

equilibrio, vase bayesiano de Nash,


equilibrio; bayesiano perfecto,
equilibrio; de agrupacin, equilibrio;
de separacin, equilibrio; hlbrido,
equilibrio; lineal, equilibrio; Nash,
equilibrio de; perfecto en subjuegos,
equilibrio de Nash; agrupacin
parcial, equilibrio de
espado de estrategias
ejercicios 3.2,3.3,169
en equilibrio lineal, 155-56, 160
en el juego de duopolio de Bertrand,
21
"
en el juego de duo polio de
Coumot,15
en j~egos con informacin completa,
3
en juegos dinmicos con informacin
completa, 118
en juegos estticos con informacin
completa, 92
en juegos estticos con informacin
incompleta; 150-51
en subastas, 155
vase tambin forma extensiva, juego
en; forma normal, juego en
espacio de tipos
en el juego de Coumot cdn
infomlacin asinltrica, 147
en juegos bayesianos estticos, 147-48
en la batalla de los sexos con
informacin incompleta, 153
Espinosa, M., 67,129,137
esttico, juego
con informacin completa, 1-2
con informacin incompleta, 143
vase tambi" ba yesiano de
Nash, equilibrio; Nash, equilibrio de;
fonna normal, juego en; etapa, juego
de

estrategia, vase conjetura; el palo y la


zanahoria, estrategia de; equilibrio;
mixta, estrategia; pura, estrategia;
estrictamente dominada, estrategia;
disparador, estrategia de
estrictamente dominada, estrategia

definicin de, 5
vase tambin eliminacin iterativa de
estrategias estrictamente dominadas
etapa, juego de
con mltiples equilibrios de Nash,
82-87
de decisiones sucesivas, 109, 111
en el teorema de Friedman, 92
en juegos repetidos infinitamente,
91-92
en juegos repetidos infinitamente
informacin completa, 82

86,
con

en juegosrep~tid()s io'!fulitan,ere con


informacin incomple,\a,;2,27
vase tambin repetido, ju~go
expectativas ..
en un juego repetido de poltica
monetaria, 112-115
vase tambin expectativas racionales
expectativas racionales, 3

ANALTICO

265 .

ejercicio 4.1,249
relacin con juegos en forma
extensiva, 118-19
transcripcin del enunciado informal
de un problema a un, 15-16,21-22,
153, 155
vase tambin forma extensiva, juego
en
Friedrnan, L 15n1, 54, 96,101
Friedman, teorema de, 88
demostracin del, 97, 99-101
enunciado del, 96
frontera, de Pareto, 87 .
Fudenberg, D., 98, 181n3
funcin de mejor respuesta, 35-37,
como correspondencia de mejor
respuesta, 42-43
como estrategia, 125
en el juego de duopolio de Coumot,
17-21,39
en el juego delos aranceles,. 75
funciones de ganancias, en jue~s"

factor de pescuento, 66, 16n7

bayesianos estticos"146,1.49
en juegos estticos con informacin
completa, 4

efecto de valores bajos del, 99,


102-106,
en juegos repetidos infinitamente,

93,

97

Farber, H., 2, 23
farol, en pquer, 30
Farrell, J., 86,120,213,248
Fenlndez,Fl,129
finito,juego: 34,45, 181n1. Vas~ tambin
repetido finita mente, juego
forma extensiva, juego en, 4, 115-117
ejercicios 2.21, 2.22, 138-39
relacin con la forma normal,119
vase tambin nodo de decisin;
conjunto de info,rmacin; forma
nomlal, juego en
forma normal, juego en:
definicin de, par,! ti!' juego con
informacin completa, 3, 4
definicin de, para un juego
esttico con informacin incompleta,
146-150
ejercicios 2.21,2.22, 138-39

ganancia factible, 95
ganancia medio, 96
ganancia de reserva,
97, 98,.
.
ganancias, informacin del dominio~"
pblico sob;e as, 117,143
".
."

determinados por estrategias, 2


esperados a partir de
estrategias mixtas, 36:
incertidumbre sobre los, 143, 146-147
vase tambin ganancia factible;
ganancia meclia; ganancia de reserva
Gibbons, El,48, 213, 248
Glazer, J., 129
Gordon, D., 54, 112
granada, juego de la
"
amenazas no crelbles en el, 53-54
como juego con informacin
completa y perfecta, 55
ejercicio 2.21, 138-39

,(;"

-266

NDICE ANALTICO

NDICE ANALTICO

vase tambin amenazas y promesas


Creen, E.,106

Hall, R., 159, 171


Hardin, C"V., 27
Harsanyi, J., 31, 148, 152, 176
Hart, O., 168
hfbrida, estrategia, 188
morida, equilibrio., vase bayesiana
perfecta, equilibrio.; hfbrida,
estrategia
hiptesis de racianalidad; en induccin
hacia atrs, 57-59
Hatelling, H., 50
Huizinga, H., 135
Hume, D., 2, 27

ignarancia de jugadas anteriares, izO-21


vase tambin infarmacin imperfecta
induccin hacia atrs
en equilibrio. bayesiana perfecta, 185
en equilibrio. de Nashperfecta en
subjuegas, 124, 129
en juegas dinmicas can infarmacin
campleta y perfecta, 56
en juegas dinmicas can infarmacin
incampleta, ejercicio. 3.8; 171-72
hiptesis subyacentes de, 57-59
vase tambin resultada par induccin
hacia atrs
induccin hacia adelante, 243
infarmacin
en teara de la decisin uni- frente a
multipersanal,61
vase tambin infarmacin asimtrica;
infarmacin campleta; infarmacin
imperfecta; infarmacin incampleta;
infarmacin perfecta; infarmacin
privada
infarmacin asimtrica
ejercicias 3.2, 3.3, 169
ejercicio. 4.12, 254
en el dilema de las presas repetida
finitamente,227,236

dudas sabre la racianalidad

en el madela de duapalia de
Caumat, 144-146
en el madela de negaciacin
sucesiva, :221-27
vase tambin infarmacin incampleta;
infarmacin privada
infarmacin campleta, 1, 143, vase
tambin informacin incampleta
informacin campleta y perfecta, juega
can, 55, vase tambin induccin hacia
atrs; repetida, juega; perfecta en ~
subjuegas, equilibrio. d Nash
infarmacin campleta.pero irriperfda,
juega can, 70, 120-121 .
en das etapas, 92, 117 .
vase tainbin infarmaan
impeTf~da; bayesiand prfeCta,
.equillbda; repetida, juega; perfecta
en subjuegas, eijilibria de Nash
infarmacin del daminio pblica, 7
en el juega de dopalia de Caumat
con informacin asimtrica, 144
en juegas can infrmati6n corhpleta
y perfcta; 11i, 143
sabre la racianalidad

de las

jugadares, 7, 56-59
sabre,las fvncianes de ganancias de
las juga49'res, 1
infarmacin il'iperfecta .
definida, 53
en el juega de las aranceles, 73-77
en el juego de las pnicas bancarias,
71-73
en el juega de tameo, 77-80
en juegas repetidas finitamente, 80'87
en juegas repetidas infinitamente,
87-105
juegas dinmicas con; 10
vase tambin infamacin completa

Kennan, J., 248


Klemperer, P., 169
K!vfRW (Kreps, Milgram, Raberts,
Wilsan) madela de, 229-34

152-55
en las juegas de sealizacin,
185-213,236-47
en un juega esttica, 146-150
vase tambin infarmacin asimtrica;

Kahlberg, E., 243


Kreps, D., 48, 115n117, 130, 177, 180,

bayesiana de Nash, equilibrid;


infarmacin campleta; infarmacin
imperfecta; bayesiana perfecta,
equilibrio.; infarmacin privada;
reputacin; principia de revelacin
infarmacin incampleta, juega can, 143,
176, vase tambin bayesiana, juega;
bayesiana de Nash, equilibrio.;
parlatea, juegas con; infarmacin
incampleta; bayesiana perfecta,
equilibrio.; sealizacin, juega de
infarmacin perfecta
definida, 53, 121
juega dinmico can, 54
vase tambin induccin hacia atrs;
dinmica can infarmacin campleta
y perfecta, juega; Infarmacin
imperfecta; perfecta en su bjuegas,
equilibrio. de Nash
infarmacin privada
diseando. juegas can, 164
ejercicias 3.6-3.8, 171
en subastas, 155-58
en subastas dables, 159-64
vase tambin infarmacin
asimtrica; bayesiana de Nash,
equilibrio.; infarmacin incompleta;
bayesiana perfecta, equilibrio.;
principia de revelacin

;.

Jacklin, C. 130
jugadares racianales, 4-7

perfecta en subjuegas, equilibrio. d


Nash
infarmacin incampleta

Kakutani, tearema de, 45, 47

53nl
en juegas can parla tea, 213-21
en la reinterpretacin del equilibrio.
de Nash can estrategias mixtas, 40,

pera imperfecta, juego can;


informacin incompleta; canjunta de
infarmacin; bayesiana perfecta,
equilibrio.; infarmacin perfecta/o

cama,

I 267

Kakutani, S., 45

228,241,243
KrisllOa, V., 130

Lazear, E., 54, 77,130,134,159,171


Leland, H., 248
Leontief, W., 54,55,62

McAfee, P., 169


McMillan, L 130, 169
Majluf, N., 177, 186,208
Maskin, E., 48, 86, 98, 130
matriz binaria, 3
Matthews, S., 213, 248
mecanismo. directa;-165
campatibilidad de incentivas, 165
decir la verdad en, 166-68
para subasta dable, 166
vase tambin principia de revelacin
mensaje daminada, vase requisita 5
de sealizacin
mensaje daminado en equilibrio,vase
requisita 6 de sealizacin
Mertens, J.-F., 243
Milgrom, P., 177, 228, 241,248
Mincer, J., 193 .
mixta, estrategia
definicin de, 32
ejercicjo 2.23, 139
ejercicio. 3.5, 170-71
ejercicio. 4.2,250
ejercicias 1.9-1.14, 50-51
reinterpretacin de, 40
vase tambin Nash, equilibrio. de;
Nash, tearema de; pura, estrategia;
estrategia
manedas, juega de las (matcJi/g pe,mies), 29
carrespandencia de mejar respuesta

2b:i

1 NDICE

NDICE

ANALTICO

en el, 35
equilibrio de Nash con estrategias
mixtas en el, 37-39
eSlra legias mixtas en el, 39
ganan.:ias esperadas en el, 33
siendo ms listo en el, 30
Mont;omery, J., 51
Myers, S., 177, 186,208
l'vIyerson, R., 163, 164, 166, 169

Nash, J., 2,11,45


Nash, equilibrio de
con amenazas o promesas
increbles, 53, 126-129
con estrategias mixtas, 10n4, 37-45
definicin de, con estrategias
mixtas, 37
definicin de, con estrategias puras, 8
ejemplos de, 9-10
ejercicio 2.21, 138-39
ejercicios 1.4-1.8,48-49
en el juego de arbitraje de oferta final,
23-26
en el juego de duopolio de.
Berlrand, 21
en el juego de duopolio de
Cmrnot, 16-19
en el juego de la moneda, 37-39
en el juego de los pnicos bancarios,
72-73
en juegos en dos etapas cen
informacin completa pero
imperfecta, 70-71, 72,74,76,78-79
en juegos repetidos en dos etapas, 81,
83-8~
en juegos repetidos infinitamente,
90-91,99,102,109-111,114-15
existencia de, en juegos finitos, 33-45
fundamentacin del, 8-9
limitaciones del, 177
mlliples, 11,

relacin con eliminacin


iterativa de estrategias estrictamente
dominadas, 10-11, 12-15,19-21
vase tambi" bayesiano de Nash,
equilibrio; convenio; eliminacin
iterativa de estrategias estrictamente
dominadas; bayesiano perfecto,
equilibrio; perfecto en subjuegos,
equilibrio de Nash
Nash, teorema de, 33, 45, 124
demostracin del, 45-47
extensin del, 47
negociacin con horizonte finito, juego de
la
con informacin asimtrica, 221-27
ejercicio 2.19,138
ejercicios 4.10-4.14, 253-56
resultado por induccin hacia atrs
del,66-68
negociacin con horiionte infinito, juego
dela
ejercicios 2.3, 2.20, 131, 138
resultado por induccin hacia
atrs de Rubinstein, 68-69
negociacin de Rubinstein, juego de la,
54,55,66,88,117
ejercicios 2.3, 2.19, 2.20, 131, 138
nio mimado, teorema del, 130
nodo de decisin
en juegos en forma extensiva, 117,
119-21. Vase tambin conjeturas;
informacin imperfecta; conjunto de
informacin; nodo terminal
nodo terminal
en juegos en forma extensiva, 117
en subjuegos, 125n19
vase tambin nodo de decisin; forma
extensiva, juego en
Noldeke, G., 194

Osbome, M., 130

na existencia con estra tegias puras,


29

reinterpretacin con estrategias


mixtas, 40, 152-155

palo y la zanahoria, estrategia del, 105,


106

pnicos bancarios, juego de los, 70, 71-73


ejercicio 2.22, 139
parloteo, juego con (cheap-talk game),177,
213-21
desarrollo temporal de, 215
ejercicios 4.8,4.9,4.15,253,256
equilbrio de agrupacin parcial en,
213-21,
equilibrio bayesiano perfecto en, 177,
215
vase tambin bayesiano, juego;
bayesiano perfecto, lC'luilibrio;
sealzacin, juego de.
Pearce, D., 321114,16.
penalizacin, 87
desencadenamiento
accidental de
una, 106
ms fuerte creble, 98, 104-105
vase tambin palo y la zanahoria,
estrategia del; supervisin
imperfecta, juego~~on; disparador,
estrategia pe!
.,
perfecto en subjuegos, equilibrio de
Nash, 57, 89:91, 99, 124-126
definicin de, 94;
ejercicios 2.10-2.13, 2.19-2.23,
135-36, 138-39
vase tambin induccin hacia atrs,
resultado por induccin hacia atrs;
Nash, equilibrio de; resultadoperfecto
en subjuegos; bayesiano perfecto,
equilibrio
Perry, M., 132
pquer, 30
Porter, R., 106
prediccin
en teora de juegos, 8, 9
equilibrio de Nash como, 7, 8
por induccin hacia atrs, 56-59
Prendergast, c., 133
principio de revelacin
en el diseo de subastas, 164-165;
enunciado.fomlal del, 166
vase tambin mecanismo directo,
compatibildad de incentivos;
informacin privada

ANALTICO

1269

probabilidad
de que se acabe un juego repetido, 90
distribucin, 24nll
en estrategias mixtas, 31
funcin de densidad, 23n10
vase tambin regla de Bayes conjetura
problema de teora de juegos, 4
punto fijo, teorema del, 45-47
pura, estrategia:
definicin de, 93, 117
ejercicio 2.18, 138
ejercicios 3.1, 3.3,169-70
en juegos bayesianos estticos, 151-52
en juegos de sealzacin, 188
en juegos dinmicos con informacin
completa, 93
en juegos repetidos con informacin
completa, 93
vase tambin estrategia; mixta,

"\

estrategia
Pyle, D., 248

racionaldad.sucesiva,
179.
refinamiento
del equilibrio bayesianoperfecto,
177,194,199,202,236,248
del equilibrio de Nash, 84
ejercicio 4.16, 256
regla de Bayes, 149112,180,204n6
renegociacin, 86-86, 11 ...
repetido finitamente, juego:
con informacin completa, 80-87
definicin, 82
dilema de los presos con iriformacin
incompleta, 227-36
renegociacin en un, 86-87
repetido infinitamente, juego: 87-101
definido, 92
estrategia del disparador en, 90
estrategia en, 93
ganancias en 95
subjuego en, 94
vase tambin ganancia media
cooperacin; colusin; factor de
descuento; ganancia factible;

.....
't.a

te::.

NDICE

270 /

';,

.L/

NDICE

tradicin orat teorema de; ganancia


de reserva; perfecto en subjuegos,
equilibrio de Nash; disparador,
estrategia del
representacin de un juego
representacin en forma
extensiva, 115-116
representacin en forma normat 34,
146-150
vase tambin forma extensiva, juego
en; forma normal, juego en
reputacin
comparacin con el teorema
de tradicin oral, 228-30
en el dilema de los presos repetido
finitamente, 227-36
vase tambin informacin incompleta;
repetido finitamente, juego; repetido
infinitamente, juego
requisito 5 de sealizacin (para
refinamiento del equilibrio bayesiano
perfecto), 240, 243, 245-46
ejercicio 4.16, 256
requisito 5, para refinamiento del
equilibrio bayesiano perfecto, 239
requisito 6 de sealizacin (para
refinamiento del equilibrio ba yesiano
perfecto), 243-44, 246-47
ejercicio 4.16,256
requisitos 1, 2R, 2E,3 de sealizacin
(para equilibrio bayesiano perfecto
en juegos de sealizacin), 188-90,
237n6
aplicaciones de, 196, 198-99, 201-204
en juegos con parloteo, 215
requisitos 1-4, para equilibrio bayesiano
perfecto, 178-85, 188-90, 199, 225-26,
236
resultado, comparado con equilibrio, 126
vase tambin resultado por induccin
hacia atrs; resultado perfecto en
subjuegos
resultado perfecto en subjuegos
ejercicios 2.6-2.9, 133-134
en el juego de etapa de poltica
monetaria, 113

~.)

ANM.II(,()

/2'71

ANALTICO

en el juego de los pnicos bancarios, 72


en el juego de los aranceles, 76
en el juego de salarios de eficiencia, 108
en juegos dinmicos con informacin
completa pero imperfecta, 71
en juegos repetidos en dos etapas, 82,
83-84
relacin con el equilibrio de Nash
perfecto en subjuegos, 126-127
vase tambin resultado por
induccin hacia atrs; perfecto en
subjuegos, equilibrio de Nash
resultado por induccin hacia atrs, 54
ejercicios 2.1-2.5, 130-132
en el juego de duopolio de
Stackelberg, 60
en el juego de negociacin con tres
periodos, 67
en el juego de salarios y nivel de
empleo,.65
en juegos de etapa, 83n 113
en juegos de negociacin con
horizonte infinito, 68-69
en juegos dinmicos con informacin
perfecta y completa, 56
vase tambin equilibrio de Nash
pi-fecto en subjuegos
Rhee, c., 65, 129, 137
Roberts, L 177, 228, 241, 248
Rogoff, K, 112, 130, 248
Rosen, S., 54, 77, 130
Rotemberg, J., 106, 136
Rubinstein, A., 130
Rubinstein, juego de negociacin de la,
54,55,66,88,117
ejercicios 2.3, 2.19, 2.20, 131, 138

salarios de eficiencia, juego de los,


106-112
ejercicio 2.17, 136
salarios y nivel de empleo en una
empresa con fuente implantacin
sindical, 62
con muchas empresas, ejercicio 2.7,
133-34

en un juego repetido, ejercicio 2.16,


137
Saloner, G., 106, 136
Samuelson, W., 159,254
Sappington, D., 169
Satterthwaite, M., 163
Scheinkman J., 48
secuencial, equilibrio, 181n1, vase
tambin bayesiano perfecto, equilibrio
Selten, R, 94,124
sealizacin, juegos de: 176-77, 181
definicin de, 185-92
ejercicios 4.3-4.7, 250-53
juego de estructura de capital,
207-210
juego de mercado de trabajo, 192-207
juego de poltica monetaria, 210-213
refinamientos del equilibrio
bayesiano perfecto en, 239-248
vase tambin bayesiano, juego;
comunicacin previa, juego con;
bayesiano perfecto, equilibrio
separacin, equilibrio de, vase
bayesiano perfecto, equilibrio
Shaked, A., 68
Shapiro, c., 54, 107
Sobet J., 66, 177, 214, 222, 248, 249, 253
Spence, A.M., 177, 186, 192, 193-95
Stacchetti, E. 106
Stackelberg, H. van, 15nl
Stackelberg, equilibrio de, 60, 61n4
Stackelberg, juego de duopolio de, 54,
55,59-62,117
ejercicio 2.6, 133
vase tambin duopolio, juego de
Staiger, D., 129
Stein, L 213, 248
Stiglitz, J., 54,107
subasta
de sobre cerrado, 155-159
doble, 159-164
reinterpretacin en el mercado de
trabajo: ejercicio 3.8,171-72
subjuego
definicin en juegos en forma
extensiva, 123-24
definicin en juegos repetidos finita e

infinitamente, 93
en el dilema de los presos rel,elicio
infinitamente, 94
en el duopolio de Cournot repetid"
infinitamente, 105
en el juego de poltica mone!"ria, n5
en el modelo de salarios de eficiencia,
111

en el teorema de tradicin oral, 101


vase tambin induccin hacia atd,
continuacin, juego de; perfecto en
subjuegos, equilibrio de Nash
supervisin imperfecta, juegos can,
105-106,106-112
Sutton,

J., 68

Takahashi, L, 66, 177, 222, 254


Talin (Tit Jor Tat), estrategia del, en
el dilema de los presos repetido,
228-32
tipo
en el juego de sealizacin de
estnlclura de capital, 186
en el juego de sealizacin de poltica
monetaria, 186
en el juego de sealizacin en el
mercado de trabajo, 186
en juegos bayesianos estticos, 147,
148
en juegos con parloteo, 214
en juegos de sealizacin, 185
en subastas, 155
vase tambin informacin incompleta
Tirole, J., x, 130, 181n3
torneo, 70, 77-80
ejercicio 2.8,134
Tracy, L 248
tradicin oral, teorema de, 5'1, 88nl6
vase tambin Friedman, teorema ele
trayectoria de equilibrio
definicin de, 210-13
conjeturas en conjuntos de
informacin en la, 180
conjeturas en conjuntos ele
informacin fuera de la, 1S2
vase tambirl bayesiano perfecto,

'-"#;"
;-~;:C"l

equilibrio; refinamiento; perfecto en


subjuegos, equilibrio de Nash

valor prente,

89

Van Damme, E., 194


variables de estado, juego con, 105-106
Vicker" J., 177, 186,210

Wilson, R., 115n17, 130, 177, 180, 228, 248

Ydlen, J., 130

Zender,

Facultad

r., 208

U 1'1~,il S IVI
de Cielic;;s EClr1micils

DCANi\TO

I ,fBRO

l.

CO;\lPR,\DO

SE"'JESTRE

2006 1

(;~