Está en la página 1de 186

This is page i

Printer: Opaque this


LA MICRO DE CUARTO
Antonio J. Morales
UMA y LINEEX
ii
ABSTRACT
This is page iii
Printer: Opaque this
Contents
References ix
I Los Fundamentos x
1 La Teora de Eleccin en Condiciones de Incertidumbre 1
1.1 Introduccin: Eleccin con condiciones de certidumbre. . . . 1
1.1.1 Conjunto de eleccin C . . . . . . . . . . . . . . . . 2
1.1.2 Conjunto asequible A . . . . . . . . . . . . . . . . . 2
1.1.3 Hiptesis de Comportamiento . . . . . . . . . . . . . 3
1.1.4 Las preferencias: axiomas. . . . . . . . . . . . . . . . 3
1.1.5 Existencia de la funcin de utilidad . . . . . . . . . . 4
1.2 La funcin de utilidad VNM . . . . . . . . . . . . . . . . . . 5
1.2.1 Conjunto de eleccin. . . . . . . . . . . . . . . . . . 5
1.2.2 De dnde salen las probabilidades? . . . . . . . . . 6
1.2.3 Las preferencias: axiomas . . . . . . . . . . . . . . . 6
1.2.4 Existencia constructiva de la funcin de utilidad VNM 8
1.2.5 Propiedades de la funcin de utilidad VNM . . . . . 10
1.3 Riesgo y Aversin al Riesgo . . . . . . . . . . . . . . . . . . 12
1.3.1 Actitudes frente al Riesgo . . . . . . . . . . . . . . . 12
1.3.2 Equivalente Cierto y Prima de Riesgo . . . . . . . . 14
1.3.3 Cuanticacin de la Aversin al Riesgo . . . . . . . 15
1.4 Aplicaciones I: Un Modelo Bsico de Seleccin de Cartera . 18
1.4.1 La diversicacin de la cartera ptima . . . . . . . . 19
iv Contents
1.4.2 La eleccin entre un activo seguro y un activo
arriesgado. . . . . . . . . . . . . . . . . . . . . . . . 21
1.5 Aplicaciones II: Un Modelo Bsico de Demanda de Seguros 24
1.6 Apndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.6.1 Kahneman and Tversky (1979): Prospect Theory . . 27
2 Juegos con Informacin Perfecta 31
2.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Representacin estratgica de un juego . . . . . . . . . . . . 32
2.3 Representacin en forma extensiva de un juego . . . . . . . 34
2.4 Conceptos de solucin. Nociones generales. . . . . . . . . . . 36
2.5 Conceptos de solucin para juegos en forma estratgica . . . 37
2.5.1 Dominancia iterada . . . . . . . . . . . . . . . . . . 37
2.5.2 Estrategias racionalizables . . . . . . . . . . . . . . . 39
2.5.3 Equilibrio de Nash . . . . . . . . . . . . . . . . . . . 40
2.6 Estrategias mixtas . . . . . . . . . . . . . . . . . . . . . . . 43
2.6.1 Sobre la interpretacin de las estrategias mixtas . . 46
2.7 Conceptos de solucin para juegos en forma extensiva . . . 47
2.7.1 Equilibrio de Nash Perfecto en Subjuegos . . . . . . 50
2.7.2 Estrategias en juegos en forma extensiva . . . . . . . 52
2.7.3 Lo importante de un equilibrio es lo que no se ve . . 52
3 Juegos con Informacin Imperfecta 55
3.1 Primeros ejemplos . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 La Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.1 El Show de Monty Hall . . . . . . . . . . . . . . . . 58
3.2.2 La Baraja Espaola . . . . . . . . . . . . . . . . . . 60
3.3 Creencias Consistentes . . . . . . . . . . . . . . . . . . . . . 62
3.4 Equilibrio Secuencial . . . . . . . . . . . . . . . . . . . . . . 65
3.5 Apndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.1 Ojo con la circularidad . . . . . . . . . . . . . . . . . 71
3.5.2 La lgica de tantos conceptos de solucin distintos . 72
4 Juegos con Informacin Incompleta 75
4.1 Representacin en forma estratgica de un juego bayesiano 76
4.1.1 Aplicacin al Duopolio de Cournot con Informacin
Incompleta: . . . . . . . . . . . . . . . . . . . . . . . 77
4.1.2 Timing del juego: . . . . . . . . . . . . . . . . . . . . 79
4.1.3 Denicin de Equilibrio Bayesiano . . . . . . . . . . 79
4.2 Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.2.1 El Duopolio de Cournot con Informacin Incompleta 80
4.2.2 El Teorema de Puricacin de Harsanyi . . . . . . . 82
4.3 Introduccin a las Subastas . . . . . . . . . . . . . . . . . . 85
4.4 Equilibrio Bayesiano Perfecto. Breve Introduccin . . . . . 90
Contents v
II Economa de la Informacin 92
5 Seleccin Adversa, Sealizacin y Screening 97
5.1 Seleccin Adversa: El Modelo de Akerlof . . . . . . . . . . . 97
5.1.1 Formulacin Tradicional . . . . . . . . . . . . . . . . 97
5.1.2 Formulacin con la Teora de Juegos . . . . . . . . . 100
5.2 Sealizacin: El Modelo de Spence . . . . . . . . . . . . . . 105
5.2.1 Juegos de Sealizacin. . . . . . . . . . . . . . . . . 105
5.2.2 El Modelo de Spence . . . . . . . . . . . . . . . . . . 106
5.3 Racionamiento del Crdito: El Modelo de Stiglitz y Weiss . 115
5.4 Screening: El Modelo de Rothschild y Stiglitz . . . . . . . . 122
5.4.1 Equilibrios Pooling . . . . . . . . . . . . . . . . . . . 125
5.4.2 Equilibrios separadores . . . . . . . . . . . . . . . . 126
5.4.3 Implicaciones del modelo . . . . . . . . . . . . . . . 127
6 Riesgo Moral e Incentivos 129
6.1 Modelo bsico . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.2 El contrato ptimo cuando el esfuerzo es observable. . . . . 136
6.2.1 A modo de conclusin . . . . . . . . . . . . . . . . . 139
6.3 El contrato ptimo cuando el esfuerzo no es observable. . . 140
6.3.1 Agente neutral al riesgo. . . . . . . . . . . . . . . . . 141
6.3.2 Agente averso al riesgo . . . . . . . . . . . . . . . . . 143
6.4 Principal-agente con n=2 . . . . . . . . . . . . . . . . . . . 148
III El Diseo de Mecanismos 152
7 Economa del Bienestar 153
7.1 Lmites del Conocimiento y de la Accin . . . . . . . . . . . 153
7.2 El Teorema de Imposibilidad de Arrow. La demostracin de
John Geanakoplos . . . . . . . . . . . . . . . . . . . . . . . 155
7.3 Despus de Arrow hay vida: Funciones de Bienestar Social
y Funciones de Eleccin Social . . . . . . . . . . . . . . . . 157
7.4 El Teorema de Gibbard-Satterhwaite . . . . . . . . . . . . . 158
8 El Principio de Revelacin y el Diseo de Mecanismos 161
8.1 Introduccin. Turning Game Theory on its Head . . . . . . 161
8.2 El Principio de Revelacin de Myerson (1979) . . . . . . . . 162
8.3 Provisin Eciente de Bienes Pblicos. El Mecanismo de
Clarke-Groves (1977) . . . . . . . . . . . . . . . . . . . . . . 165
8.4 Juegos Bblicos: El dilema de Salomn (950 bc) . . . . . . . 167
8.5 Maskin (1977) by Maskin (2007) . . . . . . . . . . . . . . . 169
8.6 El Principal como ser egosta . . . . . . . . . . . . . . . . . 172
8.6.1 El intercambio bilateral . . . . . . . . . . . . . . . . 172
8.6.2 El diseo ptimo de Subastas . . . . . . . . . . . . . 173
vi Contents
8.6.3 El Mecanismo de Becker, DeGroot and Marshack . . 174
Contents vii
Una nota sobre la bibliografa
La bibliografa recomendada para la asignatura Microeconoma
Avanzada II es la siguiente:
Tema 1. Eleccin bajo incertidumbre
Utilidad Esperada. Captulo 4 de [7]
Riesgo y Aversin al Riesgo. Pregunta 3.2 de [6]
Modelo Bsico de Cartera. Pregunta 3.3 de [6]
Modelo Bsico de Seguros. Pregunta 18.1 de [6]
Tema 2. Juegos con Informacin Perfecta
Captulos 1 y 2 de [4]
Captulos 1, 2 y 4 de [9]
Tema 3. Juegos con Informacin Imperfecta
Captulos 11 y 12 de [8]
Captulo 4 de [9]
Tema 4. Juegos con Informacin Incompleta
Captulo 3 de [4]
Captulo 12 de [8]
Tema 5. Seleccin Adversa, Sealizacin y Autoseleccin
Modelo de Akerlof. Captulo 17 de [6]
Modelo de Spence. Pregunta 4.2.B de [4]
Modelo de Stiglitz-Weiss. Preguntas 5.3 y 5.4 de [2]
Modelo de Rothschild-Stiglitz. Pregunta 7.2 de [9]
Tema 6. Riesgo Moral e Incentivos
Captulo 16 de [6]
Tema 7. Economa del Bienestar
El Teorema de Imposibilidad de Arrow. La introduccin de [3]
La demostracin de John Geanakoplos. La primera prueba de [3]
Funciones de Bienestar Social y Funciones de Eleccin Social.
Captulo 15 de [5]
El Teorema de Gibbard-Satterhwaite. Pregunta 15.1 de [5]
Tema 8. El Principio de Revelacin y el Diseo de Mecanismos
El Principio de Revelacin y el Diseo de Mecanismos. Pregunta 3.3
de [4]
El Mecanismo de Clarke-Groves. Pregunta 18.3 de [6]
El Teorema de Maskin. Ejemplo 186.3 de [8] y Pregunta 15.3 de [5]
El Diseo ptimo de Subastas. Pregunta 11.7 de [1]
viii Contents
This is page ix
Printer: Opaque this
References
[1] Binmore, Kenneth (1994). Teora de Juegos, McGraw-Hill.
[2] Freixas, Xavier y Jean-Charles Rochet (1999). Economa Bancaria,
Antoni Bosch Ed.
[3] Geanakoplos, John (2005) "Three Brief Proofs of Arrows Impossibility
Theorem", Economic Theory 26(1), pp. 211-215.
[4] Gibbons, Robert (1992). Un Primer Curso de Teora de Juegos, Antoni
Bosch Ed.
[5] Humphreys, Macartan (2005). Game Theory Notes, mimeo.
[6] Kreps, David, (1994). Curso de Teora Microeconmica, McGraw-Hill.
[7] Jehle, Georey A. y Philip Reny (1998). Advanced Microeconomic
Theory, Addison-Wesley.
[8] Osborne, Martin J. y Ariel Rubinstein (1994). A Course in Game
Theory, MIT Press.
[9] Vega-Redondo, Fernando (2000). Economa y Juegos, Antoni Bosch ed.
Parte I
Los Fundamentos
x
xi
Este ttulo se lo debo a Karlos Arguiano...
xii
This is page 1
Printer: Opaque this
1
La Teora de Eleccin en Condiciones
de Incertidumbre
El objetivo de este tema es extender la teora de la eleccin que visteis
el curso pasado al caso en el que no existe una relacin uno a uno entre
acciones y resultados. Una vez que nos centremos en resultados monetarios,
podremos hablar de riesgo y actitudes frente al riesgo, y eso nos dar pie a
analizar la seleccin ptima de carteras y la demanda de seguros.
1.1 Introduccin: Eleccin con condiciones de
certidumbre.
Toda teora de la eleccin que se precie tiene tres patas:
1. Conjunto de eleccin.
2. Conjunto de decisin.
3. Hiptesis de comportamiento.
En tercero visteis la teora de eleccin en condiciones de certidumbre.
Repasmosla para que podis ver el paralelismo entre tercero y cuarto.
1. Conjunto de eleccin: Todas las cestas de consumo imaginables.
2. Conjunto de decisin: De las imaginables, las cestas asequibles
(circunstancias personales).
3. Hiptesis de comportamiento: El decision maker elige lo mejor
2 1. La Teora de Eleccin en Condiciones de Incertidumbre
1.1.1 Conjunto de eleccin C
Supongamos que en la economa hay : bienes. Entonces los objetos de
eleccin son todas las cestas de consumo imaginables compuestas por los
: bienes. Matemticamente hablando, una cesta de consumo es un vector
r(r
1
, ..., r
n
) donde r
I
es la cantidad de bien i.Por tanto, el conjunto de
eleccin C es 1
n
+
.
Las propiedades relevantes del conjunto de eleccin son las siguientes:
1. O , =C_ 1
n
+
2. C es cerrado.
3. C es convexo.
4. 0 C
1.1.2 Conjunto asequible X
Una cosa son las cestas que el consumidor puede imaginar, y otra muy
distintas aquellas que puede permitirse. Eso signica que tenemos que tener
en cuenta las circunstancias personales del consumidor: su riqueza (nealth).
Cmo describimos el conjunto asequible o presupuestario? Tenemos que
decir algo acerca de la forma en la que el consumidor puede conseguir los
bienes de consumo.
Supondremos
(a) Cada bien tiene su mercado.
(b) En cada mercado surge un precio
(c) El mercado es competitivo (precio aceptantes)
Los anteriores supuestos nos permiten escribir el conjunto presupuestario
de la siguiente forma
X = x C [ j x _ n, x _ 0 (1.1)
El conjunto presupuestario tiene las siguientes propiedades
1. Cerrado (contiene a su frontera)
2. Acotado (tiene una "extensin" nita)
3. Convexo
1.1 Introduccin: Eleccin con condiciones de certidumbre. 3
1.1.3 Hiptesis de Comportamiento
El individuo elige lo mejor de lo disponible.
Cmo vamos a representar "lo mejor"? Mediante una relacin de
preferencias denida sobre el conjunto de eleccin.
1.1.4 Las preferencias: axiomas.
Relacin binaria % denida sobre el conjunto de eleccin
r
1
% r
2
se lee "r
1
es al menos tan bueno como r
2
" (1.2)
Axioma 1 Completitud. Para todo r
1
,= r
2
en C, o r
1
% r
2
o r
2
% r
1
o ambos.
Axioma 2 Reexividad. Para todo r C, r % r.
Axioma 3 Transitividad. Para cualesquiera r
1
, r
2
y r
3
pertenecientes a
C, si r
1
% r
2
y r
2
% r
3
entonces r
1
% r
3
.
Qu hacemos con estos tres axiomas? Pues el libro de los gustos del
consumidor. Es decir, el libro que nos sirve para predecir el comportamiento
del consumidor.
Pero vamos a utilizar ms axiomas
Los gustos no sufren cambios bruscos (continuidad)
Ms es mejor (ms no es peor) (no existencia del punto G)
(monotonicidad)
La virtud es el punto medio (convexidad)
Axioma 4 Continuidad. Para todo r C, el conjunto tan bueno como
y el conjunto no mejor que son cerrados.
Axioma 5 Monotonicidad. Tiene dos versiones: la dbil y la estricta:
Monotonicidad dbil: (i) Ms de todos los bienes es mejor, (ii)
Ms de algn bien no es peor.
Monotonicidad estricta: (i) Ms de todos los bienes es mejor, (ii)
Ms de algn bien es mejor.
Axioma 6 Convexidad. Tiene su versin dbil y estricta, como casi todo
en esta vida: Si r
1
,= r
0
y r
1
% r
0
, entonces tr
1
+(1 t)r
0
% r
0
para todo
t (0, 1)
4 1. La Teora de Eleccin en Condiciones de Incertidumbre
1.1.5 Existencia de la funcin de utilidad
Denicion 1 Un funcin real n :C1 se denomina Funcin de Utilidad
representativa de la relacin de preferencia % si para cualesquiera r
0
, r
1

C, n(r
0
) _ n(r
0
) ==r
0
% r
1
Teorema 1 Debreu (1954). Si la relacin binaria % es racional
y continua, entonces existe una funcin de utilidad continua que la
representa.
Vamos a realizar una demostracin utilizando el axioma de
monotonicidad. Sean dos cestas r
1
y r
2
. Sea c el vector de unos (1, 1, ..., 1).
Calculemos
n(r
1
) c ~ r
1
n(r
2
) c ~ r
2
r
1
% r
2
por construccin
n(r
1
) c ~ r
1
% r
2
~ n(r
2
) c
por transitividad de %
n(r
1
) c % n(r
2
) c
por monotonicidad de %
n(r
1
) _ n(r
2
)
(1.3)
Esta demostracin, para el caso de dos bienes, puede hacerse
grcamente.
Hay dos propiedades bsicas de la funcin de utilidad n()
1.2 La funcin de utilidad VNM 5
Remark 1 No es nica, sino que admite transformaciones crecientes.
Remark 2 Tiene carcter ordinal, no cardinal.
1.2 La funcin de utilidad VNM
La Teora de la Utilidad Esperada fue presentada por John Von Neumann
y Oscar Morgenstern en su inmortal libro de 1944 LA TEORA DE
JUEGOS Y EL COMPORTAMIENTO ECONMICO. Ha sido la base del
anlisis con incertidumbre de todo anlisis econmico. Ahora bien, tiene
competidores siendo el ms laureado de ellos la Teora Prospectiva, de
Daniel Kahnemann y Amos Tversky.
1.2.1 Conjunto de eleccin.
Sea C un conjunto de resultados c
0
, . . . , c

. Fjate en que estamos


suponiendo un par de cosas
1. El conjunto de eleccin es compacto (es algo que no supusimos para
el caso con certeza)
(a) Existe el peor resultado (c
0
)
(b) Existe el mejor resultado (c

).
2. OJO: Cada resultado c
I
es un resultado cierto. Por tanto, el decision
maker puede ordenarlos en base a su funcin de utilidad n(). Sin
prdida de generalidad voy a suponer que estn ordenados de menos
a ms preferidos.
Los objetos de eleccin van a ser loteras denidas sobre el conjunto de
resultados. Piensa en la siguiente clase de objeto (se llama lotera simple)
1 =
_

_
c
0
con probabilidad j
0
c
1
con probabilidad j
1
. . . . . .
c
I
con probabilidad j
I
. . . . . .
c

con probabilidad j

(1.4)
con

I
j
I
= 1.
Una notacin ms compacta sera
1 :
_
_
_
_
j
0
j
1
...
j

_
_
_
_
(1.5)
6 1. La Teora de Eleccin en Condiciones de Incertidumbre
Desde un punto de vista tcnico, qu son las loteras simples? Son
distribuciones de probabilidad denidas sobre el conjunto de resultados.
OJO: Tambin hay loteras compuestas.
1.2.2 De dnde salen las probabilidades?
Tenemos dos casos posibles:
1. Si son probabilidades objetivas, entonces hablamos de eleccin bajo
riesgo. Por ejemplo, el billete de Lotera de Navidad. Resultados
monetarios. Se conocen las distintas posibilidades de premios.
2. Si son subjetivas, entonces hablamos de eleccin bajo incertidumbre.
Entonces, ESTADOS DEL MUNDO. Comentario tcnico importante:
Small worlds Hypothesis. Si tenis un poco de tiempo podis leer
la seccin del Kreps sobre el tema que es muy interesante.
1.2.3 Las preferencias: axiomas
Por favor, Alguien puede decirme cules son los cuatro primeros axiomas?
Axioma 7 Completitud.
Axioma 8 Reexividad.
Axioma 9 Transitividad.
Axioma 10 Continuidad.
Es posible que tengis la siguiente sensacin: o sea, que cambiamos la
interpretacin del conjunto de eleccin, aplicamos la misma maquinaria
y tenemos asegurada la existencia de una funcin de utilidad y qu?
Existir alguna relacin entre las distintas funciones de utilidad n() y
l ()? John Von Neumann y Oscar Morgenstern mostraron al mundo en
1944 que, bajo ciertos supuestos adicionales, hay una relacin muy estrecha.
De hecho, el objetivo de esta pregunta es mostraros esta relacin tan
estrecha.
Piensa en el siguiente subconjunto de loteras.
1
o
:
_

_
c
0
with probability 1 c
c
1
with probability 0
c
2
with probability 0
... ...
c

with probability c
(1.6)
1.2 La funcin de utilidad VNM 7
Qu tienen de especial? Pues que slo dan o el peor resultado del mundo,
o el mejor resultado del mundo. Y claro, observa que a esta clase de loteras
pertenecen tanto la peor lotera del mundo
1

= 1
o=0
:
_
c
0
with probability 1
c

with probability 0
(1.7)
como la mejor lotera del mundo
1
+
= 1
o=1
:
_
c
0
with probability 0
c

with probability 1
(1.8)
Esa es la gracia del supuesto que hemos hecho sobre la nitud del conjunto
de resultados. De esa forma, nos hemos asegurado la existencia de la mejor
lotera y de la peor lotera. A partir de ahora vamos a hacer un uso intensivo
de las loteras 1
o
.
Axioma 11 Continuity. For every lotery 1 there exists a number c
[0, 1] such that 1 ~ 1
o
Remark 3 Este es calcadito al caso con certeza: Pequeos cambios en
las probabilidades no cambian el orden entre dos loteras. Considera que
1
0
:"muerte segura" y 1
00
:"ganar 11 euros seguros". Considera la lotera
1:"Ganar 10 euros seguros". Evidentemente la gente las ordenara de la
siguiente forma
1
00
~ 1 ~ 1
0
Pues bien, el axioma de continuidad nos dice que existe una probabilidad j
estrictamente positiva tal que
1 ~ j1
0
+ (1 j) 1
00
Es decir, admitiras una probabilidad positiva de muerte con tal de conseguir
1 euro ms (u, u, cuidadito con lo que supones)
Axioma 12 Monotonicity. For every a, / [0, 1] , a _ / =1
o
_ 1
b
Remark 4 Este es calcadito al caso con certeza. Simplemente nos dice que
los resultados de las loteras son "bienes" en lugar de "males".
Axioma 13 Substitution. Let 1 be (j
0
, q
0
; . . . ; j
I
, q
I
; . . . ; j

, q

). If q
I
~
d
I
then 1 ~ (j
0
, q
0
; . . . ; j
I
, d
I
; . . . ; j

, q

).
Remark 5 Este tiene su enjundia, porque no hay nada parecido en la
teora de la eleccin con certidumbre. Os esbozo la situacin. Imaginaos
que para vosotros la lotera 1
00
es preferida a la lotera 1
0
. Entonces si
mezclas estas dos loteras con una tercera 1, el orden de preferencia no
cambia, es decir, es independiente de la tercera.
1
00
_ 1
0
==j1
00
+ (1 j) 1 _ j1
0
+ (1 j) 1
8 1. La Teora de Eleccin en Condiciones de Incertidumbre
En la teora del consumidor bajo certidumbre no hay nada parecido a
este. Por qu? Pues porque no hay razn para creer que las preferencias
de un individuo sobre varias cestas de consumo de bienes 1 y 2 deban
ser independientes de las cantidades de otros bienes que tambin sern
consumidos. Bajo incertidumbre es naturral pensar que la preferencia de
un individuo sobre dos loteras 1
00
y 1
0
debe determinar cual de las dos
l preere como parte de de una lotera compuesta independientemente
del otro resultado 1 de la lotera compuesta. Este otro resultado debe
ser irrelevante porque, en contraste con el contexto bajo certidumbre, el
individuo no consume 1
00
y 1
0
junto con 1, sino ms bien a cambio de 1
(si es que el estado de la naturaleza as lo determina).
Axioma 14 Reduction to simple gambles. For any lottery 1, 1 is
indierent to the associated reduced gamble.
Remark 6 Estamos diciendo que al individuo no le importa la forma en
la que la incertidumbre se resuelve, sino las probabilidades con las que cada
resultado toca. La gente que juega a las quinielas o al bingo no piensa
precisamente eso.
1.2.4 Existencia constructiva de la funcin de utilidad VNM
En esta seccin vamos a llevar a cabo la demostracin constructiva
de la existencia de la funcin de utilidad VNM. Es, como todas las
demostraciones que veremos este curso, corta e inteligente. En n, una
belleza de demostracin.
Pero ojo, toda demostracin corta e inteligente es difcil de entender a
la primera. As que no te desesperes si necesitas unos cuantos intentos...
porque una vez que lo consigas ver, ya es tuya!!
Lo primero que haremos ser denir la funcin de utilidad VNM. Despus
demostraremos que en verdad funciona como funcin de utilidad y ms
tarde veremos la relacin con la u pequeita.
Denicion 2 A la lotera 1 le asignamos l (1) tal que
1 ~ 1
I(J)
Observa que por continuidad siempre existe.
Demostracion. Veamos ahora que funciona realmente como funcin de
utilidad para las loteras en el sentido de que a loteras mejores les asigna
1.2 La funcin de utilidad VNM 9
nmeros mayores.
1
1
_ 1
2
Sean dos loteras, una mejor que otra

1
I(J
1
)
~ 1
1
1
I(J
2
)
~ 1
2
Por continuidad

1
I(J
1
)
_ 1
I(J
2
)
Por transitividad

l
_
1
1
_
_ l
_
1
2
_
Por monotonicidad
(1.9)
Ahora utilicemos el resto de axiomas para ver la relacin tan curiosa entre
n() y l (). Empecemos con cualquier lotera 1. Si no es simple, entonces
la reducimos a su simple asociada.
1 =
_

_
c
0
con probabilidad j
0
c
1
con probabilidad j
1
. . . . . .
c
I
con probabilidad j
I
. . . . . .
c

con probabilidad j

Por continuidad
c
I
indiferente a
_
c
0
con probabilidad 1 n
I
c

con probabilidad n
I
Por el axioma de sustituibilidad
1 ~
_

_
_
c
0
con probabilidad 1 n
0
c

con probabilidad n
0
con probabilidad j
0
. . . . . .
_
c
0
con probabilidad 1 n
I
c

con probabilidad n
I
con probabilidad j
I
. . . . . .
_
c
0
con probabilidad 1 n

con probabilidad n

con probabilidad j

El axioma de reduccin a las loteras simples


1 ~
_
c
0
con probabilidad 1 (j
0
n
0
+j
1
n
1
+... +j
I
n
I
+... +j

)
c

con probabilidad j
0
n
0
+j
1
n
1
+... +j
I
n
I
+... +j

Por denicin
l (1) = j
0
n
0
+j
1
n
1
+... +j
I
n
I
+... +j

10 1. La Teora de Eleccin en Condiciones de Incertidumbre


Felicidades, pero qu hemos demostrado? Lo pondr ms grande
l
_
_
_
_
_
_
_
_
c
0
con probabilidad j
0
c
1
con probabilidad j
1
. . . . . .
c
I
con probabilidad j
I
. . . . . .
c

con probabilidad j

_
_
_
_
_
_
_
_
= j
0
n(c
0
) +j
1
n(c
1
) +... +j

n(c

)
(1.10)
Es decir, la utilidad de un gamble es la utilidad esperada de cada uno de
sus resultados.
1.2.5 Propiedades de la funcin de utilidad VNM
Hay bsicamente dos propiedades interesantes que vamos a considerar.
1. Uniqueness up to ane transformations.
2. Carcter cardinal.
Recuerda el libro de preferencias del consumidor. Recuerda su ndice n().
Pues bien, en la demostracin hemos supuesto una numeracin especial: la
primera pgina es la 0 y la ltima pgina es la nmero 1.
Qu ocurre si cambio el ndice () de manera creciente? Pues que
representa las mismas preferencias. Qu relacin hay entre l() y \ ()?
Originalmente, n(caf bueno) = 1 y n(caf malo) = 0. Entonces
l
_
_
"Un caf que es
bueno con prob. j
1utno
y malo con prob j
1olo
"
_
_
= j
1utno
n(caf bueno) + (1 j
1utno
) n(caf malo)
= j
1utno
Supongamos ahora que cambiamos la funcin de utilidad denida sobre
las cestas de consumo: (caf bueno) = 5 y (caf malo) = 2. Ojo que la
transformacin tiene que ser creciente... Entonces tenemos
\
_
_
"Un caf que es
bueno con prob. j
1utno
y malo con prob j
1olo
"
_
_
= j
1utno
(caf bueno) + (1 j
1utno
) (caf malo)
= 5j
1utno
+ 2 (1 j
1utno
)
Reorganizando esta ltima expresin tenemos
\
_
_
"Un caf que es
bueno con prob. j
1utno
y malo con prob j
1olo
"
_
_
= 2 + 3j
1utno
1.2 La funcin de utilidad VNM 11
Qu relacin surge entonces entre la l () y la \ ()? Pues
\
_
_
"Un caf que es
bueno con prob. j
1utno
y malo con prob j
1olo
"
_
_
= 2 + 3
_
_
"Un caf que es
bueno con prob. j
1utno
y malo con prob j
1olo
"
_
_
o lo que es lo mismo
\ () = 2 + 3l ()
Es decir, la nueva funcin de utilidad denida sobre las loteras es una
transformacin lineal creciente de la antigua. El resultado general es que las
funciones de utilidad denidas sobre las loteras no son nicas, pero todas
ellas son transformaciones lineales crecientes. Y sabes por qu tienen que
ser transformaciones lineales? Pues porque la funcin de utilidad sobre las
loteras tienen la forma de utililidad esperada, es decir, son lineales as que
slo las transformaciones lineales funcionan. As de fcil...
1
De alguna forma el resultado es intuitivo: cuando hay riesgo, los agentes
deben tener alguna idea de la diferencia de utilidad entre diferentes pares
de resultados (A y B por ejemplo) para poder juzgar si la posibilidad de
ganar cuando A ocurre es mayor que el riesgo de perder cuando B ocurre.
Pero claro, esta linealidad tiene sus implicaciones para la funcin de
utilidad: ahora tiene caracter cardinal, es decir, los nmeros asignados
tienen un signicado.
Imagnate que en el mundo con certidumbre el individuo ordena las
siguientes cestas de la siguiente forma
r ~ r
0
~ r
00
tal que
n(r) n(r
00
) = 2 [n(r
0
) n(r
00
)]
Podra ser
n(r) = 7
n(r
0
) = 5
n(r
00
) = 3
1
Es algo completamente anlogo a la relacin entre la escala de temperatura Celsius
y Fahrenheit. En la Celsius, el punto de congelacin del agua es 0
o
, mientras que el
punto de ebullucin corresponde a 100
o
. En la Fahrenheit el punto de congelacin se
corresponde a los 32
o
celsius mientras que el de congelacin a los 212
o
celsius. Como ya
habrs sospechado, la conversin entre ambas escalas es lineal

F
o
= 32 +
9
5
C
o

.
12 1. La Teora de Eleccin en Condiciones de Incertidumbre
Operando obtenemos la siguiente conclusin en el mundo con
incertidumbre
n(r) n(r
00
) = 2 [n(r
0
) n(r
00
)]
1
2
n(r)
1
2
n(r
00
) = n(r
0
) n(r
00
)
1
2
n(r) +
1
2
n(r
00
) = n(r
0
)
Es decir, el individuo mostrara indiferencia entre las dos siguientes
loteras
1 :
_
r con probabilidad 0
0
5
r
00
con probabilidad 0
0
5
~ 1
0
:
_
r
0
con probabilidad 1
1.3 Riesgo y Aversin al Riesgo
Supongamos que es tu cumpleaos y te hago el siguiente regalo: un activo
nanciero que a veces te hace ganar un euro (la mitad de la veces) y a veces
te hace perder un euro (la otra mitad de veces).
Este apartado del tema est dedicado a responder a la siguiente pregunta:
Te gusta mi regalo? Vale, pero Cunto te gusta?
1.3.1 Actitudes frente al Riesgo
Para saber si te gusta el regalo debes comparar tu bienestar antes y despus.
Antes de tu cumple, disponas de una riqueza n (segura), mientras que
despus tu riqueza es una lotera 1C.
Antes del regalo tu riqueza era la siguiente lotera
1 = n con probabilidad 1
mientras que despus del regalo tu riqueza viene dada por la siguiente
lotera
1 =
_
n + 1 con probabilidad 05
n 1 con probabilidad 05
Fjate en que estn relacionadas
1. Tienen el mismo valor esperado
1 (1) = 1 (1) = n
1.3 Riesgo y Aversin al Riesgo 13
2. Pero dieren en la varianza
\ 1(1) \ 1(1) = 0
As pues, tu bienestar antes del regalo es
l (1) = n(n)
mientras que despus del regalo es
l (1) =
1
2
n(n + 1) +
1
2
n(n 1)
Supongamos que eres un desagradecido, es decir, que no te gusta el regalo;
eso signica
l (1)l (1)

n(n)
1
2
n(n + 1)+
1
2
n(n 1)

n
_
1
2
(n + 1) +
1
2
(n 1)
_

1
2
n(n + 1)+
1
2
n(n 1)

n
00
()<0

n() es cncava en w

Eres averso al riesgo


Es decir, un averso al riesgo es un desagradecido cuando se le regala un
juego justo (aquel en el que en trminos esperados ni ganas ni pierdes).
Grcamente se ve muy bien
La siguiente denicin formaliza nuestros hallazgos.
Denicion 3 Sea n() una funcin de utilidad VNM. Entonces ante una
lotera simple 1 : (j
0
, j
1
, ..., j
n
), el individuo es
1. Averso al riesgo en L si n(1 (1)) l (1)
14 1. La Teora de Eleccin en Condiciones de Incertidumbre
2. Neutral al riesgo en L si n(1 (1)) = l (1)
3. Amante al riesgo en L si n(1 (1)) < l (1)
1.3.2 Equivalente Cierto y Prima de Riesgo
Sigamos con el cumpleaos. Ya sabemos que no te gusta mi regalo -
desagradecido- y ests pensando en vendrselo a alguien -traidor- ... a ver si
por lo menos puedes sacarle algn rendimiento. El objetivo de esta seccin
es ponerle precio.
La idea es encontrar el precio 1 tal que la lotera (n +1 con probabilidad 1)
te de la misma utilidad que la lotera 1. Es decir
l (n +1) = l (1)
El siguiente grco te aclarar las ideas
Es decir, la cantidad de dinero seguro que otorga la misma utilidad que
la lotera de denomina Equivalente Cierto (EC) y en el caso de los aversos
al riesgo, es menor que el valor esperado de la lotera. Eso signica que el
precio de venta del activo nanciero es NEGATIVO.
Estars dispuesto a pagar una cantidad de dinero el precio, con el
signo cambiado se denomina tcnicamente prima de riesgo- por quitarte
de encima el riesgo inherente al activo nanciero. Claro, por eso eres un
averso al riesgo.
La siguiente denicin formaliza lo obtenido hasta el momento
Denicion 4 El equivalente cierto a una lotera (EC) es la cantidad
de riqueza segura cuya utilidad iguala a la utilidad de la lotera. La prima
de riesgo (PR)es la diferencia entre la riqueza esperada de la lotera y el
equivalente cierto.
Ejemplo 1 Funcin de utilidad logartmica. Supongamos la siguiente
funcin de utilidad denida sobre la renta o la riqueza n(n) = lnn.
Es estrictamente cncava (verifcalo -si quieres dibujala), por lo que el
1.3 Riesgo y Aversin al Riesgo 15
consumidor es averso al riesgo. Supongamos que le ofrecemos la posibilidad
de invertir en un proyecto de inversin que con probabilidad 1/2 gana h y
con probabilidad 1/2 pierde h. Su riqueza es por tanto la siguiente lotera
1 :
_
n +/ jro/ 0, 5
n / jro/ 0, 5
El equivalente cierto cumple
l (1C) = l (1)
ln(1C) =
1
2
ln(n +/) +
1
2
ln(n /)
= ln((n +/) (n /))
1
2
= ln
_
n
2
/
2
_1
2
de donde obtenemos
1C =
_
n
2
/
2
_1
2
< n
11 = n
_
n
2
/
2
_1
2
0
1.3.3 Cuanticacin de la Aversin al Riesgo
Muchas veces querremos no slo decir que alguien es averso al riesgo sino
cuanticar cunto de averso es para poder establecer comparaciones entre
distintos individuos. Una primera idea es utilizar la "curvatura" de la
funcin de utilidad n
00
(). Esta medida sin embargo tiene un problema
y es que su tamao es completamente arbitrario. Recuerda que cualquier
transformacin lineal positiva tambin representa las mismas preferencias
del individuo.
Por ello, y para mantener la constancia de la medida con respecto a
transformaciones anes Pratt propuso en 1964 el siguiente coeciente.
Denicion 5 El coeciente de aversin absoluta al riesgo de
Arrow-Pratt es
1
o
(n) =
n
00
(1 (1))
n
0
(1 (1))
(1.11)
Ejercicio 1 Demuestra que dicho coeciente es invariante a transforma-
ciones anes.
Si alguien va a comprarnos esta medida como descriptora del grado de
aversin al riesgo, entonces debemos demostrar que, en algn sentido, un
mayor coeciente Arrow-Pratt implica un menor equivalente cierto, por
tanto una mayor prima de riesgo, o lo que es lo mismo estar dispuesto a
pagar un mayor precio por asegurarse frente al riesgo.
16 1. La Teora de Eleccin en Condiciones de Incertidumbre
Proposicion 1 Un mayor coeciente Arrow-Pratt de aversin absoluta al
riesgo es sinnimo de una mayor prima de riesgo.
Demostracion. Vamos a demostrarlo para un activo nanciero que ofrezca
resultado :
I
con probabilidad j
I
para i = 1, 2, .., :, cuyo rendimiento
esperado sea : = 1 (1). La prima de riesgo 11 viene denida por la
siguiente expresin
n(1 (1) 11) =

I
j
I
n(:
I
) (1.12)
Recuerda la siguiente frmula de matemticas
) (r) ) (a) +)
0
(a)
(r a)
1!
+)
00
(a)
(r a)
2
2!
+... +)
(n)
(a)
(r a)
n
:!
+...
(1.13)
que es la expansin de Taylor alrededor del punto a.
El trmino de la izquierda vamos a expandirlo un grado alrededor de la
riqueza esperada mientras que el trmino de la derecha lo vamos a expandir
hasta el segundo grado alrededor de la riqueza esperada.
n(1 (1) 11) = n(1 (1)) +n
0
(1 (1))
1 (1) 11 1 (1)
1!
(1.14)
n(:
I
) = n(1 (1)) +n
0
(1 (1))
n
I
1 (1)
1
+
1
2
n
00
(1 (1)) (:
I
1 (1))
(1.15)
de donde

I
j
I
n(:
I
) = n(1 (1)) +n
0
(1 (1))
_

I
j
I
:
I
1 (1)
_
+ (1.16)
+
1
2
n
00
(1 (1))
_

I
(:
I
1 (1))
2
j
I
_
(1.17)
= n(1 (1)) +
1
2
n
00
(1 (1)) \ 1(1)
Insertando (1.16) y (1.14) en (1.12) llegamos a
n(1 (1)) +n
0
(1 (1)) (11) n(1 (1)) +
1
2
n
00
(1 (1)) \ 1(1)
es decir
11n
0
(1 (1))
1
2
n
00
(1 (1)) \ 1(1)
y por tanto
11
1
2
1
o
(1 (1)) \ 1(1) (1.18)
Aunque claro, siempre es mejor un dibujo.
1.3 Riesgo y Aversin al Riesgo 17
Remark 7 La anterior proposicin implica que individuos con mayores
coecientes Arrow-Pratt son de hecho ms aversos en el siguiente
behavioural respect: tienen menores equivalentes ciertos y por lo tanto estn
dispuestos a aceptar menores loteras.
Ejercicio 2 Convncete demostrndolo intuitivamente.
Remark 8 (From Lengwiler Lecture Notes). Consider a simple binary
lottery- you cannot win anything but can loose $10 with 50% probability.
1. (a) CARA:A millionaire requires the same payment to enter this
lottery as a beggar would. (Constant Absolute Risk Aversion)
(b) IARA: A millionaire requires a larger payment than the beggar!
(Increasing Absolute Risk Aversion)
(c) DARA:A millionaire takes it for a smaller payment than a
beggar (more realistic case) (Decreasing Absolute Risk Aversion)
A veces sin embargo estaremos interesados en una medida relativa del
riesgo, es decir, 11,1 (1), que es el coste del riesgo por unidad de ingreso
esperado. Partiendo de (1.18) vemos que
11
1 (1)

1
2
n
00
n
0
\ 1(1)
1 (1)
o lo que es lo mismo
11
1 (1)

n
00
n
0
1 (1)
1
2
\ 1(1)
(1 (1))
2
11
1 (1)
1
1
(1 (1))
1
2
\ 1(1)
(1 (1))
2
donde
1
1
(1 (1)) = 1 (1)
n
00
n
0
(1.19)
18 1. La Teora de Eleccin en Condiciones de Incertidumbre
Fjate en que el coeciente de aversin relativa al riesgo mide el riesgo
como la elasticidad de la utilidad marginal del ingreso con respecto al
ingreso
1
1
(1 (1)) =
dn
0
d1 (1)
1 (1)
n
0
Acabamos esta seccin con un par de funciones de utilidad muy utilizadas
en economa.
Remark 9 (From Lengwiler Lecture Notes). Consider another simple
binary lottery- instead of losing $10 with 50% probability now we have
a 50% probability of losing your wealth. For the beggar this amount to
losing a few cents for the millionaire it may be in $100,000. Who requires
a larger amount up front, in terms of percentage of his wealth, to enter this
gamble? Not easy to answer? Suppose the millionaire requires $70,000- this
is not unrealistic and the beggar requires 30 cents- also probable- then the
millionaire requires a larger percentage of his wealth than the beggar =
the millionaire is thus more relatively risk averse than the beggar.
Denicion 6 The constant absolute risk aversion (CARA) utility function
is given by
n(n) =
1
c
c
or
)or c 0
where c is the coecient of absolute risk aversion.
Denicion 7 The constant relative risk aversion (CRRA) utility function
is given by
n(n) =
r
1:
1 r
)or r 0, ,= 1
= lnr )or r = 1
where r is the coecient of relative risk aversion.
1.4 Aplicaciones I: Un Modelo Bsico de Seleccin
de Cartera
Ya que tenemos un modelo acerca del comportamiento de los individuos
en presencia de riesgo, podemos desarrollar un pequeo modelo de eleccin
entre activos nancieros. De los datos experimenales se desprende que casi
todo el mundo es averso al riesgo, por lo que en esta seccin me centrar en
inversores aversos al riesgo. Piensa que la idea de este ejercicio es mostrar la
utilizacin del modelo desarrollado en este tema y no tanto la adquisicin
de habilidades para ganar la vida como diseador de fondos de inversin.
Vamos a estudiar dos situaciones que suelen aparecer en los modelos de
seleccin de cartera:
1.4 Aplicaciones I: Un Modelo Bsico de Seleccin de Cartera 19
1. La diversicacin de la cartera ptima (one should never put all ones
eggs in one basket)
2. La proporcin ptima de activos arriesgados en la cartera (portfolio
selection)
Podramos estudiar las dos situaciones en un mismo modelo sin ms que
considerar la seleccin ptima de cartera en un mundo en el que existe
un activo seguro y dos activos arriesgados, pero la cosa se complicara
innecesariamente.
1.4.1 La diversicacin de la cartera ptima
Supongamos que eres averso al riesgo y te dan a elegir entre dos activos
nancieros A e 1 con riesgo tales que
1. Unit price of A = unit price of 1 ,
2. 1 [A] = 1 [1 ].
3. \ 1[A] = o
2

o
2
Y
= \ 1[1 ].
Imagnate que te obligo a comprar slo uno de ellos: Cul compraras?
Pues dado que tienen el mismo valor esperado, preeres el de menor
varianza: el 1 .
Dada esta relacin de preferencia estricta entre los activos nancieros
1 ~ A, tiene sentido que el director del banco te ofrezca comprar de
los dos? Es decir, tu cartera ptima slo debe contener low-risk asset 1
o debes tener un mixed portfolio que incluya algo del high-risk asset A?
Interesante a la vez que contraintuitivo... Vemoslo.
Sea c la proporcin invertida en el high-risk asset A. Por tanto, tu
riqueza viene representada por una lotera 7 = cA + (1 c) 1 cuyo
rendimiento esperado 1 (7) = 1 [A] = 1 [1 ] es independiente de la
combinacin entre activo ms arriesgado y menos arriesgado y cuya
varianza s que depende del mix
o
2
2
= c
2
o
2

+ (1 c)
2
o
2
Y
+ 2c(1 c) CO\ (A, 1 ) (1.20)
Dado que eres averso al riesgo, tu eleccin ptima vendr determinada
por la eleccin de la cartera de mnima varianza.
La condicin de primer orden es
do
2
2
dc
= 2co
2

2 (1 c) o
2
Y
+ 2 (1 2c) CO\ (A, 1 )
20 1. La Teora de Eleccin en Condiciones de Incertidumbre
Utilicemos un atajo: veamos cuando el ptimo es la esquina c = 0 (es
decir, todos los huevos en la cesta 1 ). Ser ptimo cuando, a partir de la
situacin c = 0 al aumentar c la varianza sea mayor. Es decir, cuando
do
2
2
dc

o=0
= 2o
2
Y
+ 2CO\ (A, 1 ) 0 (1.21)
CO\ (A, 1 ) o
2
Y
jo

o
Y
o
2
Y
(1.22)
j
o
Y
o

donde hemos utilizado la denicin de coeciente de correlacin


j =
CO\ (A, 1 )
o

o
Y
(1.23)
Conclusion 1 Si la correlacin entre los dos activos nancieros es lo
sucientemente grande, entonces no se debe diversicar la cartera de
inversin. Es decir, debemos mezclar los activos siempre que no estn
demasiado correlacionados.
Por completitud te dir que el mixed ptimo interior viene dado por la
siguiente expresin
c

=
o
2
Y
CO\ (A, 1 )
o
2
Y
+o
2

2CO\ (A, 1 )
(1.24)
Un grco aclarar un poco las cosas
VAR(X)
VAR(Y)
VAR(Z)
0 a* 1
a
Ejercicio 3 Demuestra el mix ptimo, vericando de paso la condicin de
segundo orden.
Ejemplo 2 (From Topics in Microeconomics, by Elmar Wolfstetter)
Supongamos que la distribucin conjunta de dos activos nancieros X e
1.4 Aplicaciones I: Un Modelo Bsico de Seleccin de Cartera 21
Y es la siguiente
Prob. distrib. of returns
Prob (X,Y)
Y=8 Y=16

X=5 3/5 1/5 4/5
X=30 3/20 1/20 1/5

3/4 1/4 1
De los datos anteriores concluimos que
1 (A) =
4
5
5 +
1
5
30 = 10
1 (1 ) =
3
4
8 +
1
4
16 = 10
\ 1(A) =
4
5
(5 10)
2
+
1
5
(30 10)
2
= 100
\ 1(1 ) =
3
4
(8 10)
2
+
1
4
(16 10)
2
= 12
CO\ (A, 1 ) =
3
5
(5 10) (8 10) +
1
5
(5 10) (16 10) +
+
3
20
(30 10) (8 10) +
1
20
(30 10) (16 10)
= 0
de donde
c

=
o
2
Y
CO\ (A, 1 )
o
2
Y
+o
2

2CO\ (A, 1 )
=
12
12 + 100
0.1071 (1.25)
Es decir, cerca del 11% de la inversin total debera destinarse al activo de
riesgo ms alto.
Tiene todo el sentido del mundo que la diversicacin dependa de la
correlacin entre los activos nancieros. Se reduce el riesgo siempre que
la correlacin sea lo sucientemente pequea, como por ejemplo, cuando
la correlacin es cero o negativa. Para ver este caso ms en profundidad
estudiemos la eleccin ptima de la cartera de inversin cuando uno de los
activos nancieros disponibles es el activo seguro.
1.4.2 La eleccin entre un activo seguro y un activo
arriesgado.
Considera un inversor que debe decidir qu parte de su riqueza n invertir en
un activo nanciero con tasas de retorno (en exceso sobre el activo seguro)
r
I
con probabilidades j
I
, i = 1, 2, ..., :. Sea , la parte de la riqueza invertida
en el activo nanciero.
22 1. La Teora de Eleccin en Condiciones de Incertidumbre
Esto signica que la riqueza del individuo viene representada por la
siguiente lotera
1 :
_

_
(n ,) +, (1 +r
1
) con probabilidad j
1
(n ,) +, (1 +r
2
) con probabilidad j
2

(n ,) +, (1 +r
I
) con probabilidad j
I

(n ,) +, (1 +r
n
) con probabilidad j
n
Podemos escribir de forma formal el problema del consumidor de la
siguietne forma tan compacta
max
fog

I
j
I
n(n +,r
I
)
s.t. 0 _ , _ n
(1.26)
En lugar de construir el lagrangiano y complicarnos la vida con las
condiciones de Kuhn-Tucker, vamos a utilizar un viejo atajo: olvidarnos
de la restriccin, encontrar la solucin y vericar si la solucin cumple la
restriccin.
La condicin de primer orden es
dl (1)
d,
=

I
j
I
n
0
(n +,r
I
) r
I
Veamos cundo podemos descartar la solucin esquina , = 0. Para ellos
evaluemos la expresin anterior en , = 0.
dl (1)
d,

o=0
=

I
j
I
n
0
(n) r
I
= n
0
(n)

I
j
I
r
I
Observa que

I
j
I
r
I
es el rendimiento esperado del activo nanciero.
Por tanto, si es negativo, la utilidad esperada es decreciente en , = 0 y por
tanto no invertir nada en el activo nanciero es el comportamiento ptimo
del individuo.
Remark 10 Esto es evidente. Si no os gusta el riesgo, la eleccin entre
una riqueza segura y una menor riqueza esperada y encima con riesgo no
tiene color.
Centrmonos en el caso en el que el rendimiento esperado del activo
nanciero es positivo, i.e.

I
j
I
r
I
0. Ahora si que no podemos saber a
priori el comportamiento del inversor porque ahora le damos a elegir entre
una riqueza segura y una riqueza esperada mayor pero con riesgo. As pues,
la cantidad a invertir depender de grado de aversin al riesgo del inversor.
1.4 Aplicaciones I: Un Modelo Bsico de Seleccin de Cartera 23
Las condiciones de primer y segundo orden son las siguientes

I
j
I
n
0
(n +,

r
I
) r
I
= 0 (1.27)

I
j
I
n
00
(n +,

r
I
) r
2
I
< 0 (1.28)
Observa que la de segundo orden se cumple sin problemas porque el
inversor es averso al riesgo (n
00
< 0). Por lo tanto, la condicin de primer
orden dene la cartera ptima del inversor.
Proposicion 2 Si la funcin de utilidad es DARA (Decreasing Absolute
Risk Aversion), entonces los activos nancieros son "bienes normales", es
decir, su demanda aumenta al aumentar la renta del inversor.
Demostracion. Vamos a utilizar el teorema de la funcin implcita para
obtener la variacin de ,

al variar n.
d,

dn
=
0,0n
0,0,
=

I
j
I
n
00
(n +,

r
I
) r
I

I
j
I
n
00
(n +,

r
I
) r
2
I
(1.29)
Queremos demostrar
Jo

Ju
0 y sabemos que el denominador es negativo
(risk aversion). Entonces necesitamos mostrar que el numerador es positivo.

I
j
I
n
00
(n +,

r
I
) r
I
0 (1.30)
Este signo es ambiguo porque aun cuando n
00
sea negativa, la rentabilidad
puede ser negativa o positiva. Vamos a ir estudiando cada sumando anterior
en funcin de si la rentabilidad es positiva o negativa
Si r
I
es positiva entonces
1
.
(n) 1
.
(n +,

r
I
) (1.31)
1
.
(n) n
0
(n +,

r
I
) r
I
n
00
(n +,

r
I
) r
I
n
00
(n +,

r
I
) r
I
r
I
1
.
(n) n
0
(n +,

r
I
)
Si r
I
es negativa entonces
1
.
(n) < 1
.
(n +,

r
I
) (1.32)
1
.
(n) n
0
(n +,

r
I
) r
I
n
00
(n +,

r
I
) r
I
n
00
(n +,

r
I
) r
I
r
I
1
.
(n) n
0
(n +,

r
I
)
Utilizando (1.31) y (1.32) en (1.30) obtenemos lo siguiente

I
j
I
n
00
(n +,

r
I
) r
I

I
j
I
r
I
1
.
(n) n
0
(n +,

r
I
) (1.33)
= 1
.
(n)

I
j
I
r
I
n
0
(n +,

r
I
)
. .
}oc
(1.34)
= 0 (1.35)
24 1. La Teora de Eleccin en Condiciones de Incertidumbre
1.5 Aplicaciones II: Un Modelo Bsico de
Demanda de Seguros
Esta seccin est escrita para que realmente entiendas cmo la demanda
de seguros proviene de las preferencias por el riesgo. Y la clave para ello es
pensar en el seguro como un bien contingente.
Denicion 8 Bien Contingente: Bien que compras hoy pero que slo
consumes si se da determinado estado de la naturaleza.
As, cuando compras un seguro ests comprando una compensacin
monetaria que slo puedes reclamar si un determinado estado de la
naturaleza se realiza. Obviamente, la decisin de asegurarte la tomas antes
de que se realice el estado del mundo.
Ahora quiero que pienses en dos estados del mundo: el bueno y el malo
(nos falta el feo, pero es que quiero dibujar en dos dimensiones). La idea
es dibujar curvas de indiferencia en dicho espacio. Para ello considera el
siguiente ejemplo:
Estados de la Naturaleza
Malo Bueno
Riqueza 40 120
Probabilidad 0,25 0,75
Riqueza Esperada 0,25x40+0,75x120=100
Lo primero que vamos a hacer es calcular las distintas combinaciones
(riqueza BUENO, riqueza MALO) que proporcionan al consumidor la
misma riqueza esperada 100.
100 = 0, 25:+ 0, 75/
: =
100
0, 25

0, 75
0, 25
/
: = 400 3/
1.5 Aplicaciones II: Un Modelo Bsico de Demanda de Seguros 25
Como ves es una lnea recta con ordenada en el origen 400 y pendiente
3.
Riqueza
MALO
Riqueza
BUENO
120
40
E: Situacin inicial
Lnea iso-riqueza
esperada (100)
400
E
+
E
-
133,3
Piensa ahora en un individuo averso al riesgo y recuerda que este
individuo, a igualdad de riqueza esperada, preere las loteras que tienen
menor varianza. Por eso, este individuo preferir la situacin 1
+
frente
a su situacin inicial y no preferir la situacin 1

frente a su situacin
inicial. Es decir, las curvas de indiferencia de un individuo averso al riesgo
se curvan hacia el origen en el diagrama (riqueza BUENO, riqueza MALO);
es decir, son convexas.
Imaginemos que existen mercados de seguros actuarialmente justos; es
decir, mercados en los que el precio iguala a la compensacin esperada.
Cul ser dicho precio?
El bien 1 euro en el estado malo tiene un precio hoy de 0,25 euros,
es decir, antes de que el estado del mundo se revele.
El bien 1 euro en el estado bueno tiene un precio hoy de 0,75 euros,
es decir, antes de que el estado del mundo se revele.
Fjate en que estos precios no son sino las probabilidades de los estados
del mundo. . . Bien, veamos cuales son las consecuencias que se derivan para
este individuo de la existencia de los mercados de seguros. Ya te adelanto
que va a ser la posibilidad de trasvasar riqueza entre estados del mundo.
Veamos cmo funciona.
La situacin inicial es (120, 40). Este individuo podra vender hoy el bien
1 euro en el estado bueno al precio 0, 75 euros y dedicar ese dinero a
comprar el bien 3 euros en el estado malo. Fjate en que ha trasvasado
26 1. La Teora de Eleccin en Condiciones de Incertidumbre
riqueza del estado bueno al estado malo. . . ahora estara en la situacin
(119, 43).
Podra seguir as y situarse en situaciones (118, 46), (117, 49),. . . es decir,
la existencia de los mercados de seguros actuarialmente justos le permite
poder trasvasar riqueza entre estados a una relacin de intercambio de
3. Dnde hemos visto nosotros antes ese 3? Pues en la lnea iso-riqueza
esperada. . . La lnea de iso-riqueza no es sino la lnea de intercambio
actuarialmente justo cuya pendiente es 1
1utno
,1
1olo
.
As pues, la decisin del consumidor es en qu punto de la lnea de
intercambio actuarialmente justo situarse. Evidentemente en aquel que sea
el ms preferido, es decir, el que le proporcione mayor nivel de utilidad.
Todas las loteras disponibles tienen algo en comn: proporcionan un
mismo nivel de riqueza esperado (100) y algo en lo que se diferencian:
la varianza. Pues bien, de todas ellas slo una no tiene ningn riesgo; es
decir, slo hay una en la que la riqueza en el estado bueno coincide con
la riqueza en el estado malo: (100, 100). Esta es la solucin!! Asegurarse
completamente!!
Grcamente la situacin sera la siguiente:
Riqueza
MALO
Riqueza
BUENO
120
40
E: Situacin inicial
Lnea de intercambio
actuarialmente justo
(pendiente Pbueno/Pmalo)
Lnea de 45 grados
Tangencia !!
Analizar la demanda de seguro desde la perspectiva de los bienes
contingentes nos permite entender algo muy importante:
Conclusion 2 La decisin ptima es cobertura completa independiente-
mente del grado de aversin al riesgo del consumidor. Lo relevante es la
concavidad de la funcin de utilidad, no el grado de concavidad.
Si te gusta la formalizacin -para no perder el hbito de todos estos
aos estudiando micro- y quieres ver en accin relaciones marginales de
sustitucin y precios relativos, entonces fjate en lo siguiente.
1.6 Apndice 27
El conjunto de intercambio justo entre estados de la naturaleza
puede entenderse como una "restriccin presupuestaria" con pendiente

1
Bueno
11
Bueno
.
La utilidad asociada a la lotera inicial del consumidor es
l (1) = 1
1utno
n(n
1utno
) + (1 1
1utno
) n(n
1olo
)
As pues, las curvas de indiferencias tienen una pendiente determinada
por la siguiente expresin
dl = 0 = 1
1utno
n
0
(n
1utno
) 0n
1utno
+ (1 1
1utno
) n
0
(n
1olo
) 0n
1olo
0n
1olo
0n
1utno
=
1
1utno
1 1
1utno
n
0
(n
1utno
)
n
0
(n
1olo
)
< 0
Ya hemos visto grcamente que en el ptimo tenemos que la riqueza en
los dos estados del mundo son iguales, es decir, n
1utno
= n
1olo
= n, y
esto implica
0n
1olo
0n
1utno
=
1
1utno
1 1
1utno
n
0
(n)
n
0
(n)
=
1
1utno
1 1
1utno
Es decir, que la curva de indiferencia sea tangente a la "restriccin
presupuestaria".
El anlisis que hemos realizado en esta seccin ha sido un anlisis un poco
raro, puesto que hemos supuesto la existencia de un mercado de seguros. Lo
nico que hemos mostrado es que si existe el mercado de seguros entonces
un agente averso al riesgo querr, en las condiciones de nuestro modelo,
asegurarse completamente. Ahora bien, de verdad que si todos somos
aversos al riesgo surgir un mercado de seguros? El segundo problema
de la hoja de ejercicios est pensado como una posible respuesta a este
interrogante.
1.6 Apndice
1.6.1 Kahneman and Tversky (1979): Prospect Theory
La teora de la utilidad esperada se basa en tres principios bsicos
1. Expectations: The ultimate evaluation of a prospect is given by the
expected utility of its outcomes.
2. Asset integration: The prospect (j
0
, c
0
; . . . ; j
I
, c
I
; . . . ; j

, c

) is
acceptable at asset position n i l(j
0
, c
0
+ n; . . . ; j
I
, c
I
+
n; . . . ; j

, c

+n) n(n).
28 1. La Teora de Eleccin en Condiciones de Incertidumbre
3. Risk aversion: n() is concave, i.e. n
00
() < 0.
Daniel Kahneman y Amos Tversky demuestran experimentalmente que
en muchas situaciones estos principios bsicos son violados y proponen un
modelo alternativo para describir la eleccin bajo incertidumbre: Prospect
Theory. Segn esta teora, el proceso de seleccin de loteras tiene dos
fases:
1. Editing Phase (edicin de los prospectos). Durante esta fase,
los decision makers realizan una representacin simplicada de los
prospectos. (Muchas de las violaciones de la expected utility se
realizan en esta fase)
2. Evaluating Phase (valoracin de los prospectos). A partir de
la representacin simplicada de la fase de edicin, los individuos
valoran cada prospecto y escogen el que tenga mayor valoracin. La
funcin valor se compone de dos escalas: () and ().
(a) La primera escala () asociada a cada probabilidad j un
peso (j) que no es una probabilidad (lo ms normal es que
(j)+ (1 j) < 1)
(b) La segunda escala () ofrece una valoracin subjetiva de cada
resultado.
i. Se dene sobre prdidas y ganancias en relacin a algn
punto de referencia (Focus on changes rather than wealth
levels as in expected utility theory reects the nature of
mental accounting: transactions are often evaluated step by
step rather than in conjunction with everything else)
ii. Both the gain and loss functions display diminishing
sensitivities, i.e. the gain function is concave whereas the
loss function is convex. (Este es un principio psicolgico muy
bien establecido, a saber, que la diferencia entre 10C= y 20C=
es percibida como mayor que la diferencia entre 1000C= y
1010C=, independientemente de si son ganancias o prdidas)
iii. Loss aversion: Losing 100C= hurts more than gaining C=100
yields pleasure ( (r) < (r)). (This might reect a basic
human mechanism: it is easier to make people unhappy than
happy).
1.6 Apndice 29
30 1. La Teora de Eleccin en Condiciones de Incertidumbre
This is page 31
Printer: Opaque this
2
Juegos con Informacin Perfecta
2.1 Introduccin
En este tema empezamos con el estudio de situaciones en las que existe
interdependencia estratgica, es decir, lo que t haces afecta a mi
bienestar, lo que yo hago afecta a tu bienestar, y los dos lo sabemos. De
momento, solamente hablaremos de juegos no cooperativos con informacin
perfecta y completa. El tema de la informacin imperfecta es tratado en el
prximo captulo.
1. No cooperativos: Ningn tipo de acuerdo entre los jugadores es
vinculante -es decir, puede ser llevado ante los Tribunales con xito.
2. Informacin perfecta: Cualquier jugador, a la hora de elegir,
conoce toda la historia del juego -es decir, todas las acciones pasadas
tomadas por jugadores que han elegido antes que l.
3. Informacin completa: Las funciones de pago de todos los
jugadores son conocimiento comn.
Es posible que toda esta jerga no te diga nada en estos momentos. Espero
que la situacin sea distinta al nal del tema 3 porque en caso contrario,
ests perdido, forastero...
32 2. Juegos con Informacin Perfecta
2.2 Representacin estratgica de un juego
La representacin en forma estratgica de un juego especica los siguientes
elementos:
1. Los jugadores del juego: En general, tendremos : jugadores. Un
jugador genrico vendr denotado por i, y por tanto diremos i =
1, ..., :.
2. Las estrategias de las que dispone cada jugador. El conjunto de
estrategias del jugador i vendr denotado por
I
.
3. Los pagos para cada jugador en cada combinacin posible de
acciones. El pago para el jugador i viene denotado por n
I
(a
1
, ..., a
n
),
donde n
I
es una funcin de
1
...
n
a R. Es decir, n
I
:

1
...
n
R.
Todo lo anterior motiva la siguiente denicin
Denicion 9 La representacin en forma estratgica de un juego con :
jugadores especica los espacios de estrategias de los jugadores,
1
, ...,
n
y sus funciones de pagos n
1
, ..., n
n
. Denotaremos estos juegos con ( =

1
, ...,
n
; n
1
, ..., n
n
.
Ejemplo 3 TV Show. Imagnate que vas a un concurso de televisin
de los que hay ahora, de esos para intelectuales. Te enfrentas a otro
concursante y tu misin consiste en elegir un color, o bien rojo o bien
azul. Si coincide con el color que previamente ha elegido de forma secreta
tu rival, entonces cada uno ganis un milln de euros. En caso contrario,
es decir, si no coincide con el color elegido por tu rival, entonces ganis
cero. Representa el juego en forma estratgica.
(i) Jugadores: Dos, t y tu rival.
(ii) Espacio de estrategias: Es el mismo para los dos jugadores,
I
={Rojo,
Azul} for i = 1, 2.
(iii) Funcin de pagos: n
I
(a
I
, a

) =
_
1 Milln euros si a
I
= a

0 Millones de euros si a
I
,= a

for i, , = 1, 2, , ,= i.
Toda esta informacin queda resumida de la siguiente forma en la matriz
del juego
EL
Rojo Azul
TU Rojo 1,1 0,0
Azul 0,0 1,1
2.2 Representacin estratgica de un juego 33
Ahora bien, si quieres el tpico ejemplo de teora de juegos, entonces te
reeres al Dilema de Presos.
Ejemplo 4 Dilema de Presos. Dos ladrones son detenidos en relacin
a una investigacin sobre un robo. La polica no tiene evidencia suciente
para condenar a los sospechosos a menos que uno de ellos conese el robo.
Los encierra en celdas separadas y les explica las consecuencias derivadas
de las decisiones que tomen. Si ninguno de ellos conesa, ambos sern
condenados por un delito menor a 3 aos de crcel. Si ambos conesan,
entonces sern sentenciados a 10 aos de crcel. Finalmente, si uno de
ellos conesa y el otro no, el primero se beneciar de una reduccin de
pena por colaborar con la justicia y ser puesto en libertad inmediatamente,
mientras que el segundo ser condenado a 15 aos de crcel.
(i) Jugadores: Dos presos, el preso 1 y el preso 2.
(ii) Espacio de estrategias: Ambos presos tienen el mismo espacio de
acciones
I
= = Callar, Confesar for i = 1, 2.
(iii) Funcin de pagos:
n
I
(a
I
, a

) =
_

_
3 aos si a
I
=Callar and a

=Callar
15 aos si a
I
=Callar and a

=Confesar
Libertad si a
I
=Confesar and a

=Callar
10 aos si a
I
=Confesar and a

=Confesar
for i = 1, 2.
J2
Callar Confesar
J1 Callar 3 aos, 3 aos 15 aos, Libertad
Confesar Libertad, 15 aos 10 aos, 10 aos
Ejemplo 5 Beauty Contest. En un grupo de personas, cada una de ellas
debe decir un nmero mayor que 0 y menor que 100 (ambos inclusive).
Ganar una cerveza el que adivine dos tercios del nmero medio.
Jugadores: : jugadores, con : 2
Espacio de estrategias: o
I
= o = [0, 100] for all i.
Funcin de pagos: n
I
(:
I
, :
I
) =
_
ct:ut:o

if

:
I

2s
3


2s
3

for all , ,= i
0 otherwise
donde q es el nmero de ganadores.
34 2. Juegos con Informacin Perfecta
RIVAL
Rojo Azul
TU TU
ROJO AZUL ROJO AZUL
1 0 0 1
1 0 0 1
2.3 Representacin en forma extensiva de un juego
Cuando representamos una situacin estratgica en forma extensiva,
entonces debemos especicar un montn de elementos ms:
1. La lista de jugadores.
2. El rbol del juego.
3. Una asignacin de los nodos de decisin a los jugadores.
4. Las listas de acciones disponibles en cada nodo de decisin y una
correspondencia entre los inmediatos sucesores de cada nodo de
decisin y las acciones disponibles.
5. Los conjuntos de informacin; es decir, qu conoce el individuo acerca
de las acciones que han tomado sus rivales en nodos previos al suyo.
6. Una asignacin de pagos para cada jugador en cada nodo terminal (y
las probabilidades asignadas a los nodos iniciales y a las acciones en
todo nodo asignado a la naturaleza).
Por qu es ms complicado que la forma estratgica o normal? Pues
porque ahora queremos especicar ciertos elementos que no aparecan de
forma explcita en la forma estratgica: el orden de juego y, lo que es ms
importante, lo que conocen los jugadores cuando les toca jugar.
Ejemplo 6 TV Show Revisited. Supongamos que durante un intermedio
del concurso de televisin te camelas al presentador (JV?) y logras cambiar
las reglas del concurso: ahora, antes de elegir te comunican el color elegido
por tu rival. Representa este nuevo concurso en forma extensiva.
2.3 Representacin en forma extensiva de un juego 35
Grupo
terrorista
Kidnap Do not kidnap
US Congress
Negociar No negociar
0
0
2
-1
-2
-2
Ejemplo 7 Armed Group. (Based on Macartan Humphreys Game
Theory Course Notes, Sept. 2005). Un grupo terrorista est pensando en
secuestrar al presidente de EEUU. En caso de secuestro, el Congreso de
EEUU debe decidir si negociar con los secuestradores (en cuyo caso los
secuestradores consiguen sus objetivos y el presidente es dejado libre pero
con la consiguiente conmocin para el pas) o no negociar (en cuyo caso,
se produce un enfrentamiento armado que se salda con la muerte de los
terroristas y el presidente). En caso de no secuestro, no pasa nada (nunca
mejor dicho). Represente el juego en forma extensiva, explicitando una
funcin de pagos que recoja "elmente" la valoracin del grupo terrorista
y del US Congress sobre los posibles resultados del juego.
Ahora que has visto dos formas distintas de representar un juego, seguro
que te ests preguntando por la relacin que hay entre ellas. En trminos
generales se cumple el siguiente principio:
Proposicion 3 Para cualquier juego en forma extensiva existe un juego
correspondiente en forma estratgica, donde consideramos que los jugadores
eligen sus estrategias de forma simultnea. Sin embargo, para un juego en
forma estratgica existen mltiples juegos en forma extensiva.
Este principio general nos lleva a la siguiente cuestin: Siempre que
queramos modelizar una situacin econmica por medio de un juego,
podemos elegir o bien su representacin en forma estratgica, o bien su
representacin en forma extensiva. Cul debemos elegir? La respuesta a
esta pregunta no la busques ni en este captulo ni en ningn libro de Teora
de Juegos, puesto que depender de la situacin que estemos considerando.
Si creemos que toda la informacin relevante sobre la situacin econmica
viene recogida en la forma estratgica del juego, entonces estamos
36 2. Juegos con Informacin Perfecta
aceptando implicitamente que no hay diferencia sustancial entre los
diferentes juegos extensivos asociados.
Ejercicio 4 (i) Considera el juego del concurso de televisin en su primera
versin. Halla la forma extensiva asociada y (ii) Considera ahora su
segunda versin. Halla su forma estratgica asociada.
2.4 Conceptos de solucin. Nociones generales.
Una vez especicados los jugadores, estrategias, orden de juego, informacin
y relacin de preferencia sobre el conjunto de resultados, quiz te preguntes
por el objetivo de tal ejercicio. En general, la nalidad es encontrar la
solucin del juego y describir sus propiedades.
Por concepto de solucin nos referimos a una regla para predecir el
comportamiento de los jugadores en el juego. Con todo el formalismo del
que soy capaz, sea el conjunto de todos los juegos y sea 1 el conjunto de
todos los comportamientos. Pues bien, un concepto de solucin es
: 1 (2.1)
una correspondencia que va desde el conjunto de todos los juegos hasta el
conjunto de todos los comportamientos posibles.
La pregunta del milln es: cmo elegimos entre los distintos conceptos
de solucin? porque claro, conceptos de solucin hay muchos. Considera
por ejemplo la correspondencia
r
que asocia a cada juego el perl de
acciones formado por la primera estrategia de cada jugador.
Es una tautologa decir que nos quedamos con la mejor porque la
gracia del asunto est en la propia denicin de "mejor" solucin, que
necesariamente debe conjugar alguna/s de las siguientes propiedades
Existencia: Que est denida para todo juego.
Sentido: () sea razonable de acuerdo a algn criterio
preestablecido.
Unicidad: Que sea una funcin en lugar de una correspondencia.
Robustez: Que cambios irrelevantes en el juego no cambien la
prediccin.
Parsimonia: Que haga pocos supuestos acerca de los jugadores.
Ni que decir tiene que las distintas soluciones que veremos a lo largo
del curso no satisfacen todas estas propiedades, sino que en todas ellas
hay un trade-o entre distintas propiedades. Es por tanto una buena idea
2.5 Conceptos de solucin para juegos en forma estratgica 37
que conforme vayamos analizando distintas soluciones vayas vericando qu
propiedades sacrica el concepto de solucin.
Lo que s van a compartir (casi) todos los conceptos de solucin que
estudiemos este curso es el criterio de "razonable" del comportamiento:
ste debe ser acorde al criterio de racionalidad de los agentes econmicos:
la maximizacin de la utilidad (esperada, que para eso hemos estudiado el
tema 1).
2.5 Conceptos de solucin para juegos en forma
estratgica
En esta seccin veremos varios conceptos de solucin para juegos en forma
estratgica
1. Dominancia iterada.
2. Estrategias racionalizables.
3. Equilibrio de Nash.
La literatura sin embargo contiene una enorme variedad de conceptos,
algunos de los cuales aparecen en el Apndice de este tema. chale un
vistazo si te llama la atencin.
2.5.1 Dominancia iterada
El primer concepto de solucin se basa en la existencia de estrategias
estrictamente dominadas.
Denicion 10 Estrategias estrictamente dominadas. En el juego
representado en forma estratgica G = o
1
, ..., o
n
; n
1
, ..., n
n
, sean :
0
I
y :
00
I
dos estrategias del jugador i. La estrategia :
0
I
est estrictamente dominada
por la estrategia :
00
I
si para cada combinacin posible de las estrategias de los
restantes jugadores, el pago para el jugador i por utilizar :
0
I
es estrictamente
menor que el pago por utilizar :
00
I
, es decir
n
I
(:
0
I
, :
I
) < n
I
(:
00
I
, :
I
) para todo :
I
Es dbil si alguna desigualdad no es estricta.
A partir de esta denicin, podemos plantear el primer concepto de
solucin de un juego en forma normal.
Denicion 11 El conjunto de estrategias que sobreviven al proceso de
eliminacin iterativa de estrategias estrictamente dominadas.
38 2. Juegos con Informacin Perfecta
Ejemplo 8 Prisoners Dilemma. Considera el dilema de presos.
Observa que para cada jugador la estrategia CALLAR est estrictamente
dominada por la estrategia CONFESAR. Por tanto, una solucin para el
dilema de presos es la estrategia CONFESAR.
J2
Callar Confesar
J1 Callar 3 aos, 3 aos 15 aos, Libertad
Confesar Libertad, 15 aos 10 aos, 10 aos
Piensa ahora en las propiedades que satisface este primer concepto de
solucin. Nos lleva al mismo resultado independientemente del orden en
el que se eliminen las estrategias. Cierto es que en juegos simples, como
el dilema de presos, este criterio nos ofrece una solucin nica, pero en
general no ser el caso. Cierto es que en juegos simples, como el dilema
de presos, el nico supuesto es el de racionalidad de los jugadores, pero en
general necesitaremos asumir que la racionalidad de los agentes econmicos
es conocimiento comn.
Denicion 12 Algo es conocimiento comn si todos los jugadores lo
saben, todos saben que todos lo saben, todos saben que todos saben que
todos los saben,... y as ad innitum.
La formalizacin del concepto de conocimiento comn recay en Robert
Aumann quien en 1976 public el artculo "Agreeing to Disagree". Para
que veas la importancia de este concepto, piensa en la siguiente situacin.
Ejemplo 9 Rural Village. (From "A Mathematician plays the Stock
Market", by John Allen Paulos). En un pueblo hay varias parejas casadas
y cada mujer sabe inmediatamente cundo el marido de otra ha sido inel,
pero no cundo lo ha sido el suyo propio. Las normas del pueblo permiten
matar al marido ese mismo da siempre y cuando pueda demostrar su
indelidad. Supongamos que la racionalidad de las mujeres del pueblo es
conocimiento comn y que nunca informan a las dems mujeres de los
devaneos de sus maridos (o bien no es una prueba lo sucientemente
slida). Supongamos que 20 hombres han sido ineles, pero que nadie puede
demostrarlo. Sin embargo, el 1 de marzo llega el gur de una ciudad vecina
que tiene una credibilidad a prueba de bombas; es decir, su palabra es ley.
Rene a los habitantes del pueblo y dice: "entre vosotros hay por lo menos
un inel". Qu ocurre en el pueblo? Pues durante 10 das no pasa nada...
pero el 20 de marzo, 20 hombres son asesinados por sus respectivas mujeres.
El siguiente ejercicio te muestra que hay casos en el que el hecho de que
la racionalidad de los agentes sea conocimiento comn no nos lleva muy
lejos.
Ejercicio 5 Fun and Games II. (From "Fun and Games" by
Kenneth Binmore) Demuestra que el procedimiento de eliminacin
2.5 Conceptos de solucin para juegos en forma estratgica 39
iterada de estrategias estrictamente dominadas no selecciona un nico
comportamiento en el siguiente juego en forma estratgica
u v
x 3,6 7,1
y 5,1 8,0
z 6,0 6,2
Fjate en que de momento slo hemos hablado de estrategias
estrictamente dominadas. Lo hemos hecho porque eliminar estrategias
dbilmente dominadas tiene sus riesgos... Te dars cuenta cuando hagas
la hoja de ejercicios correspondiente a este tema.
2.5.2 Estrategias racionalizables
Es cierto que el que la racionalidad de los agentes econmicos sea
conocimiento comn justica la eliminacin iterada de estrategias
estrictamente dominadas, y es ms, nos dice algo ms.
Denicion 13 Una estrategia o
I
es mejor respuesta a las estrategias de
los rivales o
I
si
n
I
(o
I
, o
I
) _ n
I
( o
I
, o
I
) for all o
I
Se dice que la estrategia o
I
es nunca una mejor respuesta si no existe
o
I
tal que o
I
es mejor respuesta.
Denicion 14 El conjunto de rationalizable strategies es el conjunto
de estrategias que sobreviven a la eliminacin de estrategias que nunca son
mejores respuesta.
Remark 11 Este concepto de racionalizacin fue desarrollado en 1984,
de forma independiente por Bernheim y Pierce y se basa en el siguiente
principio mnimo: "Yo, jugador i, elijo jugar o
I
porque creo que el jugador
, va a elegir o

porque cree que yo voy a jugar o


0
I
porque ... " y as hasta
el innito.
Proposicion 4 El conjunto de estrategias racionalizables
1. Siempre existe.
2. No depende del orden de eliminacin.
3. Puede calcularse en tiempo nito (para juegos nitos).
4. Es un subconjunto del conjunto de estrategias que sobreviven a la
eliminacin iterada de estrategias estrictamente dominadas.
5. No suele seleccionar un nico resultado.
40 2. Juegos con Informacin Perfecta
2.5.3 Equilibrio de Nash
Quiz el concepto de solucin ms conocido para juegos en forma
estratgica sea el concepto de equilibrio de Nash, propuesto por John Nash
en su tesis doctoral en el departamento de Matemticas de Princeton a
principios de la dcada de los 50.
Denicion 15 A prole of strategies (a

1
, ..., a

n
) is a Nash Equilibrium
if for each i
a

I
arg max
o
i
2.
i
n
I
_
a
I
, a

I
_
Loosely speaking, a Nash equilibrium is a prole of strategies such that
strategies are mutual best responses. Como es tan importante para el
desarrollo del curso, ahora la pongo en espaol.
Denicion 16 Sea ( = o
1
, ..., o
n
; n
1
, ..., n
n
un juego en forma normal o
estratgica. El perl de estrategias (:

1
, :

2
, ..., :

n
) es un equilibrio de Nash si
para cada jugador i, :

I
es su mejor respuesta a las estrategias de equilibrio
de los dems jugadores. Es decir
n
I
_
:

I
, :

I
_
_ n
I
_
:
I
, :

I
_
para todo :
I
o
I
Otra forma alternativa de escribirlo es la siguiente
:

I
arg max
fs
i
g
n
I
_
:
I
, :

I
_
El propio Nash en su tesis doctoral ofreci el siguiente teorema de
existencia.
Teorema 2 Sea ( = o
1
, ..., o
n
; n
1
, ..., n
n
un juego con informacin
completa y perfecta. Si el nmero de jugadores : es nito y el espacio
de estrategias para cada jugador es nito, entonces existe al menos un
equilibrio de Nash.
Demostracion. No.
Cuando John Nash le cont su nocin de equilibrio a John Von Neumann,
ste dijo Ah, slo es un punto jo. Why? La clave es la siguiente:
Utilicemos las funciones de mejor respuesta para, partiendo de un perl
de estrategias (mixtas), asignar a cada jugador su mejor respuesta a
las estrategias de los dems. Fjate en que acabamos con otro perl de
estrategias. Si coincide el perl con el que partimos con el perl al que
llegamos, entonces tenemos un equilibrio de Nash. ERGO: Slo necesitamos
demostrar la existencia de ese punto jo utilizando algn teorema de
existencia de puntos jos: Teorema de Brower, de Kakutani...
Denicion 17 Teorema del Punto Fijo de Brower. Sea ) () una
funcin continua y 1 un conjunto convexo y compacto. Entonces, ) () :
1 1 tiene un punto jo, i.e. ) (r) = r.
2.5 Conceptos de solucin para juegos en forma estratgica 41
Grcamente la cosa se ve claramente
Con la ayuda de estos grcos es relativamente fcil entender por qu se
necesitan todas las condiciones del teorema del punto jo de Brower.
42 2. Juegos con Informacin Perfecta
Veamos ahora cmo se relaciona este concepto de solucin con los vistos
anteriormente. Las dos siguientes proposiciones, tambin demostradas por
Nash, clarican el asunto:
Proposicion 5 En el juego en forma estratgica ( = o
1
, ..., o
n
; n
1
, ..., n
n
,
si la eliminacin iterativa de estrategias estrictamente dominadas elim-
ina todos los perles de estrategias menos uno, ste ltimo es precisamente
un equilibrio de Nash.
Proposicion 6 En el juego en forma estratgica ( = o
1
, ..., o
n
; n
1
, ..., n
n
,
si las estrategias (:

1
, :

2
, ..., :

n
) forman un equilibrio de Nash, entonces tales
estrategias sobreviven a la eliminacin iterativa de estrategias estricta-
mente dominadas.
Proposicion 7 The set of rationalizable strategies is a subset of the set
of strategies that survive the iterated elimination of dominated strategies.
Also, Nash equilibrium strategies are a subset of rationalizable strategies.
Bueno, ya que has visto cmo se calculan los equilibrios de Nash de un
juego, practica un poco con el siguiente juego estilizado de lanzamiento de
penalties.
Ejemplo 10 Penalty shot. Un portero frente a un delantero. El delantero
elige hacia qu lado de la portera tirar el baln (izquierda o derecha) y el
portero elige hacia qu lado de la portera tirarse (izquierda o derecha). En
el caso en el que ambos jugadores decidan el mismo lado, el portero para
el penalty mientras que si baln y portero van a palos distintos entonces es
gol. La representacin en forma estratgica de este juego es la siguiente
Forward
L R
Goalie L 1,-1 -1,1
R -1,1 1,-1
El conjunto de estrategias puras del portero es o
1o:|t:o
= 1, 1 mientras
que el conjunto de estrategias puras para el delantero es o
1tlon|t:o
=
1, 1. Para calcular el equilibrio de Nash calculemos las funciones de
mejores respuestas de cada jugador.
'1
1o:|t:o
(1) = 1
'1
1o:|t:o
(1) = 1
'1
1tlon|t:o
(1) = 1
'1
1tlon|t:Io
(1) = 1
En la matriz de pagos estn sealadas en negrita. Y como vers, no hay
ningn perl de estrategias que sean mejores respuestas mutuas. Por qu?
Pues porque los intereses de los jugadores son perfectamente opuestos (por
eso no puede haber un equilibrio de Nash en estrategias puras).
2.6 Estrategias mixtas 43
Ahora bien, hemos visto antes que todo juego nito (jugadores nitos,
espacio de estrategias nito) con informacin perfecta y completa tiene un
equilibrio de Nash. Dnde est el equilibrio del penalty?
La siguiente seccin te lo clarica.
2.6 Estrategias mixtas
Ya has sufrido en tus carnes el problema de restringirse a estrategias puras:
a veces no existen estrategias puras de equilibrio. Para entender el equilibrio
de Nash y su podero en toda su extensin, necesitamos ampliar la nocin
de estrategia.
Notacin 1 El espacio de estrategias puras para el jugador i se representa
por o
I
y un elemento, es decir, una estrategia pura para el jugador i se
representa por :
I
. El espacio de estrategias mixtas se representa o
I
y un
elemento (una estrategia mixta) por o
I
.
Denicion 18 Un tpico perl de estrategias puras puede escribirse :
o
1
... o
n
. Entonces, bajo el supuesto de randomizacin independiente,
la utilidad esperada para un jugador dada la estrategia mixta o es
n
I
_
o
I
, o

I
_
=

s2S
1
...S
n
j (:) n(:) =

s2S
1
...S
n

I2N
o
I
(:
I
) n(:)
Remark 12 El supuesto bsico es que los jugadores eligen de forma
independiente sus estrategias, ya sean puras o mixtas, antes de jugar. Una
vez elegida, los jugadores la utilizan en el juego.
Ahora ampliaremos la nocin de equilibrio de Nash para el caso de
estrategias mixtas, aunque la idea es la misma: buscamos perles de
estrategias que sean mejores respuestas mutuas, aunque claro, en el mundo
de las estrategias mixtas los jugadores utilizan la utilidad esperada.
Denicion 19 El perl de estrategias (o

1
, o

2
, ..., o

n
) es equilibrio de Nash
si
o

I
arg max
c2S
i
n
I
_
o
I
, o

I
_
Vale, no hay nada como practicar un poco para entender las cosas, as
que vamos a calcular el equilibrio del lanzamiento de penalty.
Ejemplo 11 Penalty shot revisited. Una estrategia mixta para el
portero es una distribucin de probabilidad denida sobre su espacio de
estrategias puras 1, 1. En este caso sea (1 j, j) en donde j es la
probabilidad de que el portero se tire a la derecha. De la misma forma,
una estrategia mixta para el delantero es una distribucin de probabilidad
44 2. Juegos con Informacin Perfecta
denida sobre su espacio de estrategias puras 1, 1. En este caso, sea
(1 , ) en donde es la probabilidad de que el delantero tire a la derecha
el penalty.
Forward
1
Goalie 1 j 1,-1 -1,1
j -1,1 1,-1
Observa que cada estrategia mixta de cada jugador se corresponde con un
nmero real en el intervalo [0, 1] por lo que cada perl de estrategias mixtas
del juego se corresponde con un punto (j, d) en [0, 1]
2
. Eso tiene su gracia
porque las estrategias mixtas en juegos 2x2 se pueden dibujar!!
Calculemos, al igual que en el caso de estrategias puras, las
correspondencias de mejores respuestas para cada uno de los jugadores.
Empecemos por el portero. Se enfrenta a un delantero que utiliza una
estrategia mixta o
1tl
: (1 , ). Por tanto
1l (1) = (1 ) (1) + (1) = 1 2
1l (1) = (1 ) (1) + (1) = 1 + 2
Como ya sabemos que el portero es racional, elegir la direccin que
mamixice su utilidad esperada
1l (1) 1l (1) = 1 2 (1 + 2)
= 2 (1 2)
Por tanto, la correspondencia de mejor respuesta es la siguiente
'1
1o:|t:o
(o
1tl
) =
_
_
_
j = 0 _
1
2
j [0, 1] =
1
2
j = 1 _
1
2
Esta correspondencia de mejor respuesta ya la sabamos... el portero, que
quiere parar el penalty, quiere tirarse al sitio que con mayor probabilidad
dispare el delantero. Bien, hagamos los mismos clculos para el delantero.
Se enfrenta a un portero que utiliza la siguiente estrategia mixta o
1o:
:
(1 j, j). Por tanto
1l (1) = (1 j) (1) +j (1) = 1 + 2j
1l (1) = (1 j) (1) +j (1) = 1 2j
Como ya sabemos que el portero es racional, elegir la direccin que
mamixice su utilidad esperada
1l (1) 1l (1) = 1 + 2 (1 2)
= 2 (2 1)
2.6 Estrategias mixtas 45
Por tanto, la correspondencia de mejor respuesta del delantero es la
siguiente
'1
1tl
(o
1o:
) =
_
_
_
= 1 j _
1
2
[0, 1] j =
1
2
= 0 j _
1
2
Esta correspondencia de mejor respuesta ya la sabamos... el delantero,
que quiere marcar gol, quiere disparar al lado contrario al que con mayor
probabilidad se tire el portero. Una vez calculadas las correspondencias
de mejores respuestas, debemos encontrar las estrategias mixtas que
son mejores respuestas mutuas, es decir, aquellas para las que las
correspondencias de mejores respuesta se cortan. Y para ello, un grco
es lo mejor
p
q
0
Curva de reaccin
del portero
Curva de reaccin
del portero
Equilibrio
de Nash
Penalty shot
Fjate en el equilibrio mixto que acabas de encontrar. Y fjate en lo curioso
que es... cada jugador elige la direccin con la misma probabilidad: 50%.
Qu tienen de especial los equilibrios en estrategias mixtas? Pues que en
ellos, cada jugador es indiferente entre cualesquiera estrategias puras sobre
las que est randomizando. Esto es importante porque ilustra un principio
general y nos da un atajo para encontrar equilibrios de Nash en estrategias
mixtas.
Claim 1 Una estrategia mixta es mejor respuesta a algo si y solo si cada
una de las estrategias puras a las que asigna probabilidad positiva es tambin
mejor respuesta a la misma cosa. Un jugador que optimiza usando una
estrategia mixta necesariamente ser indiferente entre todas las estrategias
46 2. Juegos con Informacin Perfecta
puras a las que a mixta asigna probabilidad positiva. Debe ser as porque
si no, entonces la mixta no sera mejor respuesta, sino la pura con mayor
pago esperado
Ejemplo 12 Penalty shot. Utilicemos este atajo para re-encontrar el
equilibrio en estrategias mixtas del lanzamiento de penalty. Estamos
buscando un par de estrategias mixtas (j

) que sean equilibrio. Hombre


pues entonces debe ser para el portero que se enfrenta a

1l (1) = 1l (1)
1 2

= 1 + 2

= 1,2
y para el delantero que se enfrenta a j

1l (1) = 1l (1)
1 + 2j

= 1 2j

= 1,2
2.6.1 Sobre la interpretacin de las estrategias mixtas
Las estrategias mixtas, que tan necesarias son en teora de juegos para que
realmente exita el equilibrio de Nash en una enorme variedad de juegos,
tienen varias interpretaciones.
1. Los jugadores eligen al azar. El tpico ejemplo se encuentra en
el juego del pquer. Supongamos que estamos jugando una partida
de pquer con las siguientes estrategias puras:{apuesto, me retiro}.
La estrategia pura "apostar si tengo buenas cartas y retirarme en
caso contrario} no es una estrategia que maximiza nuestra utilidad
esperada puesto que despus de un rato jugando, nuestros rivales
sabrn que nunca faroleamos... una vez que hayamos ganado la
reputacin de "no faroleador" es cuando debemos falorear. Y cuando
la gente piense que somos de los que faroleamos, es cuando debemos
empezar a no farolear. Eso signica que la estrategia ptima es
falorear de forma aleatoria. As pues, la estrategia ptima es mixta,
en la que se elige de forma aleatoria entre "apostar" y "no apostar".
2. El problema del argumento anterior es que no se aplica demasiado
bien a one-shot games -el penalti se va a lanzar una sola vez-. El
segundo argumento que consideraremos es el argumento de la
puricacin. En este caso, los jugadores no eligen aleatoriamente
sino que su decisin es completamente determinista. Sin embargo,
los rivales no tienen por qu conocer necesariamente el proceso
determinista por el cual un jugador elige su estrategia pura. Por
2.7 Conceptos de solucin para juegos en forma extensiva 47
ejemplo, la decisin acerca de las devaluaciones de las monedas son
tomadas por experto que desde luego no lanzan una moneda al aire y
deciden devaluar la moneda si sale cara. Sin embargo, sus decisiones
son difciles de predecir por los especuladores que, normalmente, no
conocen ni el procedimiento ni los datos utilizados por el Banco
Central. Ahora bien, argumentos puricadores de este tipo deben
ir acompaados de una descripcin detallada de cul es el proceso
que sigue cada jugador y de por qu es desconocido por sus rivales.
Desde esta perspectiva, un equilibrio en estrategias mixtas es una
descripcin de las probabilidades que jugadores racionales asignan
a las estrategias disponibles para sus rivales. En el tema cuarto
te presentar un ejemplo del argumento de puricacin de John
Harsanyi.
2.7 Conceptos de solucin para juegos en forma
extensiva
Recuerda el juego del secuestro del Presidente de los EEUU por un grupo
terrorista de Macartan Humphreys. Recuerda que hemos determinado su
forma extensiva. Bien, ahora vamos a calcular sus equilibrios de Nash
para ver si podemos aventurar una prediccin y saber si el Presidente ser
nalmente secuestrado o no. A mi me resulta siempre ms fcil expresar
el juego en forma estratgica (Jugadores, estrategias puras, funciones de
pagos) y calcular all los equilibrios de Nash. Mi representacin del juego
es la siguiente
Grupo
terrorista
Kidnap Do not kidnap
US Congress
Negociar No negociar
0
0
2
-1
-2
-2
Neg No
Kid 2,-1 -2,-2
No 0,0 0,0
Prediccin: Existen dos equilibrios de Nash
PERO OJO: En general, en el caso de juegos en forma extensiva, el
conjunto de estrategias de los jugadores es ms complicado que en el caso de
48 2. Juegos con Informacin Perfecta
juegos en forma estratgica. Lo que viene a continuacin no debes olvidarlo
en lo que te queda de vida, diga, de curso.
Denicion 20 Una estrategia pura para un jugador es un curso
completo de accin, es decir, debe especicar una accin en cada nodo en
el que el jugador tenga que tomar una decisin.
Bien, cul es el espacio de estrategias puras del grupo terrorista? Puede
elegir en un solo nodo y tiene dos acciones disponibles en ese nodo, as que
tenemos o
1
:
_
1, 1
_
. Para el Congreso de US, slo acta en uno nodo y
tiene dos acciones disponibles, as pues o
2
:
_
,
_
. Ya podemos escribir
la forma estratgica del juego
US Congress

Armed 1 2,1 2, 2
group 1 0,0 0,0
Una vez que tenemos la matriz de pagos, podemos calcular las
correspondencias de mejores respuesta y nalmente el equilibrio de Nash
del juego. Vemos que hay dos equilibrios de Nash:
_
1,
_
y (1, ). Vale,
cul es entonces nuestra prediccin acerca del comportamiento en este
juego? Es posible que creas que no podemos hacer ninguna prediccin,
pero te equivocas, porque ests pasando por algo el hecho de que nuestros
conceptos de solucin asumen que los jugadores son racionales... En este
caso, cul es la prediccin en este juego?
Observa la forma extensiva y representa el equilibrio de Nash (1, ).
Grupo
terrorista
Kidnap Do not kidnap
US Congress
Negociar No negociar
0
0
2
-1
-2
-2
Estas estrategias de equilibrio implican el secuestro y posterior
negociacin, dando lugar a unos pagos en equilibrio (2,-1). Forman un
equilibrio de Nash porque nadie mejora desvindose unilateralmente. Los
2.7 Conceptos de solucin para juegos en forma extensiva 49
terroristas estn encantados (consiguen un pago de 2, frente a un pago 0
si se desvan y no secuestran) y el US Congress no mejora si le da por no
negociar (el pago sera -2).
Sin embargo, el segundo equilibrio de Nash
_
1,
_
es justamente lo
opuesto. Tiene una senda de equilibrio que desemboca en el pago de
equilibrio (0, 0).
Grupo
terrorista
Kidnap Do not kidnap
Negociar No negociar
0
0
2
-1
-2
-2
Es ciertamente un equilibrio de Nash porque los terroristas no mejoran si
secuestran al US President (conseguiran un pago de -2) y el US Congress
est encantado, puesto que si se desva no mejora (consigue el mismo pago
0) porque la senda de equilibrio no pasa por su nodo y por lo tanto, en
equilibrio el US Congress no debe decidir nada.
Los dos son equilibrios pero uno de ellos es sospechoso. El segundo no
tiene pinta de reejar el comportamiento de jugadores racionales porque
incorporan una amenaza increble. No tiene sentido que los terroristas, que
saben que el Congreso es un jugador racional (maximizador inteligente de
su bienestar) crean que cuando le toque jugar al Congreso, el Congreso se
niegue a negociar, puesto que la no negociacin no es un juego racional
puesto que no maximiza el pago del US Congress (ofrece un pago de -2
frente a un pago de -1 si se negocia con los terroristas).
As pues, el equilibrio de Nash
_
1,
_
incorpora una amenaza
increble que no es digna de jugadores racionales. Es decir, si queremos
predecir el comportamiento de jugadores racionales, entonces no podemos
quedarnos con el concepto de equilibrio de Nash... hay que ir ms lejos y
eliminar los Nash que incorporen amenazas increbles.
Remark 13 Por qu el concepto de Equilibrio de Nash no detecta la
amenaza increble? Pues porque solo exige racionalidad en la senda de
equilibrio, y la amenaza no ocurre en equilibrio.
50 2. Juegos con Informacin Perfecta
Grupo terrorista
Kidnap Do not kidnap
US Congress
Negociar No negociar
0
0
2
-1
-2
-2
La forma tcnica de quitarnos del medio estos equilibrios de Nash
increbles es mediante el concepto de perfeccin en subjuegos: exigir
un comportamiento racional en todo subjuego, no slo en la senda de
equilibrio.
2.7.1 Equilibrio de Nash Perfecto en Subjuegos
Lo primero que tenemos que hacer es calcular lo que tcnicamente se
denominan subjuegos.
Denicion 21 Un subjuego:
1. empieza en un conjunto de informacin que contiene un solo nodo.
2. Incluye todos los nodos que le siguen en el juego.
3. Nunca corta ningn conjunto de informacin.
Cuando el juego es nito y no muy complicado, puede hacerse
grcamente sin ninguna dicultad. Eso es lo que hemos hecho con el juego
del secuestro del Presidente.
Tenemos un subjuego que empieza en el nodo donde decide el US
Congress. En este subjuego, la accin que maximiza los pagos del Congreso
es Negociar. Como el grupo terrorista sabe que el Congreso es racional, sabe
que el Congreso negociar. De esta forma, estamos descartando el equilibrio
2.7 Conceptos de solucin para juegos en forma extensiva 51
100
0
300
0
500
0
10
10
0
200
0
400
0
600
1 2 1 2 1 2
A a A a A a
D d D d D d
de Nash
_
1,
_
.
Grupo
terrorista
Kidnap Do not kidnap
US Congress
Negociar No negociar
0
0
2
-1
-2
-2
Qu tiene de raro este equilibrio de Nash?
En este subjuego, US Congress hace algo raro
Amenaza Increble
Neg No
Kid 2,-1 -2,-2
No 0,0 0,0
Equilibrio de Nash: (No kidnap, No
negotiation)
Criterio 1 Fjate en que el propio juego cumple la denicin de subjuego,
por lo que algunos autores sugieren que todo juego siempre tiene un
subjuego: the game itself. Vale. Est bien porque de esa forma todo juego
tienen un equilibrio perfecto en subjuegos y ste puede entenderse como un
renamiento del concepto de equilibrio de Nash.
Todo lo anterior motiva la siguiente denicin
Denicion 22 Un perl de estrategias o

en un juego en forma extensiva


es perfecto en subjuegos si implica un equilibrio de Nash en cada
subjuego (propio).
Bien, si piensas que controlas la perfeccin en subjuegos,entonces prueba
con el siguiente ejercicio.
Ejercicio 6 Rosentals Centipede. Dos amigos tienen un billete de
1000 euros y estn pensando en el reparto. El profesor de micro les cuenta
el siguiente juego.
52 2. Juegos con Informacin Perfecta
2
1
1
3
0
1
1
2
0
0
2
L
L
L
R
R
R
El resto de esta seccin est dedicada a
1. Reforzar el concepto de estrategia en un juego en forma extensiva
2. Entender que lo importante de un equilibrio es lo que pasa fuera del
equilibrio.
2.7.2 Estrategias en juegos en forma extensiva
Esta seccin aparece aqu para reforzar la comprensin del concepto
de estrategia pura en juegos en forma extensiva. Piensa en la siguiente
situacin con interdependencia estratgica.
Calculemos el espacio de estrategias puras para cada uno de los
jugadores.
Jugador 1: Tiene dos nodos donde elegir, as pues, el conjunto de
estrategias puras debe tener dos componentes: la primera que nos
diga qu hacer en el primer nodo y la segunda que nos diga qu
hacer en el segundo nodo. Como en cada nodo hay dos acciones, el
espacio de estrategias puras del jugador 1 tiene 2 2 = 4 elementos:
o
1
= 11
00
, 11
00
, 11
00
, 11
00

Jugador 2: Tiene un solo nodo en donde elegir, con dos acciones


disponibles. As pues su espacio de estrateigas tiene 1 2 = 2
elementos; a saber, o
2
= 1
0
, 1
0

2.7.3 Lo importante de un equilibrio es lo que no se ve


Piensa en el siguiente juego en forma extensiva
2.7 Conceptos de solucin para juegos en forma extensiva 53
1
L R
2 2
L R L R
3
1
1
2
2
1
0
0
El jugador 1 elige en un solo nodo (llammoslo nodo a) y en ese nodo
tiene dos acciones 1, 1. As pues, su espacio de estrategias puras es
o
1
= 1, 1, mientras que el jugador 2 tiene dos nodos en los que pone
su nombre -el de la izquierda (b) y el de la derecha (c)- y en cada uno
de ellos tiene dos acciones 1
0
, 1
0
. Por tanto, su espacio de estrategias
puras tiene cuatro elementos: o
2
= 11, 11, 11, 11, donde la primera
accin de cada elemento es la accin que realizar el jugador 2 en el nodo
de la izquierda (b) y la segunda accin de cada elemento es la accin que
realizar en el nodo de la derecha (c).
Calculemos los equilibrios de Nash del juego. Como ya sabes, ayuda
mucho escribir la forma normal del juego.
LL LR RL RR
left 1,0 1,0 2,3 2,3
right 0,1 3,2 0,1 3,2
La correspondencia de mejor respuesta de cada jugador es la siguiente:
'1
1
(11) = 1
'1
1
(11) = 1
'1
1
(11) = 1
'1
1
(11) = 1
y
'1
2
(|) = 11, 11
'1
2
(r) = 11, 11
Por tanto, existen tres equilibrios de Nash: (1, 11) , (1, 11) , (1, 11).
Ahora calculemos cul de ellos es el perfecto en subjuegos. Para ello, utiliza
el mtodo de la induccin hacia atrs. Esto nos revela que el equilibrio
(1, 11) es el nico perfecto en subjuegos.
Centrmonos en el equilibrio (1, 11). Este equilibrio prescribe al jugador
2 que juegue la accin L en el nodo b. Pero esto es irracional, puesto que
54 2. Juegos con Informacin Perfecta
en ese nodo, la accin R proporcionar un pago mayor (30). De forma
similar, el equilibrio (1, 11) prescribe que el jugador 2 juegue la accin L
en el nodo c. De nuevo es irracional, puesto que la accin R da un pago 2
que es mayor que el pago de L que es 1.
Es posible que alguien argumente que es irrelevante que el jugador 2
juegue de forma irracional en el nodo c cuando el equilibrio es (1, 11),
porque el nodo c no ser alcanzado si el jugador 1 sigue su estrategia de
equilibrio l. Sin embargo, esto es un enorme error. Si eres de los que piensas
as, lee con atencin el prrafo que sigue.
La razn por la que los jugadores continuan usando sus estrategias de
equilibrio es por lo que pasara si se desviaran. Suponga por ejemplo
que algn libro de Teora de Juegos recomendara al algn jugador racional
que jugara el equilibrio (1, 11). Despus de leer el libro, el jugador 1
anticipara que el jugador 2 jugar R en el nodo b y L en el nodo c.
El, por tanto, querra seguir el consejo del libro y utilizar la estrategia
1, puesto que sta le asegura un pago de 2 mientras que la accin 1
slo proporciona un pago de 0. As pues, el nodo c no ser alcanzado
en equilibrio. Sin embargo, lo que recomienda el libro para el nodo c no es
irrelevante. Es precisamente lo que pasa en este nodo lo que hace
que el jugador 1 no juegue r!!! Pero el jugador 1 no debera asustarse
tanto... En vez de creer en el libro de Teora de Juegos, debera hacerse
la siguiente pregunta: Yo se que el jugador 2 es racional, por tanto, si me
desvio de la recomendacin del libro y juego r y el nodo c es alcanzado,
de verdad que va a utilizar la estrategia L como dice el libro que tiene que
hacer?. La respuesta es NO, puesto que la estrategia L en el nodo c es una
amenaza no creble, puesto que el jugador 2, que es racional, lo que quiere
es maximizar su utilidad, y esto lo consigue jugando R y no L como dice
el libro. Dado que es irracional jugar L en el nodo c, el jugador 1 concluye
que el consejo del libro no tiene valor ninguno.
Intenta hacer tu el mismo anlisis para el caso del otro equilibrio de Nash
que no es perfecto en subjuegos, es decir, detecta la amenaza no creble del
jugador 2.
Esta es la razn por la que la Teora de Juegos no puede recomendar
equilibrios de Nash que incorporen amenazas no crebles en nodos que no
pertenezcan a la senda de equilibrio. Esta es la razn por la que la Teora
de Juegos exige algo ms que Nash para hacer una recomendacin: La
Perfeccin en Subjuegos.
This is page 55
Printer: Opaque this
3
Juegos con Informacin Imperfecta
En el tema anterior hemos estudiado juegos de informacin perfecta, es
decir, juegos en los que todos jugadores conocen la historia completa del
juego en cada nodo en los que tengan que jugar.
En este tema estudiaremos cmo ampliar los conceptos de solucin
que tenemos al caso de informacin imperfecta. Una vez que lo sepamos,
pasaremos a considerar en el tema siguente la informacin incompleta.
3.1 Primeros ejemplos
Ahora quiero considerar juegos con informacin imperfecta, aunque sin
saberlo algn que otro juego con informacin imperfecta ya conocis.
Cul? Piensa por ejemplo en el dilema de presos. Es un juego con
informacin imperfecta, porque la eleccin de los jugadores se realiza de
forma simultnea. Su forma extensiva es la siguiente. (-1 signica un ao
56 3. Juegos con Informacin Imperfecta
de crcel)
Confesar Callar
Confesar Callar Confesar Callar
-6 0 -9 -1
-6 -9 0 -1
Preso 1
Preso 2
Dado que el concepto de informacin imperfecta implica que los jugadores
no saben para algn conjunto de informacin en qu nodo se encuentran
No os parece razonable que habra que complementar la nocin de
equilibrio de Nash con la inclusin de creencias en cada conjunto de
informacin?
Cmo debera razonar el preso nmero 2? Tiene dos nodos cuando le
toca jugar. l debe asignar creencias a cada uno de los nodos. Sea p su
creencia de estar en el nodo de la izquierda y 1-p la de estar en el nodo
de la derecha. Como es racional, debe elegir la estrategia que maximice sus
pagos esperados.
Si elige confesar obtiene: -6p + 0(1-p) = -6p
Si elige callar obtiene: -9p (1-p) = -8p -1 = -6p 2p - 1
La diferencia entre el pago de confesar y callarse es -6p (-8p -1) = -6p
+ 8p + 1 = 1 + 2p 0.
Luego el preso 2 debe elegir la accin confesar.
Como la racionalidad de los agentes es conocimiento comn, el preso 1
puede hacer el razonamiento del preso 2 y saber que el preso 2 elegir la
accin confesar. Por tanto, l debe elegir la accin que maximice sus pagos
esperados.
Si elige confesar entonces su pago esperado es -6
Si elige callar entonces su pago esperado es -9
Como es racional, entonces elige la accin confesar.
Ya tenemos el equilibrio: Co:)c:ar, Co:)c:ar; j = 1
Piensa ahora en el siguiente juego con informacin imperfecta
I C
1 D
i d i d
2
2 0 0 0
1 0 2 1
1
3
3.1 Primeros ejemplos 57
Fjate en que cuando le toca jugar al jugador 2, lo nico que sabe es que
el jugador 1 no ha elegido la accin D, pero no sabe si ha elegido I o C.
Qu es una estrategia pura para el jugador 1? Una accin (I, C o D)
Qu es una estrategia pura para el jugador 2? Una accin (i o d)
Para calcular los equilibrios de Nash, es una buena idea escribir la forma
estratgica del juego.
1,3 1,3 D
0,1 0,2 C
0,0 2,1 I
d i
1,3 1,3 D
0,1 0,2 C
0,0 2,1 I
d i
Como vemos, hay dos equilibrios de Nash: (I,i) y (D,d)
Analicemos el primero de ellos: (I,i). El jugador 2 tiene una estrategia
estrictamente dominada (d est dominada por i) por lo que su decisin
de jugar i est ms que justicada por su racionalidad. Como la
racionalidad es conocimiento comn, el jugador 1 cree que el jugador
2 va a jugar i y por tanto elige la estrategia I que maximiza sus pagos.
Hasta aqu todo perfecto.
Veamos el segundo equilibrio (D,d). Fjate en que el equilibrio (D,d)
es curioso, porque est basado en una amenaza no creble (pero muy
provechosa para el jugador 2). Por qu no lo caza el concepto de
equilibrio de Nash? Porque la irracionalidad ocurre fuera de la senda
de equilibrio. Pues apliquemos la perfeccin en subjuegos que est
diseada para cazar irracionalidades fuera de la senda... oh, oh...
este juego no tiene subjuegos propios por lo que (D,d) es perfecto
en subjuegos. Qu hacemos entonces? Extendamos el espritu de la
perfeccin en subjuegos a juegos con informacin imperfecta
En cada conjunto de informacin, el jugador que decide tiene
que tener unas creencias acerca del nodo en el que se encuentra.
Cuando el juego alcanza el conjunto de informacin del jugador
2, ste debe tener una conjetura acerca de qu nodo ha sido
alcanzado es decir, acerca de cul ha sido la accin del jugador
1. Sea [j, 1 j]
Dadas las creencias, las estrategias de los jugadores deben
ser secuencialmente racionales. Es decir, en cada conjunto de
informacin, la accin tomada por el jugador al que le toca
jugar y su estrategia subsiguiente deben ser ptimas, dada la
conjetura del jugador en ese conjunto de informacin y las
58 3. Juegos con Informacin Imperfecta
subsiguientes estrategias de los dems jugadores. En este caso,
el pago esperado de jugar i es j + 2(1 j) mientras que el
pago esperado de jugar d es (1 j) . Como vemos, es trivial
comprobar que el pago esperado de i supera al de d. Problema
arreglado: Hemos eliminado la amenaza increble.
Fjate en que hemos eliminado el equilibrio no razonable (D,d) mediante
la introduccin de creencias. Fjate que como el jugador 2 tena una
estrategia estrictamente dominada, no importa el valor particular de su
creencia acerca del nodo en el que se encuentra para poder eliminar el
equilibrio poco razonable. Sin embargo, hay veces en las que el valor
particular de las creencias va a ser muy importante... Y esto nos lleva
a la siguiente pregunta: cul es el proceso racional de formacin de
creencias?
3.2 La Regla de Bayes
En esta seccin vamos a ver cul es el proceso racional de formacin de
creencias. Ahora bien, por ms que sea el proceso racional de formacin de
creencias, la mayora de la gente (i) no sabe cul es, (ii) no sabe aplicarlo
y (iii) no suele aplicarlo.
Para que veas que no te miento, analicemos el llamado Show de Monty
Hall.
3.2.1 El Show de Monty Hall
Imagnate que participas en un concurso de televisin en el que hay tres
premios (dos cabras y un coche) y tres puertas. Detrs de cada puerta
(llmalas A, B y C) se esconde hay un regalo y slo uno. Imagnate que
eliges la puerta A. El presentador, Monty, que conoce dnde estn los
premios, antes de abrir la puerta que ha elegido, abre otra, por ejemplo
la C, y te ensea una cabra.
1
Y Monty te pregunta si te quedas con la
puerta que elegiste, la A, o quieres cambiar de puerta. Qu haras t?
Los datos siguientes corresponden a las respuestas de los alumnos del
curso 2006/07:
Da igual cambiar: Tengo el 50% de ganar el coche si me quedo y el
50% si me cambio (80%)
No cambio: Por diversas razones, pero una que me ha gustado mucho
es MIN REGRET (18%)
1
Siempre es posible abrir una puerta en la que haya una cabra puesto que hay dos
puertas que esconden una cabra.
3.2 La Regla de Bayes 59
Cambiar: (2%)
Veamos cmo debemos responder a este problema. Para ello, la siguiente
tabla ayuda un montn
Mundos
Posibles
Probabili
dad de
cada
mundo
Detrs
de la
puerta
elegida
por mi
hay
Probabilidad de
coche en la
tercera puerta
condicionada a
ver una cabra
en la segunda
puerta
Si no
cambio mi
decisin
inicial, gano
el coche
con
probabilidad
Si cambio la
decisin
inicial, gano
el coche
con
probabilidad
1 1/3 Cabra 1 0 1
2 1/3 Cabra 1 0 1
3 1/3 Coche 0 1 0
Probabilidad de ganar el coche: 1/3 2/3
Como ves, lo correcto es cambiar de puerta, puesto que multiplicas por
dos las posibilidades de llevarte el coche. Como estoy seguro de que no
te parece lo correcto, te pongo un razonamiento genial que entontr en
internet.
60 3. Juegos con Informacin Imperfecta
3.2.2 La Baraja Espaola
Como sigues sin enterarte a lo mejor es que las cabras te pillan lejos
, estudiemos algo ms prximo a ti: la baraja espaola. Respondamos a
la siguiente pregunta: cul es la probabilidad de que al elegir una carta
al azar de una baraja espaola estndar, esta sea el as de espadas? Su
respuesta es trivial 1,40 porque hay 40 cartas y slo una de ellas es el As
de Espadas. Bien. Ahora mira la forma racional de hacerlo:
Primera forma:
Pr (1:jada :) = Pr (1:jada:) Pr ( :[ 1:jada:) =
1
4

1
10
=
1
40
Segunda forma:
Pr (: 1:jada:) = Pr (:) Pr ( 1:jada:[ :) =
1
10

1
4
=
1
40
Estas formas nos dicen varias cosas, entre ellas que tu respuesta intuitiva
es correcta. Pero nos dice algo ms
Pr (1:jada:) Pr ( :[ 1:jada:) = Pr (:) Pr ( 1:jada:[ :)
de donde
Pr ( :[ 1:jada:) =
Pr (:) Pr ( 1:jada:[ :)
Pr (1:jada:)
=
Pr (: 1:jada:)
Pr (1:jada:)
Esta formulilla extrada del juego de cartas es la llamada Regla de Bayes y
es muy til porque si donde pone Espadas pones Estar en el conjunto de
informacin y donde pone As pones Estar en el nodo de la izquierda
entonces ya sabes cmo a partir de las estrategias de los jugadores, se
pueden calcular las creencias en los juegos con informacin imperfecta.
Veamos los ejemplos anteriores, empezando por los presos y Bayes
Confesar Callar
Confesar Callar Confesar Callar
-6 0 -9 -1
-6 -9 0 -1
Preso 1
Preso 2
[p] [1 p]
Sea j es la probabilidad de que estando en el conjunto de informacin (en
este libro lo denotaremos por ), estemos en el nodo de la izquierda.
3.2 La Regla de Bayes 61
Dadas las estrategias de equilibrio podemos calcular el valor de esta creencia
p a partir de la Regla de Bayes:
j = Pr ( 1.[ ) =
Pr (1.) Pr ( [ 1.)
Pr ()
=
1 1
1
= 1
Veamos ahora el segundo ejemplo y el equilibrio (I,i)
I C
1 D
i d i d
[p] 2 [1-p]
2 0 0 0
1 0 2 1
1
3
La creencia que debe acompaar a este equilibrio es p, donde p es la
probabilidad de que estando en el conjunto de informacin (en este libro
lo denotaremos por ), estemos en el nodo de la izquierda. Dadas las
estrategias de equilibrio podemos calcularla a partir de la Regla de Bayes:
j = Pr ( 1.[ ) =
Pr (1.) Pr ( [ 1.)
Pr ()
=
1 1
1
= 1
Considera ahora el equilibrio (D,d) de este segundo juego
I C
1 D
i d i d
2 0 0 0
1 0 2 1
1
3
[p] 2 [1-p]
Calculemos de nuevo la probabilidad p a partir de la regla de Bayes y
las estrategias de equilibrio:
j = Pr ( 1.[ ) =
Pr (1.) Pr ( [ 1.)
Pr ()
=
0 1
0
=
0
0
Fjate en que nos hemos topado con algo curioso, con una
indeterminacin... Qu est fallando aqu? Pues que la Regla de Bayes
62 3. Juegos con Informacin Imperfecta
slo puede aplicarse a eventos que tienen probabilidad positiva de ocurrir...
es decir, no pueden aplicarse a eventos imposibles. Sin embargo, a la luz
de las estrategias de equilibrio que estamos analizando, pedirle al jugador
2 que tenga creencias en su conjunto de informacin es pedirle que crea en
algo imposible, porque si el jugador 1 juega de acuerdo a su estrategia D,
entonces nunca, nunca, nunca se va a dar el caso de que el jugador 2 tenga
que elegir.
Es algo as como exigir al jugador 2 que nos diga de qu color cree l que
son los extraterrestes... si los extraterrestres no existen!! Ya, ya, ya s que
no existe, pero venga dime de qu color crees que son? Es ms probable
que sean verdes, como los pinta el imaginario popular, o es ms probable
que sean azules?
GOD
Green
aliens
Blue
aliens
No aliens
TU
[p] [1-p]
An cuando el color de los extraterrestres te pueda parecer frvolo (o si
quieres algo con ms enjundia piensa en la discusin bizantina acerca del
sexo de los ngeles), en Teora de Juegos sin embargo es muy importante lo
que crea el jugador 2 en su conjunto de informacin, porque esas creencias
dan sentido a su estrategia en ese conjunto de informacin (esa estrategia
debe ser lo que maximiza su utilidad) y esa estrategia en ese conjunto de
informacin da sentido a la estrategia D del jugador 1: el jugador 1 elige
D porque es lo mejor para l, porque si se desva entonces ganan menos
porque el jugador 1 cree que el jugador 2 jugar d y cree eso porque d es
lo que maximiza el pago del jugador 2...
Ves como en la base del concepto de Equilibrio en Teora de Juegos est
el color de los extraterrestres?
3.3 Creencias Consistentes
Dado que el problema es que al considerar estrategias puras algunos
conjuntos de informacin no se alcanzan en equilibrio, perturbemos las
estrategias puras y consideremos unas estrategias mixtas que converjan
3.3 Creencias Consistentes 63
a las puras. En los mundos perturbados s que podemos aplicar Bayes
para calcular todas las creencias. . . Entonces podemos pensar en que slo
valen las creencias que sean el lmite de la creencias segn Bayes de alguna
perturbacin de las puras. De esta forma, estas creencias sern consistentes
con las estrategias de equilibrio y con la Regla de Bayes.
Denicion 23 Consistency: An assessment j, / for a nite extensive
form game is consistent if there is a sequence of completely mixed
strategies /
n
, converging to /, such that the associated sequence of Bayes
rule induced system of beliefs j
n
converges to j.
Vayamos aplicando la idea de consistencia a los ejemplos anteriores,
porque esa denicin es la que vamos a manejar a lo largo del curso. Como
siempre, empecemos por nuestros viejos conocidos de Carabanchel.
lim
:!0
_
_
_
_
_
_
_
_
_
_
j
:
=
(1:)
(1:)+:
= 1 -
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
j = 1
_
_
_
_
_
_
_
_
_
_
Lo primero es calcular el equilibrio de Nash del juego. Recuerda que
era Confesar, Confesar. Lo segundo es complementar dichas estrategias
con creencias consistentes. Para ello nos jamos en unas estrategias
completamente mixtas que convejan a la pura que nos interesa. La mixta
asociada es hacer que el preso 1 juegue Confesar con probabilidad 1 - y
juegue Callar con probabilidad -.
2
Conforme - tiende a cero, tenemos que
la estrategia mixta converge a la pura que nos interesa. Muy bien, ahora
en el mundo perturbado de las mixtas calculamos las creencias del preso 2
dadas las estrategias de equilibrio y la Regla de Bayes.
j
:
=
(1 -)
(1 -) +-
= 1 -
Y nalmente calculamos el lmite de las creencias perturbadas conforme
la estrategia mixa converge a la pura, es decir, conforme - 0.
lim
:!0
j
:
= lim
:!0
(1 -)
(1 -) +-
= lim
:!0
(1 -) = 1
2
Tambin podemos hacer que el jugador 2 juegue una mixta que converja a la pura
Confesar. Pero recuerda que queremos considerar mixtas para que todos los conjuntos
de informacin sean alcanzados con probabilidad positiva, y claro despus de que juegue
el jugador 2 no existe ningn conjunto de informacin, por lo que su mixta es irrelevante
para el requisito de consistencia de las creencias.
64 3. Juegos con Informacin Imperfecta
Y obtenemos j = 1. Cmo interpretamos lo que hemos obtenido? Pues
decimos que la creencia p=1 es consistente con las estrategias (Confesar,
Confesar) porque hemos encontrado una perturbacin de las estrategias
originales que convergen a la pura y en la que la secuencia de creencias en
el mundo perturbado calculadas a partir de la Regla de Bayes converge a
j = 1.
Practiquemos con otro ejemplo... en este caso, el equilibrio (D,.d) en el
segundo juego... s, ese en el que no podamos aplicar la Regla de Bayes.
Veamos si la creencia p=1/2 es consistente. Es decir, veamos si podemos
encontrar la perturbacin de la pura D tal que la secuencia de creencias
perturbadas calculadas segn la Regla de Bayes converge a 1/2.
lim
:!0
_
_
_
_
_
_
_
_
_
_
j
:
=
"
2
"
2
+
"
2
=
1
2
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
j =
1
2
_
_
_
_
_
_
_
_
_
Como siempre, la mixta consiste simplemente en poner probabilidad 1-
en la estrategia pura de equilibrio, en este caso 1, y repartir la probabilidad
que hemos quitado, -, entre las estrategias restantes. En este caso, la
probabilidad - la hemos repartido a partes iguales entre las estrategias 1 y
C. Como vemos, esta perturbacin nos ensea que j = 1,2 es consistente.
Pero no es la nica creencia consistente en este caso, piensa si no en la
creencia p=3/4. La perturbacin relevante es ahora repartir la probabilidad
- de otra forma entre las estrategias I y C... ahora pongamos
3
4
- a la
estrategia I y
1
4
- a la estrategia C.
lim
:!0
_
_
_
_
_
_
_
_
_
_
_
j
:
=
3"
4
3"
4
+
1"
4
=
3
4
_
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
j =
3
4
_
_
_
_
_
_
_
_
_
_
Bien, espero que ya le hayas pillado el truco. En este juego y para el
equilibrio de Nash (1, d), cualquier creencia j (0, 1) es consistente puesto
que podemos encontrar una perturbacin de las mixtas que converja a la
pura D (en este caso la mixta sera jugar I con probabilidad j-, jugar C
con probabilidad (1 j) - y jugar D con probabilidad 1 -) y en la que
3.4 Equilibrio Secuencial 65
la secuencia de creencias en el mundo perturbado calculadas a partir de la
Regla de Bayes converge a j = j.
Tcnicamente hablando nos quedara por demostrar que las creencias
j = 0 y j = 1 son tambin consistentes para este juego. Para ello no
podemos utilizar las perturbaciones anteriores porque necesariamente la
perturbacin debe considerar una estrategia completamente mixta. Por
completitud, mostramos ahora la perturbacin que genera la creencia
consistente j = 1 y dejamos al lector que piense la correspondiente a j = 0.
lim
:!0
_
_
_
_
_
_
_
_
_
_
j
:
=
:
:+:
2
=
1
1+:
_
_
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_
_
_
_
I C
1 D
i d i d
2 0 0 0
1 0 2 1
1
3
[1] 2 [0]
j = 1
_
_
_
_
_
_
_
_
_
_
3.4 Equilibrio Secuencial
A lo largo del tema estamos viendo cmo generalizar el espritu de la
perfeccin en subjuegos a juegos con informacin imperfecta. La clave
del asunto parece estar en exigir por un lado que en cada conjunto de
informacin el jugador que juegue deba tener unas creencias acerca de en
qu nodo de dicho conjunto se encuentra y por otro lado que la estrategia
que elija sea la mejor para l. En la seccin anterior vimos el requisito
que deben cumplir las creencias de los jugadores. En esta seccin vamos a
formalizar el segundo requisito, el requisito sobre las estrategias, utilizando
el concepto de racionalidad secuencial.
Denicion 24 Un assessment j, / para un juego nito en forma
extensiva es secuencialmente racional si para cada jugador i, cada
conjunto de informacin 1 de i y cada estrategia del jugador i, tenemos
que
n
I
( j, /[ 1) _ n
I
( j, (/
0
, /
I
)[ 1)
Es decir, si ningn jugador en ningn conjunto de informacin del juego
tiene un incentivo a cambiar de estrategia. Fjate en que no decimos
conjuntos de informacin alcanzados con probabilidad positiva...
Ya estamos en disposicin de denir el concepto de equilibrio relevante
para los juegos con informacin imperfecta: El Equilibrio Secuencial de
Kreps y Wilson (1982).
Denicion 25 Un assessment j, / en un juego nito en forma extensiva
es un Equilibrio Secuencial si (i) es consistente y (ii) secuencialmente
racional.
66 3. Juegos con Informacin Imperfecta
Ya tenemos nuestro concepto de solucin denido sobre juegos en forma
extensiva con informacin imperfecta. Ahora debemos practicar un poco
con l para que te des cuenta de que no es tan ero como parece .
Considera el siguiente juego en forma extensiva con informacin
imperfecta.
I C
1 D
i d i d
2
3 0 1 0
1 0 0 1
2
2
Empecemos por calcular sus equilibrios de Nash. Para ello, construyamos
la forma estratgica del juego
2,2 2,2 D
0,1 1,0 C
0,0 3,1 I
d i
2,2 2,2 D
0,1 1,0 C
0,0 3,1 I
d i
Como vemos este juego tiene dos equilibrios de Nash: (I,i) y (D,d).
Tratemos ahora de completar estos equilibrios de Nash con creencias
que sean consistentes y veriquemos nalmente si las estrategias son
secuencialmente racionales para poder decir que hemos encontrado los
equilibrios secuenciales de este juego.
Empecemos por el equilibrio de Nash (I,i). Como siempre, dibjalo
porque las cosas se ven mejor.
I C
1 D
i d i d
2
3 0 1 0
1 0 0 1
2
2
[p] [1-p]
Consistencia:Dado que el conjunto de informacin pertenece a la
senda de equilibrio, podemos aplicar directamente la Regla de Bayes.
En este caso, la creencia consistente con la Regla de Bayes y las
estrategias de equilibrio es j = 1.
3.4 Equilibrio Secuencial 67
Secuencialidad racional. Debemos ir jugador por jugador y demostrar
que en cada conjunto de informacin, su estrategia de equilibrio
maximiza sus pagos dadas sus creencias y las estrategias de los dems.
Jugador 1. Su estrategia de equilibrio es 1. Si hace caso, su pago
es n
1
(1) = 3. Para ver que es lo mejor dadas sus creencias y
las estrategias de los dems jugadores veamos qu obtiene si se
desvia. Y va a ser que s porque n
1
(C) = 1 y n
1
(1) = 2.
Jugador 2: Su estrategia de equilibrio es i. Si la sigue, entonces
su pago, dadas sus creencias y las estrategias de los dems
jugadores, es n
2
(i) = 1. Si se desva, tenemos n
2
(d) = 0.
Acabamos de encontrar nuestro primer equilibrio secuencial: 1, i; j = 1.
Analicemos ahora el segundo equilibrio de Nash: (1, d). Como siempre,
empecemos por el dibujo.
I C
1 D
i d i d
2
3 0 1 0
1 0 0 1
2
2
[p] [1-p]
Creencias: No podemos aplicar directamente la Regla de Bayes porque
el conjunto de informacin del jugador 2 no pertenece a la senda de
equilibrio. Considera la siguiente estrategia mixta para el jugador
1: jugar I con probabilidad j-, jugar C con probabilidad (1 j) -
y jugar D con probabilidad 1 -, con j [0, 1]. Observa que esta
mixta converge a la pura D -la del equilibrio de Nash que estamos
tratando de ascender a Secuencial- y que las creencias perturbadas
j
:
=
b :
b :+(1b ):
convergen a j, por lo que cualquier creencia j [0, 1]
es consistente.
3
Secuencialidad Racional: Ahora debemos ir jugador por jugador y
ver que en cada conjunto de informacin, su estrategia de equilibrio
maximiza sus pagos dadas sus creencias y las estrategias de los dems.
Jugador 1: El equilibrio dice que juegue 1, con un pago asociado
n
1
(1) = 2. Las dos desviaciones posibles son peores: n
1
(1) = 0
y n
1
(C) = 0.
3
A mi personalmente me gusta decir que en este caso las creencias estn libres, puesto
que el requisito de consistencia no impone ninguna restriccin sobre los valores admisibles
para las creencias.
68 3. Juegos con Informacin Imperfecta
Jugador 2: El equilibrio dice que juegue la estrategia d, con
un pago asociado n
2
(d) = j0 + (1 j) 1 = 1 j. Para que
se cumpla el requisito de secuencialidad racional tiene que ser
que las desviaciones sean peores, es decir que n
2
(d) _ n
2
(i) =
j1 + (1 j) 0 = j. Es decir, debemos tener
n
2
(d) _ n
2
(i)
1 j _ j
1
2
_ j
Por tanto, hemos encontrado toda una familia de equilibrios secuenciales
asociados al perl de estrategias (D,d). La familia es
_
1, d; j _
1
2
_
.
Finalizamos esta seccin con un ltimo juego un poco ms complicado
que los anteriores porque es de tres jugadores. La forma extensiva es la
siguiente
1 L
A
2
I D
3
i d i d
1 3 0 0
2 3 1 1
1 3 2 1
2
0
0
Empecemos por calcular los equilibrios de Nash de este juego mediante
la forma estratgica del juego.
d i
0,1,1 3,3,3 A 0,1,2 1,2,1 A
2,0,0 2,0,0 L 2,0,0 2,0,0 L
D I D I
d i
0,1,1 3,3,3 A 0,1,2 1,2,1 A
2,0,0 2,0,0 L 2,0,0 2,0,0 L
D I D I
Observa que existen cuatro equilibrios de Nash en estrategias puras pero
que slo uno de ellos es perfecto en subjuegos, porque este juego tiene un
subjuego que comienza con el nodo en el que el jugador 2 debe elegir su
estrategia.
3.4 Equilibrio Secuencial 69
En dicho subjuego, existe una estrategia dominante para el jugador 2 que
es Izquierda, por lo que el nico equilibrio de Nash Perfecto en Subjuegos
es (, 1, d).
Ahora vamos a calcular los equilibrios secuenciales de este juego.
Para que la cosa vaya funcionando y de verdad el secuencial sea la
extensin natural del perfecto en subjuegos cuando hay informacin
imperfecta deberamos ser capaces de demostrar que slo se pueden
construir equilibrios secuenciales en este juego a partir de equilibrios de
Nash perfectos en subjuegos.
Empecemos por el que sabemos que debe salir, el perfecto en subjuegos...
como siempre el dibujo por delante
1 L
A
2
I D
[p] 3 [1-p]
i d i d
1 3 0 0
2 3 1 1
1 3 2 1
2
0
0
Consistencia: Podemos aplicar directamente la Regla de Bayes porque
el conjunto de informacin del jugador 2 pertenece a la senda de
equilibrio. Ergo j = 1 es la nica creencia consistente dado estas
estrategias de equilibrio.
Secuencialidad Racional: Ahora debemos ir jugador por jugador y
ver que en cada conjunto de informacin, su estrategia de equilibrio
maximiza sus pagos dadas sus creencias y las estrategias de los dems.
Jugador 1: El equilibrio dice que juegue , con un pago asociado
n
1
() = 3. La nica desviacin no mejora su pago puesto que
n
1
(1) = 2.
Jugador 2: El equilibrio dice que juegue la estrategia 1, con un
pago asociado n
2
(1) = 3. La nica desviacin posible tampoco
mejora su situacin, puesto que n
2
(1) = 1
jugador 3: El equilibrio dice que juegue la estrategia d, con un
pago asociado n
3
(d) = 3. La nica desviacin posible tampoco
mejora su situacin, puesto que n
3
(i) = 1
70 3. Juegos con Informacin Imperfecta
Felicidades, has encontrado el secuencial , 1, d; j = 1.
Estudiemos ahora el siguiente equilibrio de Nash 1, 1, i. Ya sabemos
que no es perfecto en subjuegos y por lo tanto va a ser imposible ascenderlo
a secuencial. Vemosolo con calma, puesto que para este equilibrio, el
conjunto de informacin no pertenece a la senda de equilibrio.
Consistencia: No podemos aplicar directamente la Regla de Bayes
porque el conjunto de informacin del jugador 2 no pertenece a la
senda de equilibrio. En la forma extensiva anterior he escrito la mixta
perturbada. La secuencia de creencias perturbadas es por tanto
j
:
=
--
-- +- (1 -)
= -
y como vemos tiende a 0. Por tanto, la nica creencia consistente es
j = 0.
Racionalidad secuencial: Ahora debemos ir jugador por jugador y
ver que en cada conjunto de informacin, su estrategia de equilibrio
maximiza sus pagos dadas sus creencias y las estrategias de los dems.
Jugador 1: El equilibrio dice que juegue 1, con un pago asociado
n
1
(1) = 2. La nica desviacin no mejora su pago puesto que
n
1
() = 0.
Jugador 2: El equilibrio dice que juegue la estrategia 1, con un
pago asociado n
2
(1) = 1. La nica desviacin posible mejora
su situacin, puesto que n
2
(1) = 2. Por tanto, la secuencialidad
racional falla para el segundo jugador.
3.5 Apndice 71
Acabamos de demostrar que no podemos construir un equilibrio
secuencial a partir del equilibrio de Nash 1, 1, i.
Tienes otros dos equilibrios con los que practicar antes de probar con
los problemas de este tema. Pero antes de terminar, djame decirte que
este ejercicio nos muestra que el equilibrio secuencial es a la informacin
imperfecta lo que el equilibrio perfecto en subjuegos lo es a la informacin
perfecta. Es decir, tienen el mismo espritu; es decir, no se contradicen.
3.5 Apndice
Este apndice recoge varias cosas interesantes respecto a los conceptos de
equilibrio que hemos desarrollado hasta el momento.
3.5.1 Ojo con la circularidad
Hasta ahora ests acostumbrado a calcular equilibrios del tirn, pero esto ya
no ser posible, puesto que el concepto de Equilibrio Secuencial es cirular:
las estrategias determinan las creencias (requisito de consistencia) y las
creencias determinan las estrategias (racionalidad secuencial).
Ojo con la Circularidad
ESTRATEGIAS CREENCIAS
LAS ESTRATEGIAS DETERMINAN LAS CREENCIAS
(Regla de Bayes)
LAS CREENCIAS DETERMINAN LAS ESTRATEGIAS
(Secuencialidad Racional)
Esto abre la siguiente pregunta: Qu fue primero, la gallina o el huevo?
Esta circularidad implica que casi siempre necesitemos hacer dos pasadas
por el juego para encontrar los equilibrios secuenciales. La mejor estrategia
es la siguiente:
1. Primero calculamos los equilibrios de Nash porque cada equilibrio de
Nash ser candidato a equilibrio secuencial.
2. Ampliamos cada equilibrio de Nash con creencias consistentes.
72 3. Juegos con Informacin Imperfecta
3. Finalmente vericamos si las estrategias son secuencialmente
racionales.
3.5.2 La lgica de tantos conceptos de solucin distintos
Hasta ahora hemos visto unos cuantos conceptos de solucin...
Clase de Juego Concepto Lgica
Juego esttico con
informacin perfecta
(Nash, 1950)
Equilibrio
de Nash
(acuerdo
auto
vinculante)
La estrategia de cada jugador
es mejor respuesta a las
estrategias de los otros
jugadores. Nadie jugar una
estrategia estrictamente
dominada en la senda de
equilibrio. Nash permite
amenazas no crebles
(estrictamente dominadas)
fuera de la senda de equilibrio.
Juego dinmico con
informacin perfecta
(Selten, 1965)
Equilibrio
Perfecto en
subjuegos
Evita amenazas no crebles en
cualquier subjuego.
Informacin imperfecta
ya sea un juego esttico
o dinmico
(Kreps y Wilson, 1982)
Equilibrio
secuencial
Hay conjuntos de informacin
que no pertenecen a un
subjuego. Este concepto tapa
este agujero. Nada de
amenazas increbles en ningn
conjunto de informacin fuera
de la senda
y a lo mejor tienes la sensacin de que cada vez que nos encontramos con
una situacin nueva, tenemos que cambiar nuestro concepto de solucin...
es algo as como hacer trampas. Pues no es cierto: simplemente lo vamos
reforzando para excluir equilibrios que pasaran por el cedazo de los
conceptos diseados para juegos ms simples.
3.5 Apndice 73
Dado cualquier juego, los conceptos de solucin que hemos estudiado
estn anidados
Conjunto de todos los perfiles de estrategias
Subconjunto de los
Equilibrios de Nash
Subconjunto de los
Equilibrios de Nash
Perfectos en Subjuegos
Subconjunto de
los Equilibrios
Secuenciales
Subconjunto de los perfiles que
sobreviven a la eliminacin iterada de
estrategias estrictamente dominadas
74 3. Juegos con Informacin Imperfecta
This is page 75
Printer: Opaque this
4
Juegos con Informacin Incompleta
Hasta ahora hemos considerado juegos en los que un montn de elementos
eran considerados conocimiento comn, y entre ellos estaba la matriz de
pagos... es decir, cada jugador poda escribir la matriz de pagos del juego
o el arbolillo del juego con sus nodos terminales y sus pagos si estamos
en el caso de juegos en forma extensiva. Esto implica que la funcin de
pagos de los jugadores es conocimiento comn, es decir, que tenemos un
juego con informacin completa.
Este supuesto tiene mucho sentido en ciertas situaciones estratgicas,
como cuando se enfrentan el Madrid y el Barcelona en baloncesto. Todo
el mundo sabe que el Real Madrid quiere ganarle al Barcelona y que el
Barcelona quiere ganarle al Real Madrid. Pero hay otras situaciones en las
que suponer que la funcin de pagos es conocimiento comn es suponer
mucho... Por ejemplo, piensa en la competencia en precios entre la empresa
1 y la empresa 2. Bien est que cada empresa conozca los ingresos de su
rival, puesto que "slo" hay que mirar en el mercado cuantas bebidas se
venden y a qu precio, pero cosa distinta es suponer que cada empresa
conozca la funcin de costes de su rival. Supongamos por ejemplo que la
empresa 1 no conoce los costes de la empresa 2 pero que la empresa 2
s conoce los costes de la empresa 1. Es ms, vamos a suponer que esta
estructura de conocimiento es conocimiento comn. En este caso, estamos
considerando un juego con informacin incompleta.
1
1
Como dice Ken Binmore, la distincin entre informacin completa e incompleta
no es equivalente a la distincin entre informacin perfecta e imperfecta. Decir que un
76 4. Juegos con Informacin Incompleta
4.1 Representacin en forma estratgica de un
juego bayesiano
Ahora vamos a estudiar los elementos que denen la representacin en
forma estratgica de un juego con informacin incompleta; tambin son
llamados Juego Bayesiano.
Recuerda que la representacin en forma estratgica de un juego de :
jugadores con informacin completa es ( (o
1
, ..., o
n
; l
1
, ..., l
n
), donde o
I
y l
I
son es el espacio de estrategias y la funcin de pagos del jugador i-
simo respectivamente. Sin embargo, en estos juegos, una estrategia para
el jugador i-simo es simplemente una accin, de forma que escribiremos
( (
1
, ...,
n
; l
1
, ..., l
n
), donde
I
es el espacio de acciones para el jugador
i-simo y l
1
(a
1
, ..., a
n
) es la funcin de pagos para el jugador i-simo si las
acciones elegidas fueron (a
1
, ..., a
n
).
El primer paso para la representacin de un juego bayesiano es
representar la idea de que cada jugador conoce su funcin de pagos pero
puede desconocer las funciones de pagos de sus oponentes. Supongamos
que la funcin de pagos del jugador i-simo viene representada por
l
I
(a
1
, ..., a
n
; t
I
), donde t
I
se denomina el tipo del jugador i-simo y
pertenece al conjunto de todos los tipos posibles (o espacio de tipos) T
I
,
de forma que a cada tipo del jugador le corresponde una funcin de pagos
diferente.
Dada esta denicin de tipo de un jugador, decir que el jugador i
conoce su funcin de pagos es equivalente a decir que conoce su propio
tipo, t
I
. Asimismo, decir que un jugador no conoce la funcin de pagos
de los otros jugadores es equivalente a decir que no conoce el tipo de
los otros jugadores, donde el tipo de los otros jugadores lo escribiremos
t
I
= (t
1
, ..., t
I1
, t
I+1
, ..., t
n
). Denotaremos por T
I
el conjunto de todos
los valores de t
I
, y usaremos la distribucin de probabilidad j
I
(t
I
[ t
I
)
para referirnos a la creencia del jugador i-simo sobre los tipos de los dems
jugadores, dado que el jugador conoce su propio tipo.
Si ahora ponemos juntos los conceptos nuevos de tipos y creencias con
los conceptos ms familiares de la representacin estratgica de un juego
con informacin completa, tendremos una maravillosa descripcin de un
juego bayesiano. Todo esto es lo que nos dice la siguiente denicin:
juego es de informacin perfecta o imperfecta es decir algo acerca de las reglas del
juego. Decir si un juego es de informacin completa o incompleta es decir algo sobre
lo que se conoce acerca de las circunstancias bajo las que el juego es jugado. Bajo el
supuesto de informacin completa, se supone que se ha recogido suciente informacin
sobre la situacin econmica objeto de estudio, de forma que el juego es susceptible
de ser modelizado como un juego. Para que esto puede llevarse a cabo, varias cosas
deben ser consideradas conocimiento comn. Entre ellas, estaban las reglas del juego,
las preferencias y las creencias.
4.1 Representacin en forma estratgica de un juego bayesiano 77
Denicion 26 La representacin en forma estratgica de un juego
bayesiano de : jugadores especica los espacios de acciones de cada jugador,
el espacio de tipos, sus creencias y sus funciones de pagos.
A continuacin seremos un poco ms formales en la descripcin de
todos estos elementos. Adems, para que estos elementos no parezcan tan
abstractos, despues de su enumeracin estudiaremos un ejemplo concreto:
el duopolio de Cournot con Informacin Incompleta.
1. Jugadores: Sean : jugadores, donde el jugador i-simo ser
representado por la letra i.
2. Acciones: Sea
I
el espacio de acciones disponibles para el jugador
i-simo, donde
I
= a
I
. Sea =

n
I=1

I
el espacio de
acciones de los jugadores. Un elemento arbitrario del conjunto ser
representado por a = (a
1
, ..., a
n
).
3. Tipos: Sea T
I
el espacio de tipos para el jugador i-simo, donde
T
I
= t
I
. Sea T =

n
I=1
T
I
el espacio de tipos de los jugadores.
Un elemento arbitrario del conjunto T ser representado por t =
(t
1
, ..., t
n
).
4. A-priori: Sea j(t
1,...,
t
n
) una distribucin de probabilidad objetiva
sobre el espacio T, de tal forma que para todo t
I
T
I
, j(t
I
) [0, 1]
y

n
I=1
j
I
(t
I
) = 1. Es importante tener en cuenta que todos los
jugadores tienen el mismo a-priori, es decir, es conocimiento comn.
5. Creencias: Sea j
I
la creencia que el jugador i-simo tiene sobre el
tipo de los dems jugadores. Cada jugador conoce su tipo t
I
pero
desconoce el tipo de los dems jugadores, t
I
. Por tanto, este formula
sus creencias sobre t
I
. Como estamos suponiendo que los jugadores
son racionales, las creencias deben guardar relacin con el a-priori, es
decir, los jugadores aplican la Regla de Bayes:
j
I
(t
I
[ t
I
) =
j(t
I
, t
I
)

|
i
2T
i
j(t
I
, t
I
)
=
j(t
I
, t
I
)
j
I
(t
I
)
6. Pagos: Sea l
I
el pago del jugador i-simo. Dado el tipo del jugador
i-simo, t
I
, la funcin de pagos viene dada por l
I
(a
1
, ..., a
n
; t
I
)
4.1.1 Aplicacin al Duopolio de Cournot con Informacin
Incompleta:
Consideremos 2 empresas que se enfrentan a una curva de demanda
1 = a Q, donde Q es la cantidad agregada
1
+
2
. Cada una de
las empresas tiene una funcin de costes totales C
I
(
I
) = c
I

I
, donde c
I
78 4. Juegos con Informacin Incompleta
es el coste marginal constante de la empresa i. Cada empresa conoce su
coste marginal pero desconoce el coste marginal de la empresa rival. Esta
situacin la podemos describir como un juego en forma estratgica con
informacin incompleta. Sus elementos son:
1. Jugadores: Tenemos dos jugadores, empresa 1 y empresa 2. Luego
i = 1, 2.
2. Acciones: El espacio de acciones disponibles para la empresa i
es un nivel de produccin
I
que restringimos al intervalo (0, a);
es decir,
I
=
I

j
i
2(0,o)
. El conjunto =

n
I=1

I
es entonces
= (
1
,
2
) donde
I
(0, a) .
3. Tipos: El espacio de tipos para la empresa i-sima es T
I
=
c
1
, c
J
, es decir, el coste marginal de la empresa i puede ser
alto (c
1
) o bajo (c
J
). El conjunto T =

n
I=1
T
I
es entonces T =
(c
1
, c
1
), (c
1
, c
J
), (c
J
, c
1
), (c
J
, c
J
), donde el primer elemento se
reere al coste marginal de la empresa 1 y el segundo al coste marginal
de la empresa 2.
4. A-priori: Sea j(t
1,...,
t
n
) una distribucin de probabilidad objetiva
sobre el espacio T, de tal forma que para todo t
I
T
I
, j(t
I
) [0, 1]
y

n
I=1
j
I
(t
I
) = 1. Un ejemplo de distribucin de probabilidad puede
ser j(c
1
, c
1
) = 2,8, j(c
1
, c
l
) = 3,8, j(c
J
, c
1
) = 2,8, j(c
J
, c
J
) = 1,8.
5. Creencias: Sea j
I
la creencia que la empresa i-sima tiene sobre el
tipo (coste marginal) de la empresa rival. Cada empresa conoce su
tipo t
I
pero desconoce el tipo de la empresa rival, t
I
. Por tanto,
cada empresa formula sus creencias sobre el coste marginal de la otra
empresa. Calculemos las creencias de la empresa 1 suponiendo que su
tipo es c
1
. La creencia de que el coste de la empresa 2 sea c
1
dado
que la empresa 1 es c
1
es entonces:
j
1
(c
1
[ c
1
) =
j(c
1
, c
1
)
j(c
1
)
=
2,8
2,8 + 3,8
= 2,5
La creencia de que el coste de la empresa 2 sea c
J
dado que la empresa
1 es c
1
es entonces:
j
1
(c
J
[ c
1
) =
j(c
J
, c
1
)
j(c
1
)
=
3,8
2,8 + 3,8
= 3,5
De una forma similar pueden calcularse las creencias de la empresa 2
sobre el coste marginal de la empresa 1.
6. Pagos: Sea l
I
el pago de la empresa i-sima. En nuestro ejemplo, el
pago para la empresa i-sima es su funcin de benecios,
I
(
1
,
2
; c
I
),
que por supuesto depende de su coste marginal, es decir, de su tipo.
4.1 Representacin en forma estratgica de un juego bayesiano 79
4.1.2 Timing del juego:
1. La natureleza extrae del espacio de tipos T, un perl de tipos,
t(t
1
, ..., t
n
), uno para cada jugador, con probabilidad j(t).
2. La naturaleza le dice al jugador i-simo su tipo t
I
, y ste formula sus
creencias j(t
I
[ t
I
) de acuerdo a la Regla de Bayes.
3. Los jugadores eligen simultneamente sus acciones a
I

I
.
4. Los jugadores reciben sus pagos l
I
(a
1
, ...a
n
; t
I
).
2
Un juego bayesiano en forma estratgica viene estonces representado por
(
1
, ...,
n
; T
1
, ..., T
n
; j; l
1
, ..., l
n
)
4.1.3 Denicin de Equilibrio Bayesiano
Una vez denido completamente el concepto de juego bayesiano, toca el
turno de denir un concepto de equilibrio para este tipo de juegos. Para
ello, lo primero que tenemos que hacer es denir el espacio de estrategias
de cada uno de los jugadores. Recuerda que una estrategia pura para un
jugador es un plan completo de accin, es decir, una especicacin completa
de la accin a elegir en cada una de las situaciones en las que el jugador se
puede encontrar en el desarrollo del juego.
Dado el timing especicado para un juego bayesiano, en donde el primer
movimiento corresponde a la naturaleza y su eleccin de un tipo para cada
jugador, una estrategia pura para un jugador debe especicar una accin
para cada uno de sus tipos posibles. Esto da lugar a la siguiente denicin:
Denicion 27 Una estrategia pura para el jugador i-simo es una
funcin o
I
: T
I

I
, de tal forma que para todo t
I
T
I
, :
I
(t
I
)
I
A diferencia de los juegos con informacin completa en forma estratgica,
en un juego bayesiano los espacios de estrategias puras no forman parte
de la denicin de la forma estratgica del juego, sino que tienen que
ser construidos a partir de los espacios de tipos y acciones. Por tanto,
el conjunto de todas las acciones puras para el jugador i-simo, o
I
, es el
conjunto de todas las funciones posibles con origen T
I
y destino
I
.
Podemos considerar dos tipos de estrategias puras:
1. Estrategias separadoras: En este caso, \t
I
,= t
I
, :
I
(t
I
) ,= :
I
(t
I
), es
decir, cada tipo elige una accin distinta.
2
Existen juegos en donde, en la etapa 2 del juego, el jugador i-esimo puede recibir
informacion sobre los tipos de los demas jugadores. En ese caso, los pagos del jugador
i-esimo dependeran de los tipos conocidos de los jugadores
80 4. Juegos con Informacin Incompleta
2. Estrategias pooling: En este caso, \t
I
,= t
I
, :
I
(t
I
) = :
I
(t
I
), es decir,
todos los tipos eligen la misma accin.
Esta distincin entre estrategias separadores y pooling no es relevante de
momento... pero lo ser en el tema cuatro.
Es posible que a estas alturas todava existan personas que se estn
preguntando por qu obligamos a un jugador a especicar una accin para
cada posible tipo si desde el principio del juego, el jugador ya conoce su tipo
puesto que le ha sido revelado por la naturaleza. No sera suciente con
especicar la accin para el tipo que es y no preguntarle por lo que hubiera
hecho si su tipo fuera otro?. La respuesta es NO. Cada jugador necesita
considerar lo que los dems jugadores harn y, dado que se desconocen los
tipos de los oponentes, lo que ellos harn depende de los que ellos crean que
cada jugador har en todos los tipos posibles. Es por ello que cada jugador
tiene que pensar lo que hara en cada uno de sus tipos posibles.
Dada nuestra denicin de estrategia pura en un juego bayesiano, ya
estamos en disposicin de denir lo que es un Equilibrio de Nash Bayesiano.
No os asusteis por la aparente complejidad de la notacin utilizada, sino por
su intuicin: cada estrategia debe ser mejor respuesta a las estrategias de los
dems jugadores. Es decir, un Equilibrio de Nash Bayesiano es simplemente
el Equilibrio de Nash de un Juego Bayesiano.
Denicion 28 En el juego en forma estratgica denido por (
1
, ...,
n
; T
1
, ..., T
n
; j; l
1
, ..., l
n
),
las estrategias (:

1
, ..., :

n
) constituyen un Equilibrio Bayesiano si \i, \t
I

T
I
, :

I
resuelve
'ar
a
i
2A
i

|
i
2T
i
[l
I
(:

1
, ..., a
I
, ...:

n
; t
I
) j
I
(t
I
[ t
I
)]
Es decir, ningn jugador quiere cambiar su estrategia ni siquiera si ese
cambio implica cambiar la accin asociada a uno de sus posibles tipos.
4.2 Aplicaciones
4.2.1 El Duopolio de Cournot con Informacin Incompleta
Considera el modelo del Duopolio de Cournot con una funcin de demanda
inversa 1(Q) = a Q, donde Q =
1
+
2
es la cantidad agregada en
el mercado. La funcin de costes de la empresa 1 es C
1
(
1
) = c
1
. La
funcin de costes de la empresa 2 es C
2
(
2
) = c
1

2
con probabilidad 0
y C
2
(
2
) = c
J

2
con probabilidad 1 0, donde c
1
_ c
J
. Adems, la
informacin es asimtrica: la empresa 2 conoce sus costes y la funcin de
costes de la empresa 1, mientras que la empresa 1 conoce sus costes pero
no los costes de la empresa 2 (tan solo que con probabilidad 0 se enfrenta a
4.2 Aplicaciones 81
una empresa con costes marginales altos).
3
Todo lo anterior es conocimiento
comn: la empresa 1 sabe que la empresa 2 tiene informacin superior, la
empresa 2 sabe que la empresa 1 lo sabe, etc..
Naturalmente, la empresa 2 querra producir una cantidad distinta (y
presumiblemente menor) si su coste marginal fuera alto en vez de bajo. La
empresa 1, por su parte, debera anticipar que la empresa 2 puede tomar
diferentes decisiones de produccin en funcin de sus costes de produccin.
Estudiemos primero la decisin de la empresa 1. Se enfrenta a una
especie de lotera: con probabilidad 0 se enfrenta a una empresa con costes
marginales alto, y con probabilidad 1 0 se enfrenta a una empresa con
costes marginales bajos. Por ello, la empresa 1 tratar de maximizar sus
benecios esperados
'ar
j
1
2(0,o)
0 [(a
1

2
(c
1
) c)
1
] + (1 0) [(a
1

2
(c
J
) c)
1
]
donde

2
(c
1
) y

2
(c
J
) son las cantidades producidas por la empresa 2
en funcin de sus costes de produccin.Por su parte, la empresa 2 es
conocedora de su superior informacin, es decir, de que la empresa 1 slo
conoce la distribucin de probabilidad sobre sus costes, y anticipa que el
comportamiento de la empresa 1 es el anterior. Es por ello, que aunque su
coste sea alto o bajo, necesitar computar tanto

2
(c
1
) como

2
(c
J
) para
poder calcular su correspondencia de mejor respuesta. En este caso

2
(c
1
) arg max
j
2
2(0,o)
[(a

1

2
c
1
)
2
]

2
(c
J
) arg max
j
2
2(0,o)
[(a

1

2
c
J
)
2
]
Las condiciones de primer orden de estos problemas de maximizacin son
las siguientes
4
:

1
=
0 [a c

2
(c
1
)] + (1 0) [a c

2
(c
J
)]
2

2
(c
1
) =
a

1
c
1
2

2
(c
J
) =
a

1
c
J
2
Resolviendo este sistema de tres ecuaciones con tres incgnitas obtenemos
el Equilibrio Bayesiano del juego:

2
(c
1
) =
a 2c
1
+c
3
+
1 0
6
(c
1
c
J
)
3
La empresa 2 puede ser una empresa nueva en el mercado o bien ha podido
desarrollar una nueva tecnologia
4
Suponemos que las condiciones de segundo orden se cumplen, por lo que no las
consideramos explicitamente
82 4. Juegos con Informacin Incompleta

2
(c
J
) =
a 2c
J
+c
3

0
6
(c
1
c
J
)

1
=
a 2c +0c
1
+ (1 0)c
J
3
Resulta un ejercicio interesante comparar este equilibrio bayesiano con el
equilibrio de Nash del modelo de Cournot con informacin completa en
el que las empresas tienen costes marginales diferentes.
5
Suponiendo que
las cantidades de equilibrio de las dos empresas son positivas, la empresa
i produce

I
=
o2c
i
+c
j
3
en el modelo de informacin completa. Cuando
existe informacin incompleta,

2
(c
1
) es mayor que
o2c
H
+c
3
y

2
(c
J
) es
menor que
o2c
L
+c
3
. Esto ocurre porque la empresa 2, a la hora de tomar
su decisin de produccin, no slo tiene en cuenta que ella tiene un coste
marginal determinado sino tambin el hecho de que la empresa 1 no lo
conoce. Si el coste de la empresa 2 es alto, produce poco porque su coste es
alto pero algo ms porque sabe que la empresa 1 producir una cantidad
que maximice su benecio esperado y, por tanto, menor que si la empresa
1 supiera que el coste de la empresa 2 es alto.
4.2.2 El Teorema de Puricacin de Harsanyi
Como mencionamos al nal del tema anterior, Harsanyi sugiri que la
estrategia mixta del jugador , representa la incertidumbre del jugador i
acerca de la estrategia pura elegida por el jugador ,, y que la eleccin de
, depende de la realizacin de una cantidad de informacin privada. La
denicin formal del Teorema es la siguiente:
Teorema 3 Fija un conjunto de : jugadores y espacio de estrategias
o
I
. Para un conjunto de pagosn
I
(:)
I21,s2S
con medida de Lebesgue 1,
para todo a-priori j (j
1
, ..., j
n
) donde j
I
son independientes y dos veces
diferenciables denidas sobre T
I
= [1, 1]
#S
, cualquier equilibrio de pagos
n
I
es el lmite cuando c 0 de una secuencia de equilibrios en estrategias
puras del juego perturbado con pagos n
I
, donde t
s
I
denota una variable
aleatoria con rango en el intervalo cerrado [1, 1] y c _ 0 denota una
constante positiva de tal forma que la funcin de pagos perturbados adopta
la forma n
I
(:, 0
I
) = n
I
(:) +c0
s
I
.
En esta seccin daremos una descripcin un poco menos informal de este
teorema: un equilibrio en estrategias mixtas de un juego con informacin
completa puede, casi siempre, ser interpretado como el equilibrio bayesiano
en estrategias puras de un juego estrechamente relacionado con el original
en el que se ha introducido un poco de informacin incompleta.Considera
5
Aun cuando no lo hayamos calculado, este se puede calcular simplemente tomando
tetha igual a cero o uno
4.2 Aplicaciones 83
el siguiente ejemplo de la Batalla de los Sexos.
B S
B 2, 1 0, 0
S 0, 0 1, 2
La batalla de los sexos
con informacin completa
Existen dos equilibrios de Nash en estrategias puras y un equilibrio en
estrategias mixtas, en el que el jugador 1 juega B con probabilidad 2/3 y
el jugador 2 juega S con probabilidad 2/3. Supongamos ahora que aunque
los jugadores se conocen desde hace mucho tiempo, stos no estn seguros
de los pagos exactos del otro jugador. En particular, supongamos que el
pago del jugador 1 por ir a la obra de Bach es 2 +t
1
, y el pago del jugador
2 por acudir a la obra de Stravinsky es 2 +t
2
, donde t
I
es conocido por el
jugador i, pero no por el jugador ,. Adems, t
1
y t
2
son variables aleatorias
independientes con funcin de distribucin uniforme en el intervalo [0, 1].
Todos los dems pagos son los mismos.
B S
B 2 +t
1
, 1 0, 0
S 0, 0 1, 2 +t
2
La batalla de los sexos
con informacin incompleta
En trminos de nuestra notacin, el juego bayesiano en cuestin es
=
1
,
2
; T
1
, T
2
; j
1
, j
2
; n
1
, n
2
, donde los espacios de acciones son
I
=
1, o, los espacios de tipos son T
I
= [0, r], las creencias son j
I
(t

) = 1,r y
los pagos son los descritos en la anterior gura. Construiremos un equilibrio
bayesiano en estrategias puras de esta versin con informacin incompleta
de la Batalla de los Sexos en la que el jugador 1 juega 1 si t
1
es mayor
que un cierto valor crtico c
1
y juega o en caso contrario, mientras que el
jugador 2 juega o si t
2
es mayor que un cierto valor crtico c
2
y juega 1
en caso contrario. En este equilibrio, la probabilidad de que el jugador 1
juegue B es simplemente
jro/(t
1
_ c
1
) =
r c
1
r
mientras que la probabilidad de que el jugador 2 juegue S es
jro/(t
2
_ c
2
) =
r c
2
r
Demostraremos que cuando la informacin incompleta desaparece (es
decir, cuando r 0), el comportamiento de los jugadores en este equilibrio
bayesiano en estrategias puras con informacin incompleta se aproxima al
84 4. Juegos con Informacin Incompleta
comportamiento descrito por el equilibrio en estrategias mixtas del juego
con informacin completa. Es decir, lim
r!0
rc
1
r
= lim
r!0
rc
2
r
=
2
3
.
Supongamos que los jugadores juegan las estrategias descritas. Dado un
valor de r, determinaremos los valores de c
1
y c
2
tales que estas estrategias
son un equilibrio bayesiano.
Dada la estrategia del jugador 2, el pago esperado para el jugador 1 si
juega B y S viene dado por
c
2
r
(2 +t
1
) +
_
1
c
2
r
_
0 =
c
2
r
(2 +t
1
)
y
c
2
r
0 +
_
1
c
2
r
_
1 = 1
c
2
r
respectivamente. As pues, jugar B es ptimo si y solo si
t
1
_
r
c
2
3 = c
1
Similarmente, dada la estrategia del jugador 1, el pago esperado para el
jugador 2 de jugar B y S es
_
1
c
1
r
_
0 +
c
1
r
(2 +t
2
) =
c
1
r
(2 +t
2
)
y
_
1
c
1
r
_
1 +
c
1
r
0 = 1
c
1
r
respectivamente. As pues, jugar S es ptimo si y solo si
t
2
_
r
c
1
3 = c
2
Debemos resolver el sistema formado por las ecuaciones
r
c
2
3 = c
1
r
c
1
3 = c
2
Resolviendo obtenemos c
1
= c
2
= c (las dos ecuaciones son simtricas)
y c
2
+ 3c r = 0. Resolviendo esta ltima ecuacin de segundo grado
tenemos:
c =
3
_
9 + 4r
2
Ya podemos calcular la probabilidad, en equilibrio, de que el jugador 1
juegue B
6
r c
r
=
_
1
3
_
9 + 4r
2r
_
6
O la probabilidad de que el jugador 2 juegue la accion S
4.3 Introduccin a las Subastas 85
Debemos quedarnos con la solucin positiva puesto que una probabilidad
debe estar en el intervalo (0, 1). Ahora queremos calcular hacia donde
converge esta probabilidad cuando desaparece la informacin incompleta,
es decir, cuando r 0. As, y tras aplicar la Regla de LHopital, tenemos
lim
r!0
r c
r
= 1 lim
r!0
_
1
2
4 (9 + 4r)
1/2
2
_
de donde
lim
r!0
r c
r
= 1
1
3
=
2
3
As pues, cuando la informacin incompleta desaparece, el comportamiento
de los jugadores en el equilibrio bayesiano en estrategias puras del juego
con informacin incompleta se aproxima al comportamiento en el equilibrio
de Nash en estrategias mixtas del juego original con informacin completa.
Sin embargo, lo importante de esta seccin no es ni el teorema ni el
ejemplo concreto que lo ilustra, sino lo que nos quiere decir este tipo
de argumento. La idea fundamental es que una cosa es la situacin
real que queremos estudiar y otra es el juego que utilizamos para su
modelizacin y posterior anlisis. As, es posible que los juegos con
informacion completa sean una idealizacin, puesto que los jugadores, en
el mundo real, tpicamente disponen de al menos una pequea cantidad de
informacin incompleta acerca de los objetivos y preferencias de los dems
jugadores. Al modelizarlo como un juego con informacin incompleta,
estamos aproximando la realidad ms que describindola. Cmo de
vlida es esta aproximacin?. Depender de la cantidad de informacin
privada de los jugadores. El Teorema de Harsanyi nos muestra que en la
medida en que esta informacin privada sea pequea, nuestra aproximacin
ser tanto mejor... Como consecuencia, el argumento de Harsanyi muestra
que la distincin entre estrategias puras y mixtas puede ser articial.
4.3 Introduccin a las Subastas
La subasta ms simple es take-it-or-leave-it (La de los comercios: cada bien
tiene su precio, aparece en una etiquete y si no aparece pues preguntas
al vendedor y si se te ocurre preguntar por un descuento te dice: "no
estamos en rebajas". As que o lo tomas o lo dejas). Las ms usuales son
las siguientes
86 4. Juegos con Informacin Incompleta
Pujas
Publicas (Con un subastador) Privadas (en un sobre cerrado)
Subastador Nombre Precio pagado Nombre
Ascendente Inglesa Primera puja perdedora Vickrey
Descendente Holandesa Puja ganadora ?
Pregunta interesante: Cul de ellas elegiras para vender tu objeto?
Cul de ellas utiliza ebay? Pero hay subastas ms exticas. . . que
tendrs que pensar en los ejercicios de este tema... de momento quedmonos
analizando la subasta de sobre cerrado de primer precio con dos pujadores.
En este caso, cada jugador tiene una valoracin del bien. Si paga un precio
p a cambio del bien, entonces su ganancia es su valoracin menos el precio
pagado. Adems, cada participante conoce su valoracin pero desconoce
la de su rival. Las valoraciones estn uniformemente distribuidas de forma
independiente en el intervalo [0,1]. Cada participante entrega su puja en
un sobre cerrado de forma simultnea. La puja ms alta gana la subasta
y el ganador recibe el bien a cambio de pagar su puja. La puja ms baja
pierde la subasta, no recibe el objeto y no paga nada.
Formulemos esta subasta como un juego bayesiano: G(
1
,
2
; T
1
, T
2
; j
1
, j
2
; n
1
, n
2
)
Espacio de Acciones:
1
=
2
= [0, ). Una accin para el jugador
i es el nmero que escribe dentro del sobre, lo que tcnicamente se
conoce como puja en la jerga de las subastas. Sea /
I
la puja del jugador
i, con i = 1, 2.
Espacio de Tipos: T
I
= [0, 1] para i = 1, 2.
Conjeturas: j
I
(t

,t
I
) se obtiene a partir de la distribucin uniforme
para i = 1, 2.
Las ganancias son
n
I
(/
1
, /
2
;
I
) =
_
_
_

I
/
I
si /
I
/

(
I
/
I
) ,2 si /
I
= /

0 si /
I
< /

Lo primero que debemos hacer para construir un equilibrio bayesiano


es describir las estrategias puras para un jugador. Recuerda que como en
todo juego, una estrategia pura es un plan completo de accin. En nuestro
caso, una estrategia pura es un nmero (puja) para cada tipo (valoracin
del bien subastado) posible [0, 1]. Tcnicamente hablando tendramos una
funcin /
I
: T
I

I
, donde /
I
(
I
) [0, ) para i = 1, 2.
Denicion 29 El par de estrategias /

1
(
1
) , /

2
(
2
) es Equilibrio Bayesiano
si para cada tipo
I
[0, 1], /

I
(
I
) arg max
fb
i
g
(
I
/
I
) Pr
_
/
I
/

)
_
+
u
i
b
i
2
Pr
_
/
I
= /

)
_
4.3 Introduccin a las Subastas 87
Fjate en que no hay nada nuevo bajo el sol... para tener un equilibrio
(bayesiano en este caso), cada estrategia debe ser lo mejor que puede
conseguir el jugador dada la estrategia de su rival (y dadas sus creencias,
porque tenemos un juego con informacin incompleta).
La nico un poco ms complicado en este tipo de juegos es que aunque
sepamos la estrategia que va a jugar el rival, no vamos a saber a ciencia
cierta cul es nuestro pago. Esto es lo nuevo... Vemoslo con calma.
Imagnate que tu rival utiliza la siguiente estrategia: Puja 0 si su tipo
es menor que 1/2 y puja 1 si su tipo es mayor o igual que 1/2. Frente a
esta estrategia, cul es tu pago si tu tipo es 0.8 y pujas 0.6? Pues depende
del tipo del rival porque su puja depende de su tipo. Y la informacin
que tienes acerca del tipo del rival es que es extrado del intervalo [0, 1]
siguiendo una distribucin uniforme. As pues, tu pago es
(0.8 0.6) Pr (t

< 1,2) + (0) Pr (t

_ 1,2) = (0.8 0.6)


1
2
donde hemos usado la distribucin uniforme para decir que la
probabilidad de que el tipo sea menor que 1/2 es 1/2. El siguiente ejemplo
grco te ayudar a entenderlo mejor. Supongamos que tu rival usa la
siguiente estrategia.
Tipo

0 0.2 0.4 0.7 0.9 1


b(v)
E
Cul es la probabilidad de que t ganes la apuesta si pujas 1 euros?
Pues es simplemente la probabilidad de que el tipo (valoracin) de tu rival
sea tal que su puja sea menor que la puja 1. Hemos representado en rojo
dichas tipos valoraciones (tipos). Como los tipos son iid segn la uniforme,
tenemos por tanto que
Pr (Ganar diciendo 1 / Rival usa / ()) =
(0.2 0) + (0.7 0.4) + (1 0.9)
(1 0)
=
=
0.2 + 0.3 + 0.1
1
= 0.6
88 4. Juegos con Informacin Incompleta
Bien, poquito a poco estamos aprendiendo a pensar en trminos de juegos
bayesianos. Ahora demos un paso adelante y pensemos en qu estrategias
yo no quiero utilizar en este subasta.
Considera los siguientes grcos
Tipo

0 1
b(v)
b(v)=v
Tipo

b(v)
Estrategia a Estrategia b
Fjate en que en el grco de la izquierda estrategia a, hay tipos que
pujan por encima de su valoracin, por lo que si ganan tendran prdidas...
La estrategia a est dominada por la estrategia b, en la que simplemente
hemos reemplazado los tipos que pujan por encima de su valoracin por
una puja de cero...
Todas estas consideraciones nos van a permitir responder de forma
elegante a la siguiente pregunta: Existir algn equilibrio bayesiano lineal?
Fjate en que no queremos restringirnos a estrategias lineales, sino que nos
queremos preguntar si existe un equilibrio en el que las estrategias sean
lineales.
Bien, pensemos en qu estrategia lineal puede ser una estrategia de
equilibrio. Fjate en las siguientes guras:
4.3 Introduccin a las Subastas 89
Tipo

0 1
b(v)=v
b(v)
Tipo

0 1
b(v)
Estrategia c Estrategia d
Claramente la estrategia c no puede, porque la estrategia c implica
que algunos tipos pujen por encima de su valoracin (recuerda que est
dominada y por tanto no puede formar parte de ningn equilibrio) mientras
que la estrategia d implica que algunos tipos pujen un nmero negativo, y
eso no est permitido por las reglas de la subasta. As pus, el candidato
lineal a equilibrio es la siguiente estrategia
Tipo

0 1
b(v)=v
/

) = c

con c

(0, 1)
OK. Estudiemos ahora la funcin de mejor respuesta frente a un jugador
que utiliza la estrategia /

) = c

. Ya sabemos que la mejor respuesta


/
I
(
I
) debe ser solucin del siguiente problema de maximiazin
max
fb
i
g
(
I
/
I
) Pr (/
I
c

) +

I
/
I
2
Pr (/
I
= c

)
donde fjate en que no estamos restringiendo el espacio de funciones /
I
(
I
) a que sean lineales.
90 4. Juegos con Informacin Incompleta
Como el tipo

del jugador , es una variable aleatoria continua en el


intervalo [0, 1], ya sabemos que Pr (/
I
= c

) = 0. Por tanto, el problema


que debemos resolver es
max
fb
i
g
(
I
/
I
) Pr (/
I
c

)
Es ms, como el tipo

del jugador , est distribuido segn una uniforme,


tenemos que
Pr (/
I
c

) = Pr
_

<
/
I
c

_
=
/
I
c

Por tanto, el problema a resolver es


max
fb
i
g
(
I
/
I
)
/
I
c

Antes de resolverlo, veamos por dnde andar:


(i) Subir la puja /
I
est bien por un lado porque aumenta la probabilidad
de ganar Pr (/
I
c

) pero est mal por otro porque hace que el


premio que se gana (
I
/
I
) sea menor.
(ii) Bajar la puja /
I
est mal por un lado porque disminuye la probabilidad
de ganar Pr (/
I
c

) aunque est bien por otro porque hace que el


premio que se gana (
I
/
I
) sea mayor.
Ya que sabemos algunas cosas sobre la funcin /
I
(
I
) es hora de calcularla
explcitamente. La condicin de primer orden es
d/
d/
I
=
/
I
c

+ (
I
/
I
)
1
c

= 0 ==/
I
+
I
/
I
= 0 ==/
I
=
1
2

I
Lo que acabamos de demostrar es que la mejor respuesta (sin
restringirnos a estrategias lineales), a una estrategia lineal c

es la
estrategia lineal
1
2

I
. Por tanto, el nico equilibrio lineal es /

I
(
I
) =
1
2

I
.
Remark 14 Para el caso de n jugadores, la estrategia lineal de equilibrio
es /

I
(
I
) =
n1
n

I
.
4.4 Equilibrio Bayesiano Perfecto. Breve
Introduccin
(Adapted from A Course in Game Theory by Martin J. Osborne and Ariel
Rubinstein).
Fjate en que hemos desarrollado en clase un concepto de solucin que
puede aplicarse a cualquier juego con informacin imperfecta. Vale, es muy
4.4 Equilibrio Bayesiano Perfecto. Breve Introduccin 91
matemtico y os cuesta trabajo entenderlo. En n, que sepis que hay una
clase especial de juegos en forma extensiva cuyo concepto de solucin es
mucho ms fcil que el equilibrio secuencial pero que tiene propiedades
similares. Es el llamado Equilibrio Bayesiano Perfecto.
Esa clase especial de juegos es aquella la llamada Juegos Bayesianos
Extensivos con Acciones Observables. En ellos, la naturaleza mueve
en primer lugar eligiendo de forma independiente los tipos de los jugadores.
Despus, las acciones elegidas por los jugadores son observadas por todos
los jugadores. Es decir, la informacin imperfecta se reere a la accin
elegida por la naturaleza, no a las acciones elegidas por los rivales.
En el tema siguiente veremos ejemplos de esta clase de juegos, pero ahora
quiero avanzaros cul es la denicin de Equilibrio Bayesiano Perfecto
(PBE).
Denicion 30 Una evaluacin (/, j) es un Equilibrio Bayesiano
Perfecto si
1. Sequential rationality: The strategy for each type is optimal after any
sequence of events)
2. Correct initial beliefs: Initially, the other players beliefs about the
type of each player i be given by natures apriori)
3. Action-determined beliefs: Only a players action inuences the other
players beliefs about his type; i.e. you cannot signal what you do not
know.
4. Bayesian Updating: from the observation of player is actions.
Es muy legtimo que te preguntes varias cosas: (i) por qu te tengo que
contar dos conceptos de equilibrio para juegos con informacin imperfecta
y (ii) Qu relacin hay entre ellos. Ah van mis respuestas:
PBE no est denido para juegos en forma extensiva con acciones
no observables. En estos casos, hay gente que simplemente habla de
Weak Perfect Bayesian Equilibria (WPBE) que simplemente exige
Bayes en la senda, sin imponer restricciones sobre las creencias fuera
de la senda de equilibrio.
En la clase de juegos bayesianos extensivos con acciones observables,
todo equilibrio secuencial es bayesiano (pero no al revs)
Parte II
Economa de la
Informacin
92
93
En los captulos anteriores hemos estudiado las bases tericas que nos van
a permitir abordar el ncleo duro del curso: la Economa de la Informacin.
En este curso nos centraremos en dos temas: la Seleccin Adversa y el
Riesgo Moral.
En el tema 5 estudiaremos la Seleccin Adversa: una de las partes de
una transaccin conoce aspectos de la misma que, siendo relevantes para
la transaccin, son desconocidos por la otra parte. El tpico ejemplo lo
constituye la realizacin de un seguro de vida: el asegurado puede saber que
tiene 6 meses ms de vida por la presencia de un cncer de pulmn mientras
que Mapfre no lo sabe... La solucin a este problema es la transmisin
de seales, a travs de la cul la parte informada de la transaccin trata
de sealizar, a travs de sus acciones, aquello que conoce y la autoseleccin
si es la parte no informada la que mueve en primer lugar.
El tema 6 se centra en el Riesgo Moral:
7
una de las partes de la
transaccin puede realizar ciertas acciones que, afectando a la valoracin
de la transaccin por la otra parte, sta no puede controlar. El ejemplo ms
tpico puede ser la contratacin de un seguro de incendios. El asegurado
puede, nada mas rmar el seguro, incendiar accidentalmente su casa o
no tomar medidas de precaucin o prevencin de incendios. La solucin
a este problema es la provisin de incentivos.
Sea cual sea la naturaleza del problema, es natural preguntarse cul es el
mejor contrato que podemos encontrar para estructurar las transacciones.
La respuesta nos la dar el diseo de mecanismos, cuyo anlisis queda
relegado a la tercer parte del temario.
Utilizaremos la teora de juegos que hemos estudiado en los temas 2,
3 y 4 para tratar los problemas de seleccin adversa y riesgo moral. La
caracterstica en comn de estos problemas es que existen agentes en la
transaccin que tienen informacin superior, es decir, la informacin es
asimtrica.. En este sentido, es til utilizar el modelo del principal-agente
para analizar estos casos de informacin asimtrica.
8
Los dos jugadores son
el principal y el agente, que generalmente son individuos representativos.
El principal contrata a un agente para que lleve a cabo una misin, y el
agente tiene una ventaja informacional a cerca de su tipo, sus acciones o
del mundo exterior en el que se desenvuelve la situacin. Normalmente se
supone que los jugadores rman un contrato en algn momento del juego, o
lo que es lo mismo, el principal se obliga a pagar una determinada cantidad
de dinero al agente si observa un cierto resultado. Implcitamente estamos
7
Este es un caso agrante de invasin lingustica. El original ingls reza Moral Hazard,
y que yo sepa Hazard no es azar...
8
Aun cuando este trmino se suele reservar para al anlisis de los problemas de riesgo
moral, este paradigma ser de valiosa utilidad en todos los contextos que analizaremos
en este curso.
94
suponiendo que existe un Tribunal que puede castigar a cualquier jugador
que rompa el contrato rmado siempre y cuando esta alegacin pueda ser
probada utilizando informacin pblica.
Las siguientes guras recogen los dos tipos de problemas provocados por
la informacin asimtrica en un contexto del modelo principal-agente.
Riesgo Moral : El principal P ofrece al agente A un contrato, que ste
puede aceptar o rechazar. Acto seguido, el agente A realiza una accin
que no es observada por el principal P, pero que afecta a la funcin
de pagos del principal.
9
Los pagos para cada uno de los jugadores se
realizan.
10
En este sentido, el problema del principal es maximizar sus pagos
esperados sujeto a dos restricciones: Compatibilidad de Incentivos:
que el agente elija de motu propio la accin que el principal quiere,
y Restriccin de Participacin: que el agente acepte el contrato.
Seleccin Adversa: La naturaleza elige un tipo para el agente A que
es desconocido para el principal P. El principal ofrece un contrato
al agente A, que este puede aceptar o rechazar. Los pagos para los
jugadores son realizados.
11
Como ejemplo de este tipo de situaciones, considera el siguiente cuadro:
En esta segunda parte del temario los temas siguen una estructura
similar:
1. Presentacin del problema econmico
2. Descripcin segn la Teora de Juegos
3. Equilibrios del modelo (en estrategias puras)
(a) Nash
(b) Perfecto en Subjuegos
(c) Secuencial, segn las caractersticas del modelo.
9
Por ello existir una accin que el principal preera, en el sentido de que maximize
los pagos del principal.
10
Tcnicamente algunos autores llaman a este tipo de situacin Riesgo Moral con
accin escondida, para diferenciarlo del Riesgo Moral con conocimiento escondido. Esta
distincin no ser relevante en este curso.
11
Es a veces til diferenciar entre seal y mensaje. Una seal es una accin que conlleva
un coste para el agente. Un mensaje es un costless statement.
95
MODELO PRINCIPAL AGENTE Clave
Seleccin
Adversa
Banco Prstamo Inversor arriesgado
Compaa de seguros Tomador seguro Enfermedad mortal
Comprador Vendedor Calidad objeto venta
Empresa Trabajador Habilidad productiva
Sealizacin
Comprador Vendedor Garanta
Empresa Trabajador Master
Screening Compaa de seguros Tomador de seguro Varios contratos
Riesgo Moral
Compaa de seguros Tomador seguro Care to avoid theft
Compaa de seguros Tomador seguro Fumar y beber s.m.
Terrateniente Jornaleros Esfuerzo recolector
Accionista Directivos Riesgo inversin
Dueo casa alquiler Inquilino Cuidado hogar
INFORMACIN INFERIOR INFORM. SUPERIOR
96
4. Resultado en equilibrio.
Detalle Tcnico Importantsimo: En esta segunda parte del curso,
cuando tengis que aplicar el Equilibrio Secuencial nunca os exigir que me
mostris los trembles. Si hace falta lo har yo, aunque slo una vez: en el
siguiente caso, voy a calcular explcitamente el equilibrio secuencial en el
ejemplo de Cournot con informacin asimtrica.
El Secuencial de Cournot Asimtrico
( )
( )
( )
( )
( )
( )
( )
{ } b,m all for
m
b
t requiremen y Consistenc
=
+

=
=
+

=
=
+

=
0
1 1 1
1 0
Pr
1
1 1 1
1 1
Pr
1 1 1
1
Pr
:

( )
{ }
[ ]
( )
{ }
[ ]
{ }
( ) [ ]
( ) ( ) [ ]
1
*
2 1
1
*
2 1
*
1
2 2
*
1
*
2
2 2
*
1
*
2
1
max arg
max arg
max arg
:
1
2
2
q c c q q p
q c c q q p q
q c q q p c q
q c q q p c q
y Rationalit Sequential
L
H
q
L
q
L
H
q
H
+
+

GOD
2 2
1-
1
Quin dijo que
Dios no juega a
los dados?
a b c d e f g h i j k l m n
( ) ( ) { }
*
1
*
2
*
2
, , q c q c q
m Equilibriu Sequential
L H
q
2
*(c
H
)
q
2
*(c
L
) 0 2 3 4 5 6 0 1 2 3 4 6
This is page 97
Printer: Opaque this
5
Seleccin Adversa, Sealizacin y
Screening
5.1 Seleccin Adversa: El Modelo de Akerlof
5.1.1 Formulacin Tradicional
Akerlof estimul todo un campo de investigacin cuando en 1970 public en
la revista Quarterly Journal of Economics (Q.J.E.) su modelo del mercado
de coches de segunda mano,
1
en el que la seleccin adversa surge porque la
calidad de los coches es slamente conocida por los vendedores. Es trminos
ms tcnicos, el principal hace un contrato de compra de un bien cuya
calidad, que puede ser alta o baja, no es contratable. La caracterstica
bsica del modelo de los limones de Akerlof es que el mercado puede
colapsar incluso aunque existan ganancias asociadas al intercambio.
El modelo bsico es el siguiente: tenemos un mercado de coches usados
donde existen dos tipos de coches:
Coches de alta calidad (h),
Coches de baja calidad (l)
Por simplicidad, supondremos que:
1. El nmero de coches usados es - .
1
En ingls, se llaman lemons, por lo que este modelo suele denorminarse el modelo
de los limones de Akerlof.
98 5. Seleccin Adversa, Sealizacin y Screening
2. La proporcin de coches tipo / es r, donde 0 _ r _ 1.
3. Todos los agentes, tanto compradores como vendedores de coches, son
neutrales al riesgo.
2
4. Sea /

la valoracin que un comprador (buyer) hace de un coche tipo


,, donde , /, | . Sea :

la valoracin que un vendedor (seller) hace


de un coche tipo ,, donde , /, | . As,
/

~ :

para , /, |
por lo que existen ganancias asociadas al intercambio.
5. A los precios /
|
, /
l
o inferiores, existe un nmero grandsimo de
compradores. Sin embargo, la oferta de coches es inelstica..
En esta seccin consideraremos tres diferentes escenarios:
(a) Informacin completa:
En este caso, todos los participantes del mercado conocen la calidad de
cada coche, por lo que se puede establecer un mercado de coches buenos
(/) y un mercado de coches malos (|), cada uno de los cuales tendr su
propio precio de equilibrio. Bajo el supuesto 5, este precio se corresponder
con la valoracin del comprador /

.
En este escenario, no existe ningn problema de seleccin adversa.
(b) Informacin incompleta pero simtrica:
En este escenario, ya no tendremos dos mercados diferentes porque las
calidades de los coches no son conocidas ni por los compradores ni por
los vendedores. Por lo tanto, tendremos un solo mercado y un solo precio
1. ?Cul ser la valoracin que un comprador haga de un coche?. El
comprador sabe que la proporcin de coches de alta calidad es r, por lo
que su valoracin ser
1(/) = r/
|
+ (1 r)/
l
De la misma forma, la valoracin que un vendedor har de su propio
coche ser
1(:) = r:
|
+ (1 r):
l
Dado que /

~ :

para , /, | , tenemos que 1(/) ~ 1(:) por lo


que existen ganancias esperadas asociadas al intercambio. Los coches se
vendern al precio 1 = 1(/).
2
Este es un supuesto que implicitamente hemos realizado en el nalisis de los temas 2
y 3. Frente a cualquier lotera, siempre hemos considerado que un jugador maximizaba
pagos esperados. Eso es cierto si el agente es neutral al riesgo.
5.1 Seleccin Adversa: El Modelo de Akerlof 99
En este escenario, y pese a que existe informacin incompleta, tampoco se
produce ningn problema de seleccin adversa porque ningn participante
en el mercado de coches usados tiene informacin superior; es decir, la
informacin es simtrica.
(c) Informacin incompleta pero asimtrica:
En este caso, los compradores toman acciones dependiendo de resultados
esperados pero no los vendedores, que s conocen la calidad de los coches
que van a vender. As, los vendedores tienen informacin superior. Esta es
la causa que puede generar el problema de seleccin adversa.
Se puede dar la siguiente situacin. Tomemos una proporcin r de coches
de alta calidad y unas valoraciones /

y :

tal que 1(/) sea menor que :


|
, es
decir, el precio de intercambio de coches es menor que la valoracin de un
vendedor de un coche de alta calidad. En este caso, el mercado de coches
de alta calidad colapsa, puesto que los vendedores de coches de alta calidad
no querrn vender su coche a un precio menor que su valoracin. As, los
coches buenos desaparecen del mercado. Solo quedan coches malos que se
vendern a un precio /
l
.
Aqu tenemos el problema de seleccin adversa: slo se venden coches de
segunda mano (seleccin no aleatoria de la poblacin). Este problema de
colapso del mercado puede agravarse si
1. Aumenta el nmero de calidades de los coches en venta.
2. Las diferencias entre las valoraciones de los compradores y vendedores
son menores.
Para que juguemos un poco, considera el siguiente ejemplo numrico:
1 2 3 4 5
s
L
b
L
s
H
b
H
Cacharros
2/3
Normales
1/3
Valoracin
1. Informacin completa:
(a) Mercado de cacharros: p=2
(b) Mercado de coches normales: p=5
2. Informacin incompleta pero simtrica:
100 5. Seleccin Adversa, Sealizacin y Screening
(a) Ningn lado del mercado es capaz de distinguir los dos tipos
de coche por lo que slo existe un mercado. Los compradores
estn dispuestos a pagar como mucho su valoracin de un coche
que con probabilidad
2
3
es un cacharro y con probabilidad
1
3
es normal. Por tanto, el precio que estn dispuestos a pagar es
j = 1 (/) = 2
2
3
+ 5
1
3
= 3. Un vendedor valora su coche en
1 (:) = 1
2
3
+4
1
3
= 2, por lo que est dispuesto a vender el
coche a 3.
3. Informacin incompleta y asimtrica:
(a) Los compradores estn dispuestos a pagar 1 (/) = 3 pero el
problema es que un vendedor de un coche normal no acepta
porque su valoracin es mayor: 4. Acaba de colapsar el mercado
de coches normales... slo se venden cacharros a un precio 2.
5.1.2 Formulacin con la Teora de Juegos
Ahora quiero modelizar el modelo de Akerlof utilizando el lenguaje de la
Teora de Juegos. Es necesario? Pero si lo he entendido con el ejemplo...
1. Jugadores: Comprador y vendedor
2. Timing:
(a) La naturaleza elige la calidad del coche segn una distribucin
de probabilidad j ()
(b) La naturaleza revela la calidad al vendedor pero no al
comprador.
(c) Se negocia la compra-venta del coche
3. Pagos:
(a) Si se produce la venta, entonces el vendedor obtiene P-s y el
comprador obtiene b-P
(b) Si no se produce la venta, ambos obtienen utilidad 0.
Cmo modelizamos el proceso de negociacin entre comprador y
vendedor (bargaining procedure)? Hay muchsimos enfoques, yo os cuento
uno: El vendedor ofrece un precio de venta 1 que el comprador puede
aceptar o rechazar (take-it-or-leave-it).
5.1 Seleccin Adversa: El Modelo de Akerlof 101
Practiquemos pensando en Akerlof con informacin completa. El rbol
de juego es el siguiente:
P P
Seller
0
0
0
0 P-s
H
b
H
-P
P-s
L
b
L
-P
x H L 1-x
DIOS
Buyer
Seller
Buyer
Buyer
Buyer Buyer
Buyer
Como ves, es un juego dinmico con informacin completa, por lo que el
concepto de solucin que debemos aplicar es la Perfeccin en subjuegos: El
buyer acepta cualquier precio no superior a su valoracin. El seller ofrece
1 = /

.
Por tanto, el resultado en equilibrio es que se produce la transaccin a un
precio de venta que coincide con el valoracin del comprador el vendedor
extrae todo el excedente del consumidor-. Esto est bien, porque acabamos
de replicar el resultado con la formulacin tradicional.
102 5. Seleccin Adversa, Sealizacin y Screening
En el siguiente grco tienes resuelto formalmente el ejemplo numrico
anterior
Akerlof con informacin completa
GOD
Vendedor
1-
Vendedor

Tipo H Tipo L
1 2 3 4 5
s
L
b
L
s
H
b
H
1 2 3 4 5 1 2 3 4 5
A R A R A R A R A R A R A R A R A R A R
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
2
-1
3
-2
4
-3
-3
4
-2
3
-1
2
0
1
1
0
Equilibrio de Nash Perfecto en Subjuegos
Comprador: S
buyer
: {L,H} x [1,5] {A, R}
Acepta si el precio es menor o igual a su valoracin.
Rechaza en caso contrario
Vendedor: S
seller
: {L, H} [1,5]
Ofrece precio 5 si el tipo alto.
Ofrece precio 2 si es tipo bajo.
Precios por encima de la
mxima valoracin del
comprador y por debajo de la
mnima del vendedor estn
dominados, as que los
ignoro en la representacin
estratgica del juego
Comprador Comprador Comprador Comprador Comprador
Comprador Comprador Comprador Comprador Comprador
Si crees que te has enterado, entonces prueba a resolver el caso de
informacin completa pero simtrica (es el problema 5.1). Te facilito las
5.1 Seleccin Adversa: El Modelo de Akerlof 103
cosas dibujndote el rbol del juego:
Seller
Buyer
x H L 1-x
DIOS
Buyer
Buyer
1 2 3 4 5
s
L
b
L
s
H
b
H
Buyer
Buyer
1 2
3
4
5
1 2
3
5
4
Remark 15 Baruch de Spinoza (1632-1677). Spinoza reduce las tres
sustancias descartianas a una sola: sustancia divina innita, que segn
la perspectiva que se adopte, se identica bien con Dios o bien con la
Naturaleza. De hecho, ambos trminos llegan a ser equivalentes para l:
Deus sive Natura -God is not distinguishable from Nature-
La gracia del asunto consiste ahora en estudiar el caso de informacin
incompleta y asimtrica. El rbol de juego es el siguiente:
Buyer
0
0
b
H
-s
H
b
H
-b
H
b
L
-s
L
b
L
-b
L
Seller Seller
x H L 1-x
DIOS
No es secuencialmente
racional para el tipo L
poner el precio b
L
Buyer
Buyer
b
H
b
L
0
0
[1] [0]
[0] [1]
b
L
b
H
b
H
-s
L
b
L
-b
H
[p]
[1-p]
104 5. Seleccin Adversa, Sealizacin y Screening
Es relativamente sencillo demostrar que el precio no sealiza la calidad.
Es decir, que no existe un equilibrio secuencial separador que replique el
equilibrio con informacin completa. Para verlo tratemos de construirlo y
veamos dnde se rompe el candidato:
Estrategia vendedor: Establece precio /
1
si tipo alto y /
J
si limn.
Estrategia comprador: Acepta precios /
J
y /
1
.
Creencias senda comprador: Cree , si ve precio /

. Fuera senda?
DNDE SE ROMPE ESTE CANDIDATO A EQUILIBRIO SECUEN-
CIAL? Pues el tipo 1 con querra poner el precio /
J
sino el precio /
1
porque de esa forma ganara ms.
Pero es fcil demostrar que ambos tipos pongan un precio /
1
no es
equilibrio, porque
Consistencia: Buyer: p=x en la senda de equilibrio y libertad fuera
de ella (por ejemplo, cree que el tipo es bajo siempre).
Racionalidad secuencial: Buyer: Si rechaza gana 0 y si acepta
gana x(bH-bH) + (1-x) (bL-bH) que es negativo. Ergo no es
secuencialmente racional aceptar.
Existe la posibilidad de algn equilibrio pooling? Pues el pooling natural
es que ambos tipos establezcan pongan el siguiente precio r/
1
+(1 r)/
J
.
Consistencia: Buyer: p=x en la senda de equilibrio y libertad fuera
de ella. Supongamos por ejemplo que cree que el tipo es bajo siempre.
Racionalidad secuencial:
Buyer: Acepta el precio de equilibrio y en los dems casos, acepta
siempre que el precio sea inferior a bL.
Seller L: OK
Seller H: Rechaza si sHxbH+(1-x)bL
Si de verdad crees que entiendes, entonces ahora es el momento de realizar
el ejercicio 5.2, en el que consideramos un proceso de negociacin entre
compradores y vendedores distinto.
5.2 Sealizacin: El Modelo de Spence 105
5.2 Sealizacin: El Modelo de Spence
5.2.1 Juegos de Sealizacin.
Un juego de sealizacin es un juego con informacin imperfecta con dos
jugadores: un emisor (S) y un receptor (R).
El timing del juego es el siguiente:
1. La Naturaleza elige un tipo t
I
para el emisor a partir de un conjunto
de tipos T = t
1
, ..., t

de acuerdo a una funcin de probabilidad


j(t
I
), donde j(t
I
) _ 0 para cada i y

I=1
j(t
I
) = 1.
2. El emisor observa su tipo t
I
y elige un mensaje o seal :

a partir
de un conjunto de mensajes ' = :
1
, ..., :

.
3. El receptor observa el mensaje enviado :

y entonces elege una accin


a
|
a partir de un conjunto de acciones = a
1
, ..., a
1
.
4. Los pagos vienen dados por l
S
(t
I
, :

, a
|
) y l
1
(t
I
, :

, a
|
) .
En esta seccin vamos a tratar de no complicarnos la vida as que hemos
supuesto que los conjuntos T, ' y son nitos.
Recuerda que para cualquier juego, incluidos los juegos de sealizacin
que estamos estudiando, una estrategia pura para un jugador es un plan
completo de accin.
3
Por lo tanto, en este juego, una estrategia pura para
el emisor debe especicar el mensaje a emitir para cada uno de sus tipos
posibles, mientras que una estrategia pura para el receptor debe especicar
la accin a tomar para cada posible mensaje que pueda recibir.
Ahora es el momento de utilizar la clasicacin que hicimos en el tema
anterior de las estrategias puras en un contexto bayesiano. Una estrategia
pura es pooling en nuestro contexto si para cualquier tipo, la estrategia del
emisor le dice que emita el mismo mensaje, mientras que una estrategia
pura es separadora si para cada tipo especica una accin distinta.
4
El siguiente principio es el opuesto al principio de Akerlof.
Denicion 31 Full Disclosure Principle: If there is a credible means
for an individual to disclose that he is above the average of a group, he will
do so. This disclosure will implicitly reveal that other non-disclosers were
3
Esta debe ser la n-sima vez que escribimos la denicin de estrategia pura para un
jugador. Espero que nadie tenga dudas sobre lo que es una estrategia... Luego no me
digis en el examen que no lo sabis.
4
Si el nmero de tipos posibles es mayor que 2 y hay un subconjunto de tipos que
especican la misma accin hablaremos de estrategias parcialmente pooling o semi-
separadoras.
106 5. Seleccin Adversa, Sealizacin y Screening
below the average, which will give them the incentive to disclose, and so on
. . . In equilibrium, everyone will explicitly or implicitly disclose his private
information.
Remark 16 El Principio de Revelacin Mxima: Si existe una
manera creble de que un individuo revele que est por encima de la media
de un grupo,la utilizar. Esta revelacin implicitamente revelar que otros
estaban por debajo de la media, lo que les dar incentivos a revelar su
informacin, y as sucesivamente... En equilibrio, todos revelarn, explcita
o implcitamente, su informacin privada.
Ejemplo 13 El croar de las ranas al anochecer en las charcas del campo
no es sino el funcionamiento del Full Disclosure Principle. El espectculo
nocturno en El Viso tambin, aunque yo preero las charcas estivales.
5.2.2 El Modelo de Spence
La enorme literatura sobre juegos de sealizacin empieza con el modelo
de Spence
5
(1973). En esta seccin, estudiaremos una versin sencilla de
este modelo modelizado como un juego en forma extensiva y buscaremos
algunos de sus Equilibrios Secuenciales.
El timing del juego es el siguiente:
1. La naturaleza determina la habilidad productiva de los trabajadores,
j, que puede ser alta (H) o baja (L). La probabilidad objetiva de que
sea alta es .
2. El trabajador conoce su habilidad productiva y elige un nivel de
educacin, c 0.
3. Dos empresas observan el nivel de educacin elegido por cada
trabajador pero no su habilidad productiva y, simultneamente,
ofrecen un salario al trabajador.
6
4. El trabajador acepta el mayor salario ofrecido. Sea n el salario que
el trabajador acepta.
5. Los pagos son los siguientes:
(a) n c (j, c) para el trabajador, donde c (j, c) es el coste para un
trabajador de habilidad productiva j de conseguir un nivel de
educacin c
5
Es interesante tener en cuenta que precedi tanto al uso generalizado de los juegos en
forma extensiva para la modelizacin de problemas econmicos como a las deniciones
de equilibrio tales como el Equilibrio Bayesiano Perfecto y el Equilibrio Secuencial.
6
El hecho de que existan dos empresas en el papel de receptor hace que este modelo
no se ajuste demasiado bien a lo expuesto en la seccin anterior...
5.2 Sealizacin: El Modelo de Spence 107
(b) j (j, c) n para la empresa que contrata al trabajador,
donde j (j, c) es la produccin de un trabajador de habilidad
productiva j y nivel de educacin c y cero para la empresa que
no ha contratado al trabajador.
En esta seccin nos centraremos en el estudio de los Equilibrios
Secuenciales en los que las empresas interpretan el nivel de educacin de
los trabajadores como una seal de su habilidad productiva y por lo tanto,
ofrecen un salario mayor al trabajador con mayor nivel educativo.
7
Los supuestos del modelo son los siguientes:
1. Los trabajadores menos habilidosos encuentran la sealizacin ms
costosa que los trabajadores ms habilidosos. En trminos ms
tcnicos:
0c (1, c)
0c

0c (H, c)
0c
e
w
I
L
I
H
APRO
BADO
NOTA
BLE
SOBRE
La interpretacin de este supuesto es la siguiente: consideremos un
trabajador de habilidad j con educacin c
1
que tiene un salario n
1
.
Calculemos el incremento en el salario que sera necesario ofrecer para
que este trabajador incrementara su educacin hasta el nivel c
2
. La
respuesta depende de la habilidad del trabajador: los trabajadores
menos habilidosos encontraran ms costoso adquirir el nuevo nivel
7
En este modelo interpretaremos e como las notas del trabajador en sus estudios mas
que como anos de estudio. As pus, este modelo se puede aplicar a una promocin de
estudiantes de una carrera, por ejemplo, la vuestra...
108 5. Seleccin Adversa, Sealizacin y Screening
educativo que los trabajadores ms habilidosos. En trminos grcos,
la curva de indiferencia de los trabajadores menos habilidosos sera
ms inclinada que la de los trabajadores ms habilidosos.
8
2. El segundo supuesto dice que las empresas compiten entre ellas hasta
el punto en que los benecios esperados son cero. En este sentido,
para cualquier nivel de educacin c, el salario ofrecido es
n(c) = j(H [ c) j (H, c) + [1 j(H [ c)] j (1, c)
donde j(H [ c) son las creencias de que el trabajador con nivel de
educacin c sea de habilidad alta.
3. Las creencias de las dos empresas son idnticas
9
La conclusin que podemos sacar de estos supuestos es que en cualquier
Equilibrio Bayesiano Perfecto, los salarios van a venir determinados por la
ecuacin
n(c) = j(H [ c) j (H, c) + [1 j(H [ c)] j (1, c)
Para poder entender ms fcilmente los Equilibrios Secuenciales de este
modelo de sealizacin, empecemos por analizar el caso de informacin
completa.
1. Informacin completa.
En este caso, la competencia entre las empresas hace que el salario
ofrecido a cada trabajador sea simplemente n(c) = j (j, c)
e
w
y(,e)
8
En trminos ms tnicos, esta condicin se denomina single-crossing condition, o
condicin de Spence-Mierless.
9
Dentro de la senda de equilibrio es obvio que tienen que ser iguales, puesto que
ambas empresas utilizaran la Regla de Bayes para determinarlas. Este supuesto lo
utilizaremos para forzar a las empresas a que sus creencias sean idnticas fuera de la
senda de equilibrio.
5.2 Sealizacin: El Modelo de Spence 109
por lo que un trabajador con habilidad j elegir su nivel de educacin
c tal que
c arg max
t
[j (j, c) c (j, c)]
Sea esta solucin c

(j) y sea n

(j) = j [j, c

(j)] .
2. Informacin Incompleta.
En el caso de que la habilidad del trabajador en cuestin sea
desconocida por las empresas, pueden presentarse dos situaciones
bsicas:
(a) Caso de no envidia.
Supongamos que la empresa ofrece los salarios n

(H) y n

(1),
de tal forma que
n

(1) c [1, c

(1)] n

(H) c [1, c

(H)]
Es decir, para un trabajador de calidad baja intentar llegar al
nivel de educacin c

(1) es tan costoso que preere elegir el


nivel de educacin adecuado a su baja habilidad.
e
w
y(L,e)
I
H
I
L
y(H,e)
(b) Caso de envidia.
En este caso, para el trabajador de habilidad baja es benecioso
hacerse pasar por un trabajador de habilidad alta y conseguir
c

(H), para engaar a las empresas y conseguir un salario


110 5. Seleccin Adversa, Sealizacin y Screening
mayor, es decir, n

(H).
e
w
I
H
I
L
Este modelo es tan interesante como complejo, por lo que no podemos
hacer un estudio profundo de todos sus Equilibrios Secuenciales. En lugar
de eso, vamos a considerar unos cuantos ejemplos de equilibrios baysianos
perfecos, diferenciando, como no, entre equilibrios pooling y equilibrios
separadores.
Equilibrios pooling.
En esta seccin estudiaremos equilibrios pooling sin hacer referencia
explcita a si estamos considerando el caso de envidia o no envidia, puestos
que en ambos casos existen equilibrios pooling que son secuenciales.
Como ya sabemos de temas anteriores, en un equilibrio pooling, ambos
tipos de trabajadores eligen un mismo nivel de educacin. Denotemos este
nivel de educacin por c

, es decir, c (H) = c (1) = c

.
5.2 Sealizacin: El Modelo de Spence 111
e
w
y(L,e)
y(H,e)
I
L
q y(H,e) + (1-q) y(L,e)
e
P
El requisito de consistencia implica que las creencias de las empresas
depus de observar c

deben ser j(H [ c

) = .
Esto implica que el salario en equilibrio ofrecido por las empresas es
n

= n(c) = (H, c) + (1 ) j (1, c)


Para completar la descripcin del equilibrio pooling, necesitamos:
1. (a) Consistencia de las creencias fuera de la senda de equilibrio,
es decir, para valores de educacin distintos de c

. As ya
tendramos determinados los salarios ofrecidos por las empresas
fuera de la senda de equilibrio.
(b) Racionalidad secuencial: Demostrar que la mejor respuesta de
cada tipo del trabajador es precisamente c

.
Una posibilidad es que las empresas crean que cualquier nivel de
educacin distinto de c

implica un nivel de habilidad del trabajador


baja. As:
j(H [ c) =
_
0 si c ,= c

si c = c

Por tanto, el salario ofrecido por las empresas es


n(c) =
_
j (1, c) si c ,= c

si c = c

Entonces, un trabajador con habilidad j eligir un nivel de educacin


c

tal que
c

arg max
t
[n(c) c (j, c)]
112 5. Seleccin Adversa, Sealizacin y Screening
Sera interesante que comprobaras que los trabajadores encuentran
ptimo elegir c

.
Este es un equilibrio secuencial de entre la multitud que podemos
encontrar, porque cambios en las creencias fuera de la senda de
equilibrio y cambios en los niveles de educacin elegidos por los
distintos trabajadores nos llevan a otros equilibrios pooling.
Equilibrios Separadores.
En este caso, la diferencia es crucial entre el caso de envidia y no envidia.
1. Caso de no envidia.
En este caso, slo existen equilibrios separadores, puesto que al
trabajador de habilidad baja no le interesa ngir y hacerse pasar por
un trabajador de habilidad alta. As, un posible equilibrio secuencial
sera el siguiente:
(a) Nivel de educacin elegido:
c (1) = c

(1)
c (H) = c

(H)
Los trabajadores eligen niveles de educacin como si
estuviramos en el caso de informacin completa. Es fcil
explicar por qu: no hay envidia...
(b) Creencias en la senda de equilibrio:
j(H [ c

(1)) = 0
j(H [ c

(H)) = 1
(c) Salarios ofrecidos en la senda de equilibrio:
n

(1) = j (1, c

(1))
n

(H) = j (H, c

(H))
(d) Fuera de la senda de equilibrio.
Tenemos que explicitar, para describir perfectamente el
Equilibrio Bayesiano Perfecto, tanto las creencias como los
salarios fuera de la senda de equilibrio. Pensad un poco...en
cualquier caso, en el apndice encontraris una posible solucin.
5.2 Sealizacin: El Modelo de Spence 113
e
w
y(L,e)
I
H
I
L
y(H,e)
Racionalidad secuencial: La explicacin del comportamiento de los
agentes en este caso es bastante simple: dado que no hay envidia, el
trabajador con habilidad alta elige su nivel ptimo de educacin con
informacin completa porque sabe que un trabajador con habilidad
baja nunca va a tratar de hacerse pasar por uno de habilidad alta.
As, en este caso, c

(H) es suciente para sealizar que uno es de


habilidad alta.
2. Caso de envidia.
Equilibrios separadores con envidia.
El caso ms interesante es el de los equilibrios separadores en el
caso de envidia. An cuando tengamos un equilibrio separador,
el trabajador de habilidad alta nunca va a conseguir el salario
n(c) = j (H, c), es decir, su salario ptimo con informacin completa,
eligiendo el nivel de esfuerzo c

(H) de informacin completa, porque


en este caso, el trabajador con habilidad baja tiene incentivos a ngir
y adquirir el nivel de educacin c

(H) para hacerse pasar por un


trabajador de habilidad alta.
114 5. Seleccin Adversa, Sealizacin y Screening
e
w
y(L,e)
I
H
I
L
y(H,e)
e
Sep
Por tanto, c

(H) no puede formar parte de un equilibrio separador!!


El nivel de educacin elegido por un trabajador de habilidad alta
c
s
tendr que ser mayor que c

(H), pero, cunto mayor? Hasta


el punto en que al trabajador de habilidad baja no le interese
ngir. La intuicin de este resultado es bastante clara: El trabajador
de habilidad alta busca un nivel de educacin para separarse
(distinguirse) del trabajador de habilidad baja eligiendo un nivel de
educacin que no puede ser replicado por el trabajador de habilidad
baja. Este es un maravilloso ejemplo que ilustra un maravilloso
principio: La separacin es costosa, emitir una seal (nivel de
educacin) para que el emisor reconozca que somos de calidad
alta tiene un coste: un nivel de educacin mayor que en el caso de
informacin completa.
Una vez que el trabajador de habilidad alta ha elegido c
s
, la empresa
reconocer sin problemas al trabajador de habilidad baja y por lo
tanto le ofrecer un salario j (1, c (1)). As, el nivel de educacin
elegido por este trabajador ser aquel que maximice sus pagos
esperados, es decir,
c

arg max
t
[j (1, c (1)) c (1, c(1))]
que no es otro que c

(1), el nivel de educacin elegido por este


trabajador en el caso de informacin completa.
As, un ejemplo de un equilibrio separador sera:
(a) Nivel de educacin elegido:
5.3 Racionamiento del Crdito: El Modelo de Stiglitz y Weiss 115
i. c (1) = c

(1)
c (H) = c
s
(b) Creencias en la senda de equilibrio:
i. j(H [ c

(1)) = 0
j(H [ c
s
) = 1
(c) Creencias fuera de la senda de equilibrio:
i. j(H [ c) =
_
0 si c < c
s
1 si c _ c
s
(d) Esquema salarial :
i. n(c) =
_
j (1, c) si c < c
s
j (H, c) si c _ c
s
Lo nico que nos queda por hacer es comprobar que realmente es un
equilibrio secuencial. Para ello tenemos que ver que los trabajadores
eligen los niveles de educacin de equilibrio, dado el esquema salarial
y las creencias de las empresas. Adems, que las empresas maximizan
pagos esperados (eso ya lo sabemos, benecios esperados cero) y por
ltimo que las creencias son consistentes. Como siempre, lo dejamos
para que lo pensis un poco...
De nuevo surge la situacin anterior, en la que este es un simple
ejemplo de entre la multitud de equilibrios separadores que podemos
encontrar. Sin embargo, eso es algo que no nos preocupa en este
curso...
5.3 Racionamiento del Crdito: El Modelo de
Stiglitz y Weiss
Esta seccin versa sobre una de las respuestas tpicas de los bancos en el
mercado de crditos ante la posibilidad de seleccin adversa. Para verlo
empecemos por formalizar una de las ideas comunmente ms aceptadas en
el mundo bancario: a mayor probabilidad de impago de un crdito, mayor
tipo de inters.
Supongamos que eres un banco (neutral al riesgo) que puede conseguir
una determinada cantidad de recursos 1 a un tipo de inters i
JT
(por
ejemplo, en los mercados de capitales internacionales, o en el mercado
interbancario, o del Banco Central Europeo). Tu negocio consiste en prestar
ese dinero a individuos que vienen descritos por la probabilidad 1 j de
impago.
116 5. Seleccin Adversa, Sealizacin y Screening
Querrs prestar el dinero siempre que te sea rentable, es decir, siempre
que tus ingresos j (1 +i
J
) 1+0 (1 j) donde i
J
es el tipo de inters que
cargas sean mayores que tus pagos
_
1 +i
JT
_
'. Para que los parntesis
(1 +a|qo) no nos enmaraen las expresiones, hagamos un cambio de
variable: Sea r = 1 +i. As, el banco prestar el dinero siempre que
jr
l
1 + 0 (1 j) _ r
JT
1
Esto implica la existencia de una cota inferior para tu tipo de inters
r
J
_
r
JT
j
= r
J
Si ahora suponemos que ests en un entorno competitivo, entonces la
lucha de tipos de inters entre los bancos te llevar a establecer como tipo
de inters esa cota inferior, precisamente la que te da benecios cero. Como
ves, r
J
es tal que cuanto mayor es la probabilidad de impago, mayor es el
tipo de inters al que prestars el dinero.
Lema 1 Conventional wisdom: A mayores probabilidades de impago, cobra
mayores tipos de inters
Pero ojo, este lema tiene sentido en el marco terico que hemos
desarrollado hasta el momento: el banco conoce el perfectamente las
caractersticas del deudor. En el caso en el que el banco no conozca todas
las caractersticas relevantes, entonces el anterior lema no tiene por qu ser
cierto; es ms, no ser cierto.
Supongamos que con el crdito 1, el deudor quiere nanciar un proyecto
de inversin con rentabilidad 1. Supongamos que adems el banco exige
una garanta C (collateral). Entonces, el impago del crdito se producir
siempre que 1 +C _ r
J
1.
No nos har falta pero es interesante que entiendas que los benecios del
banco son

1on|
= min(1 +r
J
) 1, 1 +C
Sigamos adelante. Supongamos que la rentabilidad del proyecto de
inversin 1
r
es una variable aleatoria que con probabilidad 1,2 es 1
0
+r y
con probabilidad 1,2 es 1
0
r, con r 0. Fjate en que todos los proyectos
de inversin tienen la misma rentabilidad esperada
1 (1
r
) = 1
0
pero dieren en el riesgo, puesto que
\ 1(1
r
) =
1
2
(1
0
1
0
r)
2
+
1
2
(1
0
1
0
+r)
2
= r
2
0
5.3 Racionamiento del Crdito: El Modelo de Stiglitz y Weiss 117
Supongamos adicionalmente que nos restringimos a valores de las
variables tales que si el proyecto no va bien, entonces el inversor no puede
devolver el prstamo ms los intereses pactados; es decir, supongamos
1
0
r +C < (1 +r
J
) 1
Finalmente supongamos que hay dos tipos de inversores equiprobables e
indistinguibles para el banco: los buenos (poco riesgo, i.e. r pequeita) y
los malos (ms arriesgados, i.e. r ms grande).
El rbol del juego es el siguiente
GOD

BANCO

Malo Bueno
1 2 r
L
4 5 1 2 r
L
4 5
A R A R A R A R A R A R A R A R A R A R
[]
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

I

B

I

B

I

B

I

B

I
Inversor Inversor Inversor Inversor Inversor Inversor Inversor Inversor Inversor

I

B

I

B

I

B

I

B

I
[]
donde en cada nodo terminal en el que un inversor de tipo , acepta el
tipo de inters r
J
del banco los pagos de los jugadores son

1onco
=
1
2
_
1
0
r

+C
_
+
1
2
(1 +r
J
) 1 1

1nu

=
1
2
(C) +
1
2
_
1
0
+r

(1 +r
J
) 1
_
Pensemos en qu sera un equilibrio secuencial en este modelo. Para ello
empecemos por las estrategias para los inversores, que son las ms fciles:
este juego tiene un puado de subjuegos: uno por cada tipo de inters que
pone el banco y tipo del inversor. La racionalidad secuencial exige que en
cada subjuego el inversor acepte siempre que su benecio esperado no sea
negativo

1nu

=
1
2
(C) +
1
2
_
1
0
+r

(1 +r
J
) 1
_
_ 0
Si te jas bien, el benecio para un inversor tipo , es decreciente en el
tipo de inters r
J
ofrecido por el banco. Por ello, para un tipo de inters
118 5. Seleccin Adversa, Sealizacin y Screening
dado, el inversor acepta el prstamo siempre que su rendimiento r

sea
lo sucientemente grande, es decir, siempre que sea lo sucientemente
arriesgado. Sea r el rendimiento mnimo es decir, el riesgo mnimo
necesario para que el inversor rme el prstamo a un tipo de inters r
J
.

1nu

=
1
2
(C) +
1
2
(1
0
+ r (1 +r
J
) 1) = 0
r = C + (1 +r
J
) 1 1
0
GOD

BANCO

Malo Bueno
1 2 3 4 5 1 2 3 4 5
A R A R A R A R A R A R A R A R A R A R
[]
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

I

B

I

B

I

B

I

B

I
Inversor Inversor Inversor Inversor Inversor Inversor Inversor Inversor

I

B

I

B

I

B

I

B

I
[]
Fjate en que al considerar tipos de inters mayores, el primer tipo de
inversor que deja de aceptar el prstamo es el bueno (en el grco esto
ocurre para un tipo de inters 2). El tipo malo empieza a no rmar el
prstamo al tipo 4. Esta es la seleccin adversa causada por el tipo de
inters.
Sigamos con el comportamiento ptimo del banco. Este es fcil puesto
que sus creencias son trivialeas su conjunto de informacin pertenece a
la senda de equilibrio y por tanto podemos aplicar la regla de Bayes para
la formacin de las creencias. La regla de Bayes nos dice que las creencias
deben coincidir con la probabilidad con la que la naturaleza elige cada
uno de los tipos. En cuanto a su estrategia, esta es simplemente el tipo de
inters que cargar al prstamo. Para que cumpla la racionalidad secuencial,
debemos ver cul es el tipo de inters que maximiza los benecios del banco.
Sabemos que para los datos del ejemplo, para un tipo de inters menor
que 2 los dos tipos aceptan el prstamo, por lo que los benecios del banco
son

1onco
=
1
2
_
1
2
_
1
0
r
1
+C
_
+
1
2
(1 +r
J
) 1 1
. .
_
Inversor bueno
+
1
2
_
1
2
_
1
0
r
1
+C
_
+
1
2
(1 +r
J
) 1 1
. .
_
Inversor malo
5.3 Racionamiento del Crdito: El Modelo de Stiglitz y Weiss 119
Como ves, los benecios son crecientes en el tipo de inters, por lo que
tendramos el siguiente grco
r
L
0
1 2 3 4
Ahora bien, en el tramo en el que el tipo de inters se sita entre 2 y 4,
tenemos que los benecios son menores

1onco
=
1
2
_
0
..
_
Inversor bueno
+
1
2
_
1
2
_
1
0
r
1
+C
_
+
1
2
(1 +r
J
) 1 1
. .
_
Inversor malo
porque justo al llegar al tipo de inters 2 los inversores buenos rechazan el
prstamo recuerda que esta es la seleccin adversa. Finalmente, cuando
pasamos al tipo de inters 4, el inversor malo tambin rechaza el prstamo,
por lo que los benecios del banco son 0.
r
L

Banco
0
1 2 3 4
La conclusin fundamental de este modelo es que subir los tipos de
inters no es la solucin para los bancos!! Porque los tipos de inters
actan como una variable que selecciona a los prestatarios, en este caso,
negativamente para el banco.
El ptimo es establecer un tipo de inters menor (en el ejemplo, 2) al
que ambos tipos quieren endeudarse. . . Es decir, no es benecioso para el
120 5. Seleccin Adversa, Sealizacin y Screening
banco aumentar el tipo de inters para reducir el exceso de demanda de
crditos.
Pero no hay dos prstamos uno para cada tipo de inversor-, sino uno
slo: as que el primero que aparezca por el banco se lo lleva, y el otro recibe
un no por respuesta, an cuando estara dispuesto a rmarlo: el crdito est
racionado. Veamos un ejemplo numrico.
Supongamos dos inversores que quieren pedir un prstamo de un euro.
Uno es high-risk y el otro low-risk. El banco conoce la distribucin de
retornos de cada uno de los tipos, pero no sabe quin es quin... Se establece
un aval del 75% del valor del prstamo.
Retorno segn inversor
0
0,2
0,4
0,6
0,8
1
0 2,2 3,8
Retorno
P
r
o
b
a
b
i
l
i
d
a
d
Low-Risk
High-Risk
Estudiemos la demanda de prstamos en funcin de su tipo de inters.
El inversor high-risk demanda el prstamo siempre que el tipo de
inters no supere 0.55
3
4
(0.75) +
1
4
(3.8 1 r) = 0 r = 0.55
El inversor low-risk demanda el prstamos siempre que su tipo de
inters no supere 0.45
1
2
(0.75) +
1
2
(2.2 1 r) = 0 r = 0.45
5.3 Racionamiento del Crdito: El Modelo de Stiglitz y Weiss 121
Por tanto, el demanda de prstamos es
r
L
0,55
0,45
0 1 2 3 4
donde hemos incluido la oferta de prstamos vertical al valor 1. Cul
ser el equilibrio en el mercado de prstamos? Pues la teora tradicional te
diria que en el punto de corte entre oferta y demanda, es decir, en un tipo
de inters comprendido entre 0.45 y 0.55. Si piensas de esta forma, entonces
es que no te has enterado de nada, puesto que para tipos de inters por
encima de 0.45 el nico inversor que demanda el prstamo es el inversor
high-risk por lo que los benecios del banco seran negativos...

1onco
=
3
4
(0.75 1) +
1
4
(1.55 1) = 0.075 < 0
y para tener benecios negativos mejor no dedicarse al negocio de los
prstamos... Te das cuenta como desaparece el mercado competitivo
oferta igual a demanda de prstamos? En estas circunstancias, veamos
como el racionamiento del crdito (negarle el prstamos a alguien que
encuentra benecioso pedirlo) es una alternativa interesante.
La idea es que en lugar de subir el precio para disminuir la demanda
de crdito, que racione la cantidad. Por ejemplo, el banco puede poner un
tipo de inters 0.45, vienen los dos tipos y elige a qu persona le da el
crdito tirando una moneda (cara o cruz). Los benecios asociados a esta
estrategia son

1onco
=
1
2
_
3
4
(0.75 1) +
1
4
(1.45 1)
_
+
1
2
_
1
2
(0.75 1) +
1
2
(1.45 1)
_
= 0.0125 0
es decir, positivos.
122 5. Seleccin Adversa, Sealizacin y Screening
5.4 Screening: El Modelo de Rothschild y Stiglitz
Ahora presentamos otra respuesta del mercado a la seleccin adversa: el
screening o la Auto-seleccin de tipos. sta funciona siempre que:
1. Se pueda jugar con una variable adicional al precio que afecte a la
disposicin marginal a pagar de los consumidores
- Cantidad en la discriminacin monopolista
- Grado de cobertura en los seguros
- Garanta en los prstamos
- Trabajo en el mercado laboral
2. Y se pueda restringir a los consumidores a elegir entre combinaciones
particulares de las variables relevantes.
Veremos el modelo de Michael Rothschild y Joseph Stiglitz (1976) de
Seleccin Adversa en el Mercado de Seguros. Para ello, recuerda la ltima
pregunta del primer tema: un modelo bsico de demanda de seguros.
Estado
MALO
Estado
BUENO
w
w d
Sin seguro
Lnea de intercambio
actuarialmente justo
(pendiente Pbueno/Pmalo)
Beneficios empresariales
cero
Lnea de 45 grados
Con seguro
Prima del
seguro
Pago neto
del seguro
Supongamos que existen en el mercado dos tipos de individuos que slo
se diferencian en la probabilidad de accidente.
Los H que tienen una probabilidad alta de sufrir la prdida (alto
riesgo) y los L que la tienen ms pequea (la probabilidad) (bajo
riesgo).
5.4 Screening: El Modelo de Rothschild y Stiglitz 123
La informacin est asimtricamente repartida: cada individuo
conoce su probabilidad pero esta informacin no es conocida por las
empresas de seguros. El timing del juego es el siguiente:
La naturaleza selecciona el tipo del individuo, es decir, su nivel
de riesgo, que puede ser alto (H) o bajo (L), a partir de una
distribucin de probabilidad (q, 1-q).
La naturaleza revela su tipo al consumidor, pero no a las
empresas de seguros.
Las empresas de seguros ofrecen de forma simultnea un
conjunto nito de plizas (prima, indemnizacin).
El individuo suscribe una de las plizas.
Las caractersticas clave de este modelo son las siguientes:
1. Los individuos de menor riesgo (L) de accidente exigen mayores
pagos por trasvasar riqueza del estado bueno al estado malo que los
individuos de mayor riesgo (H) de accidente. Recuerda que la utilidad
de todos los individuos es la siguiente
l
_
n d, j
I
; n, 1 j
I
_
= j
I
n(n d) +
_
1 j
I
_
n(n)
Las curvas de indiferencia tienen la siguiente relacin:
Alto
riesgo
(H)
Bajo
riesgo
(L)
Estado
malo
0
Fjate en que tenemos una Single-Crossing Condition: Al
renunciar a un euro en el estado no accidente, los de bajo riesgo
exigen un mayor pago de euros en el estado accidente porque la
probabilidad del estado accidente es menor para ellos que para los
de alto riesgo.
124 5. Seleccin Adversa, Sealizacin y Screening
2. Las empresas compiten entre ellas hasta el punto en el que los
benecios son cero (Por eso queremos tener dos empresas, para poder
considerar un mercado de seguros competitivo)
3. Las creencias de las dos empresas son idnticas. En este caso esto es
menos problemtico que en el caso de Spence, porque las creencias
son triviales ya que la parte desinformada es la que mueve primero.
Por tanto, las creencias acerca del tipo del consumidor (movimiento
de la naturaleza) surgen directamente de la Regla de Bayes y por
tanto han de coincidir con el a-priori (q, 1-q).
Las estrategias en el modelo de Rothschild y Stiglitz son muy sencillitas
en comparacin con las del modelo de Spence.
(i) Individuo: Una funcin que dice para cada tipo posible (H, L)
qu pliza de seguros elige del men ofrecido por las empresas
aseguradoras.
(ii) Empresas: Un men de plizas (tantas como tipos distintos de
consumidores haya)
Como siempre estudiemos lo que ocurre con informacin completa para
poder entender mejor los efectos de la asimetra de la informacin. El
siguiente grco resume la situacin con informacin completa.
Estado
MALO
Estado
BUENO
w
w d
Lnea de cobertura
completa
Alto
riesgo (H)
Bajo
riesgo (L)
Tenemos dos mercados, uno
para cada tipo.
CLAVE: Las curvas de
indiferencia de los tipos de bajo
riesgo son ms inclinadas que
las de los tipos de alto riesgo.
RESULTADO: Los dos se
aseguran a todo riesgo aunque
los de bajo riesgo (L) tienen un
seguro ms barato que los de
alto riesgo (H)
Prima tipo L
Prima tipo H
Si existe informacin asimtrica, pueden en principio aparecer dos tipos
de situaciones:
5.4 Screening: El Modelo de Rothschild y Stiglitz 125
POOLING: Las compaas de seguros ofrecen una nica pliza.
SEPARATING: Las compaas de seguros ofrecen ms de una pliza
de seguros (deben ser dos porque hay dos tipos de clientes)
Analicmoslas por separado con cierta calma.
5.4.1 Equilibrios Pooling
Recuerda los modelos de Akerlof y Spence: La lnea de benecios cero
(actuarialmente justa) est denida a partir de las proporciones de tipos
de alto riesgo y tipos de bajo riesgo. Para no complicarnos la vida, sea sta
50-50 en el grco siguiente, por aquello de poder dibujar el equilibrio.
Estado
MALO
Estado
BUENO
w
w d
Lnea de cobertura
completa
Alto
riesgo
(H)
Bajo
riesgo
(L)
Piensa en cualquier punto de la lnea actuarialmente justa y veamos
como no puede ser equilibrio. El contrato en rojo es mejor puesto que (i)
No atrae a los de alto riesgo, (ii) Atrae a los de bajo riesgo y (iii) Hay
benecios empresariales. As pus, ya tenemos el primer gran resultado de
este modelo:
Proposicion 8 No existen equilibrios secuenciales pooling.
Remark 17 Intuicin. Si hay una nica pliza, hay un nico precio, que
pagan tanto los L y los H. Pero los H (alto riesgo) pasan ms partes y por
tanto reciben ms indemnizaciones que los L (bajo riesgo). Es decir, los
L estn subsidiando a los H. Existen incentivos a separar ambos grupos,
que es lo que hace la pliza alternativa. Por tanto, una nica pliza nos es
equilibrio.
126 5. Seleccin Adversa, Sealizacin y Screening
5.4.2 Equilibrios separadores
Siguiendo la intuicin anterior, la compaa de seguros va a ofrecer dos
plizas de seguro:
Una para los de bajo riesgo (L)
Otra para los de alto riesgo (H)
De hecho, esta es la situacin que se dara si el riesgo de los individuos
fuera observable.
Estado
MALO
Estado
BUENO
w
w d
Lnea de cobertura
completa
Alto
riesgo (H)
Bajo
riesgo (L)
Son los contratos
ptimos bajo
observabilidad de
equilibrio?
F
H
F
L
Podemos encontrar un equilibrio secuencial que implique el mismo
resultado en equilibrio que el equilibrio con informaicn completa? Pues
va a ser que no porque no es secuencialmente racional para el tipo H elegir
1
1
sino que preere 1
J
.
5.4 Screening: El Modelo de Rothschild y Stiglitz 127
De hecho, lo mejor que podemos conseguir es el siguiente equilibrio
separador:
Estado
MALO
Estado
BUENO
w
w d
Lnea de cobertura
completa
Alto
riesgo (H)
C
F
H
: Seguro ms caro con
cobertura completa para
los de alto riesgo.
C: Seguro ms barato
con cobertura incompleta
para los de bajo riesgo.
F
H
C
Lo mejor que
podemos conseguir
es el par (F
H
, C)
C
+
C
-
PRIMA
PRIMA
Situacin inicial
5.4.3 Implicaciones del modelo
Cuando la informacin es privada, el mercado no asigna los recursos
econmicos de forma eciente. Este modelo contraviene el llamado Primer
Teorema del Bienestar puesto que el mercado de seguros no ofrece un
equilibrio pareto eciente.
Cmo de realista es el modelo para el mundo real? Pues bastante, porque
en el mundo real las personas conocen mejor su salud que las compaas
aseguradoras. Es cierto que puede parecerte un supuesto extremo que
conozcas exactamente tu salud pero esto ha sido una simplicacin para
poder tener un modelo manejable.
128 5. Seleccin Adversa, Sealizacin y Screening
This is page 129
Printer: Opaque this
6
Riesgo Moral e Incentivos
En el tema anterior estudiamos situaciones en las que la asimetra de la
informacin se produca antes de que el principal propusiera el contrato
al agente, es decir, el tipo del agente era elegido antes de que el principal
tuviera ocasin de jugar... En este tema estudiaremos situaciones en las
que la asimetra se produce despus de la proposicin y rma del contrato.
El tpico ejemplo es la situacin siguiente. Un empresario contrata a un
manager para que lleve la empresa. Despus de la rma del contrato, el
propietario de la empresa no siempre podr observar el esfuerzo con el que
el manager desempea su trabajo. Anticipando este tipo de situaciones, el
propietario de la empresa tratar de disear un contrato que proporcione
al manager los incentivos necesarios para que ste realice celosamente su
trabajo, para que la empresa vaya bien y el propietario gane mucho dinero,
etc...
La literatura ha distinguido tradicionalmente entre dos tipos de
problemas informacionales que pueden ocurrir en este escenario:
1. Aquellos que resultan de acciones escondidas (riesgo moral ): es decir,
el propietario de la empresa (el principal) no puede observar el
esfuerzo del manager (agente), y
2. Aquellos que resultan de conocimiento escondido: as, el manager
puede tener un mejor conocimiento de las oportunidades de negocio
para la empresa dado que est trabajando a pie de obra...
En este tema, nos centraremos en el riesgo moral y lo haremos
desarrollando el modelo del propietario-manager, aunque debeis tener
130 6. Riesgo Moral e Incentivos
presente el amplio rango de situaciones econmicas que pueden ser descritas
por el paradigma principal-agente.
PRINCIPAL
AGENTE
Acepta
Rechaza
Contrato
NATURE
Esfuerzo
AGENTE
6.1 Modelo bsico
Imagina que el propietario de una empresa (principal) contrata a
un manager (agente) para que dirija la empresa durante un periodo
determinado de tiempo o para un proyecto en particular. No es difcil
imaginar que los ingresos de la empresa van a depender de las acciones
del agente (en este caso, las acciones sern diferentes niveles de esfuerzo en
el desempeo de su funcin). El problema al que se enfrenta el principal
es que no puede observar el esfuerzo en el trabajo del agente. As, el
contrato no puede contemplar un salario para cada nivel de esfuerzo
realizado por el agente, puesto que no hay forma de vericar si el agente ha
cumplido realmente sus obligaciones. En estas circunstancias, el principal
deber disear un esquema salarial que, de forma indirecta, proporcione
los incentivos adecuados al agente para que ponga todo su empeo en la
realizacin de su trabajo.
Siendo ms especcos, sean los ingresos obtenidos por la empresa y
sea c la accin elegida por el agente. En este tema suponemos que los
ingresos obtenidos por la empresa son siempre observados por el principal.
El conjunto de acciones posibles para el agente es 1. En nuestro tratamiento
del problema, interpretaremos c como el esfuerzo realizado.
Para que la no observabilidad del esfuerzo del agente tenga consecuencias,
evidentemente no puede haber una relacin directa entre el esfuerzo del
agente y el ingreso de la empresa. Si la correlacin entre y c fuera
perfecta, entonces el principal podra deducir el esfuerzo realizado a partir
de la observacin del ingreso. Por lo tanto, supondremos que los ingresos
de la empresa pueden tomar valores en el intervalo [

,
+
], y que estn
estocsticamente relacionados con el nivel de esfuerzo c de una manera
descrita por una funcin de densidad condicionada
) ( [c) donde ) ( [c) 0 \c 1, \ [, ] (6.1)
de forma que cada realizacin de puede ocurrir a partir de cualquier valor
de c.
6.1 Modelo bsico 131
As pues, dado el nivel de esfuerzo elegido por el agente, el ingreso
obtenido por la empresa es aleatorio, es decir, depende del estado
de la naturaleza, que viene gobernado por la funcin de distribucin
condicionada ) ( [c) .
Para que las cosas no sean tan complicadas como os estis empezando a
temer, nos referiremos al caso en el que el conjunto 1 tiene dos elementos,
es decir, 1 = 1, H, donde 1 es un nivel de esfuerzo menor que H, y el
conjunto de valores posibles de los ingresos es nito, es decir, , donde
=
1
, ...,
n
.
As, sea j
It
la probabilidad de que habiendo elegido el agente el nivel
de esfuerzo c el ingreso de la empresa sea
I
, donde las funciones de
distribucin condicionadas 1 ( [H) y 1 ( [1) cumplen
1
1 (
I
[H) < 1 (
I
[1) para todo
I
(6.2)
Un ejemplo facilita las cosas
Ingresos L H Acc L Acc H LR
1 0,53 0,14 0,53 0,14 3,78571
2 0,25 0,24 0,78 0,38 1,04167
3 0,12 0,29 0,9 0,67 0,41379
4 0,1 0,33 1 1 0,30303
Esperado 1,79 2,81 - - -
Esfuerzos y Ratio de verosimilitud
0
0,1
0,2
0,3
0,4
0,5
0,6
1 2 3 4
Beneficios (mill euros)
P
r
o
b
a
b
i
l
i
d
a
d
0
0,5
1
1,5
2
2,5
3
3,5
4
L
H
LR
ingresos
1
El trmino tcnico de la siguiente expresin es que la funcin de distribucin
condicionada en el nivel de esfuerzo H domina estocsticamente de primer orden a la
funcin de distribucin condicionada en el nivel de esfuerzo L.
132 6. Riesgo Moral e Incentivos
Funciones distribucin acumuladas
0
0,25
0,5
0,75
1
0 1 2 3 4
Ingresos (en millones de euros)
P
r
o
b

A
c
u
m
u
l
a
d
a
L
H
La primera gran implicacin de la condicin anterior es que el ingreso
esperado de la empresa si el agente realiza el esfuerzo H es mayor que el
ingreso esperado si realiza 1, es decir,
n

I=1

I
j
I1

n

I=1

I
j
IJ
(6.3)
1 ( [ H) 1 ( [ 1) (6.4)
El agente quiere maximizar su utilidad, representada por funcin que
depende del salario recibido y del esfuerzo realizado, (n, c), donde
suponemos que

0
u
() 0 \(n, c)

00
u
(.) _ 0 \(n, c) (6.5)

0
t
() < 0
Es decir, el agente preere ms salario a menos (su funcin de utilidad
es creciente en n), es averso al riesgo (su funcin de utilidad es cncava en
n) y le disgusta esforzarse en el trabajo.
Por lo tanto, hemos encontrado un conicto de intereses que es la pieza
clave de todo este captulo: el esfuerzo que proporciona un mayor ingreso
esperado de la empresa es el que ms disgusta al trabajador.
En este tema trabajaremos con una especicacin de la funcin de
utilidad del agente que es aditivamente separable:
2
(n, c) = n(n) q (c).
Para este caso particular, los supuestos anteriores implican:
n
0
(n) 0
n
00
(n) _ 0
(6.6)
2
Esta es la forma funcional estandar en la literatura de riesgo moral.
6.1 Modelo bsico 133
El principal recibe el ingreso total de la empresa menos el salario que ha
de pagarle al agente, teniendo una funcin de utilidad Q( n) = n,
es decir, su funcin de utilidad es lineal: el principal es neutral al riesgo.
Una vez detallados todos los elementos del problema del principal-agente,
expondremos el timing del juego:
1. El principal ofrece un contrato (un esquema salarial).
2. El agente acepta o rechaza el contrato.
(a) Si el agente lo rechaza, el principal no recibe un duro y el agente
consigue en otro lugar un nivel de utilidad n
3
...
(b) Si el agente acepta el contrato, entonces:
3. El agente elige un nivel de esfuerzo.
4. La naturaleza elige el estado del mundo (o el estado de la naturaleza
se realiza).
5. La empresa consigue unos ingresos.
6. Los jugadores reciben sus pagos:
(a) El Agente recibe el salario establecido en el contrato.
(b) El Principal se queda con lo que sobra de los ingresos una vez
pagado el salario del agente.
Como siempre, todo lo dicho hasta ahora sobre el juego es conocimiento
comn.
Como podis observar, en este juego no hay ningn jugador que
desconozca las funciones de utilidad de su adversario ni que no sepa
todo el desarrollo del juego desde el comienzo hasta que tiene que mover.
As, contrariamente al caso de seleccin adversa, tenemos un juego con
informacin perfecta y completa, pero con incertidumbre, porque los
jugadores no conocen el estado de la naturaleza a la hora de tomar sus
decisiones. Sin embargo, ambos jugadores estn en pie de igualdad en este
aspecto, es decir, la incertidumbre es simtrica.
La pregunta que tenemos que hacernos es dnde afecta el hecho de que el
esfuerzo realizado por el agente no sea observado por el principal. Esta es
la fuente de asimetra de informacin: el agente siempre conoce su esfuerzo
pero el principal puede no conocerlo. La respuesta es en el tipo de contrato
disponible. Si el esfuerzo es observable (y vericable ante los tribunales),
3
Podemos pensar que siempre puede trabajar en Burger King por un salario tal que
le proporciona ese nivel de utilidad, denominado Utilidad de Reserva.
134 6. Riesgo Moral e Incentivos
entonces los salarios del contrato pueden condicionarse tanto al esfuerzo
realizado como a los ingresos de la empresa (que siempre son observados
por el principal). Por contra, si el esfuerzo no es observable, entonces no es
contratable en el sentido de que no puede aparecer escrito en el contrato
y por lo tanto solo se pueden condicionar los salarios al benecio obtenido
por la empresa
4
.
Como estamos ante un juego con informacin perfecta y completa, el
concepto de equilibrio que vamos a utilizar es el de Equilibrio de Nash
Perfecto en Subjuegos, pero teniendo presente que los pagos para los
jugadores son inciertos, pues dependen del estado de la naturaleza.
Si queremos encontrar equilibrios, nos tenemos que preguntar qu es
una estrategia pura para el principal y qu es una estrategia pura para el
agente. En este caso, como en todos los modelos estudiados en este curso,
la respuesta no es demasiado difcil:
1. Una estrategia pura para el principal es simplemente un contrato a
ofrecer al agente, es decir, un esquema salarial. Esta respuesta la
detallaremos un poco ms a lo largo del tema, a la hora de estudiar
cules son exactamente los contratos disponibles para el principal,
pues como sabemos, dependern de si el esfuerzo es observable o no.
2. Una estrategia pura para el agente tiene dos componentes. En primer
lugar debe decir, para cualquier contrato posible, si lo acepta o lo.
En segundo lugar, debe decir para cualquier contrato posible, qu
esfuerzo realizar.
Ya que buscamos equilibrios perfectos en subjuegos, parece natural
preguntarse qu es un subjuego en nuestro juego. Empezando por el nal
de la representacin en forma estratgica del juego vemos que los primeros
subjuegos aparecen en los nodos en los que el agente ha aceptado el contrato
y debe decidir qu accin tomar. En este caso, la perfeccin en subjuegos
exige que el agente elija la accin c

que maximice su utilidad esperada.


c

arg max
t2fJ,1g
n

I=1
j
It
[n(n
I
) q(c)]
(Restriccion de Compatibilidad de Incentivos)
Los siguientes subjuegos empiezan en cada nodo en el que el agente
tiene que decidir si acepta o rechaza el contrato ofrecido. Por tanto, la
perfeccin en subjuegos exige que el agente elija aceptar el contrato si la
utilidad asociada a la mejor accin es al menos igual a la utilidad asociada
4
Ms tarde ser ms explcito a este respecto, un poco de paciencia...
6.1 Modelo bsico 135
al rechazo del contrato:
5
Acepta si

n
I=1
j
It
[n(n
I
) q(c

)] _ n
Rechaza en caso contrario
(Restriccion de Participacion)
En este punto se acaban las decisiones del agente. El ltimo subjuego
es el juego mismo, en donde el principal elige el contrato que maximice su
utilidad teniendo en cuenta la estrategia pura del agente:
'ar
fu
i
g
n

I=1
j
It
[
I
n
I
] cumpliendo
Restriccin de Compatibilidad de Incentivos)
(Restriccin de Participacin
Ya podeis tener una idea un poco clara del problema fundamental del
principal. Su utilidad depende en primer lugar de que el agente acepte
el contrato (en caso contrario no gana un duro, por lo que estar muy
interesado en que el agente diga que s) y en segundo lugar del esfuerzo
del agente, porque afecta al estado del mundo elegido por la naturaleza y
por ende al ingreso obtenido por la empresa. Por tanto, el principal tendr
un esfuerzo favorito en el sentido de que es el esfuerzo que hace que sus
ingresos esperados sean los mayores, pero, puede controlar el principal el
esfuerzo realizado por el agente? Cuando supongamos que no es observable,
el principal tendr problemas...
PRINCIPAL AGENTE
Acepta
Rechaza
Contrato
NATURE
Esfuerzo
AGENTE
RESTRICCIN DE COMPATIBILIDAD
DE INCENTIVOS
RESTRICCIN DE PARTICIPACIN
THATS
ALL
FOLKS!!
5
En el equilibrio, el agente estar indiferente entre aceptar o rechazar el contrato
propuesto por el agente, y supondremos que el agente acepta el contrato. Si no
resolviramos de esta forma el empate, entonces no existira ningn contrato ptimo...
136 6. Riesgo Moral e Incentivos
Quiero recordar por ltima vez que en este juego hay incertidumbre: los
pagos de los jugadores son aleatorios porque deciden sus acciones antes de
que se realice el estado de la naturaleza, vale?
Y ya por ltimo, quiero responder a la pregunda de por qu exigimos
perfeccin en subjuegos y no nos contentamos solamente con equilibrios
de Nash puros y duros. Principalmente para evitar equilibrios de Nash
que describan situaciones de tirana o maa por parte del agente; es decir,
queremos eliminar equilibrios de Nash que involucren amenazas increbles
del tipo: o me das todos los ingresos de la empresa o no acepto ningn
contrato. Espero que a estas alturas del curso tengas una idea un poco
clara de lo que signica perfeccin en subjuegos...
6.2 El contrato ptimo cuando el esfuerzo es
observable.
Es til empezar por el caso en el que el esfuerzo es observable por el
principal con objeto de ganar intuicin en los resultados de las siguientes
secciones.
Lo primero que vamos a hacer es ver qu tipo de contratos tiene a
su disposicin el principal. Recuerda que el principal ofrece al agente un
contrato que ste puede aceptar o rechazar. Como el esfuerzo es observable
y vericable por el principal, el tipo de contrato disponible es un contrato
muy completito porque puede condicionar el salario del trabajador tanto
a los ingresos obtenidos por la empresa () como al nivel de esfuerzo del
trabajador (c). As, un contrato es una funcin C : c n. Puesto ms
sencillito un contrato es una tabla con el siguiente esquema
C :
_
_
_
_
_
_
_
_
Esfuerzo
Ingresos Bajo Alto

1
w
1J
w
11

2
w
2J
w
21
...

w
J
w
1
_
_
_
_
_
_
_
_
De una forma ms compacta, un contrato es una coleccin de numeros
n
It
. Suponemos adems que hay un mercado competitivo que hace que
el agente pueda conseguir un nivel de utilidad n trabajando en cualquier
otra empresa. Este nivel de utilidad se denomina utilidad de reserva, por lo
que si el principal quiere contratar al agente debe proporcionarle un nivel
de utilidad esperada de al menos n. Si el agente rechaza el contrato, el
principal no consigue un duro y el agente consigue su utilidad de reserva...
El equilibrio perfecto en subjuegos en el caso de observabilidad del
esfuerzo es fcil de imaginar, porque el contrato especica un esfuerzo
6.2 El contrato ptimo cuando el esfuerzo es observable. 137
en concreto y un esquema salarial para ese esfuerzo en funcin de los
ingresos nales de la empresa. Cualquier otro esfuerzo es recompensado,
por ejemplo, con un salario cero o negativo.
6
Por tanto, la estrategia pura
de equilibrio perfecto en subjuegos para el agente es: elijo el contrato si
el esfuerzo explicitado en el contrato me da una utilidad esperada igual o
mayor que la utilidad de reserva. En caso contrario, rechazo el contrato.
Si he aceptado el contrato, entonces realizo el esfuerzo explicitado en el
contrato. Una vez conocida la estrategia de equilibrio para el agente, la
estrategia de equilibrio para el principal es simplemente el contrato que
maximiza su utilidad esperada, es decir, un esquema salarial para cada
nivel de esfuerzo realizado por el agente. Este sera el equilibrio perfecto en
subjuegos. As pues, a partir de ahora, nos centraremos en la estrategia de
equilibrio del principal, es decir, en lo que todo el mundo llama contrato
ptimo.
El contrato ptimo es aquel que maximiza los ingresos esperados del
principal restringido a que el agente acepte el contrato, es decir, la condicin
Restriccion de Participacion
7
, es decir, el contrato [c

, n

()] resuelve el
problema
_
'ar
t2fJ,1g,fu
i
g

n
I=1
[
I
n
I
] j
It
r.a.

n
I=1
n(n
I
) j
It
q(c) _ n
(6.7)
donde la restriccin se denomina restriccin de participacin.
Es conveniente pensar que es un problema de dos etapas. En la primera
de ellas, podemos pensar cul es el mejor esquema salarial que podemos
ofrecer al agente para cada nivel de esfuerzo, y en la segunda, cul es el nivel
de esfuerzo ptimo en el sentido de que maximiza los ingresos del principal.
No olvidis que quin disea el contrato es el principal y trata de hacerlo
para quedarse con la mayor parte del pastel (ingresos de la empresa), donde
por supuesto el pastel es un pastel aleatorio.
1. Primera Etapa: Esquema salarial ptimo para cada nivel de
esfuerzo.
Supongamos que el esfuerzo a implementar es H. El principal tiene
que elegir el esquema salarial n() = n
11
, ..., n
n1
que maximice
sus ingresos esperados, o lo que es lo mismo, el que minimice el salario
a pagar en cada uno de los estados de la naturaleza
8
. Es decir, el
esquema salarial ptimo para c = H resuelve el siguiente problema:
_
'i:
fu
i
g

n
I=1
n
I1
j
I1
r.a.

n
I=1
n(n
I1
) j
I1
q(H) _ n
(6.8)
6
Esto tiene un nombre tcnico: punishment
7
En caso contrario, el principal consigue un resultado cierto igual a cero...
8
Tcnicamente se denomina maximizacin punto a punto.
138 6. Riesgo Moral e Incentivos
La restriccin de participacin siempre se va a cumplir con igualdad
9
por lo que simplemente necesitamos utilizar el mtodo de Lagrange.
Denotando por ` el multiplicador lagrangiano de la restriccin de
participacin, el lagrangiano adopta la forma
/ =
n

I=1
n
I1
j
I1
+`[n +q(H) n(n
I1
) j
I1
]
por lo que la solucin al problema debe satisfacer las siguientes
condiciones de primer orden
0/
0n
I
= j
I1
`n
0
(n
I1
) j
I1
= 0 para i = 1, 2, ..., : (6.9)
o lo que es lo mismo
1
n
0
(n
I1
)
= ` para i = 1, 2, ..., : (6.10)
Como el agente es averso al riesgo, es decir, n
00
(n) < 0, tenemos que
n
0
(n
I1
) = ctc para i = 1, 2, ..., :
de donde
n
I1
= n para todo i = 1, 2, ..., :
As, si el agente es averso al riesgo, la ecuacin 6.10 implica que el
salario ptimo es una constante, es decir, el agente recibe el mismo
salario independientemente del estado de la naturaleza. Este resultado
es simplemente un reparto del riesgo existente en la empresa. Ya que el
propietario es neutral al riesgo, que asuma todo el riesgo asegurando
al agente con un salario jo.
Por lo tanto, el salario ptimo jo para cada nivel de esfuerzo c, n

t
,
es aquel que hace que el agente reciba su nivel de utilidad de reserva:
n(n

t
) = q (c) +n (6.11)
Despejando
n

t
= n
1
[n +q (c)]
Si el agente fuera neutral al riesgo, por ejemplo, n(n) = n, la
condicin 6.10 hace que cualquier esquema salarial sea ptimo siempre
y cuando satisfaga la restriccin de participacin con igualdad. As,
el salario jo anterior ya no sera el nico esquema salarial ptimo.
9
Si no entiendes por qu vienes a verme... Una pista: imagina que existe un contrato
al que llamamos ptimo y que hace que la utilidad esperada del agente fuera mayor que
su nivel de utilidad de reserva. Entonces, podramos encontrar otro contrato en el que
los salarios fueran un peln ms bajos... etc
6.2 El contrato ptimo cuando el esfuerzo es observable. 139
2. Segunda Etapa: Eleccin del nivel de esfuerzo ptimo.
El principal debe elegir el nivel de esfuerzo que maximice los ingresos
esperados de la empresa menos el salario a pagar, es decir,
c

arg max
t2f1,Jg
n

I=1
j
It
(
I
n

t
) (6.12)
c

arg max
t2f1,Jg
_
n

I=1
j
It

I
_

_
n

I=1
j
It
n

t
_
(6.13)
c

arg max
t2f1,Jg
1 ( [ c) n

t
(6.14)
donde
n

t
= n
1
[n +q (c)] (6.15)
El primer trmino de la ecuacin 6.12 representa el ingreso esperado
cuando el nivel de esfuerzo es c, mientras que el segundo trmino
representa el salario a pagar. Si 1 o H es el ptimo va a depender del
incremento proporcional en los ingresos comparado con el incremento
en el salario a pagar por el principal.
6.2.1 A modo de conclusin
En el modelo del principal-agente con esfuerzo observable, el contrato
ptimo especica que el agente tiene que desarrollar el nivel de esfuerzo
c

que maximiza
_
1 ( [ c) n
1
[n +q (c)]
_
y recibe un salario jo n

=
n
1
[n +q (c

)]. Cualquier otro esfuerzo es recompensado con un salario


cero o negativo, por ejemplo. Este es el nico contrato ptimo que existe
si el agente es averso al riesgo, es decir, si n
00
(n) < 0 para todo n.
El equilibrio perfecto es subjuegos es por tanto:
1. El principal ofrece el siguiente contrato: Si haces el esfuerzo c

,
recibes el salario jo n

= n
1
[n +q (c

)]. Si haces cualquier otro


esfuerzo, recibes un salario jo n = 0.
2. El agente acepta un contrato si se cumple la condicin Restriccion de
Participacion y realiza el esfuerzo dado por la condicin Restriccion
de Compatibilidad de Incentivos.
Como podis observar, el agente est indiferente entre aceptar o rechazar
el contrato, puesto que la utilidad esperada de ambas acciones es su utilidad
de reserva. Como ya dijimos anteriormente, esto va a ocurrir en todos
los contratos ptimos que estudiemos en este tema y resolvemos esta
indiferencia diciendo que el agente acepta el contrato. Si no lo hicieramos
as, no existira un equilibrio perfecto en subjuegos...
140 6. Riesgo Moral e Incentivos
6.3 El contrato ptimo cuando el esfuerzo no es
observable.
El contrato ptimo descrito en la seccin anterior cumple dos grandes
objetivos:
1. Especica un nivel de esfuerzo eciente por parte del agente.
2. Asegura completamente al agente frente al riesgo porque indepedien-
temente del estado de la naturaleza, el salario recibido por el agente
es el mismo.
Sin embargo, cuando el esfuerzo no es observable, el tipo de contrato
disponible para el principal ya no puede incluir el nivel de esfuerzo a
realizar por el agente, puesto que ahora, el principal es incapaz de vericar
el esfuerzo del agente
10
. Un contrato tipo en el mundo no observable es
ahora la siguiente coleccin de nmeros con la restriccin contenida en la
ltima columna
C =
_
_
_
_
_
_
_
_
Esfuerzo
Ingresos Bajo Alto r.a.

1
w
1J
w
11
w
1J
=w
11

2
w
2J
w
21
w
2J
=w
21
... ...

w
J
w
1
w
J
=w
1
_
_
_
_
_
_
_
_
Como ves, los contratos disponibles solo pueden contener un esquema
salarial en funcin del benecio observado de la empresa. Esto plantea un
serio problema para el principal, porque ya no puede controlar directamente
el esfuerzo realizado por el agente, es decir, ya no puede decir haz el
esfuerzo tal porque si haces otro no te pago nada Existe alguna forma
de forzar al agente a realizar un determinado nivel de esfuerzo?. La nica
forma es a travs del esquema salarial: tiene que incentivar de alguna forma
al agente para que realice el nivel de esfuerzo "ptimo" y la nica manera
de hacerlo es a travs de los salarios percibidos por el agente. As, los
salarios deben ser tales que la condicin Restriccion de Compatibilidad
de Incentivos seleccione el esfuerzo que el principal quiere. Tenemos que
incluir esta restriccin explcitamente, que se denomina Restriccin de
Compatibilidad de Incentivos.
Lo que tiene que quedar claro es que en el caso de no observabilidad,
el principal no puede obtener un resultado mejor que en el caso
10
Hombre, el principal podra incluir el esfuerzo y, el agente, como sabe que no es
vericable, puede realizar el esfuerzo menor y decir al principal que realiz el esfuerzo
alto pero que el estado de la naturaleza no fue el ms favorable... Lgicamente, como
esto no es vericable, es su palabra contra la del principal... y no hay juez que pueda
decidir quin tiene razn...
6.3 El contrato ptimo cuando el esfuerzo no es observable. 141
de observabilidad. Este es un principio general de los problemas de
optimizacin con restricciones: si aadimos una restriccin adicional, el
ptimo ser como mucho el ptimo sin esa restriccin.
As, es posible que los dos objetivos anteriores sean incompatibles. Es en
este caso cuando la no observabilidad del esfuerzo trae consigo ineciencia.
Para que veamos todo esto con mayor claridad, vamos a considerar en
primer lugar el caso en que el agente es neutral al riesgo y demostraremos
que todava es posible encontrar un equilibrio perfecto en subjuegos tal
que los pagos en equilibrio son los mismos que el equilibrio perfecto en
subjuegos en el caso de observabilidad del esfuerzo. Sin embargo, cuando
consideremos el caso en que el agente es averso al riesgo, nos daremos cuenta
de que ya no vivimos en un mundo ideal y eciente...
Seguro que estis pensando en cul es la estrategia del agente. Por
supuesto que la estrategia pura de equilibrio perfecto en subjuegos para el
agente sigue siendo la misma que en el caso de observabilidad: acepta si te
interesa y haz el esfuerzo que ms te interese en el sentido de que maximiza
tus pagos esperados. A partir de este comportamiento del agente, el
principal tiene que buscarse la vida... Por lo tanto, la estrategia ptima para
el principal ser el esquema salarial en funcin de los ingresos de la empresa
que maximice sus ingresos esperados. Pero ahora tenemos que explicitar
que el equilibrio cumple la condicin Restriccion de Compatibilidad de
Incentivos: esta es la restriccin de compatibilidad de incentivos.
As que a partir de ahora nos centraremos en la estrategia pura de
equilibrio del principal, es decir, buscaremos como en la seccin anterior lo
que se llama el contrato ptimo para el principal.
6.3.1 Agente neutral al riesgo.
Supongamos que n(n) = n. Ya sabemos que si el esfuerzo es observable,
el principal elige a travs del contrato el esfuerzo c

que resuelve
max
ftg
1 ( [ c) q (c) n (6.16)
Los ingresos del empresario vienen dados por esta expresin y el agente
recibe una utilidad esperada igual a n.
Considera ahora el caso en que el esfuerzo es no observable.
Demostraremos que el empresario puede todava conseguir el pago
del ptimo observable, puesto que vamos a disear un contrato que
precisamente consigue ese resultado.
Supongamos que el principal ofrece un esquema salarial del tipo n
I
=

I
c, donde c es una constante. Este esquema salarial se puede interpretar
142 6. Riesgo Moral e Incentivos
como que el principal vende la empresa al agente por un precio c, puesto
que el agente consigue el benecio de la empresa menos el pago c.
Si el agente acepta el contrato elegir el nivel de esfuerzo que maximice su
utilidad esperada (condicin Restriccion de Compatibilidad de Incentivos)
max
ftg
n

I=1
j
It
n(n
I
) q (c)
pero como es neutral al riesgo, n(n) = n, tenemos
max
ftg
n

I=1
j
It
n
I
q (c)
que, como n
I
=
I
c, se reduce a
max
ftg
n

I=1

I
j
It
q (c) c (6.17)
Comparando la ecuacin 6.17 con la ecuacin 6.16 vemos que la solucin c

de la ecuacin 6.16 resuelve la ecuacin 6.17. Eso signica que este contrato
hace que el agente elija el nivel de esfuerzo ptimo con observabilidad.
Ahora bien, el contrato tiene que ser tal que el agente lo acepte (condicin
Restriccion de Participacion). Para ello, le tiene que proporcionar al agente
una utilidad esperada igual a su nivel de utilidad de reserva n , es decir,
n

I=1

I
j
It
c q (c

) = n (6.18)
Sea c

el precio de venta resultante de la ecuacin 6.18. Eso quiere decir


que el pago para el principal es c

que es, precisamente, despejando c en


la ecuacin 6.18
c

=
n

I=1

I
j
It
q (c

) n
Con este contrato, tanto el principal como el agente obtienen los mismo
pagos esperados que con el contrato ptimo con observabilidad del esfuerzo.
El equilibrio perfecto en subjuegos es por tanto:
1. El Principal ofrece el contrato: Te pago el salario c

2. El Agente acepta un contrato si se cumple la condicin Restriccion de


Participacion y realiza el esfuerzo dado por la condicin Restriccion
de Compatibilidad de Incentivos.
6.3 El contrato ptimo cuando el esfuerzo no es observable. 143
Como podis observar, de nuevo el agente est indiferente entre aceptar
o rechazar el contrato, puesto que la utilidad esperada de ambas acciones es
su utilidad de reserva y resolvemos esta indiferencia diciendo que el agente
acepta el contrato.
La intuicin es tan extraa como sencilla: Si el agente es neutral al riesgo,
le vendemos la empresa. Con esto, el agente har lo mejor para la empresa
porque es suya. As el objetivo del agente, la maximizacin de la utilidad
esperada, que bajo neutralidad al riesgo se reduce a la maximizacin de los
ingresos esperados de la empresa, es el mismo que era el del principal en el
caso de observabilidad. Tcnicamente, convertimos al agente en el residual
claimant.
Hemos demostrado que este es el mejor contrato posible, porque sabemos
que lo mejor que se puede conseguir es el resultado del ptimo con
observabilidad y esto es precisamente lo que se obtiene con este contrato
de venta de la empresa.
Pero ojo, esto funciona slo en el caso de que el agente sea neutral al
riesgo. Si no fuera neutral al riesgo, su objetivo ya no sera la maximizacin
de los ingresos esperados y ya no podemos estar seguros de que la venta de
la empresa sea el mejor contrato que se puede disear...
6.3.2 Agente averso al riesgo
Cuando el agente es averso al riesgo, las cosas se ponen un poco
ms complicadas. Para caracterizar el contrato ptimo, vamos de
nuevo a considerarlo como un problema en dos etapas: en la primera,
caracterizaremos el esquema salarial ptimo para cada nivel de esfuerzo
requerido y en la segunda, elegiremos el nivel de esfuerzo ptimo.
1. Primera Etapa: Esquema salarial ptimo para un nivel de esfuerzo
dado.
Los incentivos apropiados para implementar el nivel de esfuerzo
c deben ser tales que minimicen el salario pagado al agente.
Sin embargo, dado que el esfuerzo es no observable, tenemos dos
restricciones que afectan a este problema de optimizacin: por un
lado, el agente tiene que aceptar el contrato (esta es la misma
restriccin que antes, la restriccin de participacin), pero, por otro
lado, el principal se enfrenta a un problema adicional: el agente tiene
que desear realizar el esfuerzo c que el principal encuentra ptimo.
144 6. Riesgo Moral e Incentivos
Formalmente, el esquema salarial o de incentivos apropiado debe
resolver
min
fu
i
g

n
I=1
n
I
j
It
restringido a:
(i)

n
I=1
n(n
I
) j
It
q(c) _ n
(ii) c resuelve :ar
t

n
I=1
n(n
I
) j
It
q(c)
(6.19)
La segunda restriccin se denomina Restriccin de Compatibilidad de
Incentivos: simplemente dice que la utilidad esperada del agente es
mayor si realiza el esfuerzo que el principal quiere implementar; es
decir, asegura que el agente realmente quiera elegir el esfuerzo c que
el principal desea implementar.
Pero, cmo se implementan estos niveles de esfuerzo?.
Consideremos el caso en que el principal quiere que el agente elija el
esfuerzo c = 1. La restriccin de Compatibilidad de Incentivos sera
entonces
n

I=1
n(n
I
) j
IJ
q(1)
n

I=1
n(n
I
) j
I1
q(H) (6.20)
El problema queda entonces con la siguiente funcin objetivo:
/ =

n
I=1
n
I
j
IJ
+
+`[n

n
I=1
n(n
I
) j
IJ
+q(1)] +
+j[

n
I=1
n(n
I
) j
I1
q(H)

n
I=1
n(n
I
) j
IJ
+q(1)]
donde ` y j son los multiplicadores de Lagrange de este problema de
optimizacin. La condicin de primer orden de Kuhn-Tucker es
0/
0n
I
= j
IJ
`n
0
(n
I
) j
IJ
jn
0
(n
I
) [j
IJ
j
I1
] = 0 para todo i = 1, 2, ..., :
o, agrupando trminos,
1
n
0
(n
I
)
= ` +j
_
1
j
I1
j
IJ
_
para todo i = 1, 2, ..., : (6.21)
Suponiendo que la restriccin de participacin es activa en el
equilibrio, es decir, ` es distinto de cero, nos queda por considerar la
restriccin de compatibilidad de incentivos.
Supongamos que no est activa en el ptimo, es decir, que es
irrelevante, que no hay problema de incentivos,.... Esto implica que
j es cero. As, la condicin de primer orden sera
1
n
0
(n
I
)
= ` para todo i = 1, 2, ..., :
6.3 El contrato ptimo cuando el esfuerzo no es observable. 145
o bien
n
0
(n
I
) =
1
`
= ctc para todo i = 1, 2, ..., :
es decir, el salario del agente es constante e independiente del estado
de la naturaleza. Sea el esquema salarial n
I
= n. Sustituyndolo en
la restriccin de compatibilidad de incentivos tenemos
n(n)
n

I=1
j
IJ
q(1) n(n)
n

I=1
j
I1
q(H)
y como las distribuciones de probabilidad suman 1, la expresin
anterior implica
q(1) < q(H)
Por lo tanto, este caso solo puede ocurrir cuando el nivel de esfuerzo
preferido por el principal es aquel que conlleva el menor coste para
el agente. As, no hay ningn conicto de intereses entre el agente
y el principal. La intuicin es sencilla: si el esfuerzo a implementar
es el menor (1), la no observabilidad del esfuerzo no provoca ningn
problema. El principal ofrece un salario jo que cumpla la restriccin
de participacin y el agente, dado que el salario no depende de los
ingresos de la empresa hace el esfuerzo que le causa el menor coste,
a saber, 1.
Pero no siempre vamos a vivir en este mundo ideal. Si el esfuerzo a
implementar no es el de menor coste, sino H, entonces el salario no
puede ser jo, porque si no, el agente realizara el esfuerzo menor,
sino que tiene que variar con el estado de la naturaleza, es decir, con
los ingresos de la empresa. Pero, de qu forma ha de variar?. Eso lo
descubriremos ahora mismo, aunque estad preparados para llevaros
ms de una sorpresa...
El problema a resolver es por tanto
min
fu
i
g

n
I=1
n
I
j
I1
restringido a:
(i)

n
I=1
n(n
I
) j
I1
q(H) _ n
(ii)

n
I=1
n(n
I
) j
I1
q(H)

n
I=1
n(n
I
) j
IJ
q(1)
(6.22)
con el siguiente lagrangiano asociado
/ =

n
I=1
n
I
j
I1
+
+`[n

n
I=1
n(n
I
) j
I1
+q(H)] +
+j[

n
I=1
n(n
I
) j
IJ
q(1)

n
I=1
n(n
I
) j
I1
+q(H)]
y la condicin de primer orden sera
1
n
0
(n
I
)
= ` +j
_
1
j
IJ
j
I1
_
(6.23)
146 6. Riesgo Moral e Incentivos
donde j y ` son distintos de cero.
Podemos utilizar la ecuacin 6.23 para conocer algunas propiedades
del esquema salarial ptimo cuando las dos restricciones son activas
en el ptimo. Considera el salario jo n tal que
1
u
0
( b u)
= `.
La ecuacin 6.23 nos dice que
j
IJ
j
I1
< 1 =n
I
n
y
j
IJ
j
I1
1 =n
I
< n
Demostracin:
(a) Para el estado de la naturaleza i sabemos que el salario n
I
satisface la condicin
1
n
0
(n
I
)
= ` +j
_
1
j
IJ
j
I1
_
Pero como
1
u
0
[ b u]
= `, esta condicin la podemos escribir
1
n
0
(n
I
)
=
1
n
0
( n)
+j
_
1
j
IJ
j
I1
_
Supongamos que

iL

iH
< 1. Entonces, tenemos que
1
n
0
(n
I
)

1
n
0
( n)
Pero como sabemos que la funcin n es tal que n
0
() 0, tenemos
que
n
0
(n
I
) < n
0
( n)
Adems, como n
00
() < 0, tenemos
n
I
n
La demostracin para el caso en que

iL

iH
< 1. es anloga y por
tanto es omitida.
c.q.d.
6.3 El contrato ptimo cuando el esfuerzo no es observable. 147
Esta relacin es bastante intuitiva. El salario ptimo es mayor que
n (son ms altos) para aquellos niveles de ingresos que son ms
probables que ocurran cuando el agente realiza H en vez de 1, en
el sentido de tener un ratio de verosimilitud

iL

iH
menor que 1, y
son ms bajos para niveles de ingresos que son ms probables que
ocurran cuando el agente realiza el esfuerzo menor. As, estamos
proporcionando al agente unos incentivos geniales: cuanto mayor sea
el benecio de la empresa, mayor es el salario del agente. Pero para
que los ingresos sean altos con mayor probabilidad, el agente tiene que
elegir el nivel de esfuerzo alto, que es precisamente el que nosotros
queremos.
Si

iL

iH
es decreciente en
I
entonces el esquema salarial ptimo es
creciente en ingresos . Es decir, mayores ingresos implican mayores
salarios para el agente. Esto tiene un nombre tcnico: the monotone
likelihood ratio property
11
.
Se puede demostrar que dada la variabilidad del salario en el caso
de no observabilidad del esfuerzo, el salario esperado para el agente
es mayor que el salario ptimo con observabilidad, es decir, el
coste salarial para implementar el esfuerzo alto es mayor bajo no
observabilidad.
2. Segunda Etapa: Eleccin ptima del nivel de esfuerzo.
Este segundo paso es como en el caso de observabilidad del esfuerzo.
El principal debe comparar el incremento en los ingresos con la
diferencia en el salario esperado a pagar al agente para elegir el nivel
de esfuerzo ptimo. No hay nada nuevo que comentar...
A modo de conclusin.
Si el contrato ptimo bajo no observabilidad conlleva implementar el
esfuerzo menor, entonces el principal debe elegir un salario jo igual al
ptimo con observabilidad, mientras que cuando el contrato ptimo bajo
no observabilidad implica implementar el nivel de esfuerzo alto, el salario no
es jo sino variable en funcin de los ingresos de tal forma que en trminos
esperados, el salario a pagar al agente es mayor que el salario en el caso de
observabilidad. As pues, en este modelo, la no observabilidad del esfuerzo
a realizar por el agente implica mayores costes para el principal a la hora de
implementar el esfuerzo alto y los mismos costes si se trata de implementar
11
La traduccin es algo as como la propiedad del ratio de verosimilitud montono.
Pero ojo, si no se cumple esta propiedad, entonces puede darse el caso de que mayores
benecios impliquen menores salarios para el agente... algo que en principio parece poco
intuitivo.
148 6. Riesgo Moral e Incentivos
el esfuerzo bajo. Es decir, bajo no observabilidad del esfuerzo se produce
una prdida de bienestar para el propietario de la empresa.
Remark 18 La no observabilidad introduce ineciencia (perjudica) en
el sistema econmico, en particular para el dueo de la empresa, siempre
que el agente sea averso al riesgo y el ptimo sea implementar el nivel
de esfuerzo alto. En otros casos, implementacin del esfuerzo bajo o
neutralidad del agente, la no observabilidad es inocua.
6.4 Principal-agente con n=2
El problema del principal-agente cuando no hay observabilidad del esfuerzo
es un problema de optimizacin en el que la funcin objetivo es lineal pero
las restricciones son no lineales. Sin embargo, no es difcil encontrar un
programa de optimizacin equivalente en el que la funcin objetivo sea no
lineal y las restricciones sean lineales, de forma que nos permita realizar un
anlisis grco casi trivial...
Imaginemos que el principal quiere implementar el nivel de esfuerzo H.
As, el problema de maximizacin del principal es el siguiente:
max
fu
i
g

n
I=1
[
I
n
I
] j
I1
restringido a:
(1C)

n
I=1
n(n
I
) j
I1
q(H) _ n
(1C)

n
I=1
n(n
I
) j
I1
q(H)

n
I=1
n(n
I
) j
IJ
q(1)
Sea n
I
la utilidad que consigue el agente si ocurre el benecio
I
, es decir,
n(n
I
) = n
I
. Sea )() = n
1
(), es decir, la inversa de la funcin de utilidad
del agente y escribamos n
I
= ) (n
I
). La funcin ) lo nico que indica es el
coste para el principal (el salario a pagar al agente) si quiere proporcionar
un nivel de utilidad n
I
.
As, podemos reescribir el problema de maximizacin original de la
siguiente forma
max
fu
i
g

n
I=1
[
I
) (n
I
)] j
I1
restringido a:
(1C)

n
I=1
n
I
j
I1
q(H) _ n
(1C)

n
I=1
n
I
j
I1
q(H)

n
I=1
n
I
j
IJ
q(1)
(6.24)
La variable de eleccin es ahora una distribucin de utilidades para el
agente, en donde el coste para el principal de proporcionar el nivel de
utilidad n
I
es simplemente ) (n
I
) = n
I
.
Este problema puede ser analizado grcamente cuando : = 2. As pues,
estudiemos el caso en el que hay dos niveles posibles de ingresos ,
1
y
2
,
donde
1
<
2
, por lo que el principal solo necesita establecer dos niveles de
6.4 Principal-agente con n=2 149
utilidad, a saber, n
1
y n
2
, la utilidad recibida por el agente si el estado de la
naturaleza es 1 y 2, respectivamente. Adems, suponemos que j
21
j
2J
.
El siguiente paso es representar grcamente las restricciones de
participacin y compatibilidad de incentivos. Para ello, es necesario
considerar las curvas de indiferencia del agente. Vayamos por partes.
Dados los niveles de utilidad n
1
y n
2
establecidos por el principal en
el contrato, el agente puede calcular la utilidad esperada asociada a la
realizacin del esfuerzo H y el nivel de utilidad esperada asociado a la
realizacin del esfuerzo 1.
As, podemos calcular los pares (n
1
, n
2
) que proporcionan al agente la
misma utilidad esperada si realiza el esfuerzo H. Esta ser su curva de
indiferencia para el esfuerzo H y adopta la forma
j
11
n
1
+j
21
n
2
q(H) = l
1
Anlogamente, podemos calcular los pares (n
1
, n
2
) que proporcionan al
agente la misma utilidad esperada si realiza el esfuerzo 1. Esta ser su
curva de indiferencia para el esfuerzo 1 y adopta la forma
j
1J
n
1
+j
2J
n
2
q(1) = l
J
Tratemos en primer lugar de representar grcamente la restriccin de
compatibilidad de incentivos (IC).
Considera el par (n
1
, n
2
) tal que el agente es indiferente entre elegir el
nivel de esfuerzo H o el nivel de esfuerzo 1, es decir l
J
= l
1
. Estos son
pares en el espacio n
1
n
2
en los que se cruzan la curva de indiferencia
para el esfuerzo H y la curva de indiferencia para el esfuerzo 1 asociadas al
mismo nivel de utilidad. El locus de todos estos pares de utilidades viene
dado por la ecuacin
j
11
n
1
+j
21
n
2
q(H) = j
1J
n
1
+j
2J
n
2
q(1)
manipulando esta expresin obtenemos
l
1
l
J
= n
1
(j
11
j
1J
) +n
2
(j
21
j
2J
) q(H) +q(1) = 0 (6.25)
Resolviendo para n
2
tenemos la siguiente expresin
n
2
=
(j
11
j
1J
)
j
21
j
2J
n
1
+
q(H) q(1)
j
21
j
2J
(6.26)
Como j
21
j
2J
, tiene que ser el caso de que j
1J
j
11
, puesto que las
probabilidades tienen que sumar 1. Esto implica que el coeciente de n
1
en la ecuacin 6.26 es positivo y, por lo tanto, la lnea determinada por la
ecuacin 6.26 tiene pendiente positiva. ?Cunto vale la pendiente de esta
150 6. Riesgo Moral e Incentivos
curva? No es difcil demostrar que la pendiente es uno: el denominador es
1 = j
21
j
2J
. Sumando y restando j
211
tenemos
1 = j
21
j
2J
+j
11
j
11
pero como j
11
+j
21
= 1, obtenemos
1 = 1 j
2J
j
11
pero recordando que j
1J
+j
2J
= 1, obtenemos
1 = j
1J
j
11
que es precisamente el numerador.
?Cul es la interpretacin de esta curva? Nos dice aquellos contratos
en los que el agente est indiferente entre llevar a cabo el esfuerzo H o el
esfuerzo 1. As, puntos situados fuera de esta curva nos dicen que el agente
tiene un nico nivel de esfuerzo preferido (el nico que maximiza su utilidad
esperada). ?Qu regin del espacio n
1
n
2
est asociada a contratos en los
que el agente preere el esfuerzo H?. La respuesta es aquella regin situada
por encima de la curva 6.26. ?Por qu?.
No es difcil responder a esta pregunta. Cuando los pares (n
1
, n
2
) cumplen
la ecuacin 6.26, el agente est indiferente entre las acciones H y 1, es decir,
l
1
l
J
= 0 . Fijemos el valor de n
1
e incrementemos el valor de n
2
hasta
n
2
= n
2
+c, donde c 0. As, estamos en la regin por encima de la curva.
?Qu esfuerzo es el preferido por el agente?. Observando la ecuacin 6.25
tenemos que l
1
l
J
= 0 +c (j
21
j
2J
) 0 porque j
21
j
2J
.
Hemos llegado a la conclusin de que si queremos implementar el nivel de
esfuerzo H, como es nuestro propsito, el esquema de utilidades, es decir,
el contrato ofrecido al agente, debe estar en la regin situada por encima
de la curva 6.26.
Estudiemos ahora la restriccin de participacin (PC). Esta requiere
que la utilidad esperada asociada el esfuerzo H sea, como mnimo, su nivel
de utilidad de reserva; analticamente
j
11
n
1
+j
21
n
2
q(H) _ n
El conjunto de contratos (n
1
, n
2
) donde esta condicin se satisface con
igualdad es simplemente la curva de indiferencia para el esfuerzo H del
agente asociada a l
1
= n.
La interseccin de la regin de compatibilidad de incentivos con la
curva de indiferencia de la restriccin de participacin nos da los contratos
(n
1
, n
2
) que satisfacen las dos restricciones.
Tambin hemos dibujado la lnea de 45 grados. Esta lnea es importante
porque nos dice aquellos pares (n
1
, n
2
) donde n
1
= n
2
. Es decir, el agente
6.4 Principal-agente con n=2 151
recibe el mismo salario independientemente del estado de la naturaleza:
el agente est asegurado completamente. Segn hemos estudiado en las
secciones anteriores, la solucin al problema del principal estara en esta
lnea si no existiera ningn problema de compatibilidad de incentivos y, por
tanto, la nica restriccin a satisfacer fuera la de participacin n
1
= n
2
= n.
Pero ojo, debido a la presencia de la restriccin de compatibilidad de
incentivos, el punto de seguro completo puede no ser siempre el ptimo.
La solucin al problema del principal depender de cual es la desutilidad
asociada a cada nivel de esfuerzo.
Para encontrar la solucin al problema del principal, solo nos queda por
dibujar las curvas de indiferencia del principal, es decir, sus curvas iso-
benecio-esperado. Estas adoptan la forma siguiente
j
11
[
1
) (n
1
)] +j
21
[
2
) (n
2
)] = ctc
Los ingresos -esperados del principal se incrementan cuando los salarios a
pagar, ) (n
I
) , son menores. Obvio. Qu sabemos acerca de su pendiente?.
La pendiente de las curvas iso-benecio-esperado viene dada por
' =
j
11
)
0
(n
1
)
j
21
)
0
(n
2
)
Cuando n
1
= n
2
, es decir, en la diagonal principal, tenemos que ' =

1H

2H
. Pero dado que las curvas de indiferencia del agente para el nivel de
esfuerzo H responden a la ecuacin j
11
n
1
+ j
21
n
2
= ctc, su pendiente
cuando n
1
= n
2
viene dada por

1H

2H
. Por lo tanto, las curvas de
indiferencia del agente para el esfuerzo H y las curvas iso-benecio-esperado
del principal deben ser tangentes a lo largo de la curva de 45 grados.
Ya tenemos todos los elementos necesarios para encontrar la solucin
grca al problema del principal:
1. Si el esfuerzo H es el ms costoso para el agente, q(H) q(1),
entonces la regin de compatibilidad de incentivos est situada por
encima de la diagonal principal por lo que la lnea de seguro completo
no es asequible. En este caso, la restriccin de compatibilidad de
incentivos est activa, es decir, es relevante, y la solucin ptima
implicar n
1
,= n
2
, por lo que el agente tendr que soportar algun
riesgo.
2. Pero si el esfuerzo H es el menos costoso para el agente, q(H) <
q(1), entonces la regin de compatibilidad de incentivos est situada
por debajo de la diagonal principal, por lo que la lnea de seguro
completo es asequible. En este caso, la restriccin de compatibilidad
de incentivos no es relevante, y la solucin ptima implicar n
1
= n
2
,
por lo que el agente estar completamente asegurado.
Parte III
El Diseo de Mecanismos
152
This is page 153
Printer: Opaque this
7
Economa del Bienestar
7.1 Lmites del Conocimiento y de la Accin
Llevis toda la carrera (ms de 4 aos) describiendo el comportamiento
de los agentes econmicos mediante problemas de maximizacin con
restricciones. (El paradigma PrincipalAgente es un clarsimo ejemplo).
El valor de los multiplicadores de Lagrange nos informa a cerca de cunto
nos restringen las restricciones asociadas.
Restriccin presupuestaria (DINERO)
Restriccin tecnolgica (CIENCIA)
Restriccin cognitiva (Ausente en la carrera pero muy presente
en la investigacin actual en Economa)
Vuestra visin puede estar por lo tanto de hecho lo est- sesgada
hacia una idea muy decimonnica de que todo lo deseable sera nalmente
realizable, de que todo ptimo es posible, sin ms que ir poco a
poco levantando las restricciones. Este sentimiento queda resumido
magncamente en las siguientes palabras de Laplace: "El presente es efecto
del pasado y causa del futuro".
Claim 2 El demonio de Laplace. Podemos mirar el estado presente del
universo como el efecto del pasado y la causa de su futuro. Se podra
condensar un intelecto que en cualquier momento dado sabra todas las
fuerzas que animan la naturaleza y las posiciones de los seres que la
componen, si este intelecto fuera lo sucientemente vasto para someter los
154 7. Economa del Bienestar
datos al anlisis, podra condensar en una simple frmula de movimiento de
los grandes cuerpos del universo y del tomo ms ligero; para tal intelecto
nada podra ser incierto y el futuro as como el pasado estaran frente sus
ojos
Hoy, a principios del siglo XXI, tenemos una visin ms pesimista (?).
Hoy sabemos que hay lmites insuperables a lo que podemos hacer o saber.
Esos lmites estn presentes en casi todas las ramas del conocimiento (y
por lo tanto, tambin en Economa)
Los lmites a nuestro conocimiento o accin toman la forma de Teoremas
de Imposibilidad. Estos Teoremas no nos dicen cmo son las cosas, sino
cmo no pueden ser.
Fsica:
Leyes de la Termodinmica:
+ (i) La energa se conserva
+ (ii) la energa se degrada
+ (iii) el cero absoluto es inalcanzable
La velocidad de la luz en el vaco (c) es insuperable (limite al
movimiento, y por ende, a la transmisin de informacin)
Principio de Indeterminacin de Heisenberg (lmite a
la determinacin conjunta de la velocidad y posicin de una
partcula)
Matemticas:
Teorema de Incompletitud de Gdel: Una teora aritmtica
no puede ser al mismo tiempo consistente, axiomatizable y
completa.
Economa:
Teorema de Imposibilidad de Arrow (The impossibility of a
social ordering): Una agregacin de las preferencias individuales
no puede ser al mismo tiempo racional, paretiana, independiente
de alternativas irrelevantes y no dictatorial.
En la siguiente seccin veremos cmo se demuestra este famoso teorema.
7.2 El Teorema de Imposibilidad de Arrow. La demostracin de John Geanakoplos 155
7.2 El Teorema de Imposibilidad de Arrow. La
demostracin de John Geanakoplos
Qu signica la frase "EEUU quiere deshacerse de Sadam Hussein"? Qu
signica la frase "Espaa quiere entrar en el G8"? Pues que Espaa tiene
una relacin de preferencias tal que entrar en el G8 se preere a estar fuera
del G8.
La pregunta que surge es cmo se construye dicha relacin de preferencias
social a partir de la relacin de preferencias individuales de todos los
espaoles. Kenneth Arrow en 1951 consider una serie de principios
normativos bsicos que pensaba deba tener cualquier mtodo de agregacin
de preferencias individuales racionales en una preferencia social racional:
Universalidad: Que funcione para cualquier posible perl de
preferencias individuales.
Pareto Eciente: Si todos los individuos preeren x a y, entonces
la preferencia social tambin (unanimidad).
No dictatorial: La preferencia social no se corresponde con la
preferencia de ningn individuo.
Independencia de alternativas irrelevantes: La preferencia
social sobre x e y slo depende de las preferencias individuales sobre
x e y.
Kenneth Arrow demostr que estas cuatro propiedades juntas implican
la intransitividad de la relacin de preferencias social. O lo que es lo mismo,
transitividad ms tres de stas contradice la cuarta.
(OJO: EN EL CASO DE SLO DOS OPCIONES, LA REGLA DE LA
MAYORA FUNCIONA)
Teorema 4 Cualquier sistema de agregacin social que respete la
transitividad, la independencia de alternativas irrelevantes y la unanimidad
es una dictadura.
La demostracin original de Arrow es un engorro. Hay demostraciones
posteriores, algunas debidas a espaoles insignes fundamentalmente
Salvador Barber, que son un peln ms cortas. Pero yo os mostrar aqu
una demostracin "preciosa"
1
de John Geanakoplos de su artculo Three
brief proofs of Arrows Impossibility Theorem (1998).
Demostracin. Vamos a demostrar que para cualquier par de
alternativas a y c, un ranking social que cumpla T, IAI y U es D,
1
Preciosa en el sentido de que es corta y elegante. Es, como dira Paul Erdos, digna
del libro de Dios.
156 7. Economa del Bienestar
es decir el ranking social coincide con el ranking de una persona, que
naturalmente debe ser llamado dictador. La clave es usar mucho el principio
de Independencia de Alternativas Irrelevantes (IAI). Por este principio, el
ranking social entre a y c no depende de dnde anden las dems alternativas
a nivel individual. En toda la demostracin vamos a trabajar con una
alternativa b cualquiera diferente de a y c, y vamos a ir subindola y
bajndola a nivel individual pero sin tocar el ranking individual ac para
los individuos, por lo que estos cambios de subir y bajar la alternativa b
no afectarn a la comparacin social ac.
Paso 1. Concentrmonos en perles en los que todos los miembros
de la sociedad consideran que la alternativa b es o la mejor o la peor.
Entonces el ranking social pone la alternativa b o la primera o la ltima.
La demostracin es trivial. Supongamos que no sea cierto, sino que en el
ranking social existen las alternativas Q y R tales que Q _
S
/ _
S
1. Fjate
en que por IAI, el ranking social Qb slo depende del orden individual Qb,
as que podemos sentirnos libres de cambiar a nivel individual la posicin
de la alternativa R sin afectar para nada al ranking social de Qb. Pues
bien, hagamos que cada individuo suba la alternativa R por encima de
la Q sin cambiar las posiciones relativas de Qb y bR -se puede hacer
porque para cada individuo b est situado en un extremo-. Ahora bien,
por unanimidad el ranking social debe preferir R a Q porque todos los
individuos lo preeren. Pero eso entra en contradiccin con la transitividd
del orden social que implica que Q es preferida a R.
Paso 2. Centrmonos en el perl de preferencias en el que todos los
miembros de la sociedad consideran que la alternativa b es la peor. Eso no
afecta a la comparacin social ac (recuerda que ese es nuestro objetivo) pero
situa a b en el fondo del ranking social por unanimidad. Concentrmonos
ahora en el perl en el que todos los miembros de la sociedad consideran que
la alternativa b es la mejor. Eso no afecta a la comparacin social ac (sigue
siendo nuestro objetivo) pero situa a b en los ms alto del ranking social.
Ahora vamos a ir considerando mundos en los que individuo a individuo y
de forma secuencial, la alternativa b pasa de ser la peor a la mejor. Llegar
un individuo para el que el ranking social cambie de situar a b la ltima
a situarla la primera (por unanimidad sabemos que existe ese individuo
Llmalo :

y recuerda que es especial...


Paso 3. Pensemos ahora en un perl del individuo :

tal que a _
n
c
y demostremos que el ranking social coincide con el ranking del individuo
:

. Para ello, subamos y bajemos las alternativas ac sin cambiar su orden


relativo en el individuo :

de tal forma que la alternativa especial b quede


en medio, es decir, a _
n
/ _
n
c y pensemos en el ranking social ac.
Por IAI, el ranking social ac no depende de dnde ande la alternativa b
a nivel individual as que vamos a centrarnos en el perl de preferencias
individuales en el que todos los individuos a la izquierda de :

pongan
7.3 Despus de Arrow hay vida: Funciones de Bienestar Social y Funciones de Eleccin Social 157
a b en los ms alto y todos los individuos a la derecha de :

pongan la
alternativa b abajo del todo. La siguiente tabla ilustra esta situacin:
Ranking Individuales Ranking
1 2 ... N

... N-1 N Social


b b ... ... ... ... ...
a a
b
c c
... ... ... ... ... b b
Piensa ahora en el ranking social de las alternativas ab. Slo depende de
las posiciones relativas ab a nivel individual... as pues debe ser igual que
el ranking social en el perl en el que el individuo especial :

pone b en el
fondo. Pero claro, en ese mundo b es la peor alternativa social. Por tanto
debe ser a _
n
/.
Piensa ahora en el ranking social de las alternativas bc. Slo depende de
las posiciones relativas bc a nivel individual... as pues debe ser igual que
el ranking social en el perl en el que el individuo especial :

pone b en
lo ms alto. Pero claro, en ese mundo b es la mejor alternativa social. Por
tanto debe ser / _
n
c.
Pero claro, por transitividad del orden social debemos tener a _
n
c.
Fjate en que el ranking social replica elmente el ranking individual del
individuo :

para cualquier par de alternativas ac. Este individuo especial


es efectivamente un dictador. cqd
2
7.3 Despus de Arrow hay vida: Funciones de
Bienestar Social y Funciones de Eleccin Social
El Teorema de Imposibilidad de Arrow nos dice que no existe ninguna
Funcin de Bienestar Social que satisfaga simultneamente estos cuatro
principios normativos. La literatura ha seguido dos caminos bien distintos.
1. El primero es seguir pensando en trminos de Funciones de
Bienestar Social y ver qu funciones no cumplen con qu principio
normativo, o si cabe proponer principios alternativos:
La Regla de Borda: Incumple el axioma de Independencia de
Alternativas Irrelevantes.
2
Faltara mostrar que el ranking social tambin coincide con el individual cuando
una de las alternativas involucradas es la alternativa mgica b. Esto te lo dejo a ti como
ejercicio.
158 7. Economa del Bienestar
La Regla de la Mayora: Incumple el axioma de universalidad
(single-peaked preferences).
2. Pensar en un concepto alternativo: Funciones de Eleccin Social:
Si yo quiero la funcin de bienestar social para tomar una decisin,
entonces con saber qu alternativa queda en primer lugar es suciente;
es decir, no me interesa tanto qu alternativa queda en tercer o cuarto
lugar y luego ojo, requerir que sea transitiva. En este caso hablamos
de una funcin de eleccin social. (REGLAS DE VOTACIN SON
LAS MS TPICAS)
Pero ojo, las preferencias no se llevan escritas en la frente y sabemos
de la segunda parte de este curso que es posible que esto cause ciertos
problemas estratgicos. La versin ms ingenua pasa por preguntrselas
directamente a los invididuos para luego enchufarlas en la regla de eleccin
social, pero... necesitamos primero ver qu reglas de eleccin social inducen
a los individuos a relevar honestamente sus preferencias. En los aos 70
se demuestra un resultado negativo que tiene un gran paralelismo con el
Teorema de Imposibilidad de Arrow. De hecho, Philip Reny proporciona la
demostracin en paralelo de los dos resultados.
7.4 El Teorema de Gibbard-Satterhwaite
En los 70 se demuestra un resultado negativo acerca de las reglas de
eleccin social (tiene un tullo al Arrows Impossibility Theorem que
queda evidenciado en el artculo de Philip Reny "Arrows Theorem and
the Gibbard-Satterhwaite Theorem: A Unied Approach", publicado en
Economics Letters a principios del siglo XXI). El Teorema es el siguiente:
Teorema 5 La nica regla de eleccin social eciente no manipulable es
la dictatorial.
Os voy a presentar una especie de demostracin informal que utiliza
la eciencia de Pareto. Considera dos jugadores , 1 y tres opciones
a, /, c y con los siguientes tipos (perles de preferencias)
A B
a b
b a
c c
Fjate en que ambos estn de acuerdo en que la c es la peor pero no se
ponen de acuerdo en cul de las otras dos es la mejor. Supongamos que la
7.4 El Teorema de Gibbard-Satterhwaite 159
regla de eleccin social elige la opcin a (la mejor del jugador A).
f
_
_
_
_
A B
a b
b a
c c
_
_
_
_
=A
Ahora vamos a dejar jas las preferencias del jugador A y pensemos en
las estrategias del jugador B en el juego de declaraciones de los tipos. La
idea es computar la funcin de mejor respuesta del jugador B tratando de
evitar que el jugador B nos mienta . . .
El jugador B tiene 6 posibles tipos (hay 3! permutaciones posibles de 3
elementos).
Social
outcome
a b a c b c c
a,b,c a,c a,b a a a
b a c a c b b
c c b b a a a
B6 B5 B4 B3 B2 B1 A
Social
outcome
a b a c b c c
a,b,c a,c a,b a a a
b a c a c b b
c c b b a a a
B6 B5 B4 B3 B2 B1 A
Para que ningn tipo B quiera mentir es necesario que:
En el mundo B4 el resultado social sea a (Si el resultado fuese b
entonces el tipo 3 querra decir que es tipo 4).
En el mundo B5 el resultado social sea a (Si el resultado fuese c,
entonces el tipo 4 querra decir que es tipo 5).
En el mundo B6 el resultado social sea a (otherwise, el tipo 4 nos
mentira y nos dira que es tipo 6)
Es decir, para que el individuo B no nos mienta tenemos que hacer que
sus declaraciones sean irrelevantes, es decir, debemos convertir al individuo
A en un dictador!! c.q.d.
Fjate en el uso tan curioso que le hemos dado en esta pregunta a la
Teora de Juegos que hemos aprendido en esta asignatura. Estamos dndole
la vuelta: Hasta ahora hemos considerado situaciones estratgicas dadas y
las hemos resuelto utilizando no se qu concepto de solucin pero ahora
estamos pensando en que queremos conseguir no se qu solucin y queremos
ver si podemos disear un juego que nos la proporcione.
Eso es la Teora del Diseo de Mecanismos y no slo atae a los problemas
de eleccin social. Es tan importante que el Nobel de Economa de 2007
160 7. Economa del Bienestar
se le ha concedido a Leonid Hurwicz, Eric S. Maskin y Roger B. Myerson
por "haber establecido las bases de la teora del diseo de mecanismos". El
siguiente tema, el ltimo de este curso, servir como introduccin al asunto.
This is page 161
Printer: Opaque this
8
El Principio de Revelacin y el
Diseo de Mecanismos
8.1 Introduccin. Turning Game Theory on its
Head
Un principal se enfrenta a mltiples agentes que tienen informacin
privada. El principal querra condicionar sus decisiones a la informacin
que tienen los agentes. Pero lamentablemente no dispone de ella. Podra
simplemente preguntar a los agentes, pero ya sabemos que stos no diran
la verdad a menos que el principal les proporcione los incentivos adecuados
(recuerda el tema 6). A veces, la provisin ptima de incentivos es costosa
por lo que lo ms normal es que exista un trade-o que resulte en una
decisin ineciente.
Esta estampa genrica se aplica a multitud de situaciones econmicas
dependiendo de quin sea el principal.
Un gobierno (planeador social) cuyo objetivo es el bienestar de la
sociedad
Regulacin monopolio con costes desconocidos (clsico de los 80)
Provisin ptima de un bien pblico (clsico de los 50 y 60)
Un mediador (entre dos partes)
Dilema del Rey Salomn (clsico de Bernardo)
162 8. El Principio de Revelacin y el Diseo de Mecanismos
Un egosta (persona normal y corriente)
Un vendedor quiere vender un objeto pero no sabe las
propensiones a pagar de los compradores (subastas)
Intercambio bilateral
Un monopolio discriminador de precios (tarifas no lineales)
Una compaa de seguros que no conoce el tipo de sus asegurados
(screening)
8.2 El Principio de Revelacin de Myerson (1979)
En un mundo sin informacin privada, todo la informacin relevante sera
conocimiento comn y por tanto el diseo de mecanismos sera innecesario.
Pero no vivimos en ese mundo ideal as que el principal debe pensar cul
es la mejor forma de servir sus intereses . . . la pregunta clave es: Dados los
objetivos del principal, es posible Y COMO descentralizar la decisin entre
los agentes de tal forma que, siendo ellos libres de elegir lo que quieran,
terminen eligiendo lo que maximiza el bienestar del principal?
Fjate que estamos hablando del diseo de instituciones . . . cul es la
mejor institucin?
La relevancia de la Teora de Juegos en la economa es que le permite
estudiar ms instituciones que el mercado competitivo!!
Denicion 32 Un mecanismo es un juego en tres etapas con informacin
incompleta en el que los tipos de los agentes son su informacin privada.
Etapa 1. El Principal disea juego en el que los agentes envan mensajes
y en el que la decisin del principal se basa en los mensajes enviados.
Etapa 2. Restriccin de Participacin: Los agentes eligen libremente si
participan o no en el mecanismo (obviamente, si el principal es el gobierno
puede considerarse ilegal la no participacin)
Etapa 3. Restriccin de Compatibilidad de Incentivos: Los agentes que
aceptan jugar, deciden lo que quieren.
Debemos buscar respuestas a los siguientes dos interrogantes:
Q1 Cuntos mecanismos hay? Pues innitos, y
Q2 De todos los que hay, cul es el que maximiza el bienestar del
principal? Uf, Pero si son innitos, cmo vamos a ser capaces de
responder a esta pregunta...
8.2 El Principio de Revelacin de Myerson (1979) 163
Es posible que te parezca una misin imposible responder a la segunda
cuestin, pero hay una cosa que se llama Principio de Revelacin que nos
dice que en el fondo no es tan complicado. El Principio de Revelacin es
algo del tipo de qu color es el caballo blanco de Sant Yago?
Ya hemos visto que no es posible implementar en estrategias dominantes
una funcin de decisin social eciente y no dictatorial. Pero es posible que
creas que es porque hemos considerado un mecanismo demasiado simple:
hemos preguntado directamente a los ciudadanos acerca de sus tipos. . .
Quin nos ha dicho que no puede existir un mecanismo/institucin ms
complicada/general que s pueda?
Supongamos que un chino (o un indio as cubrimos un tercio de la
humanidad-) se inventa un mecanismo M (lo llamaremos Mecanismo Chino
por razones obvias) que tiene no se qu estrategias dominantes que resultan
en una propiedad interesante, por ejemplo, elige el resultado eciente...
Fjate en que funciona con mensajes chinos y que para cada combinacin
de mensajes chinos, el mecanismo elige un resultado.
Introduzcamos al chino con su mecanismo en el interior de una mquina
con un turco que juega al ajedrez. Este nuevo mecanismo es el Mecanismo
Turco pero ojo, slo habla de tipos. As pues, los jugadores le transmiten
al turco mensajes que versan sobre su tipo. El turco habla con el chino que
est escondido en el interior de la mquina y el resultado del mecanismo
turco es el resultado del mecanismo chino para el perl de mensajes chinos
que hubieran sido enviados por los tipos enviados al mecanismo turco. El
164 8. El Principio de Revelacin y el Diseo de Mecanismos
siguiente grco te ayudar a entenderlo
Como en el mecanismo chino hay una estrategia dominante para cada
jugador, en el mecanismo turco hay una estrategia dominante que es revelar
el tipo verdadero. De esa forma cada jugador se asegura que el chino
introduce su mensaje dominante en el mecanismo chino.
El siguiente esquema nos muestra el interior del mecanismo turco
A nales de los aos 70, Myerson (1979) extendi estos resultados
iniciales de Gibbard al mundo del equilibrio bayesiano. El siguiente teorema
contiene lo que se conoce como Principio de Revelacin.
8.3 Provisin Eciente de Bienes Pblicos. El Mecanismo de Clarke-Groves (1977) 165
Teorema 6 El Principio de Revelacin. Cualquier equilibrio bayesiano
en un juego bayesiano puede representarse mediante un mecanismo directo
compatible con los incentivos.
Intuicin: Hombre una proof no querrs a estas altuas del curso,
simplemente voy a ponerte matemticamente lo que hace el turco que
juega al ajedrez con el mecanismo chino en su interior. Considera un
juego bayesiano G =
1
, ...,
n
; T
1
, ..., T
n
; j
1
, ..., j
n
; n
1
, ..., n
n
que tiene
el siguiente equilibrio bayesiano :

= (:

1
, ..., :

n
). Denamos el siguiente
mecanismo directo '
1
= T
1
, ..., T
n
; T
1
, ..., T
n
;j
1
, ..., j
n
;n
0
1
, ..., n
0
n
tal que
n
0
I
(t
1
, ..., t
1
; t
I
) = n
I
(:

1
(t
1
) , ..., :

n
(t
n
) ; t
I
).
La grandeza del Principio de Revelacin es su contrapositivo
Contrapositivo. Si una funcin de eleccin social no es truthfully
implementable usando un mecanismo bayesiano directo, entonces no existe
ningn mecanismo general que la implemente usando el concepto de
equilibrio bayesiano.
Es decir, el principio de revelacin implica que si somos capaces
de identicar una propiedad en el selecto grupo de los mecanismos
directos bayesianos compatibles con los incentivos (dictadura, eciencia,
imposibilidad) entonces dicha propiedad se extiende inexorablemente al
conjunto de todos los mecanismos imaginables.
8.3 Provisin Eciente de Bienes Pblicos. El
Mecanismo de Clarke-Groves (1977)
Piensa en el problema de provisin del bien pblico PMC por parte de
un Gobierno (Piscina Municipal Cubierta). Cada ciudadano tiene una
valoracin t
I
del bien. Si el Estado supiese la valoracin de cada ciudadano,
entonces podra comparar el benecio social (suma valoraciones) con el
coste de construccin para poder tomar una decisin eciente en cuanto a
la construccin de la piscina. El problema es que no las conoce...
GibbardSatterthwaite (1973, 1975) nos dice que no podemos esperar
implementar la decisin eciente en estrategias dominantes... Qu hacemos
entonces?
Existe un teorema de posibilidad si restringimos el conjunto de
preferencias de los ciudadanos. Pero ms que restringirlas al caso single-
peaked (ms propio de Political Economy), pensemos en las preferencias
cuasi-lineales.
n
I
(:
I
,
I
) =
_

I
+:
I
si hay piscina
:
I
si no hay piscina
ClarkeGroves (1971, 1977) nos presentan el siguiente mecanismo directo.
166 8. El Principio de Revelacin y el Diseo de Mecanismos
1. Cada ciudadano dice su valoracin del bien pblico (lo que
tcnicamente se conoce como su willingness to pay) n
I
2. Se construye la piscina siempre que la suma de las valoraciones
reportadas exceda del coste de provisin,

I
n
I
_ c.
3. Cada ciudadano recibe una transferencia igual a la suma de las
valoraciones reportadas por los dems ciudadanos menos el coste del
proyecto si el proyecto es aprobado (

6=I
n

c). Si no es aprobado,
qu?
Veamos que en este mecanismo decir la verdad es una estrategia
dominante (supongamos para mayor facilidad de exposicin que el coste
de provisin es cero y que la renta :
I
de cada individuo i tambin es cero).
Fjate en que la funcin de pagos de cada individuo es la siguiente
n
I
(n
I
, n
I
;
I
) =
_

I
+

6=I
n

:i

0
0 ot/crni:c
Supongamos que
I
+

6=I
n

0. Entonces, si dice ms que su


valoracin no cambia la decisin del mecanismo, pero si dice menos entonces
es posible que sea pivote haciendo que el mecanismo cambie su decisin
hacia la no provisin y por tanto haciendo que el ciudadano est netamente
peor. El caso contrario es simtrico; si dice ms que su valoracin entonces
es posible que cambie la decisin del mecanismo hacia la provisin y
haciendo por tanto que el ciudadano est netamente peor.
Remark 19 Intuicin: Lo que yo digo slo afecta a la instalacin o no
de la piscina, pero no a mi pago dado que hay piscina. Por eso, lo que a m
me interesa es que se ponga la piscina si me interesa y no se ponga cuando
no me interesa... es decir, a m me interesa decir la verdad.
As pues, este mecanismo no incentiva la misrepresentation de las
preferences y no te recuerda a algo que hemos visto en el curso?
Uno de los problemas de este mecanismo es que no es budget balanced,
es decir, que en general puede ser muy caro incentivar a los ciudadanos
a decir la verdad (pagarles mucho dinero ms del que recauda). Eso hace
que aunque implemente la decisin eciente desde el punto de vista de la
provisin del bien pblico, no sea eciente si tomamos en cuenta el gasto
del sector pblico.
Teorema 7 Teorema de Imposibilidad de Green y Laont (1979):
No existe un mecanismo no manipulable, eciente y con presupuesto
equilibrado.
Teorema 8 Teorema de Posibilidad de dAspremont y Grard-Varet
(1979): Se puede implementar la solucin eciente con un presupuesto
equilibrado en entornos bayesianos.
8.4 Juegos Bblicos: El dilema de Salomn (950 bc) 167
8.4 Juegos Bblicos: El dilema de Salomn (950 bc)
Dado que la implementacin en estrategias dominantes es tan imposible
podemos preguntarnos si utilizando conceptos de solucin ms exigentes
equilibrio de Nash por ejemplo- podemos encontrar teoremas de posibilidad.
Y la verdad es que es cierto.
Vamos a pensar en un ejemplo bblico: El dilema del Rey Salomn.
Jugadores: Dos mujeres, A y B (y un nio)
Resultados: {a:(Nio a la mujer A) , b:(Nio a la mujer B), c:(Nio
cortado y cada madre recibe la mitad)}.
La solucin eciente es darle el nio a su madre verdadera. Pero
Salomn no conoce quin es la madre verdadera.
Las preferencias de las jugadoras son las siguientes:
La madre verdadera preere tener a su nio, pero en caso de
que no se lo den, preere que se lo den a la otra antes que verlo
cortado.
La madre impostora preere tener al nio, pero en caso de no
tenerlo, preere verlo cortado antes que verlo con su madre
verdadera.
El siguiente cuadro resume toda la situacin
Solomons
Choice
f(U)=b f(U)=a
c b a c
a c c b
b a b a
B A B A
U U
Solomons
Choice
f(U)=b f(U)=a
c b a c
a c c b
b a b a
B A B A
U U
El problema es que Salomn no conoce quin es quin en este mundo de
disputas. Afortunadamente, Maskin (1977) auxilia al Sabio.
Teorema 9 Maskin (1977). Si ) () es Nash-implementable entonces es
montona.
Denicion 33 Considera el perl de preferencias l = n
I

I=n
I=1
y l
0
=
n
0
I

I=n
I=1
. Una funcin de decisin social ) () es montona en el sentido
168 8. El Principio de Revelacin y el Diseo de Mecanismos
de Maskin si para cualquier resultado r ) (l) y r , ) (l
0
) tenemos
que existe un jugador i y otro resultado j tal que n
I
(r) _ n
I
(j) pero
n
0
I
(r) < n
0
I
(j) .
Es decir, si r es el resultado social para el perl de preferencias l pero no
para el perl l
0
es porque r ha debido "moverse para abajo" en el ranking
de al menos un jugador. Es muy fcil su demostracin directa.
Demostracin.
La clave del asunto est en que tenemos un juego en forma estratgica que
de forma "mgica" para el perl de preferencias U tiene un nico equilibrio
de Nash cuyo resultado es x y que para el perl de preferencias alternativo
U tiene un nico equilibrio de Nash cuyo resultado es y. Ten en cuenta que
el juego es el mismo independientemente del perl de preferencias... el perl
de preferencias lo que hace es cambiar la estructura de mejores respuestas
de los jugadores. Con esto en la cabeza, empecemos con la demostracin.
Empecemos por el perl de preferencias U y por el hecho de que el
resultado x sea el elegido por la funcin de eleccin social. Esto signica
que existe un equilibrio de Nash tal que su resultado en equilibrio es x. Lo
ms fcil es visualizar la matriz de pagos
l
:

I
a
I
y
:

I
x
t
I
z
Por denicin de equilibrio de Nash, signica que para cada jugador i,
la mejor respuesta a :

I
es :

I
, es decir
n
I
_
:

I
, :

I
_
_ n
I
_
:
I
, :

I
_
para todo :
I
o
I
Fjate que esta funcin de mejor respuesta nos dice que el individuo i
tiene las siguientes preferencias sobre los resultados que aparecen en la
matriz r _ j, r _ .. Es decir, para este individuo tenemos n
I
(r) _ n
I
(j)
y n
I
(r) _ n
I
(.).
Pensemos ahora en el segundo perl de estrategias U. Para este perl,
la funcin de eleccin social ya no elige el resultado x sino otro. Es decir, el
equilibrio de Nash del juego tiene que se otro diferente al perl
_
:

I
, :

I
_
.
Esto signica que la estrategia :

I
ya no es mejor respuesta a :

I
para algn
jugador i, sino que es otra estrategia... llammosla a
I
. Veamos esto en la
matriz de pagos
l
0
:

I
a
I
y
:

I
x
t
I
z
8.5 Maskin (1977) by Maskin (2007) 169
Tenemos por tanto que
n
0
I
_
:

I
, :

I
_
< n
0
I
_
a
I
, :

I
_
y que puestos en trminos resultados nos dice que para este individuo
j _ r, es decir, n
0
I
(r) < n
0
I
(j). Fjate en que ya hemos encontrado lo que
buscbamos, la monotona de la funcin de decisin social. c.q.d.
El contrapositivo de nuevo es el que tiene poder: si una funcin de
decisin social no es montona, entonces no es Nash-implementable! Y esto
es lo que ocurre con el ejemplo bblico
Solomons
Choice
f(U)=b f(U)=a
c b a c
a c c b
b a b a
B A B A
U U
Solomons
Choice
f(U)=b f(U)=a
c b a c
a c c b
b a b a
B A B A
U U
Como vemos, para el resultado a, el nico cambio que protagoniza cuando
pasamos de U a U es que se hace ms deseable para la jugadora B. Para
el resultado b tenemos lo mismo (por simetra). Por tanto, no es montona
. . . ergo no se puede implementar en Nash.
Presentamos un mecanismo que implementa la solucin eciente aunque
utilizando un concepto de solucin an ms exigente: la perfeccin en
subjuegos, siempre que una madre verdadera valore ms a un nio (V)
que una impostora (v). La pregunta del milln es: Es el nio tuyo?
NO
SI A B
NO
SI
Nio a B Nio a A
Nio a B, quien paga una
multa v<M<V mientras que
la mujer A paga una pequea
multa e>0.
8.5 Maskin (1977) by Maskin (2007)
Voy a cerrar esta seccin utilizando el ejemplo que utiliza Eric Maskin en
su discurso Nobel de 2007 para ilustrar su concepto de monotonicidad y
170 8. El Principio de Revelacin y el Diseo de Mecanismos
su relacin con la implementacin. Hay dos consumidores de energa, Alice
and Bob y una autoridad energtica que tiene que decidir qu poltica
energtica seguir, sabiendo que hay cuatro posibles fuentes de energa
Gas (Gas)
Oil (Petrleo)
Nuclear power (nuclear)
Coal (carbn)
Supongamos que hay dos posibles estados del mundo:
Estado 1 Los ciudadanos no se preocupan por el futuro.
Estado 2 Los ciudadanos valoran el futuro.
con las siguientes preferencias de los consumidores:
State 1 State 2
Alice Bob Alice Bob
Gas Nuclear Nuclear Oil
Oil Oil Gas Gas
Coal Coal Coal Coal
Nuclear Gas Oil Nuclear
Oil optimal Gas optimal
Fjate en que estas preferencias reejan que Alice se preocupa por la
conveniencia practica de cada fuente de energa mientras que Bob se
preocupa por la seguridad.
La Autoridad Energtica quiere conseguir un compromiso entre las
distintas visiones de los ciudadanos y por tanto piensa que OIL sera el
ptimo social en el estado 1 (es la segunda preferida de cada ciudadano) y
GAS sera el ptimo social en el estado 2 (es la segunda preferida de cada
ciudadano). Pero el problema es que no conoce el estado del mundo...
Preguntarle directamente a los ciudadanos es un enfoque demasiado
ingenuo, porque los ciudadanos van a mentir.
Alice dir que el estado del mundo es el 2, porque para ella GAS es
siempre mejor que OIL independientemente de qu estado del mundo
sea.
Bob dir que el estado del mundo es el 1, porque para l, OIL
es siempre mejor que GAS, independientemente de qu estado del
mundo sea.
8.5 Maskin (1977) by Maskin (2007) 171
Sin embargo, considera el siguiente mecanismo -juego-
Bob
L R
Alice U Oil Coal
D Nuclear Gas
en el que Alice puede elegir las estrategias (Up, Down) mientras que
Bob puede elegir las estrategias (Left, Right). En funcin de las estrategias
elegidas por los ciudadanos, el mecanismo selecciona una de las fuentes de
energa.
El punto del asunto es demostrar que este simple juego consigue
implementar la fuente de energa ptima para cualquier estado del mundo.
Estado 1: Calculemos las mejores respuestas de cada jugador (Estn
subrayadas)
Estado 1 Bob
L R
Alice U Oil, Oil Coal, Coal
D Nuclear, Nuclear Gas, Gas
Como vemos, el nico equilibrio de Nash tiene como resultado OIL,
que es el ptimo social en este estado.
Estado 2: Las mejores respuestas son las siguientes (de nuevo aparecen
en negrita)
Estado 2 Bob
L R
Alice U Oil, Oil Coal, Coal
D Nuclear, Nuclear Gas, Gas
Como vemos, el nico equilibrio de Nash tiene como resultado GAS,
que es el ptimo social en este estado.
Por qu hemos podido implementar esta funcin de eleccin social? Pues
porque es montona... Para Alice, el ptimo social en el estado 1 -Oil- cae
en su ranking al pasar al estado 2 (pasa de ser la segunda a ser la ltima...
es decir, cae en relacin a la energa nuclear y al carbn).
State 1 State 2
Alice Bob Alice Bob
Gas Nuclear Nuclear Oil
Oil Oil Gas Gas
Coal Coal Coal Coal
Nuclear Gas Oil Nuclear
Oil optimal Gas optimal
172 8. El Principio de Revelacin y el Diseo de Mecanismos
8.6 El Principal como ser egosta
8.6.1 El intercambio bilateral
Mucho ms econmico es el problema del intercambio bilateral analizado
por Myerson and Satterthwaite en 1983. Fjate en que es uno de los
problemas bsicos con los que empezbamos el curso all por el mes
de febrero. A lo largo del curso hemos visto algunas formas de abordar
el problema, y casi todas ellas recuerdan al mecanismo de competencia
perfecta (precio-aceptante)
No os he contado los esfuerzos axiomticos iniciados por Nash.
La solucin de Nash (1951)
Propuso una serie de axiomas (razonables) que en su opinin deba cumplir
el proceso de reparto de un excedente. Vemoslo aunque sea brevemente.
1. El resultado debe depender de las preferencias de los individuos, no
de la funcin de utilidad particular que las represente
2. Si el problema de negociacin es simtrico, entonces la solucin debe
ser simtrica
3. Eciencia econmica
4. Independencia de alternativas irrelevantes, es decir, si del conjunto
de negociacin se eliminan alternativas que no son la solucin del
problema, entonces la solucin del problema de negociacin no debe
cambiar.
La solucin de Kalai - Smorodinsky (1975)
Estos autores reemplazan el ltimo de los axiomas de Nash y proponen la
siguiente solucin.
1. El resultado debe depender de las preferencias de los individuos, no
de la funcin de utilidad particular que las represente
2. Si el problema de negociacin es simtrico, entonces la solucin debe
ser simtrica
3. Eciencia econmica
4. Monotonicidad: Si para cualquier demanda del jugador 1, el mximo
nivel de utilidad que puede conseguir el jugador 2 se incrementa,
entonces el nivel de utilidad asignado al jugador 2 debe aumentar.
8.6 El Principal como ser egosta 173
Myerson y Satterthwaite (1983)
Todas las formas analizadas a lo largo del curso de reparto de un excedente
comparten una caracterstica comn: Informacin completa, en el sentido
de que el tamao del excedente es conocimiento comn.
Myerson y Satterthwaite (1983) analizaron el siguiente caso extremo de
informacin asimtrica:
Un vendedor con un coste de produccin c de un objeto (conocido
slo por l)
Un comprador con una valoracin del objeto v (conocido slo por l)
Bajo informacin completa:
Si v c, existen ganancias asociadas al intercambio (eciencia), ambos
quieren por tanto entrar en negociaciones (restriccin de participacin) y
determinar un precio de intercambio (equilibrio presupuestario). Nada de
esto ocurre en caso contrario.
Bajo informacin incompleta, se preguntan si existe una institucin
(mecanismo) que tenga las mismas propiedades que bajo informacin
completa
Eciente.
Presupuesto equilibrado.
Ambas partes quieran participar.
Demuestran que no existe.
8.6.2 El diseo ptimo de Subastas
Imagnate que quieres vender un objeto pero no sabes la valoracin de los
compradores. Alguien te habla de las tpicas subastas y entonces empiezas
a considerarlas seriamente.
1. Subasta take-it-or-leave-it.
2. Subasta de sobre cerrado de primer precio.
3. Subasta de sobre cerrado de segundo precio.
4. Subasta inglesa (oral ascendente).
5. Subasta holandesa (oral descendente).
Con cul te quedas?
Seguro que no puedes disear tu propia subasta para que te d ms
dinero? Qu tal la subasta inversa?
174 8. El Principio de Revelacin y el Diseo de Mecanismos
Teorema 10 The Revenue Equivalence Principle
Demostracin. c.q.d.
8.6.3 El Mecanismo de Becker, DeGroot and Marshack
Hasta ahora hemos supuesto que hay dos compradores para la casa. . . pero
qu ocurre si solo hay uno. Sea la siguiente situacin:
Un objeto a la venta
Un nico agente con una valoracin belonging to [

,
+
] y con
funcin de utilidad quasilineal: n() = j (si compra el objeto al
precio p) y 0 si no lo compra.
Una distribucin G() con soporte [

,
+
]
El mecanismo de Becker, DeGroot and Marshack (BDM) es el
siguiente:
El agente anuncia un precio de reserva .
Obtenemos un precio j segn la distribucin G().
Si j < entonces el agente obtiene el objeto al precio j. Si j
entonces no adquiere el objeto (y no paga nada). Si j = entonces
se lanza una moneda y se decide si se adquiere o no el bien.
Claim 3 It is optimal (a weakly dominant strategy) for the agent to choose
his valuation as the reservation price.
Demostracin. Dado que el agente no puede inuir en el precio de
venta y dado que slo puede inuir en la decisin de comprar o no a un
precio dado, su objetivo debe ser por tanto tomar la decisin de compra
correcta para cada posible precio de venta realizado. Y eso se consigue
eligiendo como precio de reserva su propia valoracin. Puesto que este
argumento funciona para cualquier G(), no importa si sta viene de una
ruleta o del comportamiento de otros agentes (equilicu). Esto hace que
este mecanismo sea igualito, igualito al mecanismo de Clarke y Groves y a
la subasta de Vickrey. c.q.d.

También podría gustarte