Está en la página 1de 427

ECONOM

IA, POL

ITICA Y OTROS JUEGOS.


UNA INTRODUCCI

ON A LOS JUEGOS NO
COOPERATIVOS
Paloma Zapata Lillo
Marzo 2006
ii

Indice general
Pr ologo I
Introducci on V
I Modelos de juegos no cooperativos 1
1. Juegos Rectangulares 3
1.1. Presentaci on del modelo . . . . . . . . . . . . . . . . . . . . . 3
1.2. Algunas deniciones . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4. Estrategias puras conservadoras . . . . . . . . . . . . . . . . . 19
1.5. La paranoia colectiva puede ser soluci on . . . . . . . . . . . . 22
1.6. Algunos ejemplos innitos . . . . . . . . . . . . . . . . . . . . 33
1.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2. Juegos Extensivos 45
2.1. Sobre el modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2. Alternancia, azar e informaci on. . . . . . . . . . . . . . . . . . 46
2.3. Gr acas y juegos extensivos . . . . . . . . . . . . . . . . . . . 62
2.4. Posici on o Historia? . . . . . . . . . . . . . . . . . . . . . . . 72
2.5. Gr acas Dirigidas y Juegos. . . . . . . . . . . . . . . . . . . . 82
2.6. Selecci on de Equilibrios y Gr acas Dirigidas. . . . . . . . . . 86
2.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3. Estrategias y Forma Normal 101
3.1. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . 101
3.2. Estrategias en Juegos Extensivos . . . . . . . . . . . . . . . . 102
3.3. Buenas Estrategias en Informaci on Perfecta . . . . . . . . . . 106
3.4. Forma Normal y Equilibrio de Nash . . . . . . . . . . . . . . 112
i

INDICE GENERAL

INDICE GENERAL
3.5. Equilibrios Perfectos en Subjuegos . . . . . . . . . . . . . . . 121
3.6. Inducci on hacia atr as en el caso innito . . . . . . . . . . . . 131
3.6.1. Un principio de equilibrio. . . . . . . . . . . . . . . . . 139
3.6.2. El juego con horizonte innito. . . . . . . . . . . . . . 142
3.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4. Sobre gustos y conocimiento 151
4.1. Justicaci on del Captulo . . . . . . . . . . . . . . . . . . . . 151
4.2. Sobre gustos y utilidad . . . . . . . . . . . . . . . . . . . . . . 152
4.3. Sobre Conocimiento . . . . . . . . . . . . . . . . . . . . . . . 159
4.3.1. Conocimiento Privado. . . . . . . . . . . . . . . . . . . 159
4.3.2. Conocimiento Com un. . . . . . . . . . . . . . . . . . . 166
4.4. Racionales y Bayesianos . . . . . . . . . . . . . . . . . . . . . 168
4.5. Y si no se conocen las reglas? . . . . . . . . . . . . . . . . . 173
4.5.1. Juegos rectangulares bayesianos (o de informaci on in-
completa) . . . . . . . . . . . . . . . . . . . . . . . . . 174
4.5.2. Juegos extensivos bayesianos . . . . . . . . . . . . . . 179
4.5.3. Juegos de se nalizaci on . . . . . . . . . . . . . . . . . . 179
II Mezclando y Jugando en el largo Plazo 187
5. Estrategias Mixtas 189
5.1. Motivando con el Juego Ficticio . . . . . . . . . . . . . . . . . 189
5.2. Estrategias Mixtas y Pago Esperado . . . . . . . . . . . . . . 195
5.3. Respondiendo a perles mixtos . . . . . . . . . . . . . . . . . 199
5.3.1. Una cruz Gamada para los juegos 2 2 . . . . . . . . 207
5.3.2. Las curvas de reacci on . . . . . . . . . . . . . . . . . . 211
5.4. Equilibrio de Nash en Estrategias Mixtas . . . . . . . . . . . 216
5.5. Geometra de las Estrategias Mixtas . . . . . . . . . . . . . . 222
5.5.1. Un Algoritmo de Scarf para Calcular Puntos Fijos . . 227
5.6. Existencia de Equilibrios . . . . . . . . . . . . . . . . . . . . . 236
5.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
6. Comportamiento Conservador 245
6.1. Discusi on del Problema . . . . . . . . . . . . . . . . . . . . . 245
6.2. Estrategias Mixtas Conservadoras . . . . . . . . . . . . . . . . 246
6.3. Equilibrio de Nash en Juegos Antag onicos . . . . . . . . . . . 253
6.4. Calculando Estrategias Conservadoras . . . . . . . . . . . . . 261
6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
ii

INDICE GENERAL

INDICE GENERAL
7. Equilibrios Perfectos en Subjuegos 283
7.1. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . 283
7.2. Estrategias de Comportamiento . . . . . . . . . . . . . . . . . 285
7.3. Juegos de Memoria Perfecta . . . . . . . . . . . . . . . . . . . 292
7.3.1. El Surgimiento de una Organizaci on Social . . . . . . 296
7.4. Juegos Repetidos . . . . . . . . . . . . . . . . . . . . . . . . . 306
7.4.1. Los Equilibrios de un Conicto Repetido . . . . . . . 307
7.4.2. La Tradici on Oral y el Espritu de Venganza . . . . . 309
7.4.3. Los Juegos Repetidos en General . . . . . . . . . . . . 312
7.4.4. La Conjetura de Coase para un Monopolio en el Mer-
cado de un bien durable . . . . . . . . . . . . . . . . . 317
7.5. Inducci on hacia atr as en estrategias mixtas . . . . . . . . . . 328
7.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
8. Selecci on de Equilibrios 341
8.1. Y si existe m as de un equilibrio? . . . . . . . . . . . . . . . . 341
8.2. Selecci on de Harsanyi . . . . . . . . . . . . . . . . . . . . . . 343
8.2.1. La Selecci on de Equilibrios Propuesta por Nash . . . . 343
8.2.2. La Selecci on de Harsanyi . . . . . . . . . . . . . . . . 345
8.2.3. La v-Soluci on y la t-Soluci on de Harsanyi . . . . . . . 345
8.3. Un enfoque m as realista de selecci on . . . . . . . . . . . . . . 355
8.4. Digr acas y aprendizaje . . . . . . . . . . . . . . . . . . . . . 357
8.4.1. Din amica de Aprendizaje en Poblaciones, el Enfoque
de Kandori, Mailath y Rob . . . . . . . . . . . . . . . 358
8.4.2. Din amica de historias de tama no r. El Enfoque de
Young. . . . . . . . . . . . . . . . . . . . . . . . . . . . 366
8.4.3. Errar es de Humanos . . . . . . . . . . . . . . . . . . . 370
8.5. Digr acas de aprendizaje en general . . . . . . . . . . . . . . 372
8.5.1. Digr acas Perturbadas . . . . . . . . . . . . . . . . . . 377
8.5.2. La Digr aca de las Clases de Comunicaci on Recurrente 381
8.6. La din amica como un proceso estoc astico . . . . . . . . . . . 388
8.6.1. Otra vez sobre errores y experimentos . . . . . . . . . 390
8.6.2. Una versi on de Young de un teorema de Freidlin y
Wentzell sobre procesos de Markov nitos y perturbados.393
8.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396
Bibliografa 399
iii

INDICE GENERAL

INDICE GENERAL
iv
Pr ologo
Este texto es una introduci on a la teora de juegos no cooperativos, la cual
se utiliza cada vez m as como un instrumento de an alisis dentro de las ciencias
sociales, particularmente de la economa. Entendemos por juego a un modelo
simplicado de un conicto social en donde cada participante (jugador) tiene
un objetivo y para tratar de lograrlo debe tomar una o varias decisiones
dentro de un conjunto posible. El resultado que se obtiene en dicho conicto
depende de las decisiones de todos y puede resultar contrario a lo que cada
uno deseaba. En un juego no cooperativo, los jugadores pueden comunicarse
y acordar la conducta que seguir an, pero no es obligatorio respetar esos
acuerdos.
El trabajo est a pensado como texto para un curso de la materia de Teora
de Juegos, al nivel de licenciatura, en las carreras de Actuara, Economa y
Matem aticas. En cada una de ellas, sin embargo, habra que hacer distintos
enfasis.
A medida que van apareciendo los conceptos, procuramos examinarlos a
la luz de ejemplos sencillos. Dividimos el material en dos partes, cada una
de ellas con cuatro captulos. En la primera estudiamos los dos modelos
que se trabajan en la teora de los juegos no cooperativos. Por un lado,
el rectangular o estrategico que consta del conjunto de jugadores, de un
conjunto de estrategias puras para cada jugador y de una funci on de pago.
Por el otro lado, tenemos al modelo extensivo que incorpora m as elementos
que el rectangular para estudiar conictos reales. El extensivo es un modelo
menos est atico que el rectangular, pues los jugadores tienen que tomar varias
decisiones a lo largo del tiempo y, adem as, pueden aparecer en este modelo,
si es necesario, los problemas de falta de informaci on que tengan algunos
jugadores, lo mismo que el azar. En esta primera parte, no s olo exponemos
los modelos, tambien nos preguntamos que se puede decir acerca de los
juegos cuando estos se van a llevar a cabo por una sola ocasi on. En el ultimo
captulo de la primera parte, presentamos ciertas ideas de formalizaci on de
la teoras de la utilidad y del conocimiento com un y privado que tienen los
i
ii Pr ologo
jugadores.
El texto gira en torno al concepto de soluci on de los juegos no coo-
perativos, el equilibrio de Nash, que consiste en un perl de estrategias,
una para jugador, de tal manera que cada uno est a maximizando su pago
respecto a las elecciones de los dem as. Desde las primeras p aginas de este
trabajo aparece la forma m as simple de dicho equilibrio, la de estrategias
puras. Sin embargo, no todos los juegos tienen equilibrio de Nash en dichas
estrategias. La segunda parte del libro la dedicamos a la combinaci on de
estrategias puras, en particular a lo largo del tiempo. Es decir, ahora los
jugadores combinar an sus estrategias puras ya sea en una sola ocasi on o
al repetirse el juego a lo largo del tiempo. El recurso del cual dispondr an
los jugadores para establecer esa combinaci on de estrategias puras es el
concepto de estrategia mixta. Se generalizar a mucho de lo que hicimos con
estrategias puras, pero ahora tendremos el teorema fundamental de la teora
de los juegos no cooperativos que establece que siempre existen equilibrios
de Nash en estrategias mixtas en los juegos nitos. En esta segunda parte,
estaremos casi exclusivamente en el contexto del modelo rectangular de un
juego, excepto en el captulo 7 donde combinamos los juegos extensivos con
los rectangulares. Estudiamos varios metodos para calcular equilibrios de
Nash. Al nal del libro, con la ayuda de las gr acas dirigidas y de algunos
elementos de procesos estoc asticos se pueden estudiar diversas din amicas de
aprendizaje con las que se podra desenvolver la repetici on de un juego y
poner a prueba el derecho del equilibrio de Nash a llamarse soluci on y, al
mismo tiempo, establecer mecanismos de selecci on entre los equilibrios del
juego.
En la primera y segunda parte se examina, con detenimiento, un tipo
especial de conictos en el cual los jugadores tienen intereses antag onicos.
Para ello se constuye un concepto de juego que es una generalizaci on de los
juegos bipersonales llamados de suma cero. Puede decirse que es el m as
simple que estudia la teora de juegos y donde el concepto de soluci on resulta
m as contundente.
Un tema que tambien se estudia en las dos partes es el de la posibilidad
de descomponer un juego extensivo en peque nos juegos, llamados subjuegos,
que forman parte de el. La idea es encontrar una soluci on del juego completo
(equilibrio de Nash), a partir de encontrar las de dichos subjuegos. Esto no
s olo facilita la tecnica para construir equilibrios de Nash, sino que es una
primera forma de seleccionar equilibrios, pues los que se encuentran de esa
manera, los equilibrios perfectos en subjuegos, est an protegidos contra los
errores de todos los jugadores.
La mayor parte del material que presentamos est a centrado en los juegos
ii
Pr ologo iii
rectangulares y extensivos nitos, pero introducimos secciones en que se
abordan los juegos innitos.
El texto contiene algunas tem aticas que no sera adecuado tratar en
un curso b asico. Por ejemplo, nos referimos al trabajo formal con juegos
innitos, en particular, el tratamiento con juegos repetidos. Nos referimos,
tambien, a temas que se centran en la formalizaci on de la racionalidad de
los jugadores como la exposici on de los criterios de selecci on de Harsanyi o
a la formalizaci on de la teora del conocimiento. Sin embargo, muchos de los
ejemplos presentados en esas direcciones y a un los resultados te oricos pueden
abrir un panorama interesante, aunque no se trabaje en detalle en ellos. Por
otro lado, hay temas que est an teniendo una aplicaci on muy interesante
en diversos conictos sociales y que apenas se tocan, como los juegos de
informaci on incompleta o bayesianos. Nos ha parecido que, de haberlo hecho,
se hubiera ampliado el texto en forma considerable.
Durante varios semestres, se han utilizado los avances de este texto den-
tro de los cursos de Teora de Juegos impartidos en la Facultad de Ciencias
de la UNAM. El texto se ha beneciado con las crticas y sugerencias, tanto
de estudiantes, como de profesores y ayudantes de dichos cursos. Queremos
expresar nuestro profundo agradecimiento por dicho apoyo, en especial a la
profesora Claudia Villegas.
Dentro del seminario de Economa Matem atica y Teora de Juegos de
la Facultad de Ciencias, UNAM presentamos varios de los temas que se
exponen en el libro y recibimos numerosas y valiosas aportaciones de todos
los participantes. A todos ellos les damos las gracias m as sinceras.
Menci on aparte merece el apoyo que en todos sentidos recibimos del
profesor Sergio Hern andez Casta neda. Sin el este libro no hubiera sido posi-
ble. Sergio no s olo es una presencia importantsima dentro del seminario
mencionado, sino que desde que nos iniciamos juntos en el estudio y, poste-
riormente, en la ense nanza de la Teora de Juegos, empezamos a desarrollar
una parte importante del material que contiene este texto.
Queremos, por ultimo, hacer constar nuestro reconocimiento a los arbi-
tros que revisaron el trabajo por las valiosas sugerencias que hicieron, las
cu ales esperamos haber incorporado como ellos deseaban.
Por supuesto, la autora se declara como la unica responsable de todos
los errores y limitaciones que contenga el texto.
iii
Introducci on
Economa, Poltica y otros Juegos es el ttulo que hemos puesto al
libro. Quiz a parezca extra no ese nombre, c omo calicar de juegos, asuntos
tan importantes y que a todos afectan, como son la economa y la poltica?
Hemos querido destacar, con dicho ttulo, un aspecto esencial de los conic-
tos humanos, sean econ omicos, polticos o de otra ndole, que en los juegos
de sal on aparece claramente. Nos referimos a que los resultados que se ob-
tienen en los distintos conictos humanos son producto, como ocurre en
dichos juegos, de las decisiones de numerosos individuos que buscan su pro-
pio benecio y construyen, entre todos, algo que posiblemente nadie quera.
La Teora de Juegos busca construir modelos, inspirados en los juegos de
sal on, para estudiar los conictos humanos.
Abordar los problemas de la sociedad capitalista, con el enfoque propio
de la Teora de Juegos, es decir, estudiando la resultante de las fuerzas
con que empujan cada uno de los participantes, corresponde a la concepci on
los oca del pensamiento de la economa poltica cl asica, desde la mano
invisible de Adam Smith. Corresponde tambien al pensamiento neocl asico y
es un aspecto importante de la concepci on de Marx y Engels.
La historia del desarrollo de la sociedad - dice Federico Engels- diere
substancialmente, en un punto, de la historia del desarrollo de la naturaleza.
En esta, si prescindimos de la acci on inversa ejercida a su vez por los hom-
bres sobre la naturaleza, los factores que act uan los unos sobre los otros y en
cuyo juego mutuo se impone la ley general, son todos agentes inconscientes
y ciegos. En cambio, en la historia de la sociedad, los agentes son todos
hombres dotados de conciencia, que act uan movidos por la reexi on o la
pasi on, persiguiendo determinados nes; aqu nada acaece sin una intenci on
consciente, sin un n propuesto... Los hombres hacen su historia, cua-
lesquiera que sean los rumbos de esta al perseguir cada cual sus nes propios
conscientemente; y la resultante de estas numerosas voluntades, proyectadas
en diversas direcciones y de su m ultiple inuencia sobre el mundo exterior,
es precisamente la historia. Y, sobre esta resultante, Engels agrega, poste-
v
vi Introducci on
riormente, ... las voluntades que act uan en la historia producen casi siempre
resultados muy distintos de los propuestos.
Despues de leer esas citas de Engels, cuyo contenido se repite en otras de
sus obras lo mismo que en las de Marx y en las de muchos de los pensadores
cl asicos y neocl asicos, ya no nos parecer a raro que la teora de juegos tenga
mucho que hacer en el campo de las Ciencias Sociales.
Fue John von Neumann el que concibi o a la Teora de Juegos como la
matem atica ad hoc para estudiar la problem atica econ omica.

El pensaba
que el enfoque usual dentro de la teora de su epoca no corresponda a la
realidad de los conictos econ omicos y podramos agregar que ni a la de los
sociales, en general. Este enfoque de la teora econ omica situaba a agentes,
individuales y aislados, optimizando sus recursos sin tomar en cuenta las
posibilidades de acci on que tenan los dem as individuos; ya que no conside-
raba que los resultados del conicto dependan de las acciones de todos los
involucrados. Ilustraremos el contraste entre los dos enfoques recurriendo a
un ejemplo muy simple.
Pensemos en una empresa M que est a a punto de lanzar al mercado un
producto, por ejemplo un nuevo software, cuyo precio total es de 1000 000
unidades de dinero y que, para promoverlo, tiene que decidir el sistema de
publicidad que le resulta m as conveniente de entre tres a los cuales podra
recurrir: 1) regalar algunos paquetes en lugares claves y esperar que la noticia
de la excelencia del producto se vaya corriendo de boca en boca, 2) usar
de medios escritos para hacer publicidad y 3) usar los medios electr onicos
de comunicaci on masiva para hacerlo. Cada uno de los tres tiene distinto
costo y logra la venta de distintas cantidades del producto en cada uno de
los dos a nos en que este se encontrar a en el mercado. Suponemos que el
producto total se agota en los dos a nos. En la siguiente tabla, podemos ver
las caractersticas de cada uno de estos tres metodos.
metodos costo ventas 1
er
a no ventas 2
o
ganancias
regalar 200, 000 100,000 900,000 800,000
prensa 400,000 400,000 600,000 600,000
radio y tv 450,000 800,000 200,000 550,000
Si la empresa no tiene interes en vender cuanto antes su producto, en-
tonces es una trivialidad encontrar el metodo que le permitir a obtener ma-
yor ganancia que, sin lugar a dudas, es el primero. Aunque utilizando una
matem atica muy sosticada, muchos problemas de la microeconoma que no
usan teora de juegos tienen en esencia el mismo enfoque que consiste en
vi
Introducci on vii
maximizar la funci on objetivo de un agente sujeta a diversas restricciones.
Sera mucho m as realista el ejemplo anterior, si existiera otra empresa que en
el segundo a no considerara la conveniencia o no de competir con M quien to-
do el primer a no ha monopolizado el software. Cu al ser a la ganancia de cada
empresa, depende de las acciones de las dos. Si suponemos, por ejemplo, que
la segunda empresa tiene que realizar gastos por valor de solamente 200,000
pesos, pues est a usando la propaganda ya realizada, y que las dos empre-
sas se repartir an la demanda del segundo a no en partes iguales; si, adem as,
pensamos que las empresas tienen que tomar decisiones simult aneamente al
inicio del primer a no, cada una sin conocer lo que har a la otra, la siguiente
matriz registrar a los resultados correspondientes a cada pareja de decisiones.
La primera coordenada de la entrada ij es la ganancia de M y la segunda
coordenada la de C.
competir en el 2
o
a no no competir
regalar (350,000; 250,000) (800,000; 0)
prensa (300,000; 100,000) (600,000; 0)
radio y tv (450,000; -100,000) (550,000; 0)
Ahora, ya no es tan sencillo saber cu ales deberan ser las decisiones de
la empresa M o las de la empresa C, porque esto depende de las acciones
de su respectivo oponente. Si C escoge no entrar a competir, entonces los
posibles pagos de M son los mismos que cuando no exista C y, c omo en
aquel caso, le conviene regalar algunos productos como metodo publicitario
ganando 800,000 pesos. En cambio, si C elige entrar a competir, la mejor
alternativa para M es usar los medios electr onicos para hacerle publicidad al
producto ganando 450,000 pesos. Lo mismo es v alido para C. Dependiendo
de la elecci on de M, C tendr a una mejor decisi on distinta. Por ejemplo, si M
elige su primera o su segunda opci on, entonces a C le conviene decidirse por
entrar a competir. Por el contrario, si M escoge hacer propaganda a traves
de los medios electr onicos, entonces C no debera entrar a competir. Esta es
la situaci on tpica dentro de la Teora de Juegos.
En general, hablaremos de los resultados de los juegos en terminos de
eneadas de reales, uno para cada jugador, lo que puede crear la falsa im-
presi on de que el pago que los jugadores reciben es siempre en dinero o en
cualquier otra forma f acil de expresar en terminos de n umeros reales. La
idea no es esa; los pagos o resultados para un jugador pueden ser hechos tan
difciles de medir como el obtener los favores del ser amado o recibir una
paliza de su pareja actual. Sin embargo, recurriendo a la llamada teora de
la utilidad se pueden convertir en n umeros reales los diversos pagos de los
jugadores.
vii
viii Introducci on
Von Neumann no es el primero que estudi o a los juegos; varios matem a-
ticos anteriores haban estudiado diversos aspectos de estos. Por ejemplo,
Emile Borel deni o el concepto de estrategia y Zermelo (1913) construy o un
metodo de an alisis de un juego que lleva a lo que hoy se llama un equilibrio
perfecto en subjuegos. Tampoco es von Numann el primero que establece
ideas en torno a la vinculaci on entre juegos y fen omenos econ omicos. El
matem atico frances Agustine Cournot (1838), por ejemplo, sin hablar ex-
plcitamente de juegos, tiene un tratamiento del oligopolio propio de la teora
contempor anea y establece un concepto de soluci on que es una caso particu-
lar del equilibrio que deni o Nash m as de un siglo despues. Lo mismo ocurre
con Edgeworth (1881) quien para estudiar un mercado con dos agentes y dos
mercancas, en el fondo, utiliz o el moderno concepto de n ucleo de un juego.
Sin embargo, el libro de von Neumann y Morgenstern Theory of Games
and Economic Behavior es un hito hist orico porque establece la teora
como una nueva rama de las matem aticas, la apropiada para el an alisis de
la economa. Dentro de ese libro se trabajan varias direcciones, tanto en los
llamados juegos cooperativos, como los no cooperativos.
Los juegos cooperativos tienen un papel normativo, buscan los resulta-
dos equitativos, justos que conseguiran agentes racionales y bien
informados. Los diversos conceptos de soluci on que hay en la teora que los
estudia se establecen con conjuntos de axiomas que responden a una forma
de entender esas propiedades de racionalidad, justicia y equidad. Los juegos
no cooperativos, en cambio, son un marco te orico adecuado para estudiar si
hay una ley interna en el conicto que se estudia, y pueden resultar un
importante instrumento de an alisis en la teora econ omica para las distintas
corrientes de pensamiento que existen dentro de ella, como las mencionadas
teoras cl asica, neocl asica y marxista, tanto por la posibilidad de plantear
muchos problemas de la sociedad capitalista utilizando los juegos no coope-
rativos, como por la posibilidad de estudiar problemas de la sociedad en su
conjunto. Por ejemplo, el estudio de la formaci on de las instituciones, de la
moral y de las convenciones sociales. Desde luego, tambien el uso de los jue-
gos ha tenido resultados pr acticos importantes en diversas problem aticas,
al situarse el analista en el lugar de alguno de los jugadores, o como su
consejero, para preguntarse cu al es su forma optima de jugar?

Intimamente ligado al desarrollo de la teora de la clase de los juegos no


cooperativos est a el matem atico norteamericano John Nash quien introdujo
el concepto de equilibrio que lleva su nombre y estableci o un teorema funda-
mental de existencia de tales equilibrios. La clave para la divisi on entre los
juegos cooperativos y los no coopertivos consiste en que, en los primeros, ca-
da participante, antes de tomar sus decisiones, puede asociarse con los dem as
viii
Introducci on ix
jugadores o con algunos de ellos, para decidir conjuntamente las elecciones
de cada uno de los miembros de la coalici on que se haya formado, y quiz a,
si es posible, repartirse el pago que reciba dicha coalici on. Estos acuerdos
son obligatorios para todos ellos y ser an los mejores desde el punto de vista
de poseer las propiedades que se nal abamos antes. Por el contrario, en los
juegos no cooperativos, no existe ese tipo de acuerdos obligatorios a priori.
Aqu los jugadores pueden platicar y decidir acciones conjuntas, pero nadie
los obligar a a respetar lo acordado. Para aclarar un poco m as concretamente
esta diferencia nos resultar a util un sencillo juego al que se da el nombre del
dilema del prisionero Albert W. Tucker, matem atico muy conocido por el
teorema de optimizaci on no lineal que descubri o conjuntamente con Harold
Kuhn invent o ese famoso ejemplo que ha hecho correr tanta tinta.
La historia que se narra en el dilema del prisionero es como sigue: Dos
hombres cometen un delito, por ejemplo un asalto a mano armada. Cuan-
do son detenidos, resulta que la polica no puede probar que el asalto fue
cometido por los 2 prisioneros, necesita la confesi on de alguno de ellos, para
lograrlo. S olo los podr a acusar de portar armas prohibidas si los dos se nie-
gan a confesar. Separando a los dos prisioneros, la polica les plantea, a cada
uno de ellos, el dilema expresado en la siguiente matriz:
confesar no confesar
confesar (10 a nos, 10 a nos) (libre, 20 a nos)
no confesar (20 a no, libre) (2 a nos, 2 a nos)
Supongamos que antes de ser aprehendidos, sintiendose cercados, los dos
hombres deciden actuar coordinadamente y escoger alguna de las parejas de
acciones posibles. Cu al ser a esa pareja? Cumplir an lo acordado? No cabe
duda de que podramos abordar la situaci on con dos enfoques distintos;
correspondiendo a cada uno un concepto de soluci on del juego. El primero
consiste en suponer que existe una fuerza exterior capaz de hacer cumplir
el acuerdo. Por ejemplo, una banda a la que pertenecieran ambos y cuyo
principio moral fundamental, siempre cumplido, fuera que los traidores que
violan los acuerdos morir an. Es obvio que la soluci on de ese juego, es decir
el acuerdo al que llegaran los jugadores, sera que ninguno de ellos confe-
sara, y ambos lo cumpliran, pues estaran seguros de la acci on del otro.
Entonces cada uno pasara dos a nos en la c arcel. En el segundo enfoque,
los participantes tienen la libertad de violar los acuerdos sin recibir castigo
alguno. Seguramente, en este caso, los dos hombres llegaran al acuerdo de
que ninguno confesara y quiz a juraran con sangre que nada en el mundo
hara que violasen ese acuerdo. Pero es f acil darse cuenta de que a la hora
de la verdad los dos lo traicionaran. El primer enfoque es el de los juegos
ix
x Introducci on
cooperativos, el segundo el de los juegos no cooperativos. Es decir, en el
primero, es como si los jugadores rmaran un contrato ante una autoridad
externa que obliga a su cumplimiento, so pena de alg un castigo que est a im-
plcito en el modelo. En el segundo, no existe nada externo al conicto y
nadie est a obligado a cumplir ning un acuerdo previo.
En el dilema del prisionero, con el enfoque no cooperativo, la pareja de
acciones (confesar, confesar) es la ley del juego. Dicha pareja es lo que
se llama un equilibrio de Nash del juego. Cada uno de estos equilibrios se
puede pensar como un acuerdo entre todos los jugadores para decidir lo que
elegir a cada uno de ellos, con la propiedad adicional de que si el jugador j
abandona el acuerdo, mientras los dem as lo respetan, no lograr a j mejorar
su pago. Sobre este concepto ha girado todo el desarrollo posterior a Nash de
los juegos no cooperativos. Por ejemplo, John Harsanyi y Reinhard Selten
realizaron un enorme trabajo sobre criterios de selecci on de los equilibrios
de Nash. Establecieron entre otros conceptos ligados a estos criterios, el
de equilibrio dominante por riesgo, el de equilibrio de Nash perfecto en
subjuegos y los de equilibrios bayesianos y de bayesiano perfecto.
Como un reconocimiento a las s olidas piedras que pusieron para el de-
sarrollo de la teora de juegos y con este del de la economa, Nash, Harsanyi
y Selten recibieron conjuntamente el Premio Nobel de economa en 1994.
Hemos insistido en que la teora de juegos no cooperativos pretende pre-
scindir de fuertes supuestos de racionalidad y, sin embargo, los equilibrios
de Nash los necesitan, sobre todo en lo referente al conocimiento que deben
poseer los jugadores, lo que podra quitarle realidad e interes al concepto.
Este problema desaparece, en distintos tratamientos modernos, en particular
en el de los juegos evolutivos, en los cu ales un mismo conicto es enfrenta-
do repetidamente por grandes poblaciones, cuyos miembros est an llenos de
limitaciones, miopas, inercias y cometen errores. Se establecen relaciones
entre los patrones de conducta recurrentes o estables de estos procesos y los
equilibrios de Nash. Es interesante mencionar que este tratamiento de los
juegos evolutivos se inici o con los trabajos del bi ologo Maynard Smith para
elaborar modelos sobre la evoluci on de las especies. Desde la biologa, estos
juegos pasaron a ser un interesante instrumento de an alisis de la problem a-
tica social, por ejemplo, del establecimiento de convenciones, instituciones,
concepciones eticas, etc.
Hoy parecieran empezar a comprobarse las previsiones de von Neumann,
en el sentido de que la teora de juegos sera la matem atica apropiada para
el an alisis econ omico (poltico, social, etc.) Proliferan los libros de teora
econ omica en donde el instrumento de an alisis es la teora de juegos y
hay una enorme cantidad de libros con aplicaciones de los juegos a prob-
x
Introducci on xi
lemas econ omicos, polticos y sociales. Pero esto no fue tan inmediato como
se hubiera supuesto en los fructferos a nos que siguieron a la aparici on de
Theory of Games and Economic Behavior en 1944. En la decada de los
50 y los primeros de la de los 60 del siglo pasado se sentaron las bases
para la fundamentaci on de la teora, se se nalaron las rutas m as importantes
para el desarrollo de su investigaci on y se escribieron libros que son ya los
cl asicos del campo como el de Thomas Schelling The Strategy of Conict
o el de Duncan Luce y Howard Raia Games and Decisions. Muchos de
los m as reconocidos te oricos de los juegos empezaron a trabajar en esas
decadas. Adem as de los ya mencionados, von Neumann, Nash, Harsanyi,
Selten, Shelling, Luce y Raia, est an nombres de la talla de Harold Kuhn,
Robert Aumann, Lloyd Shapley, David Gale, Martin Shubik , Gerard De-
breu y Herbert Scarf entre muchos otros.
Los a nos nales de los 60 y la decada de los 70 fueron, en cierto modo, de-
cepcionantes. Aunque no estuvieron exentos de resultados muy importantes,
pareci o que la teora de juegos no cumpla todas las expectativas que haba
despertado pues no daba muchos frutos para el an alisis te orico y pr actico
de los problemas sociales. Desde nuestro muy personal punto de vista, sin
lugar a dudas parcial, esto se debi o a que los te oricos se centraron casi exclu-
sivamente en los juegos cooperativos que no resultan, tambien seg un nues-
tra opini on, tan adecuados para estudiar las leyes que rigen los fen omenos
sociales. Desde mediados de los 80, la teora ha retomado ampliamente a
los juegos no cooperativos y se ha fortalecido su inuencia en las ciencias
sociales, particularmente en la economa. Los premios Nobel de economa
otorgados a Nash, Harsanyi y Selten en 1994 y a Schelling y Aumann en
2005 son un reconocimiento de esta potencia. Uno de los te oricos actuales
m as interesantes, Ken Binmore, notable no s olo por su trabajo en la teora
de juegos misma, sino por su trabajo los oco sobre ella, asegura que la
teora econ omica moderna y la teora de juegos son una y la misma cosa.
Este texto est a dedicado a los juegos no cooperativos y el equilibrio de
Nash es su protagonista principal. Vamos teniendo, a lo largo del libro, dis-
tintos acercamientos a el, lo estudiamos desde varios puntos de vista: cuan-
do los jugadores s olo juegan una vez y se tienen que limitar a las llamadas
estrategias puras, cuando pueden combinar dichas estrategias, cu ando el
juego se repite a lo largo del tiempo, etc. Nos preguntamos, por ejemplo, si
personas con muchas limitaciones de racionalidad e informaci on que est an
aprendiendo a comportarse dentro de un conicto, usando su propia experi-
encia, llegaran necesariamente a un equilibrio de Nash. En caso armativo,
a cu al de ellos? Y la sociedad en su conjunto, juega en equilibrios de
Nash? A traves de muchos ejemplos, inspirados y adaptados de textos cuyas
xi
xii Introducci on
referencias se pueden encontrar en la bibliografa, queremos hacer sentir la
fuerza de los juegos no cooperativos y del equilibrio de Nash para ayudar a
entender los conictos humanos de la m as diversa ndole.
xii
Parte I
Modelos de juegos no
cooperativos
1
Captulo 1
Juegos Rectangulares
1.1. Presentaci on del modelo
Existen dos tipos de modelos para los juegos no cooperativos, el de los
llamados juegos rectangulares o estrategicos y el de los juegos extensivos. En
este captulo nos referiremos al primero. Los juegos rectangulares o estrategi-
cos resultan m as f aciles de denir que los extensivos, pero hacer un modelo
de este tipo sobre un conicto real es m as difcil que hacer uno extensivo.
Los ejemplos que aparecieron en la introducci on, el dilema del prisionero y
la competencia potencial entre dos empresas, son modelos rectangulares o
estrategicos.
Para establecer uno de estos modelos rectangulares para un conicto
dado, tenemos que determinar quienes son los principales protagonistas en
este, que objetivos persiguen ellos, cu al es el conjunto de decisiones que tiene
cada uno y, nalmente, que resultado se obtendr a despues de que cada uno,
en forma simult anea, ha escogido una de sus posibles decisiones. Todo esto,
si el conicto es sucientemente complicado, no es tarea f acil.
Supongamos que pretendemos estudiar la segunda guerra mundial, a
traves de la teora de juegos, y que queremos establecer un modelo rec-
tangular de ella. Designar, por ejemplo, a los jugadores resulta sumamente
difcil. Quiz as, podramos llegar a la conclusi on de que para modelar los
rasgos esenciales del desarrollo de la guerra, sera suciente considerar s olo
a los gobiernos de las potencias mundiales, o a los bloques que establecieron
entre ellos. Pero no cabe duda que tambien fue importante, para entender
lo que ocurri o, la elecci on que tomaron los gobiernos de los pases invadi-
dos, si colaboraron o no con el invasor alem an, o la decisi on de millones
de personas de organizar la resistencia contra los ocupantes. Todava m as
3
4 Juegos rectangulares
complicadas son preguntas como cu ales conjuntos de decisiones contienen
todas las posibilidades de acci on que tuvieron los jugadores durante esos
cinco a nos? o c omo formalizar, a traves de funciones de pago, los resultados
que hubieran provocado las diversas decisiones cruzadas?
Hemos elegido un ejemplo demasiado complicado; en general, los proble-
mas abordados no lo son tanto.
Presentemos el sencillo modelo matem atico que expusimos en Miscel anea
Matem atica, en el artculo Convenir para jugar o jugar para convenir? [58],
sobre el espinoso conicto entre los hombres y las mujeres, para empezar a
discutir el problema.
Existe un famoso ejemplo de la teora de juegos que lleva el sonoro nom-
bre de La Batalla de los Sexos, lo que provoca frustraciones de todo el
que lo aborda, tanto si piensa que se le presentar a un tratamiento sobre la li-
beraci on femenina, como si le emociona enfrentarse a un modelo matem atico
de alguna secci on del Kamasutra. Y en lugar de esos temas o de alg un otro,
igual de apasionante, se encuentra con la historia de un matrimonio que
tiene un grave conicto, pues a ella le gusta el ballet, mientras que el pre-
ere el box, por lo dem as todo es simetrico y equitativo entre ellos. Tratemos
nosotros de abordar una situaci on m as cercana a nuestra idiosincrasia, pero
pensemos en que nos encontramos en el Mexico de los a nos 40 o 50 del siglo
XX, as evitaremos herir alguna susceptibilidad.
Simplicando enormemente, podemos decretar que un hombre de esa
epoca s olo tena dos pautas de conducta, entre las que podra elegir en
cada ocasi on que tuviera que enfrentarse a una mujer, seg un pensara que le
convendra una u otra. La primera de estas pautas de conducta o estrategias
sera la representada por nuestro llorado Pedro Infante, en casi cualquiera
de sus personajes, Pepe el Toro por ejemplo, macho entre los machos, nadie
como el para enamorar a las mujeres. La segunda, la de un hombre com-
prensivo y cooperador, conducta poco respetada, nos referimos a aquella
epoca claro est a!, por ello, nos cuesta trabajo encontrar un gal an de la talla
de Pedro Infante para representarla y tendremos que conformarnos con una
caricatura como la de Don Regino, el de la Familia Burr on de Gabriel Var-
gas. Es decir, cada vez que un hombre entraba en conicto con una mujer
tena que elegir la estrategia de actuar como un Pedro Infante o como un
Regino Burr on
Como es l ogico, las conductas o estrategias que cada mujer poda decidir
seguir, cuando se iba a relacionar con un hombre, se tipican con las contra-
partes. As una mujer podra decidir que le convena comportarse como una
sufrida mujer mexicana, al estilo de La Chorreada (Blanca Estela Pav on) o
4
Modelos de juegos no cooperativos 5
podra decidir actuar en forma arg uendera y rebelde como do na Borola
Burr on.
Para saber cu al es la bondad de cada estrategia, relativa a la usada por
el contrario, en el conicto en que estaran envueltos un hombre y una mu-
jer de aquellos a nos, tendramos que conocer las utilidades que el y ella
recibiran con los resultados provocados por la elecci on de cada pareja de
estrategias, una del hombre y otra la de la mujer. C omo les ira a uno que
hubiera escogido comportarse como Pepe el Toro y a una que eligi o actu-
ar como Borola, al enfrentarse?

El pasara m as de un coraje, mientras ella
sacara algunos huesos rotos, seguramente en m as de una ocasi on, cada uno
de ellos, habra pensado en cambiar de estrategia. A los que hubieran elegi-
do conductas como la de Pepe y su Chorreada, les habra ido de pelcula, el
siempre cantando y de buen humor, para ella llantos y celos, pero que cosa
no compensaba aquello de Amorcito Coraz on, yo tengo tentaci on..., en
esos momentos no se cambiara por nadie. Si a uno que quiso hacerla de don
Regino le hubiera tocado una que actuara de Chorreada, no cabe duda que
sera m as feliz que con la Borola, pero el gusanito de que las cosas le saldran
a un mejor al imitar a Pedro Infante acabara por vencerlo, mientras que a
la aspirante a Chorreada, despues de suspirar frente a las escenas rom anti-
cas de las pelculas de su dolo, llegara a la conclusi on de que cambiando
de estrategia, tendra la gran compensaci on de ser ella quien llevara los
pantalones. Por ultimo, si alguna se decidi o por hacer su santa voluntad
como do na Borola y le tocase en suerte alguien decidido a ser tan paciente
como Job o como Don Regino, ella podra hacer y deshacer a su antojo,
mientras el pensara que mejor no menearle. Pongamos n umeros que desde
nuestro punto de vista reejan la utilidad que recibiran los dos contrin-
cantes (hombre y mujer) en las diversas situaciones resultantes y, si al lector
no le satisfacen, puede probar con otros.
B Ch
P
R
_
(1, 10) (5, 2)
(0, 5) (1, 4)
_
En el modelo anterior estamos representando a las estrategias Pedro
Infante, Regino, Borola y Chorreada como P, R, B y Ch, respectivamente.
Ahora, estamos en condiciones para describir cu ales parejas de estrate-
gias son patrones de conducta estables, en este conicto. Ese tipo de cues-
tiones se abordar an en las secciones de este captulo y en todo el libro.
En una gran cantidad de conictos, econ omicos, polticos, militares, etc.,
los jugadores tienen que tomar muchas decisiones a lo largo del tiempo.
5
6 Juegos rectangulares
Algunas situaciones a las que se tendr an que enfrentar son de tipo azaroso,
no hay m as que pensar en los numerosos juegos de sal on, en que esto ocurre.
Adem as, los participantes, al tener que tomar decisiones, pueden no tener
informaci on sobre cu al es exactamente la situaci on en la que se encuen-
tran. Los modelos rectangulares dan pocos elementos para abordar todo
esto, contaremos, para ello, con los modelos extensivos que nos proveen con
m as elementos, por ello son un mejor puente con la realidad. Los modelos
rectangulares o estrategicos son, en cambio, m as adecuados para denir los
conceptos de soluci on, es en ellos, donde aparece el equilibrio de Nash.
En este captulo introduciremos las deniciones de juego rectangular
o estrategico y de equilibrio de Nash en estrategias puras, daremos varios
ejemplos y estudiaremos un tipo de estrategias, que llamamos conservadoras,
en las que cada jugador se imagina que est a solo contra el mundo. Por el
momento, unicamente trataremos las llamadas estrategias puras, con las que
s olo podemos hablar de una unica decisi on o tirada para cada jugador;
en el captulo 5, aparecer an las estrategias mixtas, con las que es posible
abordar la combinaci on de estrategias y la repetici on del conicto a lo largo
del tiempo.
1.2. Algunas deniciones
Hemos discutido en que consiste el modelo rectangular y en la intro-
ducci on presentamos dos ejemplos de este modelo y hablamos un poco del
equilibrio de Nash, pasemos, ahora, a las deniciones y posteriormente pre-
sentaremos varios ejemplos m as.
Denici on 1.2.1. Un juego rectangular consta de un conjunto N, de una
colecci on de conjuntos D
j
, uno para cada j en N, y de una colecci on de
funciones
j
, una para cada j en N, donde
j
:

jN
D
j
R.
A N le llamaremos el conjunto de jugadores, a cada D
j
el conjunto
de estrategias puras del jugador j y a
j
la funci on de pago del ju-
gador j. (N, D
j

jN
,
_

j
_
jN
) denotar a el juego que tiene el conjunto de
jugadores N, los conjuntos de estrategias puras D
j
y la funciones de pago

j
. Usaremos la letra D para denotar al producto cartesiano

jN
D
j
(igual
a D
1
D
2
... D
n
si N es nito y tiene n elementos). A los elementos de
D les llamaremos perles de estrategias puras.
6
Modelos de juegos no cooperativos 7
Denici on 1.2.2. Si N y los conjuntos D
j
son nitos, se dice que el juego
es nito.
La mayor parte de este texto trata sobre juegos nitos y siempre con-
sidera que N es nito. Frecuentemente tendremos que examinar lo que
ocurre con el pago de un jugador j, cuando habiendo escogido todas las
estrategias puras correspondientes a alg un perl de estrategias puras =
_

1
,
2
, ...,
j
, ...,
n
_
, j decide cambiar su estrategia, mientras los dem as
contin uan con las estrategias que describen el perl . Por ello resultar a util
la notaci on
_

j
_
=
_

1
,
2
, ...,
j1
,
j
,
j+1
, ...,
n
_
En muchos libros, para dicho perl, se utiliza la notaci on
_

j
,
j
_
en
vez de
_

j
_
.
Denici on 1.2.3. Se dice que

en D es un equilibrio de Nash en estrate-


gias puras (ep), si para cada jugador j en N se cumple:

j
(

)
j
_

j
_
para toda
j
en D
j
.
Si la desigualdad es estricta, se dice que

es un equilibrio estricto, es decir,


s para cada j en N,
j
(

) >
j
_

j
_
para toda
j
en D
j
.
Denici on 1.2.4. Dado un perl de estrategias en D, decimos que
j
en
D
j
es una mejor respuesta del jugador j a , si

j
_


j
_

j
_

j
_
para toda
j
en D
j
.
Adem as, decimos que
j
D
j
es una mejor respuesta estricta de j a , si

j
_


j
_

j
_

j
_
, para toda
j
en D
j
, y
j
_


j
_
>
j
( )
Es claro que

es un equilibrio de Nash (ep) si y s olo si


j
es una mejor
respuesta de j a

para toda j N.
Para los juegos bipersonales nitos resulta conveniente representar al
juego con una matriz, a cada uno de sus renglones asignarle una de las
estrategias del jugador 1, a cada una de las columnas una del jugador 2 y el
termino de la matriz correspondiente al rengl on i y a la columna j ser a el
vector (
1
(i, j),
2
(i, j)). De hecho, podemos hablar de dos matrices de pago,
la del jugador 1, (
1
(i, j)) y la del jugador 2, (
2
(i, j)), por eso, tambien se
llaman juegos bimatriciales. En esta forma fueron presentados los ejemplos
7
8 Juegos rectangulares
de juegos rectangulares en la introducci on. Es de esta representaci on de
donde el modelo adquiere el nombre de juego rectangular.
Las secciones 1.3, 1.4 y 1.5 se dedicar an a juegos rectangulares nitos,
en la secci on 1.6 introduciremos algunos ejemplos innitos.
Decimos que un juego es de suma cero si

jN

j
() = 0 para toda
D. Los juegos bipersonales de suma cero son los juegos m as sencillos de
analizar.
Denici on 1.2.5. Si
j
y
j
son dos estrategias puras tales que

j
_


j
_

j
_

j
_
para toda en D,
se dice que
j
est a dominada debilmente por
j
(o que
j
domina debilmente
a
j
).
j
es una estrategia no dominada, si no est a dominada por ninguna

j
en D
j
. Se dice que
j
domina estrictamente a
j
si

j
_


j
_

j
_

j
_
para toda en D y existe en D

j
_


j
_
>
j
_

j
_
.
1.3. Ejemplos
Juegos bipersonales de suma cero
Ejemplo 1.3.1. a) En febrero de 1943, el general George Churchill Kenney,
comandante en jefe de las fuerzas aereas aliadas en el sur del Pacco, tuvo
que enfrentarse al siguiente problema. Los japoneses estaban intentando
reforzar su ejercito en Nueva Guinea, y para ello tenan que decidirse por
transportar sus fuerzas por dos rutas alternativas. Podan navegar o bien
al norte de Nueva Breta na, donde el tiempo era lluvioso, o por el sur de la
misma, en el que el tiempo era generalmente bueno. En cualquiera de ambos
casos el viaje duraba tres das. El general Kenney tena que decidir d onde
deba concentrar el grueso de sus aviones de reconocimiento. Los japoneses,
por su parte, deseaban que su ota estuviese expuesta el menor tiempo
posible al bombardeo de sus enemigos. El general Kenney, por supuesto,
deseaba lo contrario. (Ejemplo del libro de Morton D. Davis Introducci on
a la Teora de Juegos [13].
8
Modelos de juegos no cooperativos 9
La matriz de pago es la siguiente:
JAPONESES
norte sur
ALIADOS
norte
sur
_
(2, 2) (2, 2)
(1, 1) (3, 3)
_
Las palabras norte y sur que etiquetan los renglones signican concentrar
el grueso de los aviones aliados en el norte y en el sur, respectivamente,
an alogamente para las columnas signican las rutas norte y sur para los
barcos japoneses. Las primeras coordenadas de los vectores en los terminos
de la matriz son los pagos para el jugador que representa a los aliados. Estos
pagos expresan el n umero de das que dicho jugador podr a bombardear a
los japoneses, si los jugadores, aliados y japoneses, escogen las estrategias
rengl on y columna que corresponden. Del mismo modo, las segundas coorde-
nadas negativas son el pago para el jugador que representa a los japoneses,
el valor absoluto de ellas signica el n umero de das en que los japoneses
ser an bombardeados cuando se eligi o la pareja de estrategias en cuesti on.
El unico equilibrio de Nash de este ejemplo es la pareja (norte,norte),
que no es un equilibrio estricto.
Juegos como este, bipersonales de suma cero y con equilibrio de Nash en
estrategias puras, son los m as sencillos. No todos los juegos bipersonales de
suma cero tienen equilibrio de Nash en estrategias puras.

Este es el caso del
juego que llamaremos del volado, ejemplo 1.3.2, aunque en este juego, un
jugador y no el azar elige la posici on de la moneda.
Ejemplo 1.3.2. Dos amigos quieren decidir a quien le toca ir a comprar los
cigarros. El primero saca una moneda y la coloca sobre la mesa cubriendola
con la mano, le pide a su compa nero que adivine cu al es la posici on en que
la puso, el aguila hacia arriba o el sol? Si es descubierto, tendr a que ir el
mismo a la compra, pero si no, le tocar a al segundo amigo. La matriz de
pago es
aguila sol
aguila
sol
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
Es f acil observar que este juego no tiene equilibrio de Nash (ep).
En los juegos bipersonales de suma cero, basta trabajar con la funci on

1
, funci on de pago del jugador 1, pues
1
=
2
, llamemos a
1
. Para
9
10 Juegos rectangulares
caracterizar los juegos bipersonales de suma cero que tienen equilibrios de
Nash (ep) denimos el concepto de punto silla de una funci on.
Denici on 1.3.1. Sean D
1
y D
2
dos conjuntos y f una funci on de valor
real, denida en D
1
D
2
. Decimos que (x

, y

) en D
1
D
2
es un punto silla
de f si se cumple que:
f(x, y

) f(x

, y

) f(x

, y) para toda x en D
1
y para toda y en D
2
.
Interpretaci on: En un juego bipersonal de suma cero, mientras el jugador
1 tratar a de maximizar su funci on de pago, el jugador tratar a de minimizar
dicha funci on.
Dada una matriz B con m renglones, n columnas y entradas reales,
decimos que la pareja (i

, j

) es un punto silla de la matriz B si b


i

j
es el
termino menor de su rengl on y el mayor de su columna. Es decir,
b
ij
b
i

j
b
i

j
para toda pareja (i, j) , con i = 1, ..., m y j = 1, ..., n.
Por ejemplo, podemos pensar en la matriz B como una funci on f denida
en
1, ..., m 1, ..., n como f (i, b) = b
ij
.
La pareja (norte,norte) es un punto silla de la matriz
norte sur
norte
sur
_
(2) (2)
(1) (3)
_
,
mientras que la matriz de pago del jugador 1 en el ejemplo del volado no
tiene punto silla.
Proposici on 1.3.2. Dado (N, D
j

jN
, ), un juego bipersonal de suma
cero (i

, j

) es un equilibrio de Nash (ep) si y s olo si es un punto silla de .


Es decir (i

, j

) es equilibrio de Nash si y s olo si es punto silla de la matriz


de pago del jugador 1.
Demostraci on. (i

, j

) es un equilibrio de Nash (ep) si y s olo si:


1. (i

, j

) (i, j

) para toda i en D
1
y
2. (i

, j

) (i

, j) para toda j en D
2
.
La desigualdad 1 es, directamente, una de las desigualdades que se tiene
que cumplir para que (i

, j

) sea punto silla de . La segunda es equivalente


a (i

, j

) (i

, j), para toda j en D


2
que es la segunda desigualdad punto
silla.
10
Modelos de juegos no cooperativos 11
Juegos Simetricos 2 2
Los juegos simetricos son aquellos para los que los jugadores pueden
cambiar sus papeles unos por otros. Los m as sencillos de todos son los de
dos jugadores, cada uno con dos estrategias, su matriz de pagos es de la
forma:
1 2
1
2
_
(d, d) (e, f)
(f, e) (g, g)
_
Si suponemos que d ,= f y e ,= g, todos los equilibrios de Nash (ep) son
estrictos y tenemos tres casos:
i) (d f)(g e) < 0. Tendramos dos subcasos. En el primero, d > f
y e > g, entonces (1, 1) es el unico equilibrio de Nash (ep) del juego. En el
segundo, f > d y g > e, entonces (2, 2) es el unico equilibrio de Nash (ep).
ii) (d f)(g e) > 0 y, adem as, d > f y g > e, entonces el juego tiene
dos equilibrios de Nash en estrategias puras, (1, 1) y (2, 2).
iii) (d f)(g e) > 0 y, adem as, d < f y g < e, tambien el juego tiene
dos equilibrios en estrategias puras que son (1, 2) y (2, 1).
En estos juegos es frecuente interpretar una de las estrategias como agre-
siva (halc on) o egosta, y a la otra como conciliadora (paloma) o solidaria.
Demos algunos ejemplos.
Ejemplo 1.3.3. a) Otro ejemplo tipo dilema del prisionero. Dos empresas,
N = E
1
, E
2
, fabricantes de aparatos electrodomesticos han competido por
el mercado de esos productos durante varios a nos. Ambas han considerado
siempre el mismo conjunto de opciones para cada uno de sus productos, a
saber,
D
j
= caro y durable (calidad), barato y desechable (baratija) .
Supongamos que la matriz de pago siguiente expresa la experiencia de
ganancias promedio.
calidad baratija
calidad
baratija
_
(100, 100) (10, 200)
(200, 10) (50, 50)
_
En este caso, (baratija, baratija) es el unico equilibrio de Nash del juego.
Este juego simetrico es del tipo i.
11
12 Juegos rectangulares
b) Dos pases petroleros tienen la opci on de ponerse de acuerdo para re-
ducir su plataforma de producci on (reducir) o mantener una alta producci on
(no reducir). Si los dos deciden reducir la cantidad de petr oleo que producen,
entonces el precio del hidrocarburo subir a, beneci andolos a ambos. Si, por
el contrario, los dos permanecen con la misma producci on, seguir a la ten-
dencia a la baja del precio. Tambien puede ocurrir que uno de ellos reduzca
su producci on y el otro no, entonces, el precio se estacar a y el que no ha ba-
jado la cantidad tendr a mayores benecios. En la siguiente matriz se asignan
pagos a los jugadores para expresar lo relatado anteriormente.
reducir no reducir
reducir
no reducir
_
(2, 2) (2, 1)
(1, 2) (0, 0)
_
En este ejemplo del tipo ii, los equilibrios de Nash en estrategias puras
son (reducir, reducir) y (no reducir, no reducir). A este tipo de juegos se les
llama juegos de coordinaci on. En este juego especco, el primer equilibrio
tiene la ventaja de que otorga, a cada uno, una mayor ganancia, pero la
desventaja de que ambos pases arriesgan obtener un pago muy malo si el
otro pas no reduce su producci on.
c) Dos hombres que viven en el mismo edicio salen todos los das, de
sus respectivos hogares, a la misma hora y los dos con una gran prisa, pues
est an a punto de llegar tarde a trabajar. Ambos tienen que sacar el coche
del garaje com un y no pueden hacerlo simult aneamente. As, que cada da
tienen que decidir si preeren aguantar las ironas y reconvenciones de sus
jefes, por llegar tarde a la ocina debido a sus cortesas con el vecino, o
sufrir las maldiciones de dicho vecino si tratan de salir por delante, a como
de lugar. Si los dos adoptan esa actitud descortes habr a una reyerta segura
que signica mayor perdida de tiempo.
cort es descort es
cort es
descort es
_
(1, 1) (0, 2)
(2, 0) (5, 5)
_
En este caso, los equilibrios de Nash en estrategias puras son:
(cort es, descort es) y
(descort es, cort es).
Este es un ejemplo de tipo iii. A cada uno de los dos jugadores le con-
viene uno de los equilibrios y no existen equilibrios en estrategias puras que
12
Modelos de juegos no cooperativos 13
sean simetricos como en los otros dos casos. En juegos an alogos, pero no
simetricos, por ejemplo, el conicto entre el hombre y la mujer que apare-
ci o en la secci on 1.1, ocurre lo mismo. Pero, en el caso de los vecinos, ambos
jugadores tienen igual peso, por lo que no hay criterio para pensar que a la
larga se impondr a uno u otro. En cambio, es natural esperar que el equilibrio
que le conviene al hombre es el que se impondr a como costumbre.
Otros Ejemplos Bipersonales que no son 2 2.
Ejemplo 1.3.4. El juego de las empresas que apareci o en la introducci on.
entrar no entrar
regalar muestras
publicidad escrita
publicidad en radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(45, 10) (55, 0)
_
_
El juego no tiene equilibrios de Nash en estrategias puras.
Ejemplo 1.3.5. El baile de Shapley
a b c d
a
b
c
d
_
_
_
_
(2, 1) (0, 0) (1, 2) (1, 1)
(1, 2) (2, 1) (0, 0) (1, 1)
(0, 0) (1, 2) (2, 1) (1, 1)
(1, 1) (1, 1) (1, 1) (1, 1)
_
_
_
_

Este juego tiene un unico equilibrio de Nash que es (d, d) y no es estricto.


La caracterstica de este juego radica en que si los jugadores eligen un perl
que no es (d, d) y consideramos un proceso en el que, en cada paso, se permite
a uno s olo de los jugadores cambiar su estrategia por otra que optimice su
pago, se produce un ciclo que Shapley apreci o como un baile.
Juegos n-Personales
Hasta el momento, s olo hemos mostrado ejemplos bipersonales, ahora
revisemos algunos ejemplos de m as jugadores.
Ejemplo 1.3.6 (El ligue de Nash (un problema machista)). Re-
cuerdan la pelcula Mente brillante? En una parte de esta, aparece Nash,
con otros tres estudiantes amigos suyos, sentados en la mesa de un bar.
En otra mesa cercana, se encuentran cinco bellas chicas, entre ellas una
13
14 Juegos rectangulares
Rubia espectacular que tiene el defecto de ser muy acaparadora. Cada
estudiante quiere ligar a una chica, aunque todos preeren a la rubia. El
comportamiento de cada chica, diferente de la Rubia, consiste en que, si
varios de los estudiantes le piden salir con alguno de ellos, realizar a una
rifa para elegir al gal an. En cambio, la Rubia s olo har a una rifa, si los 4
estudiantes le piden salir, si sus pretendientes son menos que 4, rechazar a a
todos.
Los jugadores son los estudiantes, las chicas son los premios, la rubia
es el premio mayor. Tenemos el juego siguiente: (N, D
j

jN
, ), donde
N = E
1
, E
2
, E
3
, E
4
, D
j
= Rubia, ch
1
, ch
2
, ch
3
, ch
4

Si para i D
j
, n
i
es el n umero de estudiantes que eligieron a la chica
i, la funci on de pago del jugador j se expresa con la funci on
j
tal que
D,

j
() =
_
_
_
1/n
ch
k
si
j
= ch
k
0 si
j
= Rubia y n
Rubia
< 4
1/2 si
j
= Rubia y n
Rubia
= 4
En la pelcula, uno de los estudiantes arma que Adam Smith les acon-
sejara que todos fueran a tratar de ligarse a la Rubia porque los mejores
resultados se obtienen con la libre competencia. Nash contrapone la idea de
que cada uno de ellos elija a una chicas diferente y que no sea la rubia. Los
Equilibrios de Nash del juego son precisamente los perles recomendados
por este, seg un la pelcula.
Dilemas del Prisionero n-Personales
G. Hardin en su artculo The tragedy of the Commons de 1968 [24]
generaliz o, para cualquier n umero de jugadores, el dilema del prisionero de
Tucker. Esta generalizaci on ha sido muy importante, tanto en la motivaci on
del desarrollo de la teora, como para modelar y analizar verdaderas tragedias
que provocamos los humanos en nuestro pobre mundo.
Esta clase de conictos son omnipresentes en la sociedad en que vivi-
mos y se caracterizan porque, en ellos, cada jugador tiene dos estrategias,
llamemoslas, por el momento, Egosta y Solidaria. La estrategia Egosta es
dominante estrictamente, es decir, para cada perl de estrategias , el ju-
gador j obtendr a un pago mayor con en el perl ( [ Egosta) y, sin embargo,
el pago obtenido por cada jugador cuando todos escogen Egosta es menor
que cuando todos escogen Solidario.
14
Modelos de juegos no cooperativos 15
Es en este dilema donde se enfrentan, m as claramente, las concepciones
cl asicas de la sociedad de Adam Smith y tambien de los neocl asicos y la
de los juegos no cooperativos. Ambas concepciones consideran a la sociedad
como una suma de individuos egostas buscando su propio interes, sin preo-
cuparse del bien com un y, cuando llegan a construirlo, sera una resultante
no buscada de las decisiones egostas.
Sin embargo, en los juegos no cooperativos la resultante de las aciones
colectivas puede construir la desgracia com un, cosa que no podan concebir
los cl asicos ni lo quieren hacer los neocl asicos.
Veamos algunos ejemplos de este tipo de juegos.
Ejemplo 1.3.7. a) Supongamos una gran ciudad, como la de Mexico, y
discutamos una posible explicaci on acerca de uno de sus problemas de con-
taminaci on ambiental y de congestionamiento vehicular. Para ello, pensemos
en la parte de su poblaci on que posee autom ovil. Es decir,
N = habitante de la ciudad de M exico [posee un autom ovil . Cada
uno de ellos tiene que decidir si se transporta casi siempre en su autom ovil
o trata de limitar el uso de este y utilizar el transporte p ublico.
D
j
= uso intensivo del autom ovil, uso de transporte p ublico.
Si una gran cantidad de personas utilizan intensivamente el auto, el
tr ansito se vuelve insoportable y la contaminaci on de la atm osfera se con-
vierte en da nina para la salud.
Denotemos como r a este tope del n umero de auto dependientes, donde
r es un n umero positivo menor que n, y sea un perl de estrategias y k

el n umero de los que usan intensivamente el auto de acuerdo .

j
() =
_

_
50 si k

< r y
j
= transporte p ublico
100 si k

r y
j
= transporte p ublico
100 si k

r y
j
= auto
50 si k

> r y
j
= auto
El unico Equilibrio de Nash del juego, que por cierto es estricto, es (au-
to,auto,. . . ,auto). En el equilibrio, cada uno de los jugadores gana 50, mien-
tras que en (transporte p ublico, transporte p ublico, . . . , transporte p ublico)
gana 50. Logra este dilema del prisionero captar aspectos esenciales del
problema? Nosotros creemos que s.
b) El juego del parasitismo social. Otros dilemas del prisionero con-
sisten en que alg un tipo de comunidad se propone realizar, con la coopera-
ci on de todos, alg un proyecto para mejorar la utilidad de cada miembro.
Por ejemplo, pensemos en un barrio en el que no hay una escuela cercana
y las autoridades se encargar an de establecerla si los vecinos construyen el
15
16 Juegos rectangulares
edicio. Por cada familia que coopera, aumenta en unidades de utilidad,
el benecio recibido por cada familia, de parte de la escuela, menor que
1, pero mayor que 1/n, donde n es el tama no del grupo. Cooperar con la
construcci on implica la perdida de una unidad de utilidad. Por supuesto,
la cooperaci on es voluntaria, pero la escuela estar a abierta para los hijos de
todos, hayan cooperado o no. La funci on de pago para cada familia es como
sigue:

j
() =
_
+ (k

+ 1) 1 si
j
= Cooperar,
+k

si
j
= No Cooperar,
k

es el n umero de miembros de la comunidad que escogieron cooperar de


acuerdo a .
De nuevo el unico equilibrio de Nash es
(No Cooperar, ..., No Cooperar). Es decir, no se construir a la escuela.
Juegos de Mayora
Ejemplo 1.3.8. a) Haciendo m as exibles las reglas de trabajo (mo-
delo de Vega Redondo [52] modicado). Supongamos que en una planta
industrial, existe la tradici on de que sus obreros realizan funciones muy
bien establecidas por un contrato de trabajo. La empresa quiere cambiar
las cosas y poder exibilizar la forma de trabajo, cambiando las funciones
de los obreros, seg un necesidades de la producci on. Para alentar el cambio,
dise na un sistema de premios para los obreros que acepten la exibilizaci on y
aumenten su productividad. La aceptaci on del sistema debe ser individual,
es decir cada obrero puede resistirse a dicho cambio. Si menos de q obreros
aceptan ser exibles, no se podr a legitimar el sistema de premios, n q > 1,
las funciones de todos seguir an rigiendose por el contrato. En cualquier caso,
la cooperaci on con la empresa, aceptando cambiar las funciones de trabajo
implica un esfuerzo que descuenta c unidades a la utilidad recibida.
N = obreros de una planta industrial.
D
j
= flexibiliza, resiste.

j
() =
_
_
_
0 si
j
= resiste
x c > 0 si
j
= flexibiliza y n
f
q
c < 0 si
j
= flexibiliza y n
f
< q
n
f
es el n umero de trabajadores que, de acuerdo a , acepta exibilizar sus
funciones.
16
Modelos de juegos no cooperativos 17
Este juego tiene dos equilibrios de Nash (ep):
(flexibiliza, flexibiliza, . . . , flexibiliza) y
(resiste, resiste, ..., resiste).
Depende de los valores de x, c y q, cu al de estos equilibrios ser a el que se
imponga como ley del conicto.
b) El juego de la Cargada. Los miembros de un partido poltico tienen
que escoger, ellos mismos, sin intervenci on de alg un dedo privilegiado, al
candidato presidencial que lanzar an en las pr oximas elecciones. El conjun-
to de aspirantes, de donde tiene que salir el candidato es C
1
, C
2
, ..., C
r
.
Los miembros del partido pueden decidir abstenci on, es decir, no manifestar
p ublicamente sus preferencias. Si un militante no apoya a nadie, no ob-
tendr a ni benecios, ni castigos; si, por el contrario, apoya a alguno de los
aspirantes, puede obtener un buen hueso, si logra jug arsela con el bueno
o quiz a tendr a que olvidarse de la poltica durante los pr oximos seis a nos,
si su visi on no fue sucientemente buena y apoy o a un perdedor. Podramos
decir que la funci on , denida a continuaci on, esquematiza la situaci on
descrita.

j
() =
_

_
0 si
j
= abstenci on,
0 si
j
= C
k
y no hay mayora,
p > 0 si
j
= C
k
y C
k
tiene mayora,
q < 0 si
j
= C
k
y otro C
l
distinto tiene mayora.
Los equilibrios de Nash en estrategias puras son (C
k
, C
k
, ..., C
k
), para k =
1, 2, .., r. Es decir, la resultante, en este juego, es una tradicional cargada.
Cu al es el equilibrio que se lograra imponer depende de los valores de p, q y
n. Si cambi aramos ligeramente la funci on de pago exigiendo que la mayora
de un candidato s olo se reconoce cuando tiene m as de un voto, el perl en
que todos los jugadores escogieran abstenerse tambien sera equilibrio de
Nash. Este equilibrio podra llamarse el que se mueve no sale en la foto.
Los juegos de la mayora son juegos de coordinaci on, no es necesario
que estos sean simetricos en cuanto a los pagos, pero los equilibrios de Nash
si lo son pues todos los jugadores escogen la misma estrategia. Es decir, en
el equilibrio, los jugadores se coordinan.
Juegos de Concurreccia o de Ventanillas
Por ultimo, damos unos ejemplos del tipo juegos de concurrencia o
de ventanillas, en su versi on m as simple. Estos juegos los introdujo S.
17
18 Juegos rectangulares
Hern andez [27] para analizar problem atica planteada por la economa cl asica.
En ellos, los jugadores escogen formarse en alguna de las ventanillas posi-
bles, en las que hay una cantidad de dinero a repartir entre todos los que se
hayan formado en ella. Existen ejemplos, para los cu ales, algunos jugadores
pueden escoger cualquier ventanilla, mientras que los otros solo algunas de
ellas. En distintos contextos se pueden dar diversas interpretaciones de las
ventanillas.
Ejemplo 1.3.9. a) Los trabajadores (artesanos) de una ciudad tienen que
escoger a que actividad productiva se dedicar an de entre un conjunto de
posibilidades O
1
, O
2
, ..., O
r
. Ellos solo emplear an trabajo para realizar su
actividad. La demanda d
j
pesos del producto de O
j
est a determinada por
las necesidades de los habitantes y esta demanda se repartir a entre todos los
que se dedican al ocio. Es decir, si i est a entre los que eligen la estrategia
O
k
,

i
() =
d
k

k
donde
k
es el n umero de jugadores que escogi o O
k
de acuerdo a .
Si los trabajadores son 10, los ocios son 5 y las demandas en miles de
pesos son d
1
= 500, d
2
= 400, d
3
= 300, d
4
= 200, d
5
= 100, entonces los
equilibrios de Nash (ep) son todos aquellos en que cuatro jugadores escogen
el primer ocio, tres el segundo, dos el tercero, uno el cuarto y ninguno el
quinto.
b) Supongamos que para algunos ocios se necesita tener cierta prepa-
raci on o experiencia y solo algunos de los trabajadores la tienen, entonces
estos jugadores podr an escoger cualquiera de los ocios, pero los otros no.
La funci on de pago es la misma que en el ejemplo anterior.
Consideremos que, como en dicho ejemplo, existen 10 trabajadores y 5
ocios, y que las demandas d
i
tienen el mismo valor. Pero, pensemos que para
los ocios O
1
, O
2
y O
3
se necesita tener por lo menos 10 a nos de experiencia
y solamente los trabajadores 1 y 2 la tienen. Para los otros dos ocios no es
necesaria ninguna experiencia. Entonces, los conjuntos de estrategias puras
de este juego son D
1
= D
2
= O
1
, O
2
, O
3
, O
4
, O
5
y D
j
= O
4
, O
5
para
j =3, 4, ..., 10.
Todos los equilibrios de Nash (ep) son tales que, los trabajadores 1 y 2
escogen el primer o el segundo ocio, pero, no los dos el mismo. Para los
restantes jugadores, unos equilibrios son tales que seis escogen el cuarto o-
cio, mientras que los dos ultimos el quinto, mientras que en otros equilibrios,
de los ocho trabajadores distintos a 1 y a 2, cinco hombres eligen el cuarto
y tres el quinto.
18
Modelos de juegos no cooperativos 19
1.4. Estrategias puras conservadoras
Vamos a hablar, en esta secci on, de un tipo de estrategias que correspon-
den a un comportamiento que podramos llamar paranoico, pues consiste en
que un jugador supone que todos los dem as se han unido para actuar en
su contra. Estas estrategias y los pagos asociados a ellas representan lo
mejor que cada jugador puede conseguir por s mismo, contando s olo con
sus propias fuerzas.
Uno de los enfoques para abordar la problem atica, sera partir de todos
los pagos que el jugador j tiene seguros, pr acticamente en el bolsillo. Es de-
cir, aquellos pagos para los que j tiene una estrategia con la que, los dem as
jugadores, no pueden impedirle ganar por lo menos el pago en cuesti on.
Despues, j buscara, si existe, la m as grande de todas esas cantidades. For-
malmente:
Denici on 1.4.1. Se dice que el n umero real x es asegurable en estrategias
puras(ep) para el jugador j, si existe
j
D
j
, tal que
j
_


j
_
x para
toda D.
En el ejemplo 1.3.3, 39 es una cantidad asegurable para la empresa que
monopolizaba, hasta ese momento, el producto, porque si escoge la estrategia
de realizar publicidad en radio y tv, no importa lo que escoja el competidor
potencial, M ganar a por lo menos 39. En el juego 1.3.6 a, -1 es asegurable
para cualquier capitalista, pues basta que uno de ellos saque su capital,
para que gane m as que -1, cualesquiera que sean las decisiones de los dem as.
Es claro que en ambos juegos, los jugadores pueden asegurar cantidades
mayores.
Consideramos, ahora,

A

j
= x R[x asegurable para j .
Proposici on 1.4.2. Si el juego (N, D
j
, ) es nito, entonces, para toda
j N, existe el supremo de

A

j
.
Demostraci on. Sea m
j
= mn
(|
j
)

j
_

j
_
. m
j
existe, pues el conjunto de
valores que toma
j
es nito. Asimismo, m
j
est a en

A

j
, pues para cualquier

j
D
j
,
j
_

j
_
m
j
. Por lo que

A

j
,= .
Por otro lado, m ax
j
= m ax
(|
j
)

j
_

j
_
tambien existe.
Para toda x

A

j
, existe
j
D
j
tal que
j
_


j
_
x.
Pero, m ax
j

j
_


j
_
x.
19
20 Juegos rectangulares
Es decir,

A

j
es un subconjunto de reales no vaco y acotado superior-
mente, por lo que tiene supremo.
Denotaremos como v

j
al supremo de

A

j
. Se puede decir que j juega
conservadoramente en estrategias puras, si trata de que su pago este lo m as
cerca posible de ese n umero.
Otra forma de introducir la conducta conservadora o paranoica de j
es considerar que este siempre piensa en lo peor que pudiera ocurrirle. Es
decir, ante cada una de sus estrategias, j piensa en el pago menor que puede
recibir, cuando escoge dicha estrategia y, por aquello de que de los males,
el menos, decide inclinarse por la estrategia que le da el m as alto de los
peores pagos. Formalmente:
Dado
j
D
j
, el conjunto
_
x R

j
_


j
_
= x
_
es nito, entonces,
existe mn
([b
j
)

j
_


j
_
.
Por lo tanto, podemos construir h

j
:D
j
R, denida como
h

j
_

j
_
= mn
([b
j
)

j
_


j
_
.
Es claro que h

j
alcanza su m aximo en D
j
, pues este conjunto es nito. A
este m aximo lo denotamos como m ax
b
j
D
j
mn
D

j
.
Proposici on 1.4.3. v

j
= m ax
b
j
D
j
mn
D

j
Demostraci on. Sea x

A

j
, entonces existe
j
tal que
j
_


j
_
x, para
toda en D.
Tenemos que mn
([b
j
)

j
_


j
_
x.
Pero, m ax

j
D
j
mn
([b
j
)

j
_

j
_
mn
([b
j
)

j
_


j
_
x.
Es decir, m ax

j
D
j
mn
([b
j
)

j
_

j
_
es una cota superior de

A

j
.
Por lo que se cumple que m ax

j
D
j
mn
([b
j
)

j
_

j
_
v

j
.
Por otro lado, existe
j
D
j
, tal que

j
_


j
_
= mn
([b
j
)

j
_


j
_
= m ax

j
D
j
mn
([b
j
)

j
_

j
_
.
20
Modelos de juegos no cooperativos 21
Es decir, m ax

j
D
j
mn
([b
j
)

j
_

j
_

j
_


j
_
, para toda D. Lo que sig-
nica que m ax

j
D
j
mn
([b
j
)

j
_

j
_

j
.
Pero, entonces, m ax

j
D
j
mn
([b
j
)

j
_

j
_
v

j
.
Por lo tanto, m ax

j
D
j
mn
([b
j
)

j
_

j
_
= v

j
.
Diremos que
j
es una estrategia conservadora (ep) para el ju-
gador j, si este gana por lo menos v

j
, cuando escoge
j
. A v

j
se le llamar a el
m aximo asegurable para el jugador j en estrategias puras (ep). En el proceso
de la prueba se ha demostrado que existen estrategias conservadoras (ep),
Para cualquier juego y para cada jugador.
Las dos formas de acercarnos a las estrategias conservadoras llevan a lo
mismo y la igualdad 1.4.3 permite que v

j
se calcule f acilmente.
Los aliados y los japoneses, en el conicto planteado en 1.3.1 a, jugar an
conservadoramente escogiendo la ruta Norte y el m aximo pago que los alia-
dos pueden asegurar, si el juego se realiza una sola vez, es el de bombardear
durante dos das a sus enemigos. Ser bombardeados durante dos das es el
m aximo pago que pueden asegurar los japoneses. En el volado (1.3.1 b),
todas las estrategias de los jugadores son conservadoras y lo m aximo que
puede asegurar en estrategias puras, cada uno de los dos jugadores, es -1.
La empresa monop olica de 1.3.3 con s olo sus fuerzas asegura como m aximo
40, con su estrategia de hacer publicidad en radio y tv que es conservadora
(ep). Por su parte, la empresa competidora asegura obtener 0 cuando no
entra a la competencia y es lo m aximo que puede asegurar, cuando se limita
a estrategias puras. Todos los artesanos (1.3.7 a) actuar an conservadora-
mente eligiendo el ocio cuyo producto tiene mayor demanda, y cada uno
obtendr a un pago de 50 como m aximo asegurable.
En los ejemplos de 1.3, se puede apreciar que los jugadores reciben en
un equilibrio de Nash (e.p) al menos v

j
. Esto es cierto para cualquier juego.
Proposici on 1.4.4. Si

es un equilibrio de Nash (ep), entonces

j
(

) v

j
.
Demostraci on. Sea
j
una estrategia conservadora del jugador j,

j
_


j
_
v

j
,
para toda .
21
22 Juegos rectangulares
Como

es un equilibrio de Nash en estrategias puras,

j
(

)
j
_

j
_
, para toda
j
D
j
.
En particular,
j
(

)
j
_


j
_
. Y, por lo tanto,
j
(

) v

j
.
1.5. La paranoia colectiva puede ser soluci on
En los juegos bipersonales de suma cero, existen intereses antag onicos
entre los participantes. No es una actitud que amerite consultar a un siquia-
tra, el que un jugador que participa en uno de estos juegos piense que su
oponente trata de imponerle el peor pago posible. Intuitivamente, sabemos
que, en ellos, una forma conservadora de actuar es buena para los dos
jugadores, pero veremos que esto no siempre se puede establecer, cuando el
juego se realiza en estrategias puras. Por otro lado, estrategias que parten de
que un jugador piensa que todo el mundo se ha puesto en su contra pueden
ser las adecuadas para otros juegos, en donde tambien existe antagonismo
entre los competidores, pero este no es tan evidente. En esta secci on, carac-
terizamos este tipo de juegos y estudiamos la relaci on entre sus equilibrios
de Nash y sus estrategias conservadoras, ambos en estrategias puras.
Para (N, D
j

jN
, ), un juego arbitrario, denotamos como Max a la
m axima ganancia conjunta. Es decir, Max = m ax
D

jN

j
().
Si cada jugador j escoge una estrategia conservadora
j
, la suma de las
ganancias de todos no rebasa a Max. Esto es,

jN

j
_

1
,
2
, ...,
n
_
Max.
Pero, entonces, tenemos la proposici on:
Proposici on 1.5.1. Para cualquier juego (N, D
j

jN
, ) se cumple que

jN
v

j
Max. Si el juego es bipersonal de suma cero, la desigualdad
signica que v

1
v

2
.
Esta desigualdad induce una divisi on entre los juegos que resulta muy im-
portante para la problem atica que queremos estudiar; los juegos que cumplen

jN
v

j
= Max y los que cumplen

jN
v

j
< Max. En el primer caso, cuando

jN
v

j
= Max, los jugadores, actuando cada uno con sus propias fuerzas,
logran repartirse Max. Ninguno de ellos, por ejemplo j, puede esperar lle-
gar a alg un pacto con otros jugadores que le permita obtener un pago g
j
22
Modelos de juegos no cooperativos 23
mayor que v

j
. Para que esto pudiera ocurrir, alg un jugador k, tendra que
ganar menos que v

k
y k no lo permitira. Por ello, es obvio que, en estas
situaciones, los jugadores tienen intereses contrapuestos.
Denici on 1.5.2. Decimos que (N, D
j

jN
, ) es un juego antag onico en
estrategias puras, si

jN
v

j
= Max.
El juego 1.3.1 a), Aliados contra Japoneses, es antag onico (ep), puesto
que en 1.3.1 a), el m aximo asegurable para los aliados es 2, mientras que
para los japoneses es -2. Por otro lado, como el juego es de suma cero, Max
es cero. Ya se haba observado que (norte, norte) es un equilibrio de Nash y
un punto silla de la funci on de pago de los aliados, es claro que tambien es
una pareja de estrategias puras conservadoras.
Sin embargo, no se cumple que todos los juegos bipersonales de suma cero
son antag onicos en estrategias puras. As, en el juego del volado, v

1
= v

2
=
1, mientras que Max es 0. Recordemos que mientras las dos estrategias,
aguila y sol, son conservadoras para los dos jugadores, el juego no tiene
equilibrio de Nash (ep), ni la funci on de pago del primer jugador tiene punto
silla.
Ejemplo 1.5.1.
1 2 3 4
1
2
3
_
_
(3, 6) (5, 2) (4, 1) (7, 1)
(1, 7) (1, 3) (5, 2) (4, 2)
(0, 8) (4, 1) (5, 1) (1, 1)
_
_
En este juego, v

1
= 3, v

2
= 6 y Max = 9. (1, 1) es un equilibrio de Nash
(ep) y un punto silla de la matriz de pago del jugador 1 y de la del jugador
2 (poniendo como renglones las estrategias de 2 y como columnas las de 1).
Adem as, (1, 1) es un perl de estrategias puras conservadoras (ep) y cada
uno de los dos jugadores obtiene su m aximo asegurable, en dicho perl. El
juego es antag onico (ep), pero no es de suma cero.
Ejemplo 1.5.2. De los juegos de ventanilla, podemos construir alguno
que sea antag onico (ep) cambiando la funci on de pago del ejemplo 1.3.7 a).
Pensemos en los 10 artesanos, con sus 5 ocios y las mismas demandas para
cada O
i
. Para j = 1, 2, . . . , 10, el conjunto de estrategias es el mismo que en
1.3.7a, es decir, el conjunto de los 5 ocios. Pero, en cambio, supongamos
que las pareja de artesanos 1 y 2, son los m as famosos y solicitados en el
23
24 Juegos rectangulares
primer ocio, la pareja 3 y 4 en el segundo. En el tercero, cuarto y quinto lo
ser an, respectivamente, las parejas formadas por 5 y 6, 7 y 8 y 9 y 10. Esto
repercutir a en las funciones de pago que son
j
() =
_

_
d
k
2
Si j y su par escogieron O
j
.
2d
k
3
Si j escogi o O
j
, pero su par no lo hizo.
0 Si
j
= O
k
,= O
j
y los 2 expertos eligieron O
k
d
k
3n
k
()
Si
j
= O
k
,= O
j
y un experto eligi o O
k
d
k
n
k
()
Si
j
= O
k
,= O
j
y ning un experto eligi o O
k
,
donde n
k
() es el n umero de artesanos que eligieron O
k
de acuerdo a .
Observe que O
j
es el ocio en el que j es especialista.
Tenemos, entonces, que v

1
= v

2
= 250, v

3
= v

4
= 200, v

5
= v

6
= 150,
v

7
= v

8
= 100, v

9
= v

10
= 50.
Max = 1500 =
10

j=1
v

j
. Es decir, el juego es antag onico en estrategias
puras.
Si
j
es la estrategia en que j elige su especialidad, entonces j ganar a por
lo menos v

j
, independientemente de lo que hagan los dem as. Por lo que
j
es una estrategia conservadora para j.
j
_

1
,
2
, ...,
10
_
= v

j
.
Para toda j en N, si
j
distinta que
j
,
j
_

j
_
= 0.
Por lo tanto, para cada j en N,
j
(

)
j
_

j
_
para toda
j
en
D
j
. Es decir,

es equilibrio de Nash (ep).


Observamos que en estos ejemplos de juegos antag onicos hay una relaci on
entre el comportamiento conservador y los equilibrios de Nash (ep), tratare-
mos de ver que tan general es tal relaci on.
Por lo pronto, veamos que en dichos juegos, el pago de equilibrio es
el mismo que se obtiene con el comportamiento conservador de todos los
jugadores.
Proposici on 1.5.3. Sea (N, D
j

jN
, ) antag onico (ep), entonces:
a) si

D es un equilibrio de Nash (ep),


j
(

) = v

j
, para toda
j N.
b) si
j
D
j
es conservadora (ep) para cada j,
j
(

) = v

j
.
Demostraci on. Para toda j N,
j
(

) v

j
, como se demostr o en 1.4.4.
Supongamos que, para alguna k N,
k
(

) > v

k
. Entonces

jN

j
(

) >

jN
v

j
= Max.
24
Modelos de juegos no cooperativos 25
Pero

jN

j
(

) Max. Con lo que llegamos a un absurdo, es decir

j
(

) tiene que ser igual a v

j
, para toda j.
La demostraci on de que, en un perl de estrategias conservadoras, los
jugadores ganan su m aximo asegurable sigue el mismo razonamiento.
Una observaci on ante la proposici on 1.5.3 es que, para los equilibrios de
Nash (ep), es urgente ver si ellos implican un comportamiento conservador,
pues si estos perles s olo son capaces de proporcionar a cada jugador su
m aximo asegurable, pero no lo salvan del riesgo de ganar menos, entonces no
tendran interes para los involucrados en el juego, ya que eligiendo estrategias
conservadores, ellos garantizan dicho pago.
Para avanzar en el problema, nos servir a analizar primero el caso de los
juegos bipersonales de suma cero, del que ya tenemos algunos resultados.
Lo que sabemos de estos juegos es que tienen equilibrio de Nash (ep), si y
s olo si la funci on de pago del jugador 1 tiene punto silla y que una pareja de
estrategias puras es punto silla de la matriz de pago del jugador que elige
renglones, si y s olo si es equilibrio de Nash (ep). Haremos ver que, en los
juegos bipersonales de suma cero que son antag onicos, ser un punto silla de
la funci on de pago del jugador 1 es equivalente a ser una pareja de estrategias
conservadoras. Y que el que la funci on de pago del jugador 1 tenga punto
silla es equivalente a ser antag onico (ep).
Proposici on 1.5.4. Si (N = 1, 2 , D
1
, D
2
, ) es un juego bipersonal de
suma cero,
v

1
= m ax

1
D
1
mn

2
D
2

1
_

1
,
2
_
= mn

1
D
1
m ax

2
D
2

2
_

1
,
2
_
y
v

2
= m ax

2
D
2
mn

1
D
1

2
_

1
,
2
_
= mn

2
D
2
m ax

1
D
1

1
_

1
,
2
_
Demostraci on. Sea una funci on f : D R tal que alcanza un m aximo y
un mnimo en D, es conocido que:
m ax
xD
(f (x)) = mn
xD
(f (x))
y
mn
xD
(f (x)) = m ax
xD
(f (x)) .
Sabemos que v

2
= m ax

2
D
2
_
mn

1
D
1

2
_

1
,
2
_
_
y, adem as, el juego es de
suma cero, entonces
v

2
= m ax

2
D
2
_
mn

1
D
1
_

1
_

1
,
2
__
_
=
25
26 Juegos rectangulares
m ax

2
D
2
_

_
m ax

1
D
1
_

1
_

1
,
2
__
__
= mn

2
D
2
_
m ax

1
D
1

1
_

1
,
2
_
_
.
Proposici on 1.5.5. Si (N = 1, 2 , D
1
, D
2
, ) es bipersonal de suma
cero, entonces es antag onico (ep) si y s olo si la matriz A = (
1
(i, j)) tiene
punto silla. Adem as, una pareja de estrategias es punto silla de A, si y s olo
si cada una de ellas es conservadora para el jugador en cuesti on.
Demostraci on. Supongamos que (i

, j

) es punto silla de la matriz A, en-


tonces a
i j
a
i

j
a
i

j
, para cualesquiera i D
1
y j D
2
.
As a
i

j
mn
jD
2
a
i

j
m ax
iD
1
mn
jD
2
a
i j
= v

1
.
Por otro lado,
v

2
= mn
jD
2
m ax
iD
1
a
i j
m ax
iD
1
a
i j
a
i

j
v

1
.
Pero sabemos que v

2
v

1
. Por lo tanto v

2
= v

1
= a
i

j
. Por lo que
el juego es antag onico (ep).
Reinterpretando las desigualdades punto silla, a
i

j
a
i

j
para toda j,
nos dice que a
i

j
v

1
para toda j D
2
. Es decir, i

es una estrategia
conservadora para el jugador 1.
Por otro lado, a
i j
a
i

j
para toda i D
1
implica que j

es una
estrategia conservadora para el jugador 2, pues es equivalente a
a
i j
a
i

j
= v

2
para toda i D
1
.
Supongamos, ahora, que el juego es antag onico (ep), es decir v

2
= v

1
.
Sea (i

, j

) una pareja de estrategias conservadoras para 1 y 2, respectiva-


mente. Entonces, a
i

j
v

1
para toda j D
2
, y a
i j
v

2
para toda
i D
1
.
Por lo que, para toda i D
1
y para toda j D
2
,
a
i

j
v

1
a
i j
.
Basta demostrar que a
i

j
= v

1
para que hayamos demostrado que, en
un juego antag onico (ep), A tiene punto silla y toda pareja de estrategias
conservadoras es un punto silla. Pero en 1.5.3b, se demostr o esa igualdad
para los juegos antag onicos (ep).
Las proposiciones 1.5.5 y 1.3.2 nos dicen que, en los juegos bipersonales
de suma cero, antag onicos, los equilibrios de Nash, las parejas de estrategias
conservadoras y los puntos silla, todos en estrategias puras, son conceptos
equivalentes y los juegos bipersonales son antag onicos (ep), si y s olo si la
matriz de pago del jugador 1 tiene punto silla. La proposici on siguiente re une
y enfatiza dichos resultados que ya han sido demostrados.
26
Modelos de juegos no cooperativos 27
Proposici on 1.5.6. En un juego bipersonal de suma cero antag onico las
tres armaciones siguientes son equivalentes:
a)

= (i

, j

) es punto silla de
1
, la funci on de pago del jugador 1.
b)

es un equilibrio de Nash (ep).


c) i

y j

son estrategias conservadoras para 1 y 2, respectivamente.


Tenemos, adem as como corolario de 1.5.5 el siguiente resultado:
Corolario 1.5.7. En (N, D
j
, ) bipersonal de suma cero, antag onico (ep),
existe al menos un equilibrio de Nash en estrategias puras.
Tratemos de generalizar el concepto de punto silla para todos los juegos e
investiguemos si tiene un papel semejante en la caracterizaci on de los juegos
antag onicos en general.
Observaci on 1.5.1. En los juegos bipersonales de suma cero, s olo nos preo-
cupamos de que la funci on de pago del jugador 1 tenga punto silla. Por
que? Supongamos que
_

i,

j
_
es dicho punto silla. Basta que multipliquemos
por 1 todos los terminos de las desigualdades implicadas en el punto silla
de la funci on de pago para 1, para que obtengamos las desigualdades para
la funci on de pago del jugador 2. Es decir,
_

i,

j
_
es tambien punto silla
del jugador 2. Este hecho no ocurre necesariamente en un juego que no es
bipersonal de suma cero. En el ejemplo 1.5.3, la funci on de pago del jugador
1 tiene punto silla y, sin embargo, no es antag onico, pues v

1
= 3, v

2
= 1,
pero Max = 8.
Ejemplo 1.5.3.
1 2 3 4
1
2
3
_
_
(3, 0) (5, 2) (4, 1) (7, 1)
(1, 7) (1, 3) (5, 2) (4, 2)
(0, 8) (4, 1) (5, 1) (1, 1)
_
_
Si observamos esta matriz, podemos ver que mientras que la funci on de
pago del jugador 1 tiene punto silla, la del jugador 2 no lo tiene.
Examinemos el ejemplo 1.3.3. Repetimos su expresi on matricial a con-
tinuaci on.
entrar no entrar
regalar muestras
publicidad escrita
publicidad en radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(45, 10) (55, 0)
_
_
27
28 Juegos rectangulares
Las dos funciones de pago tienen punto silla. Para la funci on de la empre-
sa monop olica, jugador 1, (publicidad en radio y tv, entrar), para la del 2
(publicidad en radio y tv, no entrar). Sin embargo, como ya habamos ob-
servado anteriormente, el juego no tiene equilibrios de Nash (ep) y, adem as,
no es antag onico, pues v

1
= 45, v

2
= 0 y Max= 80.
Si examinamos detenidamente el argumento que usamos en la anterior
observaci on, para hacer ver que en los juegos bipersonales de suma cero no
puede ocurrir que la funci on de pago de uno de los jugadores tenga punto
silla y la del otro no lo tenga, nos daremos cuenta que all se deca algo
m as fuerte y era que la misma pareja es punto silla de ambas funciones.
Inspir andonos en eso, establecemos la denici on de punto silla de un juego
como un perl de estrategias puras que sea punto silla, al mismo tiempo, de
las funciones de pago de todos los jugadores.
Denici on 1.5.8. Considerese el juego rectangular
_
N, D
j

jN
,
_

j
_
jN
_
.
Decimos que D es punto silla de la funci on de pago del jugador j si,
para toda D y para toda
j
D
j
, se cumple que

j
_


j
_

j
( )
j
_


j
_
.
Decimos que

D es punto silla del juego


_
N, D
j

jN
,
_

j
_
jN
_
,
si es punto silla de la funci on de pago de cada jugador.
Antes de estudiar el papel que los puntos sillas tienen en los juegos
antag onicos (ep), veamos que estos puntos son importantes en cualquier
juego, desde la problem atica que estudiamos.
Proposici on 1.5.9. Si

es un punto silla del juego (N, D


j

jN
, ),
entonces se cumplen:
a)

es equilibrio de Nash (ep).


b)

est a formada por estrategias conservadoras para cada jugador.


Demostraci on. Como

es punto silla, se cumple que, para todo jugador j,


para toda D y para toda
j
D
j
,

j
_

j
_

j
(

)
j
_

j
_
.
Tomando en cuenta las n desigualdades del lado izquierdo, tenemos que se
cumplen las condiciones para armar que

es equilibrio de Nash (ep). Por


lo que la armaci on del inciso a es v alida.
28
Modelos de juegos no cooperativos 29
Pero si

es equilibrio de Nash, para toda j N,


j
(

) v

j
. Entonces,
por las desigualdades de la derecha,
j
_

j
_
v

j
para toda D y para
toda j N. Lo que quiere decir que
j
es una estrategia conservadora del
jugador j. Y como esto es cierto para cualquier jugador,

est a formado
por estrategias conservadoras.
En la proposici on 1.5.9 se demostr o que un punto silla de un juego,
sin importar si este juego es o no antag onico, est a formado por estrategias
conservadoras. Sin embargo, lo recproco no es cierto, como es f acil observar
en el juego del volado, en el que todos los perles de estrategias puras est an
formados por estrategias conservadoras, pero el juego no tiene punto silla.
Tampoco los equilibrios de Nash de cualquier juego son necesariamente
puntos sillas o est an formados por estrategias conservadoras. En el ejemplo
1.3.3 b), mientras que la pareja (nr, nr) es punto silla y, entonces, est a forma-
da por estrategias conservadoras y es equilibrio de Nash (ep), la pareja (r, r)
no es punto silla y no est a formado por estrategias conservadoras y, sin em-
bargo, es equilibrio de Nash. Sin embargo, el juego 1.3.3 b) no es antag onico.
Vayamos, ahora, a la relaci on entre puntos silla de un juego y la propiedad
de que este sea antag onico. Examinemos el ejemplo 1.5.1.

Este es un juego
antag onico y bipersonal, pero no de suma cero. Habamos constatado que
la pareja (1, 1) es un equilibrio de Nash del juego y est a formado por una
pareja de estrategias conservadoras. Es f acil observar que (1, 1), tambien,
es punto silla de las funciones de pago de ambos jugadores. La del primer
jugador est a representada por la matriz de la izquierda, la del segundo por
la matriz de la derecha.
1 2 3 4 1 2 3
1
2
3
_
_
3 5 4 7
1 1 5 4
0 4 5 1
_
_
1
2
3
4
_
_
_
_
6 7 8
2 3 1
1 2 1
1 2 1
_
_
_
_
En el juego de ventanillas del juego antag onico del ejemplo 1.5.2, el perl

= (O
1
, O
1
, O
2
, O
2
, O
3
, O
3
, O
4
, O
4
, O
5
, O
5
)
es un equilibrio de Nash (ep) y est a formado por estrategias conservadoras,
una para cada jugador. Tambien dicho perl es un punto silla del juego.
Para mostrar esta ultima armaci on, podemos escribir en una matriz A
(j)
la funci on de pago del jugador j. Por ejemplo, la matriz A
(5)
corresponde
29
30 Juegos rectangulares
a uno de los especialistas en el ocio 3, en los renglones est an colocadas
las estrategias del artesano 5 y en las columnas los perles de estrategias
de los 9 artesanos restantes. En dicha matriz, suponemos que los perles
de los 9 artesanos que no son el 5 est an ordenados de tal manera que en
las primeras columnas se colocan, en cualquier orden, aquellos en los que el
artesano 6, el otro especialista en el ocio 3, elige O
3
y los dem as perles
en cualquier orden son las columnas siguientes. La columna con asterisco
es aquella en la que los 9 artesanos, distintos que 5, eligen su especialidad.
Examinemos la pareja
_

j
,
_
tal que
j
es el rengl on donde 5 escoge O
3
y la correspondiente a la columna con asterisco, en donde los artesanos
distintos a 5 tambien escogen su especialidad.
A
(5)
=

O
1
O
2
O
3
O
4
O
5
_
_
_
_
_
_
0
0
d
3
2
...
d
3
2
...
d
3
2
2d
3
3
...
2d
3
3
0
0
_
_
_
_
_
_
Es evidente que
_

j
,
_
es un punto silla de A
(5)
.
M as a un,
_

j
,
_
= (O
1
, O
1
, O
2
, O
2
, O
3
, O
3
, O
4
, O
4
, O
5
, O
5
) es un pun-
to silla de A
(j)
para cualquier artesano j, es decir es punto silla del juego.
En estos ejemplos de juegos antag onicos (ep) se observa un compor-
tamiento similar al de los juegos bipersonales de suma cero antag onicos.
Expresemos, en la proposici on siguiente, un resultado general.
Proposici on 1.5.10. Si (N, D
j

jN
, ) es antag onico (ep), entonces tiene
punto silla. Cualquier perl formado por estrategias conservadoras es punto
silla del juego.
Demostraci on. Supongamos que el juego es antag onico (ep) y sea D,
tal que
j
es conservadora, para cada j N.
Se tiene que para toda j N,
j
_


j
_
v

j
para toda D y

j
( ) = v

j
. Es decir,
j
_


j
_

j
( ) para toda D.
Adem as,
j
( ) = Max

i=j

i
( ) y

j
_


j
_
Max

i=j

i
_


j
_
para toda
j
D
j
.
Pero, para toda i ,= j,
i
_


j
_

i
( ).
30
Modelos de juegos no cooperativos 31
Entonces,
Max

i=j

i
_


j
_
Max

i=j

i
( ) =
j
( ) .
Es decir, para toda D y para toda
j
D
j
,

j
_


j
_

j
( )
j
_


j
_
.
O sea que es punto silla de la funci on de pago de cada jugador.
Sin embargo, no es cierto, a diferencia de lo que ocurre en los juegos
bipersonales de suma cero, que si un juego tiene punto silla, entonces el
juego es antag onico (ep), c omo podemos observar en los ejemplos siguientes:
confesar no confesar
confesar
no confesar
_
(10, 10) (0, 20)
(20, 0) (2, 2)
_
y
a b c d
a
b
c
d
_
_
_
_
(2, 1) (0, 0) (1, 2) (1, 1)
(1, 2) (2, 1) (0, 0) (1, 1)
(0, 0) (1, 2) (2, 1) (1, 1)
(1, 1) (1, 1) (1, 1) (1, 1)
_
_
_
_
El primer ejemplo es nuestro viejo conocido dilema del prisionero que
aparece en la introducci on. En este juego (confesar, confesar) es punto silla
de las funciones de pago de los dos jugadores. El juego no es antag onico, pues
el m aximo asegurable para ambos es -10, pero Max no es -20, sino -4. Como
es obligado (confesar, confesar) es un perl de estrategias conservadoras
y, a pesar de no ser antag onico, es punto equilibrio de Nash y punto silla.
Lo mismo ocurre en el segundo ejemplo que es el baile de Shapley (ejem-
plo 1.3.5). Este juego tiene un unico punto silla en (d, d), que es el unico
equilibrio de Nash y est a formado por estrategias conservadoras. Las matri-
ces de los jugadores 1 y 2 tienen otros puntos sillas, pero no lo son del juego.
El baile de Shapley no es antag onico, ambos jugadores tienen como m aximo
asegurable (ep) a 1 y Max es 3.
Por otro lado, c omo son los equilibrios en los juegos antag onicos (ep)
que no son bipersonales de suma cero? A diferencia de estos ultimos juegos,
31
32 Juegos rectangulares
en los antag onicos m as generales, un equilibrio de Nash (ep) puede ser un
perl de estrategias que no son conservadoras (ep). Adem as un equilibrio
de Nash en estrategias puras no necesariamente es punto silla del juego.
Veamos el siguiente ejemplo:
Ejemplo 1.5.4.
1 2
1
2
_
(1, 0) (0, 0)
(0, 0) (0, 1)
_
En este juego, 0 es el m aximo asegurable (ep) para los dos jugadores y
Max es 0, es decir, el juego es antag onico (ep). Hay un punto silla en (2, 1)
que es un equilibrio de Nash (ep) y que, adem as, es un perl de estrategias
conservadoras (ep), mientras que (1, 2) es equilibrio de Nash (ep), pero no
es punto silla de ninguna de las funciones de pago y tampoco es un perl de
estrategias conservadoras (ep).
La proposici on 1.5.11 resume los resultados que hemos probado respecto
a puntos sillas, estrategias conservadoras y equilibrios de Nash en los juegos
antag onicos, todos estos conceptos en relaci on con estrategias puras.
Proposici on 1.5.11. Si (N, D
j

jN
, ) es antag onico (ep), entonces
i)

es punto silla de
j
para toda j N si y s olo si
j
es estrategia
conservadora (ep) para toda j N.
ii) Si

es punto silla de
j
para toda j N, entonces

es equilibrio
de Nash (ep).
Entonces, hablando en el contexto de las estrategias puras, los perles
de estrategias conservadoras, que siempre existen, son equilibrios de Nash
en los juegos antag onicos, pero, en algunos de estos juegos, existen equili-
brios de Nash que no est an formados con estrategias conservadoras. En la
proposici on 1.5.3, se prob o que, en los juegos antag onicos, el pago en to-
dos los equilibrios es el m aximo asegurable, con eso se hizo claro, como lo
comentamos en ese momento, que los jugadores preferir an estrategias con-
servadoras en dichos juegos. Afortunadamente, para los equilibrios de Nash,
los perles con estas estrategias son equilibrios, pero aquellos equilibrios que
no aseguran los pagos v

j
no podr an formar parte del conjunto soluci on.
Es decir, en los juegos antag onicos (ep), cualquiera que sea el n umero de
jugadores, si se dene un conjunto, al que debe llamarse la soluci on del
juego, en todos los perles que formen parte de este conjunto, los jugadores
32
Modelos de juegos no cooperativos 33
actuaran conservadoramente. En el contexto de las estrategias puras hemos
mostrado que en los juegos antag onicos, por eso les hemos puesto ese nom-
bre, los jugadores tienen intereses contrapuestos y no se puede esperar que
se formen pactos o coaliciones entre los jugadores, al igual que ocurre en los
juegos bipersonales de suma cero, con punto silla.
1.6. Algunos ejemplos innitos
Aunque nuestra denici on fue m as general, hasta ahora, jugar una sola
vez ha querido decir tratar con un juego nito, pero esto no tiene por que
ser as, en muchos conictos, a los que toman las decisiones se les pueden
presentar innitas opciones. Una empresa que debe considerar el precio de
cada uno de sus productos tendr a una innidad de posibilidades. Tambien
cada uno de los clientes potenciales de ella, aunque s olo tengan que decir un
s o un no, a cada uno de esos posibles precios, tienen innitas estrategias.
Decidir cu anto invertir a de su capital en cada una de las opciones posibles
sera elegir una de sus estrategias en muchos de los conictos en que se
ve envuelto un hombre de negocios. Que parte de su fortuna heredar a,
un viejo millonario, a cada uno de sus parientes? En todos estos ejemplos la
elecci on dentro de un conjunto innito ocurre en cada ocasi on que se celebra
el conicto.
La denici on de equilibrio de Nash es v alida para juegos innitos. A estas
alturas del texto queda claro, que en los juegos nitos no siempre existen
equilibrios de Nash (ep), lo mismo ocurre en los juegos innitos. Para tener
teoremas de existencia, en juegos nitos e innitos, tendremos que esperar
al captulo 5. Para los juegos nitos aparecer an las estrategias mixtas, en
los innitos no tendremos que mezclar, aunque tambien se puede, pero
aprovecharemos la tecnica usada con las estrategias mixtas, para discutir
condiciones de existencia de equilibrios de Nash en el caso innito y, por
ello, trataremos al mismo tiempo el asunto. En esta secci on, simplemente,
introduciremos algunos ejemplos.
Ejemplo 1.6.1 (Un juego bipersonal de suma cero innito). Del libro
Introducci on a la Teora Matem atica de los Juegos de J.C.C. McKinsey [36]:
El coronel Blotto desea atacar dos posiciones A y B igualmente impor-
tantes, y debe decidir que porci on de su regimiento enva a A y cu al a B.
El coronel enemigo s olo tiene a disposici on una parte z de su regimiento,
0 < z < 1, y debe decidir c omo distribuir dicha parte en la defensa de las
posiciones A y B. La lucha es a muerte y tomar a la posici on el que tenga
33
34 Juegos rectangulares
m as hombres concentrados en ella, para ello habr a tenido que matar a to-
dos los enemigos y habr a perdido tantos hombres como el enemigo. El pago
ser a igual a las posiciones ganadas que valen lo que un regimiento completo
m as los sobrevivientes.
Entonces N = Coronel Blotto, Coronel Enemigo, D
B
= D
E
= [0, 1],

B
=
E
. Donde

B
(x, y) = sgn[x yz] +x yz+
sgn[1 x (1 y) z] + 1 x (1 y) z, con
sgn(c) =
_
_
_
1 si c < 0
0 si c = 0
1 si c > 0
.
Supongamos que existen
v
B
= m ax
x[0,1]
mn
y[0,1]

B
(x, y)
y
v
E
= mn
y[0,1]
m ax
x[0,1]

B
(x, y)
Entonces, el Coronel Blotto tiene una estrategia de tal manera que por
lo menos gana v
B
y el Coronel Enemigo tiene una estrategia de tal manera
que le impide ganar m as que v
E
.
Si v
B
= v
E
,
B
tiene un punto silla (x
0
, y
0
). (x
0
, y
0
) es equilibrio de
Nash y
B
(x
0
, y
0
) = v
B
.
Ejemplo 1.6.2. Podemos transformar el juego de ventanillas 1.3.9 a), per-
mitiendo que los artesanos no se dediquen a un solo ocio, sino que sus
decisiones sean ahora vectores de dimensi on r que indiquen la parte de su
jornada, digamos que de 8 horas, que dedicar an a cada ocio.
Entonces, para el artesano j,

D
j
=
_
X
j
R
r

x
j
O
i
0, O
i
y
r

i=1
x
j
O
i
= 8
_
es el conjunto de donde
escoger a cada da. Para cada j N, la funci on de pago se dene, cuando
X =
_
X
1
, X
2
, ..., X
n
_
, de la manera siguiente:

j
(X) =

(O
k
1
,O
k
2
,...,O
kn
)

O
k

x
j
O
k
=0
d
k

iN
x
i
O
k
.
Es claro que existen equilibrios de Nash tales que todos ganan lo mismo.
Podramos trabajar este modelo para hacer ver que el mercado es un plani-
cador espont aneo y reparte el trabajo de una manera sabia. O podramos,
34
Modelos de juegos no cooperativos 35
como hace S. Hern andez [27], con un modelo similar, demostrar que en estas
condiciones vale la ley del valor trabajo. O siguiendo a ese autor discutir la
formaci on de la tasa media de ganancia en un modelo de concurrencia, donde
los jugadores son capitalistas, existe un conjunto de opciones de inversi on,
libres para todos, y las estrategias de los jugadores consisten en decidir que
parte de su capital emplear an en cada una de sus opciones.
Ejemplo 1.6.3 (El Duopolio de Cournot). Dos empresas controlan el
mercado de un bien. Cada una de ellas debe decidir la cantidad q
i
R
+
que
producir a. El precio unitario del bien se determina para igualar la demanda
con la oferta (un precio de equilibrio). Supongamos que dicho precio cumple
con la ecuaci on: p = d q
1
q
2
, donde d sera la demanda si el precio fuera
cero. Entonces, si c es el costo unitario, la ganancia que recibir a la empresa
i, cuando se han elegido q
1
y q
2
est a expresada en la funci on:

i
(q
1
, q
2
) = q
i
(p c) = q
i
(d q
1
q
2
c)
Para buscar cu al es la conducta racional que seguir an las empresas, Antoine
Augustin Cournot [12] supone que si la empresa 2 ha elegido q

2
, la empresa
1, buscar a q
1
que maximice
1
(q
1
, q

2
). Y an alogamente actuar a 2, si 1 ha
elegido q

1
. Considerando la condici on de primer orden de maximizaci on de
las ganancias de ambas empresas, llegamos al par de ecuaciones que deben
cumplir q

1
y q

2
.
Es decir, Cournot dira que el equilibrio del duopolio es:
q

1
= q

2
=
1
3
(d c) .
Resulta que esa misma pareja de estrategias es el equilibrio de Nash, pues
es exactamente la misma denici on. Cournot, matem atico frances del siglo
XIX que es pionero de la aplicaci on de las matem aticas a la economa, se
adelant o en m as de 100 a nos en la construcci on de un concepto an alogo al
del equilibrio de Nash, para los casos de empresas oligop olicas.
Ejemplo 1.6.4. Una empresa M que monopoliza un bien, cuyo costo uni-
tario es c, tiene que elegir el precio al que lo vender a, en principio, cualquier
real es v alido. Sus posibles r compradores (los consumidores) desean, cada
uno, una unidad. Tienen que decidir, para cada precio posible, si compran o
no compran. La ganancia que recibir a el monopolio es igual al precio de todas
sus ventas menos el costo. El pago para el consumidor j es igual a la utilidad
que le reporta el bien (U
j
) menos el precio que pag o por este si compra, o 0
en el caso de no comprar. Suponemos que 0 c mn
j
U
j
= U
b
.
35
36 Juegos rectangulares
El juego se puede describir de la siguiente forma:
N = M, 1, 2, . . . , r,
D
M
= R
+
D
j
=
_
f
j
: R
+
s compra, no compra
_

M
_
p, f
1
, f
2
, ..., f
r
_
= (p c) n
p
n
p
es el n umero de consumidores que compran al precio p, de acuerdo a
_
f
j
_
.
Para j = 1, 2, . . . , r,
j
_
p, f
1
, f
2
, ..., f
r
_
=
_
0 si f
j
(p) = no compra,
U
j
p si f
j
(p) = compra.
Dos equilibrios de este juego:
a) Cada comprador elige comprar, cuando el precio es a lo m as igual a la
utilidad que recibe del bien y no comprar a precios m as altos. El monopolio
elige el precio igual a la utilidad del consumidor que, en estas condiciones,
le permite obtener mayor ganancia. Si el precio de venta determinado es
muy alto, este equilibrio convendra al monopolio y no a los consumidores,
pues muchos de ellos no podran comprar y los que lo hicieran lo haran a
un precio alto.
b) Cada comprador elige comprar, cuando el precio es a lo m as igual a
U
b
, la utilidad m as peque na que existe entre los consumidores, y no comprar
a precios m as altos. El monopolio vende a un precio igual U
b
. Este equilibrio
convendra a los consumidores, pues todos podran comprar y lo haran a
un precio bajo. En cambio, al monopolio, excepto si a y b llevan al mismo
precio, no le conviene esta situaci on, es como si los consumidores se hubieran
coaligado en su contra exigiendo que el precio sea U
b
. Sin embargo, este
equilibrio encierra una amenaza no creble, pues si el monopolio escogiese
un precio p > U
b
, los consumidores que tienen una utilidad mayor que p
mejoraran comprando, por lo que el vendedor creera que no se sostendran
en no comprar a precios mayores que U
b
, pero menores que la utilidad que
les proporciona el bien.
Tambien puede ser interesante considerar juegos innitos en el sentido
del n umero de jugadores, pues es una forma con la que se puede modelar
que cada jugador, o algunos de ellos, no tienen peso. Por ejemplo, cada
consumidor de un gran supermercado no har a que este cambie el precio de
un artculo, si decide no comprarlo. Los juegos en los que ning un jugador
tiene peso se llaman no at omicos. En este texto no nos meteremos en ese
tema.
36
Modelos de juegos no cooperativos 37
1.7. Ejercicios
Ejercicio 1.1. Construya un modelo rectangular de los siguientes conic-
tos. Posteriormente se nale, para cada uno, sus equilibrios de Nash (ep) o
si no los tiene.
a) (M. Davis [13]) En agosto de 1944, justamente despues de la in-
vasi on de Europa, los aliados rompieron su cabeza de playa en Cherburgo
y amenazaban al Noveno Ejercito alem an. El comandante alem an tena es-
tas posibles elecciones: ataque o retirada. El comandante aliado tena estas
alternativas: reforzar la brecha, lanzar sus reservas hacia el este tan pronto
como fuese posible, defenderse esperando veinticuatro horas para despues
decidir reforzar o empujar hacia el este. Para cada pareja de estrategias se
tienen los resultados siguientes:
ataque retirada
reforzar
reservas
al este
esperar
_
_
_
_
_
_
_
_
_
_
_
_
_
_
probable rechazo
del ataque
d ebil presi on
alemanes pueden
cerrar brecha
disposici on ideal
contra alemanes
brecha y rodeo de
los alemanes
atraso en llegada
y poca presi on
contra alemanes
_
_
_
_
_
_
_
_
_
_
_
_
_
_
b) Considere dos empresas comerciales que compiten por atraer al mayor
n umero de clientes. La m as fuerte de las dos, pues cuenta con m as capital,
considera las tres estrategias siguientes: 1) aceptar un acuerdo sobre los
precios si su competidora se lo ofrece y si no escoger un precio alto; 2) bajar
precios y hacer una gran publicidad buscando arruinar al competidor y 3)
ofrecer dinero al competidor para que este abandone la competencia y si
este no acepta, bajar precios buscando arruinarlo. La otra empresa, por su
lado, tiene dos opciones: 1) buscar un acuerdo con el competidor y aceptar
el ofrecimiento, si se le hace, de abandonar y 2) actuar aisladamente, sin
ofrecer, ni aceptar nada del competidor. Construya una matriz de los posibles
resultados cualitativos, an aloga a la del problema a y posteriormente asigne
n umeros reales que expresen un pago que reeje la situaci on.
c) Tres amigos quieren decidir quien pagar a la cena escogiendo en forma
simult anea, cada uno de ellos, entre aguila o sol. El disparejo pierde. Si los
37
38 Juegos rectangulares
tres escogen lo mismo, cada quien pagar a la tercera parte.
d) En una glorieta donde el ujo de autom oviles es enorme, repentina-
mente, el sem aforo se apaga, cada automovilista se encontrar a en la disyun-
tiva de escoger entre comportarse civilizadamente (solidario), dejando pasar
a otros autom oviles cuando esto favorece la uidez del tr aco o, por el con-
trario, buscar avanzar, el mismo, a como de lugar (egosta). Cuando los
automovilistas que deciden tomar este ultimo comportamiento rebasan el
n umero r, n > r > 0, se provoca un embotellamiento.
Si llamamos k

al n umero de automovilistas que en el perl de estrategias


=
_

1
,
2
, ...,
n
_
escoge la estrategia egosta, dena la funci on de pago
que exprese el tiempo que tardar a cada automovilista dependiendo de las
decisiones de todos, de tal manera que el juego sea un dilema del prisionero.
e) Considere un conicto actual y construya un juego rectangular sobre
el.
f) Considere un conicto que conozca que sea un dilema del prisionero
(distinto de los que aparecen en este libro) y construya un juego rectangular
sobre el.
g) Considere un conicto que conozca que sea un juego de mayora (dis-
tinto de los que aparecen en este libro) y construya un juego rectangular
sobre el.
h) Construya un juego de ventanillas sobre las colas en las cajas del
supermercado.
i) Construya un juego rectangular del conicto entre hombres y mujeres,
en el medio en que se mueve.
j) Es un a no de elecciones y los dos partidos polticos principales se
encuentran en el proceso de redactar sus programas. Hay una disputa entre
dos estados X y Y relativa a derechos sobre agua y cada partido debe
decidir si en su programa favorecer a a X o a Y o no tocar a el punto. Los
ciudadanos que no son de X o de Y son indiferentes al problema. En X y
en Y , el comportamiento en la votaci on puede predecirse de la experiencia
pasada. En X se decidir an por el que prometa apoyo a su estado y si ambos
prometen lo mismo o no tocan el punto, los habitantes de X se abstendr an.
En Y , ocurre lo mismo con la mitad de la poblaci on, pero la otra mitad,
no votar a por 1, aunque le prometa favorecerlos y por 2 s olo si les promete
favorecerlos. La poblaci on de Y es 4/3 la de X.
Ejercicio 1.2. Sea (N, D
j
, ), un juego bipersonal de suma cero, y
_

1
,
2
_
y
_

1
,
2
_
dos perles que son equilibrios de Nash (ep). Demuestre que
_

1
,
2
_
y
_

1
,
2
_
tambien son equilibrios de Nash (ep) y que el pago, para
los dos jugadores es el mismo en cualquier equilibrio de Nash.
38
Modelos de juegos no cooperativos 39
Ejercicio 1.3. Considere los juegos siguientes y encuentre todos los equi-
librios de Nash (ep)
a)
_
_
_
_
(1, 5) (5, 4) (0, 0) (0, 1) (2.0) (3, 3)
(3, 2) (5, 2) (2, 1) (2, 1) (3, 4) (10, 5)
(4, 6) (7, 0) (0, 3) (2, 2) (3, 1) (0, 2)
(1, 0) (7, 2) (1, 1) (1, 0) (5, 5) (7, 1)
_
_
_
_
b)
_
_
_
_
_
_
_
_
_
_
(2, 1) (1, 0) (5, 4)
(4, 3) (4, 3) (8, 7)
(4, 5) (1, 2) (4, 5)
(4, 3) (4, 3) (7, 6)
(3, 2) (3, 2) (2, 1)
(4, 3) (2, 1) (4, 5)
(0, 1) (2, 3) (3, 2)
_
_
_
_
_
_
_
_
_
_
c)
_
_
_
_
_
_
(3, 7) (0, 2) (1, 1) (4, 30) (10, 10)
(4, 5) (3, 10) (2, 1) (4, 5) (5, 1)
(0, 0) (6, 2) (10, 1) (3, 4) (3, 2)
(5, 15) (5, 5) (2, 9) (2, 17) (2, 7)
(1, 10) (2, 11) (12, 8) (3, 3) (11, 11)
_
_
_
_
_
_
d) El juego de los artesanos con 10 jugadores D
1
= D
2
= O
1
, O
2
, O
3
, O
4
,
D
3
= D
4
= D
5
= O
2
, O
3
, O
4
y D
6
= D
7
= D
8
= D
9
= D
10
= O
3
, O
4
,
d
1
= 2500, d
2
= 750, d
3
= 500, d
4
= 350.
e) Corre el a no 1994, n capitalistas tienen gran cantidad de d olares in-
vertidos en alg un pas en donde est an obteniendo enormes ganancias, sin
embargo, en los ultimos das de noviembre empiezan a correr fuertes ru-
mores de que se aproximan acontecimientos polticos que pueden poner en
peligro sus inversiones. Tienen que decidir, entonces, si sacan sus d olares
del pas para proteger su capital, aunque por alg un tiempo sus ganancias
se reduzcan considerablemente, o si asumen el riesgo y dejan sus inver-
siones donde est an. Si m as de r inversionistas permanecen en el pas, el que
as act ue hace buenos negocios, 1 < r < n. En cambio si la mayora de los
inversionistas protege su dinero sac andolo del pas, y permanecen menos de
r el que haya decidido permanecer obtendr a perdidas. Podemos suponer que
si permanecen r inversionistas, nadie pierde, ni gana nada. La funci on de
pago de este conicto tendr a la forma siguiente:

j
=
_

_
0 si
j
= sale
0 si
j
= no sale y r no salen
p > 0 si
j
= no sale y m as que r no salen
q < 0 si
j
= no sale y menos de r no salen
Ejercicio 1.4. Justique que los equilibrios de Nash son los que se se nalan
39
40 Juegos rectangulares
en todos los ejemplos que aparecen en el captulo.
Ejercicio 1.5. Encuentre el m aximo asegurable (ep) y estrategias puras
conservadoras para todos los jugadores, en los ejemplos del captulo. Exa-
mine si los juegos son antag onicos o no.
Ejercicio 1.6. Considere los juegos simetricos 2 2 y demuestre que es
cierto que los equilibrios son como se se nala en el texto. La forma general
de uno de estos juegos es como sigue:
1 2
1
2
_
(d, d) (e, f)
(f, e) (g, g)
_
Considere que en el juego simetrico 2 2 se cumple que (d f)(e g) = 0.
Examnense, para todos los casos cu ales son los equilibrios de Nash (ep),
el m aximo asegurable y las estrategias conservadoras para cada jugador.
Podemos decir algo sobre si es antag onico o no?
Ejercicio 1.7. En los juegos simetricos 22 que se contemplan en el texto,
estudie en cada caso, si existe punto silla. En los casos para los que siempre
hay punto silla y en los que nunca lo hay, demuestre por que sucede dicho
resultado. En los casos que a veces lo hay y a veces no lo hay, construya un
ejemplo de cada uno.
Ejercicio 1.8. Los 100 socios de un gran consorcio tienen que votar por al-
guno de los candidatos C
1
, C
2
, C
3
y C
4
para elegir a su presidente, tambien
tienen derecho a abstenerse. Gana el candidato que obtenga la mayora de
votos. Cada candidato ha hecho grandes promesas a los socios que lo apoyen,
si es que logra ganar. Si un socio se abstiene, no gana, ni pierde nada, si
apoy o al ganador recibe la recompensa prometida, si apoy o a un perdedor
recibir a un castigo del candidato ganador. Si no hay mayora ninguno gana
o pierde algo. Considere que los premios y castigos ( relativo al candidato C
i
(p
i
, c
i
)) se pueden medir con los n umeros siguientes: p
1
= 500, p
2
= 1000,
p
3
= 300, p
4
= 700, c
1
= 900, c
2
= 100, c
3
= 400, c
4
= 300. Con-
struya una funci on de pago que reeje este conicto (ojo los candidatos
no son jugadores, solo los socios). Encuentre todos los equilibrios de Nash
(ep) del juego. Encontrar el m aximo asegurable y las estrategias puras con-
servadoras de cada jugador. Cu al es la m axima ganancia conjunta? Es
antag onico el juego? El perl de estrategias conservadoras es equilibrio de
Nash (ep)?
40
Modelos de juegos no cooperativos 41
Ejercicio 1.9. Construya un ejemplo de un juego bipersonal de suma cero,
con 10 estrategias para el primer jugador y 15 para el segundo, de tal mane-
ra que sea antag onico. Se nalar todas las estrategias conservadoras de cada
jugador y todos los equilibrios de Nash.
Construya un ejemplo de un juego bipersonal que no sea de suma cero, ni
de suma constante con el mismo n umero de estrategias que el anterior (10
15) y que sea antag onico (ep). Se nale todas las estrategias conservadoras de
cada jugador y todos los equilibrios de Nash.
Ejercicio 1.10. Considere el modelo de Cournot para n empresas. Las em-
presas E
1
, E
2
, . . . , E
n
producen el mismo bien, el coste unitario de cada una
es igual a c. La empresa E
j
debe escoger q
j
en [0, ), que es la cantidad
del bien que piensa producir. Todas las empresas deben vender al mismo
precio unitario que cumple la ecuaci on: p = d

i
q
i
. La funci on de pago
para la empresa E
j
es
j
(q
1
, q
2
, ..., q
n
) = q
j
(p c). Encuentre el equili-
brio de Cournot-Nash del juego. Cu al es el precio correspondiente a dicho
equilibrio? Cu al es ese precio en el lmite, cuando n tiende a innito?
Ejercicio 1.11. En el duopolio de Cournot (dos empresas), considere que
la ecuaci on de precios es p = dq
1
q
2
. La funci on de pago para la empresa
E
j
es
j
(q
1
, q
2
) = q
j
(p c
j
), con c
j
, el costo unitario de la empresa j.
Encuentre el equilibrio de Cournot-Nash del juego. Si c
1
> c
2
, cu al de las
dos empresas produce m as en el equilibrio?
Ejercicio 1.12. El duopolio de Bertrand. Dos empresas controlan el mer-
cado de un bien. Las empresas eligen el precio unitario al que vender an el
bien p
1
y p
2
, respectivamente. La cantidad demandada a la empresa i por los
consumidores es
q
i
(p
1
, p
2
) = a p
i
+bp
j
.
0 < b < 2. El coste unitario c es tal que 0 < c < a. La ganancia de la
empresa j est a dada por la funci on

j
(p
1
, p
2
) = q
j
(p
1
, p
2
) (p
j
c) .
Encuentre los equilibrios de Nash del juego. C omo cambian los precios de
equilibrio si hay dos costes unitarios distintos para las empresas 1 y 2?
Ejercicio 1.13. Otro juego de ventanillas. Sea N el conjunto de los m as
grandes capitalistas de un pas y D
j
= f
1
, f
2
, . . . , f
k
el conjunto de rmas
en las que puede invertir cualquiera de las capitalistas de N. Cada rma
produce un tipo de producto. La ganancia total medida en dinero que obtiene
41
42 Juegos rectangulares
la rma f
l
es S
l
. La ganancia de cada rma se divide en partes iguales entre
sus accionistas, es decir, si j escoge f
l
y n
l
= #i escogi o f
l
, j gana
S
l
n
l
.
#N = 6, k = 5, S
1
= 1000 millones de pesos, S
2
= 500 millones de pesos,
S
3
= 300 millones de pesos, S
4
= 250 millones de pesos y S
5
= 125 millones
de pesos.
Cu ales piensa que son los equilibrios de Nash (ep) del juego?
Sea el conjunto S =
_
(a
1
, a
2
, a
3
, a
4
, a
5
)

a
i
entero no negativo,
a
i
6 y

i
a
i
= 6
_
.
(a
1
, a
2
, a
3
, a
4
, a
5
) se identica con todos los perles de estrategias puras
en los que a
k
capitalistas, sean los que sean, eligen la rma f
k
. Considere la
gr aca dirigida
_
S,

A
_
con vertices o nodos en S y tal que si v y w est an en
S, (v, w)

A se puede pasar de v a w con el cambio de estrategia de
uno s olo de los jugadores y este mejora el pago que tena con ese cambio de
estrategia. Dibuje la parte de
_
S,

A
_
que empieza en el vector (6, 0, 0, 0, 0),
siga con todas las echas que parten (6, 0, 0, 0, 0), ahora, para cada vertice
nal de dichas echas, considere las echas que parten de el. Contin ue con
el procedimiento hasta que llegue a vertices de los que no parten echas.
Reinterprete esos vertices como perles de estrategias y habr a encontrado
equilibrios de Nash. Por que?
Ejercicio 1.14. Considere un juego rectangular nito
_
N, D
j

jN
,
_
y
la gr aca dirigida
_
S,

A
_
, con S = D
1
D
2
... D
n
. C omo debera
ser

A para que tuvieramos un procedimiento an alogo al del ejercicio 1.13?
Encuentre con este procedimiento todos los equilibrios de Nash de un juego
bipersonal con 6 estrategias para el jugador 1 y 5 para el dos.
Ejercicio 1.15. Una empresa M que monopoliza la venta de un paquete
de software tiene que elegir entre vender cada paquete a 600 o 1000 pesos.
El costo unitario de cada paquete es de 450 pesos. Hay 500 personas para
las que la utilidad que reporta dicho software es equivalente a 1100 pesos
menos el precio al que lo compren y 1000 personas para las que la utilidad es
equivalente a 650 menos el precio al que la compren. Construya un modelo
rectangular del juego. Es decir, especique el conjunto de jugadores N, los
conjuntos de estrategias D
j
y las funciones de pago
j
. Encuentre todos los
equilibrios de Nash (ep) del juego.
Ejercicio 1.16. Conteste si las siguientes preguntas son falsas o verdaderas
y diga por que. Es decir, demuestre la armaci on si es verdadera o exhiba
un contraejemplo si no lo es.
42
Modelos de juegos no cooperativos 43
a) Un juego bipersonal de suma cero siempre es antag onico (ep).
b) Un juego bipersonal de suma cero, cuya matriz tiene punto silla tiene
todos sus equilibrios de Nash formados por estrategias conservadoras.
c) Un juego antag onico (ep) tiene todos sus equilibrios formados por
perles de estrategias conservadoras.
43
44 Juegos Extensivos
44
Captulo 2
Juegos Extensivos
2.1. Sobre el modelo
En el captulo 1, hablamos sobre las dicultades que tiene el construir
modelos rectangulares de muchos de los conictos reales. Por ejemplo, los
conictos militares, en donde los protagonistas toman una enorme cantidad
de decisiones a lo largo del tiempo, no una sola, como hasta aqu hemos con-
siderado. A un para un juego de sal on como el ajedrez, del que podra decirse
que es, en cierto sentido, una simplicaci on de un conicto militar, resul-
ta muy complicado hacer un modelo tipo juego rectangular, precisamente
porque los jugadores toman en una partida una gran cantidad de decisiones.
La situaci on se complica, respecto al ajedrez, en otros juegos de sal on y en
los conictos econ omicos, polticos, militares, etc., en donde los jugadores,
adem as de tomar decisiones a lo largo del tiempo, enfrentan situaciones de
tipo azaroso y tienen problemas de informaci on. No hay m as que pensar
en juegos como el p oker o el domin o, para obtener ejemplos en los que
ocurren, tanto jugadas de azar, como falta de informaci on. No s olo en juegos
de sal on se presentan estos problemas, en numerosos conictos humanos,
los participantes act uan sujetos a un azar real o cticio y, al tener que
tomar decisiones, pueden no tener informaci on sobre cu al es exactamente la
situaci on en la que se encuentran.
Los modelos rectangulares tienen que abolir esos elementos que poseen
los conictos reales, lo que no resulta f acil, si se busca una manera no arbi-
traria de hacerlo. Encontrar simplicaciones forzadas puede ser f acil, pero el
modelo no servira para el an alisis del conicto que interesa. Adem as, aunque
el modelo sea bueno, es necesariamente m as pobre. Afortunadamente, la
45
46 Juegos Extensivos
teora de los juegos no cooperativos cuenta con otro tipo de modelos con el
que se pueden tomar en cuenta todos los elementos mencionados, los Juegos
Extensivos. Los modelos rectangulares o estrategicos son m as adecuados
para denir los conceptos de soluci on, en ellos apareci o el equilibrio de Nash
en estrategias puras. Desde dichos juegos, se extender a el concepto para
hablar de equilibrios de Nash en contextos como el de los juegos extensivos,
entre otros.
La denici on formal del modelo extensivo es m as compleja que la del
modelo rectangular, el meollo de ella es un concepto de la teora de gr acas,
el de arbol con raz. Antes de establecer dicha denici on presentaremos, en
este captulo, ejemplos de modelos extensivos de algunos conictos sencillos
que ayudar an a hacer que la denici on resulte m as natural. Los ejemplos
buscan tambien presentar un peque no panorama del tipo de modelos que
se pueden elaborar. Posteriormente introducimos los conceptos de teora
de gr acas mnimos necesarios para las deniciones del modelo extensivo.
Adem as, discutiremos la denici on de juego extensivo, enfrent andole otra
posible, la de juego de posiciones que se establece tambien en terminos de
gr acas.
Aprovechando que estamos en el contexto de la Teora de Gr acas,
hablaremos de gr acas dirigidas o digr acas que, despues, utilizaremos am-
pliamente en la selecci on de equilibrios. En este captulo s olo introducimos
ese tema de la selecci on. Tambien las digr acas nos servir an para ampliar
el panorama que se sigue en el libro, presentando, en la secci on 2.5, otro
instrumento para analizar algunos juegos.
2.2. Alternancia, azar e informaci on.
Juegos de informaci on perfecta y sin azar
Ejemplo 2.2.1 (La Cadena de Supermercador de Selten 1 (Una
amenaza increble)). La empresa M, una cadena de supermercados, tiene
el control sobre cierto producto, lo monopoliza, pero existe la posibilidad de
que una empresa C decida entrar a competir a dicho mercado. M inten-
tar a convencer a C de que no lo haga, prometiendole a cambio un mill on de
pesos de los seis que ella obtendra sin competidor y amenaz andola, adem as,
con bajar los precios si, a pesar de todo, C decidiera entrar a la competencia.
Supongamos que llegara a ocurrir esto ultimo, es decir, C hizo caso omiso
del peligro que corre. De cumplir M su palabra, ninguna de las dos em-
presas obtendra ganancia alguna, en cambio, si M no cumple su amenaza,
46
Modelos de juegos no cooperativos 47
las ganancias de cada uno ser an de dos millones. La gura 2.2.1 muestra el
modelo extensivo del ejemplo.
NE E
M
BP NBP
C
(5,1)
(0,0) (2,2)
Figura 2.2.1:
Observese que el desenvolvimiento del conicto en el tiempo se representa
con un arbol, las historias posibles del juego con los vertices y la posibilidad
de pasar de una a otra con las aristas. En los vertices nales est an colocados
vectores con los pagos de los jugadores, las primeras coordenadas son los que
recibe M, las segundas coordenadas los pagos para C. En cada vertice no
nal est a una etiqueta M o una C, indicando a quien le toca decidir en ese
vertice. En este conicto no funciona el azar, ni existe falta de informaci on
de los jugadores sobre ninguna de las decisiones anteriores.
En un esquema como el representado en la gura 2.2.1 no parece difcil
hacer un an alisis para contestar preguntas como: Le conviene a C aceptar
ese dinero f acil?. Y si no lo hace cumplir a M su amenaza?. Esto no depende
tanto del tama no del arbol como de los elementos que contiene. Aqu el
ejemplo nos sirve para ilustrar algunos elementos de un juego extensivo. El
siguiente ejemplo emplea los mismos elementos y, aunque el arbol es un poco
mayor, ser a igualmente f acil analizarlo.
Ejemplo 2.2.2 (La Cadena de Supermercados de Selten 2 (Una
amenaza que se puede creer)). Es claro que, en el ejemplo anterior,
la amenaza de M no es creble. Otra versi on del conicto en la que dicha
amenaza se tendra que tomar m as en serio, puede presentarse como sigue:
47
48 Juegos Extensivos
C
NIn In
C
M
BP BP NBP NBP
M
(3,1)
(1,0) (0,2) (0,0) (2,2)
NE NE E E
(5,1)
M
Figura 2.2.2:
la empresa M considera, al principio, la conveniencia o no de hacer una
inversi on en su planta. Con esa inversi on M podra abaratar costos y estar
en condiciones de cumplir su amenaza. Si M decide no hacer la inversi on
todo ocurrir a como en el ejemplo 2.2.1. Si, por el contrario, M decide hacer
la inversi on las cosas cambian. Por un lado, si C acepta el ofrecimiento de
M, esta se quedar a con tres millones de su ganancia total, en cambio, si C
decide entrar, M tendr a que decidir entre cumplir su promesa y bajar los
precios, obteniendose como vector de pago (1, 0) o mantener los precios, en
cuyo caso los pagos ser an los del vector (0, 2). La gura 2.2.2 describe la
historia anterior. Por que ahora la amenaza de M es creble?
Juegos de informaci on perfecta y con azar.
Ejemplo 2.2.3 (Riesgo Moral. El Riesgo de Contratar a un Hol-
gaz an). (simplicaci on de un ejemplo del libro de Bierman y Fern andez
[3].) Un patr on (P) est a considerando la conveniencia de ofrecer a un posi-
ble empleado (E) un salario de 100 pesos diarios o uno de 200. En ambos
casos, el empleado tiene que decidir si acepta (ac) o no acepta (nac) el ofrec-
imiento. Si E no acepta, tiene la seguridad de obtener, trabajando por su
cuenta, 100 pesos de ingreso (el patr on no obtendra nada). Por otro lado,
despues de aceptar el empleo, a E le vendr a a la cabeza el que quiz a no sea
mala idea usar parte del tiempo en otras tareas que le reportaran un ingreso
extra (holg), aunque no cabe duda que arriesgara su empleo y tendra que
pensar, si no sera mejor poner todo su empe no en su trabajo (tr). El patr on
48
Modelos de juegos no cooperativos 49
Nac Ac Nac Ac
E
E E
(100,0) (100,0)
(150,200)
(100,300)
(100,0)
(250,100)
(100,0)
(200,200)
0
0
0
0
.9 .9 .9 .9 .1 .1 .1 .1
(100,0)
100 200
E
holg holg tr tr
(100,0)
P
Figura 2.2.3:
no est a en condiciones de invertir en un sistema de vigilancia que observe al
empleado durante cada minuto de la jornada de trabajo, pues resultara de-
masiado costoso, s olo cuenta con un inspector que sin previo aviso pasa por
el lugar de trabajo de E. La forma de revisar de dicho inspector es tal que
la probabilidad de que E sea atrapado sin trabajar depende de la elecci on
(holg) o (tr) que este haya tomado. Si el inspector atrapa al empleado, sin
cumplir con sus obligaciones, el trabajador ser a despedido inmediatamente.
La forma extensiva del conicto se ilustra en la gura 2.2.3. En los vec-
tores de pagos la primera coordenada corresponde a E y la segunda a P.
Observese que hay una etiqueta 0 en algunos de los vertices no nales. En
dichos vertices se realiza una jugada de azar y en cada alternativa del vertice
en cuesti on, a) el trabajador es atrapado in fraganti y b) no es atrapado,
se especica la probabilidad con que estas ocurrir an. La aparici on del azar
en el juego complicar a un poco el an alisis, pero todava resulta sencillo en-
contrar cu ales son los planes de acci on m as adecuados para cada jugador.
Haremos el supuesto de que al aparecer el azar, los jugadores se comportan
frente al pago esperado, buscando optimizarlo y haremos abstracci on de la
actitud de los jugadores frente al riesgo.
Ejemplo 2.2.4 (El Duelo). Dos personas se enfrentan en un duelo a pisto-
la. Cuando este empieza, los duelistas est an separados por una distancia de n
pasos. Cada pistola tiene una sola bala. Los duelistas se van alternando para
49
50 Juegos Extensivos
2
p
1
p
1
1p
2
1p
n2
p
n2
1p
n1
p
n1
1p
n
p
n
1p
I
espera
II
I
II
I
espera
espera
espera
espera
dispara
dispara
dispara
dispara
dispara
(1,1)
(1,1)
(1,1)
(1,1)
(1,1)
(1,1)
(1,1)
(1,1) (1,1)
(1,1)
(1,1)
0
0
0
0
0
Figura 2.2.4:
decidir si disparan sobre su oponente o dan un paso hacia este y esperan al
siguiente turno. Si el jugador, en su turno, decide disparar, la probabilidad
de herir a su enemigo depende de la distancia a la que se encuentran. La
gura 2.2.4 ilustra el juego. Cu anto deben esperar los jugadores para lanzar
el disparo si empiezan separados n pasos y las p
j
(probabilidad de atinar en
el blanco cuando la separaci on es de j pasos) est an dadas? (Binmore [4]).
Juegos de Informaci on no Perfecta.
Ejemplo 2.2.5 (El padre y sus tres hijos 1). Haba una vez un padre
que tena tres hijos. El padre quera heredar su tierra a dos de sus hijos, a
pesar de que el hijo restante tendra que conformarse con un gato. La raz on
de todo esto era que el padre saba que cuando sus tres hijos estaban juntos,
siempre llegaban a las manos. Terminaran por dividir su amada tierra. Era
importante que los dos hijos que heredaran la tierra estuviesen dispuestos a
compartir toda la vida cuid andola, no sea que, tambien a ellos, les viniese,
un da, la idea de dividirla. Por eso, decidi o hacer la siguiente pregunta,
por separado, a cada uno de sus hijos, A, B y C: A cu al de tus hermanos
preeres, para sufrirlo hasta el nal de tus das? Empez o por A, el hijo
50
Modelos de juegos no cooperativos 51
mayor, y continu o con el que A eligi o. Al elegido, B o C, no le cont o nada
de la reuni on anterior, ni siquiera si el era al segundo que entrevistaba o
ya haba hablado con los otros dos, no sali o de su boca palabra alguna
sobre la respuesta obtenida. Si el resultado de estas dos consultas dej o al
padre satisfecho, es decir, si A y B o A y C estaban en armona, a ellos
correspondi o la tierra, no tomara ya la opini on del tercer hermano, si no
fue as, hubo de recurrir a este ultimo y, sin hacer comentarios sobre pasadas
entrevistas, le hizo la pregunta consabida. De nuevo, si logr o el acuerdo entre
B y C, seran ellos los beneciados, pero si sus tres hijos eran tan necios
de tener preferencias circulares, ofrecera sus tierras a la hermosa joven a
quien cortejaba y que a un no se decida a entregarle el ansiado s. Quiz a la
promesa de las tierras, la alentara a aceptar al viejo terrateniente, aunque
sus tres hijos tuvieran que conformarse con el gato; despues de todo, algunos
de estos animales son muy listos.
Notemos que el padre no es uno de los jugadores, si lo fuera, quiz a buscase
aderezar con algunas buenas insidias, las entrevistas con sus hijos, buscando
provocar decisiones circulares. Es seguro que, de lograr el tal crculo, su
amada tierra correra el peligro de ser dividida y de terminar en manos de
no se sabe quien. Sin embargo la joven era tan hermosa! Bueno, pero esa es
otra historia.
El elemento de la informaci on en un juego complica tanto el an alisis que
no se podr a analizar en s mismo y habr a que recurrir a la construcci on de
un juego rectangular equivalente.
El juego se ilustra en la gura 2.2.5. Observese que los dos vertices con
etiqueta B est an encerrados en una elipse. Lo mismo ocurre con los vertices
con etiqueta C. Esto signica que B o C, seg un el caso, confunden situa-
ciones, no saben con quien ha hablado el padre, ni la (o las) respuesta(s)
obtenida(s). Pero eso implica que B tiene que contestar la misma pregunta
en los dos casos y confunde la respuesta A, en la situaci on en que A lo ha
elegido, lo que le asegurara el disfrute de la tierra, con la repuesta A en
el caso de que sea C, el que lo haya elegido, lo que le llevar a a tener que
compartir un gato con sus dos hermanos. Lo mismo ocurre con la respuesta
C. Es decir, para que un jugador confunda varios vertices, debe identicar
cada alternativa de uno de estos vertices con las correspondientes de los
otros vertices confundidos.
Decisiones simultaneas e informaci on no perfecta.
Ejemplo 2.2.6 (El padre y sus tres hijos 2.). Podemos pensar en la
misma historia, pero ahora el padre pide a sus hijos que escriban, sin ser
51
52 Juegos Extensivos
A
c a
a
a
b
C
B
C
(100,100,100)
(1,1,0)
(0,1,1)
(100,100,100)
b c
b
a c
B
(0,1,1)
(1,0,1)
Figura 2.2.5:
vistos, el nombre del hermano preferido en un papel y se lo entreguen si-
mult aneamente. El padre procedera con los mismos criterios que en 2.2.5
para hacer su testamento (Figura 2.2.6)
En este ejemplo, aparece el problema de simultaneidad de decisiones que
caracterizaba al modelo rectangular, pero, en el modelo extensivo, suponemos
que los jugadores se alternan en el tiempo para tomar decisiones, pues este
modelo no permite que lo hagan al mismo tiempo. Es decir, procedemos de la
siguiente manera: a) ordenamos a los jugadores, no importa cu al es el orden
elegido, b) el primer jugador tiene toda la informaci on, en el momento en
que decide y c) los jugadores que toman decisiones, despues de alg un otro,
confunden situaciones, cuando llega su turno, pues no conocen las elecciones
de los jugadores anteriores.
Ejemplos con todos los ingredientes
Ejemplo 2.2.7 (Negociaciones de un Sindicato). Un sindicato (SIN) va
a negociar el salario que los trabajadores recibir an en el a no y est a pensando
en dos posibilidades. Una de ellas es exigir 50 pesos diarios, exigir 100 es la
otra. Tiene, nuestro sindicato, un problema, pues no conoce bien el efecto
que ha tenido la campa na publicitaria en su contra que los medios de comu-
nicaci on han llevado a cabo. Por tal motivo no son evidentes las condiciones
52
Modelos de juegos no cooperativos 53
A
b c
B B
a a c c
C C C C
a a a b b b
(1,1,0)
(1,1,0)
(0,1,1)
(100,100,100)
(1,0,1)
(0,1,1)
(100,100,100)
a b
(1,0,1)
Figura 2.2.6:
de solidaridad que los dem as sindicatos y la poblaci on en general pueden
prestarle. Este asunto es muy importante para que tenga capacidad de re-
sistir una lucha larga y difcil. Lo unico que sabe, el sindicato, con respecto
a dicho asunto es que con probabilidad de tres quintos las condiciones le son
favorables, y con probabilidad dos quintos le son adversas. La empresa (EM)
tampoco est a enterada de si su campa na ha logrado mermar el prestigio del
sindicato. Y al conocer la exigencia salarial que se le presente, tendr a que
decidir si la acepta o, en su lugar, hace una contraposici on que puede ser
muy baja o no tanto.
Si la empresa no acepta su demanda, el sindicato, sin tener mejor infor-
maci on sobre las condiciones que enfrentar a si realiza una huelga, tendr a que
decidir si se lanza a ella o se conforma con lo que ofrece la empresa. En caso
de huelga, el juego podra seguir ahora con decisiones de la empresa ante
la interrupci on de su producci on.

Esta podra tratar de que intervenga el
gobierno con la fuerza p ublica, para restablecer la normalidad o arreciar la
campa na en contra del sindicato o amenazar con cerrar la f abrica o simple-
mente aceptar lo que se le est a pidiendo. Simulemos todas estas posibilidades
y las consecuentes respuestas del sindicato a traves de una distribuci on de
probabilidad sobre el triunfo de la huelga y su derrota. La huelga afectar a,
adem as, los pagos de empresa y sindicato. Con el modelo de la gura 2.2.7
esquematizamos la historia.
53
54 Juegos Extensivos
2/5 3/5
0
ac
(0,1000)
(0,0)
(100,0) (100,0)
50 100 50 100
SIN SIN
40 50
40 50
(50,50)
ac
EM EM
EM EM
40 30 30
SIN SIN SIN
(50,50)
SIN SIN
40
(30,70)
(40,60)
ac
h
(30,70)
SIN SIN
SIN SIN
h
ac
h
ac
(40,60)
ac
(40,60) (50,50) (40,60)
0
(80,30)
(35,80)
0
(80,30)
(40,40)
(40,40)
(25,65)
2/3
1/2 1/2
1/4
3/4
h
(40,40)
(35,60)
(80,30)
(35,60)
4/5
1/5
1/3
1/3
2/3
(80,30)
(45,35)
1/5
4/5
(30,70)
0
0
0
0
0
(45,35)
(25,65)
1/4
1/5 4/5
(45,35)
(25,65)
1/5
3/4 4/5
0
ac
h
ac
h
ac
ac
ac
h h
ac
Figura 2.2.7:
1/2
dos
1/2
as
(1,1)
I I
apuesta no apuesta apuesta no apuesta
(1,1)
(1,1)
(1,1) (2,2) (1,1) (2,2)
0
bluff
I
verdad
cree no cree cree no cree
II II
Figura 2.2.8:
Ejemplo 2.2.8 (El P oker Simplicado). En este juego participan dos
personas. Se tienen dos cartas, un as y un dos, al inicio del juego, en forma
aleatoria y con la misma probabilidad para el as y para el dos, se le entrega
al jugador I una de las dos cartas. El jugador II no puede ver dicha carta.
54
Modelos de juegos no cooperativos 55
Si I recibi o el as, est a obligado a declararlo. Si, por el contrario, recibi o el
dos, puede declarar la verdad (dos) o hacer blu, diciendo que tiene el as.
Despues de escuchar a I, pero sin ver la carta que este tiene, el jugador II
puede decidir creerle y pagarle 1 peso, o no creerle y subir la apuesta a 2
pesos. En caso de que II haya doblado la apuesta, I debe decidir si acepta
la nueva apuesta o no la acepta. En la gura 2.2.8 se ilustra esta historia
con los pagos correspondientes. Observese que cuando le toca el as a I, el
est a obligado a declararlo y no toma decisi on alguna, por ello no aparece un
vertice en donde I diga que tiene el as y directamente le toca a II decidir si
cree o no cree la declaraci on de I. En ese caso, al or la declaraci on de I, el
jugador II est a confundido entre si I realmente tiene el as o si tiene dos y
est a haciendo blu diciendo que su carta es un as.
Ejemplo 2.2.9 (La Industria Contaminadora). Cada vez que M, em-
presa de productos qumicos, echa a andar su proceso productivo, sin tomar
ninguna medida para prevenirlo, puede contaminar las aguas de un ro. Este
ro riega las dos parcelas de un campesino (C). Existe un inspector (In)
que puede obligar a M a indemnizar a C, en caso de da nar sus tierras. Es
epoca de lluvias y si estas son fuertes la probabilidad de da nar las tierras
ser a menor, pues la corriente dispersar a gran parte de los elementos conta-
minantes. M y C no saben como ser an las lluvias, la experiencia les permite
conocer la probabilidad de que sean fuertes o no lo sean. Antes de iniciar su
proceso productivo, M debe elegir entre tres opciones: i) adquirir un equipo
que evite la contaminaci on, a un a costa de mermar sus ganancias; ii) no
adquirir el equipo, pero intentar sobornar al inspector para evitar que este
la obligue a indemnizar a C, si se llegara a da nar alguna de las cosechas de
este; iii) cambiar sus inversiones hacia otra industria m as limpia, aunque
menos redituable. Por su lado, In sabe que independientemente de que el sea
corrupto o no, recibir a un premio por cada cosecha de C que no este conta-
minada. En cambio, si alguna est a contaminada y C no ha sido indemnizado,
In tendr a que pagar una multa, pues existe una poltica de castigo a la cor-
rupci on; recuerdese que la historia es cticia. Cuando M decida irse por el
camino f acil de la mordida, In puede aceptar o no el ofrecimiento de
M. In tiene que tomar su decisi on de aceptar o no la mordida, hasta que la
fuerza de las lluvias es ya un hecho. Despues de conocer la decisi on de In,
en cada uno de los dos casos, aceptar o no, M decidir a si echa a andar uno o
dos procesos productivos y C deber a tomar la decisi on de cuantas parcelas
cultivar a, una o dos, conociendo la decisi on de In, pero no la de M. Cuando
M toma medidas contra la contaminaci on, las tierras no sufren da no, pero
los pagos de M tendr an un descuento por los gastos anticontaminantes.
55
56 Juegos Extensivos
Supongamos que no se han tomado precauciones contra la contaminaci on,
entonces si las lluvias son fuertes, la probabilidad de que cada proceso pro-
ductivo da ne la cosecha de una de las parcelas es 1/5, de otra manera es de
2/5. Si M trata de sobornar al inspector, no gastar a en equipo y cuando
In acepta el soborno, esta mordida se descuenta al pago de M. Acepte o no
acepte In el soborno, puede haber, para M, multas por da nos (dependiendo
del azar), los pagos de C dependen de su propia decisi on, pero podr an verse o
no afectados por da nos e indemnizaciones que dependen de las decisiones de
M, de In y del azar. An alogamente ocurre con sobornos, premios y multas
que afectan el pago de In, pues estas, tambien, dependen de las decisiones
de todos los jugadores y del azar.
Se deja al lector la construcci on del modelo extensivo del conicto.
0
(1,1) (1,1)
(4,x)
(x,4)
1/4
1/12 1/4
1/12
(1,2)
1/12
(1,3)
(2,1)
(3,1)
(3,2)
I I I I I I
1/12
(2,3)
1/12
1/12
nc
0
nc
c nc
0
0
0 0
0
(1,1)
nc c nc c nc c nc
c
c
II II II II II II
(1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1)(1,1)
1/2 1/2 1/2 1/2 1/2
(1,1)
1/2 1/2 1/2 1/2 1/2 1/2 1/2
(1,1) (1,1) (1,1) (1,1) (1,1) (1,1)
c
nc nc nc nc nc c c c c
II II
0 0 0 0 0 0
nc c
(1,1)
c nc c nc c nc c
nc nc c
(1,1) (1,1) (1,1) (1,1) (1,1)
1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2
(1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1)
II
II II
II
Figura 2.2.9:
Ejemplo 2.2.10 (El juego del Contento). n personas juegan con una
baraja espa nola. Cada una de ellas recibe, al azar, una carta cubierta. Los
56
Modelos de juegos no cooperativos 57
jugadores comienzan a tomar decisiones en un orden preestablecido, si al-
guno de ellos recibe una carta con el n umero m as alto posible (rey), declara
BARRERA. El primer jugador que no tiene barrera decidir a si est a con-
tento con la carta que le toc o o la intercambia con el segundo si este no tiene
barrera. Este jugador est a obligado a aceptar el cambio y, a continuaci on,
realizar a una decisi on semejante, declararse contento o cambiarle al tercero
si este no tiene barrera. As continuar a el juego hasta llegar al ultimo jugador
que en caso de no encontrarse satisfecho con la carta que tiene, despues de
las decisiones de todos los dem as, tomar a una del monte, declarando barrera
si es un rey. Despues de terminada la ronda, todos muestran su carta y el
jugador que tiene la carta con el n umero menor se retira del juego, pagando
un peso, mientras los dem as reinician el juego. El proceso se repite, hasta
que no hay m as que un jugador. El que se queda hasta el nal gana el dinero
acumulado.
En la gura 2.2.9, se ilustra el modelo extensivo para el caso de dos
jugadores que juegan con una baraja de cuatro 4 cartas.
Juegos extensivos innitos
Por supuesto, los juegos extensivos pueden ser innitos. Algunos juegos
innitos no tienen partidas innitas, es decir, no contin uan indenida-
mente en el tiempo, sino que la realizaci on de cada enfrentamiento termi-
na despues de un n umero nito de jugadas. Sin embargo, son innitos,
porque, en uno o varios vertices del juego, existen una innidad de opciones
posibles, para alg un jugador o para el azar.
Hay otros juegos, en cambio, que tienen opciones nitas, en cada vertice,
pero son innitos debido a que algunas de las partidas posibles son innitas.
Desde luego, un juego puede ser innito en ambos sentidos.
Juegos innitos de informaci on perfecta
Ejemplo 2.2.11 (Demandas triviales, Rasmusen [44] (Amenazas
crebles e increbles)). Un campesino C, cuyas tierras est an siendo con-
taminadas por una empresa E, puede decidir demandar a la empresa, rea-
lizando un pago d por ello, o cruzarse de brazos y no hacer nada. En este
ultimo caso, el litigio termina, teniendo los dos rivales un pago de cero. En
cambio, si el campesino decidi o demandar, pero preere, despues de esto,
tratar de llegar a un acuerdo fuera de los tribunales, escoger a una cantidad
de dinero (i) para exigirla como indemnizaci on. Si la empresa acepta pagar
i, no proceder a la demanda en su contra y no habr a juicio. En cambio, si la
57
58 Juegos Extensivos
no hace nada
(0,0)
C
C
(id,i) (id,i)
C C
E
(id,i)
C
desiste jucio desiste jucio desiste jucio
(d,0)
E
(xdp ,xp )
E
demanda
i
acepta rechaza acepta rechaza acepta rechaza
... ... ...
i i
... ... ... ...
... ...
E
... ... ...
... ... ...
... ... ...
... ...
...
...
(d,0) (d,0)
c
(xdp ,xp )
E
c
(xdp ,xp )
E
c
Figura 2.2.10:
empresa rechaza la oferta, C debe decidir si cumple su amenaza de ir a juicio
o desiste. En el juicio, C obtendra la cantidad x positiva, pero tendr a que
pagar p a un abogado para que lo represente. En caso de juicio, la empre-
sa tambien tendr a gastos como pago a sus respectivos abogados. C puede
escoger cualquier cantidad real positiva, para exigirla como indemnizaci on
(i). Esto convierte al juego en innito, aunque ninguna de sus partidas
es innita. La gura 2.2.10 representa el modelo extensivo del problema, el
segundo vertice de decisi on de C tiene innitas salidas. Todas las ramas del
arbol que inician en los vertices correspondientes a decisiones de E tienen
la misma estructura. En la gura s olo aparecen tres de estas ramas.
Ejemplo 2.2.12 (Un juego de negociaci on). El vendedor de un objeto
y un posible comprador negocian, periodo tras periodo. El comprador no
est a dispuesto a pagar m as de p
C
, el vendedor no est a dispuesto a vender
por menos de p
V
. Para que sea posible la negociaci on y tenga cierto interes,
se supone que p
V
< p
C
. En el primer periodo, el vendedor hace una oferta de
precio p, tomada del intervalo [p
V
, p
C
]. A continuaci on, el comprador decide,
si acepta o rechaza dicho precio. En caso de aceptar, termina el juego; en
caso de rechazar, el comprador hace una contraoferta de precio tomado del
mismo intervalo. Ahora el vendedor debe decidir si acepta o rechaza, si
acepta termina el juego y si rechaza termina el periodo. Cuando un periodo
n termina con un rechazo, con probabilidad , 0 < < 1, habr a un nuevo
periodo de negociaci on y con probabilidad 1 terminar a el juego. Si, en
58
Modelos de juegos no cooperativos 59
alg un periodo, los negociantes llegan al acuerdo de compra- venta, al precio
p, el comprador gana p
C
p y el vendedor p p
V
. En cambio, si el juego
termina sin acuerdo los dos ganan cero. Cuando se supone que la negociaci on
tiene un lmite en el n umero de periodos, estaramos en un caso parecido al
anterior, un juego innito, sin partidas innitas. Pero tambien podemos
considerar que hay un n umero innito de periodos (horizonte innito). Esta
suposici on no deja de ser realista, aunque quiz a parezca lo contrario, ya que,
en diversos conictos, son frecuentes las situaciones en las que alg un jugador,
al tomar decisiones, no puede saber cuando llegar a el n de un conicto.
El n de algunos conictos se ve tan lejano que bien puede considerarse
innito, aunque, en cada periodo, hay una probabilidad positiva de que el
juego termine en ese momento. Por supuesto, la probabilidad de que contin ue
tambien es positiva. El modelo extensivo del juego es innito (gura 2.2.11),
pero la probabilidad de las partidas innitas puede ser cero, como suele
suceder en los juegos de negociaci on con horizonte innito.
Bierman y Fernandez [3] realizan un interesante an alisis sobre el desem-
pleo involuntario utilizando una versi on innita del juego que llamamos el
riesgo de contratar un holgaz an. En este juego, el salario podra ser cualquier
real positivo o quiz a pertenecer a un intervalo. Tambien, las opciones sobre
el esfuerzo que puede realizar el empleado pueden modelarse en un intervalo
y no solo como holgaz an y trabajador. El ejemplo no tiene partidas innitas.
Juegos extensivos innitos, con informaci on no perfecta
Cualquiera de los dos ultimos juegos puede servir de base a un juego con
informaci on no perfecta. Por ejemplo, el de demandas triviales.
Ejemplo 2.2.13 (Demandas triviales con informaci on no perfecta).
Pensemos en el mismo conicto anterior, con una diferencia. La empresa,
al rechazar pagar la indemnizaci on, considera la conveniencia de contratar
o no a un abogado, antes de saber si el campesino se lanzar a a juicio, pero
no le informa a C si lo contrat o o no. Entonces, cuando C debe decidir si
desiste del juicio o sigue adelante con el, no est a informado de si se enfrenta
a una empresa que ya est a asesorada por un abogado o no. En caso de juicio,
C tendr a que pagar a un abogado y la empresa, sino lo ha hecho, tambien
tendr a que hacerlo, ahora. Hay dos resultados posibles en caso de llegar a
juicio i) el campesino gana cierta cantidad de dinero; ii) el campesino pierde
y tiene que pagarle a la empresa. Cada uno de estos eventos ocurre con
59
60 Juegos Extensivos
Pc Pv
0
c =
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Pc Pv
a =
P Pv
Pc P
b =
P Pv
Pc P
b =
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
P
. . .
Pv
. . .
nac ac
Pc
ac ac
nac nac nac
V V V
nac
ac
nac nac nac
ac ac ac
Pv Pv Pc Pc Pc
P . . . . . . . . . . . . P
ac nac
V V V
. . . . . . . . . . . . . . . . . .
V
. . . . . .
ac
nac
ac
nac
ac
a a b a b c c b c
. . . . . . . . . . . . . . . . . . . . . . . .
. . . 0 0 0 0 0 0 0 0 0
. . .
1

. . . . . . . . . . . . . . .
1 1 1 1 1 1 1 1

. . . . . .

. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . .
V
nac
. . . . . . . . . . . .
C
C
C C C
V V
V
P
. . .
Pv
. . .
C
Pc
C
ac ac
nac nac nac
V V
nac
ac
nac nac nac
ac ac ac
Pv Pv Pv Pc Pc Pc
P . . . . . . . . . . . . P
. . . . . . . . . . . . . . . . . . . . . . . .
ac
nac
ac
nac
ac
a a b a b c c b c
. . . . . . . . . . . . . . . . . . . . . . . .
. . . 0 0 0 0 0 0 0 0 0
. . .
1

. . . . . . . . . . . . . . .
1 1 1 1 1 1 1 1

. . . . . .

. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . .
a = Pc Pv
0
c =
0
Pc Pv
ac
C C C
nac
nac ac
nac ac
. . . . . .
. . . . . .
C
. . .
P
. . .
. . .
C
P . . . . . .
Pv
. . . . . . . . . . . . . . . . . . . . . . . . . . .
ac
V V V V V
V
V
. . . . . . . . . . . . . . . . . . . . . . . . . . .
Figura 2.2.11:
60
Modelos de juegos no cooperativos 61
C
i i i
E E
ab nab
C C
C
No hace nada Demanda
... ... ... ...
... ...
acepta
...
jui
nab ... ab
...
C C
... C
...
des
...
...
C
jui
des des
...
des
jui
...
des
jui
...
jui
des
nab ... ...
...
...
rechaza rechaza ... acepta
rechaza ...
acepta
... ab
E ... ...
E E
... ...
E
...
jui
Figura 2.2.12:
cierta probabilidad que depende de que el abogado de la empresa este o no
contratado con anticipaci on (ver gura 2.2.12).
Un juego puede ser innito en cuanto al n umero de jugadores. Esto
puede parecer todava menos realista que el supuesto de que el tiempo sea
innito. Pero es una forma efectiva para modelar, por ejemplo, la situaci on de
los agentes en el mercado de competencia perfecta, ya que en un contexto
de teora de la medida se puede establecer que cada consumidor (y cada
empresa) no tiene capacidad, por s s olo, de afectar los precios. En este
texto no abordaremos ese tema.
61
62 Juegos Extensivos
2.3. Gracas y juegos extensivos
Algo de gracas
Para introducir, informalmente, los modelos extensivos en los ejemplos
anteriores hemos hecho uso de un tipo especial de gr aca que recibe el nom-
bre de arbol con raz. Esta gr aca es la parte medular en la denici on de
estos modelos. En esta secci on, se introducen algunos conceptos de Teora
de Gr acas para arribar al concepto de arbol con raz.
Una gr aca es una pareja (V, A), donde V es un conjunto y A es una
subcolecci on de la colecci on de todos los subconjuntos de dos elementos de
V . A V le llamaremos el conjunto de vertices y al conjunto A el de aristas.
Es decir, A x, y [ x y y est an en V . Si V es un conjunto nito, se
dice que la gr aca es nita.
Por ejemplo, en la gura 2.3.1 aparece la gr aca:
V = x
1
, x
2
, x
3
, x
4
, x
5
, x
6
, x
7
, x
8
,
A = x
1
, x
2
, x
1
, x
3
, x
3
, x
2
, x
3
, x
4
, x
5
, x
6
, x
5
, x
7
, x
6
, x
7
.
x
x x x x
x
x
x
8
7
5
6
4
3
1
2
Figura 2.3.1:
Observese que en una arista los vertices no tienen orden, mientras que
en el concepto de gr aca dirigida que se dene en 2.5.1, en las parejas de
vertices hay uno inicial y otro nal.
Dada una gr aca (V, A), una pareja (V

, A

), con V

V y A

A, se
dice que es una subgr aca de (V, A).
Una sucesi on de vertices v
1
, v
2
, ..., que puede ser nita o innita, es
una trayectoria de (V, A), si v
i
,= v
j
cuando i ,= j y v
i
, v
i+1
A para toda
i. Si v
1
, v
2
, ..., v
s
es una trayectoria, decimos que esta une a v
1
con v
s
.
En el ejemplo de la gura 2.3.1, algunas trayectorias son:
x
4
, x
3
, x
1
, x
1
, x
2
, x
3
, x
4
, x
5
, x
6
, x
7

Decimos que una gr aca es conexa, si para cada dos vertices u y v dis-
tintos existe una trayectoria que une a u con v.
La gr aca 2.3.1 no es conexa, ya que, por ejemplo, para los vertices x
3
y x
7
no existe una trayectoria que los una.
62
Modelos de juegos no cooperativos 63
En cambio son conexas las gr acas (V

, A

) y (V

, A

), con
V

= x
1
, x
2
, x
3
, x
4
, V

= x
5
, x
6
, x
7
,
A

= x
1
, x
2
, x
2
, x
3
, x
3
, x
1
, x
3
, x
4
y
A

= x
5
, x
6
, x
6
, x
7

Ambas son subgr acas de (V, A).


Decimos que una gr aca conexa no tiene ciclos, si para toda pareja de
vertices x y z, la trayectoria que los une es unica.
As (V

, A

) no tiene ciclos, mientras que (V



, A

) tiene ciclos, ya que,


en esta ultima, dos trayectorias distintas, x
1
, x
2
y x
1
, x
3
, x
2
, unen a x
1
con x
2
.
A una gr aca conexa y sin ciclos la llamamos un arbol.
En la gura 2.3.2 se representa el arbol (V, A) del juego del ejemplo
2.2.2.
V = v
1
, v
2
, v
3
, v
4
, v
5
, v
6
, v
7
, v
8
, v
9
, v
10
, v
11
y
A =
_
v
1
, v
2
, v
1
, v
3
, v
2
, v
4
, v
2
, v
6
, v
3
, v
5
,
v
3
, v
7
, v
5
, v
8
, v
5
, v
9
, v
7
, v
10
, v
7
, v
11

_
v
v
v
v
v
v v
v
v
v
v
5
1
2
3
6
7
4
10
11
9 8
Figura 2.3.2:
El vertice v
1
juega un papel especial dentro del juego, pues representa el
inicio de este.
63
64 Juegos Extensivos
Un arbol , en el que destacamos U, uno de sus vertices, es un arbol con
raz y se le denota como (, U).
En un arbol con raz U, se induce, en forma natural, un orden parcial
entre sus vertices, de la manera siguiente, dado un vertice v ,= U, denotamos
como W(v) a la trayectoria que une a U con v y entonces decimos que u es
menor o igual que v, u v, si u est a en W(v). Claramente es reexiva
y transitiva y se cumple que si u v y v u, entonces u = v, es decir, es
antisimetrica. Por otro lado, dados v
1
y v, dos vertices distintos de un arbol
con raz, no necesariamente son comparables, es decir, puede ocurrir que v
1
no sea menor o igual que v y que tampoco v sea menor o igual que v
1
. Por
ejemplo, en el arbol de la gura 2.3.2 v
5
y v
11
no son comparables. Por lo
tanto, es un orden parcial en el conjunto de vertices V .
Decimos que el vertice v
1
es estrictamente menor que el vertice v
2
, v
1
<
v
2
, si v
1
est a en W(v
2
) y v
1
,= v
2
.
En (, U), con = (V, A) un arbol y U un vertice, el vertice z es una
alternativa del vertice x, si x < z y x, z est a en A. Denotaremos como
Alt(x) al conjunto de alternativas del vertice x. Adem as, z es un vertice
nal de (, U), si su conjunto de alternativas es vaco. Usamos la letra T
para denotar al conjunto de los vertices nales.
En 2.3.2 el conjunto de alternativas de v
5
es v
8
, v
9
. Mientras que el
conjunto de vertices nales es v
4
, v
6
, v
8
, v
9
, v
10
, v
11
.
Una partida es una trayectoria maximal y, por lo tanto, empieza en
la raz. Una partida puede ser innita. En un arbol con raz nito, a cada
vertice nal z le corresponde una partida que sera W(z) y, recprocamente,
a cada partida le corresponde un vertice nal.
Denici on de Juego Extensivo
Recordemos el juego de las negociaciones de un sindicato (ejemplo 2.2.7).
En la gura 2.3.3, aparece el arbol del juego, (V, A), sin adornos (etiquetas,
probabilidades, conjuntos de informaci on, pagos), lo denotamos como .
V = x
1
, x
2
, x
3
, ..., x
49
, x
50
, x
51
y
A = x
1
, x
2
, x
1
, x
3
, x
2
, x
4
..., x
39
, x
51
.
T =
_
_
_
x
6
, x
7
, x
8
, x
11
, x
16
, x
18
, x
20
, x
21
,
x
26
, x
29
, x
30
, x
31
, x
32
, x
35
, x
36
, x
39
, x
40
, x
41
, x
42
,
x
43
, x
44
, x
45
, x
46
, x
47
, x
48
, x
49
, x
50
, x
51
_
_
_
Pero en un modelo extensivo aparecen m as elementos que el arbol con
raz. La gura 2.2.7, donde se modela la historia del ejemplo que tiene como
arbol el de la gura 2.3.3.
64
Modelos de juegos no cooperativos 65
x
23
x
20
x
29
x
x x
x
x
x
x
x x
x x
x x
x
x
x
x
x
x
x
x
x
x x
x
x
x
x
x
1
2 3
4
7
8
9
5 6
12 13
14 15
10
19
17
16
21
24
25
26
27
18
28
22
33
34
35
37
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
30
31
46
47
48
49
32
38
50
39
51
40
41
42
43
44
x
x
x
11
36
45
Figura 2.3.3:
Enumeramos los elementos del modelo completo:
Los vertices no nales tienen una etiqueta que especica si es una
jugada de azar (etiqueta 0) o cual de los jugadores debe decidir (etiqueta
con n umero o nombre del jugador). Por ejemplo, el jugador SIN decide en los
vertices x
2
, x
3
, x
12
, x
13
, x
14
, x
15
, x
17
, x
19
, x
16
y x
28
, mientras que el jugador
EM decide en x
4
, x
5
, x
9
y x
10
. Los vertices de azar son todos los dem as
vertices no nales.
Dado un vertice de azar, por ejemplo x
33
, est a denida la probabilidad
de que el juego pase a cada una de las alternativas de este vertice. Alt (x
33
) =
x
39
, x
40
. Por ejemplo, la probabilidad de que el juego pase a x
39
, supuesto
que ha llegado a x
33
, es
1
3
, mientras que la de pasar a x
40
es
2
3
.
Por otro lado, los jugadores SIN y EM no siempre reconocen en que
situaci on se encuentran cuando, les toca tomar decisiones. As, SIN no puede
distinguir entre x
2
y x
3
y, por eso mismo, confunde entre pedir un salario
de 100 pesos diarios cuando est a en x
2
con pedir esos 100 pesos estando
en x
3
. Otros vertices que confunde SIN son los de las parejas que est an
65
66 Juegos Extensivos
en cada uno de los conjuntos x
12
, x
14
, x
13
, x
15
, x
17
, x
22
y x
19
, x
28
.
En cada una de estas parejas de vertices, SIN no conoce en cu al de ellos
est a y debe decidirse por uno de los elementos del conjunto de ndices
aceptar la contraoferta, lanzarse a la huelga, sin tener esa informaci on.
Por su lado, el jugador EM confunde los vertices del conjunto x
4
, x
5
y,
por otro lado, los de x
9
, x
10
. El primer conjunto representa que E ha
recibido una exigencia salarial de 100 pesos diarios y no sabe como est an
las condiciones en la opini on p ublica y entonces tiene que escoger alguno de
los elementos del conjunto aceptar la exigencia de 100, ofrecer 40 pesos,
ofrecer 50 pesos. An alogamente, cuando ha recibido una exigencia de 50
pesos estara en alguno de los vertices de x
9
, x
10
y tiene que escoger entre
los elementos de aceptar pagar los 50, ofrecer 40 pesos, ofrecer 30 pesos.
Una observaci on es que el modelo extensivo postula que ning un jugador
puede confundir dos vertices que esten en la misma partida.
Por ultimo, en cada vertice nal hay un pago para cada jugador, por
ejemplo, en el vertice x
7
tenemos un pago de 100 pesos para SIN y cero
para EM y en el vertice x
8
, 50 pesos para cada jugador.
La denici on de juego extensivo que recoge todos estos elementos, se
debe a von Neumann, Morgestern [55] y Kuhn [30] y es la siguiente:
Denici on 2.3.1. Un juego extensivo con conjunto de jugadores N consta
de:
a) Un conjunto N de jugadores.
b) Un arbol con raz (, U), tal que para cada vertice v, Alt(v) o tiene
m as de un elemento o es vaco.
c) Una partici on de los vertices no nales en una colecci on de subconjun-
tos S
0
,
_
S
j
_
jN
, de tal manera que existe una biyecci on entre dicha
colecci on de subconjuntos y el conjunto N 0, el conjunto S
j
es el
conjunto de vertices del jugador j en N y S
0
es el conjunto de jugadas
de azar.
d) Para cada vertice v de S
0
, una distribuci on de probabilidad positiva
denida en Alt(v), y que la denotamos como P ( [ v ).
e) Para j ,= 0, una partici on de S
j
en una colecci on de subconjuntos
_
S
j
k
_
tales que
e
1
) para S
j
k
, existe I
j
k
y para todo v en S
j
k
una biyecci on : Alt (v)
I
j
k
.
66
Modelos de juegos no cooperativos 67
e
2
) si v y z est an en S
j
k
, entonces v no es mayor que z y z no es mayor
que v.
Dichos subconjuntos S
j
k
se llaman los conjuntos de informaci on
del jugador j.
f) Para cada j N, una funci on de pago
j
denida del conjunto de
partidas en R. El conjunto de partidas de , se denota como .
Todos los ejemplos de la secci on 2.2 son juegos extensivos.
Decimos que un juego extensivo es nito, si V y N son nitos.
Decimos que un juego extensivo es de informaci on perfecta, si para
cada jugador j N, cada S
j
k
consta de un s olo elemento.
Decimos que un juego extensivo es sin azar, si S
0
= .
Para utilizar los conceptos de probabilidad m as elementales, en este texto
suponemos que S
0
es nito.
En muchos juegos extensivos, es posible pensar en algunas de las partes
de estos, las que contin uan a un vertice no nal, como juegos extensivos. Por
ejemplo, en los juegos de informaci on perfecta, cada una de estas partes es
a su vez un juego extensivo.
Pensemos en la versi on ?? de las demandas triviales. Denotaremos a esta
versi on del juego como . La gura del juego se puede observar en 2.3.4.
Supongamos que los pagos est an bien denidos. Pongamos atenci on en el
vertice X. Podemos pensar en el juego extensivo cuyo arbol es (V
X
, A
X
),
con V
X
= Y V [Y X, mientras que las aristas son aquellas de que
unen vertices de V
X
y la raz es X. Los conjuntos de vertices de los jugadores,
los de informaci on, los de azar, con las probabilidades correspondientes y la
funci on de pago se heredan de . Tenemos un juego extensivo en el sentido
de la denici on 2.3.1 que se denotar a como
X
. Lo mismo se podra hacer
en los vertices Y
i
y en los Z
i
.
Dado un juego extensivo y un vertice no nal X, no siempre se puede
hacer lo anterior. Podra suceder que algunos vertices mayores o iguales que
X pertenezcan al mismo conjunto de informaci on que vertices que no son
mayores o iguales que X. Entonces, no podemos aspirar a que V
X
con las
herencias del juego original formen un juego extensivo, pues necesitamos de
vertices que no pertenecen a V
X
para completar la estructura de informaci on.
En el ejemplo que hemos estado discutiendo, el juego no se pude cortar en
ninguno de los vertices en que C tiene que decidir si se va a juicio o no lo
hace.
67
68 Juegos Extensivos
Precisemos las ideas que acabamos de discutir con las siguientes deni-
ciones.
Denici on 2.3.2. Decimos que el juego se descompone o se corta en el
vertice no nal X, si para toda Y X, con Y S
j
k
y Z S
j
k
, entonces
Z X.
(id,i) (id,i) (id,i)
a
1
a
2
b
2
b
1
a
3
b
3
a
4
b
4
C
i i i
E
ab nab
C C
C
No hace nada Demanda
... ... ... ...
... ...
acepta
nab ... ab
C C
... C
...
des
...
...
C
jui
des
jui
des
...
des
jui
...
des
jui
...
jui
nab ... ...
...
...
rechaza rechaza ...
...
acepta
... ab
... ...
E E ... ... ... Y Y E Y
X
... ... ... ...
E E Z Z Z
jui
des
...
( ) , ( ) , ( ) , ( ) ,
...
(,) (,) (,) (,) (,) (,) (,) (,)
acepta rechaza
Figura 2.3.4:
Denici on 2.3.3. Si se descompone en X, el subjuego de con raz X
es el juego extensivo
X
tal que
i) tiene como arbol a (V
X
, A
X
) y como raz a X, donde
V
X
= Y V [Y X, A
X
= Y, Z A[Y X y Z X;
68
Modelos de juegos no cooperativos 69
ii) S
0
X
=
_
Y S
0
[Y X
_
, si Y S
0
X
, para toda Z Alt (Y ),
P
X
(Z [Y ) = P (Z [Y );
iii) para toda j N, S
j
X
=
_
Y S
j
[Y X
_
. Si S
j
X
,= , S
j
k

_
S
j
i
_
,
S
j
k
= S
j
Xi
o S
j
k
V
X
= ;
iv) para cada , partida de que contiene a X, consideramos

X
= ( W (X)) X.
Para cada j: i) Si
X
es nito y z es el vertice nal correspondiente,
entonces
X
j
(z) =
j
(z). ii) Si
X
es innita
X
j
(
X
) es
j
() menos
el pago acumulado hasta X.
Un interes de los subjuegos se debe a que podremos analizar por partes
el juego. Supongamos que el juego del ejemplo ?? est a completo (es decir, en
los parentesis vacos tenemos pagos) y que hemos analizado el subjuego
Z

(gura 2.3.5), c omo continuar el an alisis? Pensaremos en el resto del juego,


casi como otro juego. Es decir, borramos de todos los vertices mayores
que Z

, conservando para todos los dem as vertices de , los elementos del


juego en que est an involucrados (aristas, conjuntos de jugador y de azar,
conjuntos de informaci on, probabilidades, pagos). Tendramos as casi un
tercer juego, excepto porque Z
1
se ha convertido en un vertice nal, pero no
tiene un pago asignado (gura 2.3.6).
C C
no abogado abogado
desiste jucio jucio
ab
(d,p )
(wdp ,wp p )
E ab
C C
E
E
desiste
)
(d,0)
(xdp ,xp
Figura 2.3.5:
69
70 Juegos Extensivos
(id,i) (id,i) (id,i)
C
i i i
E
ab nab
C
No hace nada Demanda
... ... ... ...
acepta
...
des
...
des des des
nab ...
...
...
rechaza
...
acepta
... ab
...
X
...
E E Y Y E Y
E Z Z
jui jui jui
...
... ... ... ...
C
C
C C
...
(,) (,) (,) (,) (,) (,) (,) (,)
rechaza
rechaza acepta ...
jui
(0,0)
Z* ... ...
... ... ... ...
Figura 2.3.6:
Denici on 2.3.4. Si se descompone en X y d R
N
es un vector de pago,
[X (d) , el juego podado en X con vector de pago d, en dicho vertice, es el
juego extensivo tal que,
i) tiene como arbol a (V [X, A[X) y como raz a U,
donde V [X = Y V [Y X y
A[X = Y, Z A[Y y Z est an en V [X ;
ii) S [X
0
=
_
Y S
0
[Y X
_
, si Y S [X
0
;
para toda Z Alt (Y ), P [X (Z [Y ) = P (Z [Y );
iii) para toda j N, S

X
j
=
_
Y S
j
[Y X
_
. Si S

X
j
,= , para todo
conjunto S
j
k
en
_
S
j
i
_
, S
j
k
= S [X
j
i
o S
j
k
V [X = ;
iv) [X = (
X
) W (X), donde
X
=
X
[ y X .
Adem as, [X es la restricci on de para el conjunto de partidas de
[X (d) distintas de W (X) y [X (W (X)) = d.
70
Modelos de juegos no cooperativos 71
1/2 1/2
Y
dos as
verdad
bluff
Y* II
I I Z* Z
apuesta apuesta no apuesta no apuesta
(1,1)
(1,1)
(1,1)
(1,1) (2,2)
(1,1)

Y** II
0
I
(2,2)
cree no cree cree no cree
Figura 2.3.7:
Usamos la notaci on [X para el arbol de cualquier juego podado en
X, es decir, sin importar el vector de pago asignado en X. [X (d) denota
el juego podado en X y con el vector de pago d en el vertice nal X.
(1,1)
apuesta no apuesta

z

(2,2)
Figura 2.3.8:
Es claro que un juego no se descompone en X, si existe otro Y en su
conjunto de informaci on. Un juego de informaci on perfecta se puede cortar
en cualquiera de sus vertices no nales.
El subjuego
Z
y el casi juego [Z

(del ejemplo 2.2.13 de demandas


triviales) se pueden observar en las gura 2.3.5 y 2.3.6.
El juego del p oker simplicado (Ejemplo 2.2.8) que se ilustra en la gura
2.3.7 no se puede descomponer en Y ni en Y

, pero se puede descompo-
ner en Z y en Z

y, entonces, se pueden construir


Z
, [Z(d), [Z(d)
Z
,
[Z(d) [Z

(d) (guras 2.3.82.3.10).


71
72 Juegos Extensivos
(|(1,1))
1/2 1/2
Y
dos as
verdad
bluff
Y* II
I Z*
apuesta no apuesta
(1,1)
(1,1)
(2,2)
Y** II
0
I
(1,1)
Z
(1,1)
cree no cree cree no cree
(2,2)
Figura 2.3.9:
1/2 1/2
Y
dos as
verdad
bluff
Y* II
(1,1)
(1,1)
Y** II
0
I
(1,1)
Z
(1,1) (2,2)
Z*
(|(1,1))|((2,2)
creer no creer creer no creer
Figura 2.3.10:
2.4. Posici on o Historia?
El concepto de juego extensivo que hemos estudiado a lo largo de este
captulo fue introducido por von Neumann y Morgenstern y desarrollado por
Kuhn. Como hemos estado insistiendo, este concepto aporta m as recursos
para el an alisis de muchos conictos reales que otros conceptos como, por
ejemplo, el de juego rectangular. Sin embargo, a pesar de ello, desde el punto
de vista de una persona que se acerca por primera vez a la Teora de Juegos,
el concepto de juego extensivo est a lejos de ser intuitivo.
Uno deseara que, en el modelo extensivo del Ajedrez, una distribuci on
posible de las piezas y el se nalamiento del jugador al que le corresponde
72
Modelos de juegos no cooperativos 73
C3AD P4AR
BLANCAS
NEGRAS NEGRAS
NEGRAS X NEGRAS Y
BLANCAS
BLANCAS
P4AR C3AD
P3AD P3AD
... ... ...
... ... ...
... ... ...
P4TR
Figura 2.4.1:
tirar, es decir, lo que podramos llamar una posici on del juego, se repre-
sentara, en el modelo, por un solo vertice, pero esto no es as. Por ejemplo,
imaginemos que se han realizado las tres jugadas siguientes:
BLANCAS NEGRAS
P4AR P3AD
C3AD
El juego habra llegado exactamente a la misma posici on que si las ju-
gadas se hubieran desarrollado de esta otra manera:
BLANCAS NEGRAS
C3AD P3AD
P4AR
El modelo extensivo de Kuhn reserva un vertice distinto para cada uno
de los dos desarrollos o historias del juego, aunque estos hayan llevado a
la misma posici on. Otra forma de describir el juego, utilizando otro tipo de
gr acas, sera asignar a cada vertice, una distribuci on de piezas en el tablero
junto con el se nalamiento del jugador al que le toca tirar. En las guras
2.4.1 y 2.4.2 se compara, s olo para las tres tiradas anteriores, el modelo
extensivo con la nueva gr aca propuesta.
Consideremos las mismas dos formas de describir un juego completo, con
un ejemplo mucho m as simple que el Ajedrez.
73
74 Juegos Extensivos
C3AD P4AR
BLANCAS
P3AD P3AD
... ...
...
... ...
...
BLANCAS
... NEGRAS NEGRAS
...
...
NEGRAS
BLANCAS ...
...
...
P4AR C3AD
Figura 2.4.2:
Ejemplo 2.4.1 (El juego de los cerillos). Se coloca una hilera de n
cerillos y dos jugadores se van turnando para levantar 1, 2 o 3 cerillos, el
que levanta el ultimo pierde.
En las guras 2.4.3 y 2.4.4 se ilustran las dos formas de describir el juego,
cuando n = 5. La primera es uno de nuestros juegos extensivos, a la segunda
la bautizaremos con el nombre de Juego de Posiciones, en esta secci on la
deniremos en forma precisa.
Los vertices de un juego de posiciones representan las posiciones posibles
dentro del juego estudiado. En cambio, en un juego extensivo, los vertices
representan las historias posibles, desde el inicio del juego, hasta una
posici on dada. Esto hace que el n umero de vertices de un modelo ex-
tensivo para cualquier situaci on algo complicada sea enorme, inmanejable
a un para una computadora. Pero, a pesar de ello, como se observa al com-
parar las guras, la segunda gr aca, que es un arbol, es mucho m as sencilla
y de ah la mayor atracci on te orica del modelo extensivo.
Proponemos, en esta secci on, la denici on de juego de posiciones que,
al apegarse m as a la intuici on, puede jugar un papel did actico para aclarar
el concepto de juego extensivo. Mostramos, tambien, que realmente los dos
modelos resultan equivalentes. Los Juegos de Posiciones tienen interes en
s mismos y pueden ser un instrumento para construir algoritmos que re-
suelvan algunos juegos, pero no abordaremos esta ultima problem atica.
74
Modelos de juegos no cooperativos 75
(1,1) (1,1)
II
1 2 3
I I
(1,1) (1,1) (1,1) (1,1)
II
1 2 3
(1,1) (1,1)
1 2
I
2 1
II II
(1,1)
(1,1)
(1,1)
(1,1)
1 2
I
1
2
3
1 2 3 1 2
Figura 2.4.3:
Juegos de Posiciones
Empecemos por considerar a los juegos de sal on como el Ajedrez, el
P oker, el Bridge, el Go, el Domin o, etc.
Cada uno de estos juegos consiste de multitud de posiciones. En algunas
de estas, uno de los jugadores debe tomar una decisi on, en otras, entra en
acci on alg un mecanismo de azar, como tirar unos dados, revolver las
cartas de la baraja, etc., por ultimo, otras posiciones corresponden al nal
del juego.
Si un juego ha llegado a una posici on X y puede pasar a otra Y , ya sea
por una decisi on de uno de los jugadores o debido al funcionamiento de un
mecanismo de azar, diremos que la posici on Y sucede inmediatamente a la
posici on X y podemos simbolizarla como X Y .
Por ejemplo, en el juego de posiciones para los cerillos ilustrado en la
gura 2.4.4, podramos escribir X Y , donde X y Y son, respectivamente,
las posiciones se naladas como II(3) y I(2). La primera II(3) signica hay
tres cerillos y le toca tirar a II, la segunda I(2) signica hay dos cerillos y
le toca a I. Las reglas del juego permiten pasar de la primera a la segunda.
Tambien si Y = I(1), X Y , etc.
Una sucesi on nita o innita de posiciones X
0
, X
1
, X
2
, . . . es una
historia posible a partir de X
0
o simplemente una historia a partir de X
0
75
76 Juegos Extensivos
F
2
(1,1) F
1
(1,1)
(0)
I(3)
I(5)
I(2)
I(1)
(0)
II(4)
II(3)
II(2)
II(1)
Figura 2.4.4:
si X
i1
X
i
, para i = 1, 2, . . . En el juego de los cerillos podemos tomar
X
0
= I(5), X
1
= II(3), X
2
= I(1), X
3
= F
2
(0) es un ejemplo de historia
posible, desde el inicio del juego, hasta una posici on nal, una partida.
La posici on X conduce a Y (en smbolos X Y ) si existe una historia
nita X
0
, X
1
, X
2
, . . . , X
r
con X
0
= X y X
r
= Y .
En la gran mayora de los juegos de sal on existen reglas para impedir
que se pase m as de una vez por una misma posici on. Por ello, admitiremos
que si X Y y Y X entonces X = Y .
Llegamos as a nuestros primeros requerimientos para denir un Juego
de Posiciones:
En primer lugar, un Juego de Posiciones J consta de un conjunto P lla-
mado de posiciones, en el cu al, se encuentra denida una relaci on (que
leeremos seguida inmediatamente de) tal que se cumplen los siguientes
axiomas:
Axioma 2.4.1. Si X Y , entonces X ,= Y .
Axioma 2.4.2. Si X Y y Y X, entonces X = Y (en donde la relaci on
est a denida como arriba).
76
Modelos de juegos no cooperativos 77
Es f acil demostrar, desde la denici on, que la relaci on es reexi-
va y transitiva y, por el axioma 2.4.2, es tambien antisimetrica. Por tanto
constituye un orden parcial para P.
Si X es una posici on del juego, el conjunto de las alternativas correspon-
dientes a esa posici on, Y P

X Y , se denotar a como Alt(X).


Nos limitaremos al caso en que, para toda posici on X, el conjunto Alt(X)
es vaco o tiene un n umero de elementos nito y mayor que uno.
Diremos que una posici on Z es nal si Alt (Z) es vaco.
Esta condici on es equivalente a decir que Z es de tal manera que Z X
implica X Z.
El conjunto de todas las posiciones nales ser a denotado con la letra F.
En el juego de los cerillos, F = F
1
(0), F
2
(0).
A las posiciones que no est an en F las llamaremos disyuntivas. Al con-
junto de disyuntivas lo denotaremos como D. N otese que D = P F.
Como decamos antes, al llegar el juego a algunas de las disyuntivas X,
se pone en funcionamiento un mecanismo de azar que determina a cual de
las posiciones del conjunto Alt(X) pasar a el juego.
Esto nos conduce a nuestro:
Axioma 2.4.3. Existe un subconjunto R
0
D, tal que para cada X en R
0
se tiene una distribuci on de probabilidad positiva en Alt(X).
Nuestro socorrido ejemplo de los cerillos es un juego sin azar y de in-
formaci on perfecta. Adelant andonos a la denici on de juego de posici on,
recurramos al juego del contento cuya historia se relata en el ejemplo 2.2.10
y cuya gr aca c omo Juego de Posiciones aparece en la gura 2.4.5 (el modelo
extensivo est a en la gura 2.2.9). Este juego s tiene posiciones de azar que
son la inicial I y, adem as, Z (3, 1), Z (3, 2), y Z (2, 3). La notaci on Z (i, j)
signica que la repartici on de cartas en ese momento est a dada por (i, j) y
el jugador dos, como no estaba contento con la carta j, preri o que hubiera
una jugada de azar. Las posiciones Z (2, 1), Z (1, 2) y Z (1, 3) no aparecen,
pues al realizarse en ellas la jugada de azar, saldra ganador en ambas posi-
bilidades, el jugador dos y por lo tanto la unica posici on que sigue a ellas es
G
1
y no hay propiamente una jugada de azar.
Alt(I) = (1, 2) , (1, 3) , (2, 1) , (2, 3) , (3, 1) , (3, 2) , G
1
, G
2
, la probabili-
dad correspondiente a cada una de las seis primeras es
1
12
y a cada una de
las dos ultimas es
1
4
.
Alt
_
Z (3, 1)
_
= Alt
_
Z (3, 2)
_
= Alt
_
Z (2, 3)
_
= G
1
, G
2
, la probabili-
dad correspondiente a cada una es
1
2
.
Pasemos, ahora, al problema de las decisiones de los jugadores. Si X
est a en D R
0
, X es una disyuntiva para algunos de los jugadores.
77
78 Juegos Extensivos
Axioma 2.4.4. Existe una partici on del conjunto DR
0
en n subconjuntos
R
1
, R
2
, ..., R
n
.
El subconjunto R
j
ser a llamado el conjunto de las disyuntivas del jugador
j.
C omo expresar la informaci on que tienen los jugadores?. Al igual que en
los juegos extensivos, nos preocupa introducir, en el modelo de posiciones,
el hecho de que, en algunos juegos, existen posiciones distintas X y Y en
R
j
tales que, al llegar a alguna de las dos, j no es capaz de distinguir en
cual de ellas est a, pues los datos que ha recibido del desarrollo del juego no
se lo permiten. En este caso escribiremos X Y y leeremos j identica la
posici on X con la Y . La relaci on es claramente una relaci on de equiva-
lencia. Adem as, si ocurre que el jugador j identica X con Y , debe confundir
cada alternativa de Alt(X) con alguna de las alternativas de Alt(Y ). Es de-
cir, establece una correspondencia entre los elementos de Alt(X) y los de
Alt(Y ).
En los juegos que hemos estado discutiendo, cada jugador j es un in-
dividuo o un equipo formado por varios individuos. En este ultimo caso,
cada clase de R
j
se considerar a asignada a uno solo de los componentes del
equipo. Por esta raz on si X y Y est an en R
j
, con X ,= Y , no puede ocurrir
simult aneamente que X Y y que X Y .
Todas estas consideraciones nos conducen a los siguientes axiomas adi-
cionales.
Axioma 2.4.5. Para cada jugador j, se tiene una relaci on de equivalencia
en el conjunto R
j
. Para cada clase de equivalencia R
j
k
correspondiente a
dicha relaci on, se tiene un conjunto I
j
k
tal que para cada X en R
j
k
existe una
correspondencia biunvoca que a cada Y de Alt(X) le asocia un elemento
de I
j
k
.
Axioma 2.4.6. Si X y Y son dos posiciones distintas que est an en R
j
, no
pueden cumplirse simult aneamente las relaciones X Y y X Y .
Finalmente consideremos la cuesti on de los pagos:
Axioma 2.4.7. Se tiene una funci on de pago : P R
n
llamada la funci on
de pago.
Para cada X en P, la componente j-esima
j
(X) del vector (X) se
llama el pago que recibe el jugador j, si el juego llega a la posici on X.
Un juego de posiciones J tiene un inicio, si se cumple el siguiente axioma
adicional.
78
Modelos de juegos no cooperativos 79

1/12
1/4
1/4
1/12
1/12
1/12
I(2,3)
1/12
I(3,2) I(3,1)
1/12
1/2
1/2
1/2
1/2
II(2,3)
II(1,3)

G G
I
II(1,2)
I(1,3) I(1,2)
I(2,1)
Z(3,1)
Z(3,2)
II(3,2)
II(2,1) II(3,1)
II(2,3)
II(1,3)
II(3,2) II(1,2)
II(2,1)
Z(3,2)
II(3,1)
0
~
~
~
0
0
0
Figura 2.4.5:
Axioma 2.4.8. Existe U en P tal que para toda X en P, U X.
En este caso, U se llamar a la posici on inicial que, claramente es unica.
Consideraremos juegos en que P ,=
_
U
_
.
En un juego de posiciones se cumplen los axiomas 2.4.12.4.8.
En la gura 2.4.5 se representa el juego de posiciones correspondiente al
juego del contento.
A las historias posibles desde la posici on inicial las llamaremos simple-
mente historias.
Una historia es una partida si es maximal, en particular, si conduce a
una posici on nal.
En un juego de posiciones est a involucrada una gr aca, (P, B), donde
B = X, Y

X y Y est an en P y X Y o Y X. Esta gr aca no es


necesariamente un arbol, aunque a veces puede serlo. Este ultimo caso,
ocurre cuando no existen en el juego historias distintas que lleven a la misma
posici on. Los juegos de posiciones de los ejemplos del contento y del juego
de los cerillos, con n 5, dan lugar a gr acas que no son arboles.
79
80 Juegos Extensivos
Los Juegos de Posiciones y los Juegos Extensivos.
Consideremos J un juego de posiciones con inicio U. Veremos que pode-
mos asociarle un juego extensivo que lo represente.
Lo primero que construiremos ser a el conjunto de vertices V .
Ya habamos observado que, en un juego extensivo, los vertices son, en
cierto sentido, historias de desarrollo del juego. Basemonos, entonces, en la
denici on precisa de historia que existe en los Juegos de Posiciones para
construir nuestro conjunto de vertices. Diremos que v es un elemento de V ,
es decir un vertice, si es una historia nita de J.
Entonces, si v est a en V , v es una sucesi on nita de posiciones
X
0
, X
1
, ..., X
l
tal que X
0
= U y X
i
X
i+1
para i = 0, 1, ..., l 1.
Tenemos, ahora, que hablar de aristas y, como para que una historia
este unida a otra a traves de una arista, las dos deben ser casi iguales excepto
por el ultimo elemento de una de ellas, diremos que dos vertices u y v forman
una arista, u, v A, si son tales que
u = X
0
, X
1
, ..., X
l
y v = Y
0
, Y
1
, ..., Y
s
con l = s + 1 o s = l + 1 y,
adem as, X
i
= Y
i
, para i = 0, 1, ..., d 1 y X
l
Y
s
, si d = s o Y
s
X
l
, si
d = l (d = m ax l, s. Entonces, A denotar a nuestro conjunto de aristas.
Es importante, si queremos seguir adelante, que la gr aca (V, A) que
hemos construido sea un arbol.
Proposici on 2.4.1. (V, A) es un arbol.
Demostraci on. Sean u y v en V . Entonces,
u = X
0
, X
1
, ..., X
l
y
v = Y
0
, Y
1
, ..., Y
s
. U = X
0
= Y
0
.
Hacemos u
0
= X
0
, u
1
= X
0
, X
1
, u
2
= X
0
, X
1
, X
2
, ...,
u
l
= X
0
, X
1
, ..., X
l
= u y
v
1
= Y
0
, Y
1
, v
2
= Y
0
, Y
1
, Y
2
, ...,
v
s
= Y
0
, Y
1
, ..., Y
s
= v.
Las ues y las ves son historias, es decir vertices y son distintas dos a dos.
Por la forma que tienen, es evidente que si las ordenamos en una sucesi on
adecuada, a saber
g = u
l
, u
l1
, ..., u
1
, u
0
, v
1
, v
2
, ..., v
s
,
obtenemos una trayectoria que une a u con v. Por lo que (V, A) es conexa.
Claramente g es la unica trayectoria que une a u con v. Es decir (V, A)
es un arbol.
80
Modelos de juegos no cooperativos 81
Tomamos como raz del arbol que hemos construido a U = U .
Como la raz induce un orden parcial entre los elementos de V , podemos
denir el conjunto de alternativas de un vertice y los vertices nales de
. Estos ultimos ser an aquellos cuyo conjunto de alternativas es vaco y
corresponden a las historias que unen el inicio del juego J con uno de los
vertices nales de dicho juego.
C omo asignar etiquetas de jugador o de azar a un vertice no nal que
es una sucesi on de posiciones cada una con su etiqueta respectiva? Pues le
asignaremos la etiqueta de la ultima posici on de la historia. Dicha posici on
no es nal por lo que J le otorg o una etiqueta. O lo que es lo mismo, para
i = 0, 1, 2, ..., n, S
i
consta de todas las historias que terminan en posiciones
de R
i
.
Cuando v es un vertice de azar, es decir, cuando su posici on nal X
m
est a en R
0
, sus alternativas son historias con una posici on m as que X
m
y dichas posiciones son alternativas de X
m
en J y, por lo tanto, tienen
asignada una probabilidad. En , esta misma probabilidad se asignar a a la
alternativa que la contiene.
En cuanto a c omo heredar el problema de la informaci on, desde J hasta
, podemos proceder de la manera siguiente. Es claro que cada vertice v que
pertenece a S
j
es una sucesi on nita, y la posici on nal que compone dicha
sucesi on pertenece a alg un R
j
k
. Con esta idea, podemos partir a S
j
en los
conjuntos de informaci on de j, es decir, v est a en S
j
k
si y s olo si su posici on
nal en v est a en R
j
k
.
Obviamente
_
S
j
k
_
es una partici on de S
j
, pues la colecci on R
j
k
parte
a R
j
y, adem as, es claro que se cumplen las dos condiciones que el axioma
4 de juegos extensivos impone, pues se heredan de las condiciones de la
partici on que R
j
sufre con los axiomas 2.4.5 y 2.4.6 del Juego de Posiciones.
Siendo m as explcitos, respecto a la primera condici on, la existencia de un
conjunto de ndices asociado a S
j
k
, es natural que nuestro candidato a I
j
k
sea
el conjunto de ndices que corresponde a R
j
k
y que con este quede tambien
inducida, en forma natural, la necesaria correspondencia biunvoca entre I
j
k
y
las alternativas de cualquier vertice de S
j
k
. En cuanto a la segunda condici on,
es evidente que se desprende del axioma 6 de Juegos de Posiciones.
Por ultimo, nos falta construir la funci on de pago en . Recordemos que
en J tenemos asociado un vector de pago en cada posici on. Supongamos
que, para cada partida de J, X
0
, X
1
, ..., X
m
, . . ., se tiene la propiedad
de que la serie

(X
i
) converge. Si es una partida de , es decir =
v
0
, v
1
, v
2
, ..., v
m
, . . ., donde v
0
=
_
U
_
y v
l
= X
0
, X
1
, ..., X
l
, entonces
81
82 Juegos Extensivos
podemos denir () =

(X
l
), con X
l
el vertice nal de v
l
.
2.5. Gracas Dirigidas y Juegos.
En este captulo, las gr acas han sido el instrumento esencial para ex-
presar o modelar los conictos. Cuando estas gr acas son dirigidas, nos
aportan nuevos elementos para el an alisis. En la secci on 2.6 y, sobre todo,
en el captulo 8 nos servir an para describir din amicas de aprendizaje de los
jugadores y, con ello, se empezar a a poner a prueba el derecho de los equi-
librios de Nash a llamarse soluci on de un juego. Por ahora, introducimos a
las gr acas dirigidas y las usamos para describir algunos juegos de manera
distinta a los Juegos Extensivos y a los Juegos de Posiciones y esto nos per-
mitir a acercarnos al concepto de soluci on de un juego, con metodos distintos
a los dominantes en este texto. S olo pretendemos, con esto, mostrar otras
direcciones en el camino.
Denici on 2.5.1. Una digr aca es una pareja
_
V,

A
_
, donde V es un
conjunto y

A V V = (u, v) [u y v en V .
A los elementos de V se les llama vertices y a los de

A echas.
Es decir, una digr aca es una gr aca dirigida en la que hemos con-
vertido a cada arista en una echa, pues sus elementos tienen orden. Se
recordar a que en las gr acas que utilizamos para la denici on de juego ex-
tensivo, p agina ??, el orden de los vertices de una arista no importaba. En
cambio, ahora, en las echas, uno de los vertices es inicial y el otro es nal.
En esta secci on y la siguiente se comprender a la utilidad de este orden entre
los vertices.
Ejemplo 2.5.1. Sea la gr aca (V, A), con V = a, b, c, d, e, f, g y
A =
_
a, b, a, c, a, d, a, e, b, c, b, d, c, e,
c, g, c, f, d, e, d.g, d, f, f, g
_
.
Si ahora orientamos cada arista de tal manera que

A =
_
(b, a), (a, c), (a, d), (a, e), (c, b), (b, d), (e, c),
(c, g), (c, f), (d, e), (g, d), (f, d), (g, f)
_
,
obtenemos la digr aca (V,

A) que aparece en la gura 2.5.1.


82
Modelos de juegos no cooperativos 83
En las digr acas, hablamos de trayectorias dirigidas como una sucesi on
de vertices, a
0
, a
1
, a
2
, ..., a
m
, . . ., tales que (a
i
, a
i+1
)

A para toda i.
En el ejemplo de la gura 2.5.1, b, d, e, c, g, f es una trayectoria dirigida.
Un ciclo dirigido es una trayectoria dirigida nita a
0
, a
1
, a
2
, ..., a
m
, tal
que a
0
= a
m
.
En el ejemplo mencionado a, e, c, b, a es un ciclo dirigido.
a
f
d
b
g
e
c
Figura 2.5.1:
Supongamos un juego nito de ganar perder en el que dos personas se
turnan para tomar sus decisiones. Cuando una posici on sin considerar al
jugador que le toca decidir se repite, el juego termina. Si construimos una
digr aca asociada al juego en el que cada vertice representa una posici on
posible, no importando a que jugador le toca decidir y (x, y) es una echa
si dichas posiciones x y y son tales que se puede pasar de x a y por la
decisi on de uno de los jugadores, entonces obtendremos una digr aca sin
ciclos dirigidos.
Por ejemplo, al juego de los n cerillos, donde los jugadores pueden levan-
tar 1, 2, . . . , m cerillos y el que levanta el ultimo pierde, le podemos asociar
una digr aca de la siguiente manera:
El conjunto V tiene n elementos, cada uno representa el n umero de
cerillos que existen cuando le toca decidir a un jugador, es decir V = n,
n 1, . . . , 2, 1. Cada uno de los jugadores puede estar colocado en muchos
de estos vertices. El conjunto

A es el de parejas ordenadas de V tales que
se puede pasar desde el primer elemento de la pareja al segundo con una
decisi on de uno de los jugadores, levantar 1, 2, . . . , m cerillos.
La gura 2.5.2 ilustra la digr aca, cuando n = 17 y m = 3.
83
84 Juegos Extensivos

A =
_

_
(17, 16) , (17, 15) , (17, 14) , (16, 15) , (16, 14) ,
(16, 13) , (15, 14) , (15, 13) , (15, 12) , (14, 13) ,
(14, 12) , (14, 11) , (13, 12) , (13, 11) , (13, 10) ,
(12, 11) , (12, 10) , (12, 9) , (11, 10) , (11, 9) ,
(11, 8) , (10, 9) , (10, 8) , (10, 7) , (9, 8) , (9, 7) ,
(9, 6) , (8, 7) , (8, 6) , (8, 5) , (7, 6) , (7, 5) ,
(7, 4) , (6, 5) , (6, 4) , (6, 3) , (5, 4) , (5, 3) ,
(5, 2) , (4, 3) , (4, 2) , (4, 1) , (3, 2) , (3, 1) , (2, 1)
_

_
Para cada uno de estos juegos, nos gustara caracterizar al conjunto S
de posiciones perdedoras. Si hemos logrado caracterizar a S, la estrategia
ganadora de un jugador que no est a en una posici on de S, sera llevar al
contrario a dicho conjunto.
En el juego de los cerillos, ejemplo 2.4.1,
S = x V [x 1(m odulo m+ 1).
Es decir, S es el conjunto de los naturales menores o iguales que n que al
dividirlos entre m+1 dejan residuo 1. S es el conjunto de todas las posiciones
perdedoras del juego, pues tiene dos propiedades que lo caracterizan y que
hacemos explcitas a continuaci on:
Bauticemos a los dos jugadores con los nombres I y II respectivamente.
Si uno de los jugadores, por ejemplo I, est a en una posici on fuera de S,
tiene una estrategia ganadora que consiste en llevar a su contrario a alg un
vertice z de S. Por otro lado, cuando II toma una de las decisiones permitidas
en z en S, es decir levantar k cerillos, con k menor o igual que m, entrega a
I una posici on fuera de S y este jugador puede levantar m + 1 k cerillos
regresando a II a una posici on en el conjunto S. Continuando con esta forma
de jugar hasta que II se encuentre irremediablemente frente a un solo cerillo,
viendose obligado a levantarlo y as a perder el juego.
Consideremos cualquier juego de ganar perder, con dos jugadores que
se turnan y sin posiciones que se repitan, c omo encontrar un conjunto
S? En la teora de gr acas dirigidas, tenemos el concepto de n ucleo que
es un subconjunto de vertices que cumple nuestras dos propiedades que se
expresan en la siguiente denici on.
Denici on 2.5.2. Un n ucleo de una digr aca es un subconjunto S de V
que tiene las propiedades siguientes:
i) Para cualquier vertice x que no est a en S hay una echa que inicia en
x y llega hasta alguno de los vertices de S.
84
Modelos de juegos no cooperativos 85
ii) Si y est a en S no hay echas desde y hasta otro elemento de S, sino
s olo hacia algunos de los vertices que est an fuera de S.
10 6
7
16
13 9
15
14
17 5
4
2
11
8
3
1
12
Figura 2.5.2:
En el ejemplo de la gura 2.5.1, un n ucleo es c, d.
Una digr aca puede tener varios n ucleos; en el mismo ejemplo anterior,
tambien b, e, f es un n ucleo. Pero no todas las digr acas tienen n ucleo. No
lo tiene, por ejemplo, la digr aca donde el conjunto de vertices es a, b, c y
el de echas es (a, b), (b, c), (c, a).
El unico n ucleo del juego 2.4.1 es x V [x 1(m odulo m+ 1) . En
particular, si n = 17 y m = 3, el n ucleo es 1, 5, 9, 13, 17 (ver gura 2.5.2).
Si cambiamos la regla del juego, de tal manera que el que levanta el
ultimo cerillo gana, nos conviene asociarle la digr aca que tiene como con-
junto de vertices a 0, 1, . . . , n y el conjunto de echas construido con el
criterio anterior. En este caso, el conjunto de posiciones perdedoras, es decir
el n ucleo de la digr aca es x V [x 0(m odulo m+ 1) .
Tenemos un teorema debido a von Neumann que dice que toda gr aca
dirigida nita y sin ciclos dirigidos tiene n ucleo. Traducido a terminos de
Teora de Juegos, que es su contexto original, dira que todos los juegos
bipersonales de ganar perder, donde los jugadores se turnan y no se permite
repetir posiciones, est an estrictamente determinados. Es decir, existe un con-
85
86 Juegos Extensivos
junto de posiciones S tal que, si el jugador que empieza el juego est a dentro
de S, pierde el juego y si est a fuera, lo gana.
La demostraci on que es constructiva sigue los pasos siguientes:
1- Sea S
0
el conjunto de posiciones en las que un jugador s olo tiene
decisiones que terminan el juego perdiendo el mismo. Sea D
1
el conjunto de
posiciones en que, para cada una de ellas, existe una decisi on con la que se
termina el juego ganando o existe una decisi on en la que se deja al contrario
en S
0
, por lo menos uno de esos dos conjuntos es no vaco.
2- Si no existieran posiciones fuera de S
0
D
1
, S = S
0
. En cambio, si
existen posiciones que no est an en ninguno de los dos conjuntos, sea S
1
el
conjunto de vertices que solo inician echas que terminan en D
1
.
3- Supongamos que hemos construido (S
1
, D
1
), (S
2
, D
2
), . . . , (S
k
, D
k
),
tales que para j = 1, 2, . . . , k, cada vertice de D
j
inicia al menos una echa
que termina en S
j1
y todas las echas que empiezan en un vertice de S
j
terminan en D
j
.
4- Si ya no existen posiciones fuera de los conjuntos construidos, el con-
junto S de posiciones perdedoras, o n ucleo de la digr aca, es la uni on de
todos los S
j
, si existen posiciones que no esten en alguno de los conjuntos
construidos hasta el paso k, llamamos D
k+1
al conjunto de vertices que ini-
cian una echa que termina en S
k
y S
k+1
al conjunto de vertices que s olo
inician echas que terminan en D
k
.
El algoritmo termina en un n umero nito de pasos.
Si seguimos los pasos de la demostraci on en el juego de los cerillos con
n = 17, m = 3 y el que levanta el ultimo cerillo pierde.
S
0
= 1, D
1
= 2, 3, 4, S
1
= 5,
D
2
= 6, 7, 8, S
2
= 9,
D
3
= 10, 11, 12, S
3
= 13,
D
4
= 14, 15, 16, S
4
= 17. Entonces S = 1, 5, 9, 13, 17.
2.6. Selecci on de Equilibrios y Gracas Dirigidas.
Las gr acas dirigidas nos servir an, tambien, para describir y estudiar di-
versas din amicas con las que pueden desenvolverse los juegos. Pensemos en
que los patrones de conducta de los individuos que se enfrentan en un juego
est an expresados en todos los posibles perles de estrategias puras. M as ade-
lante podremos expresar estos patrones en formas diversas. Consideremos
una din amica en la que un patr on de comportamiento se cambia por otro,
siguiendo el criterio de que si alguno de los jugadores decide utilizar otra es-
trategia es porque as mejora su pago. Las gr acas dirigidas nos permitir an
86
Modelos de juegos no cooperativos 87
formalizar como transitar, de acuerdo con dicha din amica, de un patr on
de comportamiento a otro. Adem as, en estas digr acas se revelar an los pa-
trones que tienden a repetirse como algo acostumbrado. En este captulo,
s olo estudiaremos el movimiento entre los perles de estrategias puras, en el
captulo 8 desarrollaremos m as ampliamente el papel de las digr acas para
modelar din amicas de aprendizaje.
Sea (N, D
j
, ) un juego nito, con l
j
el n umero de estrategias que
tiene D
j
. Sea z en D =

D
j
, un perl de estrategias puras. z es uno de los
patrones de conducta posible y lo consideraremos un estado posible de las
din amicas que se introducir an.
La coordenada i-esima de z se interpreta, como en cualquier perl de
estrategias puras, es decir, como la estrategia que escogi o el jugador i, en el
estado z. Sea V el conjunto de estados posibles (V = D).
C omo actuaran los jugadores, si encontr andose en el estado z, ellos
pudieran recticar sus estrategias? Se generaran diversas din amicas que de-
terminaran el paso de un estado a otro, cuando los jugadores trataran de
mejorar su pago. Entenderemos por una din amica d a una correspondencia
que a cada estado z le asocia un conjunto de estados posibles. Dada una
din amica d, construimos

A = (z, z) [z d(z) . La digr aca (V,

A) repre-
sentar a a esta din amica en la que se mueven las elecciones de estrategias de
los jugadores pasando de un estado a otro.
Estudiemos, primero, una din amica, a la que llamaremos de mejor res-
puesta con inercia, porque en cada periodo s olo un jugador cambia su es-
trategia, mientras los dem as permanecen con la escogida anteriormente.
Denici on 2.6.1. Dado un juego (N, D
j
, ), su digr aca de mejor res-
puesta con inercia es
_
V,

A
_
, con V = D y

A = (v, v) tal que existe k N,
con v
k
una mejor respuesta de k a v y v
j
= v
j
j ,= k.
A diferencia del concepto de n ucleo que encerraba a todas las posiciones
perdedoras de ciertos juegos. Introducimos, ahora, otros conceptos de las
gr acas dirigidas que se relacionan con la soluci on de un conicto expresado
en un juego rectangular.
Denici on 2.6.2. Dada una digr aca cualquiera
_
V,

A
_
, decimos que V
1
,
V
2
, ...,V
r
, subconjuntos no vacos de V , ajenos dos a dos, son las clases de
comunicaci on recurrente de
_
V,

A
_
, si se cumplen:
1. Para cada vertice x que no est a en
i
V
i
, existe una trayectoria dirigida
que une a x con un vertice que pertenece a alguno de los subconjuntos
V
i
.
87
88 Juegos Extensivos
2. Si dos vertices x y z distintos est an en la misma clase V
i
, existe una
trayectoria dirigida que une a x con z.
3. Dado un vertice x en V
i
y un vertice z que no est a en V
i
, no existe
trayectoria dirigida que une a x con z.
Si una clase de comunicaci on recurrente de la gr aca asociada a una
din amica contiene un solo elemento, diremos que este es un estado ab-
sorbente de la din amica.
Si la digr aca
_
V,

A
_
representa a una din amica asociada a un juego
(N, D
j
, ), diremos que los elementos de sus clases de comunicaci on re-
currente son los patrones de conducta aprendidos relativos a esa din amica.
Por ejemplo, pensemos en el juego de los pases petroleros, ejemplo 1.3.3
b, con matriz de pagos
reducir no reducir
reducir
no reducir
_
(2, 2) (2, 1)
(1, 2) (0, 0)
_
La digr aca de mejor respuesta con inercia, para este juego se ilustra en
la gura 2.6.1.
(reducir,reducir)
(no reducir, reducir)
(reducir, no reducir
(no reducir,no reducir )
)
Figura 2.6.1:
Las clases de comunicaci on recurrentes son V
1
= (reducir, reducir) y
V
2
= (no reducir, no reducir), es decir el ejemplo 1.3.3 b, con la din amica
de mejor respuesta con inercia tiene a los dos equilibrios de Nash (ep) del
juego como estados absorbentes. Adem as, son los unicos equilibrios de Nash
(ep) del juego, as que en este ejemplo se cumple que un perl de estrategias
88
Modelos de juegos no cooperativos 89
puras es equilibrio de Nash si y s olo si es un estado absorbente de la din amica
de mejor respuesta con inercia.
Sin embargo, si consideramos el ejemplo 2.6.1 con matriz
_
(1, 3) (1, 6)
(1, 1) (1, 2)
_
,
la digr aca de la din amica de mejor respuesta con inercia est a en la gura
2.6.2
La unica clase de comunicaci on recurrente es V
1
= (1, 2) , (2, 2) que
es un ciclo, la digr aca no tiene estados absorbentes, pero (1, 2) y (2, 2)
son equilibrios de Nash(ep) del juego 2.6.2. Observese que, en este juego,
ninguno de los dos equilibrios de Nash es estricto, a diferencia del ejemplo
anterior en que los dos equilibrios eran estrictos.
(1, 1) (1, 2)
(2, 1) (2, 2)
Figura 2.6.2:
Si alteramos un poco la din amica de mejor respuesta con inercia con
que se desenvuelve el juego (N, D
j
, ), pensando que un jugador k no
abandonar a su estrategia correspondiente a D, para cambiar por
j
, si
esta ultima no le reporta un aumento en su ganancia. Es decir, solo si
j
es
una estrategia de mejor respuesta estricta se dar a el cambio. Construimos
una nueva digr aca, a la que llamaremos digr aca de mejor respuesta estricta
con inercia, de la manera siguiente, (V,

A), con V = D y

A de tal manera
que (v, v)

A si y s olo si, existe un jugador k, tal que v
k
es una mejor
respuesta estricta de k a v y v
j
= v
j
, para toda j ,= k.
Es claro que

A

A.
La digr aca de mejor respuesta estricta, con inercia, para el juego 2.6.1
est a representada en la gura 2.6.3 que tiene dos clases de comunicaci on
recurrente, (1, 2) y (2, 2). Ambas son estados absorbentes y est an for-
madas por equilibrios de Nash (ep).
89
90 Juegos Extensivos
(1, 1) (1, 2)
(2, 1) (2, 2)
Figura 2.6.3:
Tambien, en la din amica de mejor respuesta estricta con inercia puede
haber clases de comunicaci on recurrente que constan de m as de un elemento,
y el juego se mover a en ciclo pasando repetidamente por todos los vertices
de la clase. Por ejemplo, en el juego de las empresas la unica clase de comu-
nicaci on recurrente es un ciclo.
entrar no entrar
muestras
medios escritos
radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(45, 10) (55, 0)
_
_
(medios escritos, no entrar)
(muestras, entrar)
(radio y tv, entrar) (radio y tv, no entrar)
(muestras, no entrar)
(medios escritos, entrar)
Figura 2.6.4:
La unica clase de comunicaci on recurrente de su gr aca de mejor res-
puesta estricta, con inercia, como se puede ver en la gura 2.6.4, es el ciclo
90
Modelos de juegos no cooperativos 91
(muestras, no entr) , (reg, entr) , (radio-tv, entr) , (radio-tv, no entr) .
Recordemos el baile de Shapley (Ejemplo 1.3.4).
a b c d
a
b
c
d
_
_
_
_
(2, 1) (0, 0) (1, 2) (1, 1)
(1, 2) (2, 1) (0, 0) (1, 1)
(0, 0) (1, 2) (2, 1) (1, 1)
(1, 1) (1, 1) (1, 1) (1, 1)
_
_
_
_
Podemos observar la gura 2.6.5 que es su digr aca de mejor respuesta
estricta con inercia, tiene un estado absorbente que es el unico equilibrio de
Nash (ep) (d, d) y otra clase de comunicaci on recurrente que es el ciclo
(a, a), (a, c), (c, c), (c, b), (b, b), (b, a).
(d,a)
(a,a)
(b,a)
(b,d)
(a,d) (c,a)
(a,c)
(d,c)
(b,c) (a,b)
(b,b)
(c,c)
(c,b) (d,d)
(d,b) (c,d)
Figura 2.6.5:
Es claro que es equilibrio estricto si y s olo si es un vertice tal que, en
la digr aca de mejor respuesta con inercia, no existen echas de la forma
(, ), con distinto de . Y que es un equilibrio de Nash (ep) si y s olo
si es un vertice tal que no existen echas de la forma (, ) en la digr aca
de mejor respuesta estricta con inercia y de estas propiedades se desprende
la siguiente proposici on.
Proposici on 2.6.3. es un estado absorbente de la digr aca de mejor
respuesta con inercia si y s olo si es un equilibrio de Nash (ep) estricto.
91
92 Juegos Extensivos
Adem as, es un estado absorbente de la digr aca de mejor respuesta estricta
con inercia si y s olo si es un equilibrio de Nash (ep).
Las cosas seran diferentes en una din amica de mejor respuesta sin iner-
cia, es decir, cuando todos los jugadores reaccionan simult aneamente, con
su mejor respuesta.
Por ejemplo, pensemos de nuevo en el baile de Shapley, con la din amica
de mejor respuesta estricta, sin inercia. Su digr aca se representa en la gura
2.6.6. Las clases de comunicaci on recurrente son:
el estado absorbente (d, d),
el ciclo (a, b), (b, c), (c, a) y
el ciclo (a, a), (a, c), (c, c), (c, b), (b, b), (b, a).
(d,a)
(a,a)
(b,a)
(b,d)
(a,c)
(d,c)
(b,b)
(c,c)
(c,b) (d,d)
(d,b) (c,d)
(a,d)
(a,b) (b,c)
(c,a)
Figura 2.6.6:
Este tipo de digr acas que estamos estudiando, quiz a un poco alteradas,
pueden permitir encontrar los equilibrios de Nash (ep) en algunos juegos,
aunque la gr aca sea muy grande y solo podamos analizar una parte de ella.
Pensemos en un juego de ventanillas simetrico, en el que los jugadores pueden
ser muchos y el conjunto de estrategias grande. Podemos, entonces, alterar
el conjunto de estados posibles considerando que cada vertice no representa
92
Modelos de juegos no cooperativos 93
un perl de estrategias, sino todos los que resultan equivalentes. Es decir,
pensemos en que un estado posible z es de tal manera que su coordenada
i-esima se interpreta como el n umero de jugadores que escogi o la estrategia
i, en el perl, no importando quienes son los jugadores que lo hicieron. La
suma de las coordenadas de z debe ser n, el n umero de jugadores que tiene
el juego. Sea V el conjunto de estados posibles, y entonces

A tendr a el
signicado an alogo a la digr aca de mejor respuesta con inercia.
Supongamos que los jugadores son 10 capitalistas y que cada uno tiene
un capital del mismo tama no. Cada jugador puede invertir su capital en
alguna de las 5 rmas E
1
, E
2
, E
3
, E
4
, E
5
. Las ganancias totales respectivas
de cada rma son 50, 40, 30, 20 y 10 millones de pesos. Los capitalistas tienen
que escoger alguna de las rmas para invertir y las ganancias se repartir an
entre todos los que participen en la rma.
Queremos estudiar la din amica basada en la mejor respuesta de un
solo jugador, a un perl de estrategias dado, mientras los dem as jugadores
se quedan quietos. Pensemos que el juego de las ventanillas se repite a no
con a no, con los mismos participantes.
El n umero de perles de estrategias puras distintos son 5
10
. Identique-
mos dichos perles de tal manera que solo interese cuantas personas hay en
cada ventanilla, sin importar quienes est an en ella. Es decir, el conjunto de
estados posibles es el de clases de perles de estrategias puras que resultan
al identicar todos los perles que provocan que hay la misma repartici on
de capitalistas en las rmas, sin importar cu ales de ellos est a en cada una
de las rmas.
Los estados son vectores de 5 coordenadas enteras menores o iguales que
10 y tales que suman 10. Cada vector (x
1
, x
2
, x
3
, x
4
, x
5
) con esas propiedades
representa varios perles de estrategias, aquellos en donde x
j
capitalistas,
sean los que sean, eligen E
j
. As el n umero de vertices es menor, pero todava
es enorme.
Estudiemos unicamente la parte de la digr aca que empieza en el vertice
que representa a que todos los capitalistas escogieron la primera rma y cada
uno gan o 5 millones de pesos y, despues consideremos todos los vertices que
se pueden generar desde all, con la din amica de mejor respuesta estricta
con inercia. Es claro que el a no siguiente no les convendr a seguir todos en
la primera rma, pero supongamos que ellos son muy cautos, por lo que el
siguiente a no, cada uno espera que los dem as se muevan; no vaya a ocurrir
que todos huyan de la primera rma a la segunda rma y las cosas resulten
todava peor. Sin embargo, uno de ellos decide cambiar, pues est a seguro que
los dem as no lo har an y, entonces, aprovechar a la coyuntura cambi andose a
93
94 Juegos Extensivos
la segunda rma que es la que le dara mayor pago, si los dem as permanecen
en la primera. Entonces, los que permanecieron en E
1
ganar an 50/9 millones
y el que se fue a la segunda ganar a 40. Para el tercer a no el que est a en E
2
se siente contento, pues no podra mejorar con un nuevo cambio, si todos
siguen con las mismas decisiones, en cambio, los que se encuentran en E
1
no lo est an, pues pueden cambiar para mejorar. Si uno s olo de ellos cambia,
ser a para irse a E
3
.
En la gura 2.6.7 se ilustra la din amica con que se mueven los ca-
pitalistas hasta llegar a un perl de estrategias del que ya no saldr an. De
hecho, (4, 3, 2, 1, 0) es la unica clase de comunicaci on recurrente de la
gr aca de mejor respuesta, con inercia. Como consta de un solo vertice,
este es un estado absorbente. En particular, todos los perles represen-
tados por (4, 3, 2, 1, 0), por ejemplo (E
1
, E
1
, E
1
, E
1
, E
2
, E
2
, E
2
, E
3
, E
3
, E
4
),
son equilibrios de Nash en estrategias puras. Cuando la din amica llega a
(4, 3, 2, 1, 0) ning un capitalista mejorar a su pago cambiando de estrategia,
bajo el supuesto que los dem as no cambian la suya.
(10,0,0,0,0) (9,1,0,0,0) (8,1,1,0,0)
(7,1,1,1,0) (7,2,1,0,0)
(6,2,1,1,0)
(5,2,2,1,0) (4,3,2,1,0)
Figura 2.6.7:
Pensemos en una din amica de mejor respuesta sin inercia (cuando todos
los jugadores reaccionan con su mejor respuesta simult aneamente). Si se
iniciara en cualquier vertice que no corresponda al equilibrio de Nash (ep),
la din amica terminara en el ciclo (10, 0, 0, 0, 0) , (0, 10, 0, 0, 0). Entonces,
las clases de comunicaci on recurrente son dicho ciclo y el estado absorbente
(4, 3, 2, 1, 0).
En la gura 2.6.8 se observan algunas trayectorias dirigidas, de la din a-
mica de mejor replica, que terminan en el ciclo.
En el captulo 8, seguiremos desarrollando las digr acas como instrumen-
to para analizar diversas din amicas de correcci on de estrategias. Se genera-
lizar a su uso, ya contando con el concepto de estrategia mixta. Podremos,
94
Modelos de juegos no cooperativos 95
entonces, relacionar las clases de comunicaci on recurrente a los equilibrios
de Nash, en ambos tipos de estrategias.
(7,1,1,1,0) (0,8,1,1,0)
(10,0,0,0,0) (0,10,0,0,0)
(0,1,9,0,0) (2,1,0,7,0)
Figura 2.6.8:
2.7. Ejercicios
Ejercicio 2.1. Considere el juego con 23 cerillos (dos jugadores que se
turnan levantando 1, 2 o 3 cerillos, el que levanta el ultimo pierde).
a). Si los dos jugadores juegan bien, existe un ganador? Cu al de ellos?
Por que?
b). Si hay n cerillos, para que valores de n gana la mano? Para que val-
ores de n gana la tras? Para que valores de n hay empate? Por que?
c). Que ocurre si cambiamos la regla admitiendo que se pueden levantar
menor o igual que s cerillos? Puede usted dar una regla general?
d). Las mismas preguntas, para cuando cambiamos a una regla que dec-
reta que el que levanta el ultimo cerillo gana.
Ejercicio 2.2. Considere el juego de los cerillos con n igual a 5 y s olo se
pueden levantar 1 o 2 en cada tirada. Construya el modelo extensivo.
Ejercicio 2.3. Considere la digr aca del juego original de los 23 cerillos (el
que levanta el ultimo pierde), de la siguiente manera V =23, 22, 21, . . . , 2, 1,

A es el conjunto de parejas ordenadas de V , tal que se puede pasar desde
el primer elemento de la pareja al segundo con la decisi on de uno de los
jugadores. Considere el conjunto de vertices de posiciones perdedoras, es
decir, en donde al jugador que le toca jugar perder a el juego, si el otro juega
bien. Haga ver que el conjuntos es n ucleo de la digr aca.
95
96 Juegos Extensivos
Ejercicio 2.4 (El Juego del Nim). En cada hilera i, de m existentes,
est an colocados m
i
cerillos, los jugadores se alternan para escoger una hilera
k y levantar, en esa hilera, el n umero de cerillos que quieran, mayor que cero
y menor o igual que m
k
. El jugador que levante el ultimo gana. Suponiendo
que m es 3, m
1
= 2, m
2
= m
3
= 1. Construya el modelo extensivo y el juego
de posiciones.
Ejercicio 2.5 (de votaciones y de eventos). Un equipo de trabajo de
tres personas tiene que integrar a un nuevo elemento de una lista de cuatro
candidatos (A, B, C y D). Para hacerlo, los miembros del equipo (I, II, III)
tienen derecho a vetar a uno de los tres candidatos. Se van alternando para
decir a quien veta cada uno. Cuando le toca el turno al jugador j, conoce
los vetos que se han hecho antes. Cada jugador, en su turno, est a forzado
a vetar a uno de los que no han sido vetados. Despues de que se han dado
los vetos de I, II y III, s olo quedar a un candidato sin vetar, el cu al ser a el
nuevo miembro del equipo. Suponiendo que los ordenes de preferencia que
los actuales miembros tienen para la integraci on del nuevo miembro son:
para I, A~ B ~C~D,
para II, B~C~D~A y
para III, C~D~A~B,
donde x~y signica que el miembro del equipo en cuesti on preere al can-
didato x que al y.
Construya un modelo extensivo que represente al juego.
Ejercicio 2.6 (El juego del gato). Consideremos el conocido juego del
gato de tal manera que el juego termina hasta que se llenan todas las casillas.
Explique c omo es su modelo extensivo.
Ejercicio 2.7. Para el juego del duelo, cambie la situaci on de tal manera
que, en cada ocasi on, se lance una moneda para ver a cu al de los jugadores
le toca decidir. C omo cambia el modelo extensivo?
Ejercicio 2.8 (El juego de Gale [22]). Hay tres ruedas de ruleta, cada
una dividida en tres partes iguales, en la primera est an escritos los n umeros
9, 2 y 4, en la segunda 8, 1 y 6 y en la tercera 7, 3 y 5. El jugador I escoge una
de las tres ruletas, despues el jugador II escoge alguna de las otras dos. A
continuaci on, se hace girar la ruleta de I y despues en forma independiente
la de II, gana el jugador al que le sale el n umero m as alto. Construya el
modelo extensivo.
Ejercicio 2.9. Considere el juego 2.2.9 de La Industra Contaminadora, El
Campesino y el Inspector y construya el modelo extensivo.
96
Modelos de juegos no cooperativos 97
Ejercicio 2.10. Sea = (V, A),con
V =
_
x
1
, x
2
, x
3
, x
4
, x
5
, x
6
, x
7
, x
8
, x
9
,
x
10
, x
11
, x
12
, x
13
, x
14
, x
15
, x
16
, x
17
_

A =
_

_
(x
1
, x
2
) , (x
1
, x
3
) , (x
2
, x
3
) , (x
2
, x
4
) , (x
4
, x
6
) ,
(x
4
, x
7
) , (x
5
, x
8
) , (x
5
, x
8
) , (x
5
, x
9
) , (x
5
, x
10
) ,
(x
7
, x
11
) , (x
7
, x
12
) , (x
9
, x
14
) , (x
14
, x
15
) ,
(x
14
, x
16
) , (x
14
, x
17
)
_

_
S
0
= x
1
, x
14
, S
1
= x
2
, x
7
, x
9
, x
10
, S
2
= x
4
, x
5
, x
14
.
P (x
1
[x
2
) =
1
9
, P (x
1
[x
3
) =
8
9
.
P (x
15
[x
14
) =
1
3
, P (x
16
[x
14
) =
2
3
, P (x
17
[x
14
) =
2
3
S
1
1
= x
2
, x
7
, S
1
2
= x
9
, x
10
, S
2
1
x
4
, x
5
, S
2
2
= x
14
,
I
1
1
= I
1
2
= I
2
1
= I
2
2
= 1, 2.
(x
3
) = (2, 1) , (x
6
) = (3, 0) , (x
8
) = (2, 11) ,
(x
11
) = (1, 1) , (x
12
) = (3) , (x
15
) = (1, 1) ,
(x
16
) = (8, 7) , (x
17
) = (4, 4) .
La anterior descripci on no cumple con la denici on de juego extensivo,
explique todas las violaciones a los axiomas que se han cometido y arreglelas
para que la nueva descripci on cumpla todos los axiomas.
Ejercicio 2.11 (D onde qued o la cabrita?). En un concurso de tele-
visi on hay tres cubculos numerados del 1 al 3, con las puertas cerradas. El
concursante (A) elige un n umero 1, 2 o 3, tratando de adivinar en cu al de los
cubculos esconder an la cabrita que le muestra el conductor del programa,
eligiendo un n umero. El conductor del programa elige al azar un cubculo y
esconde en este a la cabra. El conductor sabe el n umero de cubculo donde
est a el animalito y el n umero que eligi o A, entonces abrir a la puerta de
uno de los cubculos que no contenga a la cabra y que no sea el escogido
por el concursante (esto puede ser una jugada obligada o una elecci on del
conductor). Posteriormente el concursante decidir a si contin ua apost andole
al cubculo que escogi o desde el principio o cambia al otro que sigue con
la puerta cerrada. Si el cubculo nalmente escogido es el que esconde a
la cabra ganar a el concursante, si no perder a y el ganador es el programa
representado por su conductor. Dise ne un juego extensivo para el juego.
Ejercicio 2.12. Cambie el juego de las negociaciones del sindicato (Ejemplo
2.2.7), pensando que la primera jugada no es de azar, sino que el sindicato
decide si construye un fondo de resistencia o por el contrario descuida esto
y la direcci on se dedica a tratar de reelegirse. Dependiendo de esta primera
97
98 Juegos Extensivos
acci on habr a buenas o malas condiciones para la huelga, pero el sindicato
las conoce y el patr on no. Dibuje el juego extensivo.
Ejercicio 2.13 (Fichas de domin o en un tablero). (Juego de informa-
ci on perfecta. K. Binmore [4]) Dos jugadores se van alternando colocando
chas de domin o en un tablero cuadriculado, cada cha cubre dos cuadrados
ya sea en forma vertical u horizontal. El tablero tiene mn cuadrados y el
primer jugador que ya no puede colocar una cha pierde y su pago es 1, el
otro gana 1.
Para el tablero de m = 2 y n = 3, haga el modelo extensivo, considerando
que los vertices en que al jugador que le toca decidir s olo tiene una opci on
son vertices nales con los pagos que se obtendran despues de la jugada
obligada.
Ejercicio 2.14. Considere un empresario E que tiene en su f abrica tres
procesos productivos, P
1
, P
2
y P
3
. E contrata a tres artesanos para echar
andar la producci on y tiene que decidir, si les permite elegir a ellos mismos
cu al proceso preeren utilizar o si hace una rifa, para tratar de asegurar
que se echar an a andar los tres procesos, para conocer bien el efecto de
cada P
i
. En caso de que decida rifar, los artesanos tienen que decidir, sin
comunicarse unos con otros, si aceptan la rifa o se van a trabajar por su
cuenta, cada artesano es capaz de ganar 500 pesos por su cuenta. Si un
artesano acepta el trabajo y le toca aplicar el primer proceso ganar a 300, al
que le toca aplicar el segundo ganar a 550 y al que le toca el ultimo 1100.
En caso de permitirles la elecci on voluntaria, se determina un juego de tres
artesanos (ventanillas), con tres ocios, en los que d
P1
= 300, d
P2
= 550 y
d
P3
= 1100, respectivamente. El empresario obtiene la suma de las ganancias
de los artesanos. Construya el juego extensivo.
Ejercicio 2.15. Complete las digr acas de mejor respuesta estricta y no
estricta, con y sin inercia, para los ejemplos de dos jugadores del captulo 1
que no se abordaron en la secci on ??.
Ejercicio 2.16. En forma an aloga a como procedimos, al nal de la secci on
??, para estudiar un juego de ventanillas, con una digr aca especial (o con
parte de ella):
a) estudie la exibilizaci on del trabajo (ejemplo 1.3.8 a) y
b) el juego del monopolio del ejemplo 1.6.4, pero con los siguientes cam-
bios. El monopolio solo considera los precios 600 y 1000, c = 500. S olo hay
dos tipos de consumidores, los 10 primeros con funci on de pago 650p y los
5 de funci on 1100p. No empiece por un vertice que represente un equilibrio
de Nash.
98
Modelos de juegos no cooperativos 99
Ejercicio 2.17. Construya modelos extensivos de alg un conicto actual, ya
sea poltico o econ omico, con las siguientes caractersticas.
a) Informaci on perfecta y sin azar.
b) Informaci on perfecta y con azar.
c) Informaci on no perfecta y sin azar.
d) Informaci on no perfecta y con azar.
Ejercicio 2.18 (El automovilista y la aseguradora). Una persona (A)
tiene un vehculo con el que trabaja y est a considerando comprar un seguro
contra accidentes. La compa na de seguros (CS) piensa en dos precios posi-
bles por un a no de seguro, uno de 500 y otro de 200. En los dos casos, el
posible asegurado tiene que decidir, si acepta o rechaza la oferta. Si rechaza
la oferta tendr a que ser cuidadoso con su vehculo, para tratar de evitar
accidentes, en cambio, si acepta comprar el seguro, tendr a que decidir, entre
ser cuidadoso o basarse en que est a cubierto por el seguro y arriesgarse m as,
pudiendo con ello obtener m as ingresos en su trabajo. La probabilidad de
tener accidentes depende de s es cuidadoso o no lo es. Construya un modelo
extensivo del juego, asignando valores adecuados a todo lo que considere que
falta para obtener dicho modelo.
Construya, tambien, el modelo extensivo de la siguiente variante del
mismo problema. Una aseguradora, cada vez que vende un seguro a un
automovilista no sabe si se trata de uno cuidadoso o uno arriesgado. Lo
unico que sabe es el porcentaje de automovilistas cuidadosos que hay en
el pas. Por su lado, el automovilista no sabe si en caso de accidente la
aseguradora cumplir a lo prometido o usar a argucias legales para disminuir su
pago. El automovilista piensa, debido a diversos comentarios que ha obtenido
que la aseguradora cumplir a lo pactado con cierta probabilidad. Lo dem as
transcurre como se explic o antes, excepto en los pagos que se transforman
por las nuevas condiciones.
Ejercicio 2.19. Construya los modelos extensivos de los juegos siguientes:
a) En el juego de la cadena de supermercado de Selten del ejemplo 2.2.2,
suponga que el jugador M est a formado por un equipo de dos personas y
cuando la segunda de ellas debe decidir si cumple o no su amenaza de bajar
los precios, no sabe si su compa nero de equipo hizo o no una inversi on. Dejar
todo lo dem as igual.
b) El juego de la ruleta rusa. Dos ociales del ejercito del zar, que com-
piten por el amor de una doncella, acuerdan que sea una ruleta especial la
que decida quien continuar a en el cortejo y quien abandonar a el campo. Al
99
100 Estrategias y Forma Normal
azar se coloca una bala en una de las seis rec amaras de un rev olver. Los
dos jugadores se van alternando y, en cada turno, sin saber donde est a la
bala, deciden si se ponen el rev olver en la sien y disparan, pudiendo morir,
o se retiran, por aquello de que m as vale aqu corri o. Si uno de los jugadores
muere, obtendr a el peor resultado posible. Si se acobarda, tendr a que de-
jar que el otro trate de conquistar a la muchacha y esperar a que ella lo
rechace, por lo que tiene a un esperanzas. Y, si el otro muere, estar a en la
mejor situaci on posible, pues ya no tendr a rival.
100
Captulo 3
Estrategias y Forma Normal
3.1. Planteamiento del Problema
Los planes globales de un jugador en un juego extensivo son sus estrate-
gias. Este es el concepto central del captulo y lo introduciremos en la secci on
3.2. Pero cu al perl de estos planes globales puede ser llamado una soluci on
del juego?
En los juegos de informaci on perfecta nitos es posible encontrar buenos
planes para cada jugador j. Procediendo como los ajedrecistas, es decir,
haciendo un an alisis del juego desde las posibles nales, se localizan cu ales
de estas le convendran a j y se estudia si, con algunas de sus estrategias,
es posible que el logre que dichas nales se alcancen. Desarrollaremos estas
ideas en la secci on 3.3. Sin embargo, aunque posteriormente extenderemos
este an alisis a los juegos que no son de informaci on perfecta, por el momento
esto no ser a posible.
En la secci on 3.4, partiendo del concepto de estrategia dentro de un
modelo extensivo nito , podremos construir un juego rectangular equi-
valente a , al que llamaremos su forma normal. Deniremos los equilibrios
de Nash de como los equilibrios de su forma normal. Despues, se puede
extender el concepto a algunos juegos innitos.
Sin embargo, existen dos problemas. En primer lugar, surge la pregun-
ta de si tenemos que conformarnos con solucionar a los juegos de infor-
maci on perfecta de una manera y a los dem as de otra. En la secci on 3.5,
demostraremos que el an alisis que copiamos a los ajedrecistas construye, en
los juegos nitos de informaci on perfecta, un equilibrio de Nash de su forma
normal. No todos los equilibrios de un juego de informaci on perfecta pueden
construirse con un an alisis hacia atr as. Los equilibrios que pueden constru-
101
102 Estrategias y Forma Normal
irse en dicha forma son especiales, garantizan que los jugadores eligen bien
en cada una de las situaciones en las que tienen que tomar decisiones. Por
lo que se busca extender este tipo de an alisis a cualquier juego nito. Des-
graciadamente, en estrategias puras, dicho algoritmo no siempre tiene exito
y habr a que esperar a introducir las estrategias mixtas en el captulo 5. El
otro problema que se presentar a con la forma normal de un juego extensivo
es que frecuentemente resulta demasiado grande. Por lo que, en lugar de
trabajar con la forma normal, ser a conveniente no perder de vista el modelo
extensivo y trabajar con sus partes si esto es posible.
Los dos tipos de ideas, con las que trabajamos en este captulo para
encontrar buenas estrategias de un juego extensivo tendr an tambien im-
portancia en el contexto de las estrategias mixtas. La primera es la de un
an alisis del juego extensivo en s mismo, al estilo, como dijimos antes, de los
metodos utilizados por los ajedrecistas que localizan posiciones ganadoras
dentro de las posibles nales del juego, para luego tratar de conducir el juego
hacia dichas posiciones. La segunda consiste en construir el juego rectangu-
lar equivalente al juego extensivo nito dado y basarse en los equilibrios
de Nash de dicho juego para obtener los del juego extensivo. Desde luego,
en estrategias mixtas, existe la misma relaci on, entre ambas ideas que la que
surge en este captulo. Con el primer an alisis, se construir an los equilibrios
especiales a los que llamaremos de perfecto en subjuegos y con el segundo
se tendra el conjunto completo de equilibrios de Nash.
3.2. Estrategias en Juegos Extensivos
C omo podemos pensar en los planes de acci on que tienen los jugadores
en un juego extensivo? C omo saber cu ales de estos planes son buenos y
cu ales son malos?
En el ejemplo 2.2.1, cada uno de los jugadores tiene que decidir, en una
sola ocasi on, representada por un vertice y, entonces, los dos unicos planes
posibles para la empresa C son E (entrar al mercado a competir con la
empresa M, previamente establecida) y NE (abstenerse de competir con
M). Por su lado, la empresa M tambien tiene dos planes BP (bajar precios
para arruinar a C) y NBP ( no bajar precios). Este ejemplo es semejante a
un juego rectangular. Los planes para actuar en 2.2.1 constan de tomar una
sola decisi on, como ocurre en dichos modelos.
El ejemplo 2.2.2 es m as complicado, la empresa C tiene que decidir
si entra a la competencia o no entra, para dos situaciones distintas (dos
vertices), una de ellas, cuando la empresa M decidi o invertir, otra si esta
102
Modelos de juegos no cooperativos 103
ha decidido no invertir; tiene entonces cuatro planes para el juego completo:
a) entrar en ambas situaciones; b) entrar si M invierte y no entrar si M
no invierte; c) no entrar si M invierte y entrar si no invierte y, por ultimo,
d) no entrar en ninguna de las dos situaciones. Mientras que la empresa M
tendr a que decidir en tres vertices. En el primero, debe escoger si invierte
o no lo hace y, despues, en caso de invertir y que la empresa C decida
competir contra ella, tendr a que decidir si baja los precios o no los baja.
An alogamente, en caso de no invertir, bajo el mismo supuesto de que C
est a en la competencia, debe decidir si baja los precios o no los baja. En
total tendr a ocho planes posibles. A estos planes se les llamar a estrategias.
De la misma forma, es decir, diciendo lo que har an el patr on y el trabajador,
en cada uno de los vertices del juego, en los que les toca decidir, se pueden
describir sus respectivos planes de acci on global o estrategias. Lo an alogo
para los duelistas del juego 2.2.4.
Hasta ahora, hemos hablado de los planes de acci on de los jugadores
en juegos de informaci on perfecta, en los que los conjuntos de informaci on
de un jugador coinciden con los vertices en los que le toca decidir. En jue-
gos que no son de informaci on perfecta, los participantes pueden confundir
varios de los vertices en los que les toca decidir y, cuando ocurre esto, tam-
bien confunden las alternativas que tienen en cada uno de ellos. Entonces,
para hacer sus planes, cualquier jugador tiene que escoger, en cada conjunto
de informaci on, uno de los elementos del conjunto de ndices asociado al
conjunto de informaci on.
Para cualquier juego extensivo , precisemos el concepto de este tipo de
planes para un jugador j, sus estrategias.
Denici on 3.2.1. Una estrategia para el jugador j en el juego es una
funci on
j
que a cada conjunto de informaci on S
j
k
le asocia un elemento de
I
j
k
.
Al conjunto de estrategias del jugador j en el juego , lo denotaremos
como
j
y al conjunto de perles como . Es decir, =

j
.
Observaci on 3.2.1. Se podra argumentar, polemizando con la denici on
de estrategia de un jugador, que en el juego 2.2.2, por ejemplo, si la empresa
M no piensa invertir, ya no sera necesario tomar previsiones para el tercer
vertice, pues para alcanzar este es necesario que M hubiera elegido invertir,
en el primer vertice. El mismo cuestionamiento ser a v alido en un enorme
n umero de juegos Por que la teora obliga a pensar en las decisiones que
tomara un jugador en situaciones que, como consecuencia de decisiones an-
teriores de el mismo, no se podr an alcanzar? Es claro que, debido a esta
103
104 Estrategias y Forma Normal
exigencia, el n umero de estrategias que tienen los jugadores crece en for-
ma considerable, lo que es un problema serio para encontrar la soluci on de
un juego. Sin embargo, en aras de la mayor sencillez en el manejo formal
y, tambien, debido a otros problemas que se discutir an posteriormente, la
denici on de estrategia se establece en la forma en que se ha procedido en
3.2.1.
Examinemos las estrategias que tiene cada jugador en algunos de los
juegos que aparecen en la secci on 2.2.
En el ejemplo 2.2.3, tenemos dos jugadores, un patr on (P) y un empleado
(E). P tiene dos estrategias, pues s olo tiene un conjunto de informaci on, con
dos alternativas, ofrecer un salario de 100 o uno de 200. Denotemos como

P
1
y
P
2
a dichas estrategias. Entonces,

P
1
_
S
P
1
_
= 100,
P
2
_
S
P
1
_
= 200
E, por su lado, tiene cuatro conjuntos de informaci on. S
E
1
corresponde
al vertice en el que P le ha ofrecido cien pesos y el debe decidir si acepta o
no acepta el empleo, es decir I
E
1
= ac, nac. S
E
2
consta del vertice an alogo
al anterior, cuando le han ofrecido 200, entonces I
E
2
= ac, nac. S
E
3
consta
del vertice correspondiente a la situaci on en la que E ha aceptado un salario
de 100 y debe decidir entre comportarse como un holgaz an o trabajar a
conciencia, es decir I
E
3
= holg, tr. Por ultimo, S
E
4
es semejante a S
E
3
,
pero respecto al salario de 200 e I
E
4
= I
E
3
. Entonces, E tiene 2
4
estrategias.
Por dar un ejemplo cualquiera, pensemos en
E
, tal que
E
_
S
E
1
_
= nac,

E
_
S
E
2
_
= ac,
E
_
S
E
3
_
= holg,
E
_
S
E
4
_
= tr.
En los juegos nitos, a cada estrategia
j
del jugador j le podemos
asociar un elemento de I
j
1
I
j
2
... I
j
r
j
, cuya k-esima coordenada es

j
_
S
j
k
_
, y donde r
j
es el n umero de conjuntos de informaci on del jugador
j. Esta forma de expresar a las estrategias, a traves de sus im agenes, resulta
muy c omoda.
Entonces, en el caso de juegos nitos, identicamos con I
j
1
I
j
2
...
I
j
r
j
.
En el ejemplo 2.2.3 tendramos, respecto a las estrategias de P que (100)
correspondera a
P
1
y (200) a
P
2
, mientras que a
E
le correspondera
(nac, ac, holg, tr).
En los ejemplos 2.2.5 y 2.2.6 cada jugador tiene un solo conjunto de infor-
maci on. Estos ejemplos son como juegos rectangulares, donde las estrategias
son las alternativas en los conjuntos de informaci on respectivos. En el ejem-
plo 2.2.5 el tiempo juega un papel para describir la situaci on concreta, pues
es importante el orden en que el padre entrevista a los hijos. En cambio,
104
Modelos de juegos no cooperativos 105
en 2.2.6 no est a involucrado el tiempo, las acciones son simult aneas, dicho
juego es, en sentido estricto, un juego rectangular.
En el ejemplo 2.2.7, el jugador SIN tiene cinco conjuntos de informaci on
y, en cada uno de ellos, tiene asociado un conjunto de ndices con dos ele-
mentos, por lo que tiene 2
5
estrategias y, por su lado, el jugador EM tiene
dos conjuntos de informaci on cada uno con un conjunto de ndices de tres
elementos, por lo que tiene 3
2
estrategias. Un perl de estrategias en este
juego es, por ejemplo, ((100, ac, h, ac, h) , (50, ac)).
Sabemos, ahora, cu antas estrategias tiene cada jugador en un juego ex-
tensivo nito, pero c omo saber cu al es la estrategia que le conviene usar en
cada uno de ellos?
Para desarrollar las primeras ideas, resultan claves los conceptos de sub-
juego y de juego podado que aparecieron en la secci on 2.3 (captulo 2). Y,
junto con ellos, las ideas de construir una estrategia de un jugador para un
juego extensivo, si se tienen estrategias, de dicho jugador, para un subjuego y
para el juego podado correspondiente. Adem as, es importante la operaci on
recproca a la que acabamos de describir, es decir, la de descomponer la
estrategia de un jugador, en el juego completo, en una estrategia para el
subjuego y otra para el juego podado.
Denici on 3.2.2. Sea un juego extensivo que se puede descomponer en
un vertice A y sea
j
una estrategia de j en el juego . Podemos considerar
la descomposici on de
j
en
j
A
y
j
[A, donde
j
A
es la restricci on de
j
a
la colecci on de conjuntos de informaci on de j que pertenecen a
A
y
j
[A
es la restricci on de
j
a la colecci on de conjuntos de informaci on de j que
pertenecen a [A.
Denici on 3.2.3. Sea un juego extensivo que se puede descomponer en
un vertice A y sea
j
una estrategia de j en el juego
A
y


j
una estrategia
de j en el juego [A. Podemos considerar la composici on de
j
y


j
, para
construir
_

j
,


j
_
una estrategia del jugador j , para , denida como
_

j
,


j
__
S
j
i
_
=
_
_
_

j
_
S
j
i
_
si S
j
i
pertenece a
A


j
_
S
j
i
_
si S
j
i
pertenece a [A
Consideremos el juego de las demandas triviales, en la versi on de la
secci on 2.3 con pagos adecuados que la completan (gura 2.3.4). El juego se
puede cortar en el vertice X, en los vertices Y y en los Z. Si cortamos en Y
(i

)
,
se obtienen
Y
(i

)
y

Y
(i

)
. Sea la estrategia
E
para E descrita como sigue:
105
106 Estrategias y Forma Normal
si a E se le exige una indemnizaci on mayor o igual que

i, E rechaza pagar y
despues contrata a un abogado; si a E se le exige una indemnizaci on menor
que

i, E acepta pagarla y no contrata abogado, en caso de rechazar el pago.


Sea i

>

i,
E
Y
(i

)
es tal que en Y
(i

)
rechaza pagar la indemnizaci on i

y en Z
(i

)
contrata un abogado. Mientras que
E

Y
(i

)
es de tal manera que si, a E, se
le exige una indemnizaci on mayor o igual que

i , E rechaza pagar y despues


contrata a un abogado y si a E se le exige una indemnizaci on menor que

i, E acepta pagarla y no contratara un abogado, cuando rechazara pagar


dicha indemnizaci on.
Ahora, supongamos que E tiene la estrategia
E
para
Y
(i

)
tal que
si estuviera en el vertice Y
(i

)
aceptara pagar i

y en caso de estar en el
vertice Z
(i

)
no contratara ning un abogado. Supongamos que
E
es la
estrategia para

Y
(i

)
que rechaza pagar indemnizaciones mayores que i

y acepta pagar las menores o iguales que i

. Adem as,
E
es de tal manera
que no contrata un abogado, a menos que tenga que ir a juicio. Entonces,
_

E
,
E
_
es una estrategia para j, en el juego y, con ella, j acepta pagar
indemnizaciones menores o iguales que i

y rechaza pagar las mayores y


nunca contrata un abogado, a menos de que C vaya a juicio, pero no antes.
La composici on de estrategias est a denida como una operaci on binaria
entre una estrategia para el subjuego con raz en un vertice, en el que el juego
se puede cortar, y otra estrategia para el juego podado en dicho vertice. Por
inducci on, se puede extender la composici on de estrategias que provienen de
m as de un corte de .
Observaci on 3.2.2. Es necesario notar que en alguno de los subjuegos o
de los juegos podados puede no jugar el jugador j, en cuyo caso no tendra
sentido hablar de estrategia de j para dicho subjuego (juego podado) y no
aparecera en la composici on.
Observaci on 3.2.3. Estas composiciones de estrategias ser an muy utiles
para construir el algoritmo de inducci on hacia atr as de un juego extensivo
que encuentra buenas estrategias para cada jugador en . Comencemos
a discutir este tipo de an alisis con los juegos de informaci on perfecta nitos
que es en los que siempre logra exito.
3.3. Buenas Estrategias en Informaci on Perfecta
Veamos que, en los juegos de informaci on perfecta nitos y en algunos
innitos, los jugadores pueden, a la manera de los ajedrecistas, analizar el
106
Modelos de juegos no cooperativos 107
juego desde el nal hacia el inicio, buscando jugar bien cada parte que
se analiza, para despues componer estrategias y tener un plan global.
Quien di o forma a esta idea, precisamente analizando el juego del ajedrez,
fue el matem atico Zermelo [60] quien a principios del siglo XX fue uno de
los pioneros de la teora de los juegos. Por ello, adem as de llamar a este
metodo el algoritmo de inducci on hacia atr as, tambien se le llama algoritmo
de Zermelo.
Consideremos el ejemplo 2.2.1, el supermercado de Selten, donde una
empresa M monopoliza un producto y tiene un competidor potencial C.
Observemos la gura 3.3.1 y supongamos que el juego ha llegado hasta el
vertice X. Bastar a, entonces, con que M tome su decisi on para que el juego
termine con un pago para cada jugador. X representa una situaci on en la
que C, sin hacer caso de las amenazas de M de bajar el precio, ha entrado
a la competencia. Es claro que, puesta en X, a la empresa M le conviene
no cumplir su amenaza y escoger NBP (no bajar los precios) para ganar 2,
pues si cumpliera su amenaza y escogiera BP no ganara nada.
Entonces, al hacer nuestro an alisis desde la unica jugada nal que
tiene este juego, concluimos que M escoger a NBP y determinar a el vector
de pagos (2, 2). Hemos estudiado el subjuego
X
, a continuaci on podemos
construir un nuevo juego que permitir a continuar el an alisis. Para ello, en
el juego original, borramos los vertices siguientes a X, a este lo convertimos
en un vertice nal y le asociamos, como vector de pago, a (2, 2). Este nuevo
juego, se denota como

X
(2,2)
(ver gura 3.3.1). Ahora, podemos repetir
el proceso dentro de

X
(2,2)
. All, el unico que toma decisiones es C, a el le
convendr a entrar a competir, es decir, elegir E (entrar) para ganar 2, en vez
de no entrar, NE, y obtener s olo un pago de 1. Por lo que podemos decir
que las estrategias soluci on del juego original son (E) para C y (NBP)
para M.
Con esta idea, podemos estudiar cualquier juego de informaci on perfecta
nito, con azar o sin azar, aunque, si el juego es muy grande, el podemos
estudiar se quedar a en el ambito de la teora.
Analicemos, ahora, un juego con azar, como el del riesgo de contratar
a un holgaz an, ejemplo 2.2.3. Recordemos que en los vectores de pago, la
primera coordenada corresponde a E y la segunda a P. X
1
, X
2
, X
3
y X
4
(gura 3.3.2) son los vertices que tienen alternativas nales y todos ellos
son vertices de azar. Cada uno de ellos se puede convertir en vertice nal,
asign andole el vector de pagos esperados.
As, vamos construyendo

X
1(105,20)
,

X
1(105,20)

X
2(100,270)
,

X
1(105,20)

X
2(100,270)

X
3(115,10) ,
107
108 Estrategias y Forma Normal
C
NE E
C
NE
BP
M X
NBP
E
(0,0)
M X
(2,2)

X
|X
(5,1)
(0,0)
(2,2)

(2,2)
(2,2)
NBP BP
(5,1)
Figura 3.3.1:

X
1(105,20)

X
2(100,270)

X
3(115,10)

X
4(190,180) .
En

X
1(105,20)

X
2(100,270)

X
3(115,10)

X
4(190,180)
(gura 3.3.3), se puede
continuar el an alisis, considerando los vertices X
5
y X
6
, ambos del jugador
E. En X
5
, E ha sido contratado con 100 pesos de salario y le convendr a elegir
ser holgaz an (holg) y, entonces, llegaremos a
X
8
X
5
X
6
X
1
X
2
X
3
X
4
E
(100,0)
E E X
7
100 200
E E
holg tr holg tr
0 0 0 0
.9 .9 .9 .1 .1 .1
(150,200)
(100,0)
(100,0)
(100,300)
(100,0)
(250,100)
(100,0)
P
nac ac nac ac
(200,200)
.1 .9
(100,0)
Figura 3.3.2:
108
Modelos de juegos no cooperativos 109

X
1(105,20)

X
2(100,270)

X
3(115,10)

X
4(190,180)

X
5(105,20) .
En cambio, en X
6
, a E lo contrataron con un salario de 200, y le con-
vendr a ser trabajador (tr) y se llegara a

X
1(105,20)

X
2(100,270)

X
3(115,10)

X
4(190,180)

X
5(105,20)

X
6(190,180) .
Si llamamos a dicho juego, de nuevo, en este, habra dos vertices del
jugador E con alternativas que son vertices nales y, en los dos, le con-
vendra aceptar el empleo que le ofrecen ya sea con salario de 100 o de
200 y en estos dos pasos construiramos, en primer lugar

X
7(105,20)
, y

X
7(105,20)

X
8(190,180) .
X
8
X
5 X
6
(100,0)
E E X
7
100 200
P
E
tr holg tr holg
(105,20)
(100,270)
(115,10)
(190,180)
nac ac nac ac
(100,0)
E
Figura 3.3.3:
Este ultimo juego podado ya s olo consta del vertice del jugador P y de
sus alternativas que son vertices nales. A P le conviene ofrecer un salario
de 200, para obtener una ganancia de 180, en lugar de los 20 que obtendra,
si ofrece un salario de 100.
Entonces, las estrategias soluci on seran (200) para P y (ac, ac,holg, tr)
para E. Con el perl construido, P ganar a 180 y E, 190.
A continuaci on, formalizaremos el procedimiento empleado en los ejem-
plos anteriores como un algoritmo que construye una estrategia para cada
jugador, en los juegos nitos de informaci on perfecta.
Algoritmo 1 (Inducci on hacia atr as (Algoritmo de Zermelo)). Sea
un juego extensivo de informaci on perfecta nito, con arbol ((V, A)), raz
U y conjunto de jugadores N no vaco.
109
110 Estrategias y Forma Normal
Primer paso: Llamamos
0
a , V
0
a V , A
0
a A y T
0
a T. Ya que V
0
tiene m as de un elemento, existe X
1
V
0
tal que Alt (X
1
) T
0
. Luego,
0
X
1
es un juego cuyo arbol es
(X
1
Alt (X
1
) , X
1
, Y [Y Alt (X
1
)) ,
y tenemos dos casos:
a) X
1
= S
j
0
l
0
, para alg un jugador j
0
, entonces consideramos F
0
tal que

j
0
(F
0
) = m ax
FAlt(X)

j
0
(F) y denimos
j
0
X
_
S
j
0
l
0
_
= (F
0
) (ndice de
F
0
).
Si V V
X
1
= , el algoritmo termin o habiendo construido

=
_

j
0
X
1
_
.
Si V V
X
1
,= , denimos
1
=
0

X
1((F
0
)) .
b) X
1
S
0
, denimos

1
=
0

X
1
0
@
P
FAlt(X
1
)
P(F|X
1
)(F)
1
A
.
Consideramos que este juego no se reduce a un vertice, pues sino
sera un juego de azar.
Segundo Paso: Hip otesis de inducci on
Consideremos construidos los juegos
0
,
1
, ...,
k1
,
k
, los vertices X
1
,...,
X
k+1
y las estrategias
j
1
Xm
1
,
j
2
Xm
2
,...,
jr
Xmr
tales que:
a)
0
,
1
, ...,
k1
son juegos de informaci on perfecta, con raz U y para
i = 1, .., k,
i
=
i1

X
i(d)
, con
d =
_

_
(F
i
) si X
i
S
j
i
m
i
y
j
i
(F
i
) = m ax
FAlt(X
i
)

j
i
(F) ,

FAlt(X
1
)
P (F [X
1
) (F) si X
i
S
0
.
Cada
i
se puede cortar en X
i+1
.
b) Alt (X
i
) T
i0
y los subjuegos
i1
X
i
tienen un arbol de la forma
(X
i
Alt (X
i
) , (X
i
, Y ) [Y Alt (X
i
)) .
110
Modelos de juegos no cooperativos 111
c) Adem as, para cada X
m
1
que est a en alg un S
j
i
m
,
j
i
Xm
1
_
S
j
i
m
_
= (F
i
),
donde F
i
es tal que
j
i
(F
i
) = m ax
FAlt(X
i
)

j
i
(F).
Tercer Paso: Paso general:
a) No existe X
k+1
donde se corte
k
de tal manera que Alt (X
k+1
)
T
k
0
. Si el unico vertice no nal de
k
pertenece a S
j
r+1
m

, constuimos

j
r+1
tal que
j
r+1
_
S
j
r+1
m

_
= (F
i
), donde X es tal que
j
i
(X) =
m ax
XAlt(U)

j
i
(X).
El algoritmo termina con la composici on, para cada j N, de las
estrategias
_

j
i
_
construidas tales que j
i
= j.
b) Existe X
k+1
donde se corta
k
. Consideramos
k+1
=
k
[X
k+1
(d) ,
con
d =
_

_
(F
i
) si X
k+1
S
j
i
m
y
j
i
(F
i
) = m ax
FAlt(X
k+1
)

j
i
(F) ,

FAlt(X
1
)
P (F [X
1
) (F) si X
k+1
S
0
.
y
j
i
tal que
j
i
_
S
j
i
m
_
= (F
i
).
Se pasa al cuarto paso;
Cuarto Paso: Se aplica el paso general a
k+1
.
Teorema 3.3.1. El algoritmo de Zermelo o de inducci on hacia atr as, para
juegos nitos de informaci on perfecta, termina en un n umero nito de pasos
construyendo una estrategia
j
para cada j N.
Demostraci on. Todos los pasos son realizables, no hay repeticiones y el
n umero de vertices es nito. Adem as, para todo Y vertice no nal de , en
alg un momento X = Y , por lo que las estrategias de los jugadores quedar an
completas.
Observaci on 3.3.1. Es claro que las estrategias construidas por el algorit-
mo no son unicas, pues en algunos pasos puede existir m as de una soluci on
al problema m ax
F Alt(X)

k
j
(F).
111
112 Estrategias y Forma Normal
3.4. Forma Normal y Equilibrio de Nash
La tarea en esta secci on consiste en construir, para cada juego extensivo
nito , un juego rectangular que sea equivalente, en cierto sentido, a .
Se considerar an los equilibrios de Nash de dicho juego rectangular como las
soluciones de .
Que pasa en un juego extensivo nito, cuando cada jugador ha elegido
una de sus estrategias? Examinemoslo para algunos de los ejemplos de la
secci on 2.2.
Si en La cadena de supermercados de Selten (ejemplo 2.2.2, gura
2.2.2), el jugador M escogiera (inv, bp, bp) y el jugador C escogiera (e, e),
entonces el juego terminara en el vertice nal con vector de pago (1, 0). En
este juego, dado cualquier perl o pareja de estrategias
_

M
,
C
_
, encon-
tramos el vector de pagos correspondiente al unico vertice nal al que nos
conducen las estrategias dadas.
Podemos construir, entonces, un juego rectangular que obtiene los mis-
mos resultados (pagos) para cada pareja de estrategias que los que se ob-
tienen en el juego extensivo. La matriz de pago de dicho juego rectangular
es la siguiente:
(E, E) (E, NE) (NE, E) (NE, NE)
(INV, BP, BP)
(INV, BP, NBP)
(INV, NBP, BP)
(INV, NBP, NBP)
(NINV, BP, BP)
(NINV, BP, NBP)
(NINV, NBP, BP)
(NINV, NBP, NBP)
_
_
_
_
_
_
_
_
_
_
_
_
(1, 0) (1, 0) (3, 1) (3, 1)
(1, 0) (1, 0) (3, 1) (3, 1)
(0, 2) (0, 2) (3, 1) (3, 1)
(0, 2) (0, 2) (3, 1) (3, 1)
(0, 0) (5, 1) (0, 0) (5, 1)
(2, 2) (5, 1) (2, 2) (5, 1)
(0, 0) (5, 1) (0, 0) (5, 1)
(2, 2) (5, 1) (2, 2) (5, 1)
_
_
_
_
_
_
_
_
_
_
_
_
Podemos buscar, entonces, los equilibrios de Nash (ep) de tal juego rec-
112
Modelos de juegos no cooperativos 113
M
NINV
C C
NE E NE E
(3,1)
(5,1)
INV
M M
BP NBP BP NBP
(2,2)
(0,0)
(0,2)
(1,0)
Figura 3.4.1:
tangular. Estos son:
((NINV, BP, NBP), (E, E)),
((NINV, NBP, NBP), (E, E)),
((NINV, BP, BP), (E, NE)),
((NINV, NBP, BP), (E, EN)),
((INV, BP, BP), (NE, E)),
((INV, BP, NBP), (NE, E)),
((NINV, BP, BP), (NE, NE)),
((NINV, NBP, BP)), (NE, NE)).
Observemos que el equilibrio que tiene asterisco corresponde al perl
obtenido con el algoritmo de Zermelo de la secci on anterior.
Examinemos un nuevo ejemplo.
Ejemplo 3.4.1. Supongamos que la empresa C del ejemplo 2.2.2, cuando
tiene que decidir si entra o no a competir, no sabe si M realiz o alguna
inversi on, la que le dara la plena posibilidad de cumplir la amenaza de
bajar los precios, sin castigarse a s mismo, o si no ha hecho tal inversi on y
est a haciendo una amenaza que es un blu (gura 3.4.1).
Con este cambio, C no tiene informaci on perfecta. Sin embargo, sigue
113
114 Estrategias y Forma Normal
ocurriendo que al escoger, M y C, una estrategia cada uno, queda determi-
nado un solo vertice nal y un solo vector de pago.
Nuevamente podemos construir un juego rectangular asociado al juego
3.4.1
E NE
(INV, BP, BP)
(INV, BP, NBP)
(INV, NBP, BP)
(INV, NBP, NBP)
(NINV, BP, BP)
(NINV, BP, NBP)
(NINV, NBP, BP)
(NINV, NBP, NBP)
_
_
_
_
_
_
_
_
_
_
_
_
(1, 0) (3, 1)
(1, 0) (3, 1)
(0, 2) (3, 1)
(0, 2) (3, 1)
(0, 0) (5, 1)
(2, 2) (5, 1)
(0, 0) (5, 1)
(2, 2) (5, 1)
_
_
_
_
_
_
_
_
_
_
_
_
Los equilibrios de Nash (ep) de este juego son
((Ninv, bp, Nbp), (E)),
((Ninv, Nbp, Nbp), (E)),
((Ninv, bp, bp), (EN)),
((Ninv, Nbp, bp), (EN)).
Los dos juegos extensivos nitos que hemos examinado no tienen jugadas
de azar y, para ellos, hemos construido juegos rectangulares, donde el vector
de pago que corresponde a un perl de estrategias es el mismo que el que
corresponde a la partida del juego extensivo determinada por dicho perl. El
resultado puede establecerse para cualquier juego extensivo nito sin azar.
Teorema 3.4.1. Sea un juego extensivo de n personas, tal que S
0
= y
=
_

1
,
2
, ...,
n
_

1

2
...
n
. Entonces existe una partida unica
t

= A
0
= U, A
1
, ..., A
l

tal que si A
m
t

y A
m
S
j
k
, se tiene que
j
_
S
j
k
_
= (A
m+1
).
Demostraci on. Sea A
0
= U. Consideramos S
j
0
i
tal que A
0
S
j
0
i
, denotamos
como A
1
al vertice de Alt(A
0
) tal que (A
1
) =
j
0
_
S
j
0
k
_
y construimos la
trayectoria t
1
= A
0
= U, A
1
.
114
Modelos de juegos no cooperativos 115
Supongamos construida la trayectoria t
r
= A
0
= U, A
1
, ..., A
r
, tal que
para todo m menor que r, si A
m
S
j
k
, entonces
j
_
S
j
k
_
= (A
m+1
). Si A
r
es un vertice nal, t

= t
r
.
Si A
r
no es un vertice nal, consideramos S
jr
i
tal que A
r
S
jr
i
. En-
tonces consideramos t
r+1
= A
0
= U, A
1
, ..., A
r
, A
r+1
, donde (A
r+1
) =

jr
_
S
jr
i
_
. La trayectoria t
r+1
tiene las mismas propiedades que t
r
.
De nuevo nos preguntamos si A
r+1
es un vertice nal. Si lo es, entonces
t

= t
r+1
; si no lo es, construimos A
r+2
, de la misma forma en que se
procedi o con A
r+1
. Si no existen trayectorias innitas en , el procedimiento
termina en un n umero nito de pasos construyendo la partida t

, con las
propiedades requeridas, es claro que esta es unica. Si existen trayectorias
innitas, la partida t

que se construye con ese procedimiento puede ser


nita o innita.
Podemos asociar, entonces, a cualquier juego extensivo nito, sin vertices
de azar, el juego rectangular (N,
j
, ) con () = (F), si F es el vertice
nal de la partida t

. A dicho juego rectangular le llamamos la forma normal


de .
La forma normal de juegos con azar
Cuando en un juego interviene el azar, las cosas no ser an iguales. Con-
sideremos el ejemplo 2.2.2, pero transformemos ahora la cadena de Selten de
tal manera que en el vertice inicial, el azar, en vez de M, es quien decide a
cu al de los vertices del conjunto de informaci on de C se va a llegar. Supong-
amos, por ejemplo, que con dos tercios de probabilidad llegaremos al vertice
izquierdo X y con un tercio al derecho Y (gura 3.4.2). Entonces al escoger
cada jugador una estrategia, no queda determinado un s olo vertice nal. Si,
por ejemplo, M escoge su estrategia (bp, bp) y C su estrategia (NE), en-
tonces con probabilidad dos tercios podemos llegar a F
1
y con probabilidad
un tercio podemos llegar a F
2
.
En forma general, dado un perl de estrategias puras, podemos construir
la probabilidad de que el juego llegue a un vertice Z, si est a en un vertice
X, donde Z es mayor o igual que X.
1. Sea un perl de estrategias, X un vertice y Z una alternativa de X,
115
116 Estrategias y Forma Normal
C
NE E NE E
M M
BP NBP BP NBP
(2,2)
(0,0)
(0,2)
(1,0)
0
2/3
X C Y
(3,1) F
(5,1) F
Z Z*
1/3
1
2
Figura 3.4.2:
denimos:
P

(Z [X) =
_

_
P (Z [X) si X S
0
1 si X S
j
k
y
j
_
S
j
k
_
= (Z)
0 si X S
j
k
y
j
_
S
j
k
_
,= (Z)
2. Para X V , denimos P

(X [X) = 1.
3. Para X y Z tales que X < Z, consideramos la trayectoria
X
0
= X, X
1
, ..., X
m
= Z (trayectoria unica que une a X con Z) y
denimos
P

(Z [X) = P

(X
1
[X
0
) P

(X
2
[X
1
) ...P

(X
m
[X
m1
) .
Para cualquier vertice X, denotamos como P

(X) a P

(X[U ). Sea t tal


que t = W (F); entonces tendr an el mismo signicado P

(t) y P

(F).
Dado un vertice arbitrario X, denotaremos como X) al conjunto de
vertices nales mayores que X y como long(X) a la longitud de la trayectoria
m as larga que une al vertice X con alguno de los vertices de X).
Proposici on 3.4.2. Si X es un vertice, y F X), entonces
P

(F [X) es no negativo y

FX
P

(F [X) = 1.
116
Modelos de juegos no cooperativos 117
Demostraci on. Claramente P

(F [X) 0, pues por denici on es un pro-


ducto de n umeros no negativos. La demostraci on de

FX
P

(F [X) = 1 se
har a por inducci on sobre long(X).
Si long(X) = 1, tenemos que Alt(X) = X).
Entonces, si X es un vertice de azar,

FX
P

(F [X) =

FX
P(F [X) =
1 y si X S
j
k
,
j
_
S
j
k
_
=
_

F
_
, para un s olo vertice

F de X), entonces
P

F [X) = 1. Mientras que P

(F [X) = 0, para todo F X), F ,=



F.
Entonces,

FX
P

(F [X) = 1.
Supongamos, por hip otesis de inducci on que si X es tal que long(X) < k,
entonces

FX
P

(F [X) = 1.
Veamos que ocurre si X es tal que long(X) = k.

FX
P

(F [X) =

Y Alt(X)

FY
P

(Y [X) P

(F [Y ) =

Y Alt(X)
P

(Y [X)

FY
P

(F [Y ).
Como long(Y ) < k,

FY
P

(F [Y ) = 1.
Entonces,

FX
P

(F [X) =

Y Alt(X)
P

(Y [X) = 1.
Al considerar el caso en que el vertice X es U, el vertice de inicio del
juego, obtenemos, como corolario, el resultado de que cualquier perl de
estrategias determina una distribuci on de probabilidad entre los vertices
nales del juego.
Corolario 3.4.3. En un juego extensivo nito, cualquier perl de estrategias
induce una distribuci on de probabilidad entre los vertices nales.
Demostraci on. Todo vertice nal est a en U), as que P

(F [U ) 0 y

FT
P

(F) =

FU
P

(F [U ) = 1.
Con base en ese resultado, podemos asociar un juego rectangular a cada
juego extensivo nito . A ese juego le llamaremos la forma normal de .
Denici on 3.4.4. Dado un juego extensivo nito arbitrario , con el con-
junto de jugadores N, la funci on de pago y los conjuntos de estrategias
puras
j
, el juego (N,
j
, ) es la forma normal de , si : R
n
est a denida como () =

FT
P

(F) (F).
117
118 Estrategias y Forma Normal
Observaci on 3.4.1. En un juego extensivo , sin azar, cada vez que los
jugadores escogen un perl de estrategias puras obtienen el mismo pago con
la forma normal de que el obtenido en , por lo que podramos decir que
la forma normal representa cabalmente a . En cambio, en la forma normal
de un juego extensivo con azar, un perl de estrategias tiene que usarse un
n umero enorme de veces para dar el mismo pago medio en ambas formas
del juego, extensiva y normal. Es decir, la forma normal representa a en
el largo plazo. En ambos casos, los equilibrios de Nash de la forma normal
se considerar an los equilibrios de Nash del juego extensivo.
Denici on 3.4.5. Un perl de estrategias

es un equilibrio de Nash en
estrategias puras del juego extensivo nito , si es un equilibrio de Nash en
estrategias puras de la forma normal de .
Construyamos la forma normal de otros juegos extensivos nitos para
encontrar sus equilibrios de Nash (ep). Empecemos con el ejemplo de la
gura 3.4.2.
E NE
(BP, BP)
(BP, NBP)
(NBP, BP)
(NBP, NBP)
_
_
_
_
(2/3, 0) (11/3, 1)
(4/3, 2/3) (11/3, 1)
(0, 4/3) (11/3, 1)
(2/3, 2) (11/3, 1)
_
_
_
_
Los equilibrios de Nash (ep) de este juego son:
((BP, BP), (NE)) y
((BP, NBP), (NE)).
La forma normal del juego del riesgo moral (Ejemplo 2.2.3) es la matriz
siguiente, en la que el jugador I es el empleado E.
118
Modelos de juegos no cooperativos 119
100 200
(ac, ac, ho lg, ho lg)
(ac, ac, ho lg, tr)
(ac, ac, tr, ho lg)
(ac, ac, tr, tr)
(ac, nac, ho lg, ho lg)
(ac, nac, ho lg, tr)
(ac, nac, tr, ho lg)
(ac, nac, tr, tr)
(nac, ac, ho lg, ho lg)
(nac, ac, ho lg, tr)
(nac, ac, tr, ho lg)
(nac, ac, tr, tr)
(nac, nac, ho lg, ho lg)
(nac, nac, ho lg, tr)
(nac, nac, tr, ho lg)
(nac, nac, tr, tr)
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
(105, 20) (115, 10)
(105, 20) (190, 180)
(100, 270) (115, 10)
(100, 270) (190, 180)
(105, 20) (100, 0)
(105, 20) (100, 0)
(100, 270) (100, 0)
(100, 270) (100, 0)
(100, 0) (115, 10)
(100, 0) (190, 180)
(100, 0) (115, 10)
(100, 0) (190, 180)
(100, 0) (100, 0)
(100, 0) (100, 0)
(100, 0) (100, 0)
(100, 0) (100, 0)
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Los equilibrios de Nash (ep) del juego de riesgo moral son:
((ac, ac, ho lg, ho lg), (100)),
((ac, nac, ho lg, ho lg), (100)),
((ac, nac, ho lg, tr), 100),
((ac, ac, ho lg, tr), (200)),
((nac, ac, ho lg, tr), (200)) y
((nac, ac, tr, tr), (200)).
El equilibrio que tiene asterisco es la soluci on obtenida con el algoritmo de
Zermelo.
En la matriz siguiente se representa la forma normal del juego del duelo
(ejemplo 2.2.4) cuando los duelistas est an separados 5 pasos, tienen ambos
la misma habilidad para disparar y la probabilidad de matar al contrario
depende del n umero de pasos a que se encuentran, cuando se efect ua el
disparo, de la siguiente manera: p (5) = .2, p (4) = .4, p (3) = .6, p (2) = .8,
p (1) = .9, p (0) = 1
119
120 Estrategias y Forma Normal
(d, d) (d, e) (e, d) (e, e)
(d, d, d)
(d, d, e)
(d, e, d)
(d, e, e)
(e, d, d)
(e, d, e)
(e, e, d)
(e, e, e)
_
_
_
_
_
_
_
_
_
_
_
_
(.6, .6) (.6, .6) (.6, .6) (.6, .6)
(.6, .6) (.6, .6) (.6, .6) (.6, .6)
(.6, .6) (.6, .6) (.6, .6) (.6, .6)
(.6, .6) (.6, .6) (.6, .6) (.6, .6)
(.2, .2) (.2, .2) (.2, .2) (.2, .2)
(.2, .2) (.2, .2) (.2, .2) (.2, .2)
(.2, .2) (.2, .2) (.6, .6) (.8, .8)
(.2, .2) (.2, .2) (.6, .6) (1, 1)
_
_
_
_
_
_
_
_
_
_
_
_
Los equilibrios de Nash (ep) del juego son:
((esperar, disparar, disparar) , (disparar, disparar)),
((esperar, disparar, disparar) , (disparar, esperar)),
((esperar, disparar, disparar) , (esperar, disparar)),
((esperar, disparar, esperar) , (disparar, disparar)),
((esperar, disparar, esperar) , (disparar, esperar)),
((esperar, disparar, esperar) , (esperar, disparar)).
Las soluciones de Zermelo est an marcadas con asterisco.
El juego del p oker simplicado (Ejemplo 2.2.8) tiene como forma normal:
creer no creer
(ver, ap, ap)
(ver, ap, nap)
(ver, nap, ap)
(ver, nap, nap)
(bl, ap, ap)
(bl, ap, nap)
(bl, nap, ap)
(bl, nap, nap)
_
_
_
_
_
_
_
_
_
_
_
_
(0, 0) (1/2, 1/2)
(0, 0) (1, 1)
(0, 0) (1/2, 1/2)
(0, 0) (1, 1)
(1, 1) (0, 0)
(1, 1) (3/2, 3/2)
(1, 1) (1/2, 1/2)
(1, 1) (1, 1)
_
_
_
_
_
_
_
_
_
_
_
_
El unico equilibrio del juego es
((blu, no apostar, apostar), (no creer)).
A un no podemos hablar de soluci on de Zermelo para este juego.
120
Modelos de juegos no cooperativos 121
Tenemos, entonces, el concepto de equilibrio de Nash (ep) para los jue-
gos extensivos nitos. Sin embargo, es claro que no todos los juegos exten-
sivos nitos tendr an equilibrio de Nash (ep), pues basta observar que para
cualquier juego rectangular hay por lo menos un juego extensivo del que es
forma normal y sabemos que en los juegos rectangulares no siempre existen
equilibrios de Nash en estrategias puras.
Otro problema, que a estas alturas ser a evidente para todos, es que la
forma normal de un juego es frecuentemente tan grande que resulta inmane-
jable o imposible de construir. Un ejemplo ilustrativo en esa direcci on es el
del juego del gato. Juego tan sencillo que cualquier ni no puede descubrir
su soluci on, pero que tiene una forma normal enorme. Contar el n umero de
estrategias de cada jugador en el gato es un ejercicio com un en los textos de
teora de juegos. Su forma extensiva tiene muchas simetras y no es difcil
construir la soluci on de Zermelo para ese juego, pero esa es otra historia.
En los ejemplos de informaci on perfecta mostrados ha ocurrido que
siempre tienen soluciones de Zermelo y que son equilibrios de Nash, de-
mostraremos en la secci on siguiente que estos son resultados generales. En
cambio, no es cierto, como tambien muestran los ejemplos, que cada equi-
librio de Nash se pueda construir con la inducci on hacia atr as. Este tipo de
procedimiento constituye un procedimiento para seleccionar equilibrios, en
los que los contendientes eligen bien en cada parte de un juego extensivo.
Adem as, provocan que la forma normal de los juegos de informaci on perfecta
nitos s olo tenga una importancia te orica y no tenga sentido pr actico para
encontrar un equilibrio de Nash.
Por la importancia que tiene la inducci on hacia atr as (o algoritmo de
Zermelo), tanto en el sentido pr actico, c omo en cuanto a su papel en la
selecci on de equilibrios, se buscar a generalizarla en varios contextos. Por lo
pronto, en la siguiente secci on estudiaremos sus posibilidades para los juegos
de informaci on no perfecta.
3.5. Equilibrios Perfectos en Subjuegos
Podremos generalizar el algoritmo de inducci on hacia atr as para juegos
extensivos nitos, aunque no sean de informaci on perfecta, pero que puedan
cortarse en alguno de sus vertices y cuyos subjuegos tengan equilibrios de
Nash (ep). La idea consiste en cortar un juego en los subjuegos nales
m as peque nos posibles, para analizarlos en busca de equilibrios de Nash
(ep) y, en caso de que existan, seleccionar alguno de ellos. Posteriormente
se supondra que si el juego hubiese llegado al inicio X de uno de dichos
121
122 Estrategias y Forma Normal
subjuegos, denotemoslo como
X
, los jugadores se comportaran de acuer-
do al equilibrio seleccionado y, entonces, se puede considerar que X es un
vertice nal de un juego que resulta de despues de borrar a
X
excepto X
mismo. Adem as, a X se le asigna como vector de pago el que corresponde al
mencionado equilibrio. En el algoritmo denido y ejemplicado en la secci on
2.3, es eso exactamente lo que se hace, con la particularidad de que todos
los subjuegos encontrados all son de longitud 1 y siempre tienen equilibrios
de Nash (ep), cosa que en general no sucede.
Antes de formalizar el nuevo algoritmo, veamos su funcionamiento en
algunos ejemplos.
0
1/2 1/2
Y**
dos
bluff
as
Y* II II
Z I
apuesta
(1,1)
(2,2)
(1,1)
I Z*
Y I
verdad
(1,1)
(2,2)
(1,1)
cree
no cree no cree
cree
no apuesta no apuesta apuesta
(1,1)
Figura 3.5.1:
Pensemos en el p oker simplicado (ejemplo 2.2.8). La representaci on de
su modelo extensivo se repite en la gura 3.5.1. Desde luego que el juego no
se puede cortar en vertices pertenecientes a un conjunto de informaci on que
tiene m as de un vertice, por ejemplo en Y

y en Y

, tampoco en vertices
cuyo conjunto de informaci on s olo est a formado por ellos mismos, como Y ,
o son de azar, pero en los que alg un vertice mayor que Y comparte conjunto
de informaci on con vertices que no son mayores que Y . En el juego, existen
dos vertices en donde el juego s se puede cortar, Z y Z

. Los subjuegos
correspondientes son
Z
y
Z
. Consideremos la forma normal de
Z
en
busca de equilibrios.
122
Modelos de juegos no cooperativos 123
FORMA NORMAL DE
Z
apostar
no apostar
_
(2, 2)
(1, 1)
_
Se podran poner unicamente los pagos del jugador I, pues II no toma
decisiones en este juego.
El unico equilibrio de Nash(ep) de
Z
es (no apostar), entonces obtene-
mos el juego podado

Z
(1,1)
que se representa en la gura 3.5.2. El unico
vertice en el que se puede cortar este juego es en Z

. Obtenemos el juego

Z
(1,1)
Z

cuya forma normal es la siguiente:


0
1/2 1/2
Y**
dos
bluff
as
Y* II II
Y I
verdad
(1,1) (1,1)
(1,1)
Z*
I
apuesta
(1,1)
(2,2)
no apuesta
cree
no cree
cree
no cree
(1,1)
Figura 3.5.2:
FORMA NORMAL DE

Z
(1,1)
Z

apostar
no apostar
_
(2, 2)
(1, 1)
_
El unico equilibrio de

Z
(1,1)
Z

es (apostar). Entonces, obtenemos el


juego podado

Z
(1,1)

(2,2)
que se representa en la gura 3.5.2. Este
juego ya no se puede cortar, por lo que necesitamos su forma normal.
FORMA NORMAL DE

Z
(1,1)

(2,2)
creer no creer
verdad
blu
_
(0, 0) (1/2, 1/2)
(1, 1) (1/2, 1/2)
_
123
124 Estrategias y Forma Normal
0
1/2 1/2
Y**
dos
bluff
as
Y* II II
Y I
verdad
(1,1)
no cree cree no cree cree
(1,1) (1,1)
(1,1) (2,2)
Figura 3.5.3:
El unico equilibrio de Nash (ep) del juego

Z
(1,1)

(2,2)
es
((blu), (no creer)) .
Podemos componer los equilibrios de los juegos

Z
,

Z
(1,1)
Z

Z
(1,1)

(2,2)
y obtenemos el perl de estrategias
((blu,no apostar,apostar),(no creer)).
Este es el unico equilibrio del juego original como estudiamos en la
secci on 3.4. Pero, ahora, es claro que este equilibrio se puede obtener con un
algoritmo que hace un an alisis de inducci on hacia atr as.
Hemos compuesto los equilibrios de dos subjuegos con el del juego dos
veces podado y encontrado un equilibrio de la forma normal del juego com-
pleto. Este procedimiento al que podemos referirnos como la composici on
de equilibrios siempre obtendr a un equilibrio del juego completo. Para de-
mostrar la validez de este hecho, probemos antes un lema que muestra que
el juego podado concentra, en cierto sentido, al juego original.
Dado un juego que se puede descomponer en un vertice X, si deno-
tamos como a la funci on de pago en la forma normal de , denotaremos
como
X
a la funci on de pago en la forma normal de
X
y como

X
(d)
a
la funci on de pago en la forma normal de

X
(d)
.
Lema 3.5.1. Sea un juego extensivo que se puede descomponer en el
vertice X. Para todo perl de estrategias ,
() =

X
(
X
(
X
))
( [X) .
124
Modelos de juegos no cooperativos 125
Demostraci on. Toda se puede considerar como la composici on (
X
, [X).
Adem as,
() =

FT,F>X
P

(F) (F) +

FT,FX
P

(F) (F) =

FT,F>X
P

(X) P

(F [X) (F) +

FT,FX
P

(F) (F) =
P

(X)

FT,F>X
P

(F [X) (F) +

FT,FX
P

(F) (F) =
P

(X)
X
(
X
) +

FT,FX
P
|X
(F) (F) =

FT|X
P
|X
(F) (F) =

X
(
X
(
X
))
( [X) .
Teorema 3.5.2. Sea un juego nito que se puede descomponer en X,
un equilibrio de Nash (ep) de
X
y

un equilibrio de Nash (ep) de

X
(
X
(b ))
. Entonces ( ,

) es un equilibrio de Nash (ep) de .


Demostraci on. Si j N y
j

j
, tenemos que

j
_
( ,

j
_
=
P

b
b [
j
X

(X)
j
X
_

j
X
_
+

FT|X
P

b
b |
j

(F)
j
(F).
Como es equilibrio de
X
,
j
X
_

j
X
_

j
X
( ).
Es decir,
j
_
( ,

j
_

b
b [
j
X

(X)
j
X
( ) +

FT|X
P

b
b |
j
|X

(F)
j
(F) =
j

X
(b )
_

j
_
.
Pero,

es un equilibrio de Nash (ep) de

X
(
X
(b ))
, por lo que

X
(b )
_

j
_

j

X
(b )
_


_
.
Por el lema 3.5.1, tenemos

X
(b )
_


_
=
j
_
( ,

)
_
.
Uniendo estos resultados obtenemos, nalmente, que

j
_
( ,

j
_

j
_
( ,

)
_
, para todo jugador j y para toda
j

j
.
Es decir, ( ,

) es un equilibrio de Nash (ep) de .


El teorema recproco no es cierto. Es decir, si un juego se puede cortar
en el vertice X y

es un equilibrio de Nash (ep) de , no necesariamente

X
y

[X son equilibrios de
X
y de [X, respectivamente. En el ejemplo
125
126 Estrategias y Forma Normal
de la gura 3.4.2, ((BP, BP); (NE)) es un equilibrio de Nash en estrategias
puras de ese juego, pero su restricci on al subjuego que empieza en Z

no
es equilibrio de dicho subjuego. Cuando los jugadores usan la pareja de
estrategias ((BP, BP); (NE)), la probabilidad de que el juego llegue a Z

es cero, por lo que es intranscendente como pensaba actuar el jugador M en


este subjuego. Es decir, el hecho de jugar mal en un vertice al que no se
llegar a, no quita a un perl su car acter de equilibrio de Nash.
Es natural, por el contrario, esperar que si un equilibrio determina una
probabilidad positiva de llegar a un vertice X, en donde el juego se puede
descomponer, entonces la restricci on del equilibrio al subjuego que empieza
en X sea a su vez equilibrio del subjuego; este resultado se prueba en el
teorema 3.5.3.
Teorema 3.5.3. Si se descompone en X y

es un equilibrio de Nash
(ep) tal que P

(X) es positivo, entonces

X
y

[X son equilibrios de Nash


(ep) de
X
y

X
(

X
)
, respectivamente.
Demostraci on. Sea un juego que se descompone en X y

un equilibrio
de Nash (ep) tal que P

(X) > 0. Para un jugador j arbitrario, supongamos


una estrategia
j

j
[X. Ahora, consideremos
j

j
tal que
j
X
=
j
X
y
j

X =
j
.
Es claro, por el lema 3.5.1 y porque

es un equilibrio de Nash (ep) de


que las siguientes relaciones son ciertas para j:

X
(

X
)
(

[X) =
j
(

)
j
_

j
_
=

X
(

X
)
_

j
[X
_
.
Pero, entonces,

[X es un equilibrio de Nash de

X
(

X
)
. Observe-
mos que esto no depende del signo de P

(X).
Supongamos que

X
no es un equilibrio de Nash de
X
. Entonces, existe
un jugador

j tal que, para alguna


b
j

b
jX
,
b
jX
(

X
) <
b
jX
_


b
j
_
.
Consideremos
j

b
j
tal que
b
j
X
=
b
j
y
b
j
[X =
b
j
[X, es decir,

b
j
[X
(
X
(

X
))
(

[X) =
b
j

X
(
X
(

X
))
_

[X

j
[X
_
.
Desarrollemos explcitamente el primer lado de la igualdad:

b
j
[X
(
X
(

X
))
(

[X) =
P

|X
(X)
b
j
X
(

X
) +

FT|X
P

|X
(F)
b
j
(F) <
P

|X
(X)
jX
_


b
j
_
+

FT|X
P

|X
(F)
b
j
(F) =
126
Modelos de juegos no cooperativos 127
P

|X

bj
|X

(X)
b
jX
_


b
j
_
+

FT|X
P
(

|X[
b
j
|X )
(F)
b
j
(F) =

FTX
P

bj

(F)
b
j
(F) +

FT|X
P

bj

(F)
b
j
(F) =
b
j
_

j
_
.
Pero
b
j
[X
(
X
(

X
))
(

[X) =
b
j
(

).
Es decir, existe
j

j
tal que
b
j
(

) <
b
j
_


j
_
. O lo que es lo
mismo

no es equilibrio de Nash de , contrario a la hip otesis. Luego

X
es equilibrio de Nash (ep) de
X
.
Denici on 3.5.4. Se dice que

es un equilibrio perfecto en subjuegos de


, si

X
es un equilibrio de Nash (ep) del subjuego
X
para todo vertice X
en el que se puede cortar.
La denici on es v alida tanto para juegos nitos como innitos.
Podramos decir que un equilibrio perfecto en subjuegos previene a los
jugadores contra errores, tanto suyos como de los dem as jugadores, y contra
algunas perturbaciones del juego. Un criterio de selecci on de los equilibrios
del juego nos aconsejara preferir los equilibrios perfectos en subjuegos a los
que no lo son. El equilibrio ((blu , no apostar, apostar), (no creer)), en el
ejemplo del p oker simplicado, es perfecto en subjuegos.
El an alisis de inducci on hacia atr as o algoritmo de Zermelo construye
un perl de estrategias en los que todos los jugadores se comportan bien en
todos los subjuegos, independientemente de si la probabilidad de llegar a
algunos de los subjuegos que determina dicho perl sea cero. Con base en el
teorema 3.5.2 podemos demostrar que dicho procedimiento construye equi-
librios perfectos en subjuegos para los juegos nitos de informaci on perfecta.
Adem as, podremos generalizar el algoritmo para cualquier juego extensivo
nito. Claro que, como era de esperar, el algoritmo aplicado en juegos de in-
formaci on no perfecta, fracasa frecuentemente, pues muchos juegos no tienen
equilibrios de Nash (ep) o no los tienen algunos de sus subjuegos. Pero cuan-
do tiene exito construye equilibrios perfectos en subjuegos.
127
128 Estrategias y Forma Normal
X
1
X
2
X
3
X
4
X
5
espera I Y I Y II Y espera
(.2,.2) (.2,.2)
2 3 1
espera I Y II Y espera espera espera
1 2 3
II Y
4
dispara dispara dispara dispara
(.6,.6) (.2,.2) (.2,.2) (.6,.6)
(.8,.8)
(.6,.6)
(.6,.6)
I Y
1
(.2,.2)
I Y
(1,1) (1,1) (1,1) (1,1)
espera I Y I Y I Y II Y espera espera espera
1 2 3
II Y
4 5
dispara dispara dispara dispara dispara
0 0 0 0 0
.2 .8 .4 .6 .6 .4 .8 .2 .9 .1
(1,1) (1,1) (1,1) (1,1) (1,1) (1,1)
espera (1,1)
espera I Y I Y I Y II Y espera espera espera
1 2 3
II Y
4 5
dispara dispara dispara dispara dispara
(.6,.6) (.2,.2) (.2,.2) (.6,.6) (.8,.8)
(1,1) espera
espera
(.6,.6)
espera I Y
1
(.2,.2)
II Y
2
espera
(.6,.6)
(.2,.2)
dispara
espera
dispara dispara dispara dispara dispara
Figura 3.5.4:
128
Modelos de juegos no cooperativos 129
Algoritmo 2 (Generalizaci on del algoritmo de Zermelo (Inducci on
hacia atr as)). Sea un juego extensivo nito, con arbol (V, A) y raz U,
N ,= .
Primer paso: Llamamos
0
a , V
0
a V , A
0
a A y T
0
a T.
Tenemos tres casos:
a)
0
no se puede descomponer y su forma normal no tiene equilibrios
de Nash (ep); entonces el algoritmo termina con un fracaso.
b)
0
no se puede descomponer, su forma normal tiene equilibrios de
Nash (ep), el algoritmo termina con

, uno de los equilibrio de Nash (ep)


de .
c)
0
se puede descomponer en al menos un vertice; buscamos un vertice
X
1
tal que el subjuego
0
X
1
no se pueda descomponer (siempre existe pues
es nito). Tenemos dos subcasos:
c
1
) La forma normal de
0
X
1
no tiene equilibrios de Nash (ep); el algo-
ritmo termina con un fracaso.
c
2
) La forma normal de
0
X
1
tiene equilibrios de Nash (ep); se elige uno
de ellos, llamemosle

X
1
y denamos
1
como
0

X
1

X
1

X
1

.
Hip otesis de Inducci on: Consideremos que se han dado k pasos y se
han construido los juegos
0
,
1
, ...,
k1
,
k
(
i
con arbol (V
i
, A
i
) y raz
U), vertices X
1
, X
2
, ..., X
k
y perles

X
1
,

X
2
, ...,

X
k
para los juegos

0
X
1
,
1
X
2
, ...,
k1
X
k
tales que:
a) Para i = 0, 1, ..., k 1,
i
se puede cortar en X
i+1
.
b) Para i = 1, 2, ..., k,
i
=
i1

X
i
0
@

X
i

X
i

1
A
y
c)

X
i
es uno de los equilibrios de Nash (ep) del subjuego
i1
X
i
.
Paso general: Tenemos dos casos:
a)
k
no se puede cortar, entonces tenemos dos subcasos:
a
1
)
k
no tiene equilibrio de Nash (ep); entonces el algoritmo termina
con un fracaso.
a
2
)
k
tiene al menos un equilibrio de Nash. Elegimos uno de ellos
y lo denotamos como

k
.
Componemos

X
1
,

X
2
, ...,

X
k
y

k
. El algoritmo termina con el perl
que resulta de esta composici on.
129
130 Estrategias y Forma Normal
b)
k
se puede cortar en alg un vertice. Consideramos X
k+1
, uno de esos
vertices, de tal manera que el subjuego
k
X
k+1
no se pueda cortar.
Hay dos subcasos
b
1
)
k
X
k+1
no tiene equilibrio de Nash; el algoritmo termina con un
fracaso.
b
2
)
k
X
k+1
tiene al menos un equilibrio de Nash. Elegimos uno y lo
denotamos como

X
k+1
.
Denimos
k+1
=
k

X
k+1

X
k+1

X
k+1

y aplicamos el paso general a


k+1
.
Teorema 3.5.5. Si el algoritmo general de Zermelo aplicado a un juego ex-
tensivo nito no fracasa, entonces en un n umero nito de pasos construye
un equilibrio de Nash (ep) de que es un equilibrio perfecto en subjuegos.
La demostraci on de que se ha construido un equilibrio se puede hacer
por inducci on, aplicando repetidamente el teorema 3.5.2 que garantiza que
la composici on de equilibrios es un equilibrio. Como la restricci on del perl
construido a cualquier subjuego es uno de los equilibrios encontrados, o la
composici on de algunos de ellos, ser a equilibrio de dicho subjuego. Es decir,
en caso de exito el algoritmo construye un equilibrio perfecto en subjuegos.
Teorema 3.5.6. Todo juego de informaci on perfecta tiene un equilibrio per-
fecto en subjuegos.
Demostraci on. En los juegos de informaci on perfecta el algoritmo de induc-
ci on hacia atr as siempre tiene exito.
Construyamos todos los equilibrios perfectos en subjuegos del juego de
los duelistas (ejemplo 2.2.4) cuando estos est an separados 5 pasos (Figura
3.5.3).
Aplicamos el algoritmo de Zermelo empezando por los vertices de azar
y obtenemos el juego

X
1((.6,.6))

X
2(.2,.2)

X
3(.2,.2)

X
4(.6,.6)
S olo hay un vertice X
5
en el que se puede cortar el juego

. Al analizar
ese unico subjuego que ya no se puede cortar, es claro que I elegir a disparar
que es el unico equilibrio del subjuego

X
5
y pasamos al juego podado

Y
(.8,.8)
Continuamos el algoritmo y los dos jugadores se van alternando para
tomar decisiones. As II elegir a disparar cuando est an separados dos pasos,
130
Modelos de juegos no cooperativos 131
I decidir a disparar cuando la distancia es de tres pasos, cuando los sepa-
ran cuatro pasos a II le es indiferente escoger disparar o esperar. En ese
momento, II puede escoger cualquiera de los dos, para continuar el an alisis
escogemos uno de ellos, por ejemplo disparar y llegamos a un juego po-
dado que consta s olo del vertice inicial y las dos alternativas de este que
son vertices nales, entonces, I escoge esperar y termina el algoritmo con
((esperar, disparar, disparar), (disparar, disparar)), que es un equilibrio de
subjuego perfecto. El otro equilibrio de subjuego perfecto se obtiene cuando
para el primer conjunto de informaci on de II se elige esperar. Es decir, se
trata de ((esperar, disparar, disparar), (esperar, disparar)).
3.6. Inducci on hacia atras en el caso innito
Juegos innitos, sin partidas innitas
Pensemos, ahora, en los juegos extensivos de informaci on perfecta in-
nitos. En ellos, habr a problemas para aplicar el algoritmo de Zermelo. En
primer lugar, es claro que podramos encontrar juegos innitos, sin partidas
innitas, tales que, en alg un paso del algoritmo, la funci on de pago del ju-
gador que tiene que tomar decisiones no tenga m aximo y, entonces, habra
que buscar otro metodo distinto de la inducci on desde atr as para encontrar
una buena estrategia, si es que el juego la tiene, porque quiz a no la tenga.
Z C
(0,0)
i ...
i
... ...
... ...
... ...
... ...
...
C
(id,i) (id,i)
C
(id,i)
C X
i
X X
i i
(d,0) (d,0) (d,0)
desiste desiste desiste
...
jucio jucio jucio
... ...
... ... ...
C
Y E Y E Y E
i i i
no hace nada demanda
acepta rechaza acepta rechaza acepta rechaza
(xdp ,xp )
E C C
ix + p
(xdp ,xp ) (xdp ,xp
E
E E C
)
Figura 3.6.1:
131
132 Estrategias y Forma Normal
Sin embargo, para algunos juegos innitos, sin partidas innitas, es posi-
ble aplicar el algoritmo. Veamos el ejemplo 2.2.11 de las demandas triviales.
En este juego, con solo demandar, el campesino C tiene que pagar d.
Adem as, la cantidad que puede obtener C, si realiza juicio, es x y p
C
es
el pago que tendra que pagar al abogado encargado de representarlo en el
juicio. Suponemos que x > p
C
. Por otro lado, p
E
es el pago al abogado de
E.
En la gura 3.6.2, se repite el modelo extensivo del ejemplo 2.2.11,
se nalando los vertices en los que el juego se puede cortar, a saber, Z, X
i
, Y
i
.
El algoritmo de Zermelo se puede aplicar, sin problemas, en los vertices X
i
y, despues, en los Y
i
.
Z C
(0,0)
i ...
i
... ...
... ...
... ...
... ...
...
(id,i) (id,i)
...
... ...
C
Y E Y E Y E
i i i
...
(xdp ,xp ) (xdp ,xp )
(id,i)
no hace nada demanda
acepta rechaza rechaza acepta rechaza
i=x+p
acepta
C E C E C E
(xdp ,xp )
E
Figura 3.6.2:
i=x+p
E
Z C
...
C
... ...
...
...
no hace nada demanda
(0,0)
i i
... ...
(xdp ,xp ) (xdp ,xp ) (id,i)
C E C E
Figura 3.6.3:
132
Modelos de juegos no cooperativos 133
Si el juego llega a uno de los vertices X
i
, C debe tomar una decisi on
sobre ir o no a juicio. En todos ellos, le conviene ir a juicio y, entonces,
ganara d + x p
C
, mientras que E ganara x p
E
. Despues de cortar
en todos los vertices X
i
, tendramos el juego podado en todos esos vertices
y con el pago (d +x p
C
, x p
E
) en cada uno de ellos, cuando se han
convertido en vertices nales (gura 3.6.3). Ahora analizamos los vertices
Y
i
en dicho juego podado. Quien decide en estos vertices es E y depende
de la indemnizaci on i que se le ha exigido, si le conviene aceptar o rechazar
la proposici on de pagarla. Si resulta que i < x + p
E
, E aceptar a pagar,
mientras que si i > x + p
E
, E rechazar a hacerlo. La decisi on, en el caso
i = x + p
E
, es arbitraria, podemos inclinarnos por el rechazo o por la
aceptaci on, no tenemos argumentos contundentes para decidirlo. Podramos
alegar un principio de inercia, es decir, E tratara de evitar el juicio, pues lo
conducira a pagar lo mismo, con o sin juicio. Pero, adem as, si suponemos
que E rechaza surgir an nuevos problemas, como veremos m as adelante. Por
lo pronto, continuemos con el an alisis, bajo el supuesto de que E acepta
pagar x +p
E
como indemnizaci on.
C E
(xdp ,xp
C
(0,0)
no hace nada demanda
)
Figura 3.6.4:
Al cortar el juego en los vertices Y
i
y considerar a estos como vertices
nales, se les asociar an diversos vectores de pago, dependiendo de la relaci on
entre i y x +p
E
. En el caso de que i x +p
E
, (i d, i) ser a el vector de
pago; en el caso de que i sea mayor, ser a (d +x p
C
, x p
E
).
Se puede, entonces, analizar el juego que se corta en Z. En este le toca
decidir a C que tiene, en ese momento, innitas alternativas para elegir i.
Sin embargo, existe una sola i, en donde se maximiza el pago de C y esta es
i = x +p
E
. Por n, nos restara un juego que ya no se puede cortar m as, en
el que s olo participa el jugador C. Si x+p
E
> d, C demandar a a la empresa;
por el contrario, si x + p
E
< d, C se quedar a cruzado de brazos. Otra vez,
en caso de igualdad, podemos elegir cualquiera de las dos cosas.
En la guras 3.6.13.6.4, se ilustran los diversos juegos podados que se
van obteniendo, en el proceso de la inducci on hacia atr as.
Pensemos en el caso donde la empresa E decidiese rechazar el pago de
una indemnizaci on x+p
E
. Entonces no existira una indemnizaci on optima,
133
134 Estrategias y Forma Normal
entre las que acepta E y cualquier indemnizaci on mayor o igual que x+p
E
, es
decir cualquiera que rechazase E, sera una elecci on buena para el campesino,
pues tendran que llegar a juicio, y conseguira x +p
E
d, mientras que E
ganara x p
E
.
desiste desiste desiste desiste jucio
contrata antes contrata despus
no hace nada demanda demanda
0
0
0
0
no hace nada
abogado de planta no abogado de planta
jucio jucio jucio
contrata antes contrata despus
acepta rechaza acepta rechaza acepta rechaza acepta rechaza
id
i
d
p
C
C
E
C
dp
C
C C C
C
d
0
E
E
C
E
0
C
C
i i i i
E
C
... ... ... ...
... ... ... ... ... ... ...
... ...
...
...
... ... ...
... ...
...
dp
p
xdp
xp
xdp
xp
C C
xdp
xp
C
E
...
idp
ip
id
ip
idp
i
E
E E
xdp
xp
C
E
C
C
E
E E
C
Figura 3.6.5:
Si hubieramos partido del supuesto de que x < p
C
, el campesino desis-
tir a del juicio, E rechazara cualquier indemnizaci on positiva y el campesino
se quedara cruzado de brazos, pues cualquier gasto en demandar sera dinero
tirado a la calle.
Podemos, todava, sacarle m as jugo al problema de las llamadas deman-
das triviales (x > p
C
) y preguntarnos, por que es com un, en este tipo de
conictos, en los que la mejor manera de comportarse es no llegar a tri-
bunales, encontrarse que tanto la parte demandante, como la demandada,
contratan abogados, antes de saber si llegar an o no a juicio? Frecuente-
mente ese tipo de personal no realiza ninguna labor y, sin embargo, recibe
134
Modelos de juegos no cooperativos 135
un pago por sus servicios. C omo altera el problema, la disyuntiva de
contratar, previamente, a un abogado? Analicemos, primero, el problema
para el campesino, considerando que si decide demandar, se plantear a si es
conveniente contratar un abogado de antemano o es mejor esperar hasta que
sea claro que se llegar a a los tribunales. La gura 3.6.5 representa al modelo
extensivo con dicha modicaci on.
desiste desiste
contrata antes contrata despus
no hace nada demanda demanda
0
0
0
0
no hace nada
no abogado de planta abogado de planta
contrata antes contrata despus
jucio
xdp
xp
...
C
E
xdp
xp
C
E
jucio
idp
ip
C
E
acepta rechaza acepta rechaza
C
C
dp
C
E
C
E
0
C
C
i i
E
C
...
... ...
...
...
...
...
dp
...
...
...
...
...
...
xdp
xp
C
E
xdp
xp
C
E
idp
C
i
C
p
E
C
C
Figura 3.6.6:
Partamos de la rama en que el campesino decide no contratar a ning un
abogado hasta no estar seguro de que lo necesitar a para el juicio. Tenemos
exactamente el juego que examinamos anteriormente, por lo que se llega al
juego podado de la gura 3.6.6. Llevando a cabo el an alisis de la rama que
se forma cuando el campesino contrata de antemano a su abogado, tenemos
que no importando si lo que espera ganar es menor, mayor o igual que el pago
a su abogado, el campesino ir a a juicio, en caso de que haya presentado una
demanda, exigido una indemnizaci on y E no haya aceptado su propuesta.
La empresa aceptar a pagar la indemnizaci on si, y s olo si, la exigencia de C
es menor o igual que x+p
E
. Del algoritmo de Zermelo se desprende que: El
135
136 Estrategias y Forma Normal
campesino contratara posteriormente al juicio en caso de que p
E
< p
c
x.
Si, por el contrario, p
E
> p
c
x, contratara al abogado inmediatamente
despues de demandar. Por ultimo, el campesino demandara s olo en caso de
que x +p
E
> d +p
C
, de otra forma se quedara quieto.
pp
V
p p
V C
0
0
0
0
0
0
p
V
p
C
p p
b=
p p
0
V
V
0
p
a a a
C
C C
na na na
d =
...
a =
P
C C
Figura 3.6.7:
Nos preguntamos si la empresa contratar a o no a un abogado permanente
para todas las posibles demandas que se le vengan encima, gura 3.6.7.
Dejamos la respuesta como ejercicio.
El algoritmo de Zermelo pudo construir una estrategia para cada jugador
en estos ejemplos de juegos innitos. El perl construido por el algoritmo es
un equilibrio perfecto en subjuegos ya que al restringirlo a cada subjuego se
obtiene un equilibrio de dicho subjuego.
Juegos innitos, con partidas innitas.
Otro juego innito de informaci on perfecta que aparece en la secci on
2.2 es el de negociaci on (ejemplo 2.2.12). Sin embargo, en este caso, nos
encontramos con partidas innitas.
Que ocurre en los juegos de informaci on perfecta que tienen partidas
innitas? En principio, no se puede aplicar el algoritmo de inducci on hacia
atr as. Sin embargo, en algunas ocasiones, es posible considerar juegos nitos
cada vez m as grandes y m as parecidos al juego innito que se pretende
analizar. Entonces, se pueden encontrar las soluciones para cada uno de estos
juegos nitos, con el algoritmo de Zermelo, y estudiar si tiene sentido hablar
de un lmite de dichas soluciones. Este lmite es un prospecto de soluci on
del juego de negociaci on con horizonte innito.
136
Modelos de juegos no cooperativos 137
Estudiemos el conicto de compraventa de una casa, un juego de nego-
ciaci on semejante al del ejemplo 2.2.12.
El juego de negociaci on de un solo periodo se puede llamar el juego estado
ya que se repetir a, periodo tras periodo, aunque con algunas modicaciones
en cada ocasi on.
El juego estado.
El juego estado consiste en que el vendedor (V ) hace una propuesta al
comprador (C) de que pague un precio de p millones por la casa, de tal
manera que p
V
p p
C
. El precio mnimo al que vendera V es de p
V
millones de pesos y el m aximo precio que estara dispuesto a pagar C es
de p
C
millones. El precio p que propone V implica una forma de repartirse
el excedente de p
C
p
V
pesos. C puede aceptar o rechazar la oferta p. Si
la acepta el juego termina con los pagos p
C
p y p p
V
para C y V ,
respectivamente; si no la acepta el juego termina, sin acuerdo, es decir, con
el vector de pago de desacuerdo d que suponemos que es (0, 0). Tendramos
una negociaci on de lo toma o lo deja, que es como funciona normalmente una
tienda establecida. La forma extensiva del juego estado se puede observar
en la gura 3.6.7.
En el juego de un solo periodo, V juega una sola vez, sus estrategias son
de la forma (p). Por otro lado, una estrategia de C, quien tambien juega una
sola vez, le debe permitir responder a si aceptara o no cada posible precio.
Una estrategia posible
C
b p
para el comprador consiste en jar un precio
de reserva p, tal que p [p
V
, p
C
] y

C
b p
(p) =
_
acepta si p p ,
no acepta si p > p .
Si C elige una estrategia
C
b p
con un precio de reserva p y el vendedor
elige un precio p, las ganancias de comprador y vendedor son como siguen

E
_
p,
C
b p
_
=
_
p p
V
si p p ,
0 si p > p ,

C
_
p,
C
b p
_
=
_
p
C
p si p p ,
0 si p > p .
Los perles del conjunto
__
p,
C
b p
__
son equilibrios de Nash, ya que para
toda p [p
V
, p
C
],
137
138 Estrategias y Forma Normal

E
_
p,
C
b p
_
=
_
_
_
p p
V
< p p
V
si p < p ,
0 p p
V
si p > p ,
p p
V
si p = p
y

C
_
p,
C
p
_
=
_
p
C
p si p p ,
0 p
C
p p > p .
Consideremos el equilibrio
_
p,
C
b p
_
, con p < p
C
. En este equilibrio, C no
comprara si V le exige ptal que p < p< p
C
, pero es intuitivamente claro
que C no est a jugando bien el subjuego correspondiente a la oferta p. Es
decir,
_
p,
C
b p
_
, con p < p
C
, no es un equilibrio perfecto en subjuegos.
Al hacer el an alisis hacia atr as, se obtiene que aceptar cualquier precio
p menor que p
C
es un equilibrio en el subjuego en el que C debe decidir si
acepta o no dicho precio (denotemoslo como
p
). Si p = p
C
, aceptarlo y no
aceptarlo son, ambos, equilibrios del subjuego
p
C
. Supongamos que en el
subjuego correspondiente a p = p
C
, C elige comprar y seguimos el proceso
de Zermelo, construyendo el juego podado, en donde V debe elegir el precio.
El unico equilibrio de este juego podado consiste en que V elija p
C
que es
donde se maximiza p
V
p. En cambio, si en
p
C
, C elige no aceptarlo, el
juego podado no tiene equilibrio.
Pensemos, ahora, en un juego nito parecido al juego original, pero
las estrategias de V consisten en hacer una oferta escogida de un conjunto
nito de precios posibles, por ejemplo de p
V
millones a p
C
aumentando de
cien mil en cien mil pesos. En este juego, tenemos dos equilibrios perfectos
en subjuegos, en uno C acepta cualquier oferta y V pide el precio de p
C
millones. En este equilibrio V gana p
C
p
V
y C gana cero. En el segundo
C acepta todas las ofertas menores que p
C
millones y rechaza s olo la de p
C
millones y V pide p
C
100, 000. Entonces V gana 900, 000 y C gana 100, 000.
Si las opciones de V son precios que van de p
V
millones a p
C
, aumentando de
10000 en 10000 pesos. Los dos equilibrios son los an alogos y en el primero los
pagos son los mismos y, en el segundo, V elige p
C
10, 000 y gana 990, 000 y
C gana diez mil. Si el conjunto de precios a elegir por V es p
V
, p
V
+1000,
p
V
+ 2000, ..., p
C
1000, p
C
, en el segundo equilibrio, V elige p
C
1000
y gana 999, 000 y C gana 1000, etc. A medida de que las opciones son m as
y m as cercanas, tendiendo a innito el n umero de opciones, el precio del
segundo equilibrio converge a p
C
, la ganancia de V a p
C
p
V
y la de C a
0. Con una denici on de que un buen equilibrio del juego innito debe
ser lmite de equilibrios de juegos nitos que tienden al juego innito. El
unico equilibrio perfecto en subjuegos del juego innito, en el sentido de los
precios que puede pedir V , que es aquel en el que V elige el precio de p
C
138
Modelos de juegos no cooperativos 139
millones y C compra a cualquier precio en [p
V
, p
C
], es lmite de equilibrios
de los juegos nitos. Dicho equilibrio, por cierto, es el unico que es lmite de
ese tipo de equilibrios.
3.6.1. Un principio de equilibrio.
En el equilibrio del juego innito de un solo periodo, se est a cumpliendo
el siguiente principio: V ofrece un precio para el que C es indiferente entre
aceptar o rechazar y C acepta si y s olo si el precio es menor o igual que el que
le exige V . Este principio es v alido en muchas situaciones de negociaci on.
pp
V
p p
V C
p
V
p
C
0
0
0
0
0
0
p
V
p
V
p
C
p
C
0
0
0
0
0
0
p
V
p
C
p p
b=
p p
0
V
V
0
p
a a a
C
C C
na na na
d =
...
a =
P
a a a a na na na na
C C
V V V V
b b b d d d
... ... ...
C
V V
a na na a
C C
Figura 3.6.8:
No siempre una negociaci on tendr a la forma de la gran tienda estableci-
da, tambien puede tomar la forma usual que se establece en los mercados, en
el sentido familiar del termino, entre los marchantes (comprador y vende-
dor). Las cosas, entonces, no funcionan con un lo toma o lo deja, sino que
se llenan de regateo, un hacer ofertas y contraofertas.
Un regateo de dos etapas. Pensemos en una negociaci on que dura m as de
un periodo. Empecemos el an alisis con dos periodos. Es decir, si el comprador
no est a de acuerdo con el precio que le pide el vendedor puede hacer una
contraoferta y, en ese caso, el vendedor debe decidir si acepta o no dicha
139
140 Estrategias y Forma Normal
contraoferta.
pp
V
p p
V C
p
V
p
C
p p
V C
p p
V C
p p
V C
p p
V
0
p
a a a
C
C C
na na na
...
a =
P
C
p p
0
V C
0
0 0
Figura 3.6.9:
Supongamos, de momento, que para los jugadores es lo mismo llegar a un
acuerdo en un periodo que en el siguiente. Examinemos el juego extensivo de
dos periodos de la gura 3.6.8 y consideremos los vertices que empiezan en
alguno de los vertices, en los que V tiene que decidir si acepta o no el precio
p que C ha ofrecido. En cada uno de ellos, la mejor decisi on del vendedor
V es aceptar todos los precios mayores o iguales que p
V
(justicando la
aceptaci on de p
V
, en la forma anterior).
Podemos, entonces, considerar el juego podado, en donde todos los vertices
en que antes decida V sobre la contraoferta se han vuelto nales con vector
de pago
_
p p
V
p
C
p
_
. El pago de C se maximiza al elegir p
V
. En la gura
3.6.6 se observa el juego de dos periodos, despues de podarlo al terminar el
primer periodo.
Si analizamos dicho juego podado, empezaramos en los vertices en los
que C tiene que decidir si acepta o no el primer precio p pedido por V .
Si p = p
V
, C acepta en dicho primer periodo, si p > p
V
, C lo rechaza.
Lo que sabemos, por el an alisis del segundo periodo que conduce a que C
hace la contraoferta de comprar al precio igual a p
V
y a que V lo aceptar a.
En el juego podado en que V debe decidir que precio pedir al inicio. Sus
alternativas son vertices nales todas con el vector de pago
_
0
p
C
p
V
_
.
Entonces, ahora es C el que obtiene todo el excedente.
En forma an aloga, se puede establecer para un n umero nito m de peri-
odos, el negociador que se lleva todo es el ultimo en hacer la oferta. Es decir,
140
Modelos de juegos no cooperativos 141
si m es par el excedente se lo lleva el comprador, si m es impar corresponde
al vendedor.
Volvamos, de nuevo, a la situaci on de dos periodos, pero ahora supong-
amos que no estamos ante un comprador y su marchante, en donde las
ofertas y contraofertas transcurren tan r apidamente que el tiempo no im-
porta. Pensemos que hay un lapso de tiempo considerable entre dos periodos
consecutivos. Entonces, habr a que cambiar los pagos recibidos por cada ne-
gociador, pues no ser a lo mismo conseguir el objeto (o el dinero) en el primer
periodo que en el segundo. Para modelar este hecho, multiplicamos por fac-
tores de descuento
V
y
C
a los pagos del segundo periodo de V y C,
respectivamente.
i
es una medida de paciencia, cuanto m as paciente es i,
m as cercano a 1 ser a su factor de descuento. Supondremos que
C
= e

C
y
V
= e

V
.
Cuando no hay descuento de un periodo a otro y estamos en el primer
periodo, a C le conviene aceptar la oferta de p
V
en dicho periodo y rechazar
cualquier otro y a V le da lo mismo ofrecer cualquier precio. Las cosas
cambian cuando hay un factor de descuento. Para encontrar un equilibrio
de subjuego perfecto, empecemos por los vertices en los que V tiene que
decidir si acepta o no la contraoferta de C. Se llega a que V aceptara
siempre.
Entonces, en todos los vertices en los que C debe elegir un precio de
contraoferta, escogera p
V
. Supongamos que V ha elegido, en el primer pe-
riodo, la oferta de p = x. Para saber si a C le conviene aceptar la compra
al precio x, en el primer periodo, o si es preferible que rechace y haga la
contraoferta de p
V
, aunque se tenga que esperar hasta el segundo periodo
para obtener el objeto, hay que comparar las ganancias de p
C
x, pago
de aceptaci on en el primer periodo, con
C
(p
C
p
V
) pago para C, si rec-
haza x en el primer periodo y hace la contraoferta de p
V
en el segundo
periodo. Resulta que si x es menor o igual que
C
p
V
+(1
C
) p
C
, C acep-
ta el precio x en el primer periodo y si es mayor har a la contraoferta de
p
V
. Entonces, a V le conviene pedir en el primer periodo un precio igual
a
C
p
V
+ (1
C
) p
C
y C lo tendr a que aceptar. La ganancia de V sera
igual a
C
p
V
+ (1
C
) p
C
p
V
= (1
C
) (p
C
p
V
) y la de C igual a
p
C

C
p
V
(1
C
) p
C
=
C
(p
C
p
V
). Es claro que, para esta nego-
ciaci on de dos periodos, a C le convendra ser lo m as indiferente posible al
periodo en que compra y as se llevara casi todo el excedente, en cambio a
V le conviene que C sea muy impaciente, pero no suponemos que el grado
de impaciencia sea una elecci on al alcance de un jugador, sino parte de su
personalidad, su posici on en el regateo, etc.
Podemos observar que, en este caso, el de dos periodos, no interesa si V
141
142 Estrategias y Forma Normal
pp
V
p p
V C
p
V
p
C
p
V
p
V
p
C
p
C
p
V
p
C
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1 1 1 1 1 1
p p
V
0
p
a a a
C
C C
na na na
d = a =
P
a a a a na na na na
C C
V V V V
b b b d d d
... ... ...
C
V V
a na na a
C
p p
b=
0
V C
1

...

... ... ... ... ... ...


0
0 0 0 0 0 0
0 0
Figura 3.6.10:
es paciente o no lo es y que V se est a ajustando al principio de equilibrio
que discutimos anteriormente, pues elige el precio de tal manera que a C le
resulte indiferente aceptar el precio
C
p
V
+(1
C
) p
C
en el primer periodo
o si espera hasta el segundo para lograr que V acepte la contraoferta de p
V
.
3.6.2. El juego con horizonte innito.
Que sentido tiene considerar un n umero innito de periodos?, el lapso
entre dos periodos es de un tama no jo y si Keynes deca que en el largo
plazo estaramos todos muertos, con mayor raz on lo estaramos en un tiempo
innito.
La idea involucrada es distinta, en realidad nadie piensa que tenga sen-
tido que el tiempo transcurrido es de innitos a nos. El horizonte innito
nos permite modelar el hecho de que cada uno de los que participan en
una negociaci on, cuando tiene que tomar decisiones, no ve el n de esta,
siempre es posible dejar para ma nana lo que se puede hacer hoy. Desde la
142
Modelos de juegos no cooperativos 143
perspectiva del comprador y del vendedor, seguir a un siguiente periodo si
no se lleg o a un acuerdo en este, no pueden percatarse en que momento
terminar a, aunque sepan que no puede continuar por siempre. En torno a
esto, es frecuente introducir un factor de probabilidad de paro, distinto que
el factor de descuento, entonces cada negociante percibira que es posible
que el regateo prosiga, sin saber hasta cuando, pero tambien es posible que
el periodo que est a corriendo sea el ultimo. Cuando se trabaja con un factor
de probabilidad de paro, el permanecer eternamente en regateo tiene proba-
bilidad cero. En la gura 3.6.7 se esquematiza el juego con probabilidad de
paro 1 .
Consideremos una negociaci on con horizonte innito, sin factor de proba-
bilidad de paro. El vendedor y el comprador negocian periodo tras periodo,
siguiendo el esquema siguiente: en los periodos impares, el vendedor hace una
oferta, en caso de no estar de acuerdo, el comprador empieza otro periodo
haciendo una contraoferta y siendo V el que debe decidir si la acepta o no.
Si V no acepta la oferta, empieza otro periodo con una nueva oferta de
V , pudiendo continuar, este alternarse de ofertas, hasta innito. El juego
extensivo es innito en ambos sentidos, pues las alternativas en algunos
vertices son innitas y tambien existen partidas innitas.
Si llegara a pasar que, en cada periodo, ninguno de los dos aceptara la
propuesta del otro, tendramos una partida innita en la que el pago que
recibiran ambos jugadores es 0.
Si suponemos que los dos negociantes tienen aversi on al riesgo, entonces
sus funciones de utilidad respecto al excedente que reciben no sera la fun-
ci on identidad, sino funciones estrictamente c oncavas. Adem as, como en el
modelo con un n umero nito de periodos, el tiempo importa, entonces com-
prar o vender al precio p, en el periodo t (o, lo que es lo mismo, apoderarse
de la parte del excedente, determinada por dicho precio, en el periodo t)
produce un pago de u
i
(x, t) =
t
i
u
i
(p), u
V
(p
C
) = u
C
(p
V
) = 1.
Si los jugadores llegan a un acuerdo, en el primer periodo, se reparten
un excedente de p
C
p
V
. Pero, a medida que transcurre el tiempo, sin que
lleguen a un acuerdo, el excedente va decreciendo, al multiplicarse por los
factores de descuento.
Se dice que una estrategia de j es estacionaria cuando j elige lo mismo
en una situaci on dada, no importando la historia transcurrida para llegar a
dicha situaci on. Es decir, la estrategia de j, las propuestas que hace y las
que acepta o rechaza, es independiente de las ofertas y contraofertas que
se han dado a lo largo de los periodos anteriores al actual. Por ejemplo,
cuando el vendedor ha decidido aceptar la oferta p o cualquier precio mayor
y el comprador el precio p

o cualquier precio menor, ambos han elegido


143
144 Estrategias y Forma Normal
estrategias estacionarias. Puede este tipo de estrategias formar un equilibrio
de Nash?
Para dos precios p y p

, denamos los vectores


u(p, 0) = ( u
V
(p, 0), u
C
(p, 0))
y
u(p, t) = ( u
V
(p, t), u
C
(p, t)),
con u
C
(p, t) =
t
C
u
C
(p) y u
V
(p, t) =
t
V
u
V
(p).
El principio de equilibrio dira que el jugador que debe hacer una oferta
debe buscarla de tal manera que deje al otro indiferente entre aceptar o es-
perar al pr oximo periodo para hacer una contraoferta que supone ser a acep-
tada. Si en el periodo t, el vendedor hace la oferta p y C la acepta, entonces
C obtendr a u
C
(p, t) =
t
C
u
C
(p). Si C la rechaza y propone p

, lo mejor que
le puede pasar es que V la acepte, en cuyo caso C ganara
u
C
(p

, t + 1) =
t+1
C
u
C
(p

).
La condici on de equilibrio para C es

t
C
u
C
(p) =
t+1
C
u
C
(p

) para cada t.
O lo que es lo mismo,
u
C
(p) =
C
u
C
(p

).
An alogamente, la condici on de equilibrio para que V decida elegir el
precio p

en el periodo t, en lugar de lograr que le acepten p hasta el periodo


t + 1 es
t+1
V
u
V
(p) =
t
V
u
V
(p

), es decir,
u
V
(p

) =
V
u
V
(p).
Tomemos ahora en cuenta la longitud de tiempo que hay entre dos perio-
dos consecutivos y denotemosla como . Hasta aqu hemos actuado como si
fuera 1; cambiemos esto. Entonces, en cada periodo, el descuento ser a de

i
para i = V , C. Estudiar lo que ocurre cuando tiende a cero es preocu-
parse por lo que ocurre cuando vendedor y comprador est an interesados en
negociar lo m as frecuentemente posible. Si suponemos que

i
es de la forma
e

C
, las dos condiciones de equilibrio son:
u
C
(p) = e

C
u
C
(p

) (3.6.2 a)
144
Modelos de juegos no cooperativos 145
u
V
(p

) = e

V
V
u
V
(p) (3.6.2 b)
Rubinstein (ver el libro de M. J. Osborne y A. Rubinstein [42], Bargain-
ing and Markets) demostr o que en el lmite cuando el lapso de tiempo que
transcurre entre dos negociaciones tiende a cero, la transacci on se hace en
el primer periodo y el precio es tal que el excedente se reparte de acuerdo al
vector de pago siguiente:
(
1
C
1
C

V
(p
C
p
V
) ,
_
1
1
C
1
C

V
_
(p
C
p
V
)).
3.7. Ejercicios
Ejercicio 3.1. El Juego de los CERILLOS (ejercicios 2.1, 2.2 y 2.3) Con-
sidere el juego de los cerillos con n igual a cinco. Construya el modelo exten-
sivo y la soluci on de Zermelo. Podra decir, basado en ese tipo de an alisis,
para que valores de n gana el jugador que empieza?
Ejercicio 3.2. Analice el JUEGO DEL NIM (ejercicio 2.4), con el algorit-
mo de inducci on hacia atr as (algoritmo de Zermelo) para ver quien gana.
Que puede decir para n umeros cualesquiera?
Ejercicio 3.3. Con un an alisis de inducci on hacia atr as (algoritmo de Zer-
melo) analice el juego DE VOTACIONES Y DE VETOS (ejercicio 2.5).
Considere el juego con un equipo de dos estudiantes y tres candidatos. De-
termine una terna de estrategias que sea soluci on desde dicho an alisis y
descubra quien ingres o al equipo. Construya los terminos sucientes de la
forma normal para hacer ver que la soluci on encontrada es un equilibrio de
Nash (ep) del juego. Podra proponer una terna de estrategias que fuera
tambien equilibrio de Nash, pero no soluci on de Zermelo? Justique su res-
puesta.
Ejercicio 3.4. Escoja un conicto econ omico, poltico, social o de cualquier
naturaleza, pero que haya alcanzado cierta fama y del que se pueda construir
un modelo extensivo nito de informaci on perfecta, con o sin azar. Construya
la soluci on que aporta el an alisis hacia atr as. Cu antas estrategias tiene cada
jugador? Si el juego no es muy grande construya su forma normal, encuentre
todos los equilibrios de Nash del conicto e identique el que corresponde
a una soluci on de Zermelo. Si resulta demasiado grande, solo construya el
rengl on y la columna correspondiente a dicha soluci on de Zermelo. Puede
145
146 Estrategias y Forma Normal
proponer un equilibrio que no sea soluci on de Zermelo? (Quiz a le sirva revisar
el teorema 3.5.3).
Ejercicio 3.5. En el juego del duelo del ejemplo 2.2.4, para 7 pasos, asigne
las probabilidades de matar al adversario, para cada distancia medida en
pasos y calcule el n umero de estrategias de cada jugador, los equilibrios de
Nash (ep) perfectos en subjuegos y uno que no lo sea.
Ejercicio 3.6. Para EL JUEGO DE GALE (ejercicio 2.8), responda las
mismas preguntas que en el problema anterior y construya la forma normal
del juego.
Ejercicio 3.7. EL JUEGO DEL CONTENTO En la gura 2.2.9, tenemos
el modelo extensivo de dicho juego para el caso de que n = 2 y de que la
baraja conste de cuatro cartas numeradas del 1 al 4. Examine intuitivamente
las cosas para proponer un equilibrio. Para vericar que efectivamente lo es,
utilice el algoritmo de inducci on hacia atr as para el caso de informaci on no
perfecta.
0
0
1
5
5
2
1
4
1
2
3
4
b a
II II
II II
0 0
1/2 1/2 2/5
I
7
1 5
3 1
0 6
8
4
6 2
4 5
0
10
8
9
3
5 10
6
3
0 5
4 1
2
1
2
3
4
5
1
2
3
2
3
4
5
3/5
7
2
7
Figura 3.e.1:
Ejercicio 3.8. Considere el juego D

ONDE QUED

O LA CABRITA? (ejer-
cicio 2.11). Cu antas estrategias tiene cada jugador? Encuentre un equilibrio
de Nash (ep). Es unico? Es perfecto en subjuegos? Cu antos equilibrios
perfectos en subjuegos existen?
146
Modelos de juegos no cooperativos 147
Ejercicio 3.9. Lleve a cabo el algoritmo de Zermelo generalizado para el
juego del sindicato (ejercicio 2.12). Termina con exito o con fracaso? Si
termina con exito, cu al es el equilibrio perfecto en subjuegos construido?
Ejercicio 3.10. Encuentre un equilibrio de Nash (ep) perfecto en subjue-
gos, usando el algoritmo de Zermelo generalizado del juego de la gura 3.e.1.
Puede encontrar un equilibrio que no sea perfecto en subjuegos, sin necesi-
dad de calcular la forma normal del juego completo? Quiz a le sirva revisar
el teorema 3.5.3.
Ejercicio 3.11. En el juego de la empresa contaminadora del ejercicio 2.9,
cu antas estrategias tiene cada jugador? Lleve a cabo el algoritmo de Zerme-
lo generalizado. Termina con exito o con fracaso el algoritmo? Si termina
con exito cu al es el equilibrio perfecto en subjuegos construido?
Ejercicio 3.12. Con el algoritmo de Zermelo encuentre un equilibrio de
Nash perfecto en subjuegos para el juego de las chas de domin o en un
tablero 2 3 (ejercicio 2.13). Quien gana el juego?
Ejercicio 3.13. Realice el an alisis de Zermelo del juego de negociaci on sin
azar y con impaciencia, con horizonte nito para n par e impar Inuye la
paridad de n en el resultado que se obtiene?
Ejercicio 3.14. JUEGOS DE NEGOCIACI

ON CON AZAR Consideremos


la misma negociaci on del ejercicio 3.13, pero ahora, despues del n de cada
periodo hay un mecanismo de azar que determina que con probabilidad
contin ua el siguiente periodo y con probabilidad 1 termina el juego sin
acuerdo; los pagos son como se describen en el texto de la secci on 3.6.
En los juegos de dos y de tres periodos, cu al sera el resultado, en cada
uno de ellos? Trate de generalizar la f ormula para n periodos. Que pasara
en el lmite cuando n tiende a innito. Observe que si consideramos que la
negociaci on tiene innitos periodos (horizonte innito), no es posible hacer
el an alisis hacia atr as y hay que trabajar con el lmite.
Ejercicio 3.15. DEMANDAS TRIVIALES 2 Considere que la compa na
tiene un proceso productivo altamente contaminante y continuamente en-
frenta problemas legales, con diversos afectados. Por ello, al principio del
juego, tiene que decidir, si contrata a un abogado que pueda encargarse de
los casos, o se ahorra el gasto, todo lo dem as es igual. Los pagos que haga
por adelantado no le ser an devueltos vaya o no vaya a juicio. Haga el nuevo
an alisis.
Ahora, piense que no s olo la empresa, sino tambien el campesino con-
sidera, despues de demandar, si sera conveniente contratar a un abogado,
147
148 Estrategias y Forma Normal
independientemente de no estar seguro de que vaya a ir a juicio. Haga el
nuevo an alisis.
Ejercicio 3.16. DEMANDAS TRIVIALES 3 (informaci on no perfecta).
Considere el ejemplo 2.2.13 (gura 2.2.12) y complete con pagos plausibles.
Cu antas estrategias tiene cada jugador? Lleve a cabo un an alisis hacia atr as
generalizado.
Ejercicio 3.17. El AUTOMOVILISTA Y LA ASEGURADORA Una per-
sona (A) tiene un vehculo con el que trabaja y est a considerando comprar
un seguro contra accidentes. La compa na de seguros (CS) piensa en dos
precios posibles por un a no de seguro, uno de 500 y otro de 200. En los dos
casos, el posible asegurado tiene que decidir, si acepta o rechaza la oferta.
Si rechaza la oferta tendr a que ser cuidadoso con su vehculo, para tratar
de evitar accidentes, en cambio, si acepta comprar el seguro, tendr a que
decidir, entre ser cuidadoso o basarse en que est a cubierto por el seguro y
arriesgarse m as, pudiendo con ello obtener m as ingresos en su trabajo. La
probabilidad de tener accidentes depende de s es cuidadoso o no lo es. La
gura 3.e.2 representa el modelo extensivo del conicto. Haga un an alisis
hacia atr as para saber como actuar an los dos jugadores en cada uno de los
vertices en que deben decidir y cu al es el resultado del conicto.
A
200
A
n.acc acc acc
CS
.1 .9
A A
(0,1000)
n.acc
(0,0)
(0,1000)
(0,0)
.1 .9
0 0
cuidadoso descuidado descuidado cuidadoso
0 0 0 0
.1 .1 .9 .9
(500,500)
(500,500)
(500,300)
(500,300)
(700,200)
(200,200)
(200,0)
500
(700,0)
rechaza acepta rechaza acepta
.9 .1 .9 .1
Figura 3.e.2:
148
Modelos de juegos no cooperativos 149
Ejercicio 3.18 (Duopolio de Cournot 2). Suponga que una de las em-
presas (E
1
) utiliza una tecnologa conocida. Por esto, E
2
est a informada de
que el costo unitario de E
1
es c
1
. En cambio, E
2
est a utilizando una nueva
tecnologa y E
1
no sabe cu al es el costo unitario de E
2
. Lo unico que sabe la
segunda empresa es que el 70 por ciento de las empresas que han cambiado
de tecnologa utiliza un procedimiento alem an que tiene un costo unitario
de c (c
1
> c) y las restantes utilizan un procedimiento japones que tiene
un costo de c (c
1
< c). La funci on de pago de los jugadores es como en el
ejemplo 1.6.3 del captulo 1. C omo es el modelo extensivo? C omo es su
forma normal si la empresa con tecnologa conocida tiene tres posibles can-
tidades a producir y la otra, en cualquiera de sus variantes, dos? Bas andose
en el an alisis del ejemplo 1.6.3. Proponga un perl que sea un equilibrio de
Nash para la versi on del duopolio de Cournot, donde las empresas eligen
cantidades en un intervalo [0, a]. Compruebe que el perl propuesto es equi-
librio y compare los equilibrios con el equilibrio de Cournot que surgi o en el
captulo 1.
Ejercicio 3.19. Encuentre, donde se pueda, un equilibrio de Nash perfecto
en subjuegos de los juegos propuestos por el libro en el captulo 2.
Ejercicio 3.20. Falso o verdadero? Justique su respuesta, con una de-
mostraci on o un contraejemplo, seg un sea el caso.
a) Un juego de informaci on perfecta nito siempre tiene al menos un
equilibrio de Nash en estrategias puras.
b) En un juego extensivo nito, cada uno de los jugadores escoge una de
sus estrategias, entonces queda determinada una partida unica.
Ejercicio 3.21. Construya un ejemplo de un juego extensivo que no sea de
informaci on perfecta tal que el algoritmo de Zermelo tenga exito y uno que
no tenga exito y tales que no hayan aparecido en el texto.
149
150 Sobre gustos y conocimiento
150
Captulo 4
Sobre gustos y conocimiento
4.1. Justicaci on del Captulo
En este captulo, se esbozan, en las secciones 4.2 y 4.3, temas de la fun-
damentaci on axiom atica de la teora de juegos, especcamente el estudio
de las preferencias de los jugadores y del conocimiento que tienen, tanto
privado, como com un. Estos temas precisan argumentos que en este libro
est an implcitos. La problem atica de las relaciones de preferencias de los ju-
gadores sobre los posibles resultados en un juego, incluyendo la idea de que
los resultados pueden ser loteras se trata ampliamente en muchos textos.
En cambio, la problem atica de c omo precisar el conocimiento que tienen los
jugadores sobre diversas situaciones, el conocimiento com un a todos ellos y
la problem atica sobre las creencias que los jugadores pueden obtener de su
conocimiento y de la falta de este, son temas poco tratados. Las creencias
se formulan en terminos de conocimiento o de falta de el y tienen aspectos
a un en desarrollo y, adem as, abren la problem atica misma de la teora de
las preferencias que tienen, ahora, que denirse sobre loteras subjetivas.
El presente libro, como es f acil apreciar desde su inicio, no tiene la inten-
ci on de desarrollar los temas muy formalmente. Nuestra intenci on al incluir
ambos temas es simplemente dar algunas ideas que completen la visi on so-
bre los modelos que se utilizan en los juegos no cooperativos, por lo que se
introducen dichos temas, en forma muy breve.
Por otro lado, hemos desarrollado como secciones 4.4 y 4.5 un tipo de
problem atica con caractersticas muy diferentes, la vinculada a los llamados
juegos de informaci on incompleta que est an lejos de estar formulados en for-
ma precisa. Problemas de falta de informaci on de los jugadores aparecieron
en el concepto de informaci on no perfecta del captulo 2. Este concepto es
151
152 Sobre gustos y conocimiento
una propiedad de algunos juegos extensivos con la que se pueden modelar
situaciones como son, por ejemplo, las que se presentan en el p oker cuando
un jugador tiene informaci on sobre las cartas que tiene en la mano, pero
no sobre las de los dem as jugadores. La tem atica que abordan los llamados
juegos de informaci on incompleta, tanto cooperativos como no cooperativos,
es radicalmente distinta. En ellos, ocurre que algunos de los participantes
no conocen plenamente las reglas del conicto en el cual est an envueltos.
Por ejemplo, alg un jugador puede no conocer cu ales son los objetivos de
otro. Se supone, en cambio, que todos los participantes en un juego de p oker
conocen las reglas del juego y cuando alguno se saca un As de la manga
est a introduciendo un conicto distinto, este s de informaci on incompleta.
La investigaci on de esta problem atica es relativamente reciente y los diversos
textos existentes no concuerdan en cu al es la denici on m as apropiada de
un juego de informaci on incompleta. M as a un, ni siquiera concuerdan en si
es necesario tener o no una denici on, ya que algunos de los autores consi-
deran que se trata de abordar problemas para los cuales se pueden adaptar
los conceptos ya denidos en los primeros captulos. A pesar de lo anterior,
el desarrollo de la tem atica es sumamente interesante y ha sido abordada
parcialmente, pero en forma muy amplia, en el estudio de diversos temas
especcos, por ejemplo, en la teora de subastas, en el tratamiento de di-
versos instrumentos nancieros, en los llamados juegos de se nalizaci on y en
los de selecci on adversa. Sin embargo, abordarla en una forma m as o menos
adecuada requerira que el libro tuviera por lo menos dos largos captulos
dedicada a ella. Por lo que simplemente planteamos algunos ejemplos, para
dar una idea de como se abordan estos temas.
Por que introducir en este captulo la problem atica de los juegos de
informaci on incompleta? Desde nuestro punto de vista dicha problem atica
constituye una ilustraci on muy interesante de como los temas del conocimien-
to, las creencias y las preferencias, tanto sobre loteras objetivas como sobre
loteras subjetivas, puede cambiar el enfoque del an alisis que se realiza sobre
los juegos y es particularmente util para los llamados juegos de informaci on
incompleta.
4.2. Sobre gustos y utilidad
En los tres captulos anteriores, hemos aceptado que los pagos para los
jugadores se dan en n umeros reales, con las propiedades usuales que estos
tienen. Sin embargo, en los ejemplos que se han manejado o que se con-
sideran de interes, los resultados que obtiene un jugador, despues de que
152
Modelos de juegos no cooperativos 153
se han determinado los diversos perles de estrategias, pueden ser, como
coment abamos en la introducci on, de una naturaleza muy variada, y no
sera extra no que fuera muy difcil, para los jugadores, asignarle un n umero
real a cada evento.
Repetimos, para ilustrar, en forma sencilla, el ejemplo de Morton Davis
[13] que aparece en el ejercicio 1.1a del primer captulo de este libro.
En agosto de 1944, justamente despues de la invasi on de Europa, los
aliados rompieron su cabeza de playa en Cherburgo y amenazaban al Noveno
Ejercito alem an. El comandante alem an tena estas posibles elecciones: ataque
o retirada. El comandante aliado tena estas alternativas: reforzar la brecha,
lanzar sus reservas hacia el este tan pronto como fuese posible, defenderse
esperando veinticuatro horas para despues decidir reforzar o empujar ha-
cia el este. Supongamos que para cada pareja de estrategias se tienen los
resultados cualitativos descritos en la tabla siguiente:
ataque retirada
reforzar
reservas
al este
esperar
_
_
_
_
_
_
_
_
_
_
_
_
_
_
probable rechazo
del ataque
d ebil presi on
alemanes pueden
cerrar brecha
disposici on ideal
contra alemanes
brecha y rodeo de
los alemanes
atraso en llegada
y poca presi on
contra alemanes
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Que pareja de n umeros reales conviene asignarle a cada uno de los
resultados, para que reejen la situaci on de cada uno de los ejercitos que
se enfrentan? Nosotros hemos procedido, hasta aqu, asignando n umeros
que nos suenan plausibles y hemos dejado implcitas las reglas con que se
procede; estas no son arbitrarias. Para hablar en forma precisa, en muchos
contextos, en especial en el de los juegos cooperativos, no es aceptable seguir
en este camino.
C omo procede la teora de juegos frente al problema de que los ju-
gadores no se encuentran ante pagos que sean n umeros reales? Por un lado,
se toman como base las concepciones de la Teora de la Utilidad usual en
153
154 Sobre gustos y conocimiento
la Teora Econ omica, en donde se considera que en el espacio de resulta-
dos posibles cada jugador tiene denida una relaci on de preferencia que le
permite comparar siempre dos resultados posibles.
Es decir, no se supone que los aliados sean capaces de decir cuantas
unidades de satisfacci on les produce que, cuando ellos refuerzan la brecha,
sus fuerzas probablemente rechacen el ataque de los alemanes, si estos les
lanzan uno, ni cu antas otras reciben de que la brecha se mantenga, aunque
ejerzan una debil presi on sobre el enemigo, si este decide retirarse, lo que
s se supone es que los aliados preeren uno de los dos acontecimientos al
otro, o que los dos les son indiferentes. An alogamente se procede respecto a
los alemanes.
Si, por ejemplo, el jugador j preere el acontecimiento D al C o le son
indiferentes, esto se escribe como C _
j
D, si la preferencia por D es estricta,
es decir si se da la relaci on C _
j
D, pero no la recproca, D _
j
C, escribimos
C
j
D y, por ultimo, si C y D le son indiferentes, es decir s la relaci on se
establece en las dos direcciones, C _
j
D y D _
j
C, escribimos C
j
D. Se
supone siempre que dado un resultado C, C _
j
C y, por lo tanto, C
j
C
Si una relaci on de preferencia le permite a j comparar siempre entre
dos acontecimientos cualesquiera, se dice que esta relaci on es total. A las
relaciones de preferencia de los jugadores se les suele pedir que adem as de
totales y reexivas, sean por lo menos transitivas, es decir, que si C _
j
D y
D _
j
F, entonces se cumpla que C _
j
F. Cuando todos los jugadores tienen
relaciones de preferencia con esas propiedades, se dice que los jugadores son
racionales.
Aunque hemos dicho que los jugadores, o los consumidores, no tienen
en su cabeza un medidor de satisfacci on, todo el que ha abierto un libro en
el que se hable de los tales consumidores (y de los jugadores) ha visto por
todos lados las llamadas funciones de utilidad, con las que los susodichos
comparan las diversas canastas de bienes (o situaciones resultantes). Lo que
realmente sucede es que las funciones de utilidad representan a las relaciones
de preferencia; son un recurso matem atico para hacerlas m as manejables. Si
llamamos W al conjunto de resultados posibles, diremos que la funci on u
j
:
W R es una funci on de utilidad que representa a _
j
si, para cada pareja
de resultados A y B en W, A _
j
B u(A) u(B). Dada una relaci on de
preferencia, no siempre es posible encontrar una funci on de utilidad que la
represente. Un ejemplo muy conocido de una relaci on de preferencia para la
que no existe una funci on de utilidad que la represente es una que siga un
orden como el del diccionario, es decir, lexicogr aca.
Gerard Debreu es un economista-matem atico frances famoso por su for-
mulaci on axiom atica de la teora del equilibrio econ omico, lo que le vali o el
154
Modelos de juegos no cooperativos 155
premio N obel en 1983. Como parte de dicha formulaci on, Debreu demostr o que
una condici on suciente para que exista una funci on que represente a una
relaci on de preferencia es que, adem as, de ser total, reexiva y transitiva,
dicha relaci on, tenga una propiedad de continuidad. Dicho autor, despues
de introducir una topologa en W, exige que para cualquier elemento C de
W, se tenga que los conjuntos
_
A W

A _
j
C
_
y
_
A W

C _
j
A
_
sean cerrados.
La propiedad de continuidad de las relaciones de preferencia se justica
alegando que, para la mayora de la gente, sus preferencias no dan brincos.
Cuando la relaci on de preferencia cumple las propiedades mencionadas,
no s olo aseguramos la existencia de una funci on de utilidad, sino la con-
tinuidad de esta, lo que resulta muy conveniente para todos los problemas
de optimizaci on en que se ven envueltas estas funciones.
Sin embargo, para la Teora de Juegos no basta este tipo de concepto
de utilidad, pues es muy com un que como resultado de la acci on de los
jugadores, en los juegos extensivos o en el contexto de las estrategias mixtas
o en otros muchos, se obtenga una distribuci on de probabilidad entre los
resultados posibles, es decir una lotera. Hasta aqu hemos supuesto que
una esperanza matem atica resuelve el problema, pero esto no tiene porque
ser plausible.
Una situaci on muy simple que se puede modelar con un juego extensivo es
la siguiente. Un jugador tiene que decidir entre participar en una lotera que
le permite ganar un mill on de pesos, con probabilidad un medio, y no ganar
nada con probabilidad, tambien, de un medio, o que le entreguen, en forma
segura, medio mill on de pesos. Desde el punto de vista que hemos adoptado
hasta este captulo, a los jugadores les seran indiferentes las dos opciones,
pero no cabe duda que depende de la psicologa de la persona involucrada
(y de los recursos con que cuenta) la opci on que preere, de present arsele en
una sola ocasi on el dilema anterior. Importa mucho la actitud de la persona
ante ese tipo de riesgo, para saber cu al sera su decisi on.
Es necesario, entonces, extender el espacio de eventos al de las loteras
entre dichos eventos y tener una teora de la utilidad que permita a los
jugadores escoger entre loteras. Von Neumann y Morgenstern [55] desarro-
llaron dicha teora.
155
156 Sobre gustos y conocimiento
Dados A y B, dos resultados posibles en un juego, y un n umero real
r [0, 1], llamaremos una lotera entre A y B, con probabilidades
de ocurrencia r y 1 r, respectivamente, al evento consistente en que A
ocurra con probabilidad r y B con probabilidad 1 r.
Denotamos a la lotera entre A y B, con probabilidades de ocurrencia r
y 1 r, respectivamente, como rA+ (1 r) B.
En forma inductiva, se puede denir la lotera entre cualquier n umero
nito de eventos. Como las loteras son eventos, tambien tiene sentido hablar
de lotera de loteras.
Debido a las propiedades de la probabilidad, tenemos las propiedades
siguientes:
rA+ (1 r) B = (1 r) B +rA.
rA+ (1 r) (sB + (1 s) C) =
rA+ (1 r) sB + (1 r) (1 s) C.
rA+ (1 r) A = A.
Que propiedades deben exigirse a una relaci on de preferencia que est a de-
nida en un espacio de loteras? Desde luego, la totalidad, la reexividad y
la transitividad, pero tambien que
Axioma 4.2.1. Si A
j
B, entonces, para cualquier r (0, 1] y cualquier
evento C, se cumple que rA+ (1 r) C
j
rB + (1 r) C.
Axioma 4.2.2. Si A
j
B, para cualquier r (0, 1] y cualquier evento C,
se cumple que
rA+ (1 r) C
j
rB + (1 r) C.
Para construir una funci on de utilidad que represente a una relaci on de
preferencia, es necesaria una continuidad que se justique en forma seme-
jante a la continuidad de las preferencias usuales. Es decir, partiendo de que
los gustos se comportan sin cambios bruscos o saltos.
Axioma 4.2.3 (continuidad). Sean A, B y C eventos tales que
A
j
C
j
B,
entonces existe r (0, 1) tal que
rA+ (1 r) B
j
C.
Se demuestra que esta r es unica y es la base para construir una funci on
de utilidad que toma como marco de referencia a dos eventos dados A y B
tales que uno de ellos es estrictamente preferible respecto del otro.
156
Modelos de juegos no cooperativos 157
Teorema 4.2.1. Si A
j
C
j
B y rA+(1 r) B
j
C, etonces r est a en
(0, 1) y es unica.
Demostraci on. Es claro que r no puede ser 0, pues entonces B
j
C.
An alogamente, si r fuera 1, entonces A
j
C. Por lo tanto, r (0, 1).
Supongamos que sA+ (1 s) B
j
C, con s (0, 1). Es decir,
rA+ (1 r) B
j
sA+ (1 s) B.
Supongamos que s < r. Por el axioma 4.2.1, para
rs
1s
y B, se cumple que
r s
1 s
A+
1 r
1 s
B
j
r s
1 s
B +
1 r
1 s
B
j
B.
Es decir,
rs
1s
A +
1r
1s
B
j
B. Adem as,
rA+ (1 r) B = rA+sAsA+ (1 r) B =
sA+ ((r s) A + (1 r) B) =
sA+
1s
1s
((r s) A + (1 r) B) =
sA+ (1 s)
__
rs
1s
_
A+
_
1r
1s
__
B.
Como
rs
1s
A +
1r
1s
B
j
B, podemos considerar el real 1 s y el evento
A y, por el teorema 4.2.1, tenemos
(1 s)
__
rs
1s
_
A+
_
1r
1s
_
B
_
+sA
j
(1 s) B +sA.
Por lo tanto, rA + (1 r) B
j
(1 s) B + sA. Pero esto es absurdo,
pues ambos son indiferentes a C.
Es decir, r es unico.
Los jugadores que tienen relaciones de preferencia con las propiedades
4.2.1, 4.2.2 y 4.2.3 y que act uan de acuerdo a ellas se llaman racionales.
Teorema 4.2.2 (Existencia de una funci on de utilidad de von Neu-
mann y Morgenstern). Existe una funci on real u del espacio de eventos
tal que para todo par de eventos C y D y q en [0, 1] se cumplen:
1) u(C) u(D) si, y s olo si, C _
j
D.
2) u(qC + (1 q) D) = qu(C) + (1 q) u(D).
Demostraci on. Supongamos que para todo par de eventos A y B, A
j
B.
En este caso denimos a u como una funci on constante, por ejemplo u(A) =
0, para todo evento A, y vemos que u cumple trivialmente con 1 y 2.
Supongamos ahora que existen A y B tales que A
j
B, denimos
u(A) = 0 y u(B) = 1.
Para todo evento C, tal que A
j
C, denimos u(C) = 0.
157
158 Sobre gustos y conocimiento
Para todo evento C, tal que B
j
C, denimos u(C) = 1.
En general, para dos eventos que sean indiferentes, la funci on u tomar a el
mismo valor en ellos.
Para todo evento C, tal que A
j
C
j
B, existe r (0, 1) unica tal que
rA+ (1 r) B
j
C y denimos u(C) = 1 r.
Consideremos un evento C, tal que C
j
A. Tenemos que C
j
A
j
B,
por lo que existe s (0, 1) unica tal que sC + (1 s) B
j
A .
Si queremos que u cumpla la propiedad 2,
u(sC + (1 s) B) = su(C) + (1 s) u(B) = u(A) .
O sea que su(C) + (1 s) = 0. Por lo que u(C) =
s1
s
< 0.
Consideremos un evento C, tal que B
j
C. Tenemos que A
j
B
j
C,
por lo que existe t (0, 1) unica tal que tA + (1 t) C
j
B . Por la
propiedad 2 que debe cumplir u, tenemos que
u(tA + (1 t) C) = tu(A) + (1 t) u(C) = u(B) .
O sea que (1 t) u(C) = 1. Por lo que u(C) =
1
1t
> 1.
u est a denida para todo evento y claramente cumple la propiedad 2.
Consideremos dos eventos C y D, si alguno de ellos es indiferente al
evento A, por ejemplo C, claramente se cumple para ellos que u(C) u(D)
si, y s olo si, u(D) 0, es decir si, y s olo si A _
j
D. O lo que es lo mismo,
si y s olo si C _
j
D.
En forma an aloga, se puede proceder si uno de ellos es indiferente a B.
A y B dividen al espacio de eventos que no son indiferentes a ninguno
de ellos en tres zonas. La zona de los eventos que cumplen que A es
preferible a ellos, a estos u les asigna un n umero negativo. La zona de los
que son preferibles a B, a estos u les asigna un n umero mayor que 1.
Pensemos, nalmente, en los eventos que est an entre A y B. Es decir,
son preferibles al evento A, pero B es preferible a ellos, a cada uno de estos
eventos u les asigna un n umero en el intervalo (0, 1).
Sean C y D, ninguno indiferente al evento A o al B y tales que est an en
distintas zonas. Claramente, para ellos, se cumple la propiedad
C
j
D u(C) < u(D) .
Sean C y D, ninguno indiferente al A o al B y tales que est an en la
misma zona. Supongamos que A
j
C
j
B y A
j
D
j
B y que, adem as,
C
j
D. Existe r y r

(0, 1) tales que rA+(1 r) B


j
C, u(C) = (1 r)
y r

A + (1 r

) B
j
D, u(D) = (1 r

). Por otro lado, A


j
C
j
D y
existe r

(0, 1) tal que r

A+ (1 r

) D
j
C.
158
Modelos de juegos no cooperativos 159
Por lo que, tenemos,
(1 r

) (1 r

) = (1 r),
pero 0 < 1 r

< 1,
(1 r

) (1 r

) < (1 r

).
Es decir, (1 r) < (1 r

) o lo que es lo mismo u(C) < u(D).


Si, recprocamente, u(C) < u(D) y A
j
C
j
B y A
j
D
j
B,
entonces (1 r) < (1 r

) y procediendo como en el teorema anterior, se


tiene que C
j
D.
El an alisis para puntos en otras zonas sera an alogo.
La funci on de utilidad que representa a una relaci on de preferencia no es
unica, pero dos funciones que representan a la misma relaci on de preferencia,
se pueden obtener una de otra mediante una transformaci on afn. Esto es
natural, pues bast o que eligieramos dos eventos como origen y unidad, para
que toda la funci on quedara determinada. Esta selecci on es an aloga a elegir
una escala.
Teniendo el instrumento de las funciones de utilidad de von Neumann-
Morgenstern, al buscar, los jugadores racionales resultados que no sean domi-
nados por otros resultados, seg un su relaci on de preferencia, act uan como
si estuvieran maximizando una funci on de utilidad. Cualquier funci on
de utilidad que represente a su relaci on de preferencia juega el mismo papel,
pues todas ellas llevan a elegir el mismo resultado.
4.3. Sobre Conocimiento
4.3.1. Conocimiento Privado.
La teora de los juegos no cooperativos, aunque busca liberarse de su-
puestos de racionalidad tanto sobre la utilidad como sobre el conocimiento,
est a llena de ellos. La discusi on sobre que un equilibrio de Nash se estable-
cera, por ejemplo, supone que todos saben que todos escoger an sus estrate-
gias de equilibrio y que todos saben que todos saben esto y, as sucesiva-
mente.
Exponemos las ideas de formalizaci on de conocimiento privado y com un
al estilo del libro de Teora de Juegos de Ken Binmore [4] Para describir el
conocimiento privado de un jugador j, y posteriormente el com un a todos
los jugadores, partimos de el conjunto de todos los resultados posibles de
un juego y suponemos que es nito. Diremos que cualquier subconjunto de
es un suceso. Se dice que un suceso E ha ocurrido, cuando el resultado
159
160 Sobre gustos y conocimiento
que realmente ha ocurrido est a en E. Entonces, introducimos un operador
K
j
de la manera siguiente.
El Operador de Conocimiento.
K
j
asocia a cada subconjunto de un subconjunto tambien de que
cumple los siguientes axiomas:
Axioma 4.3.1. 4.3.1a) K
j
() = .
Axioma 4.3.2. 4.3.1b) K
j
(E F) = K
j
(E) K
j
(F).
Axioma 4.3.3. K
j
(E) E.
Axioma 4.3.4. K
j
(E) K
j
_
K
j
(E)
_
.
Axioma 4.3.5. K
j
( E) K
j
_
K
j
( E)
_
.
A partir de su operador de conocimiento, se puede hablar de las creencias
de j, introduciendo el operador P
j
que se dene como P
j
E = K
j
( E).
A los dos operadores se les pide que cumplan
Axioma 4.3.6. P
j
E K
j
P
j
E.
Estas hip otesis para el conocimiento de los jugadores s olo tienen realidad
cuando es peque no (hip otesis del mundo peque no de Savage) que es el
mundo en el que se desenvuelve un juego.
Si K
j
es el operador de conocimiento del jugador j, K
j
(E) se interpreta
como el subconjunto de en el que j sabe que E ha ocurrido.
K
j
(E) se interpreta como el subconjunto de en el que j
piensa que E es posible. K
j
( E) es el conjunto de resultados donde j
sabe que E no ocurri o, entonces el complemento de dicho conjunto son los
resultados en que j no descarta que E haya ocurrido, es decir j piensa o cree
que es posible que E haya ocurrido. Se usa el operador de creencias P
j
para
simplicar la notaci on.
Utilizando los axiomas 4.3.14.3.6 y las propiedades del operador com-
plemento tenemos,
Proposici on 4.3.1. a) P
j
= .
b) P
j
(E F) =P
j
EP
j
F.
c) P
j
E E.
d) P
j
E P
j2
E.
e) P
j
K
j
E K
j
E
160
Modelos de juegos no cooperativos 161
Demostraci on. P
j
= K
j
() = K
j
() = . Entonces, se cumple
a). Es decir, P
j
= .
P
j
(E F) = K
j
(E F) =
K
j
(( E) (F)) =

_
K
j
( E) K
j
( F)
_
=
_
K
j
( E)
_

_
K
j
( F)
_
= P
j
EP
j
F.
Por lo que se cumple, P
j
(E F) =P
j
EP
j
F, que es la armaci on b).
K
j
(E) E
K
j
( E) ( E) = E.
Es decir, tenemos que P
j
E E o sea se cumple c).
Por otro lado, K
j
( E) K
j
_
K
j
(E)
_
, entonces,
P
j
E = K
j
(E) K
j
_
K
j
( E)
_
=
K
j
_

_
K
j
( E)
__
=
K
j
_
P
j
E
_
= P
j2
E.
Es decir, P
j
E P
j2
E y se cumple d).
La demostraci on de e) se deja como ejercicio al lector.
Se dice que T es una perogrullada para j si T K
j
T. Como la contenci on
contraria la asegura el axioma 4.3.3, entonces T es una perogrullada para j
si T = K
j
T
Teorema 4.3.2. j sabe que E ha ocurrido si y s olo si ha ocurrido una
perogrullada que implica E.
Demostraci on. Supongamos que existe T tal que T K
j
T y w K
j
T.
T implica E, es decir T E, por lo que K
j
T K
j
E y w K
j
E.
Recprocamente, supongamos que w K
j
E. Por otro lado,
K
j
(E) K
j
_
K
j
(E)
_
y K
j
(E) E.
Entonces, K
j
E es una perogrullada que implica a E.
Teorema 4.3.3. La menor de las perogrulladas para j que contiene a w es
P
j
(w)
Demostraci on. Para todo suceso E, P
j
E es una perogrullada para j, ya que
P
j
E K
j
P
j
E (axioma 4.3.6). En particular, P
j
(w) es una perogrullada
para j. P
j
(w) = K
j
( w). K
j
( w) w, por lo tanto,
w K
j
( w) = P
j
(w). Entonces, P
j
(w) es una perogrullada
para j que contiene a w.
Supongamos que T es una perogrullada para j que contiene a w. w
T K
j
T, w K
j
T, lo que implica que K
j
(w)
K
j
_
K
j
T
_
. Entonces, P
j
(w) P
j
K
j
T, pero por el axioma 4.3.5,
P
j
K
j
T K
j
T que a su vez est a contenido en T.
161
162 Sobre gustos y conocimiento
Es decir P
j
(w) T.
Denotemos como P
j
(w) al conjunto de resultados que j piensa que seran
posibles (o no descartara) si w hubiera ocurrido. Es decir, P
j
asocia a
cada elemento de un subconjunto tambien en ; es lo que se llama una
correspondencia de en s misma. La notaci on que usamos es P
j
: .
El smbolo signica la asociaci on punto conjunto.
Teorema 4.3.4. Para toda w en , P
j
(w) = P
j
(w).
Demostraci on. Si T es una perogrullada que contiene a w, P
j
(w) T,
entonces, P
j
(w) P
j
(w), pues P
j
(w) es una perogrullada que contiene
a w. Pero P
j
(w) es una perogrullada y contiene a w, entonces P
j
(w)
P
j
(w), por ser esta ultima la menor de ellas.
Teorema 4.3.5. Si w es el resultado real, j sabe que E ha ocurrido si y
s olo si P
j
(w) E.
Demostraci on. Si w es el resultado real y P
j
(w) E, j sabe que E ha
ocurrido.
Supongamos que w es el resultado real y j sabe que E ha ocurrido.
Existe una perogrullada T que contiene a w e implica a E, es decir, T E.
Entonces, P
j
(w) T E.
Teorema 4.3.6. P
j
parte a en clases ajenas.
Demostraci on. Si , P
j
() .
Probaremos que si P
j
(w
1
) ,= P
j
(w
2
), entonces,
P
j
(w
1
) P
j
(w
2
) = .
Supongamos que P
j
(w
1
) P
j
(w
2
).
P
j
(w
1
) w
1
P
j
(). Es decir,
P
j
(w
1
) w
1
P
j
().
Pero w
1
P
j
() P
j
(w
1
) P
j
().
Como P
j
(w
1
), P
j
() P
j
(w
1
).
Es decir, P
j
() = P
j
(w
1
) .
An alogamente se prueba que P
j
() = P
j
(w
2
).
Es decir, P
j
(w
1
) = P
j
(w
2
) o lo que es lo mismo P
j
(w
1
) = P
j
(w
2
).
Pero esto es contrario a nuestro supuesto. Entonces, P (w
1
) P (w
2
) = .
Supongamos un operador de conocimiento de j, que determina la corres-
pondencia de creencias P
j
. Cuando j consigue m as informaci on, la partici on
determinada por la nueva correspondencia de creencias es un renamiento
de la partici on determinada por P
j
.
162
Modelos de juegos no cooperativos 163
Para ilustrar las particiones determinadas por diversas P
j
cuando j va
consiguiendo m as informaci on, exponemos un ejemplo de un conicto entre
tres empresas que es una adaptaci on del Juego de la Cara Sucia de Little-
wood [32].
Ejemplo 4.3.1. Supongamos que varias empresas quieren obtener un per-
miso ocial para producir un tipo de bien y que el dictamen ha sido hecho,
pero ellas no han sido informadas sobre esa resoluci on, pues faltan varios
tr amites. Las empresas est an interesadas en obtener la informaci on cuan-
to antes pues, en caso de aceptaci on, cada empresa actuara de inmediato
tratando de ser la primera en lanzar el producto al mercado. Cada empresa
trata de sonsacar al empleado con el que todas tienen contacto.

Este tiene
la orden de no avisar a nadie sobre la resoluci on de su caso. Sin embargo,
basado en que la prohibici on sobre dar otros informes no es explcita, dicho
empleado act ua de acuerdo a su naturaleza comunicativa e informa a cada
empresa del dictamen de las otras. Ninguna de las tres avisa a las dem as
sobre el dato obtenido, pues cada empresa preere tener la menor canti-
dad de competidores posibles y que estos act uen lo m as retrasados posibles.
Aunque, desde luego sabe que el empleado chismoso ha dado el mismo tipo
de informes a cada una de las empresas.
Dada la informaci on que obtiene la empresa j, cada clase determinada
por la correspondencia de creencias tiene dos elementos, correspondientes a
los dos posibles dict amenes de su caso, rechazo (R) o aceptaci on (A).
As si las empresas son 3,
=
_
(A, A, A) , (A, A, R) , (A, R, A) , (A, R, R) ,
(R, A, A) , (R, A, R) , (R, R, A) , (R, R, R)
_
.
Las clases determinadas por P
j
, la correspondencia de creencias de la em-
presa j, son los conjuntos tales que si la empresa sabe que est a en uno de
esos conjuntos, desconoce en cu al elemento preciso. Para j = 1 seran:
(A, A, A) , (R, A, A) , (A, A, R) , (R, A, R) ,
(A, R, A) , (R, R, A) , (A, R, R) , (R, R, R) .
Las particiones de las dem as correspondencias de creencias son an alogas.
La partici on de cada empresa es conocida por todas las dem as.
Supongamos que un periodista de la fuente ha obtenido la ltraci on de
que se ha aceptado por lo menos el proyecto de una de las empresas y lo
publica en su columna. Entonces, el operador de creencias de j cambiar a al
163
164 Sobre gustos y conocimiento
operador de creencias P
j
, cuya partici on en clases de equivalencia es un
renamiento de la partici on anterior, a saber:
(A, A, A) , (R, A, A) , (A, A, R) , (R, A, R) ,
(A, R, A) , (R, R, A) , (A, R, R) , (R, R, R) .
Si una empresa lograra deducir, de esta informaci on, que su proyecto ha
sido aceptado, tomara medidas inmediatas. Si suponemos que las acciones
de cualquier empresa, o la falta de acciones, son observadas por todas las
dem as, habra, en todos estos casos, nueva informaci on para cada empresa.
La nueva partici on sera la m as na posible. Desde luego 1 no seguira con-
fundiendo (A, A, R) con (R, A, R), pues en el segundo caso, vera moverse a
2 y en el otro no, lo an alogo sera cierto con (A, R, A) y (R, R, A), aunque,
en este ultimo caso, vera moverse a 3.
C omo puede distinguir 1 entre (A, A, A) y (R, A, A)?
Si (R, A, A) es el dictamen real, 1 habra sido informada de dos acepta-
ciones, mientras que 2 y 3 sabran que hay una aceptaci on y un rechazo.
Durante un tiempo, observaran un desconcierto en el que nadie se movera.
Esta nueva informaci on, la del desconcierto, hara que alguna de las dos, 2
o 3, se diera cuenta que eso signica que ella misma ha sido aceptada, pues
de otro modo no habra confusi on para la otra. Al moverse cualquiera de
ellas le informara a 1 que ha sido rechazada, ya que si no ninguna podra
haber deducido su aceptaci on. En el caso de que ninguna de las otras dos se
mueva, 1 sabra que estaban en (A, A, A). Es decir, puede distinguir entre
(A, A, A) y (R, A, A).
Con el operador de creencias se pueden abordar los problemas de la
informaci on de j en un juego extensivo, en una forma distinta de c omo se
ha hecho en los captulos 2 y 3.
Consideremos el juego de la gura 4.3.1. El jugador I tiene el conjunto
de estrategias
=
_
(1, 1, 1) , (1, 1, 2) , (1, 2, 1) , (1, 2, 2) ,
(2, 1, 1) , (2, 1, 2) , (2, 2, 1) , (2, 2, 2)
_
.
Cuando I tiene que tomar la primera decisi on, sus creencias parten a
en los subconjuntos
(1, 1, 1) , (1, 2, 1) , (1, 1, 2) , (1, 2, 2) y
(2, 1, 1) , (2, 1, 2) , (2, 2, 1) , (2, 2, 2),
despues de la primera tirada, cuando debe decidir la segunda, la parti-
ci on de es
164
Modelos de juegos no cooperativos 165
II II
1 2
I I I I
1 1 1 1 2 2 2 2
I
Figura 4.3.1:
(1, 1, 1) , (1, 1, 2), (1, 2, 1) , (1, 2, 2),
(2, 1, 1) , (2, 1, 2), (2, 2, 1) , (2, 2, 2).
La segunda partici on es un renamiento de la primera.
Ahora, consideremos el juego de la gura 4.3.2, es de nuevo el conjunto
de estrategias del jugador I, pero ahora es (1, 1) , (1, 2) , (2, 1) , (2, 2). La
primera partici on, cuando I tiene que tomar la primera decisi on es
(1, 1) , (1, 2) y (2, 1) , (2, 2).
La segunda, cuando I tiene que tomar su segunda decisi on, es
(1, 1) , (2, 1) y (1, 2) , (2, 2) que no es un renamiento de la primera.
Por que sucede esto? Observemos que mientras que en el primer juego,
el jugador I ha agregado informaci on despues de tomar su primera decisi on.
En el segundo, que no es un juego de memoria perfecta, el jugador I olvid o su
primera decisi on y no se ha agregado informaci on.
II II
I
1
I I
2 1 2
1 2
Figura 4.3.2:
165
166 Sobre gustos y conocimiento
4.3.2. Conocimiento Com un.
Expongamos brevemente la Formalizaci on de Robert Aumann [2] sobre
el Conocimiento Com un.
Cada persona j de un conjunto N tiene un operador de conocimiento
distinto de las otras personas de N, por eso conviene asignarle el superndice
j a K
j
, el operador de conocimiento de j. Ahora nos interesa expresar que
algunos hechos son conocidos por todos. Una forma que parecera razonable
de hacerlo es que el operador de conocimiento com un se expresara a traves de
la intersecci on. Es decir, para que el suceso E sea conocido por todos, tendra
que ocurrir que el verdadero estado del mundo w este en K
j
E para cada uno
de los miembros del conjunto N, o sea w K
1
E K
2
E ... K
n
E = KE.
Para que K fuera un operador de conocimiento debera cumplir los axio-
mas 4.3.14.3.5. K cumple, claramente, 4.3.1, 4.3.2, 4.3.3 y 4.3.5, pero no
as 4.3.4. Recordemos el ejemplo 4.3.1 en que varias empresas est an esperan-
do se les informe si su proyecto de producci on ha sido aprobado o no. Si el
verdadero estado del mundo w es que todas han sido rechazadas y E es el
suceso de que alguna ha sido rechazada, entonces, despues de que las empre-
sas han hablado con el empleado, todas saben que E ha ocurrido, es decir
w K
1
E K
2
E ... K
n
E (w KE). Pero no tienen porque saber, antes
de alg un tipo de ltraci on, que todas saben que KE ha ocurrido. Es decir,
no tiene porque ser cierto que w K
_
KE
_
. Por lo tanto, no tiene porque
cumplirse que K (E) K
_
K (E)
_
.
Ya que el operador intersecci on no cumple el axioma 4.3.4. Aumann no
dene el operador de conocimiento com un como la intersecci on
jN
K
j
sino
como K

que s cumple 4.3.4. Esto se debe a que es un conjunto nito y,


entonces, a partir de cierta m, K
m+i
= K
m
, por lo tanto, K

_
K

E
_

E y K

E K

_
K

E
_
.
K

formaliza el famoso criterio de que algo es de conocimiento com un


si todo el mundo lo sabe, todo el mundo sabe que todo el mundo lo sabe,
todo el mundo sabe que todo el mundo sabe que todo el mundo lo sabe y,
as sucesivamente.
Tambien se puede introducir el operador de creencias comunes, tomando
en cuenta la siguiente relaci on:
K

( E) K

_
K

( E)
_
.
Si denimos P

E como K

( E), se cumplen los axiomas 4.3.1


4.3.6 y, por lo tanto, las propiedades de a, b, c, d y e de la proposici on 4.3.1,
para los operadores K

y P

. P

es el operador de creencias comunes.


Diremos que T es una perogrullada com un si T K

T.
166
Modelos de juegos no cooperativos 167
Los teoremas que se deducen para los operadores K

y P

, 4.3.74.3.11,
son an alogos a los que se tenan para K
j
y P
j
(4.3.1-6) y se demuestran de
la misma forma.
Teorema 4.3.7. Todos saben que E ha ocurrido si y s olo si ha ocurrido
una perogrullada com un que implica E.
Teorema 4.3.8. El menor de las perogrulladas comunes que contiene a w
es P

(w)
Se denota como P

(w) al conjunto de resultados que nadie descarta si


w hubiera ocurrido.
Teorema 4.3.9. P

(w) = P

(w).
Teorema 4.3.10. Si w es el resultado real, todos saben que E ha ocurrido
si P

(w) E.
Teorema 4.3.11. P

determina una partici on de .


La partici on de determinada por el operador de creencias comunes P

es la partici on m as na de tal que cada una de las particiones determinadas


por los diversos operadores P
j
son renamientos de la primera.
En el ejemplo de las empresas sujetas al tr amite de obtener un permiso,
despues de que cada una ha hablado con el empleado comunicativo, la par-
tici on de creencias comunes es el conjunto . En cambio, cuando alguna de
las empresas ha sido aceptada y eso se vuelve conocimiento com un debido a
la ltraci on que publica un periodista, la partici on determinada por P

es
(R, R, R) ,
_
(A, A, A) , (A, A, R) , (A, R, A) , (A, R, R) ,
(R, A, A) , (R, A, R) , (R, R, A) .
_
Supongamos que despues de la ltraci on del periodista, la empresa 3
empieza a moverse, entonces:
La partici on determinada por P
1
es
(A, A, A) , (R, A, A) , (A, A, R) , (R, A, R) ,
(A, R, A) , (R, R, A) , (A, R, R) , (R, R, R) .
La partici on determinada por P
2
es
(A, A, A) , (A, R, A) , (A, A, R) , (A, R, R) ,
167
168 Sobre gustos y conocimiento
(R, R, A) , (R, A, A) , (R, A, R) , (R, R, R) .
La partici on determinada por P
3
es
(A, A, A) , (A, A, R) , (A, R, A) , (A, R, R) ,
(R, A, A) , (R, A, R) , (R, R, A) , (R, R, R) .
La partici on determinada por P

es
(R, R, R) , (R, R, A) ,
_
(A, A, R) , (A, R, A) , (R, A, R) ,
(A, R, R) , (A, A, A) , (R, A, A)
_
.
4.4. Racionales y Bayesianos
No siempre las personas que participan en un juego se enfrentan a pro-
babilidades objetivas, sino que, en ocasiones, tienen que hacer conjeturas
sobre con que probabilidad se encuentran en cada una de las situaciones de
un conjunto de posibilidades y, entonces, tienen que tomar decisiones sobre
probabilidades subjetivas. Por ejemplo, puede suceder que desconozcan en
que vertice de un conjunto de informaci on se encuentran, pero pueden ha-
cer conjeturas sobre las probabilidades de encontrarse en cada uno. Pueden
incluso desconocer las reglas del conicto en que est an involucrados, no
saber, por ejemplo, los verdaderos objetivos de sus oponentes y s olo conocer
diversas posibilidades de sus personalidades y tener que hacer conjeturas
sobre esto. Enfrentarse, en n, a informaci on que no es conocimiento com un
en diversos niveles. Por lo que, no es infrecuente que las situaciones en que
est an involucrados los individuos no necesariamente envuelvan, en s mismas,
probabilidad objetiva, pero los tomadores de decisiones se ven obligados a
actuar de acuerdo a sus creencias acerca de que tan probable es cada una
de las posibilidades existentes. Cada participante en el conicto engendra
probabilidades subjetivas que dependen de su conocimiento y experiencia
previa. A medida que los actores en el conicto van obteniendo nueva infor-
maci on, estas probabilidades subjetivas cambian. La problem atica que surge
aqu es cercana, en cuanto al enfoque, a la que aparece en las llamadas proba-
bilidad y estadstica bayesianas. Toda esta problem atica fue introducida por
Harsanyi y es tratada ampliamente en el libro de selecci on de equilibrios que
escribi o con Selten [26].
168
Modelos de juegos no cooperativos 169
El supuesto del que se parte consiste en que las personas pueden deter-
minar cu ales seran todas las actitudes que tomaran en todas las situaciones
posibles, hip otesis de mundo peque no, semejante a lo que sucede en un juego.
En estas condiciones, dadas las relaciones de preferencia _
j
de un partici-
pante j dentro del espacio W de resultados posibles se puede construir una
funci on de utilidad
j
de von Neumann y Morgenstern relativa a las creen-
cias de j, o sea relativa a una distribuci on de probabilidad subjetiva denida
en W. Se dice que j es racional-bayesiano si su forma de actuar no se puede
distinguir de la de alguien que buscara maximizar la funci on de utilidad .
Los juegos de informaci on incompleta o bayesianos, a los que s olo nos
acercaremos ligeramente en la secci on siguiente, se analizan en este contexto
te orico, en el que los contendientes no conocen las reglas del conicto, por lo
que realmente no se tratara de un juego, en el sentido que hasta aqu hemos
usado. Sin embargo, el enfoque de jugadores racional-bayesianos ha servido
para abordar este tipo de problem atica que aparece ampliamente en los
conictos econ omicos, polticos y sociales. Pero este enfoque se puede utilizar
en los juegos extensivos que hemos venido estudiando desde el captulo 2 y
nos provee con una forma de seleccionar entre los equilibrios perfectos en
subjuegos. La idea est a relacionada con el hecho de que los jugadores no
s olo pueden hacer inducci on hacia atr as, sino tambien deducir las acciones
no vistas de los jugadores que han actuado delante de ellos, o por lo menos
formarse creencias razonables acerca de estas acciones. Esto les permitir a no
s olo hacer an alisis sobre los subjuegos que siguen a una situaci on dada, sino
sobre la continuaci on del juego a partir de algunos conjuntos de informaci on,
aunque estos no consten de un solo elemento.
Un subjuego es la parte de un juego que sigue a un conjunto de informa-
ci on con un solo elemento v y tal que la memoria que parte de v se conserva
dentro de los vertices mayores que v. El concepto de juego de continuaci on
formaliza la parte de un juego que sigue a cualquier conjunto de informaci on,
cuando tiene caractersticas an alogas de memoria que un subjuego y es una
generalizaci on de este ultimo.
Sea un juego extensivo y S
j
i
un conjunto de informaci on del jugador
j tal que para todo vertice X S
j
i
si Y X, con Y S
j
k
y Z S
j
k
,
entonces Z X

para alg un X

S
j
i
. Entonces el juego de continuaci on de
a partir de S
j
i
(
S
j
i
) consta del conjunto de vertices mayores o iguales que
los vertices de S
j
i
y las aristas de entre ellos y todos los dem as elementos
tambien heredados del juego , es decir, conjunto de vertices de probabilidad
y distribuciones entre las alternativas de estos vertices, conjuntos de jugador,
subconjuntos de informaci on y conjuntos de ndices correspondientes a ellos
169
170 Sobre gustos y conocimiento
y funci on de pago como una restricci on a las partidas que pasan por S
j
i
.
La idea sera construir un concepto de equilibrio que pudiera garantizar
jugar bien los juegos de continuaci on, combinando el an alisis de inducci on
hacia atr as con el de deducci on de creencias razonables acerca de la acci on
que han seguido los jugadores que actuaron antes de llegar a un conjunto de
informaci on, con lo que el jugador que tiene que decidir en el conjunto de
informaci on no estara tan ciego, en cuanto a donde est a situado.
(1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1) (1,1)
(1,1) (1,1) (1,1) (1,1) (1,1) (1,1)
(1,1) (0,0) (1,1)
(1,1)
(1,1)
(1,1)
(1,1)
(0,0)
I I I I
0 0 0 0 0
II II
II II
II II
c nc
c nc
c nc
c nc c
c
nc
nc
1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2
(4,x)
0
1/12
1/12 1/4
1/4
1/12 1/12
1/12
1/12
(x,4)
(3,2)
(3,1)
(2,3) (2,1)
(1,3)
(1,2)
nc
nc c
c
c c
c
nc nc
nc nc
c
I
I
Figura 4.4.1:
Consideremos el juego del contento de la gura 2.2.9. En primer lugar,
podemos analizar los seis conjuntos de informaci on del jugador II que cons-
ta de un solo vertice. Tendramos que elegira, con seguridad, contento en
el primero y no contento en el tercero, en el quinto y en el sexto y sera
indiferente en el segundo y en el cuarto. Quedemonos con el juego podado
de la gura 4.4.1.
En el conjunto de informaci on en el que el jugador II tiene la carta 1
y el jugador I se declar o contento. II no sabe si el jugador I tiene la carta
3, vertice X
1
, o la 2, vertice Y
1
(gura 4.4.2 (Fa)). Haciendo el an alisis del
juego, llegara a la conclusi on de que si el jugador I tuviera la carta 2, no
hubiera sabido si est a en (2, 3) o en (2, 1). Entonces, si I hubiera elegido
no contento, tendra una esperanza de pago de
1
2
, mientras que al elegir
170
Modelos de juegos no cooperativos 171
contento no sabra si caera en el conjunto de informaci on de II de carta 1
o en el de carta 3, en ambos casos el jugador II le impondra el pago de
1. As que el segundo jugador llegara a la creencia razonable de que se
encuentra, con seguridad (probabilidad 1) en X
1
y le conviene declararse no
contento.
En el conjunto de informaci on en el que el jugador II tiene la carta 3 y
el jugador I se declar o contento, II no sabe si el jugador I tena la carta 2,
vertice X
3
o la 1, vertice Y
3
(gura 4.4.2 (Fc)). El an alisis le llevara a pensar
que I se habra declarado no contento en ambos casos. Por lo que no tiene
criterio para saber si est a en uno o en otro y pensara que con probabilidad
1
2
est a en X
3
y con probabilidad
1
2
est a en Y
3
. Aunque lo cierto es que no es
de mucha utilidad pues en los dos vertices le conviene declararse contento,
pues el sabe, sin tratar de averiguar en cu al de los dos vertices est a que tiene
una carta mayor que 1 y se declarara contento.
En el conjunto de informaci on en el que el jugador II tiene la carta 2 y el
jugador I se declar o contento, II no sabe si est a en el vertice X
2
, con la carta
3 para I, o en el vertice Y
2
(gura 4.4.2 (Fc)), donde el primer jugador tiene
la 1. Haciendo el an alisis llegara a la conclusi on de que a I le convendra
declararse no contento si tuviese la carta 1, pues tendra una esperanza de
pago de -
1
2
, mientras que al declararse contento II le impondra un pago de
-1. As que creera que, con probabilidad 1, el jugador I tiene la carta 3, es
decir, que est a en X
2
, as que escogera no estar contento.
Tendramos que, en el primer conjunto de informaci on, I elige contento,
en el segundo y en el tercero elegira nc, entonces se han construido cuatro
perles de estrategias:
((c, nc, nc) , (c, c, nc, c, nc, nc, nc, nc, c)),
((c, nc, nc) , (c, c, nc, nc, nc, nc, nc, nc, c)),
((c, nc, nc) , (c, nc, nc, c, nc, nc, nc, nc, c)),
((c, nc, nc) , (c, nc, nc, nc, nc, nc, nc, nc, c)).
Si buscamos los equilibrios perfectos en subjuegos tendramos las mismas
posibles respuestas de equilibrio en los conjuntos de informaci on del jugador
II que constan de un solo vertice, obteniendo un juego podado cuya matriz
de pagos para el jugador I es:
171
172 Sobre gustos y conocimiento
1 2 3 4 5 6 7 8
1
2
3
4
5
6
7
8
_
_
_
_
_
_
_
_
_
_
_
_
0
1
6
1
4
1
12
1
12
1
12
1
3
1
6
1
12
1
6
1
6
1
12
0
1
12
1
6

1
6

1
12
0
1
6
1
12
1
6
1
12
1
6

1
6

0 0
1
12
1
12
1
12
1
12
1
6

1
6

1
3
1
6
1
2
1
3
1
3
1
6
1
2
1
3
1
4
1
6
5
12
1
3
1
4
1
6
5
12
1
3
5
12
1
3
5
12
1
3
5
12
1
3
5
12
1
3
1
3
1
3
1
3
1
3
1
3
1
3
1
3
1
3
_
_
_
_
_
_
_
_
_
_
_
_
(3,2) I cont (1,2) I cont
Y
1
X
1
(3,1) I cont (2,1) I cont
X
2
Y
2
(2,3) I cont (1,3) I cont
X
3
Y
3
(1,1)
(1,1)
cont nocont
0 0
1/2 1/2 1/2
cont
1/2
nocont
(1,1)
(1,1) (1,1) (1,1)
II II
F.a
F.b
(1,1)
cont nocont
0 0
1/2 1/2 1/2
cont
1/2
nocont
(1,1) (1,1)
II II
(1,1)
(1,1)
(1,1)
cont nocont
0 0
1/2 1/2 1/2
cont
1/2
nocont
(1,1) (1,1)
II II
(1,1)
(1,1)
(1,1) (1,1)
F.c
Figura 4.4.2:
La matriz de pago del jugador I tiene los equilibrios de Nash en es-
172
Modelos de juegos no cooperativos 173
trategias puras que est an se nalados con un asterisco y combin andolos con
las respuestas obtenidas en los seis primeros conjuntos de informaci on del
jugador II, se obtienen 24 equilibrios perfectos en subjuegos del juego del
contento (ejemplo 2.2.10), entre los que est an los 4 que encontramos, com-
binando an alisis hacia atr as con el an alisis de lo que habra sucedido antes
para haber podido llegar hasta un punto dado.
Es decir, hemos llevado a cabo un procedimiento que selecciona algunos
de los equilibrios perfectos en subjuegos; estos ultimos a su vez se obtienen
por un proceso de selecci on dentro del conjunto de equilibrios de Nash.
4.5. Y si no se conocen las reglas?
En los juegos que hemos estudiado hasta aqu, todos los jugadores cono-
cen las reglas del juego. En algunos, como en el p oker o el domin o, los
jugadores, al estar actuando en una partida, pueden confundir situaciones,
ya que hay cartas o chas cubiertas y cada jugador desconoce algunas de
ellas, es lo que hemos llamado informaci on no perfecta. Pero, en ese ca-
so, todos conocen perfectamente las reglas del juego (p oker o domin o), en
particular, conocen el pago que obtendr a cada jugador en cada uno de los
resultados posibles. A estos juegos se les llama juegos de informaci on com-
pleta, no importa que sean juegos extensivos de informaci on no perfecta, en
ellos, repetimos, todos conocen las reglas del juego.
Imaginemos un conicto en el que los participantes, por lo menos alguno
de ellos, no conocen alg un aspecto de lo que podramos llamar reglas del tal
conicto. Por ejemplo, no conocen las personalidades de sus contrincantes, o
los resultados posibles, o las probabilidades en las jugadas de azar, etc. Hay
alguna denici on de juego de informaci on incompleta que abarque todos
los casos posibles? Hay alguna teora para abordar este tipo de temas?
En realidad, toda estas preguntas est an abiertas, pero la problem atica que
se ha abordado m as ampliamente es aquella en que uno o varios de los
participantes no conocen la funci on de utilidad de alguno (o algunos) de
los otros, tanto en juegos rectangulares como en extensivos. Hay muchos
avances en t opicos especcos que corresponden a este contexto. Por ejemplo,
los temas de Subastas, Dise no de Mecanismos, Selecci on Adversa, Juegos de
Se nalizaci on, Regateo con falta de informaci on de alguno de los agentes
sobre la utilidad de algunos de los otros, Nueva Organizaci on Industrial,
etc. Todos ellos son desarrollos que se ubican dentro de los llamados juegos
bayesianos o de informaci on incompleta.
173
174 Sobre gustos y conocimiento
4.5.1. Juegos rectangulares bayesianos (o de informaci on in-
completa)
Estos juegos son rectangulares, porque los jugadores toman decisiones
en forma simult anea, como en los juegos del captulo 1. Pero a diferencia
de los de dicho captulo, que por contraste llamaremos juegos rectangulares
de informaci on completa, en los que estamos introduciendo, por lo menos
alguno de los participantes desconoce la funci on de utilidad de uno o varios
de sus oponentes.
Elementos generales de estos juegos y son el conjunto de jugadores N,
para cada jugador y un conjunto de estrategias puras. El conjunto de ju-
gadores y los conjuntos de estrategias puras son conocimiento com un; sin em-
bargo con el pago que recibir a cada quien hay problemas, no es conocimiento
com un. No es muy sorprendente una situaci on de ese tipo, cuando el pago no
es en dinero, es difcil saber cu al es la satisfacci on (incluyendo en ese termi-
no lo que provocan los resultados desagradables) que obtiene una persona
al conseguir un trabajo, ser despedido, contraer matrimonio, adquirir una
obra de arte, ganar o perder unas elecciones, etc. A un cuando el pago sea en
dinero, puede ser complicado conocer la ganancia de una empresa cuando
no se conocen los diversos costos en que ha incurrido. Lo que si se considera
de conocimiento com un es que, para cada j, existe un conjunto T
j
de tipos
o personalidades y el pago que, cada uno de los elementos de T
j
, recibira en
cada perl de estrategias. Cada representante del jugador j conoce el tipo o
personalidad que el mismo tiene y puede no conocer las personalidades de los
dem as, aunque si conoce las probabilidades sobre T
1
T
2
... T
n
determi-
nadas por las creencias, de cada jugador j sobre la composici on, en cuanto a
la personalidad de los participantes. Estas probabilidades son conocimiento
com un.
En resumen, un juego rectangular bayesiano consta de:
1. Un conjunto de jugadores N.
2. Para cada j N, un conjunto de acciones A
j
.
3. Para cada j N, un conjunto T
j
, de tipos o personalidades que puede
tener el jugador j.
4. Para cada j N y para cada t
j
T
j
, una funci on de pago
j
t
j
: A
1

A
2
A
n
R.
5. Para cada j N, una distribuci on de probabilidad p
j
en T
1
T
2

T
n
.
174
Modelos de juegos no cooperativos 175
Notaci on: G =
_
N, A
j

jN
, T
j

jN
,
_

j
t
j
_
jN,t
j
T
j
, p
j

jN
_
.
C omo analizar un conicto que est a descrito por medio de un juego
rectangular bayesiano?
El metodo propuesto por Harsanyi para realizar ese an alisis consiste en
asociar a
_
N, A
j

jN
, T
j

jN
,
_

j
t
j
_
jN,t
j
T
j
, p
j

jN
_
el juego exten-
sivo de informaci on no perfecta siguiente (ver gura 4.5.1).
1- La raz del juego U es un vertice de azar tal que Alt (U) = T
1
T
2
T
n
y la probabilidad p
k
est a determinada por las creencias de los jugadores.
2- Jugadas simult aneas: cada jugador j, representado por alguno de sus
tipos posibles, elige una de sus acciones. j sabe cu al es su tipo, pero no el de
cada uno de los dem as y no conoce las decisiones de los que eligieron antes
que el.
3- Cada tipo t
j
recibe un pago
j
t
j
: A
1
A
2
... A
nj
T
j
R,
donde T
j
= T
1
T
2
... T
j1
T
j+1
... T
n
.
Denotemos a dicho juego extensivo como
H(G)
y llamemosle de Harsany
corespondiente a G.
Denici on 4.5.1. Una estrategia para el jugador j en
H(G)
es una funci on

j
: T
j
A
j
.
t11
I
t11
I
t12
I
t12
I
II
t21
II
t21
II
t22
II
t22
II
t21
II
t21
II
t22
II
t22
0
P(t11,t21) P(t12,t22)
... ... ...
... ... ... ...
... ... ... ...
P(t11,t22) P(t12,t21)
Figura 4.5.1:
D
j
es el conjunto de estrategias de j en
H(G)
.
175
176 Sobre gustos y conocimiento
La forma normal de
H(G)
est a descrita por las funciones
j
t
j
: D
1
D
2

D
n
R denidas como

j
t
j
_

1
,
2
, . . . ,
n
_
=

t
j
T
j
p (t
j
[t
j
)
j
t
j
_

1
,
2
, . . . ,
n
, t
j
_
,
donde p (t
j
[t
j
) =
p(t
1
,t
2
,...,tn)
p(t
j
)
.
Denici on 4.5.2.
_

1
,
2
, ...,
n
_
es un Equilibrio Bayesiano de Nash, si
para cada j en N, cada t
j
en T
j
y toda
j
en D
j
,

j
t
j
_

1
,
2
, ...,
n
_

j
t
j
_

1
,
2
, ...,
j
, ...,
n
_
.
Recordemos el Duopolio de Cournot del ejemplo 1.6.3. Dicho juego es
un juego rectangular de informaci on completa. Veamos ahora el Duopolio
de Cournot con informaci on incompleta m as simple.
Ejemplo 4.5.1. Supongamos de nuevo dos empresas que controlan el mer-
cado de un bien, pero, ahora, la primera de ellas usa una tecnologa conoci-
da por todos, con un costo unitario c, mientras que la segunda puede estar
usando una de dos tecnologas nuevas con costos unitarios c
a
y c
b
, respecti-
vamente, c
a
> c
b
. La primera empresa no sabe cu al es la tecnologa usada
por la otra, pero tiene la creencia de que la probabilidad de que esto suce-
da corresponde a la proporci on de empresas que utilizan la tecnologa
de costo alto, respecto del n umero total de empresas que se han inclinado
por alguna de las dos tecnologas nuevas. Las dos empresas tienen que de-
cidir simult aneamente que cantidad producir an (q
j
en A
j
= [0, d], j = 1, 2),
pero la segunda puede estar representada por uno de los dos tipos de nueva
tecnologa T
2
= E
2a
, E
2b
. El juego extensivo de Harsanyi asociado a este
juego est a representado en la gura 4.5.2.
De nuevo, consideramos la ecuaci on inversa de demanda (el precio en
funci on de la oferta) como:
p(q
1
, q
2i
) = d q
1
q
2i
, i = a, b
La ganancia para la empresa 2 de tipo i = a, b es

2i
(q
1
, q
2a
, q
2b
) =
(p(q
1
, q
2i
) c
2i
)q
2i
= (d q
1
q
2i
c
2i
)q
2i
La ganancia esperada (subjetivamente) por la empresa 1 es

1
(q
1
, q
2a
, q
2b
) =
((p(q
1
, q
2a
) c) + (1 ) (p(q
1
, q
2b
) c)) q
1
=
((d q
1
q
2a
c) + (1 ) (d q
1
q
2b
c)) q
1
La condici on de primer orden para el problema de maximizaci on de la
empresa 2 cuando usa una tecnologa de costo alto y supone que la empresa
uno elige su estrategia q
1
:
176
Modelos de juegos no cooperativos 177
E1 E1
E2a E2a E2b E2b
0
1
0 d 0 d ... ...
... ... ... ... 0 0 0 0 d d d d
Figura 4.5.2:
d(Mq
1
q

2a
c
2a
)q

2a
dq
2a
= d q
1
2q

2a
c
2a
= 0.
Entonces,
q

2a
=
d q
1
c
2a
2
. (4.5.3a)
determina la curva de reacci on de la empresa 2 de tipo a.
An alogamente el problema de optimizaci on de la empresa 2 cuando usa
una tecnologa de costo bajo nos lleva a
q

2b
=
d q
1
c
2b
2
. (4.5.3b)
Por otro lado, la condici on de primer orden de maximizaci on del pago
que espera la empresa 1 es
d

(dq

1
q
2a
c)+(1)(dq

1
q
2b
c)

1
dq
1
=
(d q

1
q
2a
c) + (1 ) (d q

1
q
2b
c) q

1
= 0
Entonces,
q

1
=
d c q
2a
(1 ) q
2b
2
. (4.5.3c)
Utilizando 4.5.3a, 4.5.3b y 4.5.3c,
(d q

_
dq

1
c
2a
2
_
c) + (1 ) (d q

_
dq

1
c
2b
2
_
c) q

1
= 0
Y obtenemos que el equilibrio bayesiano de Nash est a dado por
q

1
=
1
3
(d +c
2a
+ (1 ) c
2b
2c)
q

2a
=
1
3
(d +c 2c
2a
) +
1
6
(c
2a
c
2b
)
q

2b
=
1
3
(d +c 2c
2b
) +

6
(c
2b
c
2a
)
177
178 Sobre gustos y conocimiento
Recordemos que en el caso de informaci on completa, en el duopolio de
Cournot, suponiendo que d es sucientemente grande, el equilibrio de Nash
es
q

1
=
1
3
(d +c
2
2c
1
) y
q

2
=
1
3
(d +c
1
2c
2
).
Entonces, q

1
> q

2
c
1
< c
2
. Es decir, en el equilibrio de Nash (o
Cournot-Nash) la empresa m as eciente, o sea la que tiene menor costo,
produce m as que la otra.
Que sucede en el caso del duopolio con informaci on incompleta?
q

1
=
1
3
(d +c
2a
+ (1 ) c
2b
2c) <
1
3
(d +c
2a
2c).
El lado derecho de la desigualdad,
1
3
(d + c
2a
2c), es lo que hubiera
producido la empresa 1 de haberse enfrentado con informaci on completa a
una empresa de costos altos. Cuanto m as peque na sea , es decir cuanto m as
crea la empresa 1 que se enfrenta a una empresa de costos bajos, m as cercana
es la diferencia entre las dos producciones a c
2a
c
2b
. Es decir, si la empresa
1 se enfrenta a otra con altos costos, pero no tiene dicha informaci on, tener
que actuar con creencias le perjudica. En cambio, a la empresa 2 con altos
costos le benecia la falta de informaci on de 1, pues producir a
1
3
(d +c 2c
2a
) +

6
(c
2a
c
2b
) >
1
3
(d +c 2c
2a
),
1
3
(d + c 2c
2a
) es lo que producira en el caso de informaci on completa de
la empresa 1.
Por el contrario, si la empresa 1 se enfrenta a una empresa de bajos
costos y no lo sabe, tener que actuar con creencias le benecia. Puesto que
q

1
>
1
3
(d+c
2b
2c) y cuanto mayor sea la creencia de que se enfrenta a una
empresa de costos altos, m as cercana ser a la diferencia entre las producciones
a c
2a
c
2b
.
Por el contrario, a la empresa 2 de bajos costos le perjudica la falta de
informaci on que tiene 1. Su producci on de equilibrio est a dada por q

2b
=
1
3
(d + c 2c
2b
) +
1
6
(c
2b
c
2a
) <
1
3
(d +c 2c
2b
). El lado derecho hubiera
sido su producci on con informaci on completa.
Haciendo razonamientos como los de la secci on 4.3, quiz a lo que se puede
esperar es que si una empresa tiene bajos costos, lo publique a voz en cuello
y si tiene altos costos trate de ocultarlo a como de lugar, pero esto dara in-
formaci on a su oponente y dejara de ser un ejemplo de juego de informaci on
incompleta. As que mejor dejemos el tema.
178
Modelos de juegos no cooperativos 179
4.5.2. Juegos extensivos bayesianos
El concepto de soluci on que surge en estos juegos, el equilibrio bayesiano
perfecto, est a basado en una generalizaci on del concepto de subjuego que
es el de juego de continuaci on. La idea es la de ampliar el concepto de
cortar un juego extensivo, para que tenga sentido, no s olo en cierto tipo de
vertices, sino en algunos conjuntos de informaci on S
j
k
. La condici on sobre
los conjuntos de informaci on al que pertenece el vertice en que se cortaba
el juego y a los que pertenecen los vertices mayores, tendr a que cumplirse
para todos los vertices del conjunto de informaci on en donde se quiere hacer
el corte.
Denici on 4.5.3. Un juego extensivo se puede cortar en el conjunto de
informaci on S
j
k
si para cada pareja de vertices u y v tales que u es mayor
que alg un vertice de S
j
k
y u y v est an en el mismo conjunto de informaci on,
v es mayor que alg un vertice de S
j
k
.
Denici on 4.5.4. Dado un juego extensivo que se puede cortar en el
conjunto de informaci on S
j
k
, el juego de continuaci on que empieza en S
j
k
es el conjunto de vertices mayores o iguales que los vertices de S
j
k
y todas
las aristas, conjuntos de jugador, de azar, de informaci on en que est an in-
volucrados. Los conjuntos de ndices, la distribuci on de probabilidad en los
conjuntos de alternativas de los vertices de azar y las funciones de pago se
heredan de .
El concepto de equilibrio que se manejar a ser a de tal manera que al
restringirlo a los juegos de continuaci on sea un equilibrio.
La descripci on de un juego extensivo bayesiano en terminos generales es
mucho m as complicada que la de los rectangulares bayesianos, por lo que
s olo expondremos las caractersticas generales de uno de los tipos que se
estudian y se aplican ampliamente, los llamados juegos de se nalizaci on.
4.5.3. Juegos de se nalizaci on
Como antes, se presenta falta de informaci on de algunos de los jugadores
sobre las preferencias de algunos de los otros. Especcamente, en los juegos
de se nalizaci on, lo que no se conoce son las preferencias de uno de ellos, E,
que es un emisor de se nales y es de uno de los tipos del conjunto T
E
, lo que
le otorga una funci on de utilidad. E es un jugador informado de la utili-
dad de los otros jugadores y de la suya propia. Todos los dem as jugadores,
R
1
, R
2
, . . . , R
m
, son los receptores y no conocen cu al de los tipos del con-
junto T
E
es el del jugador informado al que se enfrentan. La utilidad de los
179
180 Sobre gustos y conocimiento
jugadores R
i
es de conocimiento com un. E emite se nales (de un conjunto
dado) que reciben los jugadores receptores, cada uno de estos decide tomar
una acci on (de su conjunto de acciones) de acuerdo a como interpreta la
se nal de E.
Formalizando, un juego de se nalizaci on
S(E,{R
j
})
consiste en
1. Un jugador E (el emisor), m jugadores R
1
, R
2
, . . . , R
m
(los receptores).
2. Un conjunto de tipos del emisor T
E
= t
1
, t
2
, . . . , t
r

3. Conjeturas sobre los tipos p (t


i
[R
j
)
4. Una jugada de azar con una distribuci on de probabilidad p sobre T
E
=
t
1
, t
2
, . . . , t
r
que deriva de las conjeturas de los receptores. Esta es
la jugada inicial.
5. Un conjunto de se nales S
E
de las que puede elegir el jugador E.
6. Para cada R
j
, un conjunto de acciones A
j
.
7. Al tocarle decidir, E estara informado de t, el tipo que lo representa.
8. Simult aneamente, cada R
j
ve la se nal y sin conocer el tipo al que
pertenece E escoge una respuesta r
j
en A
j
.
9. Para cada tipo t en T
E
, cada se nal s, y para cada perl de respuestas
de los receptores queda determinado un pago
E
t
_

E
,
R
_
, para el
representante t de E, y
R
j
_

E
,
R
1
,
R
2
, ...,
Rm
, t
_
, para cada
R
j
.
El modelo de se nalizaci on, con r tipos para E se representa en la gura
4.5.3.
Las estrategias del emisor en el juego de se nalizaci on son funciones
E
que a cada tipo en T
E
le asocian una se nal.
Para cada receptor R
j
, sus estrategias son funciones
R
j
que a cada se nal
emitida por E le asocian una respuesta del conjunto A
j
.
Es decir, todas las del juego de se nalizaci on son estrategias del juego
extensivo representado en la gura 4.5.3. Al conjunto de estrategias de E en
el juego de se nalizaci on lo denotamos como D
E
. Al conjunto de estrategias
de R
i
en el juego de se nalizaci on lo denotamos como D
R
i
.
Los receptores tienen que tomar decisiones en conjuntos de informaci on
con m as de un elemento, pues no saben a cual de los tipos se enfrentan. Ellos
construyen conjeturas o creencias acerca del tipo que pudo haber emitido
180
Modelos de juegos no cooperativos 181
Et1 Etr
R1
R1 R1
1 S k S
1 S k S
R1
Rm Rm
Rm Rm
am
1
am
1
am
1
am
s
am
s
am
s
am
1
am
s
Pt1 Pt2 Ptr
a1
1
a1
1
0
...
... ...
...
...
...
...
...
...
... ... ... ... ... ...
...
...
... ... ...
... ...
...
...
a1 a1 a1 a1 a1 a1
l l l l 1 1
Figura 4.5.3:
la se nal que est an viendo. Esto lo hacen asoci andole, a cada se nal, una
distribuci on de probabilidad en T
E
.
Para denir el concepto de equilibrio bayesiano perfecto, se considera
que con sus estrategias de equilibrio los receptores optimizar an, respecto a
un pago esperado determinado por las estrategias de equilibrio de los dem as
y sus conjeturas o creencias. Pero estas creencias, para que formen parte de
un equilibrio bayesiano perfecto, deben ser razonables. Es decir, deben
estar determinadas por las estrategias del emisor y por la ley de Bayes.
Por simplicar, denamos equilibrio bayesiano perfecto, para el caso de
un emisor y un receptor.
Sea
_

E
,
R
_
una pareja de estrategias del juego de se nalizaci on, es
decir,
E
es una funci on que a cada t T
E
le asigna una se nal s S
E
y
181
182 Sobre gustos y conocimiento

R
una funci on que a cada s le asocia una de sus posibles respuestas en
A
R
.
Dada una se nal s

S
E
, el jugador R se forma creencias acerca de cu al
es la personalidad de E que pudo haber emitido la se nal s. Estas creencias se
expresan a traves de ( [s), una distribuci on de probabilidad en los tipos
del jugador E.
Denici on 4.5.5.
_

E
,
R
,

(t [s)
sD
E
,tT
E
_
es un equilibrio baye-
siano perfecto del juego de se nalizaci on
S(E,R)
si
a) Para toda t T
E
y para toda
E
D
E
,

E
t
_

E
,
R
_

E
t
_

E
,
R
_
.
b) Para toda
R
D
R
,

tT
E

_
t

E
_

R
_

E
,
R
, t
_


tT
E

_
t

E
_

R
_

E
,
R
, t
_
.
c)
(t [s) =
_

_
ptq(s|t )

T
E
p
t
q(s|t

)
si
t

T
E
p
t
q (s [t

) > 0,
cualquier distribuci on si
t

T
E
p
t
q (s [t

) = 0,
donde q (s [t ) =
_
1 si
E
(t) = s,
0 si
E
(t) ,= s.
Consideremos el siguiente ejemplo del libro de Bierman y Fern andez [3]:
Ejemplo 4.5.2. Un paciente X fue sometido a una operaci on por un medi-
co, el Doctor Y , del que sospecha que actu o con negligencia, aunque no
est a seguro de ello. La operaci on tuvo consecuencias muy malas para X y
ahora est a dispuesto a demandar al medico. El doctor declara su inocen-
cia y achaca los nefastos resultados a otras causas. Por su apreciaci on de
la trayectoria del medico y de los hechos que tuvieron lugar durante su
caso, X cree que el Doctor Y es culpable con probabilidad
1
2
. El jugador
Doctor Y puede estar representado por alguno de los tipos del conjunto
T
D
= Culpable, Inocente. El doctor, representado por cualquier tipo,
considera la conveniencia de ofrecer, al paciente X, una indemnizaci on de
un mill on de pesos o no ofrecerle nada, S
Y
=
_
0, 10
6
_
. Esto lo convierte en
un emisor de se nales, pues ofrecer o no una indemnizaci on transforma las
creencias (probabilidades subjetivas) de X sobre la culpabilidad del doctor.
X decidir a si acepta la indemnizaci on o va a juicio, de acuerdo a la se nal
182
Modelos de juegos no cooperativos 183
recibida y a como esta transforma sus creencias en la culpabilidad del doc-
tor. Por supuesto, el juicio implica gastos para X y si su acusaci on es contra
un inocente tendr a que pagar las consecuencias. La gura 4.5.4 representa
a este ejemplo de se nalizaci on.
10
6
10
6
0
inocente
(0,0)
acepta acepta juicio juicio
(0,0)
(2x10 ,10 )
acepta juicio
juicio acepta
1/2
Dr Dr
1/2
0 0
culpable
(2x10 ,10 ) (10 ,6x10 )
5 6 5
(10 ,10 )
6
(10 ,10 )
6 6
(10 ,6x10 )
5
6
6 6 6 5
Paciente
Paciente
C I
Figura 4.5.4:
Para caracterizar todos los equilibrios bayesianos perfectos, consideremos
el conjunto de estrategias del Doctor Y , en el juego de se nalizaci on. Es decir,
_
(0, 0) ,
_
10
6
, 10
6
_
,
_
0, 10
6
_
,
_
10
6
, 0
__
.
Veamos cuantos equilibrios bayesianos perfectos corresponden a cada una
de estas estrategias.
Supongamos que los dos tipos de personalidad del Doctor Y eligen no
indemnizar a X, es decir la estrategia (0, 0). Cuando X est a en el conjunto de
informaci on en que no se le ha ofrecido indemnizaci on, X tiene la creencia de
que el medico es culpable con probabilidad (C [0), entonces, pensara que
183
184 Sobre gustos y conocimiento
si acepta la situaci on cruzado de brazos ganara 0, mientras que si decidiera
irse a juicio ganara:
(C [0) 10
6
+ (1 (C [0))
_
6 10
5
_
=
(C [0)
_
10
6
+ 6 10
5
_
6 10
5
.
Lo que nos lleva a que ir a juicio es una mejor estrategia si y s olo si
(C [0)
3
8
.
La creencia en la culpabilidad del doctor debe corresponder a la estrate-
gia de equilibrio y a la regla de Bayes. El equilibrio propuesto es que ninguno
le ofrece ninguna indemnizaci on, entonces, (C [0) =
1
2
>
3
8
. Por lo que X
elegira ir a juicio.
Tambien es necesario saber como actuara X en el conjunto de informa-
ci on en el que el Doctor Y le ofrece una indemnizaci on de un mill on de
pesos, en donde la creencia de que el medico es culpable est a dada por la
probabilidad
_
C

10
6
_
.
En este caso, si X acepta ganara un mill on, para cualquier valor de

_
C

10
6
_
. En cambio, si elige ir a juicio ganara

_
C

10
6
_
10
6
+
_
1
_
C

10
6
__ _
6 10
5
_
que es menor o igual que 10
6
para todo valor de
_
C

10
6
_
. Es decir,
cualquiera que sea la probabilidad subjetiva de X sobre la culpabilidad del
doctor, a X le conviene aceptar la oferta de un mill on de pesos y no ir a
juicio.
C omo X aceptara el mill on de indemnizaci on, el Doctor Y de tipo
culpable mejorara su pago al ofrecer dicha indemnizaci on, en lugar de ofrecer
0 e ir a juicio, ya que en este ultimo caso, X ira a juicio y el medico tendra
que pagar 2 millones. Por lo tanto, un perl, en donde el doctor Culpable
elige 0, mientras que el doctor de tipo inocente, tambien ofrece cero no puede
ser un equilibrio.
Para cualquier valor de (C [0), al Doctor Y de tipo Inocente le
conviene ofrecer 0, tanto si X acepta, cuando ganara 0, como si X va a
juicio, cuando ganara cien mil pesos, mientras que si ofrece 10
6
ganara
10
6
. Entonces,
_
x, 10
6
_
, con x = 10
6
o 0, no puede formar parte de un
equilibrio.
Que ocurre con
_
10
6
, 0
_
?
Ya sabemos que, para cualquier
_
C

10
6
_
, a X le conviene aceptar el
mill on de pesos. De acuerdo al equilibrio propuesto,
_
C

10
6
_
debera ser
igual a 1 y (C [0) = 0 <
3
8
. Pero, entonces, X no ira a juicio si no le
ofrecen indemnizaci on y el doctor Culpable mejorara su pago si no ofrece
nada.
184
Modelos de juegos no cooperativos 185
Por lo que no hay equilibrio con
_
10
6
, 0
_
.
Por lo tanto, s olo pueden existir equilibrios con estrategias mixtas para
el doctor culpable y para X en la aceptaci on de una oferta de cero.
La probabilidad d con que el doctor culpable ofrece 0 debe ser tal que
deje indiferente a X con elegir aceptar o ir a juicio.
Entonces, la igualdad de ganancias esperadas implica.
(C [0) 10
6
+ (1 (C [0))
_
6 10
5
_
= 0.
O lo que es lo mismo,
(C [0)
_
10
6
+ 6 10
5
_
= 6 10
5
.
Si denotamos como p(0 [C) a la probabilidad de ofrecer cero siendo cul-
pable y como p(0 [I ) a la de ofrecer cero siendo inocente, (C [0) se puede
escribir como
p(0 [C)p(C)
p(0 [C)p(C) +p(0 [I )p(I)
=
d
_
1
2
_
d
_
1
2
_
+
1
2
=
d
d + 1
Es decir,
d
d+1
_
10
6
+ 6 10
5
_
= 6 10
5
y
d
_
10
6
+ 6 10
5
_
=
_
6 10
5
_
d
_
10
6
_
= 6 10
5
d =
610
5
10
6
=
3
5
.
Por su lado, X debe escoger la probabilidad x de aceptar cero, de tal
manera que el doctor culpable resulte indiferente entre ofrecer 0 y ofrecer
10
6
, es decir,
x(0) + 2 (1 x)
_
10
6
_
= 10
6
.
Por lo que, x =
1
2
.
El equilibrio bayesiano perfecto es el siguiente:
i) El doctor inocente ofrece siempre 0.
ii) El doctor culpable ofrece 0, con probabilidad
3
5
y ofrece 10
6
, con
probabilidad
2
5
.
iii) X acepta siempre la indemnizaci on de 10
6
y acepta que no le ofrezcan
ninguna indemnizaci on con probabilidad
3
5
y se va a juicio con probabilidad
2
5
, cuando no le ofrecen indemnizaci on.
Las creencias sobre la culpabilidad o no del doctor, de acuerdo a las
indemnizaciones que este ha ofrecido son:
(C [0) =
3
8
,
(I [0) =
5
8
,
185
186 Estrategias Mixtas

_
C

10
6
_
= 1 y

_
I

10
6
_
= 0.
186
Parte II
Mezclando y Jugando en el
largo Plazo
187
Captulo 5
Estrategias Mixtas
5.1. Motivando con el Juego Ficticio
Como hemos visto en el captulo 1, no todos los juegos rectangulares
tienen equilibrios de Nash en estrategias puras, ni siquiera los bipersonales
de suma cero m as peque nos posibles, los juegos 22. Eso implica, entre otras
cosas, que no podemos aspirar a encontrar soluciones, como los equilibrios
de Nash en estrategias puras, en las que los jugadores no mezclan m as de
una estrategia, ya sea a lo largo del tiempo o, si esto tiene sentido en el juego
en cuesti on, en una sola ocasi on. Este captulo y el siguiente est an dedicados
al estudio de la combinaci on de estrategias puras en los juegos rectangulares
nitos. Se estudiar an algunos aspectos para los juegos innitos, siempre
especicando que se trata de dicho caso.
Para introducirnos al tema de las estrategias mixtas, pensemos, por ejem-
plo, en las dos empresas que se enfrentan a traves del conicto del ejemplo
1.3.3.
entrar no entrar
regalar
prensa
radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(45, 10) (55, 0)
_
_
Recordemos que este juego no tiene equilibrio de Nash en estrategias
puras. No existe una pareja de estrategias puras, una para cada empresa,
que se pueda prever que terminar a por adoptarse en cada ocasi on que se
celebre el juego. Tenemos, entonces, que tratar de hacer otro tipo de an alisis
del comportamiento de las empresas, por ejemplo, pensar que el monopolio,
189
190 Estrategias Mixtas
el jugador que elige renglones, no tiene porque decidir invertir todo el capital
de que dispone para publicidad en un solo metodo, sino que distintas partes
de este pueden emplearse en cada uno de los metodos disponibles. An aloga-
mente, el competidor no est a obligado a considerar unicamente las opciones
de invertir todo su capital en competir con el monopolio o no invertir nada,
sino que puede decidir arriesgar parte de su capital compitiendo y mantener
segura o invertida en otra cosa la otra parte.
La pregunta que correspondera, en un caso as, es si se puede hablar de
patrones de conducta previsibles, en terminos de las partes de los capitales
que utilizar an las empresas en cada actividad posible.
Otra situaci on que se puede presentar es que realmente las empresas
s tengan que optar por una sola de sus posibles estrategias, pero que com-
pitan a lo largo del tiempo, periodo tras periodo, y que no siempre est an
obligadas a utilizar la misma estrategia pura, entonces el problema a estudiar
sera la frecuencia relativa con que utilizan cada una de sus posibilidades, a
lo largo del tiempo. Por ultimo, otra idea que podemos analizar es que hay
varios monopolios que se enfrenta, en muchos conictos simult aneos, con-
tra muchos competidores diferentes y, en cada conicto, tanto el monopolio
como sus competidores se comportan en forma distinta, es decir, utilizando
estrategias distintas. En ese caso, nos propondramos estudia las frecuencias
con que usan las distintas estrategias los contrincantes de los dos tipos.
Por lo pronto, sigamos la segunda lnea de pensamiento, es decir, dos em-
presas se enfrentan, periodo tras periodo, en el mismo conicto, no pudiendo
escoger, en un periodo, m as que una de sus opciones, aunque en periodos
distintos si pueden elegir estrategias diferentes. Supongamos que, al empezar
el an alisis, se han celebrado k periodos del conicto y que la tabla siguiente
describe las estrategias utilizadas en cada uno de tales periodos:
Periodo Monopolio Competidor
1 s
1
c
1
2 s
2
c
2
3 s
3
c
3
4 s
4
c
4
... ... ...
k s
k
c
k
donde s
i
regalar muestras, publicidad escrita, publicidad en radio y tv
y c
j
entrar a competir, no entrar
Si conjetur aramos que la forma de actuar de cada una de las empresas
corresponde a una funci on que asocia a cada periodo una de sus estrate-
190
Mezclando y Jugando en el largo Plazo 191
gias puras, no habramos avanzado nada respecto al an alisis que hacamos
del juego cuando consider abamos que el juego se realiza una sola vez, pues
no necesariamente existe una pareja de funciones que tuviese un papel se-
mejante al equilibrio de Nash en estrategias puras.
Enfoquemos la tabla de manera distinta y pensemos que, con ella, ca-
da empresa puede examinar la historia del conicto y sacar conclusiones
acerca del comportamiento de la otra empresa para ir mejorando su propia
actuaci on. La empresa M observar a que su competidor potencial C ha en-
trado a competir en k
1
ocasiones y no ha entrado en k k
1
. Con esto,
se puede pensar en el vector de frecuencias relativas,
_
k
1
k
,
kk
1
k
_
, como
una aproximaci on sobre la tendencia del comportamiento de C. An aloga-
mente,
_
k
1
k
,
k
2
k
,
kk
1
k
2
k
_
es el vector de frecuencias relativas en el uso
de las estrategias de M, si este eligi o en k
1
ocasiones la estrategia regalar
muestras, en k
2
ocasiones utiliz o la publicidad escrita y en las restantes
ocasiones se anunci o por radio y tv. Cada empresa podr a pensar en el vector
de frecuencias relativas de su contrario como una estrategia del oponente.
Quiz a dicha estrategia no sea un plan consciente, pero la conducta segui-
da muestra ciertos pesos o probabilidades que el opositor est a asignando a
sus diversas estrategias puras como una tendencia real, aunque dichos pesos
tengan una validez moment anea. Si el conicto se va a repetir en el periodo
k + 1, cada empresa puede utilizar la informaci on sobre su oponente, para
escoger una de sus propias estrategias puras, en k + 1. Por ejemplo, podra
escoger, en k + 1, una de las estrategias puras que le hubieran otorgado la
ganancia promedio m as alta de haber utilizado alguna de ellas en cada uno
de los k periodos anteriores.
Pensemos que el conicto se ha llevado a cabo cinco veces y, de estos
periodos, la empresa M escogi o, en el primero, tercero y cuarto, la estrate-
gia de anunciarse por radio y tv, mientras que en el segundo escogi o la
publicidad escrita y en el quinto regal o muestras. Por su lado, C entr o
a competir, en los dos ultimos periodos y no entr o en los tres primeros. La
tabla que tendramos sera la siguiente:
Periodo Monopolio Competidor
1 radio y tv no entr o a competir
2 publicidad escrita no entr o a competir
3 radio y tv entr o a competir
4 radio y tv entr o a competir
5 regal o muestras entr o a competir
Supongamos que, hasta el periodo 5, las empresas escogieron sus estrate-
191
192 Estrategias Mixtas
gias arbitrariamente, pero, en el periodo 6, han llegado a la conclusi on de
que la informaci on que tienen les sirve. Por ejemplo, una buena estrategia
para M, en el periodo 6, es aquella que le hubiera dado el mayor mejor pago
promedio, de haberla usado en los cinco periodos anteriores, bajo el supuesto
de que C se hubiera comportado exactamente como lo hizo en cada uno de
los 5 periodos.
As, si hubiera regalado muestras durante los 5 periodos, habra ganado
265, o un pago medio de 53 por periodo. Este pago medio se puede calcular
como
3
5
(35) +
2
5
(80). Si, en cambio, hubiera elegido hacer publicidad escrita
sus ganancias llegaran a 210 que por periodo es 42 (
3
5
(30) +
2
5
(60)). Por
ultimo, si hubiera usado radio y tv, para anunciarse, habra ganado 245 que
en pago medio es 49 por periodo, lo que se obtiene como
3
5
(45) +
2
5
(55).
As que, de acuerdo a este criterio, M escoger a en el periodo 6, regalar
muestras que es la mejor respuesta a
_
3
5
,
2
5
_
, el vector de frecuencias relativas
de C. Por el lado de C, si hubiera escogido entrar en los cinco periodos, bajo
el supuesto de que M se hubiera comportado como lo hizo, habra obtenido
5 como ganancia total, lo que da un pago medio de 1, o lo que es lo mismo
_
1
5
(25) +
1
5
(10) +
3
5
(10)
_
. En cambio, si hubiera elegido no entrar habra
obtenido 0 como ganancia y como promedio, es decir,
_
1
5
(0) +
1
5
(0) +
3
5
(0)
_
.
Entonces, en el periodo 6, C elegira, la estrategia entrar que es la mejor
respuesta al vector de frecuencias relativas de M que es
_
1
5
,
1
5
,
3
5
_
.
Con este enfoque, cada empresa, necesariamente, tiene que elegir arbi-
trariamente en el primer periodo, pues no dispone de experiencia alguna.
Pero, a partir del segundo periodo, puede responder a la estrategia de
frecuencias relativas de su oponente, en forma optima, como se acaba de
describir. Supongamos que el monopolio elige, en el primer periodo, regalar
muestras y C decide, tambien en el primer periodo, entrar. En los sigu-
ientes periodos, las empresas dan su mejor respuesta al vector de frecuencias
re

lativas de su oponente. Esto quiere decir que, en el segundo periodo, M


partir a de que el vector de frecuencias de su oponente es
_
1
1
,
0
1
_
correspon-
diente a la elecci on entrar, en el unico periodo transcurrido y, entonces,
en el segundo periodo M elegir a hacer propaganda en radio y tv. C, por
su parte, partir a de que M est a eligiendo
_
1
1
,
0
1
,
0
1
_
y elegir a entrar. Para el
tercer periodo, M considerar a que C contin ua con
_
1
1
,
0
1
_
y volver a a elegir
hacer propaganda en radio y tv, mientras que C considerar a que el vector
de frecuencias de M es
_
1
2
,
0
2
,
1
2
_
y de nuevo elegir a entrar.
Si en un periodo dado a uno de los jugadores le son indiferentes sus
dos estrategias, supondremos que elegir a la misma del periodo anterior. La
tabla siguiente representa la conducta que seguiran, las dos empresas, con
estas mejores respuestas a las estrategias de frecuencias relativas en 15
192
Mezclando y Jugando en el largo Plazo 193
periodos, cuando, en el primer periodo, el monopolio elige regalar muestras
y C decide entrar. En las estrategias con asterisco, el jugador en cuesti on
es indiferente a sus dos estrategias.
Periodo Monopolio Competidor
1 regalar muestras entrar
2 radio y tv entrar
3 radio y tv entrar
4 radio y tv entrar
5 radio y tv no entrar
6 radio y tv no entrar
7 regalar muestras no entrar
Periodo Monopolio Competidor
8 regalar muestras *no entrar
9 regalar muestras entrar
10 regalar muestras entrar
11 regalar muestras entrar
12 regalar muestras entrar
13 regalar muestras entrar
14 regalar muestras entrar
15 *regalar muestras entrar
La empresa M ha ido cambiando sus estrategias de frecuencias a lo
largo de los quince periodos de la manera siguiente:
_
1
1
,
0
1
,
0
1
_
,
_
1
2
,
0
2
,
1
2
_
,
_
1
3
,
0
3
,
2
3
_
,
_
1
4
,
0
4
,
3
4
_
,
_
1
5
,
0
5
,
4
5
_
,
_
1
6
,
0
6
,
5
6
_
,
_
2
7
,
0
7
,
5
7
_
,
_
3
8
,
0
8
,
5
8
_
,
_
4
9
,
0
9
,
5
9
_
,
_
5
10
,
0
10
,
5
10
_
,
_
6
11
,
0
11
,
5
11
_
,
_
7
12
,
0
12
,
5
12
_
,
_
8
13
,
0
13
,
5
13
_
,
_
9
14
,
0
14
,
5
14
_
,
_
10
15
,
0
15
,
5
15
_
.
Y la empresa C lo ha ido haciendo como sigue:
_
1
1
,
0
1
_
,
_
2
2
,
0
2
_
,
_
3
3
,
0
3
_
,
_
4
4
,
0
4
_
,
_
4
5
,
1
5
_
,
_
4
6
,
2
6
_
,
193
194 Estrategias Mixtas
_
4
7
,
3
7
_
,
_
4
8
,
4
8
_
,
_
5
9
,
4
9
_
,
_
6
10
,
4
10
_
,
_
7
11
,
4
11
_
,
_
8
12
,
4
12
_
,
_
9
13
,
4
13
_
,
_
10
14
,
4
14
_
,
_
11
15
,
4
15
_
.
Mediante el procedimiento con el que hemos construido la tabla, que
estudiaremos detalladamente m as adelante, s olo aparecen pesos (probabili-
dades) racionales. Si, en lugar de pensar que el conicto se realiza en tiempo
discreto, lo hacemos en tiempo continuo, podramos hablar de la parte del
tiempo total en que se ha escogido cada una de las estrategias puras y po-
dramos tener pesos no racionales.
La forma de motivar que hemos usado en esta primera secci on hace
aparecer a lo que llamaremos estrategias mixtas como un instrumento para
que, en la repetici on de un juego rectangular a lo largo del tiempo, los
jugadores puedan estudiar la conducta de sus oponentes con base en la
experiencia de la actuaci on de estos. Esta no es la unica interpretaci on de las
estrategias mixtas posible. Alguna de ellas no necesita repeticiones del juego,
otras s. Sin embargo, al denir las estrategias mixtas y desarrollar su teora
se adopta un enfoque m as est atico de dichas estrategias, concibiendolas como
opciones de elecci on que tienen los jugadores en un momento dado.
Este captulo transcurre, como el primero, en el contexto te orico de los
juegos rectangulares nitos, pero permite no limitarse a una estrategia pura,
sino combinar varias de ellas, ya sea a lo largo del tiempo o en una ocasi on.
De hecho, se construye, con base en un juego rectangular, uno nuevo que
tambien es rectangular, pero innito. En este nuevo juego, tienen sentido
todos los conceptos que estudiamos en el captulo 1 y es lo que haremos
en este captulo, excepto con la parte relacionada con la forma de jugar
conservadora que la trataremos en el captulo 6. Otra vez el concepto central
de soluci on es el de equilibrio de Nash, ahora en estrategias mixtas. Lo
m as importante del asunto es que un teorema debido a Nash demuestra
que siempre existen los equilibrios en estrategias mixtas (secci on 5.6). Para
llegar a esto hay que estudiar las propiedades geometricas de los conjuntos de
estrategias mixtas y de la funci on de pago esperado (secci on 5.5). Encontrar
los equilibrios de Nash en este tipo de estrategias es un asunto complicado.
En el captulo, examinamos varios metodos, unos adecuados a juegos de
formas especiales, otros generales. En particular, estudiamos el algoritmo de
juego cticio que acabamos de esbozar. Justicamos dichos metodos, tanto
intuitivamente, como te oricamente.
194
Mezclando y Jugando en el largo Plazo 195
Aunque en la mayor parte del captulo se adopta el enfoque que po-
dramos llamar est atico de las estrategias mixtas, conviene no olvidar el in-
teres que tienen estas estrategias para trabajar la problem atica de conictos
que no ocurren solo una vez, sino que se repiten a lo largo del tiempo, o por
conjuntos diversos de oponentes, en un mismo periodo. Esta problem atica
la abordaremos en los captulos 7 y 8 del texto.
5.2. Estrategias Mixtas y Pago Esperado
Para estudiar la combinaci on o mezcla de estrategias puras ya sea en una
ocasi on o en el largo plazo, a la manera de las que hemos estado hablando
en la secci on anterior, introducimos la siguiente denici on:
Denici on 5.2.1. Dado el juego
_
N, D
j

jN
,
_
nito, decimos que
X
j
R
l
j
es una estrategia mixta del jugador j, si para toda
j
D
j
,
x
j

j
0y

j
D
j
x
j

j
= 1. El entero l
j
denota el n umero de estrategias puras
del jugador j.
En una estrategia mixta X
j
del jugador j, x
j

j
se interpreta como el peso
o probabilidad que el jugador j le asigna a su estrategia
j
.
La letra M
j
denotar a al conjunto de estrategias mixtas del jugador j y
M al producto cartesiano de los conjuntos M
j
. A cada elemento de M le
llamaremos un perl de estrategias mixtas.
Como las estrategias mixtas de un jugador son pesos, o distribuciones
de probabilidad, asignados a sus estrategias puras, podemos considerar, en
particular, las de la forma x
j
e
j
= 1, para alguna
j
y x
j

j
= 0, para toda

j
,=
j
. Dichas estrategias corresponden a las estrategias puras, pues le
est an dando todo el peso a una de estas. Por lo que usaremos la notaci on
j
tanto para la estrategia pura, como para la mixta correspondiente y en el
contexto se entender a si la estamos abordando como estrategia pura o como
mixta.
Si consideramos un perl de estrategias mixtas X =
_
X
1
, X
2
, ..., X
n
_
y

X
j
M
j
, la notaci on
_
X

X
j
_
tiene el mismo signicado que en el primer
captulo. Es decir,
_
X

X
j
_
=
_
X
1
, X
2
, ..., X
j1
,

X
j
, X
j+1
, ..., X
n
_
. En mu-
chos textos el lector encontrar a
_

X
j
, X
j
_
con el mismo signicado.
En la secci on anterior, para motivar la denici on de estrategia mixta,
seguimos la idea de las frecuencias relativas con que un jugador j est a us-
ando cada una de sus estrategias puras en un conicto que se repite a lo
195
196 Estrategias Mixtas
largo del tiempo. Claramente dichos vectores de frecuencias relativas, deter-
minados por la actuaci on de jugadores que s olo utilizan estrategias puras
a lo largo del tiempo, son ejemplos de estrategias mixtas. Las otras ideas
que se mencionaron en dicha secci on, tambien se pueden expresar con es-
trategias mixtas. Es decir, se pueden dar otras interpretaciones posibles
a las estrategias mixtas de un jugador, pensemos, como sugeramos en la
secci on anterior, en una gran poblaci on K, cuyos miembros se enfrentan
simult aneamente en una gran cantidad de partidas del conicto repre-
sentado por el juego
_
N, D
j

jN
,
_
. Supongamos, adem as, que dicha
poblaci on est a dividida en n subconjuntos no vacos y ajenos, K
1
, K
2
, ...,
K
n
, k
j
= #K
j
, n = #N. Pensemos que en cada partida, participa, en el
papel del jugador j, uno de los elementos de K
j
, cada uno de estos tiene
la misma probabilidad de ocupar dicho papel en cada una de las partidas
y que cada k
j
es grande. Supongamos que, para cada j N, cada una de
las personas de la poblaci on K
j
escoge una de las estrategias puras del ju-
gador j, para usarla en caso de ser elegido para participar en algunas de
las partidas. Denotemos como k
j
_

j
i
_
al n umero de personas de K
j
que
se inclinaron por
j
i
, entonces
_
k
j
(
j
1
)
k
j
,
k
j
(
j
2
)
k
j
, ...,
k
j

j
l
j

k
j
_
es una estrategia
mixta del jugador j que se puede interpretar como la conducta que la parte
K
j
de la poblaci on adopta en el periodo en cuesti on. Es decir, una estrate-
gia mixta estara expresando la conducta de una subpoblaci on completa,
no de una persona. Un perl de este tipo de estrategias puede servir para
representar un patr on de conducta de la poblaci on K.
Con esta idea obtendramos para los jugadores solo estrategias mixtas
con coordenadas racionales. Sin embargo, tambien se puede pensar, como
es com un hacerlo, cuando el n umero de elementos de una poblaci on es muy
grande, en la parte de la poblaci on de cada conjunto que ha escogido cada
una de las estrategias y, de esta manera, darle sentido a todas las compo-
nentes reales de una estrategia mixta. Con esta interpretaci on de las estrate-
gias mixtas se han desarrollado, en a nos recientes, interesantes ideas sobre
las leyes de comportamiento de poblaciones humanas y de animales, a traves
de los llamados juegos evolutivos.
En estas dos interpretaciones de las estrategias mixtas se concibe que
hay repetici on del juego, ya sea en un sentido vertical, es decir una sola
persona que interviene en un conicto a lo largo del tiempo, o en uno hori-
zontal, muchos individuos de una gran poblaci on que tienen enfrentamien-
tos simult aneos con individuos de otras poblaciones. En ambos contextos,
196
Mezclando y Jugando en el largo Plazo 197
las decisiones que realmente toman las personas son estrategias puras y
las estrategias mixtas surgen como resultado de la repetici on. Pero, como
decamos anteriormente para muchos problemas, puede tener interes pensar
a las estrategias mixtas como decisiones de un solo individuo en una sola
ocasi on. Volvamos, para ejemplicar, como adelant abamos en la secci on 4.1,
al monopolio M, a su competidor C y a sus estrategias mixtas respectivas.
Imaginemos que ellos se enfrentar an una sola vez en la vida, c omo darle
sentido a dichas estrategias? Podramos proceder de la manera siguiente,
suponer que el monopolista M tiene q pesos para hacerle publicidad a su
producto. Al considerar los metodos de promoci on, con el tratamiento de
las estrategias puras, s olo le damos oportunidad a M de que escoja una
de las 3 opciones para invertir los q pesos y no puede invertir nada en los
dem as metodos. Con las estrategias mixtas introducimos, como elecciones
posibles, el invertir una parte, por ejemplo la
14
35
, del capital en ese primer
metodo, para el segundo usar la
15
35
parte, dejando para el tercero la
6
35
parte. An alogamente C puede partir su capital de tal manera que una parte
la usar a para competir, es decir para entrar al mercado, por ejemplo la
3
5
,
mientras que el resto,
2
5
del capital, la guardar a en el banco, es decir esa
parte no entrar a al mercado. Entonces, podemos decir que, en un momento
dado, el monopolio juega con la estrategia mixta
_
14
35
,
15
35
,
6
35
_
, mientras que
C lo hace con
_
3
5
,
2
5
_
.
Ya tenemos el concepto de estrategia mixta, es decir una elecci on que
mezcla las decisiones b asicas. Necesitamos, ahora, un concepto de pago aso-
ciado a este tipo de elecciones.
Denici on 5.2.2. La funci on de pago esperado del juego
_
N, D
j

jN
,
_
es la funci on E: M R
n
denida como:
E
_
X
1
, X
2
, ..., X
n
_
=

(
1
,
2
,...,
n
)D
x
1

1
x
2

2
...x
n

n
_

1
,
2
, ...,
n
_
.
Para cada jugador j, denotamos como E
j
a la funci on de pago esperado
del jugador j. Las funciones E
j
son las funciones componentes de E.
As, en el ejemplo de las empresas que est abamos examinando, si pen-
samos que el Monopolio y el Competidor escogen las estrategias mixtas
_
2
5
,
3
7
,
6
35
_
y
_
3
8
,
5
8
_
, respectivamente, entonces el pago esperado correspon-
diente es
E
__
2
5
,
3
7
,
6
35
_
,
_
3
8
,
5
8
__
=
197
198 Estrategias Mixtas
_
2
5

3
8
_
(35, 25) +
_
2
5

5
8
_
(80, 0) +
_
3
7

3
8
_
(30, 10) +
_
3
7

5
8
_
(60, 0)+
_
6
35

3
8
_
(40, 10)+
_
6
35

5
8
_
(50, 0) =
_
1514
28
,
132
28
_
.
Es f acil demostrar que
E
_
X
1
, X
2
, ..., X
n
_
=

1
D
1

2
D
2
...

n
Dn
x
1

1
x
2

2
...x
n

n
_

1
,
2
, ...,
n
_
.
La siguiente proposici on tendr a gran utilidad tecnica. Recordemos que

j
puede signicar la estrategia pura que tiene ese smbolo o la estrategia
mixta que le da probabilidad 1 a
j
.
Proposici on 5.2.3.
a) Si X =
_
X
1
, X
2
, ..., X
n
_
M, entonces, para toda
_

1
,
2
, ...,
n
_
D, x
n

nx
n1

n1
...x
2

2
x
1

1
0 y

(
1
,
2
,...,
n
)D
x
n

nx
n1

n1
...x
2

2
x
1

1
= 1 .
Es decir, X determina una distribuci on de probabilidad en D.
b) Para toda X
j
M
j
, E
j
_
X

X
j
_
=

j
D
j
x
j

j
E
j
_
X

j
_
.
c) E
_

1
,
2
, ...,
n
_
=
_

1
,
2
, ...,
n
_
.
Demostraci on. a) Sea X =
_
X
1
, X
2
, ..., X
n
_
M. Claramente
x
n

nx
n1

n1
...x
2

2
x
1

1
0, para toda
_

1
,
2
, ...,
n
_
D.
Por otro lado,

(
1
,
2
,...,
n
)D
x
n

nx
n1

n1
...x
2

2
x
1

1
=

n
Dn

n1
D
n1
...

2
D
2

1
D
1
x
n

nx
n1

n1
...x
2

2
x
1

1
=

n
Dn

n1
D
n1
...

2
D
2
x
n

nx
n1

n1
...x
2

1
D
1
x
1

1
=

n
Dn

n1
D
n1
...

2
D
2
x
n

nx
n1

n1
...x
2

2
.
198
Mezclando y Jugando en el largo Plazo 199
Por inducci on se demuestra que

(
1
,
2
,...,
n
)D
x
n

nx
n1

n1
...x
2

2
x
1

1
=

(
1
,
2
,...,
n
)D

n1
D
n1
x
n

nx
n1

n1
y

(
1
,
2
,...,
n
)D

n1
D
n1
x
n

nx
n1

n1
=

n
Dn
x
n

n1
D
n1
x
n1

n
1
=

n
Dn
x
n

n = 1.
b) Sea

X
j
M
j
y X =
_
X
1
, X
2
, ...,

X
j
, ..., X
n
_
M. Entonces
E
j
_
X

X
j
_
=

(
1
,
2
,...,
n
)D
x
n

nx
n1

n1
... x
j

j
...x
2

2
x
1

j
_

1
,
2
, ...,
n
_
=

n
Dn

n1
D
n1
...

2
D
2

1
D
1
x
n

nx
n1

n1
... x
j

j
...x
2

2
x
1

j
_

1
,
2
, ...,
n
_
=

j
D
j

n
Dn
...

1
D
1
x
n

nx
n1

n1
... x
j

j
...x
2

2
x
1

j
_

1
,
2
, ...,
n
_
=

j
D
j
x
j

n
Dn
...

1
D
1
x
n

nx
n1

n1
...x
j+1

j+1
x
j1

j1
...x
2

2
x
1

j
_

1
,
2
, ...,
n
_
=

j
D
j
x
j

j
E
j
_
X

j
_
.
c) Sea
_

1
,
2
, ...,
n
_
D.
E
_

1
,
2
, ...,
n
_
=
(
1
,
2
,...,
n
)D

1

1
2

2...
n

n
_

1
,
2
, ...,
n
_
.
Para toda j N,
j

j
=
_
0 si
j
,=
j
,
1 si
j
=
j
.
Es decir,
1

1
2

2...
n

n =
_
0 si
k
,=
k
para alg un jugador k,
1 si
j
=
j
para todo jugador j.
Entonces, E
_

1
,
2
, ...,
n
_
=
_

1
,
2
, ...,
n
_
.
5.3. Respondiendo a perles mixtos
En la primera secci on de este capitulo, suponamos que los jugadores da-
ban una buena respuesta a las llamadas estrategias de frecuencias relativas
en terminos de sus estrategias puras. En cualquier contexto de interpretaci on
de las estrategias mixtas tiene interes esta forma de responder. Podemos
formalizar la idea de la manera siguiente:
Denici on 5.3.1. Dado X M,
j
es una mejor respuesta pura del jugador
j al perl X, si
m ax

j
D
j
E
j
_
X

j
_
= E
j
_
X


j
_
.
199
200 Estrategias Mixtas
Decimos que la estrategia pura
j
es una mejor respuesta estricta del jugador
j a X si es una mejor respuesta pura de j a X y E
j
_
X


j
_
> E
j
(X).
Denotaremos como R
j
(X) al conjunto de mejores respuestas puras del
jugador j al perl de estrategias mixtas X.
Proposici on 5.3.2. Sea el juego
_
N, D
j

jN
,
_
y X un perl de es-
trategias mixtas, entonces:
a) R
j
(X) no es vaco.
b) El conjunto de mejores respuestas estrictas de un jugador a un perl
de estrategias mixtas puede ser vaco.
c) Si
j
es una mejor respuesta de j al perl X, entonces
E
j
_
X


j
_
E
j
(X) .
Demostraci on. a) Consideramos el conjunto

P
j
(X) =
_
a R

a = E
j
_
X

j
_
para alguna
j
D
j
_
.
El conjunto

P
j
(X) es nito y, por lo tanto, contiene un elemento a que es
el m aximo de todos sus elementos. Sea
j
D
j
tal que E
j
_
X


j
_
= a,
entonces
j
es una mejor respuesta de j a X y R
j
(X) no es vaco.
b) Consideremos el juego del volado, es decir,
aguila sol
aguila
sol
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
Si X
1
es la estrategia mixta
_
1
2
,
1
2
_
del jugador 1, entonces E
1
__
1
2
,
1
2
_
,
2
_
es cero para toda
2
D
2
. Es decir, D
2
= R
2
_
(
1
2
,
1
2
), X
2
_
con X
2
M
2
.
Pero como no existe ninguna estrategia pura del jugador 2 que le otorgue un
pago esperado mayor que cero cuando el jugador 1 elige
_
1
2
,
1
2
_
, entonces el
conjunto de mejores respuestas puras estrictas de 2 a
_
(
1
2
,
1
2
), X
2
_
es vaco.
c) Si
j
es una mejor respuesta de j al perl X, entonces, para toda
j
en D
j
, E
j
_
X


j
_
E
j
_
X

j
_
. Por lo tanto, para toda
j
,
x
j

j
E
j
_
X


j
_
x
j

j
E
j
_
X

j
_
,
donde x
j

j
es la coordenada de X
j
correspondiente a
j
.
Es decir,

j
D
j
x
j

j
E
j
_
X


j
_

j
D
j
x
j

j
E
j
_
X

j
_
.
200
Mezclando y Jugando en el largo Plazo 201
Pero

j
D
j
x
j

j
E
j
_
X


j
_
= E
j
_
X


j
_
y

j
D
j
x
j

j
E
j
_
X

j
_
= E
j
(X) ,
por lo que
E
j
_
X


j
_
E
j
(X) .
El procedimiento con el que introdujimos las estrategias mixtas en la
secci on 5.1 se llama algoritmo de juego cticio. Con este se busca estudiar las
tendencias de comportamiento de los jugadores, expresando la experiencia
que se tiene de dicho comportamiento, a traves de ciertas estrategias mixtas,
las estrategias mixtas de frecuencias. Los jugadores reaccionan frente a tales
estrategias eligiendo mejores respuestas puras. Este algoritmo, en su forma
original, no es bueno desde el punto de vista numerico, pues no converge
f acilmente. Sin embargo, debido a la forma tan adecuada en que simula una
forma muy razonable de actuar de los jugadores no s olo ha inspirado nuevos
algoritmos, estos s muy buenos, sino que ha jugado un papel muy interesante
en el estudio del establecimiento de patrones de conducta sociales, a partir
de las conductas individuales. Por lo pronto, precisemos en que consiste su
forma original y en otros captulos desarrollaremos el otro tipo de ideas.
Algoritmo 3. de Juego Ficticio. Supongamos que un juego
_
N, D
j

jN
,
_
se repite durante los periodos t = 1, 2, . . .
a). Cada jugador escoge una estrategia pura cualquiera, en el primer pe-
riodo. Si j escogi o
j
(1), construimos X (1) M, X (1) =
_
X
1
(1) , ..., X
n
(1)
_
,
donde X
j
(1) = (0, ..., 0, 1, 0, .., 0), con el unico 1 en la coordenada que co-
rresponde a
j
(1).
b). Si ning un jugador j tiene estrategias puras de mejor respuesta estricta
a X (1), entonces el algoritmo termina con X(1).
c). Si algunos jugadores (k) tienen mejores respuestas estrictas a X (1),
para t = 2, cada uno de ellos escoge una de dichas estrategias para el periodo
2,
k
(2).
Los jugadores k que no tienen mejores respuestas estrictas eligen
k
(2)
en R
k
(X(1)), de tal manera que si
k
(1) R
k
(X(1)), entonces
k
(2) =

k
(1) (Hip otesis de inercia).
201
202 Estrategias Mixtas
Para cada jugador i, sea n
i

i
l
(2) el n umero de veces que el jugador i ha
elegido
i
l
en los periodos 1 y 2, y denimos
X
i
(2) =
_
_
n
i

i
1
(2)
2
,
n
i

i
2
(2)
2
, ...,
n
i

i
l
i
(2)
2
_
_
y
X (2) =
_
X
1
(2) , X
2
(2) , ..., X
n
(2)
_
.
d). Supongamos que, para t = m, hemos construido
X (m) =
_
X
1
(m) , X
2
(m) , ..., X
n
(m)
_
.
Si ning un jugador j tiene mejores respuestas estrictas a X (m), el algo-
ritmo termina con X(m).
e). Si algunos jugadores k tienen mejores respuestas estrictas a X (m),
para t = m+ 1, cada uno de ellos escoge una de ellas como
k
(m+ 1).
Los jugadores k que no tienen mejores respuestas estrictas a X (m) eligen

k
(m+ 1) R
k
(X(m)), de tal manera que si
k
(m) R
k
(X(m)), entonces

k
(m+ 1) =
k
(m) (Hip otesis de inercia).
Para cada jugador i, sea n
i

i
l
(m+ 1) el n umero de veces que el jugador
i ha elegido
i
l
en los periodos t = 1, 2, .., m + 1 y denimos
X
i
(m+ 1) =
_
_
n
i

i
1
(m+ 1)
m+ 1
,
n
i

i
2
(m+ 1)
m+ 1
, ...,
n
i

i
l
i
(m+ 1)
m+ 1
_
_
y
X (m+ 1) =
_
X
1
(m+ 1) , X
2
(m + 1) , ..., X
n
(m+ 1)
_
.
f). Se repiten d, e y f para t = m+ 2.
Con los pasos del algoritmo de juego cticio, se obtienen para t = 1, 2, ...,
estrategias mixtas para cada jugador, con coordenadas racionales y s olo
como lmite del algoritmo se pueden obtener estrategias mixtas que tengan
coordenadas no racionales. El algoritmo no termina siempre; puede, incluso,
no converger, es lento y depende del perl inicial. Sin embargo, adem as de
su interes heurstico, en construir una buena estrategia mixta, tiene como
hemos dicho, un papel importante en la teora y ha dado pie a algoritmos
muy interesantes y ecaces que estudiaremos en el captulo 8. Por ahora,
veamos algunos ejemplos del funcionamiento del algoritmo original.
202
Mezclando y Jugando en el largo Plazo 203
En algunos juegos, como los simetricos 2 2, el algoritmo funciona bas-
tante bien, sin dejar de depender del perl inicial. Veamos primero el ejemplo
?? c).
cort es descort es
cort es
descort es
_
(1, 1) (0, 2)
(2, 0) (5, 5)
_
Los equilibrios en estrategias puras son
(cort es, descort es) y (descort es, cort es).
Si empez aramos el algoritmo, con uno de ellos, este terminara de inmediato
con dicho equilibrio. Empecemos, pues, con uno de los otros dos perles, por
ejemplo (cort es, cort es).
periodo I X
I
(t) II X
II
(t)
t = 1 cort es (1, 0) cort es (1, 0)
t = 2 descort es
_
1
2
,
1
2
_
descort es
_
1
2
,
1
2
_
t = 3 cort es
_
2
3
,
1
3
_
cort es
_
2
3
,
1
3
_
t = 4 descort es
_
1
2
,
1
2
_
descort es
_
1
2
,
1
2
_
t = 5 cort es
_
3
5
,
2
5
_
cort es
_
3
5
,
2
5
_
t = 6 cort es
_
4
6
,
2
6
_
cort es
_
4
6
,
2
6
_
t = 7 descort es
_
4
7
,
3
7
_
descort es
_
4
7
,
3
7
_
t = 8 cort es
_
5
8
,
3
8
_
cort es
_
5
8
,
3
8
_
El algoritmo termina con el perl X (8) =
__
5
8
,
3
8
_
,
_
5
8
,
3
8
__
, pues ninguno
de los dos jugadores tiene mejores respuestas estrictas a X (8). En dicho
perl, los dos vecinos tienen un pago esperado de
5
8
.
Pensemos, ahora, en el ejemplo ?? b) de los dos pases petroleros, cuya
matriz de pagos es:
reducir no reducir
reducir
no reducir
_
(2, 2) (2, 1)
(1, 2) (0, 0)
_
Los equilibrios de Nash en estrategias puras de este juego son (reducir,
reducir) y (no reducir, no reducir). Si iniciamos el algoritmo con alguno
de estos equilibrios, como es natural, este terminara desde el inicio, con el
equilibrio en cuesti on. En cambio, si iniciamos con (R, NR), obtendramos
la tabla siguiente:
203
204 Estrategias Mixtas
periodo I X
I
(t) II X
II
(t)
t = 1 reducir (1, 0) no reducir (0, 1)
t = 2 no reducir
_
1
2
,
1
2
_
reducir
_
1
2
,
1
2
_
t = 3 no reducir
_
1
3
,
2
3
_
no reducir
_
1
3
,
2
3
_
t = 4 no reducir
_
1
4
,
3
4
_
no reducir
_
1
4
,
3
4
_
t = 5 no reducir
_
1
5
,
4
5
_
no reducir
_
1
5
,
4
5
_
t = 6 no reducir
_
1
6
,
5
6
_
no reducir
_
1
6
,
5
6
_
t = 7 no reducir
_
1
7
,
6
7
_
no reducir
_
1
7
,
6
7
_
t = 8 no reducir
_
1
8
,
7
8
_
no reducir
_
1
8
,
7
8
_
...
t = 20 no reducir
_
1
20
,
19
20
_
no reducir
_
1
20
,
19
20
_
El algoritmo converge a ((0, 1), (0, 1)) que representa el perl (NR, NR),
pero nunca lo alcanza, pues aunque cada uno de ellos solo ha escogido una
vez la estrategia R, no es posible desaparecer su presencia m as que en el
lmite, al que nunca se llega. En el periodo t, cada uno de los jugadores gana
1
t
que tiende a cero, el pago en el equilibrio de Nash (ep) (NR, NR), cuando
t .
Sin embargo, c omo decamos antes, no en todo juego el algoritmo se
comporta bien. Examinamos el juego del volado en la siguiente tabla:
periodo I X
I
(t) II X
II
(t)
t =1 aguila (1, 0) aguila (1, 0)
t =2 sol
_
1
2
,
1
2
_
aguila (1, 0)
t =3 sol
_
1
3
,
2
3
_
aguila (1, 0)
t =4 sol
_
1
4
,
3
4
_
sol
_
3
4
,
1
4
_
t =5 sol
_
1
5
,
4
5
_
sol
_
3
5
,
2
5
_
t = 6 sol
_
1
6
,
5
6
_
sol
_
1
2
,
1
2
_
t = 7 sol
_
1
7
,
6
7
_
sol
_
3
7
,
4
7
_
t = 8 aguila
_
2
8
,
6
8
_
sol
_
3
8
,
5
8
_
t = 9 aguila
_
3
9
,
6
9
_
sol
_
3
9
,
6
9
_
t = 10 aguila
_
4
10
,
6
10
_
sol
_
3
10
,
7
10
_
Como se puede apreciar, el algoritmo tiene en este ejemplo un mal com-
portamiento. Sin embargo, el procedimiento fue introducido para calcular
equilibrios de Nash en ciertas clases de juegos (Brown [8] y Robinson [45]).
Una variante del algoritmo se estudia en muchos textos como un metodo
para calcular, en un juego nito bipersonal de suma cero, el m aximo ase-
gurable para los dos jugadores y estrategias mixtas conservadoras que como
veremos en el captulo 6 forman equilibrios de Nash. Dicha variante permite
204
Mezclando y Jugando en el largo Plazo 205
calcular equilibrios en los juegos bipersonales de suma cero ya que, para
ellos, cada subsucesi on que se construye con el algoritmo que presentamos
y que converge lo hace a un equilibrio de Nash. A esta caracterstica se le
llamar a la propiedad de juego cticio.
Denici on 5.3.3. Se dice que el juego (N, D
j
, ) tiene la propiedad de
juego cticio si todas las subsucesiones construdas con el algoritmo que
convergen lo hacen a un equilibrio de Nash.
Enunciamos sin demostrar los siguientes resultados.
Teorema 5.3.4. a) (Robinson [45]) Cada juego bipersonal de suma cero
nito tiene la propiedad de juego cticio.
b) (Monderer y Shapley [37]) Cada juego 2 2 no degenerado tiene la
propiedad de juego cticio.
No siempre es lo mejor y m as realista trabajar con las mejores respuestas
puras, recordemos el ejemplo 1.3.3 c, pero interpretado, ahora, como los dos
individuos, el monopolista y su competidor potencial, que eligen en cada
ocasi on en la que se enfrentan, cual ser a la parte de su capital respectivo,
que invertir an en cada una de sus opciones. Dado un perl de estrategias
mixtas, es decir una partici on de los capitales entre las elecciones de cada
uno, no tiene porque interesarles mucho dar una mejor respuesta pura al
perl que se ha establecido en el periodo, pues eso los limita a responder
con inversiones en una sola de las opciones. En este y otros muchos juegos y
en diversos contextos nos interesara el concepto de mejor respuesta mixta.
Mejores respuestas mixtas
Denici on 5.3.5. Dada X M, se dice que

X
j
es una mejor respuesta
mixta del jugador j al perl X, si m ax
X
j
M
j
E
j
_
X

X
j
_
= E
j
_
X

X
j
_
.
Si consideramos que nuestras tan tradas y llevadas empresas han estado
actuando con el perl X =
__
1
3
,
1
3
,
1
3
_
,
_
2
5
,
3
5
__
, entonces (0, 0, 1) es el con-
junto de mejores respuestas puras del Monopolio a X y coincide con el de sus
mejores respuestas mixtas de X. En cambio, para cualquier perl en donde el
Competidor ha actuado con la estrategia mixta
_
5
7
,
2
7
_
, el conjunto de mejores
respuestas mixtas del Monopolio a esos perles es (x, 0, 1 x) [x [0, 1] .
Dado un juego rectangular, para cada jugador j y para cada X M,
denotaremos al conjunto de mejores respuestas mixtas de j a X como:
L
j
(X) =
_

X
j
M
j

m ax
X
j
M
j
E
j
_
X

X
j
_
= E
j
_
X

X
j
_
_
.
205
206 Estrategias Mixtas
Proposici on 5.3.6.
L
j
(X) =
_

X
j
M
j

X
j
=

j
R
j
(X)
y

j
j
con y

j > 0 y

j
R
j
(X)
y

j = 1
_
.
Demostraci on. Sea

X
j
=

j
D
j
x

j
j
, de tal manera que para

j
D
j
R
j
(X) , x
e
j > 0.
Consideremos
j
R
j
(X) y Y
j
M
j
, tales que
Y
j
=

j
D
j
,
j
=e
j
x

j
j
+x
e
j
j
.
Luego, E
j
_
X

j
_
> E
j
_
X


j
_
y, entonces, x
e
j E
j
_
X

j
_
> x
e
j E
j
_
X


j
_
.
Por lo tanto,
x
e
j E
j
_
X

j
_
+

j
D
j
,
j
=e
j
x

j E
j
_
X

j
_
>
x
e
j E
j
_
X


j
_
+

j
D
j
,
j
=e
j
x

j E
j
_
X

j
_
.
Pero
x
e
j E
j
_
X

j
_
+

j
D
j
,
j
=e
j
x

j E
j
_
X

j
_
= E
j
_
X

Y
j
_
y
x
e
j E
j
_
X


j
_

j
D
j
,
j
=e
j
x

j E
j
_
X

j
_
= E
j
_
X

X
j
_
.
O lo que es lo mismo E
j
_
X

Y
j
_
> E
j
_
X

X
j
_
, por lo que,

X
j
no es
una mejor respuesta mixta de j a X.
Es decir,
L
j
(X)
_

X
j
M
j

X
j
=

j
R
j
(X)
y

j
j
, y

j 0 y

j
R
j
(X)
y

j = 1
_
.
Supongamos ahora que

X
j
=

j
R
j
(X)
y

j
j
, y

j 0 y

j
R
j
(X)
y

j = 1.
Entonces, para cualquier
j
D
j
,
E
j
_
X

X
j
_
=

j
R
j
(X)
y

j E
j
_
X

j
_

j
D
j
y

j E
j
_
X

j
_
206
Mezclando y Jugando en el largo Plazo 207
Pero

j
D
j
y

j E
j
_
X

j
_
= E
j
_
X

j
_
.
Sea X
j
cualquier estrategia mixta del jugador j, X
j
=

j
D
j
x

j
j
, en-
tonces, para toda

X
j
M
j
,
E
j
_
X

X
j
_
=

j
D
j
x

j E
j
_
X

X
j
_

j
D
j
x

j E
j
_
X

j
_
= E
j
_
X

X
j
_
.
Es decir,

X
j
L
j
(X) y
L
j
(X)
_

X
j
M
j

X
j
=

j
R
j
(X)
y

j
j
, y

j 0 y

j
R
j
(X)
y

j = 1
_
.
Por lo tanto,
L
j
(X) =
_

X
j
M
j

X
j
=

j
R
j
(X)
y

j
j
, y

j 0 y

j
R
j
(X)
y

j = 1
_
.
Podemos entender a L
j
como una correspondencia denida en el conjunto
de perles de estrategias mixtas de tal manera que L
j
(X) es un subconjunto
de M
j
(L
j
: M M
j
). A L
j
se le llama la correspondencia de mejor
respuesta del jugador j. La gr aca de esta correspondencia es el conjunto
gr (L
j
) =
__
X,

X
j
_
M M
j

X
j
es una mejor respuesta de j a X
_
.
Consideremos
L =
_

X M

j N,

X
j
es una mejor respuesta de j a

X
_
=

jN
gr (L
j
) .
Los perles de L tienen la propiedad de que todos los jugadores est an con-
siderando el conjunto de las mejores respuestas mixtas a las elecciones de
los dem as.
En los juegos 22 podemos estudiar geometricamente dichas correspon-
dencias y algunas gr acas relacionadas a ellas.
5.3.1. Una cruz Gamada para los juegos 2 2
Consideremos un juego bipersonal, con matriz
_
(a
11
, b
11
) (a
12
, b
12
)
(a
21
, b
21
) (a
22
, b
22
)
_
.
207
208 Estrategias Mixtas
Cada estrategia mixta del jugador I es de la forma (x, 1 x), con x [0, 1].
An alogamente las estrategias de II son de la forma (y, 1 y), con y [0, 1].
Pensemos en los perles de estrategias mixtas como puntos del cuadrado
[0, 1] [0, 1].
El punto A en la gura 5.3.1 representa el perl ((x, 1 x), (y, 1 y)).
A(x,y)
Figura 5.3.1:
Con la idea de estudiar las mejores respuestas mixtas a los diversos
perles de estrategias mixtas, podemos observar que las esperanzas de pago
de los jugadores 1 y 2, se pueden escribir respectivamente como:
E
1
((x, 1 x) , (y, 1 y)) =
xy (a
11
) +x(1 y) (a
12
) + (1 x) y (a
21
) + (1 x) (1 y) (a
22
) =
x(y (a
11
a
12
a
21
+a
22
) + (a
12
a
22
)) + (y (a
21
a
22
) +a
22
) .
E
2
((x, 1 x) , (y, 1 y)) =
xy (b
11
) +x(1 y) (b
12
) + (1 x) y (b
21
) + (1 x) (1 y) (b
22
) =
y (x(b
11
b
12
b
21
+b
22
) + (b
21
b
22
)) + ((b
12
b
22
) x +b
22
) .
Sea (( x, 1 x) , ( y, 1 y)). C omo es L
1
(( x, 1 x) , ( y, 1 y))? Pode-
mos notar que la mejor respuesta del jugador 1 a (( x, 1 x) , ( y, 1 y)) de-
pende unicamente del signo de g ( y) = y (a
11
a
12
a
21
+a
22
)+(a
12
a
22
).
Si y es tal que g ( y) > 0, entonces 1 debe elegir x lo m as grande posible
para maximizar su ganancia, es decir debe elegir x = 1 y
L
1
(( x, 1 x) , ( y, 1 y)) = (1, 0) .
208
Mezclando y Jugando en el largo Plazo 209
Si, en cambio, g ( y) < 0, entonces 1 debe elegir x lo m as peque na posible,
es decir, x = 0 y
L
1
(( x, 1 x) , ( y, 1 y)) = (0, 1) .
Por ultimo, si g ( y) = 0, la ganancia de 1 es y (a
21
a
22
)+a
22
, cualquiera
que sea el valor de x. Entonces
L
1
(( x, 1 x) , ( y, 1 y)) = (x, 1 x) [ x [0, 1] = M
1
.
An alogamente la mejor respuesta del jugador 2 a (( x, 1 x) , ( y, 1 y))
depende unicamente del signo de g

( x) = x(b
11
b
12
b
21
+b
22
)+(b
21
b
22
).
Si x es tal que g

( x) > 0, entonces 2 debe elegir y lo m as grande posible


para maximizar su ganancia, es decir, debe elegir y = 1 y
L
2
(( x, 1 x) , ( y, 1 y)) = (1, 0) ,
Si g

( x) < 0, entonces 2 debe elegir y lo m as peque na posible, es decir,


y = 0 y
L
2
(( x, 1 x) , ( y, 1 y)) = (0, 1) .
Por ultimo, si g

( x) = 0, la ganancia de 2 es (b
12
b
22
) x+b
22
, cualquiera
que sea el valor de y. Entonces
L
2
(( x, 1 x) , ( y, 1 y)) = (y, 1 y) [ y [0, 1] = M
2
.
Para representar nuestro problema en el cuadrado [0, 1] [0, 1], estudiemos
la gr aca de L
1
, gr (L
1
) =
(1, y) [ si g (y) > 0(0, y) [ si g (y) < 0(x, y) [ si g (y) =0 y x [0, 1] .
La gr aca de L
2
es an aloga.
Si ( x, y) L = gr (L
1
) gr (L
2
), ninguno de los dos jugadores estara
tentado a buscar una ganancia mayor cambiando los pesos que se est an
otorgando a cada estrategia pura.
Estudiemos el conicto de los hombres contra las mujeres que apareci o en
la secci on 1.1, cuya matriz repetimos a continuaci on:
Borola (B) Chorreada (Ch)
Pepe el Toro (P)
Re gino Burr on (R)
_
(1, 10) (5, 2)
(0, 5) (1, 4)
_
209
210 Estrategias Mixtas
Para cada perl de estrategias mixtas posible, c omo se comportan los
signos de g y g

?
g (y) = y (1 5 0 + 1) + 5 1 = 5y + 4. Es decir,
g (y) > 0 si y <
4
5
,
g (y) < 0 si y >
4
5
y
g (y) = 0 si y =
4
5
Tenemos que
gr (L
1
) =
_
(1, y)

con y <
4
5
_

_
(0, y)

con y >
4
5
_

__
x,
4
5
_
[ x [0, 1]
_
.
La gr aca gr (L
1
) se representa en la gura 5.3.2a.
gr(L )
1
Figura 5.3.2a:
Por otro lado, g

(x) = x(10 2 5 + 4) +(5 4) = 13x +1. Luego,


g

(x) > 0 x <


1
13
,
g

(x) < 0 x >


1
13
y
g

(x) = 0 x =
1
13
De aqu se sigue que gr (L
2
) =
_
(x, 1)

con x <
1
13
_

_
(x, 0)

con x >
1
13
_

__
1
13
, y
_
[ y [0, 1]
_
(gura 5.3.2b). Por lo tanto,
210
Mezclando y Jugando en el largo Plazo 211
gr(L )
2
Figura 5.3.2b:
gr(L )
2
gr(L )
1
Figura 5.3.2c:
L = gr (L
1
) gr (L
2
) =
_
(0, 1) , (1, 0) ,
_
1
13
,
4
5
__
(gura 5.3.2 c)).
Observemos que (0, 1) y (1, 0) corresponden a los perles de estrate-
gias puras (Regino Burr on, Borola) y (Pepe el toro, Chorreada) que son los
equilibrios de Nash en estrategias puras del juego en estudio.
Los conjuntos L =

jN
gr (L
j
) existen para todos los juegos nitos, no
importa cuantos jugadores participen, ni cuantas estrategias puras tenga
cada uno de ellos; el problema se presenta en el manejo de esos conjuntos
en los juegos que no son 2 2.
En la gura 5.3.3, podemos observar, para el juego del volado, gr (L
1
),
gr (L
2
) y L. Entendida en el contexto de los perles de estrategias mixtas L
se puede entender como
___
1
2
,
1
2
_
,
_
1
2
,
1
2
___
.
5.3.2. Las curvas de reacci on
Algunos juegos innitos bipersonales se prestan para usar la misma idea
que la del metodo de la cruz gamada, trabajando directamente con las es-
trategias puras de los jugadores, es decir, sin introducir estrategias mixtas.
Por ejemplo, aquellos juegos innitos de dos personas, en los que los ju-
gadores tienen que elegir, como estrategia, un n umero real y ambos tienen
211
212 Estrategias Mixtas
Figura 5.3.3:
una sola mejor respuesta a cada elecci on del otro.
Construimos una curva de reacci on del jugador I como el conjunto
de parejas de reales (x, y) tales que si II eligi o y, x es la mejor respuesta de
I. Es decir,
_
(x, y) R
2
[ x es la respuesta de I que maximiza su pago dado y
_
sera la curva de reacci on del jugador I. An alogamente,
_
(x, y) R
2
[ y es la respuesta de II que maximiza su pago dado x
_
sera la curva de reacci on del jugador II. Entonces, la intersecci on de las
curvas de reacci on representan perles z

= (x

, y

) en los que cada jugador


est a eligiendo una mejor respuesta a z

.
Pensemos en el duopolio de Cournot (ejemplo 1.6.3). Cada uno de los
dos jugadores tiene que elegir q R
+
, la cantidad que piensa producir. Las
curvas de reacci on son de la forma:
Para el jugador 1, (q
1
, q

2
) [ 2q
1
+ (d q

2
c) = 0.
Para el jugador 2, (q

1
, q
2
) [ 2q
2
+ (d q

1
c) = 0.
La intersecci on de las curvas (gura 5.3.4) es el conjunto:
_
(q
1
, q
2
) [ 2q
1
+ (d q
2
c) = 0 y
2q
2
+ (d q
1
c) = 0
_
= 1/3 ((d c) , (d c)).
La correspondencia de mejor respuesta
Llamamos correspondencia de mejor respuesta a aquella que asocia, a ca-
da perl, el conjunto de perles de mejores respuestas de todos los jugadores
al perl dado, es decir,
212
Mezclando y Jugando en el largo Plazo 213
1/2(dc)
1/3(dc) 1/2(dc) (dc)
(dc)
1/3(dc)
Figura 5.3.4:
L : M M, denida como L(X) =
_

X M

X
j
L
j
(X)
_
.
Un concepto importante para esta correspondencia es el de punto jo.
Diremos que X

es punto jo de L, si X

L(X

). En el juego del vola-


do, el unico punto jo de L es ((1/2, 1/2), (1/2, 1/2)), mientras que en el
juego de los hombres contra las mujeres el conjunto de puntos jos de L es
_
((0, 1) , (1, 0)) , ((1, 0) , (0, 1)) ,
__
1
13
,
12
13
_
,
_
4
5
,
1
5
___
. Con el metodo de la cruz
gamada se pueden calcular dichos conjuntos para los juegos 2 2.
Denotemos como L al conjunto de puntos jos de la correspondencia L.
No suele ser f acil encontrar los puntos jos de una funci on ni los de una
correspondencia.
Resulta evidente de la denici on de equilibrio de Nash en estrategias
puras que el conjunto de todos estos equilibrios est a contenido en el conjunto
de puntos jos de la correspondencia L. En la secci on 5.5, generalizaremos,
en forma natural, el concepto de equilibrio de Nash al contexto de estrategias
mixtas y demostraremos que el conjunto de dichos equilibrios es el conjunto
de puntos jos de L.
Los conceptos son v alidos e interesantes, adecuadamente denidos, en los
juegos innitos, a un en aquellos en los que no es necesario utilizar estrategias
mixtas que son los unicos juegos innitos tratados en este texto. Es claro
que las curvas de reacci on se basan en este tipo de ideas.
La funci on de reajuste de Nash
Los jugadores que se est an enfrentando repetidamente en un conicto
usando estrategias mixtas pueden preferir cambiar m as lentamente dichas
213
214 Estrategias Mixtas
estrategias, en lugar de abandonar bruscamente los pesos (probabilidades)
que estaban utilizando, en aras de dar una mejor respuesta, sea pura o
mixta. Es decir, pueden conformarse con elegir nuevas estrategias mixtas que
les permitan mejorar, quiz a no lo m as posible, su esperanza de pago, pero
evitando caer en ciclos o procesos que parecieran no tener una tendencia
clara. La funci on construida por Nash tiene la caracterstica de reajustar
los pesos asignados a cada estrategia pura
j
de cualquier jugador j, de
acuerdo a que tan buena demostr o ser, en el sentido de la cantidad en que

j
hubiera incrementado el pago esperado, en el caso de que j la hubiera
usado, respecto al perl de estrategias mixtas que se estaba usando por todos
los jugadores.
Precisando, la funci on utilizada por Nash es T : M M, denida como
T (X) =

X, donde
x
j

j
=
x
j

j
+c
j

j
(X)
1 +

j
D
j
c
j

j
(X)
y
c
j

j
(X) = m ax
_
E
j
_
X

j
_
E
j
(X) , 0
_
.
Aunque el n umero que el jugador j le asocia a su estrategia
j
, c
j

j
(X),
depende del perl X al que se est a enfrentando, de aqu en adelante usaremos
la notaci on c
j

j
, para referirnos a el, para simplicar la notaci on.
Es claro que

X est a en M, pues para toda j y toda
j
D
j
, x
j

j
0 y

j
D
j
x
j

j
=

j
D
j
x
j

j
+c
j

j
1 +

j
D
j
c
j

j
=
1
1 +

j
D
j
c
j

j
D
j
_
x
j

j
+c
j

j
_
=

j
D
j
x
j

j
+

j
D
j
c
j

j
1 +

j
D
j
c
j

j
=
1 +

j
D
j
c
j

j
1 +

j
D
j
c
j

j
= 1.
Los jugadores de un juego rectangular (N, D
j

jN
, ) pueden llevar a
cabo un proceso an alogo al de juego cticio, pero en lugar de ir corrigiendo
sus estrategias mixtas del periodo anterior con una mejor respuesta, reajus-
tarlas con la funci on de Nash. Y buscando cual es el resultado nal de este
nuevo algoritmo, si es que dicho algoritmo termina. Es claro que X

es un
perl de terminaci on si y solo si X

es un punto jo de T, es decir si T (X

)
es X

. Podremos asegurar que la funci on T tiene puntos jos, pero no que


el algoritmo que acabamos de describir converja.
214
Mezclando y Jugando en el largo Plazo 215
La tabla siguiente, est a desarrollada sobre la base del juego de las em-
presas (1.3.3), con matriz
entrar no entrar
regalar
prensa
radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(45, 10) (50, 0)
_
_
El unico punto jo de T en este juego es ((5/7, 0, 2/7), (2/7, 5/7)). Pero,
el algoritmo de reajustar periodo a periodo no converge. Veamos el mal
comportamiento de sus 3 primeros pasos:
t
_
x
1
1
, x
1
2
, x
1
3
_ _
x
2
1
, x
2
2
_ _
c
1
1
, c
1
2
, c
1
3
_ _
c
2
1
, c
2
2
_
1 (1, 0, 0) (1, 0) (0, 0, 10) (0, 0)
2
_
1
11
, 0,
10
11
_
(1, 0)
_
0, 0,
10
11
_ _
0,
75
11
_
3
_
1
21
, 0,
20
21
_ _
11
86
,
75
86
_ _
21 400
903
,
10 145
1806
, 0
_ _
0,
275
258
_
En el periodo 4,
_
x
1
1
, x
1
2
, x
1
3
_
=
_
42 886
54 751
,
10 145
54 751
,
1720
54 751
_
y
_
x
2
1
, x
2
2
_
=
_
33
533
,
500
533
_
.
Mientras que
_
c
1
1
, c
1
2
, c
1
3
_
=
_
128 356 325
29 182 283
, 0, 0
_
y
_
c
2
1
, c
2
2
_
=
_
578 200 000
29 182 283
, 0
_
.
En el periodo 5,
_
x
1
1
, x
1
2
, x
1
3
_
=
_
151 214 563
157 538 608
,
5407 285
157 538 608
,
114 595
19 692 326
_
y
_
x
2
1
, x
2
2
_
=
_
580 006 783
607 382 283
,
27 375 500
607 382 283
_
.
Son pocos los pasos que contiene la tabla, pero en ella se puede apreciar
la dicultad del procedimiento. En la tabla construida para el juego del
volado, bajo el supuesto de que los jugadores empiezan, ambos, eligiendo
la estrategia pura aguila, los primeros 5 pasos muestran, tambien, un mal
comportamiento.
_
x
1
1
, x
1
2
_ _
x
2
1
, x
2
2
_ _
c
1
1
, c
1
2
_ _
c
2
1
, c
2
2
_
Periodo 1 (1, 0) (1, 0) (0, 2) (0, 0)
Periodo 2
_
1
3
,
2
3
_
(1, 0)
_
0,
2
3
_ _
0,
2
3
_
Periodo 3
_
1
5
,
4
5
_ _
3
5
,
2
5
_ _
0,
2
25
_ _
0,
18
25
_
Periodo 4
_
5
27
,
22
27
_ _
15
43
,
28
43
_ _
572
1161
, 0
_ _
(0,
34
27
)
_
Periodo 5
_
787
1733
,
946
1733
_ _
405
2623
,
2218
2623
_
215
216 Estrategias Mixtas
Parece, entonces, una perdida de tiempo esta funci on de reajuste de
Nash. En la secci on 5.6 veremos que esto no es as. La funci on T no respon-
de a las expectativas intuitivas que podra despertar, en el sentido de que
pareciera una forma adecuada de cambiar los pesos asignados a las estrate-
gias, de acuerdo a su comportamiento frente a las estrategias utilizadas por
los otros jugadores y llegar as a una soluci on del juego. Sin embargo, resulta
que es la clave para la demostraci on del teorema fundamental (Teorema de
Nash) de los juegos no cooperativos nitos que establece que siempre existe
al menos un equilibrio de Nash en estrategias mixtas. Denimos en la sec-
ci on siguiente ese nuevo equilibrio y, adem as, establecemos la relaci on entre
este y los conceptos que hemos trabajado en esta secci on. La demostraci on
del teorema de existencia aparece al nal del captulo.
5.4. Equilibrio de Nash en Estrategias Mixtas
Al introducir las estrategias mixtas y la funci on de pago esperado para
un juego nito (N, D
j

jN
, ), hemos construido otro juego rectangular,
este innito. Podemos adoptar, para el nuevo juego, el enfoque an alogo al
del captulo 1. Cada jugador elige una estrategia mixta y con ello queda
determinado un pago esperado para cada uno, es decir volveramos a pensar
en un juego rectangular, ahora (N, M
j

jN
, E) que se lleva a cabo en una
unica ocasi on. Podemos, entonces, denir los mismos conceptos que en el
captulo 1, especialmente el de equilibrio de Nash en estrategias mixtas que
es el concepto de soluci on de los juegos no cooperativos. En este caso, dado
que el juego es innito, hay que justicar la validez de los conceptos. Por
otro lado, relacionaremos los equilibrios de Nash en estrategias mixtas con
las ideas aparecidas en la secci on anterior.
Como ejemplicamos en la secci on 5.2, no siempre hay una din amica en-
vuelta en el concepto de estrategia mixta. En algunos juegos la interpretaci on
de este concepto es completamente natural como una decisi on posible para
cada ocasi on que se realiza el juego. Recordemos el juego de concurrencia
o ventanillas, donde los jugadores son trabajadores que tienen que elegir de
un conjunto nito de ocios posibles, aquel al que se dedicar an. Los diver-
sos ocios son las estrategias puras del juego, pero es v alido imaginar una
situaci on en donde un trabajador decide dedicar diversas partes del tiempo
que dura su jornada a ocios distintos y no s olo a uno de ellos. Esto sera
una estrategia mixta en el juego de una sola tirada, an alogamente en juegos
en donde los jugadores son empresarios que deben elegir donde invertir su
capital. Ellos podran dividir su inversi on, como en el ejemplo que discu-
216
Mezclando y Jugando en el largo Plazo 217
timos en la secci on 5.2, entre las diversas posibilidades; cada una de estas
divisiones posibles es una estrategia mixta.
El concepto de soluci on en el nuevo juego, (N, M
j

jN
, E), tambien
ser a el de un equilibrio de Nash [38, 40], con la generalizaci on natural de la
denici on 1.2.3.
Denici on 5.4.1. Un perl de estrategias mixtas X

es un equilibrio de
Nash en estrategias mixtas (em), si para cada jugador j en N se cumple:
E
j
(X

) E
j
_
X

X
j
_
para toda X
j
M
j
.
Podemos, entonces, decir que X

es un equilibrio de Nash en estrategias


mixtas (em) si se cumple que, para toda j N,
m ax
X
j
M
j
E
j
_
X

X
j
_
= E
j
_
X

X
j
_
= E
j
(X

) .
Tenemos que contestar varias preguntas para este nuevo acercamiento de
soluci on, como por ejemplo, ahora s tendremos soluci on en cada juego?,
que ocurrir a con los juegos que ya podamos resolver en estrategias puras?,
que relaci on tiene el equilibrio de Nash en estrategias mixtas con los diver-
sos acercamientos intuitivos a una soluci on din amica que hemos estado
tratando en lo que va de este captulo 5?, son generalizables para estrate-
gias mixtas los resultados que obtuvimos para estrategias puras?, tienen
interes en este contexto?
Por lo pronto, establecemos algunas proposiciones que resultan tecnica-
mente utiles en las demostraciones y simplican los c alculos numericos.
Proposici on 5.4.2. a) Sea X

M un equilibrio de Nash (em) y


j
D
j
tal que x
j
b
j
> 0. Entonces E
j
(X

) = E
j
_
X


j
_
.
b) Si, para X M, existe
j
D
j
tal que E
j
_
X


j
_
> E
j
(X), entonces
existe
j
D
j
tal que E
j
_
X

j
_
E
j
(X) y x
j

j
es positivo.
c) Supongamos que existen dos estrategias puras del jugador j,
j
y
j
tales que
j
domina estrictamente a
j
. Sea X

un equilibrio de Nash en
estrategias mixtas tal que X
j
=

j
D
j
x
j

j
, entonces x
j

j
= 0.
d) Sean dos estrategias puras del jugador j,
j
y
j
tales que
j
domina
debilmente a
j
y X

es un equilibrio de Nash en estrategias mixtas, con


X
j
=

j
D
j
x
j

j
. Si X
j
=

j
D
j
,
j
=
j
x
j

j
+x
j

j

j
, entonces X

X
j
es un equilibrio de Nash (em).
217
218 Estrategias Mixtas
Demostraci on. a) Como X

es un equilibrio de Nash (em),


E
j
(X

) E
j
_
X


j
_
.
Supongamos que la desigualdad estricta se cumple, es decir, tendramos
que
E
j
(X

) > E
j
_
X


j
_
y, por lo tanto, x
j
b
j
E
j
(X

) > x
j
b
j
E
j
_
X


j
_
.
De donde

j
D
j
,
j
=b
j
x
j

j
E
j
(X

) +x
j
b
j
E
j
(X

) >

j
D
j
,
j
=b
j
x
j

j
E
j
_
X

[
j
_
+x
j
b
j
E
j
_
X


j
_
.
Pero los dos lados de la desigualdad son iguales a E
j
(X

). Por lo que la
desigualdad es absurda y se cumple que
E
j
(X

) = E
j
_
X


j
_
.
b) Supongamos que X M y
j
D
j
son tales que
E
j
_
X


j
_
> E
j
(X) .
Y que, adem as, para toda
j
D
j
tal que x
j

j
es positivo,
E
j
_
X

j
_
> E
j
(X) .
Tenemos que alguna x
j

j
, tomando en cuenta a x
j
b
j
, es positiva.
Entonces, para toda
j
D
j
, x
j

j
E
j
_
X

j
_
x
j

j
E
j
(X) y para algunas
la desigualdad es estricta. As

j
D
j
x
j

j
E
j
_
X

j
_
>

j
D
j
x
j

j
E
j
(X) .
Pero los dos lados de la desigualdad son iguales a E
j
(X). Por lo que, la
desigualdad es absurda y existe
j
D
j
tal que E
j
_
X

j
_
E
j
(X) y x
j

j
es positivo.
c) Supongamos que existen dos estrategias puras del jugador j,
j
y
j
tales que
j
domina estrictamente a
j
. Sea X

un equilibrio de Nash en
estrategias mixtas y supongamos que X
j
=

j
D
j
x
j

j
, con x
j

j
,= 0.
218
Mezclando y Jugando en el largo Plazo 219
Consideremos
X
j
=

j
D
j
,
j
=
j
x
j

j
+x
j

j

j
.
E
j
_
X

X
j
_
=

j
D
j
,
j
=
j
x
j

j
E
j
_
X

j
_
+x
j

j
E
j
_
X


j
_
=

j
D
j
,
j
=
j
x
j

j
E
j
_
X

j
_
+
x
j

(
1
,
2
,...,
j1
,
j+1
,...,
n
)D
j
x
1

1
...x
j1

j1
x
j+1

j+1
...x
n

n
j
_


j
_
>

j
D
j
,
j
=
j
x
j

j
E
j
_
X

j
_
+x
j

(
1
,
2
,...,
j1

j+1
,...,
n
)D
j
x
1

1
x
2

2
...x
n

n
j
_

j
_
= E
j
(X

) .
Por lo que X

no es equilibrio de Nash (em) contrario a lo que habamos


supuesto, entonces x
j

j
= 0.
Dejamos al lector la demostraci on de d).
Proposici on 5.4.3. El perl de estrategias mixtas X

es un equilibrio de
Nash si y s olo si para toda j N y
j
D
j
, E
j
(X

) E
j
_
X

j
_
.
Demostraci on. Por la denici on de equilibrio de Nash (em), es claro que
si X

es un equilibrio de Nash (em) se cumple que, para todo jugador j,


E
j
(X

) E
j
_
X

j
_
para toda
j
D
j
.
Supongamos, ahora, que para cada j N, E
j
(X

) E
j
_
X

j
_
para
toda
j
D
j
. Sea X
j
una estrategia mixta cualquiera en M
j
. Entonces
X
j
=

j
D
j
x
j

j
para algunos x
j

j
tales que x
j

j
0 para toda
j
y

j
D
j
x
j

j
= 1.
Para cada jugador j, x
j

j
E
j
(X

) x
j

j
E
j
_
X

j
_
para toda
j
D
j
.
Entonces

j
D
j
x
j

j
E
j
(X

j
D
j
x
j

j
E
j
_
X

j
_
.
El lado izquierdo de la desigualdad es igual a E
j
(X

), mientras que el
lado derecho es E
j
_
X

X
j
_
. Por lo tanto, para toda j N,
E
j
(X

) E
j
_
X

X
j
_
para toda X
j
M
j
.
Es decir, X

es un equilibrio de Nash (em).


219
220 Estrategias Mixtas
De los resultados anteriores (proposiciones 5.4.2 y 5.4.3), obtenemos el
hecho de que los juegos que ya podan resolverse en estrategias puras con-
servan su soluci on en estrategias mixtas.
Proposici on 5.4.4. Si

es un equilibrio de Nash en estrategias puras


de un juego rectangular (N, D
j
, ), entonces tambien es un equilibrio de
Nash en estrategias mixtas del juego.
Demostraci on. Para todo jugador j y, para toda
j
D
j
,

j
(

)
j
_

j
_
.
El lado izquierdo de la desigualdad es igual a E
j
(

) y el lado derecho
es E
j
_

j
_
.
Entonces, para todo jugador j, E
j
(

) E
j
_

j
_
, para toda
j
D
j
.
Es decir

es un equilibrio de Nash en estrategias mixtas.


Podemos reexaminar, a la luz de los resultados anteriores, los perles de
estrategias mixtas con buenas estrategias para cada jugador construidos
con los algoritmos y procedimientos de la secci on 5.3. Obtenemos varios
corolarios interesantes que nos arman con algunos metodos para calcular
equilibrios de Nash en estrategias mixtas.
Corolario 5.4.5. Si el algoritmo de juego cticio tiene exito obtendr a un
equilibrio de Nash (em).
Demostraci on. Cuando el algoritmo tiene exito termina con un perl de
estrategias mixtas

X, con la propiedad de que, para cada jugador j,
E
j
_

X
_
E
j
_

j
_
para toda
j
D
j
. Por lo que

X es un equilibrio de Nash en estrategias
mixtas.
La siguiente proposici on cuya prueba es inmediata, desde los resultados
obtenidos, nos sirve para mostrar que otros de los procedimientos de la
secci on 5.3 nos conducen a equilibrios de Nash (em).
Proposici on 5.4.6. El perl de estrategias mixtas X

es un equilibrio de
Nash si y s olo si para todo jugador j, X
j
es una mejor respuesta mixta de
j a X

.
Con la correspondencia de mejor respuesta obtenemos el corolario 5.4.7
b) que nos da otra caracterizaci on de los equilibrios de Nash.
220
Mezclando y Jugando en el largo Plazo 221
Corolario 5.4.7. X

es un equilibrio de Nash en estrategias mixtas si y


s olo si
a) Para toda j, X

gr (L
j
).
b) X

es un punto jo de la correspondencia L, es decir, X

L(X

).
5.4.7 a) garantiza que el metodo de la cruz gamada encuentra todos los
equilibrios de Nash (em) en los juegos 2 2. Para juegos con m as jugadores
y conjuntos de estrategias m as grandes, la intersecci on de las gr (L
j
) no es
tan f acil de construir. En cuanto a 5.4.7 b), nos dice que el conjunto de
equilibrios de Nash de un juego coincide con el conjunto de puntos jos de
la correspondencia L y esta es la base de una de las demostraciones de la
existencia del equilibrio de Nash (ver la secci on 5.6).
Con respecto a la funci on de reajuste de Nash, la siguiente proposici on
es la clave en la demostraci on m as conocida del teorema de existencia de
equilibrios de Nash (em) en los juegos nitos.
Proposici on 5.4.8. El perl X

es un equilibrio de Nash en estrategias


mixtas si y s olo si es un punto jo de T, es decir, T (X

) = X

.
Demostraci on. Supongamos que X

es un equilibrio de Nash. Tenemos, en-


tonces que E
j
(X

) E
j
_
X

j
_
para toda
j
D
j
. Es decir, para toda
j N y toda
j
D
j
,
c
j

j
= m ax

j
D
j
_
E
j
_
X

j
_
E
j
(X

) , 0
_
= 0.

= T (X

) es tal que, para toda j N y toda


j
D
j
,

x
j

j
=
x
j

j
+ 0
1 + 0
= x
j

j
.
Es decir, T (X

) = X

.
Supongamos, ahora, que X

no es un equilibrio de Nash en estrategias


mixtas. Entonces, por la proposici on 5.4.3, existe
j
D
j
, tal que
E
j
_
X


j
_
> E
j
(X

) .
La proposici on 5.4.2 b) asegura que existe
j
D
j
tal que
E
j
_
X

j
_
E
j
(X

) y x
j

j
> 0.
Entonces
c
j
e
j
= m ax

j
D
j
_
E
j
_
X


j
_
E
j
(X

) , 0
_
= E
j
_
X


j
_
E
j
(X

) > 0
221
222 Estrategias Mixtas
y
c
j

j
= m ax

j
D
j
_
E
j
_
X

j
_
E
j
(X

) , 0
_
= 0.
Por lo que,

x
j

j
=
x
j

j
+ 0
1 +

j
D
j
c
j

j
,= x
j

j
,
pues 1 +

j
D
j
c
j

j
> 1.
Es decir, T (X

) ,= X

. Entonces X

es un equilibrio de Nash en estrate-


gias mixtas si y s olo si es un punto jo de T.
La proposici on 5.4.8 caracteriza a los equilibrios de Nash como puntos
jos de T, lo que asegura que si el algoritmo consistente en reajustar una y
otra vez las estrategias mixtas de los jugadores con la funci on T alcanza un
punto jo X

y, por lo tanto, naliza, X

es un equilibrio de Nash en estrate-


gias mixtas. Sin embargo, como decamos en la secci on anterior, el algoritmo
no necesariamente termina y ni siquiera podemos asegurar que converja por
lo que no otorga, como se antojara por la interpretaci on concreta de T, un
procedimiento general para construir equilibrios.
La funci on T fue construida por Nash [38, 40] para la demostraci on del
teorema de existencia de equilibrio en estrategias mixtas de un juego nito
y, a traves de ella, se convierte dicho problema en otro, el de la existencia
de puntos jos de la funci on T. Ese es su verdadero interes, aunque no nos
permita encontrar un equilibrio de Nash.
Nuestro siguiente objetivo ser a completar el teorema de existencia de
equilibrios de Nash y, para ello, y para la obtenci on de otros resultados,
necesitamos estudiar las propiedades geometricas de los conjuntos de es-
trategias mixtas, de la funci on de pago esperado, de la funci on de reajuste
de Nash y de la correspondencia L, cosa que haremos en la secci on siguiente.
5.5. Geometra de las Estrategias Mixtas
Consideremos un juego rectangular
_
N, D
j

jN
,
_
. El conjunto de
estrategias mixtas M
j
del jugador j est a contenido en R
l
j
, donde l
j
es el
n umero de estrategias puras del jugador j. Explcitamente
M
j
=
_
X R
l
j
[x
i
0
_

_
X R
l
j

l
j

i=1
x
i
= 1
_
, que es la intersecci on
222
Mezclando y Jugando en el largo Plazo 223
del primer ortante de R
l
j
y del hiperplano de R
l
j
formado por los puntos
cuyas coordenadas suman uno.
Es decir, los conjuntos de estrategias mixtas de los jugadores son los sim-
plejos unitarios sumergidos en R
l
j
, por lo que tienen propiedades geometricas
muy interesantes.
Proposici on 5.5.1. Para todo jugador j, M
j
es compacto y convexo. Tam-
bien M = M
1
M
2
M
n
es compacto y convexo.
Demostraci on. Es conocido que los dos conjuntos que forman a M
j
, el primer
ortante y el hiperplano, son cerrados, por lo que M
j
es cerrado. Adem as,
M
j
est a contenido en la esfera unitaria de R
l
j
, por lo que es acotado. Es
decir, M
j
es un conjunto cerrado y acotado de R
l
j
, o lo que es lo mismo es
compacto.
El producto cartesiano de conjuntos compactos es compacto, por lo tan-
to, M es compacto.
Supongamos, por otro lado, que

X
j
y

X
j
son dos estrategias mixtas del
jugador j.

X
j
=

j
D
j
x
j

j
y

X
j
=

j
D
j
x
j

j
. Sea t [0, 1], entonces
t

X
j
+ (1 t)

X
j
= t
_

j
D
j
x
j

j
_
+ (1 t)
_

j
D
j
x
j

j
_
=

j
D
j
_
t
_
x
j

j
_
+ (1 t) x
j

j
_

j
.
Adem as, es claro que para toda j y toda
j
,
_
t
_
x
j

j
_
+ (1 t) x
j

j
_
0
y

j
D
j
_
t
_
x
j

j
_
+ (1 t) x
j

j
_
=
t

j
D
j
x
j

j
+ (1 t)

j
D
j
x
j

j
= t + (1 t) = 1.
Es decir, t

X
j
+ (1 t)

X
j
es una estrategia mixta de j, por lo que M
j
es convexo.
El producto cartesiano de conjuntos convexos es convexo, entonces, M
es convexo.
En la gura 5.5.1 se puede observar M
j
, para l
j
= 2, 3, 4.
Las funciones E y E
j
son continuas (para toda j), pues son lineales y
est an denidas en espacios vectoriales de dimensi on nita.
223
224 Estrategias Mixtas
Dadas

X
j
M
j
y X M, podemos pensar en las funciones
E
j
_

X
j
_
: M R y E
j
_
X [
_
: M
j
R,
denidas, respectivamente, como
E
j
_

X
j
_
(X) = E
j
_
X

X
j
_
y
E
j
_
X [
_ _
X
j
_
= E
j
_
X

X
j
_
.
Ambas funciones son continuas, pues son restricciones de las E
j
.
Por otro lado, T que es una composici on de funciones continuas, tambien
es continua.
La correspondencia de mejor respuesta tambien tiene propiedades im-
portantes de continuidad y convexidad.
Se dice que la correspondencia es superiormente semicontinua si
su gr aca, (X, Y ) [Y (X), es cerrada.
Si una correspondencia es tal que la imagen de cualquier X es convexa,
decimos que la correspondenciacorrespondencia es convexa.
(0,1)
(1,0)
(0,0,1)
(1,0,0)
(0,1,0)
l l
(0,0,0,1)
(0,1,0,0)
(1,0,0,0)
(0,0,1,0)
l
j
= 2
j
= 3
j
= 4
Figura 5.5.1:
Proposici on 5.5.2. La correspondencia L es superiormente semicontinua,
convexa y, para toda X en M, L(X) es no vaco.
Demostraci on. Sea X en M. Por la continuidad de la funci on E
j
(X [ ),
existen mejores respuestas mixtas de j a X, para todo jugador j y, por lo
tanto, L(X) no es vaco.
Sean Z
1
y Z
2
en L(X). Entonces, para toda j N,
E
j
_
X

Z
j
1
_
= E
j
_
X

Z
j
2
_
= m ax
X
j
M
j
E
j
_
X

X
j
_
.
224
Mezclando y Jugando en el largo Plazo 225
Consideremos tZ
1
+ (1 t)Z
2
, con t [0, 1].
E
j
_
X

_
tZ
j
1
+ (1 t) Z
2
__
= tE
j
_
X

Z
j
1
_
+ (1 t) E
j
_
X

Z
j
2
_
=
t m ax
X
j
M
j
E
j
_
X

X
j
_
+ (1 t) m ax
X
j
M
j
E
j
_
X

X
j
_
= m ax
X
j
M
j
E
j
_
X

X
j
_
.
Es decir, tZ
1
+ (1 t)Z
2
L(X), por lo que L(X) es convexo.
Por otro lado, pensemos en una sucesi on convergente de puntos de la
gr aca de L, (X
1
, Y
1
) , (X
2
, Y
2
) , ..., (X
k
, Y
k
) , ..., denotemos como (X, Y )
al lmite de la sucesi on.
Para i = 1, 2, ..., Y
i
L(X
i
), por lo que, para toda j N,
E
j
_
X
i

Y
j
i
_
E
j
_
X
i

Z
j
_
,Z
j
M
j
.
Por la continuidad de E
j
tenemos que
lm
(X
i
,Y
i
)(X,Y )
E
j
_
X
i

Y
j
i
_
= E
j
_
X

Y
j
_
.
Entonces, para i = 1, 2, ... y para toda Z
j
M
j
,
E
j
_
X

Y
j
_
lm
X
i
X
E
j
_
X
i

Z
j
_
= E
j
_
X

Z
j
_
.
Esto quiere decir que Y L(X), o dicho en otra forma (X, Y ) est a en
la gr aca de L, por lo que dicha gr aca es cerrada.
Todas estas propiedades de la funci on de mejor respuesta T, de la co-
rrespondencia de mejor respuesta L y del conjunto de perles de estrategias
mixtas M est an vinculadas a la existencia de puntos jos de T y de L. Como
vimos en la secci on dichos puntos son los equilibrios de Nash en estrategias
mixtas.
0 1 x 0 1 x
Figura 5.5.2:
225
226 Estrategias Mixtas
Expondremos a continuaci on los teoremas de punto jo de Brouwer y de
Kakutani y veremos que las propiedades que hemos estudiado garantizan la
existencia de equilibrios en estrategias mixtas en los juegos nitos.
Teorema de Punto Fijo de Brouwer Sea S R
m
compacto y con-
vexo y f : S S continua. Entonces, existe

X S tal que f
_

X
_
=

X.
Para dar una idea intuitiva del teorema, pensemoslo para m = 1, en-
tonces S tiene que ser un intervalo cerrado y el teorema de Brouwer se
convierte en un conocido teorema del valor intermedio. En las guras 5.5.2
y 5.5.3, se ilustran gr acas correspondientes a cuatro funciones denidas en
S y que toman valores en S, donde S [0, 1]. La gr aca de la izquierda
en 5.5.2 corresponde a una funci on f continua con S compacto y convexo.
Mientras que en la de la derecha el conjunto S tambien es compacto y con-
vexo, pero f no es continua. Las gr acas de 5.5.3 son de funciones continuas,
pero el S de la izquierda no es un conjunto compacto y el de la derecha no
es convexo.
0 1 y z
0 1
Figura 5.5.3:
Teorema de Punto Fijo de Kakutani.Sea S R
m
compacto y con-
vexo y : S S superiormente semicontinua, convexa y para toda X en
S, (X) es no vaco. Entonces, existe

X S tal que

X
_

X
_
.
0 1 0 1
Figura 5.5.4:
226
Mezclando y Jugando en el largo Plazo 227
El Teorema de Kakutani es una generalizaci on del teorema de Brouwer.
En la gura 5.5.4, a la izquierda, se ilustra lo que pasa cuando se cumplen
todas las hip otesis y a la derecha cuando la correspondencia no es superior-
mente semicontinua.
Estamos listos para establecer teoremas de existencia de equilibrios de
Nash. Sin embargo, es interesante mencionar que las demostraciones cl asicas
de los teoremas de punto jo de Brouwer y de Kakutani no son construc-
tivas. Bas andonos en ellas tendremos una demostraci on de existencia que
no permite calcular los equilibrios mismos. Lemke, Scarf y otros autores,
cambiaron este panorama. Buscando la construcci on de equilibrios de Nash
en estrategias mixtas y precios de equilibrio competitivos, encontraron una
demostraci on constructiva, de los dos teoremas de punto jo, basada en al-
goritmos de tipo combinatorio. A continuaci on exponemos brevemente una
de las versiones del algoritmo desarrollado por Scarf [46] para encontrar un
punto jo de una funci on continua.
5.5.1. Un Algoritmo de Scarf para Calcular Puntos Fijos
El surgimiento de los algoritmos para el c alculo de puntos jos de fun-
ciones y correspondencias, a nales de la decada de los 60, en la que par-
ticiparon Scarf y otros autores, se relacion o con la b usqueda de calcular
los equilibrios de Nash de juegos rectangulares nitos y precios de equili-
brio competitivo. Sin embargo, al lograr calcular puntos jos de funciones
y correspondencias para cualquier contexto te orico en el que se presenten,
tienen una aplicaci on mucho m as amplia y fueron desarrollados en varias
direcciones.
Hasta antes del desarrollo de estos algoritmos, las demostraciones de los
teoremas de punto jo eran lo que se llama demostraciones de existencia. Por
ejemplo, la demostraci on del teorema de Brouwer basada en un lema com-
binatorio debido a Sperner. Scarf demostr o constructivamente dicho lema y
otro m as que es una generalizaci on del de Sperner y que utiliza aproxima-
ciones lineales a pedazos a la funci on dada. Posteriormente se han logrado
demostraciones constructivas basadas en otras demostraciones de existen-
cia, tan cl asicas como la que utiliza el lema de Sperner. En este trabajo,
exponemos s olo las ideas relativas a las aproximaciones lineales a pedazos
que recien mencionamos, obteniendo, con ello, demostraciones constructi-
vas de los teoremas de Brouwer y de Kakutani y, por lo tanto, metodos
generales para calcular puntos jos, en particular los equilibrios de Nash de
un juego rectangular nito.
Volvamos a pensar en una funci on continua f denida del intervalo [0, 1]
227
228 Estrategias Mixtas
en s mismo, para ilustrar la idea del algoritmo de Scarf (llamado de eti-
quetaci on vectorial) en el caso m as simple. Los puntos jos de f correspon-
den a los puntos de intersecci on de la diagonal del cuadrado [0, 1] [0, 1]
con la gr aca de f. Pensemos en una funci on continua, por ejemplo aquella
cuya gr aca aparece en la gura 5.5.5, en ese caso x es el unico punto jo
de f. Supongamos que x es desconocido, el algoritmo pretende acercarse lo
m as posible a este y, para ello, considera particiones P
t
del intervalo [0, 1]
en subintervalos cada vez m as peque nos. Se construye la sucesi on de puntos
jos de las funciones lineales a pedazos f
Pt
, determinadas por cada P
t
. Dicha
sucesi on converge a x.
x
1
a = a =
2 1
x 0 1
Figura 5.5.5:
Para considerar particiones del intervalo [0, 1] que est a en la base del
cuadrado, repitamos la gura izquierda de 5.5.2 una y otra vez. La primera
repetici on aparece en la gura 5.5.5. Pensemos que en ella se representa
la primera partici on (P
0
) del intervalo [0, 1], la partici on trivial, es decir,
a
1
= 0, a
2
= 1. Sea f
P
0
, la funci on lineal cuya gr aca es la recta l que une
los puntos (a
1
, f (a
1
)) y (a
2
, f (a
2
)). Esta es la primera aproximaci on lineal
a pedazos a la funci on f. Entonces, la primera aproximaci on al punto jo
de f es x
1
tal que f
P
0
(x
1
) = x
1
. Este punto x
1
corresponde a la intersecci on
de l con la diagonal del cuadrado.
Consideremos los elementos del conjunto a
1
, a
2
, a
3
, a
4
como los puntos
extremos de la colecci on de subintervalos de la partici on P
1
,
(a
1
, a
3
) , (a
3
, a
4
) , (a
4
, a
2
).
La funci on f
P
1
es la poligonal, o funci on lineal a pedazos determinada
por los puntos a
i
, cuya gr aca consiste en los segmentos de recta que unen
los puntos (a
1
, f (a
1
)), (a
3
, f (a
3
)), (a
4
, f (a
4
)), (a
2
, f (a
2
)) como en la gura
5.5.6.
228
Mezclando y Jugando en el largo Plazo 229
a
3
x
1
x
2
a = 0
1
a =1
2
x
Figura 5.5.6:
La funci on f
P
se ir a pareciendo a f a medida que la partici on P se
hace m as na. Adem as, el punto jo de f
P
, x
P
, se ir a acercando a x, el punto
jo de f. Tanto x como x
2
pertenecen al subintervalo [a
3
, a
4
]. Si la partici on
es muy na, tambien los puntos extremos de ese subintervalo ser an muy
cercanos a x. El algoritmo de Scarf trata de ir detectando, en particiones
cada vez m as nas, esos subintervalos que contienen a los punto jos de las
f
P
y a x.
Por supuesto que estas ideas se manejar an en una forma mucho m as gene-
ral, no reducidas a funciones de un intervalo en s mismo. Dada una funci on
f denida de un subconjunto S, S R
m
compacto y convexo, en s mismo,
consideramos una partici on de S en conjuntos adecuados, simplejos, y
manejamos la funci on lineal a pedazos, determinada por dicha partici on. Se
considerar an particiones de S cada vez m as nas, entonces las f
P
corres-
pondientes, cada vez se pareceran m as y m as a la funci on f, as como sus
puntos jos se iran acercando cada vez m as a alguno de los puntos jos de
f.
Antes que nada deniremos a los simplejos en que se partir a el dominio
de la funci on f.
Denici on 5.5.3. Si v
0
, v
1
, . . . , v
m
en R
m
son anmente independientes, es
decir, si v
1
v
0
, v
2
v
0
, . . . , v
m
v
0
son vectores linealmente independientes,
entonces al conjunto de todas las combinaciones convexas de esos vectores
se le llama el n-simplejo de R
m
, con vertices v
0
, v
1
, . . . , v
m
.
Si S es un simplejo con vertices v
0
, v
1
, . . . , v
m
, una (mr)-cara de S es
un simplejo de dimensi on mr ((mr)-simplejo), cuyos mr +1 vertices
son un subconjunto de v
0
, v
1
, . . . , v
m
. Los 1-simplejos son intervalos.
229
230 Estrategias Mixtas
Denici on 5.5.4. Una colecci on nita P de m-simplejos es una triangu-
laci on, si cumple:
1. Cada dos m-simplejos son ajenos o se intersectan en una cara com un.
2. Cada m 1-cara de un m-simplejo de P es a lo mas cara de otro
elemento de P.
Diremos que v es un vertice de P, si es un vertice de alguno de los
simplejos de P.
Un (mr) simplejo es una (m r)cara de P, si lo es de uno de
los simplejos de P. Denotaremos como a un simplejo cualquiera en P y
como [P[ a
P
y diremos que P es una triangulaci on de S, o que P
triangula a S, si [P[ = S. Cuando tenemos una triangulaci on de S, podemos
determinar un sistema de coordenadas para los elementos de S. As para v
en S, consideramos , el msimplejo de P al que pertenece v, o a la cara
com un de varios elementos de P, si v pertenece a ella. Escribamos a v como
combinaci on lineal de los vertices v
0
, v
1
, . . . , v
m
de . Los coecientes de esa
combinaci on se llamar an las coordenadas baricentricas de v respecto
de P.
Dada una triangulaci on P de un msimplejo S, resulta util construir
cierto tipo de triangulaciones P de S [0, 1], tales que las caras de P de di-
mensi on m contenidas en St, con t [0, 1] son una partici on de S y a medi-
da que t es m as cercana a 1, la partici on correspondiente es m as na, las caras
en S 1 son de la forma 1, con en P y, recprocamente, para cada
en P, 1 es una cara de dimensi on m de P. Adem as, S0 es, tambien,
una cara de dimensi on m de P. Cuando una triangulaci on P de S[0, 1] tiene
las propiedades que acabamos de describir, decimos que est a bien relaciona-
da con P. En la gura 5.5.7 se representa el intervalo S, con partici on. P =
[a
1
, a
2
] , [a
2
, a
3
] , [a
3
, a
4
] , [a
4
, a
5
] , [a
5
, a
6
] , [a
6
, a
7
] , [a
7
, a
8
] , [a
8
, a
9
] y una par-
tici on P de S [0, 1] bien relacionada con P.
Sea una funci on continua g de S en R
m
, donde S es un msimplejo de
R
m
y v
0
, v
1
, ..., v
m
los vertices de S. Sea P una triangulaci on de S, con
vertices v
i
. Supongamos que ninguno de los vertices de P es un punto jo
de g y asociemos, a cada v
i
, el vector g(v
i
).
Construimos g
P
, la aproximaci on lineal a g respecto a P, de la manera
siguiente: sea v un vector de S, para alguno de los simplejos de P, llamemosle

v
, v
v
. Si los vertices de
v
son w
0
, w
1
, ..., w
m
, entonces v =
m

i=0

i
w
i
,
entonces g
P
(v) =
m

i=0

i
g (w
i
).
230
Mezclando y Jugando en el largo Plazo 231
a
1
a
2
a
3
a
4
a
5
a
6
a
7
a
8
a
9
0 1
Figura 5.5.7:
Dada una funci on continua g: S R
m
, donde S es un simplejo de R
m
que tiene vertices v
0
, v
1
, . . . , v
m
y est a triangulado por P, decimos que g es
regular respecto a P, si g
P
no tiene ceros en ninguna cara de P de dimensi on
menor que m y decimos que g es propia si

0 es una combinaci on convexa de
los vectores g (u
i
) para los vertices m+1 vertices u
i
de alg un msimplejo
de P y si S

es una cara de P de dimensi on menor que m, con vertices


w
0
, w
1
, .., w
l
, entonces

0 no es una combinaci on convexa de los vectores
g (w
i
).
Por otro lado, consideremos que S est a triangulado por P, una colecci on
de msimplejos, y g es una funci on continua de S en R
k
, con k < m y sea
una cara de P de dimensi on k con vertices w
0
, w
1
, .., w
k
. Decimos que
es regular respecto a g, o gregular, si se cumplen:
1- Existe v tal que v =
k

i=0

i
w
i
con
i
> 0 para toda i,
k

i=0

i
= 1 y
g
P
(v) =

0 .
2- Para todo x que este en una cara de de dimensi on menor que k, se
tiene que g
P
(x) ,=

0 .
Nuestro problema es encontrar los puntos jos de una funci on continua
f denida de S en S, con S un subconjunto compacto y convexo de R
m
.
Podemos transformar el problema en el de encontrar los ceros de g = I f
231
232 Estrategias Mixtas
(g es una funci on denida en S y que toma valores en R
m
). Para construir
un algoritmo relacionado a esa b usqueda, primero construiremos un algo-
ritmo auxiliar que demuestra constructivamente un lema combinatorio tipo
Sperner.
Teorema 5.5.5 (Lema de Sperner Vectorial Restringido). Sea S un
simplejo de R
m
, con vertices v
0
, v
1
, . . . , v
m
, P una triangulaci on de S, g una
funci on de S en R
m
continua, propia y regular respecto a P. Entonces existe
en P al menos un m-simplejo regular respecto a g.
Lema 5.5.6. Si la funci on g de S en R
m
es continua, regular y propia,
respecto a P, entonces cada en P o tiene dos m-caras regulares respecto
a g o no tiene ninguna, donde P es una triangulaci on de S [0, 1] bien
relacionada con P.
Demostraci on. Denotamos como g

a la funci on afn que coincide con g


P
en
.
Por la regularidad de g respecto a P, tenemos:
a) g
1

(

0 ) es una recta que atraviesa interiormente una cara de di-
mensi on m de y
b) dicha recta no puede cortar una cara de dimensi on menor.
Entonces cortar a interiormente otra cara de de dimensi on m distinta
que .
El lema anterior es la clave para el algoritmo que sigue los pasos de la
demostraci on del teorema 5.5.5 que se expone a continuaci on.
Demostraci on. Sea S un simplejo de R
m
con vertices v
0
, v
1
, . . . , v
m
y P una
triangulaci on de S. Si g : S R
m
es continua, propia y regular respecto a
P, como exige el lema 5.5.6, construimos P, una triangulaci on de S [0, 1],
bien relacionada con P. Cada vertice v de P es de la forma (v, 1), con v S,
a v le asociamos el vector l (v) = g(v).
Como g es propia,

0 = g
P
_
m

i=0

i
v
i
_
, para algunas
i
todas positivas.
Es decir,
1
= S 0 es una cara regular respecto a la funci on l que asocia
vectores a cada vertice de P (diremos simplemente que es regular).
1
es cara
de un solo (m + 1)-simplejo
1
de P, pues est a en la frontera de S [0, 1].
Por el lema 5.5.6,
1
tiene otra unica cara
2
distinta a
1
que tambien es
regular. Si
2
est a en S 1,
2
=
2
1, con
2
un m-simplejo regular
de P y el algoritmo estara terminado. Si
2
no est a en Sx1, existe un
unico
2
, (m+ 1)-simplejo de P, distinto que
1
que tiene como cara a
2
.
232
Mezclando y Jugando en el largo Plazo 233
Supongamos que tenemos construidos
1
,
1
,
2
,
2
, . . . ,
k
tal que
i
es
regular.
i
es cara de
i1
y de
i
, para i = 2, 3, . . . , k1. Por la regularidad
de g, si
k
es distinto de
1
y pertenece a la frontera de S [0, 1], entonces
pertenece a S 1,
k
=
k
1, con
k
un m-simplejo regular de P y el
algoritmo estara terminado. Si
k
no est a en S 1, existe un unico
k
,
(m + 1)-simplejo de P, distinto que cada uno de los m + 1 simplejos del
conjunto
1
,
2
, ...,
k1
y que tiene como cara a
k
. Adem as, existe
k+1
,
una sola mcara de
k
distinta de
k
.
El algoritmo termina encontrando un n-simplejo de P regular, respecto a
g, en un n umero nito de pasos ya que P y P son nitas y no puede regresar
a una cara ya visitada .
En la gura 5.5.8 se pueden observar los pasos del algoritmo.
1
0 x
1 0
Figura 5.5.8:
El lema de Sperner, teorema 5.5.5, exige que la funci on g sea continua,
regular y propia respecto de una partici on de S y que este sea un m-simplejo,
233
234 Estrategias Mixtas
de ah su car acter restringido. En relaci on con el teorema de Brouwer, las
peticiones a un son m as fuertes, pues las hip otesis de 5.5.5, se deben repe-
tir respecto a una innidad de particiones, cada vez m as nas. Busquemos
resolver este problema.
El teorema que sigue nos ayuda a generalizar el lema de Sperner vectorial.
Teorema 5.5.7. Dadas P una triangulaci on nita, g: [P[ R
k
una fun-
ci on continua y Y una matriz k k invertible, entonces existe
0
> 0
tal que, para toda en [0,
0
], g Y
_

_
es regular respecto a P, donde

=
_

1
,
2
, . . . ,
k
_
.
Demostraci on. Denotemos como P
l
al conjunto de lcaras de P.
Sean
0
,
1
,
2
, ...,
k
reales distintos, cada dos. Entonces
Y
_

1
_
Y
_

0
_
, Y
_

2
_
Y
_

0
_
, ..., Y
_

k
_
Y
_

0
_
son linealmente independientes. Por lo tanto, solo puede haber un n umero
nito de vectores de la forma Y (

) en g
P
(

P
k1

).
Para denir
0
tenemos dos casos:
i) existe v en

P
k1

tal que g
P
(v) = Y (

) para alg un > 0; entonces


denimos
0
como min R

Y (

) g
P
(

P
k1

);
ii) g
P
(v) ,= Y (

) para toda > 0; entonces


0
es cualquier n umero.
Denici on 5.5.8. Si P es una triangulaci on, g: [P[ R
k
una funci on
continua y Y una matriz invertible, se dice que en P
k
es (, Y )-regular
respecto a g, si existe
0
> 0 tal que para toda en (0,
0
), es regular
respecto a g Y (

). Si Y es la matriz identidad, se dice que es -regular


respecto a g.
Denici on 5.5.9. Si S es un m-simplejo de R
m
con vertices v
0
, v
1
, . . . , v
m
y P es una triangulaci on de S, decimos que g: P
0
R
m
es una etiquetaci on
de Sperner, si g
P
(v
0
), g
P
(v
1
), . . . , g
P
(v
m
) son anmente independientes y

0 =
m

i=0

i
g
P
(v
i
), con
i
0 y
m

i=0

i
= 1.
Enunciamos, sin demostrar, una propiedad combinatoria para los sim-
plejos (, Y )-regulares que juega un papel an alogo al lema 5.5.6, en la de-
mostraci on constructiva de un lema de Sperner vectorial m as general que
5.5.5.
234
Mezclando y Jugando en el largo Plazo 235
Lema 5.5.10. Sea g: S R
m
continua, Y una matriz m m invertible
y en

P con una cara de dimensi on m que es (, Y )-regular respecto a la


etiquetaci on de Sperner de

P que induce g. Entonces tiene otra unica m-


cara distinta que la primera que es (, Y )-regular respecto a la etiquetaci on
de

P inducida por g.
Teorema 5.5.11 (Lema de Sperner General). Sea S un m-simplejo
con vertices v
0
, v
1
, . . . , v
m
, P una triangulaci on de S y g una etiquetaci on
de Sperner de P. Entonces existe al menos un elemento de P que es (, Y )-
regular para alguna Y invertible.
La demostraci on se realiza con un algoritmo tipo Scarf que resulta for-
malmente identico que el del lema de Sperner restringido (5.5.6).
Para demostrar, ahora, constructivamente los teoremas de punto jo
(Brouwer y Kakutani), pensemoslos, por el momento, restringidos a un sim-
plejo S. Consideremos una sucesi on de triangulaciones, cuyo di ametro tiende
a cero y etiquetaciones relacionadas con la funci on o correspondencia de la
que trata el teorema en cuesti on. Gracias al lema de Sperner, encontramos
una sucesi on convergente de simplejos ( Y ) regulares que convergen a un
punto jo de la funci on f (correspondencia).
Para encontrar puntos jos de una funci on continua f (correspondencia),
resulta util trabajar con una triangulaci on de S [0, 1], al estilo de la gura
5.5.7 que para diversos valores de t en [0, 1], cada vez m as cercanos a 1,
repite una copia de S en S t, pero triangulado con una triangulaci on
m as na a medida que t se acerca a 1. As, los simplejos ( Y )regulares
encontrados en esas copias de S son cada vez m as peque nos y cada uno de
sus puntos es cercano a un punto jo de f. Si del teorema de Brouwer se
trata, la etiquetaci on que se usa es la funci on I f.
El problema de levantar la restricci on de que el dominio de f no sea un
simplejo, sino un subconjunto D compacto y convexo de R
m
, para alg un
m, se resuelve encontrando un simplejo que contenga a D y extendiendo la
funci on f a fdenida en todo S, de tal manera que las im agenes de festen
contenidas en D, asegurando as que los puntos jos de fsean los mismos
que los de f y que S D no contenga ning un punto jo de f.
La secci on siguiente naliza el captulo con algunos teoremas de existen-
cia de equilibrios de Nash.
235
236 Estrategias Mixtas
5.6. Existencia de Equilibrios
Teorema 5.6.1 (Teorema de Nash). Para cada juego rectangular ni-
to
_
N, D
j

jN
,
_
existe al menos un equilibrio de Nash en estrategias
mixtas.
Primera demostraci on (basada en la funci on de reajuste)
La funci on de reajuste T es continua en M y este conjunto es compacto
y convexo. Por el teorema de Brouwer, T tiene al menos un punto jo. Pero
los puntos jos de T son equilibrios de Nash en estrategias mixtas del juego
_
N, D
j

jN
,
_
(proposici on ??). Entonces, todo juego rectangular nito
tiene al menos un equilibrio de Nash en estrategias mixtas.
Segunda demostraci on (basada en la correspondencia de mejor
respuesta)
La correspondencia de mejor respuesta L es superiormente semicontinua
en M y el conjunto imagen de cualquier X es no vaco y convexo (proposi-
ci on ??). Como, adem as, M es compacto y convexo, entonces el teorema de
Kakutani nos asegura que L tiene al menos un punto jo. Pero cada punto
jo de L es un equilibrio de Nash en estrategias mixtas, o sea que en todo
juego rectangular nito, existe al menos un equilibrio de Nash en estrategias
mixtas.
Teorema 5.6.2. Un juego rectangular innito (N, D
j

jN
, ) tal que los
conjuntos D
j
son compactos y convexos y la funci on de pago continua
tiene al menos un equilibrio de Nash.
Las dos demostraciones del teorema 5.6.1 son v alidas para el teorema
5.6.2.
Ya sabemos, entonces, que todo juego rectangular nito tiene al menos
un equilibrio de Nash en estrategias mixtas, y algunos juegos rectangulares
innitos tienen equilibrio de Nash. Tenemos, para los primeros, un metodo
general para calcular todos los equilibrios, en el caso de juegos 22. Tenemos,
adem as, dos algoritmos, el del juego cticio y el de la funci on reajuste, pero
estos no convergen siempre.
El algoritmo debido a Scarf, expuesto al nal de la pasada secci on, per-
mite calcular un equilibrio de Nash, tanto en el caso de estrategias mixtas,
como en el de los juegos innitos que cumplen las hip otesis de los teoremas
de punto jo. En realidad es un algoritmo para calcular un punto jo de
236
Mezclando y Jugando en el largo Plazo 237
una funci on continua y tambien sirve para calcular un punto jo de una co-
rrespondencia superiormente semicontinua, resultando demostraciones cons-
tructivas de los teoremas de Brouwer y de Kakutani.
5.7. Ejercicios
Ejercicio 5.1. Considere que dos empresas se enfrentan en el ejemplo 1.3.3
c) que se repite a continuaci on.
entrar no entrar
re galar muestras
publicidad escrita
publicidad en radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(40, 10) (50, 0)
_
_
Considere que la primera empresa ha decidido invertir la mitad de su
capital en radio y tv y el resto en partes iguales entre las dos restantes
opciones, mientras que la segunda ha decidido invertir en la competencia la
tercera parte de su capital. Interprete dichas particiones como estrategias
mixtas y calcule el pago esperado para cada empresa. Cu al sera una mejor
respuesta pura de cada empresa a dicho perl? Puede construir otro perl
de estrategias mixtas, en sentido estricto, para el que las mejores respuestas
puras sean distintas?
Ejercicio 5.2. Considere que en el Mexico de los a nos 50 los hombres y las
mujeres est an enfrentados en el conicto
La Borola (B) La Chorreada (Ch)
Pepe el Toro (P)
Re gino Burr on (R)
_
(1, 10) (5, 2)
(0, 5) (1, 4)
_
Considere una composici on estrategica de la poblaci on de tal manera que
todas las parejas de estrategias puras tengan probabilidad de ocurrir al elegir
al azar a un hombre y a una mujer. Interprete dicha composici on estrategica
como un perl de estrategias mixtas y calcule el pago esperado para cada
hombre y para cada mujer. Cu al sera una mejor respuesta pura de cada
hombre (mujer) a dicho perl? Puede construir otro perl de estrategias
mixtas, en sentido estricto para el que las mejores respuestas puras sean
distintas?
237
238 Estrategias Mixtas
Ejercicio 5.3. a) Considere el juego
_
_
_
_
(1, 2) (5, 4) (6, 1) (3, 1)
(3, 3) (2, 1) (1, 5) (2, 10)
(0, 0) (0, 2) (2, 3) (1, 5)
(2, 2) (1, 1) (0, 5) (11, 3)
_
_
_
_
y las estrategias mixtas X
1
=
_
1
16
,
1
8
,
1
2
,
5
16
_
y X
2
=
_
1
4
,
1
4
,
1
4
,
1
4
_
, para los
jugadores 1 y 2, respectivamente.
Encuentre el pago esperado para cada jugador correspondiente a X
1
y
X
2
y calcule las mejores respuestas puras de cada uno de los jugadores a
dichas estrategias.
b) Considere el juego siguiente:
Un comite de tres miembros de un club tiene que elegir repetidamente a
un representante de entre una lista de cuatro candidatos (A, B, C, D, en
cada ocasi on es elegido aquel candidato que obtuvo m as votos. Suponiendo
que los tres depositan su voto secretamente en una urna y que I preere
al candidato A, en segundo lugar al B, en tercero al C y, por ultimo, al
D, mientras que II preere al B, despues al C, en tercero al D y al nal
el A y III preere al C, en segundo lugar al D, en tercero al A y al nal
el B. Correspondiendo a estas preferencias asigne un pago a cada jugador,
para cada terna de estrategias puras, en funci on del candidato elegido y las
preferencias de los jugadores.
Si los jugadores I, II y III han estado votando de tal manera que las
frecuencias con que han elegido candidatos corresponden a las estrategias
mixtas X
1
= (
3
5
,
1
5
,
1
5
, 0), X
2
= (
1
6
,
1
3
, 0,
1
2
) y X
3
= (
1
5
, 0,
4
5
, 0) respectiva-
mente. Calcule los pago esperados y mejores respuestas puras para cada
uno de los jugadores a
_
X
1
, X
2
, X
3
_
. Tiene alguno de ellos una mejor re-
spuesta mixta en la que le de probabilidad positiva a m as de una estrategia
pura?
Ejercicio 5.4. Demuestre los siguientes resultados:
a) Si X

es un equilibrio de Nash (em) y x


j
b
j
> 0, entonces
j
es una
mejor respuesta pura de j a X

.
b) Suponga que en un juego de n personas hay un cierto perl X de
estrategias mixtas y que, para el jugador j, las estrategias puras
j
y

j
son
mejores respuestas puras de j a X . Demuestre que cualquier estrategia
mixta de j de la forma y
j
+(1 y)

, con y [0, 1], es una mejor respuesta


mixta de j a X.
c) Sea D
j
D
j
el conjunto de mejores respuestas puras de j al perl
de estrategias mixtas X (D
j
nito). Entonces cualquier estrategia de j de
238
Mezclando y Jugando en el largo Plazo 239
la forma

j
D

j
y

j
j
, con y

j 0 y

j
D

j
y

j = 1, es una mejor respuesta


mixta de j a X.
Ejercicio 5.5. Usando los resultados del problema 5.4 calcule, para los
juegos siguientes mejores respuestas mixtas de los jugadores al perl dado.
a)
_
(5, 0) (3, 1)
(2, 2) (4, 0)
_
, X =
__
1
2
,
1
2
_
,
_
1
10
,
9
10
__
.
b)
_
_
(1, 2) (1, 0) (3, 3)
(2, 1) (1, 1) (1, 1)
(0, 5) (2, 1) (3, 0)
_
_
, X =
__
1
5
,
2
5
,
2
5
_
,
_
1
3
,
1
3
,
1
3
__
.
Ejercicio 5.6. Considere el baile de Shapley,
a b c d
a
b
c
d
_
_
_
_
(2, 1) (0, 0) (1, 2) (1, 1)
(1, 2) (2, 1) (0, 0) (1, 1)
(0, 0) (1, 2) (2, 1) (1, 1)
(1, 1) (1, 1) (1, 1) (1, 1)
_
_
_
_
.
Si el jugador dos ha elegido la estrategia mixta

X
2
=
_
1
4
,
1
4
,
1
4
,
1
4
_
y

X
1
es
cualquier estrategia mixta del jugador 1. Cu al es el conjunto de mejores
respuestas mixtas del jugador 1 a
_

X
1
,

X
2
_
?
Ejercicio 5.7. Utilizando el metodo de la cruz gamada, encuentre todos los
equilibrios de Nash (em) de los juegos siguientes
a)
_
(1, 5) (3, 0)
(2, 4) (7, 1)
_
, b)
_
(3, 3) (2, 1)
(1, 2) (5, 5)
_
, c)
_
(5, 5) (1, 6)
(6, 1) (1, 1)
_
,
d)
_
(3, 3) (2, 2)
(1, 1) (5, 5)
_
, e)
_
(1, 3) (9, 2)
(2, 2) (9, 4)
_
.
Ejercicio 5.8. Realice 5 pasos del algoritmo de juego cticio para:
a) el juego del ejercicio 5.7 b), empezando con el perl de estrategias
puras (1, 2). Compare las estrategias mixtas de los dos jugadores correspon-
dientes a las frecuencia obtenidas despues de los 5 pasos con los equilibrios
de Nash obtenidos con el metodo de la cruz gamada.
b) el juego del ejercicio 5.7 c), empezando con el perl de estrategias
puras (2, 2). Compare las estrategias mixtas de los dos jugadores correspon-
dientes a las frecuencia obtenidas despues de los 5 pasos con los equilibrios
de Nash obtenidos con el metodo de la cruz gamada.
239
240 Estrategias Mixtas
c) el juego del ejercicio 5.7 d), empezando con el perl (1, 1). Compare
las estrategias mixtas de los dos jugadores correspondientes a las frecuencia
obtenidas despues de los 5 pasos con el unico equilibrio de Nash obtenido
con el metodo de la cruz gamada.
Ejercicio 5.9. Realice lo mismo que en 5.8, pero utilizando la funci on de
reajuste de Nash.
Ejercicio 5.10. El duopolio de Bertrand. Dos empresas controlan el mer-
cado de un bien. Las empresas 1 y 2 eligen el precio p
1
y p
2
, respectivamente,
al que vender an cada unidad del bien.
La cantidad demandada a la empresa i por los consumidores es
q
i
(p
1
, p
2
) = a p
i
+bp
j
.
0 < b < 2. c es el coste unitario, 0 < c < a. La ganancia de la empresa j
es
j
(p
1
, p
2
) = q
j
(p
1
, p
2
) (p
j
c).
Cu al es la curva de reacci on para cada empresa? Cu al es la intersecci on
de las dos curvas?
Demuestre que cada punto de la intersecci on de las curvas de reacci on
es un equilibrio de Nash del juego.
Ejercicio 5.11. Considere el modelo de Cournot para n empresas y suponga
que p = d
n

i=1
q
i
es el precio que hace que la oferta sea igual a la demanda.
La funci on de ganancia para la empresa E
j
es

j
(q
1
, q
2
, ..., q
n
) = q
j
(p c) ,
con c, el costo unitario, igual para cada empresa. Encuentre los puntos jos
de la correspondencia de mejores respuestas.
Demuestre que esos puntos jos son equilibrios de Cournot-Nash del
juego.
Ejercicio 5.12. En el juego de los artesanos con 3 jugadores D
1
= D
2
=
D
3
= O
1
, O
2
, O
3
y para toda j N,
j
() =
ds
ks
, donde k
s
es el n umero
de artesanos que escogieron Os y d
1
= 1000, d
2
= 750 y d
3
= 500. Si los
artesanos decidieron en el mes de noviembre no emplear todos los das del
mes en la misma actividad y el primero trabaj o 10 das en cada actividad, el
segundo 25 das en la segunda y 5 das en la tercera, mientras que el tercero
tres semanas en O
1
y el resto del mes en O
3
.
Cu ales seran las estrategias mixtas de cada uno de los jugadores que
expresen la frecuencia con que escogieron actividades?
240
Mezclando y Jugando en el largo Plazo 241
a) Si los artesanos utilizan el metodo de juego cticio a partir del primero
de diciembre, partiendo de la estrategia mixta de frecuencias obtenida en
noviembre Cu ales son sus actividades en los primeros 5 das de diciembre?
b) Lo an alogo, pero ahora considere que los artesanos utilizan la funci on
de reajuste de Nash.
c) Conjeture cu ales ser an en un equilibrio los pagos de los jugadores se
puede apreciar esto como una tendencia en los c alculos anteriores?
Ejercicio 5.13. Con los algoritmos de juego cticio y de la funci on de Nash
estudie los siguientes juegos (realice 5 pasos para cada juego y para cada
algoritmo) :
a) Cinco inversionistas tienen que decidir entre si sacan su dinero de un
pas o lo mantienen invertido en este. La ganancia de un inversionista que
decide sacar su dinero (S), independientemente de lo que decidan los dem as,
ser a igual a cero, la de un inversionista que decida invertir (I), mientras que
la mayora tambien invierte, ser a igual a uno, pero el que invierte, mientras
que la mayora no invierte, tendr a perdidas de 10.
Inicie el algoritmo de juego cticio con el perl de estrategias puras (S,
S, S, I, I) y el de reajuste con el perl de estrategias mixtas consistente en
que cada jugador escoge la estrategia mixta (1/5, 4/5).
b) Tres jugadores tienen que escoger en que ventanilla se forman ya sea
en la C
1
, en la C
2
o en la C
3
, en la primera hay 300 pesos, en la segunda
200 y en la tercera 175. El dinero que hay en una ventanilla se reparte entre
todos los que se hayan formado en ella.
Ejercicio 5.14. En cualquier juego de ventanillas simetrico, considere un
perl de estrategias mixtas tal que le de el mismo pago a todos los jugadores,
de tal manera que se reparten entre todos la ganancia total existente. Es
necesariamente un equilibrio de Nash (em) ese perl?
Ejercicio 5.15. Demuestre la armaci on d) de la proposici on 5.4.2.
Ejercicio 5.16. Supongamos que, en un juego rectangular nito,

son equilibrios de Nash en estrategias puras. Sea

= x

+ (1 x)

,
con x [0, 1] Es

un equilibrio de Nash en estrategias mixtas? Por


que?
Ejercicio 5.17. Conteste si cada una de las armaciones siguientes es falsa
o verdadera y demuestre que su respuesta es correcta.
a) Un juego rectangular nito siempre tiene equilibrios de Nash en es-
trategias puras.
241
242 Estrategias Mixtas
b) Un juego rectangular innito nunca tiene equilibrios de Nash en es-
trategias puras.
c) Si, en el algoritmo de reajuste de Nash, se ha llegado a un perl X

,
para el que todos los n umeros c
j

j
son cero, X

es un equilibrio de Nash del


juego.
Ejercicio 5.18. Un problema de opci on m ultiple.
Elija la respuesta correcta y justique por que lo es.
a) Si en un juego de dos personas las parejas (

X
1
,

X
2
) y (

X
1
,

X
2
) son
equilibrios de Nash en estrategias mixtas, entonces tambien lo son (

X
1
,

X
2
)
y (

X
1
,

X
2
).
b) Si en un juego de dos personas las parejas (

X
1
,

X
2
) y (

X
1
,

X
2
) son
equilibrios de Nash en estrategias mixtas, entonces (

X
1
,

X
2
) y (

X
1
,

X
2
)
nunca son equilibrios.
c) Si en un juego de dos personas las parejas (

X
1
,

X
2
) y (

X
1
,

X
2
) son
equilibrios de Nash en estrategias mixtas, a veces (

X
1
,

X
2
) y (

X
1
,

X
2
) tam-
bien lo son y a veces no lo son.
Ejercicio 5.19. Demuestre que si el jugador i tiene dos estrategias puras
i
y
i
tales que
i
(

i
)
i
(


i
) para toda D, con la desigualdad
estricta para alguna

, entonces no puede existir un equilibrio de Nash (em)
X

tal que el jugador x


i
b
i
> 0.
Utilice esta propiedad para encontrar todos los equilibrios de Nash (em)
del juego
entrar no entrar
regalar muestras
publicidad escrita
publicidad en radio y tv
_
_
(35, 25) (80, 0)
(30, 10) (60, 0)
(40, 10) (50, 0)
_
_
Ejercicio 5.20. Suponga un juego n-personal simetrico, donde cada jugador
tiene como conjunto de estrategias a 1, 2 y sea x (0, 1) tal que
n1

k=0
_
n 1
k
_
x
k
(1 x)
n1k
_

j
(s
k
[ 1)
_
=
242
Mezclando y Jugando en el largo Plazo 243
n1

k=0
_
n 1
k
_
x
k
(1 x)
n1k
_

j
(s
k
[ 2)
_
,
donde
j
(s
k
[ 1) signica el pago para el jugador j en una partida en que s
k
personas, distintas que j, y j mismo eligieron la estrategia 1, mientras que
n1s
k
eligieron la estrategia 2.
j
(s
k
[ 1) tiene un signicado semejante,
con j eligiendo la estrategia 2.
Demuestre que el perl en estrategias mixtas donde cada jugador elige
la estrategia mixta (x, 1 x) es un equilibrio de Nash en estrategias mixtas.
243
244 Comportamiento Conservador
244
Captulo 6
Comportamiento
Conservador
6.1. Discusi on del Problema
Un jugador tambien puede comportarse en forma conservadora en es-
trategias mixtas. Es decir, tiene la opci on de considerar que todos los dem as
jugadores est an unicados en su contra, como si se tratara de un juego
bipersonal de suma cero. Las estrategias conservadoras mixtas del jugador
j son aquellas que le permiten ganar lo m aximo posible, cuando se basan
s olo en sus propias fuerzas, sin esperar apoyo de nadie m as. A dicha m axima
ganancia se le llama el m aximo asegurable y es un marco de referencia que
le permitir a decidir si es conveniente abandonar su actuar solitario para
aceptar un pacto propuesto por otros jugadores.
Para algunos juegos, la actitud conservadora, de no conar m as que en
s mismo, no es propia de un paranoico, sino que signica actuar en forma
optima. Desde luego, entre estos juegos est an los bipersonales de suma cero,
pero existen muchos otros, y en este captulo trataremos de caracterizarlos.
Para dichos juegos, los perles de estrategias mixtas conservadoras guardan
una estrecha relaci on con los equilibrios de Nash.
Como discutimos en el captulo 1, cada jugador j puede imaginar que
est a involucrado en el juego bipersonal de suma cero que consiste en que el
mismo es uno de los jugadores y el otro es un equipo formado por todos los
dem as.
Trabajaremos con conceptos, resultados y demostraciones formalmente
an alogos a los que aparecieron en las secciones 1.4 y 1.5, aunque, por supuesto,
generalizados y con resultados m as fuertes. De ah, el interes en abordar la
245
246 Comportamiento Conservador
problem atica.
Para precisar las cosas, recordemos lo que hicimos en el captulo 1. Pense-
mos que (N, D
j

jN
, ) es el conicto en el que un conjunto de jugadores
est a involucrado, y que cada jugador construye el juego siguiente:

j
= (j, N j, D
j
, D
j
, ), donde
D
j
= D
1
D
2
... D
j1
D
j+1
... D
n
.
Sea
j
=
_

1
,
2
, ...,
j1
,
j+1
, ...,
n
_
, entonces

j
_

j
,
j
_
=
j
_

1
,
2
, ...,
j1
,
j
,
j+1
, ...,
n
_
y

j
_

j
,
j
_
=
j
_

1
,
2
, ...,
j1
,
j
,
j+1
, ...,
n
_
.
Tambien, la siguiente notaci on es util para el caso de las estrategias
mixtas.
M
j
= M
1
M
2
...M
j1
M
j+1
... M
n
,
X
j
=
_
X
1
, X
2
, ..., X
j1
, X
j+1
, ..., X
n
_
,

E
j
_
X
j
, X
j
_
= E
j
_
X
1
, X
2
, ..., X
j1
, X
j
, X
j+1
, ..., X
n
_
y

E
j
_
X
j
, X
j
_
= E
j
_
X
1
, X
2
, ..., X
j1
, X
j
, X
j+1
, ..., X
n
_
.
Por otro lado, al enfrentarnos, ahora, a conjuntos innitos de estrategias,
ya no resulta inmediato asegurar la existencia y validez de los conceptos, re-
sultados y demostraciones de las secciones mencionadas del primer captulo,
sino que se requiere una matem atica m as compleja.
La estructura del captulo es la siguiente: En la secci on 6.2, denimos el
m aximo asegurable para cada jugador en estrategias mixtas y las estrate-
gias mixtas conservadoras. En la secci on 6.3, caracterizamos a los juegos
en los que hay antagonismo entre los participantes, en el marco de las es-
trategias mixtas, y estudiamos la relaci on entre los perles de estrategias
conservadoras y los equilibrios de Nash, en este tipo de juegos. Por ultimo,
en la secci on 6.4 estudiamos algunos metodos para calcular las estrategias
mixtas conservadoras y el m aximo asegurable (em) en juegos rectangulares
nitos.
6.2. Estrategias Mixtas Conservadoras
Generalizaremos a estrategias mixtas las deniciones y resultados que
se obtuvieron para estrategias puras en las secciones 1.4 y 1.5 del captulo
1. En primer lugar, encontraremos cu al es el mejorpago que un jugador
puede obtener por sus propias fuerzas en este contexto.
246
Mezclando y Jugando en el largo Plazo 247
Denici on 6.2.1. El n umero real a es asegurable en estrategias mixtas
(em) para el jugador j, si existe

X
j
M
j
, tal que E
j
_
X

X
j
_
a para
toda X M.
Para empezar a entender la diferencia que hay entre lo que ocurre en
estrategias mixtas y lo que ocurre en estrategias puras, observemos el juego
del volado. Recordemos su matriz:
aguila sol
aguila
sol
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
En el captulo 1, pudimos saber que ambos jugadores, I y II, tenan
como m aximo asegurable, en estrategias puras, un pago de 1. Esto cambia
en estrategias mixtas. Si los jugadores I y II escogen las estrategias mixtas
(x, 1 x) y (y, 1 y), respectivamente, el pago esperado para el jugador I
ser a 4xy + 2x + 2y 1. Por lo que si eligiera x (0, 1), la ganancia m as
peque na posible que obtendra I es:
mn
y
4 xy + 2 x + 2y 1 =
_
_
_
0 > 1 si x =
1
2
2 x 1 > 1 si 0 < x <
1
2
2 x + 1 > 1 si
1
2
< x < 1
Es decir, en estrategias mixtas, en sentido estricto, el jugador I siem-
pre obtiene un pago esperado mayor que -1, el m aximo que aseguraba en
estrategias puras, para cualquier x (0, 1).
En el ejemplo 1.3.2 c), ocurre algo similar,
cort es descort es
cort es
descort es
_
(1, 1) (0, 2)
(2, 0) (5, 5)
_
En estrategias puras, lo m aximo que puede asegurar el jugador I es -1.
Con estrategias mixtas, este jugador puede asegurar cantidades mayores.
En este caso, no basta que x, la probabilidad con que el jugador I elige ser
cortes, este en el intervalo abierto (0, 1), para que asegure un pago esperado
mayor que 1, pero si x est a en
_
3
5
,
7
8

, el jugador I asegurar a un pago


esperado mayor que -1.
Sea
_
N, D
j

jN
,
_
un juego rectangular nito cualquiera y conside-
remos

A
j
, el conjunto de todas las cantidades asegurables para el jugador j
en estrategias mixtas. Recordemos que en el captulo 1, al conjunto de las
247
248 Comportamiento Conservador
cantidades asegurables para el jugador j en estrategias puras, lo denotamos
como

A

j
. Queremos ver si, tambien, se puede hablar del m aximo de

A
j
.
Por lo pronto, como en la secci on 1.4, podremos asegurar la existencia de su
supremo.
Proposici on 6.2.2. Existe el supremo de

A
j
.
Demostraci on.

A
j
no es vaco, pues

A

j


A
j
ya que, si a

A

j
, existe
j
tal
que
j
_


j
_
a, para toda D.
Sea X M, X =
_
X
1
, X
2
, ..., X
n
_
, con X
k
=

j
D
j
x
k

j
. Para toda
D, =
_

1
,
2
, ...,
n
_
,
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

n
j
_


j
_
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

na
y

D
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

n
j
_


j
_

D
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

na

D
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

na = a

D
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

n = a.
Pero,

D
x
1

1
x
2

2
...x
j1

j1
x
j+1

j+1
...x
n

n
j
_


j
_
= E
j
_
X


j
_
.
Por lo que, para toda X M, E
j
_
X


j
_
a, o lo que es lo mismo,
a

A
j
y

A

j


A
j
. Es decir,

A
j
,= .
Por otro lado, recordemos que Max
j
denota a m ax
D

j
() que es una cota
superior de

A

j
. Tambien Max
j
es una cota superior de

A
j
, pues si a

A
j
,
existe

X
j
tal que E
j
_
X

X
j
_
a. Entonces,
E
j
_
X

X
j
_
=

D
x
1

1
x
2

2
... x
j

j
...x
n

n
j
()

D
x
1

1
x
2

2
... x
j

j
...x
n

nMax
j
= Max
j
a
Es decir,

A
j
es un subconjunto de n umeros reales no vaco y acotado
superiormente, por lo que existe el supremo de

A
j
.
Denotemos como v
j
al supremo de

A
j
.
Por otro lado, podemos seguir el enfoque en el cual los jugadores miden
la bondad de sus estrategias por el riesgo que corren al elegirlas. Es decir,
248
Mezclando y Jugando en el largo Plazo 249
comparando los peores pagos esperados que se pueden obtener con cada una
de ellas y, entonces, buscar el mejor de todos esos malos pagos posibles. Esta
es la famosa idea del maxmin que trabajamos para las estrategias puras en
el captulo 1 y que ahora extendemos para las estrategias mixtas. Veamos
antes que este maxmin se puede denir, tambien para las estrategias mixtas.
Como habamos visto en la secci on 5.5, las funciones E y E
j
(para toda
j) son continuas. Dada X M, las funciones E
j
_
X [
_
: M
j
R denidas
como
E
j
_
X [
_ _
X
j
_
= E
j
_
X

X
j
_
son tambien continuas, pues son restricciones de las E
j
. Adem as, los con-
juntos M
j
son compactos, as que todas las funciones mencionadas alcanzan
sus respectivos mnimos. Podemos entonces considerar, para cada jugador
j, las funciones de valor real h
j
, con dominio en M
j
, denidas como
h
j
_

X
j
_
= mn
XM
E
j
_
X

X
j
_
.
En otras palabras, para cada estrategia mixta

X
j
del jugador j, existe
el peor pago posible que puede obtener el jugador al usarla.
Ahora nos interesa la existencia de estrategias de j que le aseguren el
mejor de los peores pagos. Por ello, nos ocupamos de la continuidad de h
j
.
Proposici on 6.2.3. Las funciones h
j
son continuas en M
j
.
Demostraci on. Sabemos que E
j
es una funci on continua denida en el com-
pacto M, as que es uniformemente continua.
Dada > 0, sea

el tama no de la vecindad correspondiente a la con-


tinuidad uniforme de E
j
. Sean Y
j1
y Y
j2
dos estrategias mixtas de j tales que
_
_
Y
j1
Y
j2
_
_
<

, entonces para cada X M,


_
_
_
X

Y
j1
_

_
X

Y
j2
__
_
<

, por lo que para cada X M,


_
_
E
j
_
X

Y
j1
_
E
j
_
X

Y
j2
__
_
< .
Asimismo, para cada X M,
_
_
E
j
_
X

Y
j1
__
_
<
_
_
E
j
_
X

Y
j2
__
_
<
_
_
E
j
_
X

Y
j1
__
_
+.
Por lo tanto,
_
_
_
_
mn
XM
E
j
_
X

Y
j1
_
_
_
_
_
<
_
_
_
_
mn
XM
E
j
_
X

Y
j2
_
_
_
_
_
<
_
_
_
_
mn
XM
E
j
_
X

Y
j1
_
_
_
_
_
+.
O lo que es lo mismo, dada > 0, existe

, tal que si
_
_
Y
j1
Y
j2
_
_
<

,
entonces
_
_
h
j
_
Y
j1
_
h
j
_
Y
j2
__
_
< , es decir h
j
es continua en M
j
.
249
250 Comportamiento Conservador
Tenemos, entonces, el siguiente corolario:
Corolario 6.2.4. En cualquier juego rectangular nito, para j N, existe
m ax
X
j
M
j
_
h
j
_
X
j
__
.
Si X
j
es tal que m ax
X
j
M
j
h
j
_
X
j
_
= h
j
_
X
j
_
, j logra alcanzar de los
males el menos en X
j
.
El valor m ax
X
j
M
j
h
j
_
X
j
_
se denota como m ax
X
j
M
j
_
mn
XM
E
j
_
X

X
j
_
_
o bien
como m ax
X
j
M
j
mn
XM
E
j
_
X

X
j
_
, lo que, en el folklore, se conoce con el nombre
de maxmin en estrategias mixtas.
De nuevo, como en estrategias puras, tenemos que estas dos formas con-
servadoras de actuar, la del supremo del conjunto de las cantidades ase-
gurables en estrategias mixtas y la del maxmin en estrategias mixtas con-
ducen a lo mismo, es decir,
Proposici on 6.2.5. v
j
= m ax
X
j
M
j
_
mn
XM
E
j
_
X

X
j
_
_
.
La demostraci on es formalmente identica a la proposici on an aloga para
estrategias puras (1.4.3) y, en ella, se hace ver que cada jugador j tiene al
menos una estrategia mixta que le garantiza un pago esperado al menos de
v
j
= m ax
X
j
M
j
_
mn
XM
E
j
_
X

X
j
_
_
,
independientemente de lo que elijan los dem as jugadores.
Diremos que v
j
es el m aximo asegurable para j en estrategias
mixtas y que las estrategias mixtas conservadoras de j son aquellas
que le garantizan un pago esperado al menos de v
j
.
Dado un juego rectangular =
_
N, D
j

jN
,
_
, denotamos como
C
j
() al conjunto de estrategias mixtas conservadoras del jugador j. El
conjunto C
j
() no es vaco.
Proposici on 6.2.6. Dado un juego rectangular =
_
N, D
j

jN
,
_
,
C
j
() es compacto y convexo.
Demostraci on. Es claro que C
j
() es un conjunto acotado, pues est a con-
tenido en M
j
que es acotado.
Consideremos una sucesi on
_
X
j (1)
, X
j(2)
, .., X
j (k)
, ...
_
, tal que con-
verge a X
j
, con X
j (i)
C
j
() para todo i.
250
Mezclando y Jugando en el largo Plazo 251
Como E
j
es continua, lm
i
E
j
_
X

X
j (i)
_
= E
j
_
X

X
j
_
.
Para todo i = 1, 2, ...y todo perl X, E
j
_
X

X
j (i)
_
v
j
, de modo que
lm
i
E
j
_
X

X
j (i)
_
v
j
.
Es decir, para todo X M, E
j
_
X

X
j
_
v
j
, por lo que X
j
C
j
(). Es
decir, C
j
() es cerrado, por lo tanto, es compacto.
Supongamos, ahora, que

X
j
y

X
j
son estrategias mixtas conservadoras
del jugador j y que t [0, 1]. Consideramos t

X
j
+(1 t)

X
j
.
Para todo X M,
E
j
_
X

X
j
+ (1 t)

X
j
_
=
tE
j
_
X

X
j
_
+ (1 t) E
j
_
X

X
j
_
tv
j
+ (1 t) v
j
= v
j
.
Es decir, t

X
j
+(1 t)

X
j
C
j
(). O sea C
j
() es convexo.
Tambien podemos generalizar a estrategias mixtas la proposici on 1.4.4.
para establecer que, en los equilibrios de Nash en estrategias mixtas, los
jugadores tienen un pago esperado al menos de v
j
. La demostraci on es in-
mediata e identica a la de 1.4.4.
Proposici on 6.2.7. Si X

es un equilibrio de Nash en estrategias mixtas,


entonces E
j
(X

) v
j
.
En lo relativo al c alculo del m aximo asegurable de un jugador j, un
problema al que es frecuente enfrentarse es el gran tama no de muchos jue-
gos. Estudiamos, en el captulo 1, que los jugadores se pueden deshacer de
sus estrategias dominadas para calcular su m aximo asegurable en un juego
m as peque no que el original. En el caso de las estrategias mixtas, resulta
mucho m as fastidioso el trabajo con juegos grandes y, por ello, resulta util
generalizar el resultado y lo hacemos con la proposici on siguiente.
Proposici on 6.2.8. En cualquier juego = (N, D
1
, D
2
, ..., D
n
, ):
a) Si
j
est a dominada por

j
, entonces el m aximo asegurable(em) y las
estrategias conservadoras(em) para j en son los mismos que en
(N,
_
D
1
, D
2
, ..., D
j

_

j
_
, ..., D
n
_
,

D),
251
252 Comportamiento Conservador
donde D = D
1
D
2
... D
j

_

j
_
... D
n
.
b) Consideremos el juego

j
= (j, N j, D
j
, D
j
,
_

j
,
j
=
j
_
),
si

j
domina a

j
, ambas en D
j
, entonces el m aximo asegurable y las
estrategias conservadoras para j son los mismos en que en
(j, N j, D
j
, D
j

_

j
_
,
_

D ,
j

D
_
),
con D = D
j

_
D
j

_

j
__
.
Demostraci on. a)
j
_

j
_

j
_


j
_
para toda D.
Sea D
j
= D
1
... D
j1
D
j+1
... D
n
.
Entonces, para toda X M,

D
j
x
1

1
...x
n

n
_
_
_

j
D
j
b
j

x
j

j
_

j
_
+x
j
b
j

j
_

j
_
_
_
_

D
x
1

1
x
2

2
...x
j1

j1
x
j

j
x
j+1

j+1
...x
n

n
j
_

j
_
.
Por lo tanto, tenemos que para toda X
j
M
j
,
mn
XM
j

D
j
x
1

1
...x
n

n
_
_
_

j
D
j
b
j

x
j

j
_

j
_
+x
j
b
j

j
_

j
_
_
_
_
mn
XM

D
x
1

1
x
2

2
...x
j1

j1
x
j

j
x
j+1

j+1
...x
n

n
j
_

j
_
.
Entonces el m aximo sobre las X
j
M
j
de
_
_
mn
XM

Dj
x
1

1
...x
n

n
_
_

j
D
j
b
j

x
j

j
_

j
_
+x
j
b
j

j
_

j
_
_
_
_
_
es mayor o igual que el m aximo sobre las X
j
M
j
de
mn
XM

D
1
D
2
.....Dn
x
1

1
x
2

2
...x
j1

j1
x
j

j
x
j+1

j+1
...x
n

n
j
_

j
_
.
252
Mezclando y Jugando en el largo Plazo 253
La desigualdad contraria es evidente, por lo que hemos llegado a que el
m aximo asegurable en estrategias mixtas para el jugador j y las estrategias
conservadoras en el juego original son las mismas que en el juego que resulta
de eliminar las estrategias puras combinadas de los jugadores restantes. La
demostraci on del inciso b es an aloga.
A continuaci on, con el prop osito de simplicar el c alculo de las v
j
, obte-
nemos un importante resultado general que nos permite encontrar lo peor
que le puede ocurrir a j al escoger una de sus estrategias mixtas, calculando
unicamente los pagos que obtiene cuando el jugador N j se limita a
elegir estrategias puras. Es decir,
m ax
X
j
M
j
_
mn
XM
E
j
_
X

X
j
_
_
= m ax
X
j
M
j
_
mn
D
E
j
_

X
j
_
_
.
El resultado ser a de gran utilidad para establecer, en la secci on 6.4, algunos
metodos para calcular el m aximo asegurable y las estrategias conservadoras
de un jugador y se desprende inmediatamente de la proposici on siguiente.
Proposici on 6.2.9. Para toda X
j
en M
j
, mn
XM
E
j
_
X

X
j
_
= mn
D
E
j
_

X
j
_
.
Demostraci on. Para mantener, en forma explcita, las acciones de j y las de
N j, en lugar de utilizar las notaciones
_
X

X
j
_
y
_
X

X
j
_
, usemos
_
X
j
, X
j
_
.
Para toda X
j
M
j
,
E
j
_
X
j
,

X
j
_
=

j
D
j
x
j

j
E
j
_

j
,

X
j
_

j
D
j

x
j

j mn

j
D
j
E
j
_

j
,

X
j
_
= mn

j
D
j
E
j
_

j
,

X
j
_
.
Es decir, mn
X
j
M
j
E
j
_
X
j
,

X
j
_
mn

j
D
j
E
j
_

j
,

X
j
_
.
Pero, como D
j
M
j
, entonces,
mn
X
j
M
j
E
j
_
X
j
,

X
j
_
mn

j
D
j
E
j
_

j
,

X
j
_
.
Por lo tanto , mn
X
j
M
j
E
j
_
X
j
,

X
j
_
= mn

j
D
j
E
j
_

j
,

X
j
_
.
6.3. Equilibrio de Nash en Juegos Antag onicos
Cuando los jugadores estaban limitados a sus estrategias puras, se ca-
racteriz o a los juegos en los que exista un antagonismo de intereses entre los
253
254 Comportamiento Conservador
participantes. Lo mismo haremos en el contexto de las estrategias mixtas.
Es aqu donde puede establecerse plenamente el tan evidente antagonismo
que caracteriza a los juegos bipersonales de suma cero. Recordemos que con
las estrategias puras unicamente en un peque no n umero de juegos biperso-
nales de suma cero, cuya matriz tena punto silla, exista dicho antagonismo.
Por otro lado estudiaremos el antagonismo, en estrategias mixtas, de otros
juegos, para los que no resulta tan evidente. En los juegos antag onicos, po-
dremos justicar que hay un subconjunto de equilibrios de Nash que deben
ser desechados y otro subconjunto que debe ser seleccionado como la solu-
ci on del juego. Este ultimo es el de los perles en los que todos los jugadores
act uan conservadoramente en estrategias mixtas.
En el captulo 1, denotamos como Max a la m axima ganancia conjunta
en estrategias puras y utilizamos este n umero para clasicar a los juegos en
antag onicos y no antag onicos, respecto a dichas estrategias. Es f acil probar
que Max es tambien la m axima ganancia conjunta en estrategias mixtas y
que tambien nos sirve para establecer una clasicaci on an aloga entre los
juegos.
Proposici on 6.3.1. Max = m ax
D

jN

j
() = m ax
XM

jN
E
j
(X).
Demostraci on. Para cada D,

jN
E
j
() =

jN

j
().
Por lo que, Max = m ax
D

jN
E
j
().
Como el conjunto de perles de estrategias puras es, en este contexto,
un subconjunto del de perles de estrategas mixtas, entonces
m ax
D

jN
E
j
() m ax
XM

jN
E
j
(X).
Por otro lado, para toda X en M,

jN
E
j
(X) =

jN

D
x
1

1
x
2

2
...x
n

n
j
() =

D
x
1

1
x
2

2
...x
n

jN

j
()

D
x
1

1
x
2

2
...x
n

nm ax
D

jN
E
j
() = m ax
D

jN
E
j
() .
Por lo que, m ax
XM

jN
E
j
(X) m ax
D

jN
E
j
().
Es decir, m ax
XM

jN
E
j
(X) = m ax
D

jN
E
j
() = Max.
De nuevo, podremos establecer nuestra vieja desigualdad, ahora en relaci on
con las estrategias mixtas, aquella que deca que la suma de los m aximos ase-
gurables es menor o igual que la m axima ganancia conjunta que fue tan im-
portante, en estrategias puras, para clasicar a los juegos entre antag onicos
y no antag onicos.
254
Mezclando y Jugando en el largo Plazo 255
Proposici on 6.3.2.

jN
v
j
Max.
Demostraci on. Sea

X =
_

X
1
,

X
2
, ....,

X
n
_
tal que, para toda j N,

X
j
es conservadora.
Por lo que, para toda j N, E
j
_

X
_
v
j
, entonces,

jN
E
j
_

X
_

jN
v
j
.
Pero Max

jN
E
j
_

X
_
, entonces Max

jN
v
j
.
Entonces, podemos dividir, otra vez, a los juegos en dos clases ajenas.
Una clase, la de aquellos juegos en los que los jugadores, actuando cada uno
con sus propias fuerzas, se reparten toda la m axima ganancia conjunta, la
otra clase, la de los dem as juegos, en los que con actuaciones conservadoras
no pueden obtener una ganancia conjunta tan alta como Max, por lo que
queda un sobrante. Es natural esperar que la situaci on ser a la misma que
la que se presentaba con las estrategias puras. Es decir, en la primera clase
de juegos, los jugadores tienen intereses antag onicos, pues ninguno tiene
esperanza de obtener una ganancia mayor que su m aximo asegurable, ya
que s olo sera posible obligando a otro jugador a obtener un pago menor
que su propio m aximo asegurable, cosa que nadie permitira, pues cada uno
tiene en sus manos la garanta de no ganar menos que este m aximo.
Como en todo este captulo, las deniciones, resultados y demostraciones
son an alogos a las de estrategias puras. Dejaremos varias de dichas demostra-
ciones como parte de los ejercicios de este captulo, para que el lector re-
fresque el tema y la tecnica utilizada.
Denici on 6.3.3. Un juego (N, D
j

jN
, ) es antag onico en estrategias
mixtas (em) si se cumple que

jN
v
j
= Max.
Proposici on 6.3.4. Sea (N, D
j

jN
, ) antag onico (em).
a) Si X

en M es un equilibrio de Nash (em), entonces E


j
(X

) = v
j
.
b) Si X

en M es un perl de estrategias conservadoras (em), entonces


E
j
(X

) = v
j
.
255
256 Comportamiento Conservador
De nuevo el concepto de punto silla (em) est a intimamente ligado al de
antagonismo en estrategias mixtas.
Denici on 6.3.5. a)

X en M es punto silla de la funci on de pago esperado
E
j
, si para toda X M y para toda X
j
M
j
,
E
j
_

X
j
_
E
j
_

X
_
E
j
_
X

X
j
_
.
b)

X en M es punto silla (em) del juego (N, D
j

jN
, ) si es punto
silla de las funciones de pago esperado de cada uno de los jugadores.
Observemos que, para los juegos bipersonales de suma cero, basta pedir
que

X sea punto silla de la funci on de pago esperado del jugador 1, para
que lo sea del jugador 2.
Proposici on 6.3.6. Si el juego (N, D
j

jN
, ) es antag onico (em), en-
tonces tiene punto silla (em).
Proposici on 6.3.7. Un juego bipersonal de suma cero es antag onico (em)
si y s olo si la funci on de pago esperado del jugador 1 tiene punto silla.
Proposici on 6.3.8. En un juego bipersonal de suma cero, X

es punto silla
(em) del juego si y solo si X

es equilibrio de Nash (em).


Demostraci on. Si X

es punto silla (em), entonces, para toda X


1
M
1
y
para toda X
2
M
2
, se cumplen:
E
1
_
X
1
, X
2
_
E
1
_
X
1
, X
2
_
(1a)
E
1
_
X
1
, X
2
_
E
1
_
X
1
, X
2
_
. (1b)
Si X

es equilibrio de Nash (em), para toda X


1
M
1
y para toda
X
2
M
2
, se cumplen:
E
1
_
X
1
, X
2
_
E
1
_
X
1
, X
2
_
(2a)
E
2
_
X
1
, X
2
_
E
2
_
X
1
, X
2
_
(2b)
Las desigualdades 1a y 2a son iguales. Como el juego es bipersonal de suma
cero, podemos traducir a 2b en terminos de la ganancia del jugador 1. Lo
que la transforma en
E
1
_
X
1
, X
2
_
E
1
_
X
1
, X
2
_
.
Al multiplicar los dos lados de la desigualdad por -1, esta se convierte, en
E
1
_
X
1
, X
2
_
E
1
_
X
1
, X
2
_
.
Desigualdad que es la misma que 1b.
256
Mezclando y Jugando en el largo Plazo 257
El siguiente resultado se conoce como el teorema de von Neumann [55]
de los juegos bipersonales de suma cero.
Teorema 6.3.9 (von Neumann). Todo juego bipersonal de suma cero es
antag onico (em). O, lo que es equivalente, en un juego bipersonal de suma
cero (1, 2 , D
1
, D
2
, ), (
2
=
1
), se cumple que
m ax
X
1
M
1
_
mn
X
2
M
2
E
1
_
X
1
, X
2
_
_
= mn
X
2
M
2
_
m ax
X
1
M
1
E
1
_
X
1
, X
2
_
_
.
Demostraci on. Para todo juego nito existe al menos un equilibrio de Nash
en estrategias mixtas. En los juegos bipersonales de suma cero, cualquier
equilibrio de Nash es punto silla (em) (proposici on 6.3.8). Entonces, todo
juego bipersonal de suma cero tiene al menos un punto silla y, recordan-
do la proposici on 6.3.7, sabemos que todo juego que tenga punto silla es
antag onico (em).
Es decir, v
1
+v
2
= 0. O lo que es lo mismo, v
1
= v
2
.
v
2
= m ax
X
2
M
2
_
mn
X
1
M
1
E
2
_
X
1
, X
2
_
_
= m ax
X
2
M
2
_
mn
X
1
M
1
_
E
1
_
X
1
, X
2
__
_
.
Recordemos que para cualquier funci on f : S R,
mn
xS
(f (x)) = m ax
xS
f (x) y m ax
xS
f (x) = mn
xS
f (x) .
Aplicando esta propiedad, tenemos:
m ax
X
2
M
2
_
mn
X
1
M
1
_
E
1
_
X
1
, X
2
__
_
= m ax
X
2
M
2
_
m ax
X
1
M
1
E
1
_
X
1
, X
2
_
_
=
= mn
X
2
M
2
_
m ax
X
1
M
1
E
1
_
X
1
, X
2
_
_
.
Por lo tanto,
m ax
X
1
M
1
_
mn
X
2
M
2
E
1
_
X
1
, X
2
_
_
= mn
X
2
M
2
_
m ax
X
1
M
1
E
1
_
X
1
, X
2
_
_
.
En la jerga de teora de juegos, este resultado se expresa diciendo que en
los juegos bipersonales de suma cero el maxmin es igual al minmax o que el
juego tiene valor.
Observaci on 6.3.1. En este texto hemos establecido la demostraci on del
teorema de von Neumann como un corolario del teorema de existencia de
equilibrios de Nash. Sin embargo, el segundo es de 1951, mientras que el
257
258 Comportamiento Conservador
primero es de 1928. La primera demostraci on de von Neumann utiliza, tam-
bien, el teorema de punto jo de Brouwer. Existen otras demostraciones que
no recurren a ning un teorema de punto jo, sino a una matem atica mucho
m as elemental. El mismo Von Neumann dio la primera demostraci on ele-
mental en 1938. David Gale [21] da una elegante interpretaci on geometrica
de dicha demostraci on que se basa en el teorema del hiperplano de apoyo,
es decir en los teoremas de alternativa que fundamentan la teora de la pro-
gramaci on lineal.
La demostraci on de J. von Neumann del teorema 6.3.9, con la inter-
pretaci on geometrica de D. Gale sigue las ideas siguientes: Las columnas de
la matriz A
(j)
, j = I, II son vectores, v
1
, v
2
, ..., v
m
, en R
l
j
, l
j
es el n umero
de estrategias de j. Los vectores v
i
determinan un hiperpoliedro convexo
C.
C =
_
x R
l
j

x =
m

i=1

i
v
i
, con
i
0 y
m

i=1

i
= 1
_
.
Se considera una translaci on de C hasta un cierto C
w
, de tal manera que
un hiperplano de apoyo separe C
w
del ortante negativo.
Para representar geometricamente los razonamientos, pensemos que I
tiene s olo dos estrategias y II tiene m. Entonces v
1
, v
2
, ..., v
m
est an en R
2
y
determinan un polgono convexo (ver gura 6.3.1). Entonces, con la traslaci on
wu, donde u = (1, 1), se construye C
w
, de tal manera que es posible escoger
una recta L que pasa por el origen la cu al separa a C
w
del primer cuadrante
negativo
_
R
2

_
(gura 6.3.2). Si x es un vector semipositivo perpendicular a
L y situado del mismo lado que C
w
, entonces x hace un angulo no obtuso
con todos los vectores de C
w
(x (v
i
wu) 0 i) y ning un angulo agudo
con vectores de R
2

(gura 6.3.3).
El argumento algebraico general es el de un teorema de alternativa que
dice que o bien
m

i=1
x
i
(v
i
wu)

0 tiene una soluci on no negativa
o bien
x(v
i
wu) 0 para todo i tiene soluci on semipositiva.
Se puede, entonces, escoger x tal que
m

i=1
x
i
= 1 y xv
i
w para todo i.
Por lo tanto, existe una estrategia mixta X
j
de j, tal que,
X
j
A
(j)
(w, w, ..., w) = w(1, 1, ..., 1).
258
Mezclando y Jugando en el largo Plazo 259
v
3
v
v
v
1
v
m
2
4
Figura 6.3.1:
Para toda X
j
, X
j
A
(j)
X
j
w(1, 1, ..., 1) X
j
= w.
An alogamente, existe X
j
tal que
A
(j)
X
j
w(1, 1, ..., 1) y,
para toda X
j
, X
j
A
(j)
X
j
w.
Es decir, para toda X
j
M
j
y para toda X
j
M
j
,
X
j
A
(j)
X
j
w X
j
A
(j)
X
j
.
v
m
v
3
v
1
v
2
v
4
C C
w
L
u
Figura 6.3.2:
259
260 Comportamiento Conservador
Las siguientes proposiciones, 6.3.10 y 6.3.11, resumen la caracterizaci on
principal de los equilibrios de Nash (em) en los juegos antag onicos (em).
La mayora de los resultados est a demostrado en las proposiciones anteri-
ores y las demostraciones de los restan son formalmente iguales a las de las
proposiciones an alogas, con estrategias puras, de la secci on 1.5. La primera
proposici on es sobre los juegos bipersonales de suma cero y la equivalencia
entre punto silla (em), equilibrios de Nash (em) y parejas de estrategias
conservadoras.
C
w
N
x
Figura 6.3.3:
Proposici on 6.3.10. En un juego bipersonal de suma cero las tres arma-
ciones siguientes son equivalentes para un perl de estrategias mixtas X

:
a) X

es punto silla del juego.


b) X

es equilibrio de Nash.
c) X

est a formado por estrategias conservadoras.


El resultado para juegos antag onicos no bipersonales es menos fuerte.
Proposici on 6.3.11. Si un juego es antag onico en estrategias mixtas, en-
tonces se cumplen:
a) X

es punto silla (em) del juego si y solo si X

es un perl de es-
trategias mixtas conservadoras.
260
Mezclando y Jugando en el largo Plazo 261
b) Si X

es punto silla (em) del juego, entonces X

es equilibrio de
Nash (em).
Como en la secci on 1.5, los equilibrios de Nash, ahora en estrategias mix-
tas, pueden no estar formados por estrategias conservadoras, sin embargo, el
pago que obtiene el jugador j, en dichos equilibrios, es v
j
. Esto signica que,
en los equilibrios no conservadores, el pago v
j
no est a garantizado contra
los cambios de estrategias de los otros jugadores. Por lo que j preferir a los
equilibrios de Nash (em) que son perles de estrategias conservadoras.
6.4. Calculando Estrategias Conservadoras
El enfoque del m aximo asegurable, como ya hemos repetido, est a basado
en que cada jugador j construye un juego imaginario, bipersonal de suma
cero; es un juego en el que j se concibe s olo contra el mundo, es decir,
en ese juego, el mismo es el primer jugador y el segundo son todos los
jugadores restantes unidos contra el, buscando lograr que j gane lo menos
posible. Por ello, los metodos para calcular el m aximo asegurable de un
jugador son aquellos que resuelven los juegos bipersonales de suma cero.
En aras de no complicar la notaci on, al exponer estos metodos de soluci on,
aparecer an s olo dos jugadores, pero del segundo, excepto en el caso de que,
en realidad, estemos frente a un juego bipersonal de suma cero, no nos
interesan sus estrategias conservadoras y su m aximo asegurable, pues es un
jugador imaginario que unicamente existe en la mente del jugador j.
Establecemos, antes de entrar en materia, un resultado muy util en los
metodos que estudiaremos, pues permite reconocer cuando estamos frente
a las estrategias conservadoras de alg un jugador y a su m aximo asegurable,
en un juego bipersonal de suma cero.
Proposici on 6.4.1. Consideremos un juego bipersonal de suma cero. Sean
X

y Y

estrategias mixtas del jugador 1 y 2, respectivamente, y v un n umero


real. Una condici on necesaria y suciente para que X

y Y

sean estrategias
conservadoras y v el m aximo asegurable (em) del jugador 1 es que, para toda

1
D
1
y para toda
2
D
2
, se cumpla que
E
1
_

1
, Y

_
v E
1
_
X

,
2
_
.
Demostraci on. Si X

y Y

son conservadoras y v es el m aximo asegurable


(em) del jugador 1, tenemos:
E
1
(X

, Y ) v para toda Y M
2
. En particular, E
1
_
X

,
2
_
v para
toda
2
D
2
.
261
262 Comportamiento Conservador
E
2
(X, Y

) v para toda X M
1
. En particular, E
2
_

1
, Y

_
v
para toda
1
D
1
. O lo que es lo mismo E
1
_

1
, Y

_
v para toda
1
D
1
.
Juntando las dos desigualdades, tenemos que
E
1
_

1
, Y

_
v E
1
_
X

,
2
_
para toda
1
D
1
y toda
2
D
2
.
Supongamos ahora que para X

, Y

y v se cumplen las desigualdades


E
1
_

1
, Y

_
v E
1
_
X

,
2
_
para toda
1
D
1
y toda
2
D
2
.
Consideremos una estrategia mixta Y , arbitraria para 2, Y =

2
D
2
y

2
2
.
Entonces, por el lado derecho de la desigualdad, para toda
2
D
2
,
y

2v y

2E
1
_
X

,
2
_
y

2
D
2
y

2v

2
D
2
y

2E
1
_
X

,
2
_
,
por lo que v E
1
(X

, Y ) para toda Y M
2
.
Esto quiere decir que
v

A
1
y v v
1
. (6.4.1a)
Consideremos, ahora, el segundo lado de la desigualdad, es decir,
E
1
_

1
, Y

_
v para toda
1
D
1
.
La desigualdad se traduce en E
2
(, Y

) v para toda
1
D
1
.
Si X es una estrategia mixta arbitraria para 1,
X =

1
D
1
x

1
1
y procediendo como antes llegamos a que
E
2
(X, Y

) v para toda X M
1
.
Es decir
v

A
2
y v v
2
= v
1
, por lo que v v
1
. (6.4.1b)
6.4.1a y 6.4.1b llevan a que v es el m aximo asegurable para el jugador 1 y a
que X

y Y

son estrategias conservadoras para 1 y 2, respectivamente.


Ya es claro, para nosotros, que cuando la matriz A
(j)
del juego imaginario
que construye un jugador j tiene un punto silla
_

j
,
j
_
, entonces
j
es
una estrategia conservadora de j y a
(j)

j
es su m aximo asegurable. Nos
interesan metodos para encontrarlos, cuando la matriz del jugador 1 no tiene
punto silla.
262
Mezclando y Jugando en el largo Plazo 263
El metodo algebraico para encontrar estrategias conservado-
ras en juegos 2 2
Supongamos que el juego bipersonal de suma cero imaginario que cons-
truye el jugador j tiene como matriz de pagos:
A
(j)
=
_
(a
11
, b
11
) (a
12
, b
12
)
(a
21
, b
21
) (a
22
, b
22
)
_
.
Si A
(j)
tiene un punto silla en
_

i,

k
_
,

i es una estrategia pura conser-


vadora de j y a
b
i
b
k
es su m aximo asegurable. Supongamos el caso en que la
matriz no tiene punto silla.
Si j, el jugador del que calcularemos alguna estrategia conservadora y el
m aximo asegurable, elige la estrategia mixta (x, 1x) y el jugador imaginario
elige (y, 1 y), el pago para j ser a:
E
j
((x, 1 x) , (y, 1 y)) =
xya
11
+x(1 y) a
12
+ (1 x) ya
21
+ (1 x) (1 y) a
22
=
y (xa
11
+ (1 x) a
21
) + (1 y) (xa
12
+ (1 x) a
22
).
Cuando ambos jugadores han elegido una pareja de estrategias con-
servadoras, a las que denotamos como (x

, 1 x

) y (y

, 1 y

), respecti-
vamente. Se tiene, por la proposici on 6.3.4b, la igualdad 6.4.2:
y

(x

a
11
+ (1 x

) a
21
) + (1 y

) (x

a
12
+ (1 x

) a
22
) = v
j
.
Pero, adem as,
x

a
11
+ (1 x

) a
21
v
j
y
x

a
12
+ (1 x

) a
22
v
j
.
Ninguna de las dos desigualdades puede ser estricta pues 6.4.2 no podra
cumplirse, as que tenemos las ecuaciones 6.4.3:
x

a
11
+ (1 x

) a
21
= v
j
x

a
12
+ (1 x

) a
22
= v
j
o, lo que es lo mismo, el sistema de ecuaciones
x

(a
11
a
21
) v
j
= a
21
x

(a
12
a
22
) v
j
= a
22
.
El determinante del sistema no puede ser cero, pues de lo contrario el
juego tendra punto silla.
De donde, obtenemos las soluciones de x

y v
j
:
x

=
a
22
a
21
a
11
a
21
a
12
+a
22
v
j
=
a
22
a
11
a
21
a
12
a
11
a
21
a
12
+a
22
.
263
264 Comportamiento Conservador
Si el jugador N j fuera realmente un jugador se puede hacer lo
an alogo con su pago y proceder como con j.
Recordemos el ejemplo 1.3.2 c del captulo 1 que est a expresado en la
matriz
Cort es Descort es
Cort es
Descort es
_
(1, 1) (0, 2)
(2, 0) (5, 5)
_
.
Como el conicto es simetrico, el juego imaginario que construyen los
dos jugadores es el mismo, el de la matriz
A
(j)
=
_
1 0
2 5
_
.
Entonces la estrategia mixta conservadora para ambos es (
5
8
,
3
8
) y el
m aximo asegurable es
5
8
.
Otra forma de escribir las f ormulas anteriores es:
(x

, 1 x

) =
JA
(j)
JA
(j)
J
t
v
j
=
det
_
A
(j)
_
JA
(j)
J
t
Donde J es el vector (1, 1), A
(j)
es la matriz adjunta de A
(j)
. Esta forma
de escribir la estrategia conservadora y el m aximo asegurable de un jugador
en un juego 2 2 se puede generalizar.
Caracterizaci on de las Estrategias Conservadoras de un Juego
Para cualquier juego rectangular nito tal que JA
(j)
J
t
,= 0, la f ormu-
la anterior es v alida para calcular estrategias conservadoras del jugador j.
Para demostrarlo, necesitamos introducir, aunque no la demostraremos, una
propiedad de los subconjuntos no vacos, compactos y convexos de R
n
.
Sea S R
m
, decimos que K (S) S es el conjunto extremo de S, si
para cualquier punto z de K (S), no es posible encontrar dos puntos distintos
de S, tales que z es el punto medio entre ellos.
Teorema 6.4.2. Sea S R
m
no vaco, compacto y convexo, entonces su
conjunto extremo K (S) es no vaco y cualquier elemento de S es una com-
binaci on convexa de elementos de K (S).
264
Mezclando y Jugando en el largo Plazo 265
Dado un juego rectangular , el conjunto de estrategias conservadoras
de j, C
j
(), es no vaco, compacto y convexo, entonces cualquier elemen-
to de C
j
() es una combinaci on convexa de elementos de K (C
j
()). Es
clara la importancia de K(C
j
()) para caracterizar a todas las estrategias
conservadoras del jugador j.
Teorema 6.4.3. Supongamos que
_
N, D
j

jN
,
_
es tal que el m aximo
asegurable en estrategias mixtas del jugador j no es cero. Sean X
j
y Y
j
estrategias conservadoras de j y N j, respectivamente, X
j
est a en
K (C
j
()) y Y
j
est a en K(C
j
()) si y s olo si existe B, una subma-
triz cuadrada no singular de A
(j)
, tal que v
j
=
det(B

)
JrB

J
t
r
,

X
j
=
JrB

JrB

J
t
r
y

Y
j
=
JrB
t
JrB

J
t
r
, donde r es el orden de B, J
r
es el vector de coordenadas
1, de dimensi on r, y los vectores

X
j
(

Y
j
) son los vectores X
j
(Y
j
),
despues de suprimir las coordenadas correspondientes a los renglones elimi-
nados (columnas eliminadas) de A
(j)
para obtener B.
El lector interesado puede ver la demostraci on en el libro de J.C.C. McK-
insey [36].
Consideremos un ejemplo. Supongamos que la matriz A
(j)
representa el
juego imaginario construido por el jugador j dentro de un juego nito de
cualquier tama no y que nos proponemos encontrar el m aximo asegurable de
j y el conjunto de sus estrategias conservadoras.
A
(j)
podra ser, el ejemplo 6.4.1,
_
_
1 2 2
3 0 1
3 3 0
_
_
C omo la matriz no tiene punto silla, el juego no tiene estrategias puras
conservadoras y no tenemos que considerar submatrices de orden 1. Tene-
mos que trabajar con las 9 submatrices no singulares de orden 2 y con la
matriz A
(j)
. Las submatrices de orden 2 son:
_
1 2
3 0
_
,
_
1 2
3 1
_
,
_
2 2
0 1
_
,
_
1 2
3 3
_
,
_
1 2
3 0
_
,
_
2 2
3 0
_
,
_
3 0
3 3
_
,
_
3 1
3 0
_
,
_
0 1
3 0
_
.
Aplicando las f ormulas a la matriz A
(j)
, llegamos al n umero 1, y a las
estrategias (
1
5
,
3
5
,
1
5
) y (
1
3
,
2
3
, 0) y, por los teoremas ?? y 6.4.3, llegamos a la
conclusi on de que son el m aximo asegurable de j y elementos de K (C
j
())
265
266 Comportamiento Conservador
y K(C
j
()), respectivamente. La estrategia de N j s olo interesa para
hacer ver que 1 es el m aximo asegurable del jugador j y (
1
5
,
3
5
,
1
5
) es una
de sus estrategias conservadoras, pero como N j es s olo un jugador
imaginario, no nos dice nada sobre el comportamiento de alg un otro jugador.
Examinando las matrices de orden 2, llegamos a la conclusi on de que la
unica que nos sirve es
_
3 0
3 3
_
y nos lleva al vector
_
2
3
,
1
3
_
. La submatriz
en cuesti on es el resultado de tachar el primer rengl on, y la tercera columna
de A
(j)
, entonces
_
0,
2
3
,
1
3
_
y (
1
5
,
3
5
,
1
5
) pertenecen al conjunto extremo de
C
1
(). Es decir,
K (C
j
()) =
__
0,
2
3
,
1
3
_
, (
1
5
,
3
5
,
1
5
)
_
y
C
j
() =
_
x
_
0,
2
3
,
1
3
_
+ (1 x) (
1
5
,
3
5
,
1
5
) [x [0, 1]
_
=
__
1x
5
,
x+9
15
,
2x+3
15
_
[x [0, 1]
_
y v
1
= 1.
El metodo geometrico para calcular estrategias conservadoras
en juegos 2 m y m2
Ahora estudiaremos un metodo que se puede emplear cuando, en el juego
imaginado por j, alguno de los dos jugadores, j o N j, tiene solo dos
estrategias. En ese caso, c omo hicimos en el metodo de la cruz gamada, pode-
mos establecer una correspondencia biunvoca entre las estrategias mixtas
del jugador con dos estrategias puras y el intervalo [0, 1].
Supongamos que es j el que tiene dos estrategias y que A
(j)
es su matriz
de pago en el juego bipersonal de suma cero que construye, cuando piensa
conservadoramente.
A
(j)
=
_
a
11
a
12
... a
1s
a
21
a
22
... a
2s
_
.
Para cada estrategia pura
j
del jugador N j, tenemos que la
esperanza de pago de j, en funci on de la probabilidad x que j le dara a su
primera estrategia, est a dada por la ecuaci on de la recta l
_

j
_
. Es decir,
E
j
_
(x, 1 x) ,
j
_
= xa
1
j + (1 x) a
2
j = (a
1
j a
2
j ) x +a
2
j ,
de donde
y

j (x) = (a
1
j a
2
j ) x +a
2
j .
Podemos encontrar f acilmente m ax
X
j
M
j
_
mn
XM
E
j
_
X

X
j
_
_
, determinan-
do, para cada valor de x, el peor pago que puede recibir j, cuando N j
266
Mezclando y Jugando en el largo Plazo 267
elige dentro del conjunto de sus estrategias puras. Es decir, encontrar para
cada x, el mn

j
y

j ( x). Posteriormente encontrar la x que maximiza entre


esos peores, o sea m ax
x[0,1]
_
mn

j
y

j ( x)
_
. Ver gura 6.4.1
l 1 ( )
l 2 ( )
l 5 ( )
l 3 ( )
l 4 ( )
0 1
Figura 6.4.1:
El otro caso consiste en que j fuera el de m as de dos estrategias puras y
Nj tuviera 2. Entonces encontraramos el m aximo asegurable v
j
del ju-
gador cticio Nj, como se realiz o anteriormente para j y una estrategia
mixta conservadora para ese jugador inventado y, con ello, conseguimos el
m aximo asegurable de j que es v
j
y una ecuaci on vectorial, cuya soluci on
es una estrategia conservadora para j. Ilustremos con un ejemplo.
Ejemplo 6.4.1. Consideremos una versi on ligeramente distinta del multi-
citado ejemplo del monopolio y su competidor. Cambiamos los pagos para
que la matriz de pago del segundo jugador no tenga estrategias dominadas
ni punto silla. Obteniendo, por ejemplo, la matriz
_
_
(35, 25) (80, 0)
(30, 10) (90, 0)
(45, 10) (40, 1)
_
_
.
Supongamos que queremos encontrar el m aximo asegurable y una es-
trategia conservadora para el competidor, entonces el juego imaginario es:
A
(C)
=
_
25 10 10
0 0 1
_
.
267
268 Comportamiento Conservador
l 1 ( )
l 2 ( )
l 3 ( )
1
21
x = *
0 1
Figura 6.4.2:
Las rectas a tomar en cuenta son:
y = 25x,
y = 10x y
y = 10x + (1 x) = 11x + 1,
cuyas gr acas podemos observar en la gura 6.4.2.
El maxmin se alcanza para x

tal que 10x

= 11x

+1, es decir x

=
1
21
.
Es claro que el m aximo asegurable de C es
10
21
y su unica estrategia
conservadora es (
1
21
,
20
21
).
Estudiemos, ahora, el problema para el monopolio. La matriz del juego
que imagina es
A
(M)
=
_
_
35 80
30 90
45 40
_
_
.
El monopolio tiene m as de dos estrategias puras, tenemos que resolver
el juego para su oponente cticio y usar esta soluci on.
Es decir, para
A
(M)
=
_
35 30 45
80 90 40
_
.
Las rectas a que se da lugar y que se ilustran en la gura 6.4.3 son:
y = 35x + (1 x) (80) = 45x 80,
y = 30x + (1 x) (90) = 60x 90 y
y = 45x + (1 x) (40) = 5x 40.
268
Mezclando y Jugando en el largo Plazo 269
l 2 ( )
l 1 ( )
l 3 ( )
*
x
0
1
Figura 6.4.3:
Entonces, el m aximo asegurable para N j se alcanza en x

tal que
5x

40 = 45x

80, es decir, en x

=
4
5
.
Por lo tanto, una estrategia conservadora para N j es (
4
5
,
1
5
) y su
m aximo asegurable es 44, y v
M
el m aximo asegurable para M es 44.
Y tenemos que 35y

1
+ 30y

2
+ 45 (1 y

1
y

2
) = 44 y
80y

1
+ 90y

2
+ 40 (1 y

1
y

2
) = 44
Con soluci on y

1
=
1
10
y y

2
= 0. O sea que la estrategia conservadora de
M es (
1
10
, 0,
9
10
).
Realmente, lo que estamos haciendo, es resolver geometricamente un
problema de programaci on lineal. El problema general de encontrar el m axi-
mo asegurable y una estrategia conservadora de un jugador para cualquier
juego rectangular nito se puede establecer como un problema de progra-
maci on lineal.
El Calculo del Maximo Asegurable y de Estrategias Conser-
vadoras como un Problema de Programaci on Lineal
Podemos decir brevemente que un programa lineal consiste en el pro-
blema de maximizar (o minimizar) una funci on lineal donde las variables
del problema est an sujetas a restricciones expresadas como desigualdades
en terminos, tambien, de funciones lineales.
Una presentaci on usual de un problema de programaci on lineal consis-
tira en buscar, dentro de un conjunto caracterizado por m restricciones
de la forma
n

i=1
b
ij
x
i
c
j
, un vector (x
1
, x
2
, ..., x
n
) R
n
, con coordenadas
269
270 Comportamiento Conservador
no negativas, que maximice a una funci on de la forma
n

i=1
a
i
x
i
. En forma
taquigr aca esto se expresa de la manera siguiente:
PL1)
Maximizar
n

i=1

d
i
x
i
Sujeto a
n

i=1

b
i j
x
i
c
j
para j = 1, 2, ...m y
x
i
0 para i = 1, 2, ...n.
La funci on que se desea maximizar, osea
n

i=1

d
i
x
i
, se llama la funci on
objetivo.
El conjunto de vectores (x
1
, x
2
, ..., x
n
) en R
n
que cumplen las restric-
ciones
n

i=1

b
i j
x
i
c
j
para j = 1, 2, ...m y x
i
0 para i = 1, 2, ...n se llama el
conjunto factible del problema.
Supongamos que tenemos el problema de encontrar el m aximo asegurable
y las estrategias conservadoras de un jugador que tiene a la matriz A
(j)
co-
mo juego imaginario. Sabemos, por los resultados obtenidos en este captulo,
que X
j
=
_
x
j
1
, x
j
2
, ..., x
j
n
_
es una estrategia mixta conservadora para el ju-
gador j y v
j
es su m aximo asegurable si y s olo si X
j t
A
(j)
v
j
y v
j
es el
m aximo elemento de

A
j
, el conjunto de cantidades asegurables para j. Por
el momento consideremos que v
j
es no negativo.
Los supuestos descritos arriba nos permiten plantear nuestro problema
como el de maximizar la funci on lineal f
_
x
j
1
, x
j
2
, ..., x
j
n
, v
j
_
= v
j
sujeta a las
restricciones X
j t
A
(j)
v
j
y X
j
M
j
. La funci on objetivo es lineal y el
conjunto factible se puede expresar a traves de desigualdades en las que s olo
aparecen funciones lineales. Es decir, el problema de calcular estrategias
mixtas conservadoras y el m aximo asegurable se puede plantear como el
siguiente problema de programaci on lineal
PLJ1)
Maximizar v
j
270
Mezclando y Jugando en el largo Plazo 271
Sujeto a

i
a
(j)
i k
x
j
i
+v
j
0 para k = 1, 2, ..., l
j
,

i
x
j
i
1,

i
x
j
i
1,
x
j
i
0 para i = 1, 2, ..., l
j
v
j
0
La proposici on que enunciamos a continuaci on permite encontrar v
j
en
el caso general.
Proposici on 6.4.4. Sea =
_
N, D
j

jN
,
_
un juego rectangular nito.
Consideremos el juego

=
_
N, D
j

jN
,

_
, en el que los conjuntos de
jugadores y de estrategias puras son los mismos que en y, para todo jugador
i, con i ,= j,

i
() =
i
() para toda D, y para j,

j
() =
j
() +
para toda D. Entonces una estrategia

X
j
M
j
es conservadora para j
en , si y s olo si lo es en

. Adem as, si v
j
es el m aximo asegurable de j en
, entonces v
j
+ lo es en

.
El algoritmo usual para calcular soluciones de problemas de progra-
maci on lineal es el llamado simplex que describimos a grandes rasgos a
continuaci on. Supongamos que tenemos uno de estos problemas PL1 de
maximizar
n

i=1
d
i
x
i
y que el sistema de restricciones se puede escribir como
b
11
x
1
+b
21
x
2
+... +b
n1
x
n
c
1
b
12
x
1
+b
22
x
2
+... +b
n2
x
n
c
2
...
b
1m
x
1
+b
2m
x
2
+... +b
nm
x
n
c
m
.
Es claro que existe un vector de variables (u
1
, u
2
, ..., u
m
) R
m
que
permiten escribir las restricciones como igualdades:
b
11
x
1
+b
21
x
2
+... +b
n1
x
n
c
1
= u
1
b
12
x
1
+b
22
x
2
+... +b
n2
x
n
c
2
= u
2
...
b
1m
x
1
+b
2m
x
2
+... +b
nm
x
n
c
m
= u
m
271
272 Comportamiento Conservador
junto con x
i
0 para i = 1, 2, ...n.
A las u
i
se les llama variables de holgura.
Caractericemos las soluciones del problema con el metodo siguiente: En
primer lugar, escribimos el problema PL1 en forma de la tabla PL2.
PL2)
x
1
x
2
... x
n
1
b
11
b
21
... b
n1
b
12
b
22
... b
n2
... .... ... ...
b
1m
b
2m
... b
nm
c
1
c
2
...
c
m
= u
1
= u
2
...
= u
m
d
1
d
2
... d
n
0 = w
La tabla representa un sistema de m + 1 ecuaciones con n + m + 1
inc ognitas x
1
, x
2
, ..., x
n
, u
1
, u
2
, ..., u
m
y w. A lo m as que podemos aspirar es
a resolver m+ 1 en terminos de las restantes.
Supongamos que tenemos la soluci on de m + 1 variables, por ejemplo
s
1
, s
2
, ..., s
m
(variables b asicas) y w, en terminos de r
1
, r
2
, ..., r
n
(variables
no b asicas). Esto determina un problema equivalente que expresamos con
una tabla an aloga a la anterior.
PL3)
r
1
r
2
... r
n
1
b

11
b

21
... b

n1
b

12
b

22
... b

n2
... .... ... ...
b

1m
b

2m
... b

nm
c

1
c

2
...
c

m
= s
1
= s
2
...
= s
m
d

1
d

2
... d

n
= w
Supongamos que hemos llegado a un problema PLk en el que las c

i
y
las d

i
resultaron no positivas, a este problema lo llamaremos PL*. El vector
en el que todas las r
i
son cero es la soluci on de PL*, ya que se cumplen: a)
(0, 0, ..., 0) pertenece al conjunto factible de PL3, b) (0, 0, ..., 0) determina
que todas las variables s
i
sean no negativas pues son iguales a las c

i
y c) la
funci on objetivo de PL*, d

1
r
1
+d

2
r
2
+... +d

n
r
n
+ = w, alcanza su m aximo
en (0, 0, ..., 0). La soluci on de PL1 se encuentra a partir de la soluci on de
PL*. Entonces necesitamos un metodo para construir el problema PL*. Este
metodo es el llamado algoritmo simplex.
272
Mezclando y Jugando en el largo Plazo 273
El conjunto de puntos que cumplen las restricciones de todos los proble-
mas es el mismo en PL1 y en PL*, s olo que expresado en forma distinta.
Dicho conjunto es un hiperpoliedro convexo. Los puntos correspondientes a
que n de las variables sean cero representan a los vertices del hiperpoliedro.
Entonces, interpretado geometricamente, el metodo simplex consiste en ir
probando sistem aticamente si los vertices del poliedro son soluci on o no lo
son. Nosotros hemos justicado que cuando la columna correspondiente a
1 y el rengl on correspondiente a la funci on objetivo tienen todos los coe-
cientes no positivos, el vertice determinado por igualar a cero a las variables
distintas de w y expresadas en terminos de las restantes es la soluci on. La
demostraci on de que en un problema de programaci on lineal, la soluci on
siempre se encuentra en un vertice se puede consultar en cualquier libro de
programaci on lineal.
Un paso pivote es un procedimiento para cambiar una sola de las varia-
bles b asicas.
Supongamos que, despues del paso s, hemos obtenido la forma PLs del
problema y para el paso s + 1 queremos convertir a la variable b asica s
j
en
una no b asica substituyendola por una de las r
l
. Habr a que tomar, entonces,
como pivote el termino jl, es decir, la variable l de la ecuaci on j-esima.
Consideremos dicha ecuaci on,
n

i=1
b

ij
r
i
c

j
= s
j
,
y supongamos que b

lj
,= 0. Entonces
n

i=1, i=l
b

i j
b

l j
r
i
+
1
b

l j
s
j

1
b

l j
c

j
= r
l
.
Esta nueva ecuaci on ser a la j-esima ecuaci on de PLs+1
C omo cambian las restantes ecuaciones? Por ejemplo, en la ecuaci on
kesima, k ,= j, hay que substituir la variable r
l
por
n

i=1, i=l
_

i j
b

l j
_
r
i

1
b

l j
s
j
+
1
b

l j
c

j
.
Entonces reagrupando terminos y considerando a s
j
la l-esima variable
no b asica, tenemos para k = 1, 2, ..., j 1, j + 1, ..., n
n

i=1, i=l
_
b

i k

lk
b

i j
b

l j
_
r
i

kl
b

l j
s
j

_
c

lk
c

j
b

l j
_
= s
k
.
273
274 Comportamiento Conservador
Quedando la nueva tabla como:
r
1
... s
j
... r
n
1
b

1 1
b

l j
b

l1
b

1 j
b

l j
...
b

1l
b

l j
...
b

n 1
b

l j
b

l1
b

nj
b

l j
c

1
b

l j
b

l1
c

j
b

l j
= s
1
... ... ... ... ... ... ...
b

1 j
b

l j
...
1
b

l j
...
b

lnj
b

l j
c

lj
b

l j
= r
l
... ... ... ... ... ... ...
b

1 m
b

l j
b

lm
b

1 j
b

l j
...
b

ml
b

l j
...
b

n m
b

l j
b

lm
b

n l
b

l j
c

m
b

l j
b

lm
c

j
b

l j
= s
m
d

1
b

l j
d

l
b

1 j
b

l j
...
d

l
b

l j
...
d

1
b

l j
d

l
b

n j
b

l j
b

l j
d

l
c

j
b

l j
= w
Ejemplo 6.4.2. Consideremos que el juego imaginario del jugador j est a da-
do por la matriz:
_
_
3 6 1 4
5 2 4 2
1 4 3 5
_
_
.
Supongamos que queremos encontrar el m aximo asegurable y alguna es-
trategia conservadora del jugador I, plateando un problema de programaci on
lineal y utilizando el algoritmo simplex.
Tendramos el problema PLJ1 siguiente:
Maximizar v
M
Sujeto a
(3x
1
+ 5x
2
+x
3
v
M
) 0
(6x
1
+ 2x
2
+ 4x
3
v
M
) 0
(x
1
+ 4x
2
+ 3x
3
v
M
) 0
(4x
1
+ 2x
2
+ 5x
3
v
M
) 0
(x
1
+x
2
+x
3
) 1 0
(x
1
+x
2
+x
3
) 1 0
x
i
0 para i = 1, 2, 3
v
M
0
274
Mezclando y Jugando en el largo Plazo 275
Construimos la tabla PLJ2:
x
1
x
2
x
3
v
M
3 5 1 1
6 2 4 1
1 4 3 1
4 2 5 1
1 1 1 0
= s
1
= s
2
= s
3
= s
4
= 1
Los asteriscos marcan el termino elegido para pivote.
PLJ3:
x
1
x
2
x
3
s
4
1 3 4 1
2 0 1 1
3 2 2 1
4 2 5 1
1 1 1 0
= s
1
= s
2
= s
3
= v
M
= 1
PLJ4:
x
1
x
2
1 s
4
3 7 4 1
3 1 1 1
1 4 2 1
1 3 5 1
1 1 1 0
= s
1
= s
2
= s
3
= v
M
= x
3
Colocamos la tabla en la forma usual para llegar a la soluci on con nuevos
pasos de simplex PL4:
x
1
x
2
s
4
1
3 7 1
3 1 1
1 4 1
1 1 0
4
1
2
1
= s
1
= s
2
= s
3
= x
3
1 3 1 5 = v
M
275
276 Comportamiento Conservador
PLJ5:
x
1
x
2
s
3
1
4 3 1
4 3 1
1 4 1
1 1 0
4
1
2
1
= s
1
= s
2
= s
4
= x
3
2 1 1 3 = v
M
PLJ6:
x
1
x
2
s
1
1
4 3 1
0 6 1
3 7 1
1 1 0
2
3
4
1
= s
3
= s
2
= s
4
= x
3
2 4 1 1 = v
M
PLJ7:
x
1
s
2
s
1
1
4
1
2

1
2
0
1
6

1
6
3
7
6
1
6
1
1
6
1
6

1
2

1
2

1
2

1
2
= s
3
= x
2
= s
4
= x
3
2
2
3

1
3
3 = v
M
PLJ8:
s
3
s
2
s
1
1
1
4

1
8

1
8
0
1
6

1
6

3
4

19
24
13
24

1
4

1
24
7
24

1
8

1
2

1
8

3
8
= x
1
= x
2
= s
4
= x
3

1
2

5
12

1
12
13
4
= v
M
Entonces, una estrategia conservadora para I es
_
1
8
,
1
2
,
3
8
_
y el m aximo
asegurable es
13
4
.
276
Mezclando y Jugando en el largo Plazo 277
Otros metodos
Desde luego, todos los metodos para calcular equilibrios de Nash sirven
para encontrar el m aximo asegurable y algunas estrategias conservadoras
para un jugador j, ya que en los juegos bipersonales de suma cero coinciden
los equilibrios con las parejas de estrategias conservadoras. Por supuesto,
que s olo servir a la estrategia y el pago de equilibrio de j. En particular, el
de juego cticio (secci on 5.3) es un metodo usual para este prop osito. En
este ultimo algoritmo se introducen cambios para encontrar una subsucesi on
convergente y, adem as, volverlo m as r apido usando el hecho de que se trabaja
con un juego bipersonal de suma cero (el imaginado por j). Consulte los
libros de McKinsey [36], de Owen[43] y de Ventsel [54], en la bibliografa
para estudiar diferentes versiones del algoritmo.
6.5. Ejercicios
Ejercicio 6.1. Considere el juego 1.3.2 c)
Cort es Descort es
Cort es
Descort es
_
(1, 1) (0, 2)
(2, 0) (5, 5)
_
.
Demuestre que si el jugador I elige una estrategia mixta (x, 1 x), con x
en
_
3
5
,
7
8

, el jugador I asegurar a un pago mayor que -1. En que intervalo


tiene que estar la probabilidad que el jugador II le otorgue a la estrategia
Cortes para que asegure un pago mayor que
3
4
?
Ejercicio 6.2. Para los juegos siguientes encuentre el m aximo asegurable en
estrategias mixtas y una estrategia conservadora mixta para cada jugador.
En cada uno conteste las preguntas siguientes: La pareja de estrategias
conservadoras mixtas que encontr o es un equilibrio de Nash? El juego es
antag onico en estrategias mixtas?
a)
1 2
1
2
3
_
_
(5, 2) (0, 3)
(6, 9) (3, 0)
(4, 1) (2, 1)
_
_
.
277
278 Comportamiento Conservador
b)
1 2 3 4
1
2
_
(2, 3) (5, 3) (4, 2) (3, 7)
(5, 1) (1, 4) (2, 0) (5, 3)
_
.
Ejercicio 6.3. Para los juegos siguientes encuentre el m aximo asegurable en
estrategias mixtas y una estrategia conservadora mixtas para cada jugador,
primero con el metodo algebraico y despues con el metodo geometrico La
eneada de estrategias conservadoras mixtas encontrada es un equilibrio de
Nash? El juego es antag onico en estrategias mixtas?
a) Ejemplo 1.3.1 b)

Aguila Sol

Aguila
Sol
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
.
b) Ejemplo 1.3.2 b)
Reducir No Reducir
Reducir
No Reducir
_
(2, 2) (2, 1)
(1, 2) (0, 0)
_
.
Ejercicio 6.4. Para los juegos siguientes encuentre el m aximo asegurable
en estrategias mixtas y una estrategia conservadora mixtas para cada ju-
gador con el metodo general del que habla el teorema 6.4.3 La eneada de
estrategias conservadoras mixtas encontrada es un equilibrio de Nash? El
juego es antag onico en estrategias mixtas?
a) Ejemplo 1.3.5) El supuesto ligue de Nash (N, D
j

jN
, ), donde
N = E
1
, E
2
, E
3
, E
4
, conjunto de 4 estudiantes D
j
= Rubia, ch
1
, ch
2
, ch
3
, ch
4
.
Si para i D
j
, n
i
= #
_

k
= i
_
, la funci on de pago del jugador j se
expresa con la funci on
j
tal que D,

j
() =
_
_
_
1/n
ch
k
si
j
= ch
k
,
0 si
j
= Rubia y n
Rubia
< 4,
1/2 si
j
= Rubia y n
Rubia
= 4.
b) Ejemplo 1.3.7 a Flexibilizaci on del Trabajo.
N = obreros de una planta industrial, n = #N, n q > 1,
278
Mezclando y Jugando en el largo Plazo 279
D
j
= flexible, resiste.

j
() =
_
_
_
0 si
j
= resiste,
x a > 0 si
j
= flexible y n
f
q,
a < 0 si
j
= flexible y n
f
< q.
c) Contaminaci on Ambiental N = habitante de la ciudad de M exico
[posee un autom ovil . Cada uno de ellos tiene que decidir si se transporta
casi siempre en su autom ovil o trata de limitar el uso de este y utilizar el
transporte p ublico.
D
j
= uso intensivo del autom ovil, uso de transporte p ublico.
Si una gran cantidad de personas utilizan intensivamente el auto, el
tr ansito se vuelve insoportable y la contaminaci on de la atm osfera se con-
vierte en da nina para la salud. Denotemos como r a este tope del n umero
de auto dependientes, 0 < r < n.

j
() =
_

_
50 si k

< r y
j
= transporte p ublico,
100 si k

r y
j
= transporte p ublico,
100 si k

r y
j
= auto,
50 si k

> r y
j
= auto,
donde k

= n umero de los que usan intensivamente el auto de acuerdo al


perl de estrategias .
Ejercicio 6.5. a) Sea =
_
N, D
k

kN
,
_
un juego rectangular tal que
existen estrategias puras del jugador j,
j
1
,
j
2
, ...,
j
r
y
j
, para las que se
cumple:
r

i=1
x
i

j
_

j
i
_

j
_


j
_
para toda D y para algunas x
i

i=1,...r
,
con x
i
0 y
r

i=1
x
i
= 1. Demuestre que el m aximo asegurable (em) y las
estrategias conservadoras (em) para j en son los mismos que en
(N,
_
D
1
, D
2
, ..., D
j

_

j
_
, ..., D
n
_
,

D), donde
D = D
1
D
2
... D
j

_

j
_
... D
n
.
b) Sea =
_
N, D
k

kN
,
_
un juego rectangular tal que existen es-
trategias puras del jugador N j
j
1
,
j
2
, ...,
j
r
y
j
, para las que
se cumple
r

i=1
x
i

j
_

j
i
_

j
_


j
_
. Demuestre que el m aximo ase-
gurable y las estrategias conservadoras para j son los mismos en que en
(j, N j, D
j
, D
j

_

j
_
,

D), con D = D
j

_
D
j

_

j
__
.
279
280 Comportamiento Conservador
Ejercicio 6.6. Considere el juego N = I; II, III, D
I
=1, 2, 3,
D
II
= 1, 2, D
III
= 1, 2, 3, 4. La funci on de pago del jugador I, se
muestra en la matriz siguiente:
(1, 1) (1, 2) (1, 3) (1, 4) (2, 1) (2, 2) (2, 3) (2, 4)
1
2
3
_
_
3 5 1 7 8 0 2 10
11
3

7
3
1
15
3
4 0
2
3
11
3
4 6 2 4 2 0 0 6
_
_
.
Calcule el m aximo asegurable del jugador I.
Ejercicio 6.7. Encuentre el m aximo asegurable en estrategias mixtas de
los dos jugadores para el juego:
1 2 3 4
1
2
3
4
5
_
_
_
_
_
_
(3, 3) (4, 4) (1, 1) (5, 5)
(5, 5) (3, 3) (2, 2) (1, 1)
(2, 2) (11, 11) (4, 4) (9, 9)
(1, 1) (1, 1) (1, 1) (1, 1)
(7, 7) (0, 0) (6, 6) (0, 0)
_
_
_
_
_
_
.
Ejercicio 6.8. Demuestre la proposici on 6.2.6 que dice que si X

es un
equilibrio de Nash en estrategias mixtas, entonces E
j
(X

) v
j
.
Ejercicio 6.9. Demuestre que en un juego antag onico (em),
a) si X

es un punto silla, entonces E


j
(X

) = v
j
para toda j.
b) si X

es un equilibrio de Nash en estrategias mixtas, entonces E


j
(X

) =
v
j
para toda j.
c) si X

es tal que X
j
es conservadora para cada j, entonces E
j
(X

) =
v
j
para toda j.
Ejercicio 6.10. Demuestre la proposici on 6.3.6 que dice que si
(N, D
j

jN
, ) es antag onico (em), entonces tiene punto silla (em).
Ejercicio 6.11. Demuestre la proposici on 6.3.7 que dice:
Un juego bipersonal de suma cero es antag onico (em) si y s olo si la
funci on de pago esperado del jugador 1 tiene punto silla (em).
Ejercicio 6.12. Demuestre la proposici on 6.3.10 que dice:
En un juego bipersonal de suma cero las tres armaciones siguientes son
equivalentes para un perl de estrategias mixtas X

:
280
Mezclando y Jugando en el largo Plazo 281
a) X

es punto silla del juego.


b) X

es equilibrio de Nash.
c) X

est a formado por estrategias conservadoras.


Ejercicio 6.13. Demuestre la proposici on 6.3.11 que dice:
Si un juego es antag onico en estrategias mixtas, entonces se cumplen:
a) X

es punto silla (em) del juego si y s olo si X

es un perl de estrate-
gias mixtas conservadoras.
b) Si X

es punto silla (em) del juego, entonces X

es equilibrio de Nash
(em).
Ejercicio 6.14. Justique la validez del metodo geometrico para calcular
las estrategias conservadoras y el m aximo asegurable del jugador j en un
juego 2 m.
Ejercicio 6.15. Calcule el m aximo asegurable y estrategias conservadoras
de los jugadores de un juego de artesanos, con m as de dos jugadores dise nado
por usted.
Ejercicio 6.16. Construya un juego antag onico (em) que tenga dos ju-
gadores, pero que no sea de suma constante y que no sea antag onico (ep).
Ejercicio 6.17. Construya un juego antag onico (em) que tenga m as de dos
jugadores y que no sea antag onico (ep).
Ejercicio 6.18. Considere los juegos siguientes y calcule para cada uno los
m aximos asegurables de todos los jugadores en estrategias puras. Cu ales
de estos juegos son antag onico (ep)?
Calcule para cada juego los m aximos asegurables de todos los jugadores
en estrategias mixtas. Utilice el metodo geometrico y el de programaci on
lineal. Cu ales de estos juegos son antag onico (em)?
a)
1 2 3 4
1
2
_
(0, 4) (7, 1) (3, 1) (1, 5)
(7, 0) (3, 1) (9, 2) (6, 3)
_
.
b) Los 3 capitalistas mayores de un pas tienen gran cantidad de d olares
invertidos en dicho pas y est an obteniendo enormes ganancias. Sin embar-
go, en los ultimos das empiezan a correr fuertes rumores de que se aproxi-
man acontecimientos polticos que pueden poner en peligro sus inversiones.
281
282 Equilibrios Perfectos en Subjuegos
Tienen que decidir i) si sacan sus d olares del pas para proteger su capital,
aunque por alg un tiempo sus ganancias desaparezcan (no habra perdida de
capital) o ii) si asumen el riesgo y dejan sus inversiones donde est an.
La funci on de pago de este conicto puede construirse como

j
_

1
,
2
,
3
_
=
_

_
0 si
j
= sacar,
5 si
j
= no sacar y la mayora no saca,
10
j
= no sacar y la mayora saca.
Ejercicio 6.19. Diga si las siguientes armaciones son falsas o verdaderas
y justique su respuesta.
a) Si (N, D
j
, ) es antag onico en estrategias puras, entonces es an-
tag onico en estrategias mixtas.
b) Si
j
es una estrategia conservadora del jugador j en estrategias puras,
entonces lo es en estrategias mixtas.
c) Si
j
es una estrategia conservadora del jugador j en estrategias mix-
tas, entonces lo es en estrategias puras.
Ejercicio 6.20. Cu al de las cuatro armaciones contrapuestas siguientes
es cierta? Justique su respuesta.
a) El m aximo asegurable en estrategias puras de cualquier jugador j, en
un juego rectangular nito, es igual al m aximo asegurable de j en estrategias
mixtas.
b) El m aximo asegurable en estrategias puras de cualquier jugador j, en
un juego rectangular nito, es mayor al m aximo asegurable de j en estrate-
gias mixtas.
c) El m aximo asegurable en estrategias puras de cualquier jugador j, en
un juego rectangular nito, es menor o igual al m aximo asegurable de j en
estrategias mixtas.
d) La relaci on entre el m aximo asegurable en estrategias puras de un
jugador j y el m aximo asegurable de j, en estrategias mixtas puede ser
mayor, igual o menor, dependiendo del juego y/o del jugador.
282
Captulo 7
Equilibrios Perfectos en
Subjuegos
7.1. Planteamiento del Problema
Como se pudo apreciar en el captulo 5, la forma normal de un juego
puede ser enorme. Desde luego, no es pr actico pasar un juego extensivo
nito de informaci on perfecta a su forma normal. El algoritmo de inducci on
hacia atr as o de Zermelo result o muy util, pues resulta m as f acil construir
un equilibrio en dichos juegos, con dicho algoritmo, en el contexto de las
estrategias puras, en vez de pasar el juego a su forma normal. Adem as,
los equilibrios que se pueden construir con dicho algoritmo, los llamados
equilibrios perfectos en subjuegos, son preferibles a los que no lo son, pues
protegen contra errores a los jugadores. Existen juegos con informaci on no
perfecta, que aparecieron en el captulo 3, para los que tambien, resulta util
dicho algoritmo; pero, en general, cuando no hay informaci on perfecta, puede
haber problemas. Es muy com un que surjan, en el proceso del algoritmo,
subjuegos o juegos podados que no tengan equilibrio de Nash en estrategias
puras y que, por ello, el algoritmo termine con un fracaso. En el contexto
de las estrategias mixtas, en cambio, tenemos la ventaja de que todo juego
nito tiene equilibrio de Nash Podremos, entonces, examinar los subjuegos
de un juego , para construir un buen equilibrio de ?
En todo este captulo, vamos a considerar juegos extensivos que se
pueden descomponer en un vertice B. Recordemos que, en esa situaci on,
cualquier estrategia pura
j
de un jugador, se puede descomponer en una
estrategia para
B
, el subjuego que empieza en B y una estrategia para [B,
el juego que resulta del original , despues de podarle dicho subjuego.
283
284 Equilibrios Perfectos en Subjuegos
Recprocamente, dadas
j
y
j
, estrategias puras de un jugador j,
para el subjuego y para el juego podado, respectivamente, construimos la
composici on (
j
,
j
) para el juego . Estas operaciones fueron la clave
para la construcci on del algoritmo de inducci on hacia atr as o algoritmo de
Zermelo y de los equilibrios perfectos en subjuegos en estrategias puras.
Ahora, generalizamos esos conceptos para las estrategias mixtas.
Sin embargo, las estrategias mixtas de un juego est an construdas
sobre su forma normal que ha perdido informaci on sobre los subjuegos.
Que relaci on podemos establecer entre las estrategias mixtas de y las
de los juegos
B
y /B? Las operaciones de composici on y descomposici on
de estrategias mixtas son difciles y pueden introducirse en formas distintas,
dando lugar a resultados distintos. Nosotros dejaremos este problema para
la ultima secci on del captulo.
En los juegos de memoria o recuerdo perfecto, las estrategias mixtas
toman la forma de estrategias de comportamiento que introdujo Kuhn [30]
y son una generalizaci on natural de las estrategias de un juego extensivo,
como se denieron en ??. En estos juegos (cuando son nitos), en los que las
personas no olvidan lo que ya conocan, el algoritmo de Zermelo en estrate-
gias de comportamiento siempre tiene exito. Por lo que siempre se pueden
construir los equilibrios perfectos en subjuegos en estrategias de compor-
tamiento (o de la mano temblorosa), los que seran seleccionados seg un los
que criterios de Harsanyi y Selten [26]. Estos temas los desarrollaremos en
la secci on ?? y la 7.3. En juegos de memoria no perfecta, los conceptos de
estrategias de comportamiento y mixta no son equivalentes.
Algunos de los juegos m as interesantes de memoria perfecta son los jue-
gos repetidos. Es decir, aquellos juegos que consisten en repetir, ya sea con
horizonte nito o innito, un juego rectangular dado que se llama el juego
estado. Como era de esperarse, en los juegos repetidos aparecen otros equi-
librios adicionales a los del juego estado, pues resulta muy distinto que los
jugadores se enfrenten en una ocasi on unica a que lo hagan en una enorme
cantidad de ocasiones. Muy ilustrativo resulta el que en el dilema del pri-
sionero repetido, con horizonte innito, podamos encontrar equilibrios en los
que se tiene un resultado cooperativo. En general, los juegos repetidos, los
cu ales se estudian en las secciones 7.4 y 7.5, dan lugar a un enfoque din amico
de los conictos. Es una din amica distinta a aquellas que adelantamos en el
captulo 2 y que se estudiar an con m as detenimiento en el captulo 8.
284
Mezclando y Jugando en el Largo Plazo 285
7.2. Estrategias de Comportamiento
Denici on 7.2.1. Una estrategia de comportamiento
j
del jugador j en
el juego extensivo es una funci on que a cada conjunto de informaci on de j
le asocia una distribuci on de probabilidad entre los ndices correspondientes
a ese conjunto de informaci on.
Consideremos la versi on del juego de demandas triviales que est a en la
gura 7.2.1. Esta versi on es un juego nito de informaci on no perfecta, a
diferencia del ejemplo 2.2.11. En el juego de la gura 7.2.1, una estrategia
de comportamiento del campesino es de la forma
((x
1
, 1 x
1
) , (x
2
, x
3
, 1 x
2
x
3
) , (x
4
, 1 x
4
) ,
(x
5
, 1 x
5
) , (x
6
, 1 x
6
) , (x
7
, 1 x
7
) , (x
8
, 1 x
8
) ,
(x
9
, 1 x
9
) , (x
10
, 1 x
10
) , (x
11
, 1 x
11
) , (x
12
, 1 x
12
)),
con x
i
[0, 1], para i = 1, 2, ..., 11, 12.
Al conjunto de estrategias de comportamiento del jugador j lo denotamos
como
j
y al producto cartesiano de los conjuntos de estrategias de compor-
tamiento de los jugadores,
1
...
n
, como . A los elementos de este
ultimo conjunto le llamaremos perles de estrategias de comportamiento.
Dado
j

j
e i I
j
k
denotamos como P

j
_
i

S
j
k
_
a la probabilidad que
la estrategia de comportamiento
j
le asocia al ndice i, si el juego ha llegado
a alg un vertice A S
j
k
. Es decir,
j
_
S
j
k
_
=
_
P

j
_
1

S
j
k
_
, ..., P

j
_
l
_
I
j
k
_

S
j
k
__
.
Donde l
_
I
j
k
_
es el n umero de ndices en I
j
k
.
En el mismo juego de la gura 7.2.1, las estrategias de comportamiento
de la empresa, son de la forma
((y
1
, 1 y
1
) , (y
2
, 1 y
2
) , (y
3
, 1 y
3
) , (y
4
, 1 y
4
) , (y
5
, 1 y
5
) , (y
6
, 1 y
6
)) .
Las estrategias de comportamiento tienen un papel semejante a las es-
trategias de un juego extensivo nito y al igual que estas determinan una
distribuci on de probabilidad entre los vertices nales y se puede construir un
segundo juego rectangular asociado a , es decir una segunda forma normal
que podramos llamar de comportamiento. La construcci on es totalmente
an aloga a la que hicimos en el captulo 3.
As, dados A y B vertices del juego tales que B Alt (A) y una
estrategia de comportamiento , P

(B[A) se dene como


P

(B[A) =
_
P (B[A) si A S
0
,
P

j
_
i

S
j
k
_
si A S
j
k
y (B) = i.
285
286 Equilibrios Perfectos en Subjuegos
iid
ii
da
b b
d d
0
da
b
da
0
da
0 b
a d
0
da
b
da
0 b
d d
0
F
1
F
2
F
3
...
no hace nada
0
0
C
ii i
Ab nab
ac nac
E E
na a
id
i
a na
C C
nab
E E E E
C C
nac
E E
na
ac nac ac nac ac
a a na
C
E E
E
iiid
iii
E
ac nac nac ac
iii
Ab nab Ab
C C C C C C C C
C C
d
1/2x
a na
a na
d d d d d d d d d j j j j j j j j j j j
d j
d
j
demanda
C
i
ida
ii
iida iiida
iii
1/2xb
1/2xda 4/5xda
4/5x
1/5xd
1/5xb
1/2xd 4/5xda 4/5xda
4/5x 4/5x
1/5xd
1/5xb
1/5xd
1/5xb
1/2xda
1/2xb
1/2xda
1/2xb
1/2xda
1/2xb
1/2xda
1/2xb
Figura 7.2.1:
Dados A y B vertices del juego tales que B > A, consideramos la
trayectoria que une al vertice A con el B, C
1
= A, C
2
, ..., C
r
= B y de-
nimos
P

(B[A) = P

(C
2
[C
1
) P

(C
3
[C
2
) ...P

(C
r
[C
r1
) .
Si F T, el conjunto de vertices nales de , entonces P

(F) =
P

(F [U ).
Proposici on 7.2.2. Sea A un vertice no nal y =
_

1
,
2
, ...,
n
_
un
perl de estrategias de comportamiento de . Si F es un vertice nal mayor
286
Mezclando y Jugando en el Largo Plazo 287
que A, entonces P

(F [A) 0 y

FT, F>A
P

(F [A) = 1.
Demostraci on. Para cualquier F T , si C
1
= U, C
2
, ..., C
f
= F es la
trayectoria que une a U con F, es claro que P

(F) 0, pues P

(F) =
P

(C
2
[U ) P

(C
3
[C
2
) ...P

(C
f
[C
f1
) y cada P

(C
k+1
[C
k
) 0.
Consideramos ahora que A es tal que Alt (A) T. Es decir, l
A
la longitud
de la trayectoria menor que une al vertice A con alg un vertice nal F es
igual a 1.
Si A S
0
, entonces

FT, F>A
P

(F) =

FT, FAlt(A)
P

(F) =

C
i
Alt(A)
P (C
i
[A) = 1.
Si A S
j
k
,

FT, F>A
P

(F) =

FT, FAlt(A)
P

(F) =

C
i
Alt(A)
P

(C
i
[A) =

i
i
I
P

j
_
i

S
j
k
_
= 1.
Supongamos que si l
A
es menor que k, entonces

FT, F>A
P

(F) = 1.
Sea A tal que l
A
es k, entonces

FT, F>A
P

(F) =

CAlt(A)

FT, F>C
P

(F) =

CAlt(A)
_
_

FT, F>C
P

(C [A) P

(F [C)
_
_
=

CAlt(A)
P

(C [A)
_
_

FT, F>C
P

(F [C)
_
_
=

CAlt(A)
P

(C [A) = 1.
287
288 Equilibrios Perfectos en Subjuegos
Corolario 7.2.3. Dado =
_

1
,
2
, ...,
n
_
un perl de estrategias de
comportamiento del juego extensivo nito . Para cada vertice F en T,
P

(F) 0 y

FT, F>A
P

(F [A) = 1.
La demostraci on se obtiene aplicando la proposici on 7.2.2 al caso A = U.
En el ejemplo de la gura 7.2.1, consideremos el perl de estrategias de
comportamiento

=
_
_
(
_
1
5
,
4
5
_
,
_
1
3
,
1
6
,
1
2
_
,
_
3
4
,
1
8
_
,
_
1
2
,
1
2
_
,
_
3
7
,
4
7
_
,
_
2
3
,
1
3
_
, (0, 1) , (0, 1) ,
_
1
4
,
3
4
_
,
_
1
2
,
1
2
_
,
_
5
9
,
4
9
_
),
__
1
3
,
2
3
_
,
_
3
5
,
2
5
_
, (0, 1) ,
_
1
2
,
1
2
_
,
_
5
7
,
2
7
_
,
_
1
2
,
1
2
__
_
_
.
Podemos calcular P

(F) para todos los vertices nales del juego. Hag amoslo
para F
1
, F
2
y F
3
P

(F
1
) =
4
5

1
3

3
4

1
3
=
1
15
,
P

(F
2
) =
4
5

1
3

3
4

2
3

1
2

2
3
=
2
45
,
P

(F
3
) =
4
5

1
2

4
7

1
2

4
9
=
16
315
.
La funci on de pago en estrategias de comportamiento es

(c)
: R
n
,
denida como

(c)
() =

FT
P

(F) (F) .
Podemos llamar la forma normal de comportamiento de al juego rec-
tangular
_
N,
j

jN
,
(c)
_
. Este juego rectangular es innito.
Podemos hacer la denici on de equilibrio de Nash en estrategias de com-
portamiento, en la forma natural. La notaci on
_


j
_
tiene el signicado
acostumbrado, es decir,
_

1
,
2
, ...,
j1
,
j
,
j+1
, ...,
n
_
.
Denici on 7.2.4.

es un equilibrio de Nash en estrategias de com-


portamiento si, para todo jugador j,
(c)
j
(

)
(c)
j
_

j
_
, para toda

j

j
.
_
N,
j

jN
,
(c)
_
es tan difcil de trabajar como
_
N, M
j

jN
, E
_
. En
realidad, al trabajar con estrategias de comportamiento no se pasa a ningu-
na forma normal. Cuando son realmente interesantes este tipo de estrategias
es en los juegos de memoria perfecta que son una generalizaci on muy im-
portante de los juegos de informaci on perfecta. Estos juegos son aquellos
en los que cada jugador es una sola persona y no un equipo con m as de
288
Mezclando y Jugando en el Largo Plazo 289
un componente y, adem as, dicha persona no tiene problemas de amnesia.
En este contexto, podremos hablar de equilibrio perfecto en subjuegos en
estrategias de comportamiento y, cuando los juegos de memoria perfecta son
nitos, siempre existe uno de estos equilibrios, estableciendose una genera-
lizaci on del teorema ??. Los equilibrios, del caso nito, se pueden construir
con una nueva versi on del algoritmo de inducci on hacia atr as (Zermelo).
Formalmente:
Denici on 7.2.5. Decimos que un juego extensivo es de memoria perfec-
ta, si para cualesquiera dos vertices A y B del jugador j, tales que A B,
A S
j
k
y B S
j
k

, se cumple que S
j
k

, donde = (C), C Alt (A),


C B y S

es el conjunto de los vertices mayores o iguales que aquellas


alternativas de vertices de S
j
k
que tienen ndice igual a .
Los juegos de informaci on perfecta son de memoria perfecta. Juegos que
no son de informaci on perfecta, pero s de memoria perfecta son el p oker
y, c omo adelant abamos, todos aquellos juegos en que cada jugador es una
sola persona, sin problemas de amnesia. En cambio, si suponemos que las
personas no tienen problemas con su memoria, para que un juego no sea de
memoria perfecta es necesario que alguno de los jugadores sea un equipo con
m as de un componente y que todos ellos tengan que tomar sus decisiones,
sin poder comunicarse entre s. Por ejemplo, el domin o y el bridge no son
de memoria perfecta. Para los que s lo son, las estrategias mixtas resultan
equivalentes a las de comportamiento, pero estas ultimas resultan mucho
m as c omodas de manejar, pues no es necesario trabajar con ninguna forma
normal del juego extensivo. El juego de la gura 7.2.1 es de informaci on no
perfecta, pero de memoria perfecta.
Dado un juego que se puede descomponer en un vertice A y una
estrategia de comportamiento X
j

j
, la operaci on de descomponerla en
una estrategia de comportamiento para
A
y otra para [A y la operaci on
de componer dos estrategias de comportamiento, una para
A
y otra para
[A y obtener una estrategia de comportamiento de se denen en una
forma muy similar a dichas operaciones para las estrategias de un juego
extensivo (ver captulo 3).
Denici on 7.2.6. Sea un juego extensivo que se puede descomponer en
un vertice A y sea X
j
una estrategia de comportamiento de j en el juego .
Podemos considerar la descomposici on de X
j
en X
j
A
y en X
j
[A. Donde X
j
A
es la restricci on de X
j
a la colecci on de conjuntos de informaci on de j que
pertenecen a
A
y X
j
[A es la restricci on de X
j
a la colecci on de conjuntos
de informaci on de j que pertenecen a [A.
289
290 Equilibrios Perfectos en Subjuegos
Denici on 7.2.7. Sea un juego extensivo que se puede descomponer
en un vertice A y sea

X
j
una estrategia de comportamiento de j en el
juego
A
y

X
j
una estrategia de comportamiento de j en el juego [A.
Podemos considerar la composici on de

X
j
y

X
j
, para construir
_

X
j
,

X
j
_
una estrategia de , denida como
_

X
j
,

X
j
_
_
S
j
i
_
=
_
_
_

X
j
_
S
j
i
_
si S
j
i
pertenece a
A
,

X
j
_
S
j
i
_
si S
j
i
pertenece a [A.
Denici on 7.2.8. Un equilibrio de Nash en estrategias de comportamiento
de es perfecto en subjuegos, si la restricci on a cualquier subjuego de es
equilibrio en estrategias de comportamiento de dicho subjuego.
En forma natural, se puede generalizar el algoritmo de inducci on hacia
atr as a un juego de memoria perfecta nito, para construir un perl de
estrategias de comportamiento que tendr a la propiedad de ser equilibrio de
Nash perfecto en subjuegos en estrategias de comportamiento. Esto requiere
una generalizaci on del lema ??, para justicar el nuevo algoritmo.
Lema 7.2.9. Sea un juego extensivo que se puede descomponer en el
vertice A. Para todo perl de estrategias de comportamiento X ,

(c)
(X) =
(c)

(c)
A
(X
A
)
(X [A) .
Demostraci on. Toda X , se puede considerar como la composici on
(X
A
, X [A).

(c)
(X) =

FT
A
P
X
(F) (F) +

FT|A
P
X
(F) (F) =
P
X
(A)
(c)
A
(X
A
) +

FT|A
P
X
(F) (F) .
Por su lado,

(c)
A
(X
A
)
(X [A) = P
X
(A)
(c)
A
(X
A
) +

FT|A
P
X
(F) (F) .
290
Mezclando y Jugando en el Largo Plazo 291
Teorema 7.2.10. Sea un juego que se puede descomponer en A,

X un
equilibrio de Nash en estrategias de comportamiento de
A
, y

X un equilibrio
de Nash en estrategias de comportamiento de

A
(
c
A
(
b
X))
. Entonces (

X,

X)
es un equilibrio de Nash en estrategias de comportamiento de .
Demostraci on. Sea j N y X
j

j
, tenemos que
(c)
j
_
(

X,

X)

X
j
_
=
P

b
b
X[X
j
A

(A)
(c)
j
A
__

X
j
A
__
+

FT|A
P

b
b
X|X
j

(F)
j
(F) .
Como

X es equilibrio de
A
,

(c)
j
A
__

X
j
A
__

(c)
j
A
_

X
_
.
Es decir,

(c)
j
_
(

X,

X)

X
j
_

b
b
X[X
j
A

(A)
(c)
j
A
_

X
_
+

FT|A
P

b
b
X[X
j
A

(F)
j
(F) .
Pero por el lema 7.2.9,
P

b
b
X[X
j
A

(A)
(c)
j
A
_

X
_
+

FT|A
P

b
b
X[X
j
A

(F)
j
(F) =
(c)

(c)
A
(
b
X)
_

X
j
_
.
Adem as,

X es un equilibrio de Nash en estrategias de comportamiento


de

(c)
A
(
b
X)

, por lo que

(c)
j

A
(
b
X)
_

X
j
_

(c)
j

A
(
b
X)
_

X
_
.
Aplicando de nuevo el lema 7.2.9, tenemos

(c)
j

A
(
b
X)
_

X
_
=
(c)
j
_
(

X,

X)
_
.
Uniendo todos los resultados se obtiene, nalmente, que

(c)
j
_
(

X,

X)

X
j
_

(c)
j
_
(

X,

X)
_
,
para todo jugador j y para toda X
j

j
. Es decir, (

X,

X) es un equilibrio
de Nash en estrategias de comportamiento de .
291
292 Equilibrios Perfectos en Subjuegos
7.3. Juegos de Memoria Perfecta
Construiremos, ahora, el algoritmo de Zermelo para juegos de memoria
perfecta.
Algoritmo 4 (Inducci on hacia atr as para estrategias de compor-
tamiento). Sea un juego extensivo nito de memoria perfecta.
Primer paso:Denimos
0
como .
Tenemos dos casos:
a) Si
0
no se puede descomponer,
0
es en esencia un juego rectangu-
lar. Cada jugador tiene un solo conjunto de informaci on. Por el teorema de
Nash, este juego rectangular tiene al menos un equilibrio en estrategias mix-
tas, se elige uno de ellos, digamos X

. Este es un equilibrio en estrategias de


comportamiento de
0
= ; el algoritmo termina con el equilibrio buscado.
b) Si
0
se puede descomponer en al menos un vertice, buscamos un
subjuego
0
A
1
que no se pueda descomponer (siempre existe pues es nito).
Como
0
y
0
A
1
son de memoria perfecta, entonces
0
A
1
es en esencia un
juego rectangular. Cada jugador tiene un s olo conjunto de informaci on. Este
juego rectangular tiene al menos un equilibrio de Nash en estrategias mixtas.
Se elige uno, llamemosle X

A
1
, y construyamos
0

A
1

(c)
A
1

A
1

. Denimos

1
como
0

A
1

(c)
A
1

A
1

.
Paso general: Consideremos que se han dado k pasos del algoritmo, con
lo que se han construido
0
,
1
, ...,
k1
,
k
juegos de memoria perfecta,
tales que, cada
i1
se puede descomponer en un vertice A
i
y
i1
A
i
no se
puede descomponer y que se han elegido X

A
1
, X

A
2
, ..., X

A
k
perles, donde
X

A
i
es un equilibrio de Nash en estrategias mixtas de
i1
A
i
. Adem as,
i
=

i1

A
i

(c)
A
i

A
i

.
Denimos
k+1
como

A
1

(c)
A
1

A
1

A
2

(c)
A
2

A
2

...

A
k

(c)
A
k

A
k

o, lo que es lo mismo, como

A
k

(c)
A
k

A
k

k+1
es de memoria perfecta y tenemos dos casos:
292
Mezclando y Jugando en el Largo Plazo 293
a)
k+1
no se descompone. Como tanto
k
como
k+1
son de memo-
ria perfecta, entonces
k+1
es en esencia un juego rectangular y tiene al
menos un equilibrio de Nash en estrategias mixtas. Elegimos uno de ellos
al que denotamos como X

. El algoritmo termina con la composici on de


X

A
1
, X

A
2
, ..., X

A
k
, X

que es un equilibrio perfecto en subjuegos en estrate-


gias de comportamiento de .
b)
k+1
se puede descomponer en al menos un vertice; buscamos un sub-
juego
k+1
A
k+1
que no se pueda descomponer (siempre existe pues es nito).

k+1
A
k+1
es en esencia un juego rectangular y tiene al menos un equilibrio de
Nash en estrategias mixtas. Elegimos uno de ellos al que denotamos como
X

A
k+1
y denimos
k+2
como

A
1

(c)
A
1

A
1

...

A
k

(c)
A
k

A
k

A
k+1

(c)
A
k+1

A
k+1

o lo que es lo mismo
k+1

A
k+1

(c)
A
k+1

A
k+1

y continuamos con el
paso general, ahora aplicado a
k+2
.
Uno de los primeros criterios de selecci on de Harsanyi y Selten [26] es
preferir los equilibrios perfectos en subjuegos a los que no lo son. La soluci on
propuesta por Harsanyi y Selten es siempre un equilibrio perfecto en sub-
juegos en estrategias de comportamiento. Recordemos que estos equilibrios
previenen a los jugadores contra errores, tanto suyos como de los dem as
jugadores, y contra algunas perturbaciones del juego.
Los equilibrios construidos con el algoritmo de Zermelo son perfectos en
subjuegos.
Teorema 7.3.1. El algoritmo de Zermelo o de inducci on hacia atr as para
juegos nitos de informaci on perfecta termina en un n umero nito de pasos
construyendo un equilibrio perfecto en subjuegos en estrategias de compor-
tamiento.
Demostraci on. Todos los pasos son realizables, no hay repeticiones y el
n umero de vertices es nito. Por inducci on y aplicando repetidamente el
teorema 7.2.10, se obtiene la demostraci on.
Tenemos, entonces, el siguiente corolario.
Corolario 7.3.2. Todo juego de memoria perfecta tiene al menos un equi-
librio perfecto en subjuegos en estrategias de comportamiento.
293
294 Equilibrios Perfectos en Subjuegos
(2,1) F
1
F
2
(3,1)
m
1
m
2
m
3
C
M
B
M M M
(1,0) (0,2) (3,1) (5,1)
inv
ninv
C
M
M U
M A
(0,0) (2,2)
C C
C
(3,1)(6,0) (3.5,2.5) (8,0) (4,0) (4.5,1)
e ne e ne ne e
ne e ne e
bp nbp bp nbp bp nbp bp nbp
a
b
Figura 7.3.1:
Ejemplo 7.3.1. Consideremos un monopolio M que quiere decidir el tipo de
conicto que le conviene imponer a su posible competidor C: a) una versi on
con informaci on no perfecta, pero memoria perfecta del ejemplo 2.2.2 (
B
)
o b) el conicto del ejemplo 1.3.3 c). considerado como juego extensivo de
jugadas simult aneas (
A
). Ver la gura 7.3.1.
La forma normal de
A
es
Entrar No entrar
m
1
m
2
m
3
_
_
(3.5, 2.5) (8, 0)
(3, 1) (6, 0)
(4.5, 1) (5, 0)
_
_
Eliminando la estrategia m
2
que est a dominada, obtenemos
Entrar No entrar
m
1
m
3
_
(3.5, 2.5) (8, 0)
(4.5, 1) (5, 0)
_
294
Mezclando y Jugando en el Largo Plazo 295
cuyo unico equilibrio de Nash es
__
3
5
,
2
5
_
,
_
2
7
,
5
7
__
, luego el unico equilibrio
de Nash de
A
es
__
3
5
, 0,
2
5
_
,
_
2
7
,
5
7
__
.
Por otro lado, la forma normal del subjuego
B
es
(entrar) (no entrar)
(inv, bp, bp)
(inv, bp, nbp)
(inv, nbp, bp)
(inv, nbp, nbp)
(ninv, bp, bp)
(ninv, bp, nbp)
(ninv, nbp, bp)
(ninv, nbp, nbp)
_
_
_
_
_
_
_
_
_
_
_
_
(1, 0) (2, 1)
(1, 0) (2, 1)
(0, 2) (3, 1)
(0, 2) (3, 1)
(0, 0) (3, 1)
(2, 2) (5, 1)
(0, 0) (3, 1)
(2, 2) (5, 1)
_
_
_
_
_
_
_
_
_
_
_
_
El subjuego
B
tiene dos equilibrios en estrategias puras
((no invertir, bajar precios, no bajar precios) , entrar) y
((no invertir, no bajar precios, no bajar precios) , entrar) .
En cualquiera de ellos el pago es (2, 2). Tiene, adem as, otros equili-
brios en estrategias mixtas. Supongamos que elegimos el primer equilibrio
en estrategias puras .
Entonces, despues de podar el juego, tanto en A como en B, obtenemos

A
(
209
35
,
11
35
)

B
(2,2)
. En este juego s olo participa M y su forma normal es
Elegir A
Elegir B
_
209
35
2
_
.
El unico equilibrio de Nash de

A
(
209
35
,
11
35
)

B
(2,2)
es (1, 0).
En resumen, en , un equilibrio de estrategias de comportamiento es
_
X
C
, X
M
_
.
X
C
_
S
C
1
_
=
_
2
7
,
5
7
_
,
X
C
_
S
C
2
_
= (1, 0),
X
M
_
S
M
1
_
= (1, 0),
X
M
_
S
M
2
_
=
_
3
5
, 0,
2
5
_
,
X
M
_
S
M
3
_
= (0, 1),
X
M
_
S
M
4
_
= (1, 0),
X
M
_
S
M
5
_
= (0, 1).
Encontremos un equilibrio de subjuego perfecto en estrategias de com-
portamiento en un ejemplo de Okada y Sakakibara [41] que muestra las
posibilidades de la Teora de Juegos de hacer an alisis social.
295
296 Equilibrios Perfectos en Subjuegos
7.3.1. El Surgimiento de una Organizaci on Social
Ejemplo 7.3.2 (Los miembros de una COMUNIDAD consideran
la conveniencia de formar una ORGANIZACI

ON que los obligue


a cooperar). Consideremos la comunidad N del dilema del prisionero del
ejemplo 1.3.6b (El juego del parasitismo social). Este ejemplo trata sobre las
familias de un barrio en el que no hay una escuela cercana y las autoridades
se encargar an de establecerla si los vecinos construyen el edicio. Por cada
familia que coopera, aumenta en unidades de utilidad el benecio recibido
por cada familia, de parte de la escuela, es menor que 1, pero mayor que
1/n, donde n es el tama no del grupo. Cooperar con la construcci on implica
la perdida de una unidad de utilidad, por la distracci on del esfuerzo para
conseguir un mayor benecio para la propia familia. Por s misma la familia
obtiene una utilidad de . Por supuesto, la cooperaci on es voluntaria, pero
la escuela estar a abierta para los hijos de todos, hayan cooperado o no. La
funci on de pago para la familia j es como sigue:

j
() =
_
+ (k

+ 1) 1 si
j
= Cooperar,
+k

si
j
= No Cooperar,
donde k

es el n umero de miembros de la comunidad diferentes que j que


escogieron cooperar de acuerdo a . Denotemos como G al juego
G = (N, D
j
= Cooperar, No Cooperar, ) .
Como sabemos, el unico equilibrio de Nash de G es
(No Cooperar, No Cooperar, ..., No Cooperar).
Es decir, no se construir a la escuela. Pero como hemos supuesto que es
mayor que 1/n, estamos frente a una tragedia. En este juego, como ocurre
en cualquier dilema del prisionero, el pago de cualquier miembro de la co-
munidad, cuando todos cooperan, es mejor que cuando nadie coopera.
Las familias de la comunidad envuelta en un conicto como el que se
describe quiz a no se quede con los brazos cruzados ante la tragedia. Es
natural que intenten formar un grupo que voluntariamente convierta en
obligatoria la cooperaci on. El nuevo conicto se puede expresar a traves de
un juego extensivo que consta de varias etapas.
Etapa de Formaci on de una Organizaci on.
Cada familia considera si le conviene participar en una organizaci on S
que haga obligatoria la cooperaci on entre los miembros de S imponiendo un
296
Mezclando y Jugando en el Largo Plazo 297
J
2(n)
J
2(n1)
J
2(n1)
J
2(n2)
J
2(1)
J
2(1)
J
2(2)
2 2
1
...
n n n n
...
...
p np p np
p np
p np p np p p np np
G
Figura 7.3.2:
castigo a las familias que habiendose comprometido con S no cooperen. Si
no hay por lo menos dos familias dispuestas a cooperar la comunidad desiste
de organizarse y se juega G. Cuando se forma una organizaci on, una de las
familias (i

) se encargar a de vigilar la cooperaci on de los dem as miembros


de S y de castigarlos si no cumplen. i

no podr a obtener ninguna utilidad


por s misma (ver gura 7.3.2).
Etapas de tipo 2. Se ha formado una organizaci on S. Cada una de las s
familias que pertenecen a S deben elegir un par de valores (p, ), donde p es
un real positivo que representa el castigo para los incumplidos y (0, 1) es
la parte de la cantidad reunida por las familias que cooperan que servir a para
sostener a la familia i

encargada de vigilar y castigar. El castigo disminuye


el pago del infractor, pero no afecta el de los dem as. Si cada j S ha elegido
un par
_
p
j
,
j
_
, el acuerdo alcanzado ser a el mnimo
j
y el m aximo p
j
(ver
gura 7.3.3).
Etapas de tipo 3. Se ha formado una organizaci on S y se ha elegido
la pareja (p, ). Al azar se elige a la familia i

que debe decidir si acepta


o no el salario (s 1). Si el elegido por el azar no acepta, se deshace la
organizaci on y se juega G; si acepta se pasa a una etapa nal (ver gura
7.3.4).
Etapas nales. Caso a) s familias se organizaron tomaron los acuerdos
p y y eligieron a i

que ha aceptado el cargo. Entonces cada una de las


familia de N i

debe elegir si coopera o no.


297
298 Equilibrios Perfectos en Subjuegos
J
2(s)
v
J

3(s, ,p )
max v
J

3(s, ,p )
max v
J

3(s, ,p )
max v
J

3(s, ,p )
max

( ,p)

( ,p)

( ,p)

( ,p)

( ,p)

( ,p)

( ,p)

( ,p)
1
2
...
2 2
...
s s s
...
...
... ... ...
... ...
... ...
...
... ... ...
...

...

( ,p) ... ...

( ,p)
...

( ,p)
... ... ...
...
...
...
Figura 7.3.3:
J
4(s, ,p,i)

J
4(s, ,p,i)

J
4(s, ,p,i)

v
J

3(s, ,p )
max
0
1/s 1/s 1/s
1 2 s
G G G
...
... ...
a na a a na na
Figura 7.3.4:
El pago para j N i

est a dado por la funci on



j(p,)
(a) =
_
_
_
+ (1 ) (s
a
+ 1) 1 si a
j
= C,
+ (1 ) s
a
si a
j
= NC y j / S,
+ (1 ) s
a
p si a
j
= NC y j S,
donde a es el vector de decisiones de los individuos de N i

y s
a
es el
n umero de los que cooperan de acuerdo al vector a, sin contar a j. En este
298
Mezclando y Jugando en el Largo Plazo 299

(p, )}(a)

(p, )}(a)

(p, )}(a) J
4(s, ,p,i)

1
2 2
...
... ...
... ... ...
n n
... ...
n n n
c nc
c nc c nc
nc c c nc nc c

Figura 7.3.5:
caso el modelo extensivo es como la gura 7.3.5, pero con n 1 jugadores.
Caso b) Se juega G (ver gura 7.3.5).
El juego extensivo correspondiente al proceso que acabamos de describir
estara compuesto con guras de los tipos 7.3.27.3.5.
Construcci on de un Equilibrio Perfecto en Subjuegos en Es-
trategias de Comportamiento.
Llamemos al juego completo. Este juego no tiene partidas innitas,
pero no es nito, pues algunos vertices tienen un n umero innito de alter-
nativas. Sin embargo, podemos construir un equilibrio de subjuego perfecto
mediante el algoritmo de Zermelo para estrategias de comportamiento. A
grandes rasgos el proceso seguira el camino siguiente:
Analisis de los subjuegos correspondientes a las etapas nales.
Para el llamado caso b la soluci on es conocida, pues se trata del juego G
que es el dilema del prisionero del ejemplo 1.3.6 b). Ninguna familia coopera
y cada una gana .
Respecto al caso a:
Examinemos primero la conducta de una familia j que no pertenece a
S. Denotemos como a
j
a una estrategia arbitraria de j en el subjuego que
299
300 Equilibrios Perfectos en Subjuegos
se analiza. A las estrategias de un jugador en un subjuego le llamaremos
acciones, para distinguirlas de las estrategias en el juego completo. Dado un
perl de acciones a, denotemos como s
a
al n umero de individuos, distintos
a j, que eligieron cooperar de acuerdo al perl a.
Si j elige cooperar ganar a
+ (1 ) (s
a
+ 1) 1
y, si elige no cooperar, ganar a
+ (1 ) s
a
.
El segundo pago es siempre mayor que el primero, pues (1 ) es
menor que 1, es decir las familias que no pertenecen a S no cooperan en el
equilibrio de los subjuegos nales.
Supongamos que j est a en S. Entonces
si j elige cooperar ganar a
+ (1 ) (s
a
+ 1) 1
y, si elige no cooperar, ganar a
+ (1 ) s
a
p.
El segundo pago es mayor que el primero si y s olo si,
p < 1 (1 ).
Si p = 1 (1 ), a cada j en S le sera indiferente cooperar o no
cooperar pues le produciran el mismo pago.
Es decir, en un equilibrio de Nash del subjuego:
Si p < 1 (1 ) los miembros de S no cooperan.
Si p > 1 (1 ) los miembros de S cooperan.
Si p = 1 (1 ) los miembros de S pueden cooperar o no hacerlo.
Suponemos que los jugadores se comportaran de acuerdo al equilibrio
encontrado en las etapas nales y consideramos que al podar en cada
uno de los vertices en que inicia una etapa nal, se pondra como pagos
asociados los del equilibrio correspondiente. Obtenemos, entonces, el juego
podado de todos los vertices que inician etapas nales (lo denotamos
1
).
Los subjuegos de
1
que corresponden a etapas en que las que hay que elegir
a i

son como los de la gura 7.3.4, con los pagos que encontramos colocados
en los vertices nales correspondientes. Los jugadores son los miembros de
S y la primera jugada es de azar. Adem as, estos subjuegos se pueden cortar
a su vez en otros subjuegos en los que un solo jugador i

, el que ha sido
elegido por el azar, toma la decisi on de aceptar el cargo o no aceptarlo.
Analicemos dichos subjuegos con un solo jugador:
El pago de i

es
300
Mezclando y Jugando en el Largo Plazo 301

3
i
(b
i

) =
_
_
_
si b
i

= no aceptar,
0 si b
i

= aceptar y p < 1 (1 ),
(s 1) si b
i

= aceptar y p 1 (1 ),
donde b
i

denota la acci on de i

.
En el caso de que p < 1(1), claramente a la familia i

le conviene
no aceptar, pues ella puede ganar > 0. Lo mismo es cietro cuando
p 1 (1 ), pero (s 1) < .
En cambio, si p 1 (1 ) y (s 1) > , a i

le convendra
aceptar.
El unico caso que falta es aquel en el que p 1(1) y (s 1) = .
A i

le es indiferente aceptar o no hacerlo.


Tenemos, ahora, juegos de azar puro, nadie toma decisiones. Los vectores
de pago esperado son de la forma

3
j
=
_
si p < 1 (1 ) o (s 1) < ,
si p 1 (1 ) y (s 1) ,
donde =
1
s
(s 1) +
(s1)
s
( +s (1 ) 1).
Obtenemos, con estos pagos de equilibrio, un nuevo juego al que podemos
llamar
2
que resulta de podarle a
1
los subjuegos que empiezan en los
vertices de azar y poner los pagos de equilibrio en esos nuevos vertices nales.
Podemos, para proceder con el siguiente paso del algoritmo, considerar los
subjuegos que no se pueden descomponer en
2
.
Estos subjuegos son aquellos en las que hay que tomar acuerdos sobre
p y . Cuando el juego ha llegado a uno de los vertices en que hay que
determinar dichos par ametros, alg un subconjunto de s individuos, s 2,
habra formado la organizaci on S.
Denotamos como c
j
a las acciones de j, en esta etapa. La forma normal
de este subjuego es
_
S, D
2
j
,
2
_
, con
D
2
j
= (
j
, p
j
)


j
est a en (0, 1) y p
j
> 0
y, para toda j y toda c D
2
j
,

2
j
(c) =
_
1
s
_

mn
(s 1) + (
s 1
s
)( + (s 1) (1
mn
) 1)
si
mn
/(s 1) y p
m ax
1 (1
mn
);
301
302 Equilibrios Perfectos en Subjuegos

2
j
(c) = ((s 1) /s) ( p) si
mn
/s y p
m ax
< 1 (1
mn
y

2
j
(c) = si
mn
< /s.
Analicemos la conducta de cualquier jugador i. Si el aspira a ganar m as
que , sabe que tiene que elegir
i
al menos tan grande c omo

(s1)
; de otra
manera no ser a posible que ninguna familia acepte vigilar a las otras que
pertenecen a S y castigarlas si es necesario. Por el an alisis que se ha hecho de
las etapas nales, tambien sabe que alguna de las p debe ser mayor o igual
que 1 (1
mn
). Supongamos que las familias han escogido acciones con
esas caractersticas, as que cada una ganar a
f (
mn
) =
_
1
s
_

mn
(s 1) + (
s 1
s
)( + (s 1) (1
mn
) 1).
Estudiemos a la funci on f. Su derivada tiene la forma siguiente:
f (
mn
) = (
s 1
s
) (1 (s 1)) ,
f () es negativa si y s olo si s >
1

+1. Es decir, f es decreciente respecto a

mn
, si y s olo si s > 1/ +1. Entonces si s > 1/ +1, no hay un equilibrio
en el que los jugadores elijan de tal manera que
mn
>

(s1).
.
Por otro lado, pensemos que c

es de tal manera que


j
=
mn
=

s1
y alguna de las p
i
es mayor o igual que 1 (1
mn
). Si alg un jugador
k distinto que j y que i, uno s olo, cambia de estrategia, la ganancia de k
no cambia. En cambio, si i es el unico que eligi o un castigo mayor o igual
que 1 (1
mn
) y cambia hacia un castigo menor que la cota clave, la
ganancia de i ser a p
m ax
. Si j es la que cambia
j
=

(s1)
por una
participaci on menor para el aparato, entonces, la ganancia de j se volvera
.
Cu ando el pago
(
1
s
)
_

(s 1)
(s 1)
_
+ (
s 1
s
)
_
y + (s 1)
_
1

(s 1)
_
1
_
es mayor o igual que ? La respuesta es que esto ocurre si, y s olo si, el
tama no del grupo organizado es mayor o igual que 1/ + 1 +.
Es decir, si s > 1/ + 1 + , los perles c, con

c
k
=
_

k
, p
k
_
, tales que

mn
=

(s1)
y p
m ax
1 (1 Cm/s), son los unicos equilibrios de Nash
del subjuego. El pago que recibe cada individuo en estos equilibrios es
(
1
s
)
_

(s 1)
(s 1)
_
+ (
s 1
s
)
_
y + (s 1)
_
1

(s 1)
_
1
_
.
302
Mezclando y Jugando en el Largo Plazo 303
En cambio, si s es menor que 1/ + 1 + y

c es de tal manera que
cada k eligi o
k
< /(s 1) y la misma p, como sea, entonces

c es un
equilibrio de Nash del subjuego. Existen muchos de estos equilibrios, pero
en todos ellos los jugadores ganan .
Si s es igual a 1/+1+, a las familias de S les es indiferente escoger una
estrategia que lleve a una organizaci on exitosa o provocar que esta aborte,
de todas maneras, cada una ganara . Elijamos el equilibrio en el que las
familias de S llevan a que la organizaci on y, a la postre, la cooperaci on salgan
adelante.
Denimos a s

como el menor de los enteros que sea mayor que 1/+1+


al que denotamos como [1/ + 1 +]
+
.
Por su lado, las familias de la comunidad que no pertenecen a S no juegan
en este subjuego y ganan +s (1 ) o , dependiendo de las acciones de
los miembros de S.
La continuaci on del algoritmo signica que el juego se ha reducido a
un juego podado
3
que es un juego de jugadas simult aneas, es decir un
juego rectangular; los pagos en los vertices nales est an determinados por
los equilibrios que se escojan en el an alisis previo.
La forma normal de
3
es

G =
_
N, D
3
j
,
_
, con D
3
j
= Participar
(P), No Participar (NP) para toda familia j N.
Supongamos que, en la etapa anterior, elegimos el equilibrio en donde
los jugadores alcanzan m as que .
Para toda j N y d

jN
D
3
j
, si s
d
es el n umero de las familias distintas
de j que escogen participar de acuerdo a d, entonces la funci on de pago
se dene de la manera siguiente.

j
(d) = +
s
d
(s
d
+1)
_
s
d

_
1

s
d
_
1
_
si d
j
= P y s
d
s

1;

j
(d) = si d
j
= P y s
d
< s

1;

j
(d) = + (s
d
1)
_
1

s
d
1
_
si d
j
= NP y s
d
s

;

j
(d) = si d
j
= NP y s
d
< s

.
Hay varios equilibrios de Nash de

G, pero supongamos que nos limitamos
a los equilibrios simetricos.
Un primer resultado inmediato que se puede establecer es que si la comu-
nidad es peque na, es decir, con menos familias que s

, todas rechazar an
organizarse. En cambio, si el tama no de la comunidad es exactamente igual
a s

, todos los miembros de la poblaci on estaran de acuerdo en participar


en la organizaci on.
303
304 Equilibrios Perfectos en Subjuegos
Que ocurre cuando la comunidad tiene m as familias que s

?
El que todas las familias participen no es un equilibrio de Nash, pues cada
una ganara + ((n 1) /n) ((n 1) (1 / (n 1)) 1) y la familia
que decidiera cambiar, bajo el supuesto de que las dem as permanecieran
participando, ganara + (n 2) (1 / (n 2)) que es un pago mayor.
El que nadie participe en la formaci on de la organizaci on s es un equi-
librio de Nash de
3
; en este equilibrio todos ganan .
Cuando el n umero de familias es mayor que s

, resulta que existe un


equilibrio simetrico en estrategias mixtas en el que los jugadores ganan m as
que .
Sea X

= ((

, 1

) , (

, 1

) , ..., (

, 1

)), con

(0, 1).
El perl X

es equilibrio de Nash del juego


3
si y s olo si, para toda
familia j, E
j
(X

[ P ) = E
j
(X

[ NP ). Tenemos que
E
j
(X

[ P ) =
n1

i=0
_
n 1
i
_

i
(1

)
n1i

4
j
(i [ P ) y
E
j
(X

[ NP ) =
n1

i=0
_
n 1
i
_

i
(1

)
n1i

4
j
(i [ NP ) ,
donde i es el n umero de familias que ha decidido cooperar, distintas de j,
(i [ P ) signica que, en estas condiciones, j elige P; por ultimo (i [ NP )
signica que j elige NP, mientras i han elegido P.
Existe una unica que cumple la ecuaci on anterior. Los detalles de la
demostraci on se pueden revisar en el artculo de Okada y Sakakibara (1991).
Con el an alisis anterior hemos encontrado, con el algoritamo de Zermelo,
varios equilibrios perfectos en subjuegos. Algunos de estos equilibrios son en
estrategias puras y otros en estrategias de comportamiento, en particular
uno uno de estos ultimos es simetrico y el vector de pagos que determina no
est a dominado.
Pensemos en el equilibrio perfecto en subjuegos, simetrico y no dominado
en estrategias de comportamiento y veamos que nos ense na sobre la conducta
de la comunidad.
Observaciones.
1. Una organizaci on no puede ser s olida si el castigo que decide imponerle
a sus miembros infractores es m as peque no que lo que ellos esperan
incrementar sus respectivas ganancias por no cooperar. Es decir, p
304
Mezclando y Jugando en el Largo Plazo 305
debe ser mayor o igual a (1 (1 )). Por otro lado, 1 (1 ) es
la cantidad que provoca que los que no pertenecen a S no cooperen.
En el equilibrio los que no participan en S no cooperan, pero se bene-
cian de las aportaciones de los que s participan en ella.
2. La persona encargada de realizar las tareas de vigilar y castigar es
un empleado al servicio de la comunidad y el ingreso que recibe por
dicha tarea es un salario. En el equilibrio ninguna persona aceptara
ese empleo

A si el salario es menor a lo que dicha persona po-


dra conseguir por su cuenta que es . A los dem as miembros de la
comunidad, a pesar de que cada uno de ellos tendr a el puesto con
probabilidad positiva, no les conviene pagar m as, por lo que el salario
es exactamente .
3. Existe un tama no especial del grupo organizado s

, por debajo del


cu al dicho grupo ya no es eciente. Si las familias de la comunidad que
quieren organizarse son muy pocas, menos que s

, no vale la pena su
esfuerzo.
4. La interpretaci on de s

es la siguiente: Supongamos que un grupo S


tiene un n umero de familias tal que:
a) Una de ellas, i

, se puede dedicar a cumplir las tareas de vigilar


y castigar.
b) S tiene sucientes familias, distintas que i

, para reunir, con sus


aportaciones el salario de i

, es decir familias.
c) Existe otro n umero de familias miembros de S, tales que, debido
a su cooperaci on, se puede construir la cantidad de obra com un
suciente para que cada persona de la comunidad, en particular
cada una de las pertenecientes a S, pueda obtener al menos una
unidad adicional, es decir, 1/ unidades de obra com un.
Si 1/ + 1 + fuera un entero igual al n umero de miembros de S,
entonces, a cada una de estas le dara lo mismo permanecer organizada
que actuar por su cuenta, pues de las dos formas ganara . Por eso
s

es el entero m as peque no que es mayor que 1/ + 1 +.


5. Por ultimo, reexionemos sobre el sentido que tiene elegir en la eta-
pa inicial una estrategia mixta. Esto no tiene que interpretarse como
que cada individuo de la comunidad elige una probabilidad para, de
acuerdo con ella, en cada ocasi on, participar o no en una organizaci on.
305
306 Equilibrios Perfectos en Subjuegos
Puede haber interpretaciones m as intuitivas de X

. Por ejemplo, que


el comportamiento de cada familia y el de la comunidad en su conjun-
to, en el equilibrio, son de tal manera que si se hiciese una estadstica
sobre estos, parecera obedecer a que cada familia eligi o la estrate-
gia (

, 1

). Es decir, las familias podran estar cambiando su


forma de actuar de acuerdo a la experiencia que van adquiriendo y lo
que obtenemos es una ley del comportamiento de la comunidad, en su
conjunto.
7.4. Juegos Repetidos
Los juegos repetidos introducen un contexto m as din amico dentro de un
conicto. La mayora de los conictos interesantes se repiten m as de una vez
y esto cambia notablemente los resultados obtenidos. La idea que muchos
autores consideraron intuitiva es que, al repetirse un conicto, los jugadores
terminaran alcanzando una buena soluci on. Por eso los resultados que sus-
tentan la teora de los juegos repetidos fueron llamados teoremas del folklor
o de la tradici on oral. En forma especca, la preocupaci on surgi o vinculada
al dilema del prisionero. Era creencia com un que este juego, de dos o m as
personas, cuando se jugaba una unica vez, tena un resultado nefasto; pero
que, seguramente, si el mismo grupo de personas jugaban repetidamente,
podran llegar a conar unos en otros y alcanzar un buen resultado para
todos.
La losofa de los juegos no cooperativos est a tomada de las ciencias
sociales cl asicas, cuyo autor m as caracterstico fue Adam Smith. En esta
losofa, los hechos hist oricos, polticos, sociales y econ omicos son una es-
pecie de resultante de las decisiones libres de los individuos (ciudadanos,
agentes o como quiera llam arseles) que se mueven en la sociedad. Sin em-
bargo, para la concepci on smithiana las acciones de los individuos egostas
que s olo buscan su propio bienestar conducen siempre, sin proponerselo, al
bien com un y s olo la acci on de fuerzas externas a los individuos, a un tratan-
do de actuar por el interes colectivo, puede torcer esa resultante feliz. Por
el contrario, en los juegos no cooperativos, no es extra no que las acciones
egostas conduzcan a la cat astrofe social. El dilema del prisionero es el ejem-
plo m as famoso y es tambien el m as efectivo para mostrar dicha armaci on.
Para enfrentar este resultado que molesta a tantos autores, se ha recurrido
a considerar que el juego en cuesti on no se realice una sola vez, sino que los
mismos jugadores lo repitan una y otra vez. Aunque en este juego repeti-
do el perl formado por la estrategia indeseable para todos los jugadores
306
Mezclando y Jugando en el Largo Plazo 307
sigue siendo uno de los equilibrios que se obtienen, aparecen otros equilib-
rios del juego que signican un mejor resultado, socialmente hablando. En
particular, las estrategias ojo por ojo, diente por diente, llenas de espritu
de venganza logran ese objetivo. Usando este tipo de estrategias se suelen
demostrar diversas versiones del teorema de la tradici on oral que asegura
que para todo vector de pago v alcanzable por los jugadores y que tenga
la propiedad de dar a cada jugador un pago mayor que su minmax (o mayor
que alg un otro tope m aximo que le puedan imponer los dem as jugadores)
podemos construir un perl de equilibrio, por ejemplo el de la mencionada
ley del tali on que tiene como vector de pago a v. El pago tope, al que nos
acabamos de referir, juega el papel de una amenaza de que se recibir a dicho
pago como un castigo, si se abandona la b usqueda de v.
7.4.1. Los Equilibrios de un Conicto Repetido
La mayora de los conictos importantes de la vida se presentan repetida-
mente. En general, la forma en que se comportan las personas involucradas
en un conicto que se presenta una sola vez en la vida es distinta a la que
adoptaran si ellas, vez tras vez, tienen que enfrentarse en el mismo conicto
con los mismos oponentes.
Pensemos en el juego representado por la siguiente matriz.
p np
p
np
_
(0, 0) (2, 1)
(1, 2) (3, 3)
_
Los equilibrios del juego son los perles de estrategias puras (p, np) y (np,
p) y, adem as, el de estrategias mixtas ((
1
2
,
1
2
), (
1
2
,
1
2
)). En el ultimo equilibrio,
la esperanza de pago es de 1, para cada jugador.
Pensemos en que el conicto, al que llamaremos juego estado, se realiza
dos veces, en el sentido de que despues de que los dos jugadores eligen
simult aneamente sus estrategias, de nuevo tienen que volver a hacerlo. En
el juego extensivo resultante, el pago puede ser la suma total o el promedio
recibido por ocasi on. En la gura 7.4.1 se ilustra la situaci on, ahorr andonos
los pagos y simbolizando los enfrentamientos del juego rectangular estado
con los cuadrados JE.
Cuando en un juego repetido se utiliza el mismo equilibrio del juego
estado en cada repetici on o una combinaci on de equilibrios, se obtiene un
equilibrio de , pero pueden aparecer otros equilibrios nuevos que no existan
307
308 Equilibrios Perfectos en Subjuegos
J.E
J.E J.E J.E J.E
(np,np) (np,p) (p,np) (p,p)
Figura 7.4.1:
cuando el juego tena lugar en una sola ocasi on. En particular, uno de estos
equilibrios expresara un pacto entre los jugadores que consistira en que en
el primer periodo elegiran de acuerdo al equilibrio que conviene al primer
jugador y en el segundo, si ambos cumplieron con el pacto, el que conviene al
segundo jugador. En la inteligencia de que, si cualquiera de ellos no cumpli o,
el otro lo castigara oblig andolo a ganar a lo m as 2 que es el maxmin de
ambos jugadores en el juego estado. Con este equilibrio cada uno gana, en
promedio,
1
2
.
Si el juego se realiza tres veces, uno de los equilibrios de subjuego perfecto
otorga, a cada uno de los jugadores, ganancias promedio de
1
3
, siguiendo
las estrategias que se describen a continuaci on: Los jugadores deciden llevar
a cabo un pacto que consiste en que, en el primer periodo, los dos escogen la
estrategia p, en el segundo, escogen de acuerdo al equilibrio que le conviene
al que elige renglones y, en el tercero, de acuerdo al equilibrio que es mejor
para el que elige columnas. En las historias correspondientes a que alguien
ha traicionado el acuerdo, este ser a castigado haciendo que gane a lo m as
2.
Si el juego se jugara 1000 veces, existe un equilibrio del juego repetido que
consiste en un pacto de que en los 998 primeros periodos, ambos escoger an
la estrategia p, en el pen ultimo el equilibrio que preere el jugador 1 y en el
ultimo el que preere el jugador 2. Y en cualquier historia en la que alguno
se ha salido de lo acordado, a este se le obliga a ganar a lo m as 2. Con
este equilibrio ganan por juego jugado
1
1000
, as nos hemos ido acercando
al pago de 0, que es el pago equitativo m as grande posible. Esto no es
casual, si en un juego bipersonal, cada jugador tiene un equilibrio con el que
domina su minmax, cada vector de pago factible individualmente racional, es
decir en los que los jugadores ganan m as que su maxmin, se puede alcanzar
como lmite de vectores de pago de equilibrio de juegos repetidos k veces,
cuando k tiende a innito. Dicho resultado se conoce como teorema del
folklor (o de la tradici on oral) del que existen numerosas versiones, en esta
secci on, expondremos la que se debe a J. Friedman [18]. Antes, motivemos
308
Mezclando y Jugando en el Largo Plazo 309
en forma m as concreta el problema, analiz andolo en el dilema del prisionero
bipersonal.
7.4.2. La Tradici on Oral y el Espritu de Venganza
COOPERAR O NO COOPERAR? REPETICI

ON INFINITA.
Pensemos en el dilema bipersonal de suma cero que aparece en la intro-
ducci on del trabajo y cuya matriz es la siguiente:
Confesar No confesar
Confesar
No confesar
_
(10, 10) (0, 20)
(20, 0) (2, 2)
_
El que los dos conesen es la conducta no cooperativa y conduce a la
desgracia de ambos, pero es el unico equilibrio de Nash del juego.
Sigamos d andole vueltas al dilema del prisionero, para introducir la pro-
blem atica de los juegos repetidos, porque es, como decamos, el ejemplo
m as motivador de ella. Todos los te oricos aceptan que si el famoso dilema
ocurriera una sola vez, sin fuerzas externas de por medio, ambos jugadores
confesaran, pero que ocurre si los mismos jugadores lo repiten una gran
cantidad de veces? La intuici on nos hace aceptar que ambas personas po-
dran aprender de su experiencia y llegar a conar el uno en el otro. Adem as,
les parecera importante cuidar su prestigio de hombres de palabra, etc. As,
quiz a abandonaran el pago fatal de 10, por juego jugado, para obtener
2. Es decir, la repetici on se convertira en un mecanismo que llevara a
un resultado de bienestar com un, sin necesidad de una fuerza de coerci on
externa sobre los jugadores o una constuida por ellos mismos, como en el
ejemplo 7.3.2.
En el camino de dar forma a esta idea, construyamos un juego extensivo
tal que en cada vertice en que se puede cortar el juego, tenemos una repeti-
ci on del dilema del prisionero, en su forma extensiva, con la diferencia de que
en los vertices nales, en lugar de pagos, tendramos una nueva repetici on,
los pagos nales seran la acumulaci on, con alg un tipo de descuento para el
periodo t.
Una primera observaci on es que si el enfrentamiento se repite un n umero
nito de veces, por muy grande que sea este n umero, no habr a ning un cam-
bio en el comportamiento previsible de los jugadores. Suponiendo que estos
tienen el acuerdo de no confesar, en cada perodo, al llegar a la ultima etapa,
volveran a las andadas y trataran de aprovechar el que ya no hay presti-
gio que cuidar, desertando de su acuerdo. Peor a un, esto provocara que los
jugadores confesaran en cada etapa, pues cada uno de ellos sera consciente
309
310 Equilibrios Perfectos en Subjuegos
de la segura traici on del otro en la ultima etapa y buscara adelantarse,
traicionando el mismo, en etapas anteriores.
Es decir, el unico equilibrio perfecto en subjuegos es aquel en el que
cada jugador, en cada uno de sus conjuntos de informaci on, escoge confesar.
Desde luego, existen equilibrios en los que alguno de los jugadores elige no
confesar en uno o varios de sus conjuntos de informaci on, pero sucede que
la probabilidad determinada por esos equilibrios de llegar a cualquiera de
dichos conjuntos de informaci on es cero. O dicho con otras palabras, tenemos
equilibrios que permiten que alguno de los jugadores elija cooperar con el
otro, aunque desde el punto de vista egosta esto sea una mala elecci on, pero
solo en los conjuntos de informaci on a los que no es posible llegar, en cambio
en todos los conjuntos de informaci on que tienen probabilidad positiva de
ser alcanzados se responder a confesando. Por lo que los perles que tienen
alguna respuesta de cooperaci on, en un dilema del prisionero que se repite
un n umero nito de veces, no son equilibrios perfectos en subjuegos.
Dilema del
Prisionero
Dilema del
Prisionero
Dilema del
Prisionero
Dilema del
Prisionero
Dilema del
Prisionero
(C,C) (C,NC) (NC,C) (NC,NC)
... ... ... ...
... ... ...
... ... ...
D.P D.P D.P D.P D.P
Figura 7.4.2:
Para obtener resultados distintos, los dos jugadores tienen que pensar,
cada vez que tienen que tomar una decisi on, que el proceso de enfrentamiento
puede continuar, es decir que la probabilidad de que habr a un pr oximo
enfrentamiento es positiva.
Supongamos que el dilema del prisionero va a repetirse, de tal manera
que cada vez que termina una etapa hay una probabilidad , 0 < < 1,
de que el juego vuelva a repetirse y, por lo tanto, una probabilidad 1 ,
tambien mayor que cero, de que el juego termine. En este horizonte innito,
es f acil hacer ver que el perl de estrategias en el que los jugadores conesan
310
Mezclando y Jugando en el Largo Plazo 311
en cada una de sus oportunidades sigue siendo un equilibrio perfecto en
subjuegos. Sin embargo, ahora han aparecido otros equilibrios. Por ejemplo,
los futuros prisioneros podran llegar al acuerdo de moverse, cada uno, con
la estrategia siguiente: 1) empezar no confesando y seguir haciendolo hasta
la primera vez que a su contrario se le ocurriera confesar, 2) si esto llegara
a suceder, no volver a conar en la capacidad de cumplir compromisos de
dicho individuo, 3) vengarse del traidor, manteniendose rme en confesar,
perodo tras perodo y 4) si el mismo fuera el primero en abandonar la alter-
nativa de no confesar, de all en adelante confesar siempre, pues no podra
recuperar su prestigio y sera castigado, sin remedio, por el otro prisionero.
Este perl de aplicar la ley del tali on es un equilibrio de Nash perfecto en
subjuegos del juego repetido, cuando la probabilidad de continuar el juego
es sucientemente grande, como veremos en seguida.
Denotemos como al perl de estrategias del juego repetido en el que
los dos jugadores escogen ojo por ojo, diente por diente, los jugadores no
confesaran nunca pues ninguno de ellos llegara a los conjuntos de informa-
ci on en los que tendra que confesar, no habra motivos de venganza y el
vector de pago esperado sera: (1 )

i=0
(2)
i
= 2.
Si alguno de los jugadores, por ejemplo el jugador 1, cambiara en el
perodo t la elecci on no confesar por confesar, llamemos a la nueva estrategia
de dicho jugador
1
, su pago esperado sera:
(1 )
_
t1

i=0
(2)
i
+ 0
t
+

i=t+1
(10)
i
_
.
La diferencia del pago del jugador l, cuando elige
1
, respecto a lo que
recibe con
1
es
(1 )
_
(2)
t
+

i=t+1
8
i
_
=
(1 )
_
(2)
t
+ 8
t+1
_

i=0

i
__
=
2
t
(1 ) + 8
t+1
= 10
t+1
2
t
=
t
(10 2).
Esta diferencia es mayor que cero si y s olo si >
1
5
.
Entonces, si la probabilidad de continuar el juego en cada periodo es
mayor que
1
5
, la pareja de estrategias ojo por ojo, diente por diente es un
equilibrio de Nash del juego repetido y es un equilibrio que determina que
a lo largo de las partidas que tienen probabilidad positiva, los jugadores,
en cada ocasi on, escogen no confesar, es decir cooperan entre s y obtienen,
311
312 Equilibrios Perfectos en Subjuegos
los dos, un pago mejor que con la traici on como h abito. El espritu de
venganza lleva a la cooperaci on de los dos prisioneros.
Dicho perl es un equilibrio perfecto en subjuegos. El juego se puede
descomponer en vertices en los que el subjuego que all empieza es esen-
cialmente el juego original, excepto quiz a por una primera jugada de azar.
Sin embargo, la restricci on de la pareja de estrategias ojo por ojo, diente
por diente a dicho subjuego depende de la historia que se ha seguido para
llegar al vertice en cuesti on. As, la restricci on es de nuevo una pareja de
estrategias ojo por. . . en los vertices A que representan situaciones en que
los jugadores han respetado hasta ese momento el acuerdo de no confesar
y este perl es un equilibrio del subjuego
A
. En cambio, en los vertices B
para los que en el pasado alguno de los dos jugadores ha elegido en alguna
ocasi on confesar, la restricci on es un perl en que los jugadores conesan
siempre y este perl es un equilibrio de
B
.
En resumen, la pareja de estrategias que consiste en confesar en ca-
da ocasi on contin ua siendo un equilibrio perfecto en subjuegos, pero han
aparecido nuevos de estos equilibrios que determinan comportamientos y
pagos m as razonables.
Nos propusimos estudiar si en un contexto no cooperativo era posible
que, en un equilibrio de Nash, la conducta observada de los jugadores fuera
no confesar, podemos contestar armativamente a ello. Aunque, por otro
lado, no sabemos, si nalmente ser an estos equilibrios buenos y no el
malo el que se establecer a como conducta de los prisioneros en el juego
repetido.
7.4.3. Los Juegos Repetidos en General
Ahora vayamos a una situaci on m as general. Imaginemos un juego rec-
tangular nito cualquiera (juego estado), con un conjunto de jugadores N,
que repetir an un n umero de veces nito o innito el conicto expresado en
el juego estado. Nos planteamos el problema de estudiar la forma de los
equilibrios de Nash del juego repetido.
Formalicemos un poco las cosas.
Sea = (N, D
i

iN
, ) un juego rectangular nito.
Denici on 7.4.1. Para t en 0, 1, 2, . . . una historia h(t) de tama no t de
repetici on del juego es un una n-ada
_
h
1
(t), h
2
(t), . . . , h
n
(t)
_
, con h
j
(t) en
D
j
D
j
D
j
= D
t
j
.
312
Mezclando y Jugando en el Largo Plazo 313
Por tanto, h(t) es una matriz t n cuya j-esima columna es
h
j
(t) =
_
_
_
_
_
h
j
0
=
j
0
h
j
1
=
j
1
...
h
j
t1
=
j
t1
_
_
_
_
_
.
j.e
j.e j.e j.e
...
...
...
...
...
...
...
...
...
...
...
JUEGO DE ESTADO
N={1,2,...,n}, D ,D ,..., D
: D x D x ... x D R
1 2 n
2 n 1
n
j.e j.e j.e j.e
j.e j.e j.e j.e
Figura 7.4.3:
El vector h
j
(t) representa la historia de lo que ha hecho el jugador
j desde el perodo 0 hasta el perodo t 1. Es decir, las estrategias que
escogi o en dichos perodos. Mientras que el rengl on i-esimo representa el
perl que los n jugadores escogieron en el perodo i, es decir,
_
h
1
i
=
1
i
, h
2
i
=
2
i
, ..., h
n
i
=
n
i
_
.
Denotamos como H(t) al conjunto de historias de tama no t y como H
al conjunto
t
H(t).
Deniremos el concepto de juego repetido para un juego rectangular
= (N, D
i

iN
, ) y un n umero real en (0, 1).
Denici on 7.4.2. El juego repetido (, ) que tiene como juego estado a
y como factor de descuento o probabilidad de continuaci on a consta, para
cada j en N, de:
313
314 Equilibrios Perfectos en Subjuegos
a) los conjuntos
j
=
j
: H D
j
y M
j
= X
j
: H M
j
y
b) la funci on de pago E
j
: M
1
M
2
... M
n
R
n
denida como
E
j
_
X
1
, X
2
, .., X
n
_
=
(1 )
_
_

t=0

h(t)H(t)
p
_
h(t)

X
_

kN
x
k
(h(t))
_

k
_

j
()
_
_
.
Por supuesto, para que el juego repetido (, ) este bien denido, la serie
involucrada debe converger.
Los elementos de
j
y de M
j
se llaman, respectivamente, las estrategias
puras y de comportamiento del jugador j en el juego (, ).
Algunos autores llaman a M
j
el conjunto de estrategias mixtas de (, );
de hecho, como el juego es de memoria perfecta, ambos conceptos coinciden.
Pero nosotros preferimos el enfoque de estrategias de comportamiento, pues,
para construir los elementos de M
j
, no utilizamos el conjunto de estrategias
puras del juego (, ), sino las del juego estado . En realidad, cada X
j
M
j
es una estrategia de comportamiento como las que se trabajaron en la secci on
anterior, ya que, intuitivamente, podemos pensar a (, ) como un juego
extensivo. En dicho juego se estar a repitiendo la forma extensiva de , como
juego de jugadas simult aneas, pero convirtiendo a cada vertice nal de esta
forma extensiva en un vertice de azar con dos alternativas, una de las cu ales
es un vertice nal del juego que tiene asociada la probabilidad 1 y el
vector de pago acumulado que le corresponde seg un , y el otro ser a un
vertice de continuaci on pues representa el hecho de que el juego sigue.
M as formalmente, los vertices del juego extensivo asociado a (, ) son
las historias h(t) y existen aristas desde una historia a otra, si la diferencia
de sus tama nos es 1 y la mayor coincide en todas sus coordenadas con la
otra excepto en la ultima coordenada. La raz U de este juego extensivo es
h(0).
Las estrategias de comportamiento del juego extensivo asociado a (, )
corresponden a los elementos del conjunto M
j
del juego repetido.
Denici on 7.4.3. X

M
1
M
2
... M
n
es un equilibrio de Nash de
(, ) si para cada j N se cumple que E
j
_
X

_
E
j
_
X

X
j
_
para toda
X
j
M
j
.
314
Mezclando y Jugando en el Largo Plazo 315
Un equilibrio perfecto en subjuegos de (, ) se dene como siempre.
Es claro que para cualquier juego y cualquier en (0, 1), si X

es un
equilibrio de Nash del juego estado , entonces el perl de estrategias de
comportamiento consistente en que en cada historia cada jugador j elige
X
j
es un equilibrio perfecto en subjuegos de (, ). Pero pueden existir
otros de estos. Nos preocuparemos por algunos interesantes.
Denici on 7.4.4. Un vector v de R
n
es factible en , si existe un perl
de estrategias de comportamiento para el que el vector de pago esperado
correspondiente es v.
Consideremos un juego para el que existe un vector de pagos v factible
que domina, para cada jugador, a alg un pago de un equilibrio (o al vector de
pagos maxmin). Los teoremas de la tradici on oral aseguran que existen un
factor de descuento (o probabilidad de seguir jugando) y un equilibrio de
Nash del juego repetido (, ) tales que el vector de pago correspondiente a
este equilibrio es v. En particular, para los dilemas del prisionero, el vector
v = (No Confesar,No Confesar,...,No Confesar)
es factible y domina al vector de pago correspondiente al unico equilibrio de
Nash del juego (que tambien es, en ese juego, el vector de pagos maxmin).
Demostraremos, ahora, una versi on del teorema del folklore debida a
Friedman [18] y que est a inspirada en el principio de ojo por ojo, diente
por diente expuesto en esta secci on para el dilema del prisionero repetido
en horizonte innito.
Teorema 7.4.5 (Teorema de Friedman). Sea = (N, D
i

iN
, ) un
juego que tiene un equilibrio de Nash en estrategias mixtas X

y un vec-
tor factible v tales que v E(X

). Entonces existen en (0, 1) y X

un
equilibrio perfecto en subjuegos del juego repetido (, ), con E(X

) = v.
Demostraci on. Como v es factible, existe un perl de estrategias mixtas
Z en de tal manera que el vector de pago correspondiente es v. Ahora,
construyamos el perl de estrategias X

de (, ) que para toda j en N se


describe como,
X
j
(h(k)) =
_
_
_
Z
j
si k = 0,
Z
j
si i N y t < k, X
i
(h(t)) = Z
i
,
X
j
en cualquier otra historia.
A X

le podemos llamar el perl de estrategias ojo por ojo, diente por


diente. Haremos ver que X

es un equilibrio perfecto en subjuegos de (, )


que tiene asociado el vector de pago v, para valores adecuados de .
315
316 Equilibrios Perfectos en Subjuegos
Con dicho X

, los jugadores empezaran el perodo 0 con el perl Z.


Y con Z seguiran en cada perodo, pues ning un jugador encontrara mo-
tivo para desviarse en alg un momento, es decir la probabilidad de llegar a
cualquier historia que contenga decisiones distintas de Z sera cero y, en-
tonces, el pago para cada jugador j sera:
E
j
(X

) = (1 )
_
_

t=0

h(t)H(t)

t
p
_
h(t)

_
E
j
(Z)
_
_
=
(1 )
_
_

t=0

t
E
j
(Z)

h(t)H(t)
p
_
h(t)

_
_
_
= E
j
(Z)

t=0

t
= E
j
(Z) = v
j
.
Supongamos que todos los jugadores menos el jugador k se mantienen
eligiendo estrategias de la ley del tali on y que el jugador k decide aban-
donarla y elegir

X
k
, donde

X
k
(h(t)) = Z
k
para toda h(t), si t < y para
al menos una h(),

X
k
(h()) ,= Z
k
. Entonces
E
k
(X

X
k
) = (1 ) (
1

t=0

t
v
k
+

p
_
h()

_
X

X
k
__
E
k
(Z

X
k
h())+

t=+1

h(t)H(t)

t
p
_
h(t)

_
X

X
k
__
E
k
(X

X
k
h(t)).
Adem as,
_
E
k
(X

) E
k
(X

X
k
)
_
=
(

t=+1

t
_
v
k


h(t)
p
_
h(t)

_
X

X
k
__
E
k
(X

X
k
h(t)
_
+

_
v
k
p
_
h()

_
X

X
k
__
E
k
(Z

X
k
h()
_
) (1 )
= (1 ) (
+1

t=0

t
_
v
k


h(t)H(t)
p
_
h(t)

_
X

X
k
__
E
k
(X

X
k
h(t)
_
+

_
v
k
p
_
h()

_
X

X
k
__
E
k
(Z

X
k
h()
_
)

+1
(v
k
E
k
(X

)) +
(1 )

_
v
k
p
_
h()

_
X

X
k
__
E
k
(Z

X
k
h()
_
)

+1
_
m ax
X
j
M
j
_
E
k
_
Z

X
j
_
E
k
(X

)
_
_
+

_
v
k
m ax
X
j
M
j
_
E
k
_
Z

X
j
__
_
.
316
Mezclando y Jugando en el Largo Plazo 317
Entonces
E
k
(X

) E
k
(X

X
k
) 0 si

_
m ax
X
j
M
j
E
k
_
Z

X
j
_
E
k
(X

)
_
+
_
v
k
m ax
X
j
M
j
E
k
_
Z

X
j
_
_
es no negativo. Es decir, E
k
(X

) E
k
(X

X
k
) 0 si
1 >
m ax
X
j
M
j
E
k
_
Z

X
j
_
v
k
m ax
X
j
M
j
E
k
(Z [X
j
) E
k
(X

)
.
En consecuencia, para cualquier que cumpla las dos condiciones ante-
riores el juego repetido (, ) tiene un equilibrio de Nash con vector de pago
v. Adem as, es claro que ese equilibrio es perfecto en subjuegos. En efecto,
para los subjuegos que empiezan en vertices que corresponden a historias
en las que cada j N ha elegido su estrategia Z
j
, en todos los periodos,
la restricci on del perl ley del tali on es de nuevo un perl ley del tali on
del subjuego que es un equilibrio de este, mientras que para los subjuegos
correspondientes a historias en las que alg un jugador k no ha elegido su
estrategia Z
k
, en alg un perodo, la restricci on es la adopci on del equilibrio
X

en cada periodo y, por lo tanto, tambien es equilibrio del subjuego en


cuesti on.
Existen otros teoremas de tradici on oral, nosotros nos conformaremos
con este.
Veamos, ahora, un ejemplo en donde la repetici on tiene un efecto seme-
jante a los de los teoremas de tradici on oral m as conocidos. Este ejemplo
est a tratado en una forma un poco distinta al que se suele dar a los juegos
repetidos en general. La exposici on sigue la de un artculo que publicamos en
Aportaciones Matem aticas [59]. Aqu s olo aparece la parte correspondiente
al ejemplo del libro de Bierman y Fern andez [3].
7.4.4. La Conjetura de Coase para un Monopolio en el Mer-
cado de un bien durable
Todo mundo identica con los grandes poderosos dentro de los mercados
a los monopolios. Pero Ronald Coase [11], premio Nobel de Economa en
1992, consideraba que esto no era cierto para aquellos que se dedican a los
bienes durables.
317
318 Equilibrios Perfectos en Subjuegos
Para plantear el problema, comparemos lo que ocurre en tres tipos de
mercados, uno competitivo, uno de bienes que duran un periodo, pero donde
hay un monopolio y otro de bienes durables por muchos periodos, tambien
monopolizados.
Hablemos de la diferencia entre los tres tipos de mercados que nos intere-
san, abusando del ejemplo con el que Jean Tirole [51] introduce la conjetura
de Coase en su libro Organizaci on Industrial.
a.- El Mercado de Competencia Perfecta
Supongamos un mercado en el que hay un s olo bien y 15 individuos,
numerados del 1 al 15, quienes son los consumidores o compradores
potenciales, cada uno de ellos, de una unidad del bien en cuesti on.
La relaci on entre sus preferencias y sus recursos son de tal manera
que el consumidor q preere comprar la unidad del bien si y, s olo si,
esta tiene un precio menor o igual a q pesos. La funci on de demanda
total sera, entonces, igual a 16 p, con p = 1, 2, . . . , 15. Supongamos,
adem as, que hay 5 empresas y que las tecnicas y los recursos de cada
empresa j le permiten producir a lo m as x
j
unidades, de tal manera
que
5

j=1
x
j
= 15. Pensemos que el costo de producir una unidad del bien
es cero, para cada empresa, y que los precios son positivos. Como las
empresas buscan maximizar su ganancia, la oferta social sera igual
a 15 unidades, para todo precio p = 1, 2, . . . , 15. La ganancia de la
empresa j sera px
j
.
El unico precio que iguala la oferta con la demanda, el precio de equi-
librio, es 1 y la ganancia total de equilibrio es 15. Si el precio m aximo
que est a dispuesto a pagar el consumidor 1 fuera un real muy cercano
a cero, el precio de equilibrio y la ganancia total seran tambien muy
cercanos a cero.
b.- El Mercado de un Bien Perecedero Monopolizado
De nuevo, consideremos un mercado con un solo bien que dura un
periodo y los mismos 15 consumidores, dispuestos a comprar, en las
condiciones que describamos en el mercado competitivo. Tendramos
la misma funci on de demanda social de 16 p, con p = 1, 2, ..., 15. En
cambio, en cuanto a la producci on, s olo hay una empresa, es decir un
monopolio. Esta empresa puede decidir a que precio vender a la unidad
de producto y cuanto producir a. Al escoger el precio, determina cu ales
consumidores comprar an y, entonces, puede producir exactamente lo
necesario para satisfacer esa demanda, en ese sentido, para cualquier
318
Mezclando y Jugando en el Largo Plazo 319
precio la oferta es igual a la demanda. Sin embargo, no en cualquier
precio se alcanza la m axima ganancia del monopolio que est a expre-
sada en la funci on 16p p
2
, p = 1, 2, . . . , 15. El precio con el que el
monopolio alcanza la ganancia m axima es de 8 pesos que provoca una
ganancia de 64. El precio de equilibrio es 8, pues en este el monopolio
maximiza su ganancia los consumidores su utilidad y la oferta es igual
a la demanda. Es evidente que no alteraramos el precio de equilibrio,
ni la ganancia del monopolista, si hicieramos muy peque no el precio
con que el consumidor que est a menos interesado en el bien valora la
unidad.
c.- El Mercado de un Bien Duradero que se encuentra Monopo-
lizado. La Conjetura de Coase
Pensemos en la misma situaci on que en el mercado anterior, con la
unica excepci on de que el bien dura por varios periodos, por lo menos
4. El monopolio podra pensar que en el primer periodo tiene en sus
manos la ganancia que se obtiene para los bienes que duran un solo
periodo, es decir, que si en el primer periodo elige el precio de 8 pesos,
seguramente compraran 8 consumidores, con lo que podra ganar 64
pesos. Pero a un quedaran 7 compradores potenciales, el monopolista
tendra una fuerte tentaci on de ir bajando el precio en periodos suce-
sivos para venderles a todos ellos y as acumular mayores ganancias. Si
resolviese problemas de optimizaci on, por periodo, vera que le conven-
dra elegir el precio de 4 pesos, en el segundo, con el que compraran
otros 4 consumidores, el de 2 pesos, en el tercer periodo y el de uno
en el cuarto. De esta manera, el monopolista quiz a calcule que puede
llegar a tener ganancias totales de 85 pesos, vendiendole a todos los
compradores potenciales.
Ronald Coase dira, ante esas elucubraciones del monopolio, que no
son m as que cuentas de la lechera y que la tentaci on del monopo-
lio de venderle a todos, bajando el precio en los periodos siguientes,
es su tal on de Aquiles. Los consumidores se encargaran de romper
la jarra, ya que ellos son capaces de anticipar todos los c alculos del
monopolio y est an seguros de que los precios bajar an en un futuro
pr oximo, por que no esperar esa epoca? Coase no s olo conjetur o que
la situaci on es distinta a la de los bienes perecederos monopolizados,
sino que su previsi on es m as fuerte; el pensaba que se llegara a una
situaci on an aloga a la del mercado de competencia perfecta, en donde
el monopolio pierde todo su poder.
319
320 Equilibrios Perfectos en Subjuegos
Ya que, en este conicto, los consumidores van a tomar decisiones que
no son obligadas y que afectan el resultado nal, estamos en el terreno
de la Teora de Juegos.
Examinemos un modelo estacionario que generaliza el ejemplo numerico
de Bierman-Fern andez en el que un monopolista de la computaci on tiene
frente a s a dos tipos de compradores. Los que llamaremos de tipo 1 usan
profesionalmente el producto y lo desean fervientemente, es decir, tienen una
valoraci on relativamente alta de la unidad de software, digamos que es de p
1
pesos. Supongamos que ellos son s. Los otros m consumidores, los de tipo 2,
lo usan para sus tareas escolares, tienen posibilidades de conseguirlo, en otras
formas menos onerosas que a los profesionales les parecen arriesgadas y lo
valoran a un peque no precio de p
2
pesos, cercano al costo. Se pueden pensar
esas valoraciones como un precio tope, cuando la negociaci on se realiza una
sola vez. Cada consumidor solo desean una unidad del bien. En aras de
simplicar la notaci on, suponemos que el costo de producci on de una unidad
es cero. Supongamos, adem as, que los que tienen una valoraci on muy alta del
bien no son relativamente tan pocos, en el sentido de que (m+s) p
2
< sp
1
.
El conjunto de estrategias del monopolio en el juego estado es el conjunto
de precios que puede escoger, o sea el intervalo [p
2
, p
1
]. Para cada precio que
elija el monopolio, los consumidores, en dicho juego estado, deben decidir si
compran al precio exigido o no lo hacen. Es decir, el conjunto de estrategias
de cada consumidor j es

j
: [p
2
, p
1
] Comprar,No Comprar.
La funci on de pago tiene la forma siguiente:

M
_
p,
1
,
2
, ...,
s
,
s+1
,
s+2
, ...,
s+m
_
= n
p
p,
donde n
p
es el n umero de consumidores que compran al precio p, de acuerdo
a
_

j
_
.
Para j = 1, 2, . . . , s +m,

j
_
p,
1
,
2
, ...,
s
,
s+1
,
s+2
, ...,
s+m
_
=
_
0 si
j
(p) = no compra,
p
j
p si
j
(p) = compra,
donde p
j
es igual a p
1
si el consumidor j es de tipo uno y es igual a p
2
si es
de tipo 2.
Las estrategias del monopolio que est an en el intervalo (p
2
, p
1
) est an
dominadas por p
1
. As que, en un equilibrio de Nash del juego estado, el
monopolio tiene que escoger p
2
o p
1
.
320
Mezclando y Jugando en el Largo Plazo 321
s+m s+m s+m s+m s+m s+m s+m s+m s+m
p
2
p
1
2 2 2 2 2 2
3 3 3 3 3 3 3 3 3 3 3 3
1 1 1

p
A
... ... ...
... ...
... ...
Figura 7.4.4:
Sea

el perl de estrategias
(p
2
, compra p = p
2
, ..., compra p = p
2
) .
El perl

se puede interpretar como un pacto de los consumidores,


para no comprar m as que al precio m as bajo y, por ello, el monopolista se
ve obligado a vender a ese precio.

es un equilibrio de Nash y es bueno


para la sociedad (pues todos pueden comprar) y malo para el monopolista.
Sin embargo, como ya decamos, encierra una amenaza increble de parte de
los consumidores de tipo 1. Pensemos en la forma extensiva de ese conicto,
gura 7.4.4. La situaci on que representa el vertice A consiste en que el
monopolio (M) pide un precio p > p
2
, es claro que a los consumidores de
tipo 1 les convendra comprar y de acuerdo a

no compraran. Siguiendo
a

no se llegar a al vertice A, pero, los consumidores de tipo 1 no juegan


en una estrategia de equilibrio en el subjuego que empieza en A cuando se
utiliza

. Es decir,

no es un equilibrio perfecto en subjuegos.


Hay otro equilibrio

, que se puede construir con el algoritmo de Zer-


melo aplicado al juego de la gura 7.4.4, por lo que es un equilibrio perfecto
en subjuegos. En

, los consumidores de tipo 2 compran si y s olo si M


eligi o p
2
; en cambio, los consumidores de tipo 1 compran a cualquier precio.
Por ultimo, a M le conviene elegir p
1
. En

M exige el precio m as alto


321
322 Equilibrios Perfectos en Subjuegos
posible.

s olo conviene al monopolio, socialmente no es bueno ya que el


software se vende al precio m as alto posible y m compradores potenciales se
quedan sin comprar.
Vayamos, ahora, a la generalizaci on que hacemos del modelo de mo-
nopolio de bienes durables de Bierman-Fern andez. El modelo solo considera
estrategias estacionarias.
Pensemos que el software que produce M es tan bueno que dura toda la
vida.
Queremos construir un juego que exprese el conicto en que est a involu-
crado M con sus consumidores, en esta nueva situaci on. Los consumidores
s olo desean una unidad del bien, en cuanto la compran dejan de ser com-
pradores activos.
Veamos como son afectados los resultados por la repetici on del conicto
en el tiempo. Sin embargo, nos limitaremos a conjuntos de estrategias esta-
cionarias de los jugadores, en el sentido de que, no importando el periodo,
los jugadores solo se basan en la raz on que existe entre el n umero de com-
pradores activos de uno y otro tipo y su relaci on con los precios y con la
tasa de descuento.
Precisando,
a) para los consumidores que ya tienen una unidad del bien, acordemos
que su estrategia para todos los periodos posteriores a su adquisici on
es no comprar;
b) las decisiones de los dem as jugadores, en el tiempo t, dependen s olo
de c
1t
y c
2t
, los n umeros de compradores activos de tipo 1 y de tipo
2, respectivamente, que hay en el periodo t, es decir, aquellos que a un
no han comprado.
b1) As, las estrategias de M son funciones
M
tales que a la pareja
(c
1t
, c
2t
) de compradores activos que aparece en el periodo t, le
asocian una sucesi on de precios, p
k

k=t
, que son los que piensa
exigir M en cada uno de los periodos, a partir de t, debido a que
hay c
1t
del primer tipo y c
2t
del segundo en el periodo t, p
k

[p
2
, p
1
] para toda k.
b2) Las estrategias del consumidor activo j son funciones p
j
de tal
manera que a cada pareja (c
1t
, c
2t
) le asocia un precio de reser-
va p
j
(c
1t
, c
2t
) situado en el intervalo [p
2
, p
1
], de tal manera que j
comprar a cuando, en el periodo t, este presente la pareja (c
1t
, c
2t
)
y el precio que exige el monopolista sea menor o igual que p
j
(c
1t
, c
2t
).
322
Mezclando y Jugando en el Largo Plazo 323
Supondremos, adem as, que las funciones de pago en este nuevo juego
ser an afectadas por un factor de descuento = e
r
, pues no es lo mismo
comprar o vender en un perodo t que hacerlo en uno posterior. Entonces

M
() =

t=1

t1
p
t
n
pt
, donde p
t
es el precio que M escoge en el periodo t
y n
pt
es el n umero de consumidores del tipo 1 y 2 que compran en el periodo
t, al precio p
t
. Los valores p
t
y n
pt
est an determinados por .
La funci on de pago de un comprador j de tipo k = 1, 2 es:

j
() =
_
p
k
p
t
si j compra en t al precio p
t
,
0 si j no compra en ning un periodo.
El perl de estrategias , especica tanto los precios que escoge M en
cada periodo, como el periodo t en que cada comprador j compra, o si no
lo hace nunca.
Dado que cualquier perl de estrategias determina un pago para cada
jugador, tenemos un juego que modela la repetici on del conicto. Podemos
considerar los juegos
(c
1t
,c
2t
)
, que inician en el tiempo t, con la presencia de
la pareja (c
1t
, c
2t
), como subjuegos del juego original. Un perl de estrategias
se puede restringir a esos subjuegos. Diremos que , un equilibrio de Nash,
es perfecto en subjuegos, si para todo subjuego
(c
1t
,c
2t
)
, la restricci on de
es equilibrio de Nash de dicho subjuego.
Hagamos algunas reexiones para conjeturar c omo podran ser algunos
de los equilibrios del juego. Observemos, en primer lugar, que en cualquier
equilibrio, los compradores activos de tipo 2 tendr an que usar como precio
de reserva a p
2
. La estrategia de los compradores de tipo 1 y las de M pueden
ser m as complicadas.
Supongamos, por un momento, que los consumidores activos de tipo 1
no toman en cuenta que el tiempo puede favorecerlos y escogen p
1
, para
toda pareja (c
1t
, c
2t
), como precio de reserva. Entonces, el monopolio puede
aprovechar esa coyuntura y decidir que, en cualquier t, si c
1t
,= 0 cobrar a el
precio m as alto o sea p
1
y, en cuanto c
1t
= 0 cobrar a p
2
, a partir de ese
momento.
Llamemos

a ese perl. Es claro que de llevarse a cabo, el monopolio


vendera, en el primer periodo, a todos los consumidores del primer tipo y
a los dem as, en el segundo periodo. Es claro que las estrategias propuestas
cumplen las condiciones de equilibrio para todos los consumidores. Entonces
la condici on necesaria y suciente para que

sea equilibrio de Nash es que


la ganancia que obtiene M, en ese perl, sea mayor o igual que la que resulta
de vender a todos los consumidores, en el primer periodo, a los precios m as
bajos, es decir, sp
1
+mp
2
(s +m) p
2
. Esta desigualdad equivale a m/s
323
324 Equilibrios Perfectos en Subjuegos
(p
1
p
2
) / (1 ) p
2
. Sin embargo, es claro que, a un en ese caso,

no es
un equilibrio perfecto en subjuegos, pues encierra una amenaza increble de
M, para las parejas (c
1t
, c
2t
), tales que c
1t
/c
2t
(p
1
p
2
) / (1 ) p
2
.
Tratemos de encontrar otros equilibrios. Adoptemos la hip otesis de que
la desigualdad m/s (p
1
p
2
) / (1 ) p
2
se cumple. C omo podran
los fan aticos del software aprovechar la ventaja del tiempo y la existencia
de compradores ap aticos? Es claro que si, en el tiempo t, c
2t
= 0, no hay
esperanzas de que M baje el precio alg un da y los 1 tendr an que resignarse
a tomar, en el periodo t, como precio de reserva a p
1
. En cambio, si todava
permanecen activos compradores de tipo 2 y el comprador de tipo 1 cree
que M puede bajar los precios en alg un momento, considerar a preguntas
como Cu al es el precio m as alto que debera estar dispuesto a pagar en el
tiempo t, si sabe que, en el periodo t + 1, el precio ser a p
2
? Para encontrar
la respuesta llegamos a la desigualdad:

t
(p
1
p
t
)
t+1
(p
1
p
2
) .
Por lo que el comprador de tipo 1 estara dispuesto a pagar, en el periodo
que corre, un precio que sea menor o igual a p
1
(1 ) + p
2
, en lugar de
esperar otro periodo m as para que M baje el precio a p
2
.
Denamos p (0) = p
2
y
p (1) = p
1
(1 ) +p
2
.
Entonces, el comprador j de tipo 1 puede escoger ese precio de reserva en t,
si tiene esperanza de que M escoger a p
2
en el periodo siguiente.
Supongamos que en el periodo t, j no espera que en t + 1 el precio
alcance un precio tan cercano al costo, pero tiene esperanza de que dentro
de k periodos s lo har a, pues en el mercado todava existen compradores de
tipo 2 que no poseen el software. Cu al es el precio m aximo que aceptaran,
en t, los consumidores que tanto necesitan el producto? La pregunta nos
lleva a la desigualdad:

t
(p
1
p
t
)
t+k
(p
1
p
2
)
o
p
t
p
1
_
1
k
_
+
k
p
2
.
Si denimos
p (k) = p
1
_
1
k
_
+
k
p
2
,
324
Mezclando y Jugando en el Largo Plazo 325
podramos pensar que a nuestros profesionales del c omputo, les parecer a bue-
na idea jar como precio de reserva a p(k), si piensan que M tardar a k pe-
riodos en bajar el precio a p
2
. Es claro que p(k) p(k + 1) para toda k, y
que la sucesi on converge al precio p
1
, cuando k tiende a innito.
Veamos, ahora, la forma de actuar de M. Si en el periodo t no hay m as
que estudiantes, vender a a p
2
. En cambio, si s olo quedan compradores con
urgencia de contar con el software, el precio que exigir a es p
1
. El problema
m as complicado que tiene es jar el precio en t, cuando hay compradores
de los dos tipos. Supongamos que conoce los precios de reserva de los com-
pradores, cu ando le conviene vender en t a todos los compradores, aunque
sea al precio p
2
, en lugar de vender s olo a los de alta valoraci on al precio
p(1) y esperar a t + 1, para poner el precio en p
2
? Es decir, cuando es
v alida la desigualdad
t
p
2
(c
1t
+c
2t
)
t
p (1) c
1t
+
t+1
p
2
c
2t
?
La desigualdad es v alida si y s olo si la relaci on entre los compradores
activos acionados y los profesionales tambien activos cumple con
c
2t
/c
1t
(p (1) p (0)) / (1 ) p (0) .
Denimos como l
1
a (p (1) p (0)) / (1 ) p (0).
Si, por el contrario, la relaci on anterior no se cumple en el tiempo t,
a M no le conviene pensar en elegir p
2
en t, sino que esperar a algunos
periodos para hacerlo y, en t, buscar a un precio que esten dispuestos a pagar
inmediatamente los profesionales, a un a sabiendas de que en unos cuantos
periodos el precio llegar a a p
2
. M podra cargar el precio de reserva p(k)
durante k periodos y bajar el precio a p
2
en t + k. O podra vender, en el
periodo t, a un precio p(j) menor que p(k), a cambio de no tener que esperar
tantos periodos, para vender a todo mundo. Cu ando la primera decisi on
es mejor que la segunda? La desigualdad extrema en esa direcci on es la
siguiente:

t
p (k) c
1t
+
t+k
p (0) c
2t

t
p (k 1) c
1t
+
t+1
p (0) c
2t
lo que se cumple si y s olo si
c
2t
c
1t

p (k) p (k 1)
_

k
_
p (0)
, para k > 1.
Denamos como l
k
a (p (k) p (k 1)) /
_

k
_
p (0). Cuando k tiende a
innito, l
k
tiende a cero. Entonces, para cualquier pareja (c
1t
, c
2t
), existen
n umeros naturales k, tales que c
2t
/c
1t
l
k
. Consideremos k, el menor k para
el que se cumple la desigualdad, consideremos que en el tiempo t se encuentra
325
326 Equilibrios Perfectos en Subjuegos
la pareja (c
1t
, c
2t
) de compradores activos y describamos la estrategia de M
de la siguiente manera: a) cargar el precio p(k) durante k periodos, si en
cada uno de los periodos, desde t hasta t +k 1, hay consumidores del tipo
1, b) cargar el precio p(0), a partir del periodo t +k, haya o no compradores
del tipo 1 y c) cargar el precio p(0), del periodo ten adelante, t < t< t +k,
si los ultimos consumidores de tipo 1, compraron en el periodo t1.
Resumiendo,

es el perl de estrategias siguiente:

j
, para j comprador activo de tipo 2, es actuar de acuerdo al precio
de reserva p
2
.

j
, para j comprador activo de tipo 1, es actuar de acuerdo a los precios
de reserva siguientes:
a) p
1
, si c
2t
= 0,
b) p (1), si c
2t
,= 0 y c
2t
/c
1t
l
1
,
c) p (k), si c
2t
,= 0, c
2t
/c
1t
< l
1
y l
k1
> c
2t
/c
1t
l
k
(k 2).

M
(c
1t
, c
2t
) =
p (0) para todo t

t si c
1t
= 0 o si c
1t
> 0 y c
2t
/c
1t
l
1
,
p (k) para todo t

tal que t < t

< t +k si c
1t
> 0, l
k1
> c
2t
/c
1t
l
k
,
p (0) para todo t

tal que t

t +k si c
1t
> 0, l
k1
> c
2t
/c
1t
l
k
,
p (0) para todo t

tal que t t

si c
1t
= 0,
p
1
para todo t

tal que t

t si c
2t
= 0.
Proposici on 7.4.6.

es un equilibrio perfecto en subjuegos del juego del


monopolio de bienes durables.
Demostraci on. Supongamos que en el periodo t, hay una pareja de com-
pradores activos (c
1t
, c
2t
). Si alguno de los dos n umeros, c
1t
o c
2t
es cero, es
claro que ninguno de los jugadores puede esperar cambio con el que mejore.
Supongamos el punto (c
1t
, c
2t
) tal que ninguno de los dos n umeros es
cero. El pago desde ese punto, cuando se usa

, es que los c
1t
presentes
compran al precio p(k) correspondiente a la menor k tal que c
2t
/c
1t
es menor
que l
k
y cada uno gana (p
1
p (k)); los compradores de tipo 2 compran al
precio p(0), en el periodo t + 1 y cada uno gana 0; M obtiene la ganancia

t
c
1t
p (k) +
t+1
c
2t
p (0).
Examinemos si, desde ese vertice, existe alg un cambio en la estrategia
de alguno de los jugadores que le permita mejorar su ganancia. Resulta
evidente que los acionados activos no tienen ninguna opci on con la que
mejoren. Que pasa con un profesional?

El tiene, con

, el precio de reserva
p(k). Si decidiera cambiar a un precio de reserva mayor, en el periodo t, con
ello no alterara, ni el periodo en que compra, que seguira siendo t, ni
su ganancia. Si, por el contrario, cambiara a un precio de reserva menor,
326
Mezclando y Jugando en el Largo Plazo 327
tendra que esperar k periodos para poder comprar, lo hara al precio p(0)
y obtendra la misma ganancia que con

. Cambios en periodos posteriores


al periodo t no tendran ning un efecto pues ya habra comprado.
Por su parte, M podra cargar, en el periodo t, un precio mayor que p(k),
pero entonces nadie le comprara en ese periodo y, en t + 1, se encontrara
frente a la misma pareja de compradores activos, su ganancia habra sufrido
un descuento y sera menor que la que le proporciona

. Si, en cambio, car-


gara un precio pmenor que p(k), obtendra la ganancia
t
c
1t
p

+
t+1
c
2t
p (0),
si p> p(0), o bien la ganancia de
t
(c
1t
+c
2t
) p (0), cuando p= p(0). Por
lo tanto, obtendra una ganancia menor o igual que la obtenida con

. Los
cambios en los periodos siguientes no afectan el pago de M. Entonces la res-
tricci on de

es equilibrio en ese subjuego y, por lo tanto, es un equilibrio


perfecto en subjuegos.
Con ese equilibrio que hemos encontrado, el monopolio pierde su poder.
Ya que, en la situaci on m as desfavorable para los consumidores, aquella en
que el n umero de los muy interesados es relativamente muy alto, todos los
consumidores de tipo 1 compran a un precio relativamente bajo, p(1) =
p
1
(1 ) +p
2
, en el primer periodo. Mientras que los compradores menos
interesados compran casi al costo en el segundo periodo. representa la
impaciencia del monopolista por vender lo m as pronto posible el producto.
Cuanto m as grande sea , m as peque no ser a p(1). Adem as, si los compradores
que no tienen un interes muy grande en el software son relativamente m as
que los que si lo tienen, en el sentido de que (1 ) p
2
m (p
1
p
2
) s,
M elegira el precio p
2
desde el primer periodo y todos los consumidores
compraran en ese periodo al precio m as bajo posible. Si p
2
es sucientemente
peque no estaramos cercanos a la idea de Ronald Coase de que el monopolio
termina compitiendo consigo mismo y se establece una situaci on an aloga a
la de la competencia perfecta. Nuestro juego es de memoria perfecta, no es
de informaci on perfecta, pues en cada periodo hay jugadas simult aneas. El
equilibrio perfecto en subjuegos es en estrategias puras.
En el juego que acabamos de examinar la repetici on ha provocado, como
en los teoremas del folklore o de la tradici on oral, la aparici on de equili-
brios buenos. En general, dichos teoremas se interpretan como una funda-
mentaci on, a pesar de que los equilibrios malos no han sido abolidos, de que
si un juego con caractersticas tipo dilema del prisionero se repite por un
grupo de contendientes racionales, estos terminaran cooperando, estable-
ciendo el bienestar de la sociedad. Es interesante observar que en su artcu-
lo Reputation in Bargaining and Durable Goods Monopoly, L. Ausubel
y R. Deneckere [1] utilizan un teorema del folklore para fundamentar una
327
328 Equilibrios Perfectos en Subjuegos
situaci on antisocial. Ellos construyen un juego repetido que es una ver-
si on m as sosticada, pero m as realista, del ejemplo del monopolio de bienes
durables que acabamos de exponer. En el trabajo de dichos autores, un teo-
rema de tradici on oral relacionado con el problema, permite encontrar un
equilibrio del juego repetido en el que el monopolio recupera su poder y
obtiene una ganancia tan cercana como se quiera a la de un monopolio de
bienes perecederos.
7.5. Inducci on hacia atras en estrategias mixtas
Para redondear el captulo, exponemos un algoritmo de inducci on hacia
atr as para las estrategias mixtas, basado en una forma especial de introducir
la descomposici on y la composici on de estrategias mixtas, respecto a un
juego extensivo nito que se puede descomponer en alg un vertice no nal
A.
Supongamos que tenemos una estrategia pura
j
del jugador j. Si el
vertice A tiene probabilidad positiva de ser alcanzado por la elecci on de la
estrategia pura
j
, decimos que A est a en pos() y que
j
est a en P
j
(A), el
conjunto de estrategias puras de j que hacen posible que el juego llegue al
vertice A.
Consideremos una estrategia mixta X
j
del jugador j en el juego . Dare-
mos una forma para descomponer dicha estrategia en una parte para el
subjuego
A
y otra parte para [A.
Denici on 7.5.1. Considerese un juego extensivo que se puede descom-
poner en el vertice A. Decimos que la estrategia mixta X
j
se descompone
en X
j
A
para
A
y en X
j
[A para [A, si
a) Para
j
[A
j
[A, se tiene X
j
[A
_

j
[A
_
=

j
A

j
A
X
j
_

j
A
,
j
[A
_
;
b) Si X
j
determina una probabilidad positiva de que ocurra A, entonces
para
j
A

j
A
,
X
j
A
_

j
A
_
=

j
|A
j
|A,
j
|Apos(A)
X
j
_

j
A
,
j
[A
_

j
pos(A)
X
j
(
j
)
;
b) Si X
j
determina la probabilidad cero de que ocurra A, entonces para

j
A

j
A
, X
j
A
_

j
A
_
=

j
|A
j
|A
X
j
_

j
A
,
j
[A
_
.
328
Mezclando y Jugando en el Largo Plazo 329
Denici on 7.5.2. Sea

X
j
una estrategia mixta del jugador j en el juego
podado en el vertice A y

X
j
una estrategia mixta de j en el subjuego
que empieza en A. Decimos que
_

X
j
,

X
j
_
estrategia mixta de j en
es la composici on de

X
j
y

X
j
si: para cada
j

j
,
_

X
j
,

X
j
_
_

j
_
=

X
j
_

j
[A
_

X
j
_

j
A
_
.
Claramente, la composici on que hemos denido es una estrategia mixta
para j en el juego completo, pues
_

X
j
,

X
j
_
_

j
_
0,
j

j
y

j
_

X
j
,

X
j
_
_

j
_
=

j
|A
j
|A

j
A

j
A

X
j
_

j
[A
_

X
j
_

j
A
_
=

j
|A
j
|A

X
j
_

j
[A
_

j
A

j
A

X
j
_

j
A
_
=

j
|A
j
|A

X
j
_

j
[A
_
= 1.
Proposici on 7.5.3. Sea

X
j
una estrategia mixta del jugador j en el juego
podado en el vertice A y

X
j
una estrategia mixta de j en el subjuego que
empieza en A. Entonces
_

X
j
,

X
j
_
A
=

X
j
y
_

X
j
,

X
j
_
[A =

X
j
.
Demostraci on. Para toda
j
[A
j
[A
_

X
j
,

X
j
_
[A
_

j
[A
_
=

j
A

j
A
_

X
j
,

X
j
__

j
A
,
j
[A
_
=

j
A

j
A

X
j
_

j
[A
_

X
j
_

j
A
_
=

X
j
_

j
[A
_

j
A

j
A

X
j
_

j
A
_
=

X
j
_

j
[A
_
,
lo que es lo mismo
_

X
j
,

X
j
_
[A =

X
j
. Para toda
j
A

j
A
,
_

X
j
,

X
j
_
A
_

j
A
_
=

j
|A
j
|A,
j
|Apos(A)
_

X
j
,

X
j
__

j
A
,
j
[A
_

j
pos(A)
_

X
j
,

X
j
_
(
j
)
.
Ahora, consideremos un perl de estrategias mixtas tal que el jugador j
elige su estrategia
_

X
j
,

X
j
_
; lo denotamos como
_
X

X
j
,

X
j
__
. La proba-
bilidad de que ocurra A, dado dicho perl, se calcula de la manera siguiente:
P
(X[(
e
X
j
,
b
X
j
))
(A) =
329
330 Equilibrios Perfectos en Subjuegos

A
j
S
0
, A
j+1
Alt(A
j
)AA
j+1
P (A
j+1
[A
j
)

pos(A)
_
X

X
j
,

X
j
__
() .
Consideramos para A
j
S
0
, A
j+1
Alt (A
j
)

A
j
S
0
,AA
j+1
P (A
j+1
[A
j
)
_
_

1
pos
1
(A)
_
X

X
j
,

X
j
_

X
1
_
_

1
_
_
_
...
_
_

n
posn(A)
_
X

X
j
,

X
j
_
[X
n
_
(
n
)
_
_
).
Pero si A est a en pos
__

X
j
,

X
j
__
,

j
pos
j
(A)
_

X
j
,

X
j
_
_

j
_
=

j
|A,Apos(
j
|A)

j
A
_

X
j
,

X
j
__

j
A
,
j
[A
_
.
Por otro lado,

j
|A,Apos(
j
|A)

j
A
_

X
j
,

X
j
__

j
A
,
j
[A
_
=

j
|A,Apos(
j
|A)

X
j
_

j
[A
_
.
Combinando estos resultados y las deniciones de composici on y descom-
posici on de estrategias mixtas, tenemos que para cada
j
A
en
A
,
_

X
j
,

X
j
_
A
_

j
A
_
=

X
j
A
_

j
A
_
.
La proposici on siguiente nos muestra que el juego podado en A, tambien
en estrategias mixtas, es en cierto sentido el juego completo, cuando en el
vertice B se ha concentrado el resultado de que los jugadores se hayan
comportado de acuerdo a un perl X.
Proposici on 7.5.4. Supongamos que se descompone en A y que X es un
perl de estrategias mixtas. Entonces E (X) = E

A
(E
A
(X
A
))
(X [A), donde
E
A
(X
A
) es el vector de pago esperado asociado a

A
E
A
(X
A
)
.
330
Mezclando y Jugando en el Largo Plazo 331
Demostraci on.
E(X) =

FT
P
X
(F) (F) =

FT, FA
P
X
(F) (F)+

FT, FA
P
X
(F) (F) .
Por su lado,
E

A
(E
A
(X
A
))
(X [A) =

FT, FA
P
X
(F) (F) +P
X
(A) E
A
(X
A
) .
Pero si un vertice nal no es mayor o igual que A,
P
X
(F) =

(
1
,
2
,...
n
)
x
1

1
x
2

2
...x
n

nP

(F) =

j
|A

j
A
X
1
__

1
A
,
1
[A
__
...X
n
((
n
A
,
n
[A)) P
(
j
A
,
j
|A)
(F)) =

|A
_
_
_

jN
_
_
_

j
A
X
j
__

j
A
,
j
[A
__
_
_
_
_
_
_P
|A
(F) =

|A
X [A ( [A) P
|A
(F) = P
X|A
(F) .
Adem as,
P
X|A
(A) =

A
j
S
0
,A
j+1
A
P (A
j+1
[A
j
)

jN

j
|A,Apos(
j
|A)
X
j
[A
_

j
[A
_
=

A
j
S
0
,A
j+1
A
P (A
j+1
[A
j
)

jN

j
|A,Apos(
j
|A)

j
A
X
j
A
_

j
A
_
=

A
j
S
0
,A
j+1
A
P (A
j+1
[A
j
)

jN

j
P
j
(A)
X
j
_

j
_
.
Entonces P
X|A
(A) = P
X
(A).
Tenemos dos casos:
i) P
X|A
(A) = 0,
ii) P
X|A
(A) > 0.
Supongamos que F mayor o igual que A.
Si i) es v alido, P
X
(F) = 0 y P
X
(F) = P
X|A
(A) P
X
A
(F [A).
Si ii) es v alido,
331
332 Equilibrios Perfectos en Subjuegos
P
X|A
(A) P
X
A
(F [A) = P
X
(A) P
X
A
(F [A) =

X () P

(F).
Por otro lado, E
A
(X
A
) =

FT,FA
P
X
A
(F [A) (F).
Juntando todas las igualdades, tenemos que
E (X) = E

A
(E
A
(X
A
))
(X [A) .
Como en los casos de las estrategias del juego extensivo (estrategias puras
en su forma normal) y de las estrategias de comportamiento, la propiedad
de que el juego podado, aunque ha perdido la informaci on de lo que ocurre
despues de A, es equivalente al juego original, nos permite generalizar el
teorema de que la composici on de equilibrios es un equilibrio (teorema
?? para las estrategias puras, teorema 7.2.10 para las de comportamiento)
a las estrategias mixtas y con ello, obtener un algoritmo de Zermelo o de
inducci on hacia atr as para el caso de las estrategias mixtas.
Teorema 7.5.5. Supongamos que se descompone en el vertice A y que X

A
y X

[A son equilibrios de Nash(em) de


A
y

A
(E
A(X

A
))
, respectivamente.
Entonces la composici on (X

A
, X

[A) es un equilibrio de Nash (em) de .


Demostraci on. Para cualquier estrategia mixta

X
j
del jugador j, tenemos
E
j
__
(X

A
, X

[A)

X
j
__
= E

A
(E
A
(X
A
))
j
__
(X

A
, X

[A)

X
j
_
[A
_
=

FA
P
(((X

A
,X

|A)[
b
X
j
)|A)
(F)
j
(F) +
P
((X

A
,X

|A)[
b
X
j
)|A
(A) E
A
j
__
(X

A
, X

[A)

X
j
_
A
_

FA
P
(((X

A
,X

|A)[
b
X
j
)|A)
(F)
j
(F) +P
((
X

A
,X

|A
)|
b
X
j
)
|A
(A) E
A
j
((X

A
)) =
E

A
(E
A(X

A
))
j
__
(X

A
, X

[A)

X
j
_
[A
_

E

A
(E
A(X

A
))
j
((X

A
, X

[A) [A) = E
j
((X

A
, X

[A)) .
Es decir, (X

A
, X

[A) es un equilibrio de Nash en estrategias mixtas de


.
332
Mezclando y Jugando en el Largo Plazo 333
El algoritmo de Zermelo (inducci on hacia atr as) sera igual que en los
otros casos, s olo que respetando las deniciones de composici on que se han
dado para las estrategias mixtas.
Estudiemos el ejemplo de la gura 7.5.1.
1
0
1
1
2
1
1
2
1
1
0
1
0
1
1
2
1
1
2
1
1
0
1
1
0
1
1
2
1
1
2
1
1
0
1
1
1
0
1
1
2
1
1
2
1
1
0
1
I
II II
I
III III III III III III
II A B I C A II
III
Aguila Sol
Aguila Aguila Sol Sol
Sol Aguila Aguila Aguila Aguila Sol Sol Sol
Aguila Aguila Aguila Aguila Aguila Aguila
Sol Sol Sol Sol Sol Sol
III
Sol
Aguila Aguila
Sol
Figura 7.5.1:
Aplic andole el algoritmo, consideramos el subjuego
A
, cuya forma nor-
mal es (N = II, III , D
j
= 1, 2 ,
A
), donde
A
se describe en la ma-
triz siguiente:
_
(0, 1) (2, 1)
(2, 1) (0, 1)
_
.
El unico equilibrio de Nash (em), referido a los jugadores involucrados II y
III, es el perl ((
1
2
,
1
2
), (
1
2
,
1
2
)). Dicho perl determina el vector de pago espe-
rado (1, 1, 0). Entonces asociamos dicho pago al vertice A y obtenemos el
juego podado

A
(1,1,0)
. Consideremos el subjuego

A
(1,1,0)
B
cuya for-
ma normal es (N = I, III , D
j
= 1, 2 ,
B
), donde
B
est a representa-
do por la misma matriz que
A
. Es decir, tambien tiene como unico equilibrio
de Nash a ((
1
2
,
1
2
), (
1
2
,
1
2
)) y el vector de pago esperado es (1, 1, 0). Arriba-
mos al juego

A
(1,1,0)

B
(1,1,0)
y consideramos el subjuego

A
(1,1,0)

B
(1,1,0)
C
,
en el que participan de nuevo I y III, en el juego con la misma matriz
que antes. Su unico equilibrio es ((
1
2
,
1
2
), (
1
2
,
1
2
)), con vector de pago esper-
ado (1, 1, 0). Construimos el juego

A
(1,1,0)

B
(1,1,0)

C
(1,1,0)
y con-
333
334 Equilibrios Perfectos en Subjuegos
sideramos su subjuego

A
(1,1,0)

B
(1,1,0)

C
(1,1,0)
D
. En este subjuego
participan los jugadores II y III y tiene la matriz de pagos considerada
en los otros tres casos. El unico equilibrio de Nash (em) de este juego es
((
1
2
,
1
2
), (
1
2
,
1
2
)) que determina el vector de pago esperado (1, 1, 0). Tenemos,
por ultimo, el juego podado en los cuatro vertices,

A
(1,1,0)

B
(1,1,0)

C
(1,1,0)

D
(1,1,0)
(gura 7.5.2), en donde s olo juegan los jugadores I y II
y cuya matriz de pago es

Aguila Sol

Aguila
Sol
_
(1, 1) (1, 1)
(1, 1) (1, 1)
_
.
El unico equilibrio de Nash de este juego es, tambien, ((
1
2
,
1
2
), (
1
2
,
1
2
)).
1
1
0
1
1
0
1
1
0
1
1
0
I
II II
Aguila Sol
Aguila Aguila Sol Sol
Figura 7.5.2:
Que equilibrio en estrategias mixtas determina para el juego , el algo-
ritmo de Zermelo que hemos seguido?
En , los jugadores I y II tienen 8 estrategias puras cada uno y el III
tiene 16. Entonces el equilibrio de Nash del juego original ser a:
X
I
=
_
1
8
,
1
8
,
1
8
,
1
8
,
1
8
,
1
8
,
1
8
,
1
8
_
,
X
II
=
_
1
8
,
1
8
,
1
8
,
1
8
,
1
8
,
1
8
,
1
8
,
1
8
_
y
X
III
=
_
1
16
,
1
16
, ...,
1
16
, ...,
1
16
,
1
16
_
.
En este juego, como en otros que tienen mayor interes, es m as conveniente
describir el unico equilibrio de Nash del juego, a traves de las estrategias de
comportamiento. En ellas, en cada uno de sus conjuntos de informaci on,
cada uno de los tres jugadores escoge, con probabilidad un medio, el aguila
y con probabilidad un medio el sol.
334
Mezclando y Jugando en el Largo Plazo 335
No para todos los juegos es posible hacer esto, s olo en aquellos en los que
los jugadores recuerdan todo lo que han hecho hasta el momento, es decir
aquellos que hemos llamado de memoria perfecta.
7.6. Ejercicios
Ejercicio 7.1. Encuentre los vectores de pago correspondientes a los perles
de estrategias de comporatamiento para el juego 7.5.1. La notaci on usada
para describir estrategias de comportamiento en los juegos extensivos es
an aloga a la que usamos para las estrategias de dichos juegos.
X
I
=
__
1
3
,
2
3
_
,
_
2
5
,
3
5
_
, (1, 0)
_
,
X
II
=
__
3
4
,
1
4
_
, (0, 1) ,
_
1
10
,
9
10
__
,
X
III
=
__
1
7
,
6
7
_
,
_
2
15
,
13
15
_
,
_
7
9
,
2
9
_
,
_
1
2
,
1
2
__
X
I
=
__
1
3
,
2
3
_
,
_
2
5
,
3
5
__
,
X
II
=
__
3
4
,
1
4
_
, (0, 1) ,
_
1
10
,
9
10
__
,
X
III
=
__
1
7
,
6
7
_
,
_
2
15
,
13
15
_
,
_
7
9
,
2
9
_
,
_
1
2
,
1
2
_
, (1, 0) , (0, 1)
_
.
Ejercicio 7.2. Puede encontrar, para el juego de la gura 7.5.1 y un per-
l de estrategias de comportamiento que sea equilibrio de Nash, pero no
perfecto en subjuegos?
Ejercicio 7.3. Estudie todos los juegos extensivos que han aparecido en el
libro y determine cu ales son de memoria perfecta y cu ales no lo son.
Ejercicio 7.4. Para los juegos de memoria perfecta nitos, lleve a cabo un
algoritmo de Zermelo para encontrar un equilibrio de Nash en estrategias
de comportamiento perfecto en subjuegos.
Ejercicio 7.5. Para esos mismos juegos encuentre un equilibrio de Nash per-
fecto en subjuegos en estrategias mixtas y compare los resultados obtenidos
en el ejercicio 5.
Ejercicio 7.6. Para los juegos a los que se reere el ejercicio 7.4, encuentre
equilibrios de Nash en estrategias de comportamiento que no sean perfectos
en subjuegos, si esto es posible.
Ejercicio 7.7. Estudie el juego de Cournot repetido por n periodos. En-
cuentre un equilibrio perfecto en subjuegos.
Ejercicio 7.8. Estudie el juego de Cournot repetido en horizonte innito.
Encuentre un equilibrio perfecto en subjuegos.
335
336 Equilibrios Perfectos en Subjuegos
Ejercicio 7.9. Estudie el juego de Bertrand repetido por n periodos. En-
cuentre un equilibrio perfecto en subjuegos.
Ejercicio 7.10. Considere el siguiente juego:
Un grupo de 4 miembros est a involucrado en el conicto tipo dilema del
prisionero siguiente:
G = (N = 1, 2, 3, 4, D
j
= Cooperar, No Cooperar, ), con

j
() =
_
+ (s

+ 1) 1 si
j
= Cooperar,
+s

si
j
= No Cooperar,
donde s

= #
_

i
= Cooperar [i ,= j
_
, = 1.2, = .9, n = 4.
Como hemos estudiado en el captulo 1, el unico equilibrio de Nash del
juego es que nadie coopera.
El grupo considera la conveniencia de formar una organizaci on. Cada
uno, tiene que decidir si participa en ella o preere no hacerlo. Los que deci-
den participar se comprometen a cooperar, pero pueden decidir no hacerlo,
y uno de ellos se encargar a de vigilar si cumplen o no y castigar a los que
no lo hagan. El que se encargue de vigilar y castigar no obtiene m as ingreso
que el salario que los miembros de la organizaci on decidan pagarle por su
tarea. Los otros miembros de la organizaci on eligen el salario del vigilante
dentro del conjunto W = 1, 1.2, 1.5 y un castigo p al infractor dentro del
conjunto P = menor que .1 + .9, igual que .1 +.9, mayor que .1 +.9.
Es decir, cada jugador j escoge (w
j
, p
j
) W P. El salario ser a el mnimo
de w
j
y el castigo el m aximo de p
j
. Despues de acordado el castigo y
el salario, se elige al azar de entre los participantes al vigilante. El elegido
acepta o rechaza el cargo, de acuerdo al salario que le pagar an. Si no lo
acepta, la organizaci on se deshace y los 4 miembros se enfrentaran en el
dilema del prisionero. Si acepta, cada uno de los miembros de la comunidad
deben decidir si cooperan o no lo hacen, en el entendido de que algunos de
ellos ser an castigados si no lo hacen. Los pagos son:

j(s,p,)
(a) =
_

_
+ (1 ) (s
a
+ 1) 1 si a
j
= C y j N i

,
+ (1 ) s
a
si a
j
= NC y j / S,
+ (1 ) s
a
p si a
j
= NC y j S i

,
s
a
si j = i

.
El modelo extensivo se esboza en la gura 7.6.2.
Encuentre un equilibrio de Nash perfecto en subjuegos en estrategias de
comportamiento que sea simetrico y con vector de pago no dominado.
336
Mezclando y Jugando en el Largo Plazo 337
(3)
3
1
3
1
3
1
3
(3)
3
(3)
3
(3)
3
(3)
3
(3)
3
(3)
3
(3)
2
(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(4)
2
(3)
2
(3)
2
(2)
2
(2)
2
(1)
2
(1)
2
(1)
2
(0)=G
2
(p, )
(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

(p, )

I
II
P NP
2 2
NP NP P
3 3 3 3
4 4 4 4 4 4 4 4
3 3
C
NC NC
C
NC
C
NC
3
C NC
1
2 2
G(3) G(3) G
G
nac ac ac nac nac ac
1 2 3
G
... ... ... ...
3 3 3 3 3 3 ... ... ...
3
C
2
...
...
... ...
P
P NP P NP P NP P NP
P NP P NP NP NP NP NP NP NP P P P P P P
I
2 2
4
4 4
4
4
4
4
4
4
4
4 4
0
C
NC
C NC
Figura 7.6.1:
Ejercicio 7.11. Estudie con cuidado el ejemplo 7.3.2 y elija un equilibrio
para cada subjuego que pueda, elija equilibrios en estrategias mixtas y com-
ponga todos los equilibrios obtenidos para obtener un equilibrio de perfecto
en subjuegos en estrategias mixtas. Esboce los dibujos de los subjuegos y de
337
338 Equilibrios Perfectos en Subjuegos
los juegos podados, es decir, indique la estructura esencial.
Ejercicio 7.12. El juego con la matriz siguiente:
agresivo conciliador
agresivo
conciliador
_
(1, 1) (5, 2)
(2, 5) (3, 3)
_
tiene tres equilibrios. Cu antos equilibrios perfectos en subjuegos en estrate-
gias de comportamiento tiene el juego extensivo de la gura 7.6.2 que resulta
de repetir 2 veces dicho juego? Los pagos de las dos etapas se suman.
2

2
6

3
3

6
6

3
10

4
7

7
8

5
5

8
4

4
4

4
8

5
5

8
6

6
3

6
7

7
I
agresivo conciliador
2 2
agresivo conciliador agresivo conciliador
1 1 1 1
agresivo conciliador agresivo conciliador agresivo conciliador agresivo conciliador
2 2 2 2 2 2 2
conciliador conciliador conciliador conciliador conciliador conciliador
agresivo agresivo agresivo agresivo agresivo agresivo
2
agresivo agresivo
conciliador conciliador
4

10
Figura 7.6.2:
338
Mezclando y Jugando en el largo Plazo 339
Ejercicio 7.13. Dise ne un dilema del prisionero de m as de 2 jugadores y
encuentre el valor de descuento mnimo para que el juego repetido (, )
tenga como uno de sus equilibrios de Nash al perl ojo por ojo, diente por
diente.
339
340 Selecci on de Equilibrios
340
Captulo 8
Selecci on de Equilibrios
8.1. Y si existe mas de un equilibrio?
A lo largo de este texto nos hemos encontrado con numerosos juegos que
tienen m as de un equilibrio de Nash, tanto si nos limitamos a las estrategias
puras, como a las mixtas. En algunas ocasiones, hemos argumentado a favor
de algunos equilibrios y en contra de otros. Por ejemplo, en los juegos ex-
tensivos, preferimos los equilibrios de subjuego perfecto a los que no lo son,
porque en los primeros se garantiza que los jugadores est an prevenidos contra
los errores que puedan cometerse. An alogamente en los juegos antag onicos
(en estrategias puras o mixtas) argumentamos a favor de los equilibrios for-
mados por estrategias conservadoras. Sin embargo, no hemos presentado
una forma sistem atica para discriminar dentro del conjunto de equilibrios y
quedarnos s olo con el conjunto de equilibrios que sea mejor desde alg un
punto de vista preciso.
Esta problem atica empez o a trabajarse desde nales de los a nos 50 del
siglo pasado y su desarrollo, desde el inicio, se asocia a los nombres de
Harsanyi y Selten. Por este desarrollo, estos autores recibieron, junto a John
Nash, el premio Nobel de Economa en 1994. Desde luego, John Nash no es
ajeno a esta problem atica, como a muchos de los temas centrales de la Teora
de Juegos cuyo desenvolvimiento vislumbr o, as fuera en sus lineamientos
generales, desde los trabajos, en donde introdujo el concepto de equilibrio
que lleva su nombre y demostr o el teorema de existencia. Pero es en el exten-
so e importante libro A General Theory of Equilibrium Selection in Games
de Harsanyi y Selten [26], donde se encuentran una gran cantidad de resul-
tados y conceptos asociados a este tema y se exploran en forma muy extensa
y sugestiva la mayora de las ideas que se han generado a su alrededor, como
341
342 Selecci on de Equilibrios
el concepto de equilibrio de subjuego perfecto, el equilibrio bayesiano y mu-
chos otros. Las concepciones din amicas de aprendizaje para la selecci on de
equilibrio est an tambien vinculadas a estos autores. Sin embargo, las ideas
m as relacionadas con una selecci on que se apoya en la racionalidad de los
jugadores son las que expondremos de acuerdo a esos autores, mientras que
las ideas que seleccionan equilibrios de acuerdo al aprendizaje, las tomamos
de los llamados juegos evolutivos.
En este captulo, expondremos brevemente dos enfoques distintos para
la selecci on de equilibrios. En el primero de ellos, lo decisivo es encontrar
criterios de discriminaci on de los equilibrios basados en supuestos sobre
la racionalidad de los jugadores, en particular, sobre el riesgo que corren
al elegir estrategias, y sobre el conocimiento que ellos tienen sobre todas
las vicisitudes que pueden ocurrir y sobre la personalidad y gustos de los
dem as. En el segundo, por el contrario, se pretende simular la forma de ac-
tuar de personas comunes y corrientes con limitaciones de racionalidad y de
conocimiento, aunque pueden tomar en cuenta su experiencia, con las limi-
taciones que mencionamos, para corregir sus estrategias intentando mejorar
su pago, pero cometiendo errores en esta correcciones. En este ultimo caso,
se estudia hacia donde conducen esas correcciones con errores, si lo hacen o
no a equilibrios de Nash y cu ales de estos seleccionaran, en caso de hacer-
lo. En ambos enfoques, como decamos, Harsanyi y Selten son importantes,
aunque, en el segundo que es mucho m as reciente, hay asociados a el muchos
otros nombres, en especial el de Maynard Smith [35]. Fue en la decada de los
80 que se empez o a desarrollar ampliamente este enfoque que busca darle al
concepto de soluci on de Nash un fundamento m as acorde con la losofa de
los juegos no cooperativos.
En la secci on 8.2 de este captulo, elegimos, para exponer los criterios de
selecci on racional, en primer lugar, las ideas de Nash sobre dicha selecci on
y, en segundo lugar, el artculo de Harsanyi de 1959. Este artculo desarrol-
la sistem aticamente una forma de selecci on basada en fuertes criterios de
racionalidad.
Frente a este enfoque se exponen, en la mayor parte del captulo, a partir
de la secci on 8.3, las ideas din amicas de selecci on propias de los Juegos
Evolutivos. Nos basamos para dicha exposici on en los trabajos de Kandori,
Mailath, Rob [28, 29] y Young [56, 57].
342
Mezclando y Jugando en el largo Plazo 343
8.2. Selecci on de Harsanyi
Los criterios de Nash y los del artculo pionero de Harsanyi [25] para
seleccionar equilibrios resultan, en cierto sentido, normativos, pues se basan
en deniciones de dominancia de unos equilibrios sobre otros que requieren
hip otesis de racionalidad y de conocimiento, tanto privado como com un,
muy fuertes. A pesar de que el ideal de la teora de Juegos No Cooperativos
est a muy alejado de este tipo de supuestos tan fuertes, no le ha sido f acil
prescindir de ellos. El mismo concepto de soluci on propio de esta teora, el
equilibrio de Nash, los contiene ampliamente. En esta secci on expondremos
el metodo de selecci on correspondiente a estos supuestos.
Veamos, primero, el enfoque de selecci on de Nash.
8.2.1. La Selecci on de Equilibrios Propuesta por Nash
Equilibrios intercambiables
Dado un juego rectangular, la primera idea para escoger el subconjunto
de equilibrios de un cierto juego que tuviera derecho a ser llamado la soluci on
del juego es de Nash. Para el, este tipo de subconjuntos de equilibrios tendra
que ser de tal manera que los jugadores llegaran a alguno de sus puntos, sin
necesidad de ponerse de acuerdo. Supongamos que dos equilibrios X

y
X

pertenecieran al conjunto soluci on, si los jugadores tienen que actuar


sin avisarse, ni siquiera a traves de se nales, de cu al de los dos equilibrios
piensan elegir, es muy probable que unos se inclinaran por las estrategias
correspondientes a X

y otros por las de X

y, entonces, ni el perl X

ni el
X

se alcanzaran, sino alguna de las posibles combinaciones de estrategias


de ambos perles. Nash reexiona diciendo que el conjunto soluci on debe
ser de tal manera que cualquiera de esas combinaciones de equilibrios en el
conjunto soluci on debe ser, a su vez, un equilibrio que pertenezca a dicho
conjunto. Precisamos la idea en la primera denici on.
Denici on 8.2.1. Se dice que X

y X

, dos equilibrios de Nash de un


juego rectangular, son intercambiables, si cualquier perl (Y
1
, Y
2
, . . . , Y
n
)
tal que Y
j
= X
j
o Y
j
= X
j
es equilibrio de Nash.
Denici on 8.2.2. Un subconjunto

de equilibrios de Nash de un juego


rectangular es una soluci on de Nash, si cada pareja de elementos de

es
intercambiable y

es maximal respecto a dicha propiedad.


Sea B un subconjunto de equilibrios de Nash de un juego y

X
j
una
estrategia mixta de j, denotamos como B(

X
j
) al conjunto
343
344 Selecci on de Equilibrios
(X

X
j
) B.
Denici on 8.2.3. Sea B un subconjunto de equilibrios de un juego rectan-
gular y

X
j
una estrategia de j. El pago de seguridad de

X
j
relativo a B es,
por denici on, mn
(X[
b
X
j
)B
E
j
_
X

X
j
_
.
Dado un subconjunto de equilibrios B y el perl de estrategias mixtas
X, B es admisible respecto a X, si el pago de seguridad de la estrategia X
j
relativo a B est a bien denido, para toda j.
Si B es admisible respecto a alg un
_
X

X
j
_
B, denotemos como
E

j
_

X
j
[B
_
al mn
(X[
b
X
j
)B
E
j
_
X

X
j
_
.
Lema 8.2.4. Si

es una soluci on de Nash, entonces para todo



X en

,
tenemos que E

j
_

X
j
[

_
= mn
X

E
j
(X) para todo jugador j.
Demostraci on. Sean X

y X

dos equilibrios cualesquiera en

. Ambos
son intercambiables y por las propiedades de equilibrio de ambos perles,
tenemos
E
j
_
X

X
j
_
E
j
_
X

X
j
_
E
j
_
X

X
j
_
.
Es decir, E
j
(X

) = E
j
_
X

X
j
_
Por otro lado, para todo jugador j,
E

j
_
X
j
[

_
= mn
(X|X
j
)

E
j
_
X

X
j
_
= E
j
_

X
j
_
para alg un
equilibrio

X de

. Por otra parte,


E
j
_

X
j
_
= E
j
_

X
j
_
E

j
_
X
j
[

_
= mn
(X|X
j
)

E
j
_
X

X
j
_
.
Pero mn
(X|X
j
)

E
j
_
X

X
j
_
= E
j
_

X
j
_
para alg un equilibrio

X
de

.
Por lo tanto, E
j
_

X
j
_
E
j
_

X
j
_
E

j
_
X
j
[

_
.
Usando todas las desigualdades, se obtiene que E

j
_
X
j
[

_
=E

j
_
X
j
[

_
,
es decir todos los equilibrios de una soluci on de Nash tienen el mismo pago
de seguridad relativos a esta soluci on.
Adem as, mn
X

E
j
(X) = E
j
_

X
_
para alg un equilibrio

X en

, por lo
que
E
j
_

X
_
= E
j
_

X
j
_
E

j
_

X
j
[

_
E
j
_

X
_
= mn
(X)

j
(X) .
344
Mezclando y Jugando en el largo Plazo 345
Es decir, los equilibrios de una soluci on de Nash son equivalentes por los
pagos usuales y por los pagos de seguridad. Desgraciadamente no siempre
existen.
8.2.2. La Selecci on de Harsanyi
Harsanyi construye, en su artculo de 1963, una metodologa sistem atica
para ir depurando el conjunto de equilibrios de Nash de un juego hasta
obtener un subconjunto de equilibrios satisfactorio que pueda considerarse
la soluci on del juego. Esta soluci on siempre existe.
Como decamos m as arriba, la selecci on de Harsanyi est a basada en
fuertes supuestos de racionalidad. Una racionalidad que se establece frente
a la seguridad, el equilibrio y el riesgo.
Este autor considera como situaciones muy diferentes, aquella que ocurre
en un juego, en el que los jugadores no pueden tener ning un tipo de comu-
nicaci on, estando obligados a limitarse a acuerdos t acitos y la que ocurre en
un juego en el que hay comunicaci on, aunque no sea m as que a traves de
se nales, entonces se denen dos conceptos de soluci on, la t soluci on, para
los primeros, y la vsoluci on, para los segundos. Estas soluciones coinciden
en gran cantidad de casos, pero no en todos.
8.2.3. La v-Soluci on y la t-Soluci on de Harsanyi
En primer lugar, est a la idea de seguridad, en el sentido de que los
jugadores se mueven con base en lo que pueden lograr por sus propias fuerzas,
en la forma que se introdujo el m aximo asegurable.
Es cierto que en un equilibrio de Nash, cualquier jugador j gana al menos
dicho m aximo asegurable, v
j
= m ax
X
j
M
j
mn
XM
E
j
_
X

X
j
_
, pero si a alguno de
ellos se le ocurre cambiar de estrategia, j puede ganar menos. Es decir, cuan-
do un jugador j elige una estrategia de equilibrio no siempre estar a seguro
de ganar al menos v
j
. Examinemos, por ejemplo, el juego 1.3.2 c),
_
(1, 1) (0, 2)
(2, 0) (5, 5)
_
.
En este juego, la pareja de estrategias (1, 2) es un equilibrio de Nash. El
m aximo asegurable en estrategias mixtas para el jugador I es 5/8. En el
equilibrio (1, 2), I gana 0, una cantidad mayor que v
I
, pero si, por cualquier
raz on, el segundo jugador escoge su primera estrategia, mientras que I sigue
en la estrategia del equilibrio en cuesti on, la 1, ganar a 1 que es menor que
5/8.
345
346 Selecci on de Equilibrios
Por que podra aceptar, un jugador, actuar de acuerdo a un equilibrio
de Nash? Porque le da cierta seguridad sobre la conducta de los dem as ju-
gadores, aunque siempre hay un riesgo de que ellos no cumplan. El problema
es que a veces dicho riesgo signica ganar menos que el m aximo asegurable.
Pensemos en un equilibrio de Nash X

en el que j gana algo que puede


conseguir por s mismo, por ejemplo v
j
. Y que, adem as, para X

hay una
estrategia X
k
de un jugador k, tal que E
j
_
X

X
k
_
< v
j
. Claramente, para
j, no valdra la pena correr el riesgo. Por ello, dicho jugador s olo conside-
rar a correr el riesgo de ganar menos que su m aximo asegurable para los
equilibrios en los que obtenga un pago estrictamente mayor que el m aximo
asegurable. Pero esto debe ser cierto no s olo para el mismo, sino tambien
para todos los dem as. Es decir, j s olo considerar a correr el riesgo de ac-
tuar de acuerdo al equilibrio X

si para todo k, E
k
(X

) > v
k
. Esto ultimo,
no porque a j le preocupe, en lo m as mnimo, el bienestar de los dem as,
sino porque sabe que si alg un otro jugador k gana con un equilibrio X

su
m aximo asegurable y X
k
no es una estrategia conservadora, entonces no es
posible contar con que k actuar a de acuerdo a X

.
La idea de seguridad ha sido introducida, en este texto, desde el primer
captulo con las estrategias puras conservadoras de los jugadores que les
permiten, sin importar las acciones de los dem as jugadores, ganar al menos
su m aximo asegurable respecto a las estrategias puras. Despues se exten-
di o al contexto de estrategias mixtas. Harsanyi trabaja el concepto relativo
a cualquier subconjunto de estrategias mixtas.
Para arribar a la primera selecci on de Harsanyi, denimos:
Denici on 8.2.5. Se dice que un equilibrio de Nash X

es benecioso si,
para toda j, E
j
(X

) > v
j
.
Entonces, un jugador j no puede aceptar actuar de acuerdo a un perl
de estrategias X, si este no es un equilibrio benecioso.
En el ejemplo anterior, los dos equilibrios en estrategias puras (1, 2) y
(2, 1) son beneciosos; en cambio el equilibrio ((5/8, 3/8), (5/8, 3/8)) no lo
es pues los jugadores ganan 5/8, el m aximo asegurable para ambos.
Estudiemos un ejemplo con m as equilibrios.
Ejemplo 8.2.1.
_
(0, 0) (1, 0)
(2, 1) (0, 0)
_
El conjunto de equilibrios es
((1, 0), (y, (1 y)) [0 < y < 1/3 ((0, 1), (1, 0)), ((1, 0), (0, 1)).
346
Mezclando y Jugando en el largo Plazo 347
Como tenemos que v
1
= 2/3 y v
2
= 0, el unico equilibrio benecioso es
((0, 1), (1, 0)), pues en todos los dem as el pago que obtiene el jugador II es
0.
La primera depuraci on del conjunto de estrategias de un jugador que
realiza Harsanyi es la de deshacerse de aquellas que no forman parte de
alg un equilibrio benecioso. Con ello, obtiene un juego m as peque no, con
los conjuntos de estrategias restantes.
Denotemos como
0
, al conjunto de todos los equilibrios y como
1
al
subconjunto de los equilibrios beneciosos,
1

0
. Notemos que
1
puede
ser vaco. Por ejemplo, los juegos antag onicos del captulo 1, en particular
todos los juegos bipersonales de suma cero no tienen equilibrios beneciosos.
Primer Criterio para la Selecci on de Harsanyi
En caso de que el conjunto de equilibrios beneciosos del juego (N, D
j
, )
sea vaco, podemos decir que la soluci on de Harsanyi del juego (la v solu-
ci on y la tsoluci on) es el conjunto
(

X
1
,

X
2
, . . . ,

X
n
)


X
j
es conservadora, para toda j
Podemos establecer los resultados siguientes.
Proposici on 8.2.6. En un juego 2 2, sin equilibrio de Nash en estrate-
gias puras, la v soluci on es el conjunto de perles de estrategias mixtas
conservadoras (la tsoluci on coincide con la vsoluci on).
Demostraci on. El juego puede expresarse con la matriz
_
(a
11
, b
11
) (a
12
, b
12
)
(a
21
, b
21
) (a
22
, b
22
)
_
,
con a
11
a
12
+a
22
a
21
y b
11
b
12
+b
22
b
21
distintos que cero.
El unico equilibrio del juego es de la forma (

X
1
,

X
2
), donde

X
1
= (
b
22
b
21
b
11
b
12
+b
22
b
21
,
b
11
b
12
b
11
b
12
+b
22
b
21
)
y

X
2
= (
a
22
a
12
a
11
a
12
+a
22
a
21
,
a
11
a
21
a
11
a
12
+a
22
a
21
).
Sea a = a
11
a
12
+a
22
a
21
y b = b
11
b
12
+b
22
b
21
, entonces,
E
1
(

X
1
,

X
2
) =
1
ab
((b
22
b
21
) (a
22
a
21
) a
11
+
(b
22
b
21
) (a
11
a
12
) a
12
+ (b
11
b
12
) (a
22
a
21
) a
21
+
(b
11
b
12
) (a
11
a
12
) a
22
=
347
348 Selecci on de Equilibrios
1
ab
(b
11
b
12
+b
22
b
21
) (a
11
a
22
a
12
a
21
) = v
1
.
An alogamente, se demuestra que E
2
(

X
1
,

X
2
) = v
2
.
Para algunos de estos juegos 22, el equilibrio est a formado por estrate-
gias conservadoras, en cambio para otros no. En los primeros, la soluci on
sera el equilibrio, en los segundos la pareja de estrategias conservadoras.
Por los resultados obtenidos en el captulo 6, se tiene la proposici on 8.2.7.
Proposici on 8.2.7. En un juego antag onico, tanto la v-soluci on, como la
t-soluci on es el conjunto de los equilibrios de Nash que est an formados por
estrategias conservadoras para cada jugador.
Otro de los ejemplos que aparece en muchas ocasiones es el dilema del
prisionero n-personal (ejemplos 1.3.6 a) y b)). En ese juego, el unico equi-
librio de Nash es el perl en el que los jugadores eligen No Cooperar. Este
equilibrio no es benecioso, pues los jugadores ganan exactamente su m axi-
mo asegurable. Entonces
1
es vaco, la soluci on (los conjuntos v-soluci on
y t-soluci on de Harsanyi) consta del perl formado por estrategias conser-
vadoras que adem as es el unico equilibrio de Nash del juego, es decir,

0
= (No Cooperar, No Cooperar, . . . , No Cooperar).
Segundo Criterio de Harsanyi
Supongamos, ahora, que
1
no es vaco. Para construir el segundo criterio
de Harsanyi se establecen ciertos criterios de dominancia, de unos equilibrios
sobre otros, basados en los pagos de seguridad que tienen los jugadores,
respecto a las estrategias correspondientes a equilibrios de Nash que est an
en subconjuntos de
1
.
Dominancia Simple y Dominancia Estricta
Eliminamos todas las estrategias, de cada jugador j, que no correspondan
a equilibrios beneciosos; denotemos como

M
1
j
a dicho conjunto, como al
juego correspondiente y como
1
al conjunto de equilibrios de ese juego que
es menor que
1
.
Establecemos dos criterios de dominancia, el simple y el estricto, relativos
a subconjuntos de equilibrios beneciosos y los utilizamos para depurar, en
iteraciones sucesivas, los conjuntos de estrategias. De esta manera, se ir an
considerando juegos cada vez m as peque nos.
348
Mezclando y Jugando en el largo Plazo 349
Denici on 8.2.8. Sea B
1

Dados

X y

X en B, decimos que

X domina
estrictamente a

X en B, si E

j
_

X
j
[B
_
> E

j
_

X
_
para todo jugador j. De-
cimos que

X domina simplemente a

X en B, si E

j
_

X
j
[B
_
> E

j
_

X
j
[B
_
para toda j.
Se establece, entonces, un proceso de depuraci on de estrategias elimi-
nando aquellas que no se usan en equilibrios que no est an estrictamente
dominados por ning un otro. Inmediatamente, se considera el conjunto de
equilibrios en este juego m as chico y as sucesivamente. Obteniendose, con
este proceso, una sucesi on de subconjuntos de equilibrios, cada uno de ellos
contenido en el anterior.
Sea
1
=
1
, B
1
y F
e
(B) el conjunto de equilibrios que no est an
estrictamente dominados en B.
Sea D
j
e
(B) = X
j

X
j
no se usa en los perles de F
e
(B).
Para toda j, borramos todas las estrategias de j en D
j
e
(
1
), es decir

M
2
j
=

M
1
j
D
j
e
(
1
).
Sea
2
el conjunto de equilibrios de este juego depurado.
Supongamos que hemos construido

M
k
j
y
k
; ahora construimos

M
k+1
j
=

M
k
j
D
j
e
(
k
)
Sea
k+1
el conjunto de equilibrios del nuevo juego.
Es evidente que
k+1
est a contenido en
k
, para k=1, 2, ...
Tenemos dos posibles resultados de este proceso de depuraci on basado
en la dominancia estricta:
a) El proceso termina en un n umero nito de pasos, es decir existe un
n umero natural mnimo

k tal que
b
k+1
=
b
k
, en cuyo caso decimos que
b
k
es
d
e
estable.
b) La sucesi on
k
es innita.
Proposici on 8.2.9. Si la sucesi on
k
es innita, entonces la intersecci on
de las
k
no es vaca.
Demostraci on. Consideremos el conjunto de pagos de los equilibrios bene-
ciosos; existe al menos uno de estos equilibrios X

tal que E(X

) no
349
350 Selecci on de Equilibrios
est a dominado, coordenada a coordenada, por ning un otro vector de pagos.
Por lo tanto, X

est a en todos los conjuntos


k
y la intersecci on innita no
es vaca.
Obviamente, en el caso nito podemos considerar la sucesi on innita

k
que a partir de cierta

k ,
k
=
b
k
. Entonces, el resultado del proceso de
depuraci on, en ambos casos, se puede considerar como la intersecci on innita
de las
k
. Con este conjunto iniciamos un nuevo proceso de depuraci on,
ahora usando el criterio de dominancia simple.
Denotemos a

i=1

i
como
1
, y sea

M
1
j
el conjunto de las estrategias de
j que se usan en alg un equilibrio de
1
.
Sea B
1
y F
s
(B) el conjunto de equilibrios que no est an simplemente
dominados en B. Sea D
j
s
(B) = X
j

X
j
no se usa en los perles de F
s
(B).
Para toda j, borramos todas las estrategias de j en D
j
s
(
1
), es decir

M
2
j
=

M
1
j
D
j
s
(
1
). Sea
2
el conjunto de equilibrios de este juego depurado.
Supongamos que tenemos

M
k
j
y
k
. Entonces construimos

M
k+1
j
como

M
k
j
D
j
s
(
k
) y consideramos
k+1
el conjunto de equilibrios del juego depu-
rado.
Para k = 1, 2, . . .,
k+1

k
.
De nuevo, puede pasar que el proceso se estacione a partir de un

k mnimo
o que contin ue indenidamente, pero en ambos casos la intersecci on es no
vaca.
Proposici on 8.2.10.

i=1

i
no es vaca.
Demostraci on. Supongamos que

i=1

i
es vaca, entonces para cada equi-
librio X

en

i=1

i
, existe un ultimo k

tal que
k

contiene a X

. Es decir,
X

pertenece a todos los conjuntos del encaje


k

1
...
1
, pero
no a
k

+1
.
Denamos U :

i=1

i
R
n
, como U(X) = E

(X

), donde k

es el
ultimo conjunto del encaje generado en el que se encuentra X.
350
Mezclando y Jugando en el largo Plazo 351
Pensemos en el conjunto de vectores U(X) tales que X est a en
1
. En este
conjunto existe al menos un vector

X que no est a dominado simplemente
por ning un otro vector del mismo conjunto. Sea
s
el ultimo conjunto del
encaje generado por la dominancia simple en el que se encuentra

X.
En
s
debe haber alg un equilibrio

X que domina simplemente a



X, pues
de lo contrario,

X estara en
s+1
. Entonces

X est a dominado, lo que es
contrario a lo que se haba supuesto.
Denotemos como a

i=1

i
.
Ya estamos preparados para el segundo criterio de Harsanyi, dice lo
siguiente:
Si para cada pareja de equilibrios de Nash

X y

X que pertenece a
se cumple que E

j
(

X
j

k
) = E

j
(

X
j

k
) para todo jugador j, entonces la
vsoluci on del juego es .
Tenemos dos casos posibles:
a) Los equilibrios de son intercambiables; entonces tambien la tsoluci on
del juego es . En ese caso, tambien la soluci on de Nash es .
b) Los equilibrios de no son intercambiables y hay que considerar otro
criterio de dominancia para obtener la tsoluci on.
En el caso b) es en el que puede haber diferencia entre los resultados que
se obtienen cuando existe comunicaci on entre los jugadores, aunque esta
sea mnima (los juegos vocales) y los resultados para juegos sin ninguna
comunicaci on (los juegos t acitos).
Para el caso b), y para cuando los elementos de no tienen el mismo
pago de seguridad relativo a , tenemos que considerar la racionalidad de
los jugadores ante el riesgo.
Pero examinemos, antes, algunos ejemplos. Dos de ellos pueden solu-
cionarse apelando al primero y segundo criterios de selecci on de Harsanyi,
mientras que para el tercero no son sucientes dichos criterios.
Ejemplo 8.2.2. Sea el juego
_
(2, 2) (1, 0)
(0, 1) (1, 1)
_
,
de modo que
0
= ((1, 0), (1, 0)), ((0, 1), (0, 1)), ((
1
2
,
1
2
), (
1
2
,
1
2
)),
351
352 Selecci on de Equilibrios
v
1
=
1
2
, v
2
=
1
2
.
Por lo tanto, E
1
((
1
2
,
1
2
), (
1
2
,
1
2
)) = v
1
, E
2
((
1
2
,
1
2
), (
1
2
,
1
2
)) = v
2
.
Entonces
1
= ((1, 0), (1, 0)), ((0, 1), (0, 1)).
Sea
1
=
1
. Observese que ((1, 0), (1, 0)) domina estrictamente a
((0, 1), (0, 1)), pues
E

1
((1, 0)


1
) = 2, E

2
((1, 0)


1
) = 2,
E
1
((0, 1), (0, 1)) = 1, E
2
((0, 1), (0, 1)) = 1.
Por lo tanto
2
= ((1, 0), (1, 0)).
El proceso de depuraci on termina con ((1, 0), (1, 0)).
Entonces la vsoluci on y la tsoluci on de Harsanyi son iguales a
((1, 0), (1, 0)).
Ejemplo 8.2.3.
_
(1, 1) (2, 1)
(1, 2) (2, 2)
_
.
En este juego, todas las parejas de estrategias mixtas son equilibrios de
Nash. Es decir,
0
= M
1
M
2
.
v
1
= 1, v
2
= 1.
E
1
((x, 1 x), (y, 1 y)) =
_
1 y = 1,
mayor que 1 y < 1,
y
E
2
((x, 1 x), (y, 1 y)) =
_
1 x = 1,
mayor que 1 x < 1.
Entonces los equilibrios que est an en la uni on de los conjuntos
((1, 0) , (y, 1 y)) [y [0, 1] y
((x, 1 x) , (1, 0)) [x [0, 1]
no son beneciosos, por lo que

1
= ((x, 1 x), (y, 1 y)) [ 0 x < 1, 0 y < 1.
Hacemos
1
=
1
.
Para todo equilibrio (

X
1
,

X
2
) en
1
y para j = 1, 2,
E

j
(

X
j


1
) = mn
(X[
b
X
j
)
1
_
2 x
j
1
_
> 1.
Sin embargo, E

j
(

X
1
,

X
2
) = 2 x
k
1
> 1 para k distinto de j y para
cualquier (

X
1
,

X
2
) en
1
. Por lo tanto, D
e
(
1
) = y
1
=
1
.
352
Mezclando y Jugando en el largo Plazo 353
Es claro que tampoco existen puntos que dominen simplemente a ning un
(X
1
, X
2
) en
1
. Es decir, =
1
. Adem as, se cumple que el pago de
seguridad relativo a es el mismo en cada punto de para los dos jugadores.
Entonces, la soluci on de Harsanyi (la vsoluci on y la tsoluci on) es
((x, 1 x), (y, 1 y)) [0 x < 1, 0 y < 1.
Tendremos que establecer un tercer criterio, en cambio, en otros juegos
no simetricos, como el siguiente
Ejemplo 8.2.4.
_
(100, 10) (1, 0)
(0, 1) (1, 1)
_
.

0
= ((1, 0), (0, 1)), ((0, 1), (1, 0)), ((
1
6
,
5
6
), ((
1
51
,
50
51
)). Como antes, el equi-
librio en estrategias mixtas propiamente hablando no es benecioso y
1
=
((1, 0), (0, 1)), ((0, 1), (1, 0)).
Aplicando la depuraci on de acuerdo a las dominancias estricta y simple,
llegamos a que

1
=
1
= ((1, 0), (0, 1)), ((0, 1), (1, 0)) pues ninguno de los dos equi-
librios domina al otro ni estricta, ni simplemente ya que
E

1
((0, 1)

1
) = 0 y E

2
((1, 0)

1
) = 1 y
E
1
((1, 0), (0, 1)) = 1 y E
2
((1, 0), (0, 1)) = 0.
Pero el pago de seguridad de los jugadores relativo a no es el mismo en
los dos equilibrios. Por lo tanto, el segundo criterio de soluci on de Harsanyi
no permite llegar a la soluci on y es necesario uno tercero.
Tercer Criterio de Harsanyi
Criterios de Dominaci on por Riesgo. Consideremos los conjuntos de
estrategias despues de haber eliminado las estrategias que no se usan en
equilibrios beneciosos y las que no se usan en equilibrios no dominados
bajo los dos criterios de dominancia estricta y simple. Adem as, en cada
equilibrio en , consideramos, en lugar de los pagos originales, los pagos de
seguridad relativos a . En cambio, en los perles del juego m as peque no
que no son equilibrios, conservamos el pago original. A este nuevo juego lo
denotamos como

y le llamamos el juego reducido. Denotamos como E

a la funci on de pago del juego reducido.


En el juego reducido

introducimos la nueva hip otesis de racionalidad,


respecto al riesgo, que permitir a obtener una nueva relaci on de dominio.
353
354 Selecci on de Equilibrios
Esta nueva relaci on de dominio se basa en una regla que sugiri o Zeuthen
para llevar a cabo una negociaci on y es consistente con postulados naturales
de racionalidad. En los juegos bipersonales conduce a una soluci on equiva-
lente a la soluci on cooperativa propuesta por Nash (ver el libro de G.Owen
(1968)) y permite generalizar dicha soluci on a juegos n-personales. Harsanyi
la usa para construir su tercer concepto de dominancia.
La idea es como sigue. Supongamos que A, el vendedor de un bien, y
B, el comprador, est an regateando sobre el precio de dicho bien. La ultima
exigencia de A ha sido x
A
, mientras que B ha ofrecido x
B
. Si no llegan a un
acuerdo, el precio que se establecer a es c. Cada uno obtiene una ganancia
que depende del precio establecido. Consideramos la relaci on
G

i
(x
i
, x
k
) =
G
i
(x
i
) G
i
(x
k
)
G
i
(x
i
) G
i
(c)
, con i y k = A o B, pero i ,= k.
Estos cocientes se pueden considerar como medidas de los riesgos que
corren los jugadores y les ayudan a tomar decisiones. El numerador es el
incremento de ganancia que obtendra el negociador i si logra imponer el
precio que quiere respecto a lo que obtendra si se impone el precio que
quiere k. El denominador es el incremento de ganancia que obtendra el
negociador i si logra imponer el precio que quiere respecto a lo que arriesga
obtener si se impone el precio c. Es decir, G

i
(x
i
, x
k
) es una ganancia obtenida
por unidad de riesgo corrida.
Zeuthen razona diciendo que lo racional es que i debera ceder, mientras
que k debe mantenerse en su exigencia, si G

i
(x
i
, x
k
) < G

k
(x
k
, x
i
).
En cambio, si los dos cocientes son iguales ambos podran ceder, o no
hacerlo.
Siguiendo a Zeuthen, Harsanyi construy o sus criterios de dominancia por
riesgo, debil y fuerte, y llev o a cabo sendas depuraciones de los conjuntos
de equilibrios, cosa que no expondremos aqu.
En el caso de juegos sencillos, como el juego del ejemplo 8.2.4, el criterio
de Harsanyi coincide con el principio de Zeuthen, as
G

1
(((1, 0) , (0, 1)) , ((0, 1), (1, 0))) =
E
1
((1, 0) , (0, 1)) E
1
((0, 1), (1, 0))
E
1
((1, 0) , (0, 1)) E
1
((1, 0) , (1, 0))
=
1
101
,
mientras que
354
Mezclando y Jugando en el largo Plazo 355
G

2
(((0, 1), (1, 0)) , ((1, 0) , (0, 1))) =
E
2
((0, 1), (1, 0)) E
2
((1, 0) , (0, 1))
E
2
((0, 1), (1, 0)) E
2
((1, 0) , (1, 0))
=
1
12
.
El jugador dos gana m as por unidad de riesgo, por lo que tiene m as
capacidad de resistir intentando imponer su estrategia.
Finalmente, las soluciones propuestas por Harsanyi se describen en la
siguiente denici on.
Denici on 8.2.11. La v- soluci on es
v
, un subconjunto de
0
que no es
vaco y tal que cumple una de las dos armaciones siguientes:
1. Si X


v
, entonces X

domina fuertemente por riesgo a todos los


dem as equilibrios de
0
.
2. Si X


v
, entonces X

domina debilmente a todos los dem as equilib-


rios de
0
y domina fuertemente a los equilibrios que no son equiv-
alentes a X

.
La t-soluci on es el subconjunto
t
de
0
, no vaco, y tal que dos equi-
librios cualesquiera en
t
son intercambiables y una de las dos armaciones
se cumplen:
1

. Si X


t
, entonces X

domina fuertemente por riesgo a todos los


dem as equilibrios de
0
,
2

. Si X


t
, entonces X

domina debilmente a todos los dem as equi-


librios de
0
y domina fuertemente al menos a aquellos equilibrios
que no son intercambiables por X

.
Esas deniciones est an basadas en los supuestos de racionalidad discuti-
dos, incluyendo al principio de Zeuthen.
Si los conjuntos
v
y
t
son vacos, la soluci on es el conjunto de perles
de estrategias conservadoras.
8.3. Un enfoque mas realista de selecci on
La descripci on de las leyes naturales de los conictos humanos, a traves
de los juegos no cooperativos, no haba podido escapar de la exigencia de que
355
356 Selecci on de Equilibrios
los participantes, en dichos conictos, cumplieran los supuestos de raciona-
lidad y de conocimiento e informaci on propios de la Teora Econ omica. Pero
la gente com un y corriente no cumple dichos supuestos, no est a compues-
ta por sabelotodos, propietarios de informaci on enciclopedica, ni por super
heroes carentes de miedos y otras ataduras que les impidan abandonar la
forma de actuar que estaban siguiendo, para adoptar otras, como reacci on
inmediata. Por el contrario, los individuos reales son miopes, no van mucho
m as all a, para valorar las opciones que tienen, de observar lo sucedido, con
sus amigos, sus vecinos y ellos mismos, al seguir determinadas conductas.
Obtienen informaci on de los medios masivos de comunicaci on y, con ello,
pueden detectar que, en un momento dado, algunas estrategias son mejores
que otras, desde un punto de vista m as bien cualitativo, pues no tienen for-
ma de hacer grandes c alculos o an alisis te oricos, para encontrar, en forma
precisa, la medida en que lo son. Adem as, es com un que tengan miedo a
cambiar de estrategia o esto sea costoso y, por lo tanto, puede existir una
fuerte inercia que trabe el cambio. Los juegos evolutivos pretenden mode-
lar esta complicada situaci on y poner a prueba, con din amicas realistas
y humanas, la validez del concepto de equilibrio de Nash en cuanto a su
car acter de ley natural de un conicto y, tambien, establecer mecanismos,
igualmente realistas, para la selecci on de algunos de estos equilibrios y la
discriminaci on de otros.
La mayora de los conictos que tienen interes no ocurren en una sola
ocasi on, sino que se repiten una y otra vez. Puede ser que en ellos par-
ticipen siempre las mismas personas, puede ser que los participantes esten
cambiando continuamente, pero, en los dos casos, las personas aprenden a
comportarse a partir de su propia experiencia y la de los otros. Entonces,
aunque cada uno empiece tomando decisiones sin ninguna idea previa, poco
a poco, ir a cambiando sus estrategias tratando de mejorar su pago. Conduce
ese camino hacia equilibrios de Nash? y, si esto fuera as, que ocurre cuando
hay varios equilibrios? cu ales dominaran en este accidentado proceso de
aprendizaje?
Expusimos muy resumidamente, en la secci on anterior, la forma sis-
tem atica que Harsanyi estableci o para discriminar en el conjunto de equi-
librios y quedarse s olo con algunos mejores, desde un punto de vista de
racionalidad preciso. En las secciones siguientes desarrollaremos otro con-
cepto de soluci on de un juego que responde a un enfoque los oco diferente
al de una racionalidad absoluta. Por supuesto, no se prescinde de toda exi-
gencia de racionalidad, pero se trata de modelar el tipo de gente com un y
corriente que enfrenta los conictos reales y la cual no tiene ni informaci on,
ni memoria perfectas, ni una racionalidad con propiedades tan fuertes. Al
356
Mezclando y Jugando en el largo Plazo 357
contrario, tiene problemas de informaci on, de memoria y del manejo de estas,
para encontrar las decisiones optimas que corresponden. Por otro lado, le
atrae la experimentaci on y comete frecuentes errores. Este tipo de enfoque
empez o en biologa con los trabajos de Maynard Smith [35] y ha tenido
tambien interesantes frutos en las ciencias sociales. El enfoque no es s olo
un metodo din amico, y relativamente realista de selecci on de equilibrios de
Nash, sino que pone a prueba el derecho de este concepto de ser considerado
la soluci on de un juego.
Expondremos diversos aspectos del enfoque propio de los Juegos Evolu-
tivos, como las desarrollan Kandori, Mailath, Rob [28, 29] y Young [56, 57],
en las secciones que restan del captulo. Una idea importante vinculada al
enfoque es que los jugadores aprenden de su experiencia y ajustan sus elec-
ciones a este aprendizaje. Es importante hacer notar que se habla de apren-
dizaje en un sentido especial, con muchas limitaciones, pues los jugadores
simplemente perciben lo que hacen los dem as y cu ales estrategias les per-
miten mejorar. Para colmo de debilidad en su aprendizaje, los jugadores
cometen errores.
Trabajaremos s olo con los modelos rectangulares, aunque la problem atica
se podra extender a los modelos extensivos.
8.4. Digracas y aprendizaje
Las din amicas de aprendizaje de individuos envueltos en un conicto,
se consideren o no como parte de una gran poblaci on, se pueden expresar
con gr acas dirigidas. En el captulo 2, secci on ??, se empez o a esbozar este
tratamiento, para las estrategias puras; en este captulo continuamos con el,
ahora, para las estrategias mixtas.
En muchos contextos es usual utilizar gr acas dirigidas (digr acas) para
expresar una din amica o ujo dentro de alg un conjunto V de estados posi-
bles. Las echas de la gr aca dirigida indican cuando es posible pasar de
un estado a otro, debido a la din amica. El conjunto de echas se denota
como

A y a la digr aca como
_
V,

A
_
. En el captulo 2, el conjunto de es-
tados V era el de perles de estrategias puras del juego estudiado y nuestro
interes se centraba en algunos de sus subconjuntos, las llamadas Clases de
Comunicaci on Recurrente (ccr), ver denici on 2.6.2, a las que tambien les
podemos dar el nombre de Patrones de Conducta Social Aprendidos. Estos
subconjuntos desempe naban un papel especial, dentro del movimiento de
unos estados a otros, representado por la gr aca dirigida
_
V,

A
_
del captu-
lo 2, pues siguiendo la din amica, a partir de cualquier estado, se arriba a
357
358 Selecci on de Equilibrios
alguno de los pertenecientes a una de estas clases. Por otro lado, situ andonos
dentro de una de dichas clases o patrones, la din amica puede conducir de
cualquiera de sus vertices a cualquier otro, pero, en cambio, no permite salir
de la clase. Algunas de las clases, las que constan de un solo elemento son
equilibrios de Nash en estrategias puras
8.4.1. Dinamica de Aprendizaje en Poblaciones, el Enfoque
de Kandori, Mailath y Rob
Partamos, para esbozar el enfoque, de la versi on de la batalla de los sexos
que hemos trabajado en otros captulos cuya matriz de pago es la siguiente.
Reb D
M
C
_
(1, 5) (3, 3)
(0, 2) (1, 1)
_
.
M tiene el signicado de una conducta impositiva y machista por parte
del hombre y la C de una conducta compresiva y cooperadora con su pare-
ja. Por su parte, la Reb signica que la mujer se rebela continuamente y
no permite imposiciones, mientras la D que se comporta en forma d ocil y
abnegada. M, C, Reb y D son estrategias que los hombres y las mujeres
eligen y no formas de ser de unos y otras.
El conicto no se desarrolla en una sola ocasi on, ni entre la misma pare-
ja. Pensemos que repetidamente, periodo tras periodo, se est an enfrentando
en este conicto miembros de una poblaci on muy grande que est a formada
por k
h
hombres y k
m
mujeres. Antes de iniciar el periodo t, cada uno de
los hombres y cada una de las mujeres ha escogido una de sus estrategias
posibles. La estructura estrategica de la poblaci on, en el periodo t, se puede
describir con una pareja de n umeros (x
t
, y
t
), donde x
t
es el n umero de hom-
bres que, en dicho periodo, escoge la estrategia machista M (k
h
x
t
hombres
escogeran la estrategia C). El n umero de mujeres que escoge la estrategia
Reb, en t, es y
t
(k
m
y
t
mujeres escogeran D). A esta composici on estrategi-
ca representada por (x
t
, y
t
), al hacer el an alisis te orico, se le considera como
el perl de estrategias mixtas
__
x
t
k
h
,
k
h
x
t
k
h
_
,
_
y
t
k
m
,
k
m
k
m
y
t
__
.
Puede interpretarse dicho perl como que la poblaci on entera est a actuando,
en determinado periodo, a un sin darse cuenta, de acuerdo a esta pareja de
358
Mezclando y Jugando en el largo Plazo 359
estrategias mixtas y cada miembro de la poblaci on tendr a una percepci on de
la estructura estrategica social y har a los reajustes a su conducta de acuerdo
a esto.
Dentro del periodo t se enfrentan, en una enorme cantidad de partidas
del conicto, parejas de un hombre y una mujer, escogidos al azar. Los
miembros de estas parejas usar an la estrategia que tienen preestablecida para
el periodo t. Cada persona, hombre o mujer, debe decidir la nueva estrategia
que escoger a para el periodo t +1. Para ello, har a una evaluaci on limitada
de los resultados obtenidos, en el periodo t, con las estrategias elegidas por
todos. Dicha evaluaci on se reere tanto a el mismo como a sus congeneres.
Ser a una evaluaci on miope, sujeta a inercias y con otras limitaciones que
correspondan a la situaci on que se pretenda modelar, pero a traves de ella,
se establecer a un proceso de cambio de la estructura de estrategias de la
poblaci on, periodo tras periodo. Existen diferentes din amicas que pueden
resultar plausibles para esquematizar alg un proceso particular.
Entonces, en el ejemplo que estamos examinando, cada personaje mas-
culino que participa en el conicto, puede considerar que entre todas las
mujeres est an escogiendo una estrategia mixta y buscar una respuesta ade-
cuada ante dicha estrategia, por ejemplo, la mejor. Por su lado, cada mujer
puede, tambien, proceder en forma semejante.
Para concretar, supongamos que hay 6 hombres y 6 mujeres, entonces
asociaremos, a cada posible partici on de 6 mujeres en m que han elegido
actuar como rebeldes y 6 m como d ociles, la estrategia mixta (
m
6
,
6m
6
)
y an alogamente para los hombres. Trabajamos con un n umero peque no de
hombres y de mujeres para que la digr aca no sea demasiado grande. No es
necesario que el n umero de hombres y de mujeres sea el mismo.
Supongamos que, en el periodo t, hubo l
t
hombres machistas (M), y
6l
t
hombres conciliadores (C), m
t
mujeres rebeldes (Reb) y 6m
t
mujeres
sumisas (D).
Denotemos como x(t) a (l
t
, 6 l
t
) y como y(t) a (m
t
, 6 m
t
), llamamos
din amica de aprendizaje de mejor respuesta o de p anico a la que tiene la
forma siguiente:
d(x(t), y(t)) = (x(t + 1), y(t + 1)), donde
x(t + 1) =
_
_
_
(6, 0) si m
t
< 4,
(0, 6) si m
t
> 4,
x(t) si m
t
= 4
359
360 Selecci on de Equilibrios
y
y(t + 1) =
_
_
_
(6, 0) si l
t
< 2,
(0, 6) si l
t
> 2,
y (t) si l
t
= 2.
Es una din amica de p anico porque todos los miembros de la poblaci on
pueden escoger, en forma inmediata, su mejor respuesta.
Como el conicto es de tal naturaleza que cada persona tiene dos es-
trategias, para describir un estado basta decir cu antos hombres y cu antas
mujeres escogieron su primera estrategia, M y Reb, respectivamente. As al
conicto, expresado por el juego rectangular, y a la din amica de aprendizaje
d se le puede asociar la digr aca
_
V,

A
_
, con
V = (l, m) [0 l 6, 0 m 6 y

A = (z, z) [z y zest an en V y z

= d(z) .
En la gr aca de la gura 8.4.1 se representa la din amica de p anico en el
conicto de los hombres contra las mujeres. Los Patrones de Conducta Social
Aprendidos de esta gr aca dirigida son: (6, 0), (0, 6), (2, 4) y el ciclo
(6, 6), (0, 0). Asociando perles de estrategias mixtas a estas parejas, las
tres primeras clases o patrones de conducta corresponden a los 3 equilibrios
de Nash del juego, a saber ((1, 0), (0, 1)), ((0, 1), (1, 0)) y ((
1
3
,
2
3
), (
2
3
,
1
3
)).
Es decir, los patrones de conducta que aprende la poblaci on estudiada
son:
i) El mundo en que todos los hombres son machistas y todas las mujeres
son abnegadas.
ii) El mundo en que todas las mujeres tienen un rodillo y todos los
hombres un mandil.
iii) Un mundo en el que caben los machistas, los comprensivos, las re-
beldes y las sumisas, en una cierta proporci on.
iv) Un mundo en el que la poblaci on se encuentra en un ciclo perpetuo
entre el mundo de machistas con parejas rebeldes todos inconformes, por lo
que cambian al mundo de comprensivos con parejas sumisas, que tampoco
est an conformes y regresan al esquema anterior.
La din amica que acabamos de describir es muy r apida, no en el sentido
de su convergencia, sino en el de que toda la poblaci on reacciona simult anea-
mente eligiendo, sin ataduras, su mejor replica a la composici on social exis-
tente. Esta forma de aprender puede corresponder a una situaci on en que
no hay costos por hacer cambios, ni miedos a dichos cambios. Es decir, no
hay inercias.
360
Mezclando y Jugando en el largo Plazo 361
(6,6) (1,2)
(1,1) (1,3)
(0,1) (0,3) (0,2)
(0,0) (4,5) (4,6)
(3,5) (3,6) (6,5)
(3,0)
(2,0)
(4,2) (6,0)
(5,3)
(6,1)
(4,1) (6,2) (6,3)
(2,3) (2,2)
(4,3)
(5,4)
(5,0) (5,1) (5,2)
(3,2) (4,0) (3,3) (3,1)
(4,4) (3,4)
(6,4)
(2,1)
(1,0)
(5,6) (5,5)
(0,6)
(0,5)
(2,5)
(0,4)
(1,6) (1,5) (1,4)
(2,6)
(2,4)
Figura 8.4.1:
No es la unica din amica que se puede establecer entre los estados posibles
que describen el n umero de hombres que se comportan en forma machista y
el que se comporta en forma comprensiva, as como el n umero de mujeres que
eligen rebelarse y el de las que deciden comportarse d ocilmente. Din amicas
m as graduales pueden describirse en forma semejante, es decir, los jugadores
eligen su mejor respuesta, pero tienen inercia, por lo que, por ejemplo, s olo
pueden reaccionar, en un periodo t, un hombre y una mujer. Formalmente
tenemos la funci on d : V V tal que si (l

, m

) = d(l, m), entonces


l

=
_
_
_
min6, l + 1 si m < 4
max0, l 1 si m > 4
l si m = 4
361
362 Selecci on de Equilibrios
y
m

=
_
_
_
min6, m + 1 si l < 2
max0, m1 si l > 2
m si l = 2
La digr aca tiene el mismo conjunto de estados que la de la gura 8.4.1,
pero las echas cambian pues la din amica es distinta (gura 8.4.2).
(6,6) (6,5) (6,4) (6,3) (6,2) (6,1) (6,0)
(5,6)
(4,6)
(3,6)
(2,6)
(1,6)
(0,6)
(5,5) (5,4) (5,3) (5,2) (5,1) (5,0)
(4,5) (4,4) (4,3) (4,2) (4,1) (4,0)
(3,5) (3,4) (3,3) (3,2) (3,1) (3,0)
(2,5) (2,4) (2,3) (2,2) (2,1) (2,0)
(1,5) (1,4) (1,3) (1,2) (1,1) (1,0)
(0,5) (0,4) (0,3) (0,2) (0,1) (0,0)
Figura 8.4.2:
Los patrones de conducta social aprendidos son (6, 0) y (0, 6) que
representan los equilibrios de Nash en estrategias puras del juego y (2, 4)
que representa al equilibrio en estrategias mixtas, en sentido estricto. El
ciclo ha desaparecido.
Consideremos, ahora, una din amica, con mucha inercia, pues s olo una
persona, hombre o mujer, puede reaccionar con su mejor replica en cada
periodo. Entonces la din amica tiene la forma (l

, m

) d (l, m) si
l

=
_
_
_
min6, l + 1 si m < 4
max0, l 1 si m > 4
l si m = 4
y, adem as, m

= m o
m

=
_
_
_
min6, m + 1 si l < 2
max0, m1 si l > 2
m si l = 2
y, adem as, l

= l.
La din amica de este ultimo ejemplo se expresa con una correspondencia
d.
362
Mezclando y Jugando en el largo Plazo 363
(6,6) (6,5) (6,4) (6,3) (6,2) (6,1) (6,0)
(5,6)
(4,6)
(3,6)
(2,6)
(1,6)
(0,6)
(5,5) (5,4) (5,3) (5,2) (5,1) (5,0)
(4,5) (4,4) (4,3) (4,2) (4,1) (4,0)
(3,5) (3,4) (3,3) (3,2) (3,1) (3,0)
(2,5) (2,4) (2,3) (2,2) (2,1) (2,0)
(1,5) (1,4) (1,3) (1,2) (1,1) (1,0)
(0,5) (0,4) (0,3) (0,2) (0,1) (0,0)
Figura 8.4.3:
La gura 8.4.3 muestra la gr aca dirigida de esa din amica con mucha
inercia.
Otra vez los patrones de conducta social aprendidos son (6, 0), (0, 6)
y (2, 4).
En las tres digr acas anteriores, aparece un hecho interesante, el patr on
correspondiente al equilibrio de los hombres revela tener m as fuerza de
atracci on que los otros patrones de conducta social aprendidos, pues se puede
alcanzar partiendo desde m as estructuras estrategicas de la poblaci on.
Existen otras din amicas graduales dentro de poblaciones, pero no las
examinaremos en este texto. Por mencionar algunas ideas sobre un tipo de
inercia distinta que la presentada aqu, pensemos en la funci on de reajuste
de Nash, en la que los jugadores no cambian abruptamente a la estrategia
pura de mejor respuesta. Podemos hablar de una din amica que funciona
como dicha funci on cambiando el porcentaje de personas que escogen ca-
da estrategia pura de acuerdo a que tanto mejorara, cada una de dichas
estrategias, el pago esperado.
Dinamicas de Aprendizaje en Poblaciones Simetricas
Cuando una poblaci on est a involucrada en un conicto que se expresa
como un juego simetrico n-personal, la poblaci on puede estar dividida en n
subpoblaciones, cada una de las cuales contiene a las personas que pueden
representar a un jugador jo, por ejemplo el primero, y no pueden aparecer
como representante de ninguno de los dem as jugadores. De esta manera, en el
an alisis del conicto de hombres contra mujeres, podamos haber estudiado
una matriz simetrica, como se presenta tradicionalmente la batalla de los
sexos, pero considerar a la poblaci on dividida en hombres y mujeres y los
miembros de la subpoblaci on de los hombres s olo pueden representar al
363
364 Selecci on de Equilibrios
jugador que elige los renglones y lo an alogo para las mujeres. En ese caso,
los patrones de conducta social aprendidos ((6, 0) , (0, 6)) y ((0, 6) , (6, 0))
atraeran al mismo n umero de estructuras estrategicas y ninguno mostrara
m as fuerza que otro.
Pero el conicto simetrico puede ser de tal manera que cualquier miembro
de la poblaci on puede representar el papel de cualquiera de los jugadores en
las diversas partidas que ocurren. Entonces la poblaci on no estara dividida
en subpoblaciones y diramos que es simetrica u homogenea.
Pensemos en los juegos simetricos 2 2, es decir juegos de la forma
_
(a, a) (b, c)
(c, b) (d, d)
_
.
Podra tener interes, para determinados conictos, no dividir a la poblaci on
involucrada K. Supongamos que queremos analizar din amicas semejantes a
las que estudiamos con una poblaci on dividida, en ese caso, cada estado
posible se puede determinar con el n umero de personas pertenecientes a K
que escogen la primera estrategia. Es decir, el conjunto de estados posibles
sera Z = 0, 1, 2, . . . , k, donde k es el n umero de miembros de K.
Asociaremos a cada elemento z de Z, la estrategia mixta
z = (
z
k
,
(k z)
k
).
Para cualquier persona es importante considerar tambien las estrategias
z
+
= (
z 1
k 1
,
(k z)
k 1
) y z

= (
z
k 1
,
(k 1 z)
k 1
).
Un miembro de K que ha escogido la primera estrategia puede actuar como
si entre todos los otros miembros de K hubieran escogido z
+
. An alogamente,
cualquiera de los que escogieron la segunda estrategia actuara como si los
dem as, en conjunto, hubieran escogido z

.
Una din amica de aprendizaje para un conicto simetrico es una corres-
pondencia d: Z Z. Diremos que la din amica es darwiniana (seg un la
terminologa de Kandori, Mailath y Rob (1993 y 1995)), si cumple, para z
distinto de cero y de k,
sign(d(z) z) = sign(E
1
_
(1, 0) , z
+
_
E
1
_
(0, 1) , z

_
),
d(k) = k E
1
((1, 0) , (1, 0)) E
1
((0, 1) , (0, 1)) 0,
d(N) < N de otra manera,
d(0) > 0 E
1
((0, 1) , (0, 1)) E
1
((1, 0) , (1, 0)) 0,
d(0) = 0 de otra manera.
364
Mezclando y Jugando en el largo Plazo 365
Ejemplo 8.4.1. Consideremos, por ejemplo, un conicto representado por
el juego simetrico siguiente:
_
(2, 2) (5, 0)
(0, 5) (1, 1)
_
.
Si K es una poblaci on formada por 12 personas y la din amica es la de mejor
replica, d
p anico
, es decir
d
p anico
(z) =
_
_
_
k si E
1
((1, 0) , z
+
) > E
1
((0, 1) , z

),
0 E
1
((1, 0) , z
+
) < E
1
((0, 1) , z

),
z E
1
((1, 0) , z
+
) = E
1
((0, 1) , z

).
La digr aca correspondiente a esta din amica es la de la gura 8.4.4.
(12) (4)
(5) (6) (7)
(0)
(2) (1) (3) (9)
(10) (8)
(11)
Figura 8.4.4:
Los patrones de conducta social aprendidos son, en este caso, el ciclo
0, 12 y 8. No aparecen, dentro de dichos patrones, los equilibrios de
Nash en estrategias puras, pues estos equilibrios no son simetricos y en
el conjunto de estados posibles Z no est an representadas las estructuras
estrategicas sociales que determinan perles de estrategias no simetricos,
puros o mixtos. El unico equilibrio simetrico del juego es ((
2
3
,
1
3
), (
2
3
,
1
3
)) y
est a representado por el vertice 8.
Estudiemos el mismo ejemplo, pero con la din amica de mejor replica con
inercia fuerte, es decir aquella que en cada periodo s olo un miembro de K
optar a por su mejor replica. Esta din amica tiene la forma siguiente:
d
inerciaf
(z) =
_

_
z + 1 si E
1
((1, 0) , z
+
) > E
1
((0, 1) , z

), z ,= k y z ,= 0,
z 1 si E
1
((1, 0) , z
+
) < E
1
((0, 1) , z

), z ,= k y z ,= 0,
z si E
1
((1, 0) , z
+
) = E
1
((0, 1) , z

), z ,= k y z ,= 0,
k si E
1
((1, 0) , (1, 0)) E
1
((0, 1) , (0, 1)) y z = k,
k 1 si E
1
((1, 0) , (1, 0)) < E
1
((0, 1) , (0, 1)) y z = k,
0 si E
1
((1, 0) , (1, 0)) E
1
((0, 1) , (0, 1)) y z = 0,
1 si E
1
((1, 0) , (1, 0)) > E
1
((0, 1) , (0, 1)) y z = 0.
365
366 Selecci on de Equilibrios
La unica clase de comunicaci on recurrente es 8 que corresponde al
unico equilibrio de Nash simetrico del juego, ((
2
3
,
1
3
), (
2
3
,
1
3
)). (Ver gura 8.4.5
(0) (1) (2) (3)
(4) (5) (6) (7)
(8) (9) (10) (12) (11)
Figura 8.4.5:
8.4.2. Dinamica de historias de tama no r. El Enfoque de
Young.
Pensemos que los participantes en un conicto aprenden de la experien-
cia que tuvieron en los r ultimos periodos. Este enfoque lo inici o David
Canning [9, 10], utilizando una tecnica distinta a la de este captulo que co-
rresponde a la usada por Kandori, Mailath y Rob, por un lado, y Peyton
Young, por el otro. Canning ataca conictos de s olo 2 personas y piensa
que, en cada periodo, se escogen al azar parejas de una poblaci on innita
que se enfrentan recordando, cada persona, las conductas (estrategias) que
utilizaron sus oponentes en los ultimos r periodos. Con base en esto, Can-
ning establece un sistema din amico sobre el cambio de la proporci on de la
poblaci on que elige cada estrategia a lo largo del tiempo. Young, en cambio,
considera un conicto de n jugadores y una poblaci on nita, partida en n
subpoblaciones (cada una de estas corresponde a los posibles representantes
de uno de los jugadores). En cada periodo, s olo hay un enfrentamiento entre
n jugadores, tomando al azar a los representantes de cada jugador j de las
subpoblaciones que les corresponden. Despues, Young establece un sistema
din amico del cambio entre las historias de tama no r, bas andose en lo que
ocurrira si, despues de una de estas historias, las personas s olo fueran ca-
paces de informarse de una peque na muestra de algunos de los r periodos y
reaccionar optimamente ante dicha muestra. Young expresa esta din amica
a traves de una digr aca con pesos en sus echas.
Expondremos la din amica de Young en forma simplicada, en el sentido
de que los participantes tienen como unica muestra a la historia de tama no
r completa.
En el periodo t, las personas de la poblaci on s olo recuerdan lo que ocur-
366
Mezclando y Jugando en el largo Plazo 367
ri o en los r periodos m as recientes. Describiremos la din amica con una gr aca
dirigida, donde los vertices son historias de tama no r y habr a una echa de
una historia a otra, si es posible pasar de la primera a la segunda con bue-
nas decisiones de los jugadores y respetando la historia de la que se parte.
Las clases de comunicaci on recurrente de esta digr aca ser an las historias
que tienden a observarse como patrones de comportamiento aprendido.
Las historias de tama no r son vectores de dimensi on r, en los que su
coordenada trepresenta lo que ocurri o en el periodo t; es decir, el perl de
estrategias puras que se us o en t, que es a su vez un vector. Por lo tanto, cada
historia tiene la forma de una matriz, con tantas columnas como jugadores
hay en el conicto y tantos renglones como el tama no de la memoria social.
Los periodos est an numerados desde el m as viejo que se recuerda hasta el
anterior al que est a ocurriendo en el momento actual.
Sigamos el ejemplo no simetrico de los hombres y las mujeres estudiado
al principio de esta secci on.
Reb D
M
C
_
(1, 5) (3, 3)
(0, 2) (1, 1)
_
Al inicio del periodo t, el hombre y la mujer que han sido elegidos para
el encuentro de ese periodo decidir an una estrategia que signique una bue-
na actuaci on frente a la memoria social. Al tomar la decisi on recuerdan los
periodos t r hasta t 1. Entonces usar an la estrategia mixta de frecuen-
cias como expresi on de esa experiencia para elegir la estrategia pura que
responde mejor a ella. Los jugadores del periodo t completan la historia
que se recordar a en el periodo t + 1. Para dicho periodo, los jugadores han
olvidado lo ocurrido en t r y la nueva historia recordada consta de lo
sucedido en los periodos desde t (r + 1) hasta t.
Entonces, si en el periodo t, la historia que recuerdan los jugadores se
expresa con la r eada de vectores (C, D), (C,Reb), (M,Reb), (M, D) y
(M, D), podemos colocarlos como la matriz,
_
_
_
_
_
_
_
_
_
_
_
_
C
C
M
M
M
_
_
_
_
_
_
_
_
_
_
_
_
D
Reb
Reb
D
D
_
_
_
_
_
_
_
_
_
_
_
_
,
la cual se puede leer por columnas y por renglones. As, la primera columna
signica que el hombre fue comprensivo en los periodos t5 y t4, mientras
367
368 Selecci on de Equilibrios
que fue machista en los periodos t 3, t 2 y t 1. La columna dos, por su
lado, signica que la mujer fue d ocil en t 5, t 2 y t 1 y fue rebelde en
t 4 y t 3. El primer rengl on informa lo que hicieron el hombre y la mujer
en el periodo t 5, mientras que el segundo, lo que hicieron en el periodo
t 4, etc.
Supongamos que, el da t, el hombre tiene que decidir, tomando en cuenta
su experiencia, si le conviene portarse como un despota o ser comprensivo.
Sus recuerdos le informan sobre el comportamiento de la mujer en 5 periodos.
De haber escogido la actitud de ser comprensivo durante todos esos periodos
que recuerda, habra obtenido una ganancia total de 3 unidades, lo que
implica
3
5
unidades de pago medio. En cambio, si hubiera sido un despota
habra obtenido 7 unidades en total, es decir
7
5
unidades de pago medio, por
lo que llegar a a la conclusi on de que le conviene escoger de nuevo M. Los
recuerdos de la mujer, por su lado, le revelan que le hubiera convenido ser
d ocil y es lo que escoge para el periodo t. Entonces en el periodo t + 1, el
recuerdo social sera
_
_
_
_
_
_
_
_
_
_
_
_
C
M
M
M
M
_
_
_
_
_
_
_
_
_
_
_
_
Reb
Reb
D
D
D
_
_
_
_
_
_
_
_
_
_
_
_
Para tener una digr aca completa tomemos a r = 2. Sea V el conjunto
de posibles historias de tama no 2, es decir matrices 2 2, en las que los
terminos de su primera columna son M o C y los de la segunda son Reb o
D. Por otro lado, existir a una echa que une los vertices v y v

, si el segundo
rengl on de v es igual al primero de v

y v

21
es la estrategia pura M o C que
optimiza en el conjunto
_
1
2
(a
Mv
12
+a
Mv
22
) ,
1
2
(a
Cv
12
+a
Cv
22
)
_
,
mientras que v

22
es la mejor respuesta pura de las mujeres Re b o D que
optimiza en el conjunto
_
1
2
(b
v
11
Reb
+b
v
21
Reb
) ,
1
2
(b
v
11
D
+b
v
21
D
)
_
.
La digr aca de la gura 8.4.6 esquematiza como se pasara de una historia
a otra, cuando los jugadores tratan de mejorar sus pagos tomando en cuenta
su experiencia.
368
Mezclando y Jugando en el largo Plazo 369

Re b

Re b

Re b

Re b

Re b

Re b

Re b

Re b

Re b

Re b

Re b

Re b

Re b

C
C
D

Re b

Re b
C
C
D
D
M
D
C M
C D

M
C
D
D

Re b M
M

M
C D
D

M
C
2
M
M
D
D M
C
D
M
C
C
C

M
M
D

M
M D
C
C
D

C
M
Figura 8.4.6:
Las clases de comunicaci on recurrente que, en este caso, pensamos como
patrones de conducta social aprendida son
_ _
M
M
_ _
D
D
_ _
y
_ _
C
C
_ _
Reb
Reb
_ _
.
Estos patrones corresponden a los dos equilibrios de Nash en estrategias
puras. El equilibrio de Nash en estrategias mixtas no tiene representaci on.
En la digr aca se observa, en una forma m as dram atica que en las din ami-
cas de poblaciones, que la primera historia, la que corresponde al equilibrio
favorable a los hombres, tiene mucha m as fuerza de atracci on que la que
corresponde al equilibrio de las mujeres. Pues a la historia masculina,
se llega desde cualquier otra historia que no sea la femenina.
Sin embargo, no tenemos un criterio preciso para asegurar cu al es el
patr on m as fuerte que, adem as, nos sirva para cualquier conicto sujeto a
una din amica de aprendizaje. Para lograr este objetivo, usaremos la hip otesis
que planteamos al principio y que hemos dejado de lado, nos referimos a que
369
370 Selecci on de Equilibrios
la gente no puede ajustarse mec anicamente a la din amica de aprendizaje,
sino que comete frecuentes errores, tiene grandes deseos de experimentar,
etc., hechos que la desvan, en cierta medida, de lo que le marca la din amica
en cuesti on. Estudiaremos que sucede con los patrones de conducta social
aprendidos o acostumbrados (las ccr), tanto en el caso de las din amicas de
las poblaciones como en las de las historias, bajo estas perturbaciones.
8.4.3. Errar es de Humanos
Es natural esperar, como mencion abamos anteriormente, que los miem-
bros de una poblaci on, envuelta en un conicto representado por un juego y
con una din amica de aprendizaje, no siempre actuar an seg un esta din amica,
sino que de vez en cuando se equivocar an o querr an experimentar. A cada
una de las din amicas descritas anteriormente, tanto en este captulo, como en
el segundo, podemos perturbarlas ligeramente, suponiendo que cada jugador,
en algunas ocasiones, se desva de lo que le marca el proceso de aprendiza-
je y escoge alguna de sus otras estrategias. Obtendramos, entonces, otra
digr aca, a la que llamaremos la din amica perturbada. Supondremos que
todos los errores existentes son posibles. Esto provocar a digr acas conexas.
Adem as, le asociamos a cada echa su costo en errores.
Podemos hablar del costo de una trayectoria dirigida de la digr aca
perturbada sumando los costos de todas las echas que la componen.
En el conicto de los 6 hombres y 6 mujeres, con la din amica de apren-
dizaje de mejor replica, si tenemos una perturbaci on tal que se puede pasar
de cualquier z a cualquier otro z, el costo de pasar directamente del vertice
(3, 3) al (0, 0) es 6 (ver gura 8.4.1). Hay varias trayectorias, adem as de la
que s olo consta de la pareja (3, 3), (0, 0) para transitar de (3, 3) a (0, 0),
cada una tiene un costo. Una de las trayectorias de mnimo costo es
(3, 3)
0
(6, 0)
5
(6, 5)
0
(0, 0) .
Es decir, el costo mnimo de pasar de (3, 3) a (0, 0) es 5 y se logra con la
trayectoria (3, 3), (6, 0), (6, 5), (0, 0). Este costo mnimo es el mismo que
el de pasar de (6, 0) a (0, 0).
En cambio, en la din amica de mejor replica, con inercia fuerte (gura
8.4.3), la echa entre (3, 3) y (0, 0) tendra un costo de 5 y la trayectoria
antes considerada tendra un costo de 20, pues tenemos:
(3, 3)
5
(6, 0)
5
(6, 5)
10
(0, 0) .
370
Mezclando y Jugando en el largo Plazo 371
Una trayectoria de costo mnimo que une a (3, 3) y (0, 0) es:
(3, 3)
0
(3, 2)
0
(3, 1)
0
(3, 0)
4
(0, 0) ,
con un costo de 4.
Las din amicas de historias son muy diferentes a las de poblaciones y
dan lugar a digr acas diferentes. En las que corresponden a las segundas
siempre hay una echa entre dos vertices posibles. En dichas din amicas de
poblaciones, se describen cu ales fueron las proporciones de la poblaci on de
un cierto tipo que escogieron cada una de las estrategias en un periodo dado
y, adem as, los patrones de conducta social son algunas de estas proporciones
especiales, en las segundas, van cambiando las historias de lo que ocurri o en
los r ultimos periodos y los patrones de conducta socialmente aprendidos son
historias en donde los jugadores repiten, periodo tras periodo, su conducta
o son ciclos de historias.
La interpretaci on de los vertices es muy distinta en ambas gr acas di-
rigidas. Por ejemplo, en las din amicas de poblaciones, cada vertice se puede
entender como un perl de estrategias mixtas y si un patr on de conducta
social aprendido consta de un solo vertice se puede preguntar si este es o no
equilibrio de Nash (em) del juego. En cambio, en las gr acas de historias,
a cada patr on de conducta social aprendido que consta de un vertice se le
puede asociar un perl de estrategias puras, el que se est a repitiendo en cada
periodo. Dichos perles que se repiten son siempre Equilibrios de Nash (ep).
Young estudia el establecimiento de convenciones sociales, a traves de estas
din amicas.
Dos vertices cualesquiera, en la din amica de las historias perturbadas,
no necesariamente est an unidos por una echa, aunque s lo estar an por una
trayectoria. Por ejemplo, desde el vertice
v =
_ _
M
C
_ _
D
Reb
_ _
al vertice
v/ =
_ _
C
C
_ _
D
Reb
_ _
,
no puede haber una echa de la digr aca perturbada, pues los errores no
pueden borrar el hecho de que una historia que sea el vertice nal de una
echa que empiece en v debe tener como primer rengl on a (C, Reb), en
cambio el segundo rengl on s puede ser cualquiera de las parejas posibles.
Una trayectoria que une a los dos vertices mencionados se encuentra en
la gura 8.4.7. Sobre cada una de las echas hay un n umero (el costo)
371
372 Selecci on de Equilibrios
que signica el n umero de personas que deben equivocarse para pasar de
un vertice a otro. C omo s olo act uan dos personas, en nuestro ejemplo, los
posibles costos de las echas son 0, 1 y 2.
__
M
C
__
D
Reb
__
1

__
C
C
__
Reb
D
__
1

__
C
C
__
D
Reb
__
Figura 8.4.7
La trayectoria de la gura 8.4.7 tiene costo 2 y es una de las trayectorias
de mnimo costo que une a esos dos vertices. El costo de la primera echa
es 1, pues la mejor respuesta del hombre debi o ser M en lugar de C. La
segunda echa tiene costo 1, por la misma raz on.
8.5. Digracas de aprendizaje en general
Trataremos s olo el caso de din amicas de poblaciones y de estas aquellas
que no son din amicas simetricas. La formalizaci on general de los otros casos
sera semejante.
En la situaci on que trataremos, K una poblaci on muy grande compues-
ta por n clases de personas tiene un conicto, en su interior, esquematizado
por el juego rectangular n personal (N, D
j
, ). Es decir, la poblaci on K se
encuentra partida, en el sentido matem atico, en K
1
, K
2
, . . . , K
n
subconjun-
tos, tantos como jugadores hay en el juego que representa al conicto. De
tal manera que K
j
est a formado por las unicas personas de K que pueden
ocupar el papel de jugador j. Cada subconjunto puede tener distinto n umero
de miembros. Asignemos el smbolo k
j
al n umero de miembros de K
j
.
Entre los miembros de la poblaci on se establece alguna din amica de
aprendizaje. Iremos precisando cu ales din amicas y perturbaciones admitire-
mos como v alidas. S olo nos ocuparemos, en esta secci on, de las din amicas de
poblaciones, pero el tratamiento con las din amicas entre las historias sera
an alogo.
En un periodo t cualquiera, se realizar an una cantidad enorme de en-
cuentros, partidas del juego, entre n oponentes, escogidos al azar, uno de
cada conjunto K
j
. Cada miembro de K
j
escoge una de las estrategias puras
propias del jugador j, es decir un elemento de D
j
y, durante todo el periodo t,
ese personaje utilizar a la estrategia elegida, en los numerosos encuentros que
le tocar a sostener. k
j
i
denotar a el n umero de personas del subconjunto K
j
escogi o su iesima estrategia. Entre todos los miembros de K determinan
una estructura estrategica, formalmente:
372
Mezclando y Jugando en el largo Plazo 373
Denici on 8.5.1. Se dice que
((k
1
1
, k
1
2
, . . . , k
1
l
1
), (k
2
1
, k
2
2
, . . . , k
2
l
2
), . . . , (k
n
1
, k
n
2
, . . . , k
n
ln
))
es una estructura estrategica de la poblaci on K en el conicto representado
por (N, D
j
, ), si para toda i y toda j, k
j
i
es un entero no negativo y

iD
j
k
j
i
= k
j
, para toda j.
No ser a hasta que termine el periodo t y se vaya a iniciar el t + 1,
cuando, despues de hacer un balance, no exhaustivo sino limitado de lo
sucedido en t, cada miembro de la poblaci on K decidir a cu al ser a la nueva
estrategia que utilizar a en t +1. En aras de poner un mnimo de condiciones
a la forma de elegir esta nueva estrategia y dise nar as las din amicas de
aprendizaje que consideraremos v alidas, conviene asociar, a cada una de las
estructuras estrategicas, el perl de estrategias mixtas del juego (N, D
j
, )
determinado por la frecuencia con que ha sido utilizada cada una de las
diversas estrategias puras por los miembros de las diversas subpoblaciones
de K.
As a z = ((k
1
1
, k
1
2
, . . . , k
1
l
1
), (k
2
1
, k
2
2
, . . . , k
2
l
2
), . . . , (k
n
1
, k
n
2
, . . . , k
n
ln
)), le co-
rresponde:
z =
__
k
1
1
k
1
,
k
1
2
k
1
, . . . ,
k
1
l
1
k
1
_
,
_
k
2
1
k
2
,
k
2
2
k
2
, . . . ,
k
2
l
2
k
2
_
, . . . ,
_
k
n
1
k
n
,
k
n
2
k
n
, . . . ,
k
n
ln
k
n
_
_
.
Podemos llamar indistintamente estructuras estrategicas a este tipo de
perles de estrategias mixtas y a las denidas en 8.6.1 y entender en el
contexto a cu al de ellas nos referimos. Denotemos como Z, a los conjuntos
de estructuras estrategicas y de estrategias mixtas de frecuencias asociadas.
Los elementos de Z son los estados posibles por los que puede atravesar
la poblaci on sometida a una din amica de aprendizaje, mientras se repite el
conicto tanto horizontalmente (dentro de un periodo), como verticalmente
(a lo largo del tiempo, periodo tras periodo). Existir an, para la poblaci on
en conicto, algunos estados especialmente importantes respecto a dicha
din amica?
Las respuestas que mejoran el pago, en un proceso de aprendizaje de-
terminado, pueden no ser unicas, por lo que es natural esperar din amicas
que se tengan que expresar con una correspondencia d, como ocurra en
algunos de nuestros ejemplos de din amicas de la secci on 8.4. Cuando una
din amica d est a denida, entenderemos que, si en un periodo t, el estado es
z(t) Z, en el tiempo t +1, el estado puede ser cualquiera de los elementos
373
374 Selecci on de Equilibrios
de d(z(t)). Solo tratamos con din amicas estacionarias, en el sentido de que
d(z(t)) = d(z(t)) si z(t) = z(t), t y tarbitrarias. Adem as, a las din amicas
de aprendizaje les impondremos una propiedad especial a la que Kandori et
al [28, 29] le dan el nombre de darwiniana.
Denici on 8.5.2. Una correspondencia d : Z Z es una din amica dar-
winiana de aprendizaje para el conicto si, para cualquier z, d(z) es no vaco
y, adem as,
a) si z

d(z) y z
j
i
> z
j
i
, entonces E
j
(z [ i ) > E
j
(z),
y
b) si z

d(z) y z
j
i
= z
j
i
> 0, entonces E
j
(z [ i ) = E
j
(z).
Decimos que (N, D
j
, ), K, d) es un proceso din amico de aprendizaje
si K est a envuelta en el conicto representado por el juego (N, D
j
, ) y d
es una din amica darwiniana de aprendizaje y estacionaria.
A este proceso le llamaremos una din amica darwiniana.
Denici on 8.5.3. Un equilibrio de una din amica darwiniana de aprendizaje
d es un elemento z de Z tal que z est a en d(z), es decir, z es un punto jo
de la correspondencia d.
Proposici on 8.5.4. La estructura estrategica z es equilibrio de una din ami-
ca darwiniana si y s olo si z es un equilibrio de Nash tal que z est a en Z.
Demostraci on. Sea z en Z un punto jo de d, es decir z est a en d(z). Esto
implica que z(t +1) = z(t), pero d es darwiniana, y entonces se cumple que
para toda j y para toda i D
j
, E
j
(z [i ) E
j
(z), es decir z es un equilibrio
de Nash que est a en Z.
Por otro lado, si z es un equilibrio de Nash tal que z Z, entonces
para toda j y para toda i D
j
, E
j
(z [i ) E
j
(z) y como d es darwiniana,
entonces para toda j y para toda i D
j
, z
j
i
= z
j
i
para toda z d (z), es
decir z d (z).
Los ejemplos de din amicas de poblaciones que aparecieron en la secci on
8.4, para el conicto entre hombres y mujeres, son darwinianas. Todas ellas
se pueden denir para cualquier juego nito.
Consideremos un juego con n jugadores.
374
Mezclando y Jugando en el largo Plazo 375
Ejemplo 8.5.1 (La Din amica de Mejor Replica o de P anico). z

d(z) si y s olo si, para cada K


j
,
z
j

j
=
_

_
k
j
si
j
=

j
(

j
es una mejor respuesta
estricta del jugador j a z),
0 si
j
,=

j
,
z
j

j
si j no tiene mejores repuestas estrictas a z.
Las din amicas de mejor respuesta modelan escenarios en los que las per-
sonas de la poblaci on pueden reaccionar inmediatamente, pues no hay costos
para el cambio de estrategias, ni tampoco alg un tipo de temor. Les hemos
dado el nombre de din amicas de p anico, pues son las que pueden mode-
lar situaciones de p anico. Aunque no necesariamente la resultante de una
de estas din amicas es una cat astrofe, como frecuentemente se asocia a las
situaciones de p anico. Un posible resultado en estas din amicas es un patr on
de tipo cclico.
Los siguientes 3 ejemplos representan cambios relativamente graduales
que se prestan para modelar situaciones en donde el costo del cambio no sea
despreciable, aunque no aparezca explcitamente en los pagos, y que esto
pueda provocar que s olo poco a poco puedan reaccionar los individuos.
Ejemplo 8.5.2. Din amica con inercia debil z

d(z) si, y s olo si, para


cada K
j
, se cumple:
a) cuando hay un jugador j que tiene mejores respuestas estrictas a z,
z
j

j
=
_

_
min
_
z
j
c

j
+ 1, k
j
_
si
j
=

j
(

j
es una mejor
respuesta estricta de j a z),
max
_
z
j
c
c

j
1, 0
_
para alguna
j
=

j
;

j
,=

j
,
z
j

j
si
j
,=

j
y
j
,=

j
.
b) si ning un jugador j tiene mejores respuestas estrictas a z, entonces
z
j

j
= z
j

j
para cualquier
j
D
j
.
Ejemplo 8.5.3. Din amica con inercia fuerteDin amica con inercia
fuerte es an aloga a la anterior, pero en cada z, a lo m as una persona de K,
que puede pertenecer a cualquier K
j
, puede cambiar su estrategia.
Ejemplo 8.5.4. Din amica de Reajuste de Nash z

d(z) si, y s olo si,


375
376 Selecci on de Equilibrios
para cada K
j
,
z
j
c

j
=
_

_
_
g
z
j
c

j
1+
P

j
c
j

j
(e z)
k
j
_
si c
j
c

j
( z) = 0 y

j c
j

j
( z) ,= 0,
_
g
z
j
c

j
+c
j
c

j
(e z)
1+
P

j
c
j

j
(e z)
k
j
_
+
si c
j
c

j
( z) ,= 0,
z
j
c

j
si c
j

j
( z) = 0 para cada
j
D
j
,
donde, como en el captulo 5, c
j

j
( z) = m ax0, E
j
_
z

j
_
E
j
( z) y para
cada n umero real x, [x] es el entero mayor que es menor o igual que x y [x]
+
es el entero menor que es mayor o igual que x.
La din amica que hemos llamado de Nash porque est a construda sobre
la funci on de reajuste (captulo 5) expresa una relaci on de cautela frente
al cambio. La poblaci on no abandona bruscamente una estrategia, sino que
hay un reacomodo gradual de las personas que corresponde al incremento
de ganancia que las diversas estrategias puras hubieran provocado frente a
una estructura estrategica dada. En este caso, a diferencia de la idea de
la funci on que trabaja Nash, las personas siempre eligen estrategias puras
y las estrategias mixtas solo las lleva a cabo la poblaci on en su conjunto.
Debido a esto, la din amica de reajuste de Nash est a modelando cambios en
la proporci on de la poblaci on que usa una u otra estrategia pura.
Proposici on 8.5.5. Las din amicas de los cuatro ejemplos anteriores son
darwinianas.
Demostraci on. Probaremos unicamente que la din amica de mejor replica es
darwiniana.
Para cualquier z Z, si z

d (z), los posibles valores de z


j
e
son k
j
, z
j
e
o 0.
a) Si z
j
e
es k
j
y z
j
e
,= z
j
e
, entonces z
j
e
> z
j
e
. es una mejor replica
estricta de j a z, pero eso quiere decir que E
j
(z [ ) > E
j
(z). En este caso,
la din amica cumple la condici on darwiniana.
b) Si z
j
e
es 0 y z
j
e
,= z
j
e
, entonces, z
j
e
< z
j
e
y se tiene cualquier relaci on
entre E
j
(z [ ) y E
j
(z). Esto es compatible con la condici on darwiniana,
pues esta no arma nada en este caso.
c) Si z
j
e
= z
j
e
y no existen mejores respuestas estrictas de j a z, entonces
E
j
(z) E
j
_
z

j
_
para toda
j
D
j
. Si z
j
e
es positivo, tendramos E
j
(z) =
E
j
_
z


j
_
. Por lo que se cumple con la condici on darwiniana.
376
Mezclando y Jugando en el largo Plazo 377
c) Si z
j
e
= z
j
e
y existen mejores respuestas estrictas de j a z, entonces
no es la mejor respuesta elegida y z
j
e
= 0. Se cumple con la condici on
darwiniana.
Dejamos como ejercicio la demostraci on de que las din amicas de mejor
respuesta con inercias y la de reajuste de Nash son darwinianas.
Para estudiar a que esquemas de comportamiento conducira una din ami-
ca darwiniana, no s olo sus puntos jos resultan interesantes, tambien pueden
existir esquemas formados por varias estructuras estrategicas, tales que cuan-
do la poblaci on es conducida por la din amica d a ese subconjunto de Z, ya
no podr a abandonarlo con posteriores aplicaciones de d.
En la secci on 8.4, entramos en contacto con tres distintas digr acas
asociadas al conicto representado por el juego en el que estaba envuelta
una poblaci on de 6 hombres y 6 mujeres. Cada digr aca fue generada con
una de las tres din amicas de aprendizaje, la de mejor replica, sin inercia y
con inercia debil y fuerte. Las deniciones que siguen formalizan lo que se
realiz o entonces.
Denici on 8.5.6. Dada una poblaci on K, involucrada en un conicto que
se expresa en el juego (N, D
j
, ), y una din amica darwiniana d, decimos
que (V,

A) es la digr aca asociada a ((N, D


j
, ), K, d), si V = Z y (z, z)
est a en

A, si y s olo si zest a en d(z).
Denici on 8.5.7. Dado un juego n-personal ((N, D
j
, ) y una poblaci on
K partida en n subconjuntos, se dice que una digr aca (V,

A) corresponde
a alguna din amica darwiniana del conicto si V = Z y para (z, z) que
est a en

A si z
j
i
> z
j
i
implica E
j
(z [ i ) > E
j
(z) , y si z
j
i
= z
j
i
> 0, entonces
E
j
(z [ i ) = E
j
(z).
Las estructuras estrategicas de la poblaci on que interesan dentro del
proceso son las que pertenecen a las clases de comunicaci on recurrente de
la digr aca. Los conjuntos que constan de uno de los puntos jos de la
din amica son algunas de dichas clases. En la secci on siguiente, nos ocupamos
de estudiar si algunas de las ccr tienen una probabilidad mayor de ocurrir
dentro del proceso. El tratamiento para las din amicas de historias de Young
es completamente semejante.
8.5.1. Digracas Perturbadas
En las din amicas de las poblaciones que se enfrentan en cualquier juego
rectangular nito, con una din amica de aprendizaje, supongamos que cada
377
378 Selecci on de Equilibrios
persona puede equivocarse en cualquier vertice, escogiendo cualquiera de
sus estrategias. Bajo este tipo de din amicas perturbadas, se puede pasar de
un vertice cualquiera z a otro z

, pero esto, en algunas ocasiones, tendra


un costo en errores. Para cada pareja de vertices, para la que exista una
echa en la digr aca sin errores, diremos que el costo es cero. Entonces, a
cada echa de la digr aca perturbada, le asociaremos un entero que medir a el
costo que es el mnimo n umero de personas que se tienen que equivocar,
para pasar al vertice nal de la echa, en lugar de llegar a alguno de los
vertices que marcaba la din amica de aprendizaje sin equivocaciones. Las
echas de la digr aca original pertenecen a la perturbada y, como decamos
anteriormente, tendr an costo cero.
Observaciones: Nuestro objetivo en cualquier digr aca perturbada, con
un costo para cada echa ser a detectar los vertices que requieren del menor
costo total posible para llegar a ellos, desde cualquier otro vertice.
A la perturbaci on conviene hacerle sucientes restricciones para que la
digr aca perturbada resulte conexa, por ejemplo, que las personas que de-
sempe nan el papel de jugador j, cualquiera que sea j, se puedan equivocar
hacia cualquiera de sus estrategias. Tomando en cuenta estas restricciones
(V,

A) la digr aca perturbada de (V,



A) es unica. Adem as, es una digr aca
conexa, nita, tal que

A


A,


A = V V y hay una funci on c de


A en
0, 1, 2, . . . tal que para toda (v, v

)

A, c (v, v

) es cero.
Usaremos la notaci on ((V,

A), c) para referirnos a una digr aca pertur-


bada de (V,

A), con funci on de costo c.
El costo de una echa (x, y) ZZ cuenta el mnimo n umero de errores
para pasar del estado x al estado y. Se dene como
c(x, y) = mn
zd(x)
_
_
_

jN

iD
j

z
j
i
y
j
i

_
_
_
.
Diremos que el costo de una trayectoria es la suma de los costos de las
echas que pertenecen a la trayectoria.
Para medir el menor costo total posible para llegar a un estado z,
denimos el concepto de z- arbol y su costo.
Denici on 8.5.8. Dada una digr aca (W,

B) y un vertice z, un z- arbol es
una subdigr aca (W,

B
z
) de (W,

B), tal que para cada vertice x distinto de


z, existe una trayectoria unica de (W,

B
z
) que une a x con z. Si tenemos
una funci on de costo c denida en

B, el costo del z- arbol es la suma de
los costos de todas las echas que pertenecen a .
378
Mezclando y Jugando en el largo Plazo 379
Denici on 8.5.9. El potencial estoc astico de un vertice z de (V,

A), v
z
, es
el mnimo costo de todos los z arboles.
Diremos que z es un vertice de menor costo total, si es un vertice de
mnimo potencial estoc astico. Es natural esperar que entre los vertices de
las clases de comunicaci on recurrente (ccr) de una digr aca se encuentran
los de mnimo costo total, pues a ellos conduce la din amica sin errores.
Deniremos algunos conceptos utiles y estableceremos algunos resultados
para estudiar la fuerza de atracci on de cada vertice y de cada una de las ccr
de una digr aca (los patrones de conducta social aprendidos) y encontrar
los vertices de menor potencial estoc astico dentro de (V,

A).
Denici on 8.5.10. Se dice que x est a en la cuenca de la clase de comuni-
caci on recurrente H, si existe una trayectoria de costo cero que une a x con
alg un vertice de H.
Denotamos como Cue(H) a la cuenca de H .
Denici on 8.5.11. Sea ((V,

A), c) una perturbaci on de (V,

A) y z y zdos
vertices distintos. El costo de pasar de z a z, c
zz
, es el mnimo de los costos
de todas las trayectorias en (V,

A) que unen a z con z.


Proposici on 8.5.12. Sean x y xvertices en H, una Clase de Comunicaci on
Recurrente (ccr) de (V,

A) y z un vertice cualquiera. Entonces c
zx
es igual
a c
zx
(a este n umero lo denotamos como c (z, H)); adem as, c
xz
es igual a
c
xz
(a este n umero lo denotamos como c (H, z)).
Demostraci on. Consideremos una trayectoria de costo mnimo c
zx
que une
a z con x y un amosle una de las trayectorias de costo cero que une a x con
x. Hemos construido una trayectoria que une a z con x, cuyo costo es c
zx
,
por lo tanto, c
zx
c
zx
. An alogamente, se demuestra que c
zx
c
zx
, es decir,
son iguales.
Por otro lado, considerese una trayectoria de costo mnimo que une a x
con z y construyamos otra trayectoria uniendole una de costo cero que una
xcon x. La nueva trayectoria tiene costo c
xz
; por lo tanto, c
xz
c
xz
. Pero
podemos probar en forma an aloga que c
xz
c
xz
, as que son iguales.
Proposici on 8.5.13. Sea x un vertice de una ccr H, xen la cuenca de H
y z un vertice cualquiera. Entonces c
zx
c
zx
.
Demostraci on. Consideramos una trayectoria de costo mnimo que une a
z con xy le unimos una trayectoria de costo cero que une a xcon x. Esta
nueva trayectoria une a z con x y tiene costo c
zx
; por lo tanto, c
zx
c
zx
.
379
380 Selecci on de Equilibrios
Corolario 8.5.14. Si x es un vertice de mnimo potencial estoc astico, en-
tonces x est a en alguna clase de comunicaci on recurrente.
Corolario 8.5.15. Sean H
i
y H
j
dos clases de comunicaci on recurrente y
dos vertices x y z tales que x est a en H
i
y z en H
j
. Entonces c
xz
no depende
de x, ni de z. A este n umero se le denota como c (H
i
, H
j
)
Proposici on 8.5.16. Un z arbol de mnimo costo consta de trayectorias
que unen a cualquier vertice x con z, pasando primero por un vertice u
H
de alguna ccr H, tal que x est a en la cuenca de H y de trayectorias de
costo c (H, z) que une a u
H
con z. El potencial estoc astico de z es igual a

i
c (H
i
, z).
Demostraci on. Como un z arbol debe unir a cada vertice de la gr aca
distinto de z con z, dada una ccr, el costo mnimo de pasar de cualquiera de
sus vertices a z es el mismo, c (H, z). En un z arbol de mnimo costo, hay
por lo menos una trayectoria de costo c (H, z) que une a un vertice u
H
de H
con z. Si los dem as elementos de H est an unidos con z a traves de u
H
, c (H, z)
s olo se suma una vez. Entre dos vertices que pertenecen a ccr distintas no
hay trayectorias que los unan, dentro de (V,

A), que tengan costo cero. Por


lo tanto, el costo de un z arbol es mayor o igual que

i
c (H
i
, z).
Sea x un vertice que no est a en ninguna ccr. El vertice x est a en la cuenca
de Hpara alguna ccr. Entonces existe una trayectoria de costo cero, dentro
de (V,

A), que une a x con alg un vertice de H

. Es decir, en el z arbol de
mnimo costo, x se une a z, a traves de alg un u
H
, o lo que es lo mismo, en
dicho z- arbol ning un vertice que no est a en alguna de las ccr a nade m as
costo. Pero esto quiere decir que el costo mnimo para un z arbol es menor
o igual que

i
c (H
i
, z).
O sea, el costo mnimo para un z arbol es

i
c (H
i
, z) y las trayectorias
son de la forma descrita.
Concluimos que la competencia por el mnimo potencial estoc astico se
establece entre las ccr. Buscaremos las ccr que contienen a los vertices z con
z arboles de mnimo costo, con las mismas ideas que hemos estado traba-
jando, pero en una nueva digr aca m as peque na que tendr a como vertices a
las ccr.
380
Mezclando y Jugando en el largo Plazo 381
8.5.2. La Digraca de las Clases de Comunicaci on Recurren-
te
Denici on 8.5.17. Sea ((V,

A), c) la digr aca perturbada de (V,

A) con
costo c. La digr aca de las Clases de Comunicaci on Recurrente de (V,

A) es
la pareja (

V ,

A), en donde

V = H
1
, H
2
, . . . , H
r
, con H
i
una ccr de (V,

A)
para toda i y

A =

V

V . La funci on de costo c:

V

V R es tal que
c(H
i
, H
j
) = c(H
i
, H
j
).
Dada una ccr H, podemos hablar de los H arboles de (

V ,

A) y del
potencial estoc astico de H, es decir, del mnimo costo de todos ellos.
Proposici on 8.5.18. Dada una digr aca (V,

A) y una funci on de costos c.


Si H es una clase de comunicaci on recurrente y z un vertice que no est a en
la cuenca de H, entonces
c (z, H) = mn
yCue(H)
c (z, y) .
Demostraci on. Sea

zz

una trayectoria que une a z con zen H de la forma:


(z, x)
s

m=0
(x
m
, x
m+1
), con x en la cuenca de H, tal que
mn
yCue(H)
c (z, y) = c(z, x),
x
0
= x y (x
0
, x
1
), (x
1
, x
2
), ..., (x
s1
, x
s
) una trayectoria de costo cero que
une a x con alg un vertice x
s
= z

de H.
Entonces c(

zz

) = c(z, x), y c(

zz

) es mayor o igual que c


zH
.
Para cualquier trayectoria que une a z con un vertice x
s
de H, denimos
k() como el n umero de vertices de que no est an en la cuenca de H.
Entonces k(

zz

) = 1.
Para cada entero positivo , determinamos las trayectorias que unen a
z con zy que tienen a lo m as vertices fuera de la cuenca de z.
Denamos como
C(z, ) = mn

zz

[k(
zz

)
c(
zz
).
Por inducci on sobre demostremos que
c(

zz
) = C(z, ) = mn
yCue(H)
c (z, y) para toda .
381
382 Selecci on de Equilibrios
Supongamos que = 1. Si

es una trayectoria que une z con z de


mnimo costo y k(

) es menor o igual que uno, entonces z es el unico vertice


de

que no pertenece a la cuenca de H y c(

) = c(z, x

) = C(z, 1).
Como es de mnimo costo, c(z, x

) = c(z, x) = c(

zz

) y, por lo tanto,
c(

zz

) = C(z, 1).
Supongamos, por hip otesis de inducci on, que
para alguna 2, c(

zz
) = C(z, ) = mn
yCue(H)
c (z, y) .
Sea una trayectoria de costo mnimo que une a z con z

y tal que
k(

zz
) = + 1.
Sea (z, z
0
) en , tal que z
0
no est a en la cuenca de H. Entonces
c() = c(z, z
0
) +C(z
0
, ) = c(z, z
0
) +c(

z
0
z
),
donde

z
0
z

es una trayectoria de mnimo costo que une a z


0
con un vertice
z

z
0
z
= (z
0
, x

)
s

m=0
(x
m
, x
m+1
)
con x

en la cuenca de H tal que mn


yCue(H)
c (z
0
, y) = c(z
0
, x

) y
s

m=0
(x
m
, x
m+1
)
trayectoria que une a x

con z

.
Es decir, c() = c(z, z
0
) +c(z
0
, x/).
La trayectoria z, z
0

z
0
z

contiene dos puntos fuera de la cuenca de


H, as que
c() = C(z, + 1) = c(

zz
) = C(z, 2) = mn
yCue(H)
c (z, y) .
Por lo tanto, el costo mnimo de pasar de z a H es c(z, x).
Obtenemos como corolario:
Corolario 8.5.19. El costo de pasar de la clase de comunicaci on recurrente
H a la Hes igual al mnimo de los costos de las echas que unen a un vertice
de H con un vertice de la cuenca de H.
Con estos resultados podemos calcular el costo de las echas de (

V ,

A).
Reexaminemos el conicto de los 6 hombres y las 6 mujeres, con las
din amicas de aprendizaje establecidas en las secciones anteriores, comence-
mos con la de mejor replica. Sus ccr son H
1
, H
2
, H
3
y H
4
, donde
H
1
= (0, 6),
382
Mezclando y Jugando en el largo Plazo 383
H
2
= (6, 0),
H
3
= (6, 6) , (0, 0)),
H
4
= (2, 4) .
La digr aca de las cuatro ccr aparece en la gura 8.5.1.
H
1
H
2
H
3
H
4
5
2
5
6
2
9
4
1
1 8
4 3
Figura 8.5.1:
Los H
1
(H
2
, H
3
, H
4
)- arboles aparecen en las guras 8.5.2, 8.5.3, 8.5.4 y
8.5.5, respectivamente.
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
2
4
5
H
1
H
2
H
3
H
4
5
3
1
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
2
5
5
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
3 1 1
5 5
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
2
5
1
5
2
3
5
8
3
1
8
1
3
9
3 2
9
2
9
4
5
5
1
5
3 8
3
8
2 2
Figura 8.5.2:
El potencial estoc astico de H
1
es 9.
El potencial estoc astico de H
2
es 6.
El potencial estoc astico de H
3
es 10.
El potencial estoc astico de H
4
es 13.
Es decir, en la digr aca de las ccr, H
2
es el vertice de menor potencial
estoc astico, lo que signica que (6, 0) es el vertice de menor potencial es-
toc astico en la digr aca original (gura 8.4.1). Este vertice corresponde al
equilibrio de Nash que benecia a los hombres, es decir ((1, 0), (0, 1)) o lo
383
384 Selecci on de Equilibrios
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
3
H
4
H
2
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
1
2
3
1
3
4
5
1
2
2
4
2
2
5
2
3 1 1
4
2 2
2
5
3
2
1
2
8
3
4
5
4
2 5
1
4
4
4
5
1
5
6
6
1
1
6
Figura 8.5.3:
que es lo mismo, interpretado en estrategias puras, el equilibrio de Nash
(M, D).
La forma de las rutas aprendidas o acostumbradas, cuando los partic-
ipantes utilizan la din amica de aprendizaje de mejor replica (de p anico) y
bajo el supuesto de que la gente comete errores, se observan en la gura
8.5.6, las echas punteadas tienen costo positivo, es decir suponen que se
cometen errores y las otras echas tienen costo cero.
Veamos que sucede, en el mismo juego, con una din amica lenta, como la
de mejor replica con inercia fuerte. Conservando la notaci on que tenamos
en la din amica de p anico, ahora, en la de mejor replica con inercias fuerte,
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
3
H
4
H
2
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
2 2
1
1
1
1
1
5
4
5
1
4
9
4
5
4
1
4 9
9
4
8
4 4
8
2
6 8
1 1
6 9
1
9
6
2
8
2
9
1
2
2
9
2
9
Figura 8.5.4:
384
Mezclando y Jugando en el largo Plazo 385
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
3
H
4
H
2
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
H
1
H
2
H
3
H
4
5 5 5
4 4
4
6 9
2
8
9
6
3
4
6
5
6
5
4 4
8
5 4 8
4
9
2
4
3
6
9
4
8
2
4
5
8
5
6
3
8 6
4
8
6
Figura 8.5.5:
(0,0)
(6,6)
(x,y)
(3,6)
(0,6)
(2,0)
(2,3)
(2,4)
(3,4)
(x,y) (x,y)
(6,0)
Figura 8.5.6:
las tres ccr son H
2
, H
3
y H
4
y la digr aca de las ccr es como indica la gura
8.5.7.
H
2
H
4
H
3
1
1
2
4
8
4
Figura 8.5.7:
385
386 Selecci on de Equilibrios
Los H
2
arboles, los H
3
arboles y los H
4
arboles est an representados
en las guras 8.5.8. El potencial de H
2
es 3, el potencial de H
3
es 5 y el
potencial de H
4
es 8. Por lo que el vertice de menor potencial estoc astico
es, de nuevo, H
2
, con las mismas consecuencias.
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
H
2
H
3
H
4
1
2 2
1
1
1
2
1
4
4
1
4
1
8
4
8
4
4
Figura 8.5.8:
Con la din amica de las historias se procede en forma an aloga. As para
el juego de los hombres y las mujeres que estamos examinando, con historias
de tama no 2, tenemos s olo dos clases de comunicaci on recurrente que son:
__
M
M
__
D
D
__
y
__
C
C
__
Reb
Reb
__
.
Entonces, la digr aca de las ccr s olo tiene dos vertices
__
M
M
__
D
D
__
4

1
__
C
C
__
Reb
Reb
__
.
Por lo que, s olo hay un H arbol para cada ccr.
__
M
M
__
D
D
__
4

__
C
C
__
Reb
Reb
__
y
__
M
M
__
D
D
__
1

__
C
C
__
Reb
Reb
__
.
386
Mezclando y Jugando en el largo Plazo 387
De nuevo, el equilibrio de Nash machista domina el panorama, pues es
el que corresponde a la ccr con mnimo potencial estoc astico.
Debe notarse que, siguiendo los criterios de Harsanyi y Selten expuestos
en la secci on 8.2, el equilibrio correspondiente a los hombres es dominante
por riesgo y con el algoritmo de Harsanyi y Selten sera el seleccionado. En
esta secci on, hemos encontrado para este juego 2 2 el mismo equilibrio
seleccionado por un criterio con fuertes supuestos racionalistas, pero aqu se
han supuesto din amicas de aprendizaje que se desenvuelve entre personas
con muchas limitaciones de racionalidad, miopes y que cometen errores.
Panico contra Calma
Pudiera parecer que para una poblaci on envuelta en un conicto repre-
sentado por un juego, cualquier din amica llevar a al mismo resultado, pero
no es as.
Pensemos, por ejemplo, en un juego 22 que no tenga equilibrio de Nash
en estrategias puras, como el del volado, con una poblaci on de 4 personas
rengl on y 4 personas columna que reaccionan con una din amica de mejor
respuesta, sin ning un tipo de inercia (din amica de p anico), como en la gura
8.5.9.
(2,2)
(3,1) (1,0) (2,0) (4,1) (2,1) (4,2) (4,0)
(3,0) (4,4)
(0,2) (1,3) (1,4) (0,3)
(0,0) (3,3) (2,4)
(4,3) (0,4) (3,2) (3,4)
(1,2) (1,1) (0,1)
(2,3)
Figura 8.5.9:
Las unicas ccr son H
1
= (2, 2), que representa al unico equilibrio de
Nash del juego, es decir a ((
1
2
,
1
2
), (
1
2
,
1
2
)), y el ciclo
H
2
= (4, 0), (4, 4), (0, 4), (0, 0).
Entonces, la ccr de menor potencial estoc astico, bajo la din amica del
p anico es H
2
, el ciclo.
387
388 Selecci on de Equilibrios
H
1
H
2
4
1
Figura 8.5.10:
Es decir, todos los que esconden la moneda escogen aguila en un periodo
y todos los que tratan de adivinar escogen sol; en el siguiente periodo todo
mundo escoge aguila. En un tercer periodo, los que esconden escogen sol y
los que adivinan aguila, mientras que para el cuarto periodo todo mundo
escoge sol y en el siguiente se vuelve a empezar.
Estudiemos que ocurre con una din amica muy lenta, como la de mejor
replica con inercia fuerte que se presenta en la gura 8.5.11.
(2,2)
(4,4) (4,3) (4,2) (4,1) (4,0)
(3,4)
(2,4)
(1,4)
(0,4)
(3,3)
(2,3)
(1,3)
(0,3)
(3,2)
(1,2)
(0,2)
(3,1)
(2,1)
(1,1)
(0,1)
(3,0)
(2,0)
(1,0)
(0,0)
Figura 8.5.11:
Tenemos en esta din amica dos ccr, una de ellas es H
1
= (2, 2), mientras
que la segunda H
2
consta de todos los dem as vertices. Ambas ccr tienen
costo 1 para pasar de una a la otra. Esto signica que todos los vertices de
la gr aca tienen potencial estoc astico 1.
H
1
H
2
1
1
Figura 8.5.12:
8.6. La dinamica como un proceso estocastico
Abordaremos en una forma distinta la problem atica que hemos estado
atacando a lo largo del captulo.
Partimos como en la secci on 8.5 de una poblaci on K envuelta en un
conicto expresado en el juego (N, D
j
, ). La poblaci on est a partida en
n clases o subpoblaciones ajenas, una para cada jugador. El juego se repite
388
Mezclando y Jugando en el largo Plazo 389
a lo largo de tiempo discreto y en cada periodo cada j en K elige una
estrategia y queda determinado un patr on de conducta social (estructura
estrategica social). El conjunto Z representa, como en 8.5, el conjunto de
patrones de conducta sociales posibles. Existe d una correspondencia deni-
da de Z en s mismo que modela la din amica de aprendizaje de las personas
pertenecientes a K. A d se le pide que sea una din amica darwiniana (deni-
ci on 8.5.2). Estudiamos los patrones de conducta que la sociedad aprender a a
lo largo del tiempo.
Denici on 8.6.1. Decimos que una colecci on Z
1
, Z
2
, . . . , Z
r
es una
colecci on de patrones de conducta socialmente aprendidos en el largo plazo,
en el proceso ((N, D
j
, ), K, d) si se cumplen:
a) para i = 1, 2, . . . , r Z
i
es un subconjunto no vaco de Z y Z
i
Z
j
= ,
para toda i y j distintas.
b) Para cualquier z en Z existe una sucesi on z
1
, z
2
, . . . , z
m
Z, tal
que z
1
= z, z
m
est a en Z
k
, para alguna k, y z
i+1
est a en d(z
i
), para i =
1, 2, . . . , m1.
c) Si z est a en Z
k
y zno est a en Z
k
no existe ninguna sucesi on z
1
, . . . , z
m
,
tal que z
1
= z, z
i+1
est a en d(z
i
), para i = 1, 2, . . . , m1 y z
m
= z.
d) Si z y zest an en Z
k
, existe una sucesi on z
1
, z
2
, . . . , z
m
Z, tal que
z
1
= z, z
i+1
est a en d(z
i
), para i = 1, 2, . . . , m1 y z
m
= z.
Z
i
= z si y s olo si z es un equilibrio de Nash estricto que est a repre-
sentado en Z. En ese caso, z es un punto jo de d.
Observemos que siempre existe al menos un patr on de conducta social-
mente aprendido, aunque d no tenga punto jo. Tenemos, entonces, que una
poblaci on K, enfrentada en el conicto (N, D
j
, ) y sometida a una
din amica de aprendizaje ser a conducida a ciertos patrones de conducta, en
particular a los correspondientes a algunos de los equilibrios de Nash. Pero
a un no sabemos a cu al de estos patrones ir a a parar.
Antes de abordar dicho problema, asociemos a cada una de estas din ami-
cas de aprendizaje, una matriz de incidencia. Supongamos que para toda
estructura estrategica z, todos los elementos de d(z) tienen la misma proba-
bilidad de ocurrir y construimos P
0
, una matriz cuadrada de orden #Z.
P
0
zz
=
_
0 si z

/ d (z),
1
#d(z)
si z

d (z).
La matriz construida representa a d, en un sentido probabilstico. Si la
poblaci on est a en el estado z, hay una probabilidad P
0
zz

de pasar a z. Los
signos de los terminos de P
0
dependen de la din amica d.
389
390 Selecci on de Equilibrios
Denotemos como Q al conjunto de distribuciones de probabilidad en Z,
es decir Q es el simplejo unitario en R
#Z
.
Podemos interpretar a P
0
como una din amica de Q en Q. Es decir, si
q
t
Q es el vector de distribuci on de probabilidad en Z, en el periodo t,
entonces q
t
P
0
ser a el vector de distribuci on de probabilidad en Z, en el
periodo t + 1.
P
0
es una matriz no negativa y, adem as, los terminos de sus renglones
suman 1, entonces por los famosos resultados de Perron-Frobenius, sobre los
valores y vectores propios de matrices no negativas, podemos asegurar que 1
es el valor propio de P
0
de magnitud mayor y que al menos un elemento de
Q es uno de sus vectores propios asociado a 1. Es decir, existe al menos una
distribuci on de probabilidad q tal que qP
0
= q. En ese caso diremos que q
es una distribuci on estacionaria de P
0
.
P
0
puede tener muchas distribuciones estacionarias. Para establecer una
forma de discriminar entre esas distribuciones estacionarias de P
0
, pense-
mos que la poblaci on K est a enfrentada en (N, D
j
, ) y sometida a una
din amica de aprendizaje P
0
, pero ocurre que cada miembro de la poblaci on
K se desva, con una peque na probabilidad, de la respuesta marcada. Estas
desviaciones pueden ser producto de errores, experimentaci on, mutaciones
o lo que sea.
8.6.1. Otra vez sobre errores y experimentos
Supongamos, como en la secci on 8.5, que los miembros de K, no siem-
pre aplican rgidamente d, sino que experimentan o se equivocan con cierta
probabilidad. Con una probabilidad alta, las cosas suceden de acuerdo a P
0
,
pero con una peque na probabilidad ocurren transiciones de unos estados a
otros que no podan ocurrir con P
0
.
Diremos que la din amica de aprendizaje d est a perturbada (por errores
y experimentaciones) si:
a) en cada z, cualquier j en K
j
se desva desde las estrategias que est an
marcadas en los elementos de d (z), con probabilidad
j
, 0 <
j
< 1 y
b) para cada z y j, hay una distribuci on
j
( [z ) en D
j
, tal que
j
_

j
[z
_
es positiva para cada
j
D
j
.
Las desviaciones de cada j son independientes de las de otras personas
y de los periodos
j
_

j
[z
_
especica la probabilidad de que los miembros
de K
j
, estando en z, se desven a
j
.
Dados P
0
, ,
_

j
_
jN
y
_

j
( [z )
_
jN
, como antes, denimos P

, una
perturbaci on de P
0
, como
390
Mezclando y Jugando en el largo Plazo 391
P

zz
=
_

iK
(1
i
)
_
P
0
zz
+

yd(z) y=z

_
_

J
yz
=
Q
J
yz

yz
_
_

iJ
yz

s|iKs
_
_
_
_

i / J
yz

_
1
s|iKs
_
_
_
P
0
zy
_
_
,
donde Q
J
xx

es la probabilidad de ir de x a x

, cuando los unicos que se


equivocan son los miembros del conjunto J.
Es decir, si J ,= , entonces
Q
J
yz
=

iJ

i
_

i
[y
_
;
si J = , Q
J
xx

= P
0
xx

.
J
yz
es un subconjunto de K para el que Q
J
yz

yz

es positivo.
El proceso perturbado tiene propiedades m as fuertes que P
0
. Dichas
propiedades se resumen en la siguiente proposici on.
Proposici on 8.6.2. a) P

zz

es positiva para cada z y z

en Z.
b) lm
0
P

zz

= P
0
zz

para cada z y z

en Z.
c) Para cada z y z

en Z, existe un entero no negativo mnimo r(z, z

),
tal que
lm
0

r(z,z

)
P

zz
existe y es positivo.
d) Existe una unica distribuci on estacionaria de P

, q

en Q, tal que
q

= q

.
e) q

es un vector positivo.
f ) Para cada q en Q, existe un entero no negativo l
q
, tal que q(P

)
lq
= q

.
Demostraci on. a) Q
J
yz

iJ

i
_

i
[y
_
, donde
i

iJ
es la colecci on de
errores que los miembros de J realizan.
Siempre existe y d(z) y J
yz
tales que Q
J
yz

yz

es positivo. Adem as, como


y est a en d(z), P
0
zy
tambien es positivo.
Es decir, P

zz

es positivo, para cada z y z

en Z.
b) La armaci on b se desprende inmediatamente de la expresi on de P

zz

.
c) Sea r(z, z

) = mn
xd(z)

i,j

x
j
i
z
j
i

= mn
yd(z)

J
yz

, donde J
yz
puede ser
vaco, entonces r(z, z

) es el m as peque no entero no negativo, tal que


lm
0

r(z,z)
P

zz
existe y es positivo.
391
392 Selecci on de Equilibrios
El n umero r(z, z

) es el orden de nulidad de P

zz

.
d), e) y f) se desprenden de la armaci on a), pues P

es una matriz po-


sitiva, por lo que es irreducible y primitiva. Entonces existe un unico vector
q

Q tal que q

= q

. Este vector tiene todas sus coordenadas positivas


y, para cada q en Q, existe un entero no negativo l
q
, tal que q(P

)
lq
= q

.
Observaci on: q

no s olo es un punto de equilibrio del proceso expresado


por P

, sino que, debido a la propiedad f, desde cualquier estado q Q, el


proceso conduce al punto q

. Es decir, q

es estable.
El n umero r(z, z) mide la resistencia de pasar de z a zde acuerdo a la
din amica d.
Nos falta, ahora, saber que ocurre cuando los errores son peque nos, o
sea, cuando hacemos tender a cero la probabilidad de errar de la sociedad.
Tendremos la buena suerte de que q

converja? Si as fuera, el lmite


sera un vector q

, con coordenadas no negativas y que sumaran 1, es


decir una distribuci on de probabilidad entre los elementos de Z. Los estados
de Z, correspondientes a las coordenadas positivas de q

, seran los m as
fuertes, pues lograran sobrevivir a la din amica llena de ruido. De existir q

que relaci on tienen sus coordenadas positivas con los equilibrios de Nash?
que relaci on tienen con los patrones de conducta socialmente aprendidos?
No parece f acil probar si existe o no q

y calcularlo, en caso de que


existiera.
Afortunadamente a ciertos procesos de Markov perturbados se les puede
convertir en un problema de redes, es decir, en un problema de los que
estudiamos en la secci on anterior, con digr acas que tienen una funci on de
costo denida. Esta transformaci on se estableci o en un teorema de Young
[56] que es una versi on nita del teorema de M. Freidlin y A. Wentzell [17].
En que consisten esos procesos de Markov perturbados de los que esta-
mos hablando? Precisemoslo en la denici on siguiente:
Denici on 8.6.3. Dada una matriz de Markov A
0
y una familia de matrices
de Markov A

, en (0, a], asociada a ella, decimos que A

es un sistema
regular de perturbaciones de A
0
, si tiene las siguientes propiedades:
i) A

es irreducible y primitiva para toda en (0, a].


Y para toda z y zen Z,
ii) el lmite de A

zz
es A
0
zz
, cuando tiende a 0;
iii) si A

zz
> 0, entonces existe un entero no negativo mnimo r(z, z), tal
que el lmite de
r(z,z)
A

zz
, cuando tiende a cero existe y es positivo.
La proposici on 8.6.2 demuestra que el sistema P

es un sistema regular
de perturbaciones de P
0
.
392
Mezclando y Jugando en el largo Plazo 393
8.6.2. Una versi on de Young de un teorema de Freidlin y
Wentzell sobre procesos de Markov nitos y pertur-
bados.
Para lograr dar vuelta al problema, recurriremos, como mencionamos
antes, a las digr acas, con una funci on de costo. Asociaremos, a cada pro-
ceso din amico de aprendizaje ((N, D
j
, ), K, P
0
), una digr aca y en ella
estudiaremos las clases de comunicaci on recurrente y, dada una perturbaci on
de P

, construiremos la digr aca perturbada, con sus acostumbrados costos.


Denici on 8.6.4. Dado un proceso din amico de aprendizaje social
((N, D
j
, ), K, d)
la digr aca perturbada asociada a ((N, D
j
, ), K, d) es la digr aca (V,

A),
con V = Z y

A = (z, z) Z Z

P
0
zz
> 0
Los Patrones de Conducta Socialmente Aprendidas de un proceso din ami-
co de aprendizaje corresponden claramente a las Clases de Comunicaci on
Recurrente de su digr aca asociada.
Proposici on 8.6.5. Si Z
1
, Z
2
, . . . , Z
r
es la Colecci on de Patrones de Con-
ducta Socialmente Aprendidos en el largo plazo en el proceso de aprendizaje
((N, D
j
, ), K, d), entonces Z
1
, Z
2
, . . . , Z
r
son las Clases de Comunicaci on
Recurrente de la digr aca asociada. Los estados estacionarios de la din amica
darwiniana son los estados absorbentes de la digr aca asociada y correspon-
den a los equilibrios de Nash estrictos del juego formados por las estrategias
de frecuencias inducidos.
Si ahora consideramos que ((N, D
j
, ), K, d), el proceso din amico de
aprendizaje, es sometido a un sistema de perturbaciones que consisten en
que, con probabilidad la gente se desva de lo que marca d, podemos
construir la digr aca perturbada, con la funci on de costos de la resistencia
que resulta la misma que se utiliz o en la secci on 8.6.
Denici on 8.6.6. Dado un proceso din amico de aprendizaje social
((N, D
j
, ), K, d)
y un sistema regular de perturbaciones P

(o,a]
, la digr aca perturbada
asociada a ((N, D
j
, ), K, d, ) es la digr aca (V,

A), con V = Z y


A = (z, z) Z Z [P

zz
> 0
393
394 Selecci on de Equilibrios
y como funci on costo,
r :


A 0, 1, 2, . . .,
denida como
r(z, z) =

jN

iD
j
mn
xd(z)

x
j
i
z
j
i

.
Si z est a en Z, denotamos como T
z
a la colecci on de z arboles de (V,

A)
y, podemos denir el potencial estoc astico de z.
Debido a la versi on de Young de un teorema de Freidlin y Wentzell
podremos obtener el lmite de q

que resulta relacionado con los vertices


de potencial estoc astico mnimo de la digr aca perturbada.
Teorema 8.6.7 (Young-Freidlin-Wentzell). Sea A un proceso de Markov
nito y A

un sistema regular de perturbaciones de A. Si para cada po-


sitivo, v

es el unico vector no negativo cuyas coordenadas suman 1 tal que


v

= v

, entonces el lmv

existe y es un vector no negativo cuyas


coordenadas suman 1 y tal que es un vector propio de A asociado al valor
propio 1. Sus coordenadas positivas corresponden a los vertices de mnimo
potencial estoc astico.
Interpretando este teorema en el contexto que estamos estudiando obte-
nemos,
Teorema 8.6.8. Sea ((N, D
j
, ), K, d) un proceso din amico de aprendiza-
je social, P
0
la matriz de Markov asociada a d y P

, en (0, a] el sistema
de perturbaciones de P
0
, entonces existe q

, el lmite de q

, cuando
tiende a cero. Adem as,
a) q

P
0
= q

y
b) si q

z
es positiva, entonces z est a en alguna de las clases de comu-
nicaci on recurrente de menor potencial estoc astico de (V,

A), la digr aca


asociada a ((N, D
j
, ), K, d).
La demostraci on del teorema es esencialmente la de Young (1993). Para
establecerla, probemos antes el siguiente lema.
Lema 8.6.9. q

z
=
P
Tz

(x,x

)
P

xx

P
zZ
P
Tz

(x,x

)
P

xx

.
394
Mezclando y Jugando en el largo Plazo 395
Demostraci on. Dada z en Z, denimos el vector q () como
q
z
() =

Tz

(x,x

)
P

xx
.
Este n umero es positivo, pues P

es irreducible, de hecho la matriz es posi-


tiva.
La coordenada z de q () P

es

xZ
q
x
() P

xz
= q
z
() P

zz
+

xZ|x=z
q
x
() P

xz
.
Por otro lado,

xZ|x=z
q
x
() P

xz
=

xZ|x=z
P

xz

Tx

(y,y

)
P

yy

y reordenando los terminos, tendremos que

xZ|x=z
q
x
() P

xz
=

xZ|x=z
P

zx

Tz

(x,x

)
P

xx

=
q
z
()

xZ|x=z
P

zx
= q
z
() (1 P

zz
).
Sumando q
z
() P

zz
a ambos lados de la ultima igualdad, tenemos que
para toda z,

xZ
q
x
() P

xz
= q
z
().
Es decir, q () P

= q ().
Todos los vectores propios de P

correspondientes al valor propio 1 est an


en la recta determinada por q ().
Demostraci on. (Teorema 8.6.8)
Para z, un estado cualquiera, denotemos como a uno de los z arboles
y como c() al costo de , es decir c() =

(x,x

)
r (x, x

).
Consideramos la funci on : Z 0, 1, 2, . . . denida como
(z) = mn
Tz
c ()

= mn
zZ
(z) .
Para el z arbol a
z
, consideramos la identidad,


(x,x

)az
P

xx

=
c(az)


(x,x

)az

r(x,x

)
P

xx

(1).
Sabemos que lm
0

r(z,z

)
P

zz

> 0 y lm
0

(x,x

)eaz

r(x,x

)
P

xx

> 0.
Si z y a
z
son tales que (z) =

y r (a
z
) =

, entonces
lm
0

c(eaz)


(x,x)eaz

r(x,x)
P

xx

> 0.
395
396 Selecci on de Equilibrios
De (1), lm
0


(x,x

)eaz
P

xx

> 0 y, tambien, lm
0


azAz

(x,x

)az
P

xx
>
0.
Pero, si (z) ,=

, tendramos que lm
0


azAz

(x,x

)az
P

xx

= 0.
Uniendo los dos casos, se tiene que se cumple
lm
0

zZ

azAz

(x,x

)az
P

xx
> 0.
Entonces, lm
0

P
azQAz
Q
(x,x

)az
P

xx

P
zZ

P
azAz
Q
(x,x

)az
P

xx

> 0 si, y s olo si, (z) =

.
Por otro lado, por el lema 8.6.9, q

z
=

P
azQAz
Q
(x,x

)az
P

xx

P
zZ

P
azAz
Q
(x,x

)az
P

xx

y, por ello,
q

z
= lm
0
q

z
siempre existe, y es positivo si, y s olo si, (z) =

.
Es claro que q

= lm
0
q

es una distribuci on estacionaria de P


0
.
Llamaremos a q

la distribuci on lmite y a las coordenadas positivas


de q

, los estados de equilibrio a largo plazo. Es decir, los unicos estados


a los que la distribuci on lmite les otorga probabilidad positiva son los que
pertenecen a una ccr de mnimo potencial de la digr aca asociada al proceso
din amico de aprendizaje social. Recordemos que si estas ccr constan de un
solo vertice, entonces, el estado de equilibrio a largo plazo representara a
un equilibrio de Nash del juego (N, D
j
, ).
Con una interpretaci on m as amplia de Z y una denici on adecuada de las
din amicas darwinianas, estos resultados son v alidos para las din amicas con
historias (ver el artculo de Young sobre la evoluci on de las convenciones).
8.7. Ejercicios
Ejercicio 8.1. Supongamos que hay una poblaci on K envuelta en el con-
icto representado en el juego
_
(6, 6) (1, 5)
(5, 1) (0, 0)
_
.
Supongamos que hay 6 personas rengl on y 6 personas columna. La pareja
(u, v) con u y v en 0, 1, 2, . . . , 6, quiere decir que u personas rengl on han
396
Mezclando y Jugando en el largo Plazo 397
escogido su primera estrategia y 6 u la segunda, an alogamente en cuanto
a v.
Considere la din amica de aprendizaje d(u, v) = (u, v), con
u=
_
_
_
6 si E
1
_
(1, 0) ,
_
v
6
,
6v
6
__
> E
1
_
(0, 1) ,
_
v
6
,
6v
6
__
,
0 si E
1
_
(1, 0) ,
_
v
6
,
6v
6
__
< E
1
_
(0, 1) ,
_
v
6
,
6v
6
__
,
u si E
1
_
(1, 0) ,
_
v
6
,
6v
6
__
= E
1
_
(0, 1) ,
_
v
6
,
6v
6
__
,
y
v=
_
_
_
6 si E
2
__
u
6
,
6u
6
_
, (1, 0)
_
> E
1
__
u
6
,
6u
6
_
, (0, 1)
_
,
0 si E
2
__
u
6
,
6u
6
_
, (1, 0)
_
< E
1
__
u
6
,
6u
6
_
, (0, 1)
_
,
u si E
2
__
u
6
,
6u
6
_
, (1, 0)
_
= E
1
__
u
6
,
6u
6
_
, (0, 1)
_
.
Construya la gr aca dirigida (V,

A), con
V = 0, 1, 2, . . . , 6 0, 1, 2, . . . , 6
y

A = ((u, v), (u, v)) V V [(u, v) d(u, v) .
Encuentre los subconjuntos de V que representan los patrones de conducta
socialmente aprendidos en los que pueden caer la poblaci on K.
Ejercicio 8.2. Para el mismo juego del ejercicio 8.1, con la misma poblaci on,
dena formalmente la din amica de mejor respuesta con inercia debil. Cons-
truya la gr aca dirigida (V,

A) y estudie los patrones de conducta social-


mente aprendido. Dieren de los estudiados en el ejercicio 1?
Ejercicio 8.3. Proceda igual que en el ejercicio anterior
a) con la din amica de mejor respuesta con inercia fuerte,
b) con la din amica de reajuste de Nash.
Ejercicio 8.4. Considere que la poblaci on involucrada en el juego del ejer-
cicio 1 es simetrica (sin partir en subpoblaciones) y consta de 12 personas.
a) Dena formalmente la din amica de mejor respuesta, construya su
gr aca y estudie los patrones de conducta socialmente aprendida.
b) Dena formalmente la din amica de mejor respuesta, con inercia debil,
construya su gr aca y estudie los patrones de conducta socialmente apren-
dida.
c) Dena formalmente la din amica de mejor respuesta, con inercia fuerte,
construya su gr aca y estudie los patrones de conducta socialmente apren-
dida.
d) Dena formalmente la din amica de reajuste de Nash, construya su
gr aca y estudie los patrones de conducta socialmente aprendida.
Compare los resultados con los que se obtienen en los casos en que la
poblaci on no es homogenea (ejercicios 1, 2 y 3).
397
398 Selecci on de Equilibrios
Ejercicio 8.5. Estudie los ejemplos del captulo 1 con diversas poblaciones
y din amicas.
Ejercicio 8.6. Estudie los juegos
a)
_
(3, 3) (1, 0)
(0, 1) (4, 4)
_
, b)
_
(2, 2) (1, 1)
(1, 1) (3, 3)
_
,
c)
_
(5, 7) (3, 4)
(10, 1) (0, 5)
_
con la digr aca de las historias de tama no 2 y tama no 3. Cu ales son los
puntos absorbentes de las digr acas? Que relaci on tienen con los equilibrios
de Nash?
Ejercicio 8.7. Trabaje el juego b del ejercicio 8.6:
a) con la digr aca de poblaciones partidas. Elija el tama no de K
1
y K
2
para que en las digr acas aparezca representado el equilibrio de Nash en
estrategias mixtas, estrictamente hablando. Estudie las digr acas con las
din amicas de p anico y con inercia fuerte. Cu ales son las clases de comuni-
caci on recurrente?
b) Estudie los ejemplos 8.6 a y 8.6 b, pero con una poblaci on simetrica,
sin partir. Elija el tama no de K para que en las digr acas de poblaciones
aparezca representado el equilibrio de Nash en estrategias mixtas, estricta-
mente hablando. Estudie las digr acas con las din amicas de p anico y con
inercia fuerte. Cu ales son las clases de comunicaci on recurrente?
Ejercicio 8.8. Demuestre que la din amica de mejor respuesta con inercia
debil es darwiniana.
Ejercicio 8.9. Demuestre que la din amica de reajuste de Nash es darwi-
niana.
Ejercicio 8.10. Demuestre que la din amica de Canning que construimos a
continuaci on es darwiniana.
Din amica de Canning: considerese un juego 2 m, simetrico. Sea D =
1, ..., m y K una poblaci on con un n umero grande y par de miembros.
En cada periodo, hay muchos encuentros (partidas) entre dos miembros
distintos de K tomados al azar, de tal manera que cada miembro de K
toma parte en una sola partida. En z, cada j en K recuerda la historia
h
j
z
D
T
de las estrategias escogidas por sus oponentes en cada uno de los
T ultimos periodos, de tal manera que:
1) Si D ha sido escogida, en T + 1, j actualizar a su memoria con
b : D
T
D D
T
, tal que b(h
j
, ) = h
j
, donde h

j
Ti
= h
j
Ti+1
, para
1 i < T y h
j
T+1
= ;
398
Mezclando y Jugando en el largo Plazo 399
2) j desarrolla creencias sobre la conducta estrategica de la poblaci on to-
tal. Estas creencias se pueden formular con una estrategia mixta construda
de acuerdo a la funci on : D
T
M.
3) j responde a su creencia con : M D, tal que su pago esperado no
es peor que el que tena si usa la estrategia
_
(h
j
)
_
.
T, b, y son las mismas para cada j K.
Z =
_
(z
1
, z
2
, ..., z
m
)

z
i
0 y

iD
z
i
= kT
_
.
Para cada z Z, sea z =
z
kT
; por supuesto, z M.
Si h = h
j
es la colecci on de historias que recuerdan los miembros de
K, en z, decimos que d
C(T, b, , )
es la din amica de Canning para T, b,
, y h si d
C(T, b, , )
es una correspondencia de Z en Z, tal que d (z) no
es vaca, para cada z, y z

d (z) si, y s olo si, z


s
=
T

i=1

jK

j
is
y z

s
=
T

i=2

jK

j
is
+

jK

j
s
, donde

j
is
=
_
1 si h
j
i
= s,
0 de otra manera,
y

j
s
=
_
1 si h
k
h tal que
_

_
h
k
__
= s,
0 de otra manera.
Ejercicio 8.11. Estudie alg un ejemplo simetrico de dos jugadores pensando
en que una poblaci on simetrica y par aprende con una din amica de Canning.
Encuentre una gr aca dirigida que represente la din amica de la poblaci on y
encuentre los patrones de conducta socialmente aprendidos.
Ejercicio 8.12. Encuentre los equilibrios a largo plazo de los juegos an-
teriores, utilizando las diversas din amicas construidas e introduciendo la
hip otesis de que cada miembro de la poblaci on se desva con probabilidad
de lo que marca la din amica y que la probabilidad con la que escoge su
primera estrategia es positiva.
Ejercicio 8.13. Encuentre los equilibrios a largo plazo de los juegos del
captulo 1, considerando poblaciones adecuadas y deniendo las din amicas
a su juicio pertinentes e introduciendo la hip otesis de que cada miembro de
la poblaci on se desva con probabilidad de lo que marca la din amica y que
la probabilidad con la que escoge su primera estrategia es positiva.
399
400 Selecci on de Equilibrios
400
Bibliografa
[1] L. Ausubel, R. Deneckere, Reputation in Bargaining and Durable
Goods Monopoly, Econometrica, 57 (1989), 511-531.
[2] R. Aumann, Agreeing to desagree, Annals of Statistics, 4 (1976),
1236-1239.
[3] H.S. Bierman, L. Fern andez, Game Theory with Economic Applica-
tions, Addison-Wesley, 1993.
[4] K. Binmore, Teora de Juegos, McGraw-Hill, 1994.
[5] K. Binmore, Game Theory and the Social Contract, in R. Sel-
ten, Game Equilibrium Models II. Methods, Morals, and Markets,
Springer-Verlag, 1991.
[6] K. Binmore , Game Theory and the Social Contract, Volume 1 Play-
ing Fair, 1995 y Volume 2 Just Playing, 1998, MIT Press.
[7] K. Binmore, L. Samuelson, Evolutionary Stability in Repeated Games
Played by Finite Automata, Journal of Economic Theory, 57 (1992),
278-305.
[8] G. W. Brown, Iterative Solutions of Games by Fictious Play, en T.
Koopmans, Activity Analysis of Production and Allocation, Willey,
1951.
[9] D. Canning, Average Behavior in Learning Models, Journal of Eco-
nomic Theory, 57 (1992), 442-472.
[10] D. Canning, Learning and Social Equilibrium in Large Populations,
en A. Kirman, M. Salmon, Learning and Rationality in Economics,
Blackwell, 1995.
401
402 Selecci on de Equilibrios
[11] R. Coase, Durability and Monopoly, Journal of Law and Economics,
15 (1972), 143-149.
[12] A. Cournot, Investigaciones acerca de los Principios Matem aticos de
la Teora de Las Riquezas, Alianza Editorial, 1969. La primera edici on
en frances es de 1838.
[13] M. D. Davis, Introducci on a la Teora de Juegos, Alianza Editorial,
1986.
[14] M. Dresher, L. Shapley, A. Tucker, eds. Advances in Game Theory,
Study 52, Annals Of Mathematics Studies, Princeton University Press,
1963.
[15] M. Dresher, A. Tucker, eds., Contributions to the Theory of Games,
III, Study 39, Annals of Mathematics Studies, Princeton University
Press, 1957.
[16] D. Foster , P. Young , Stochastic Evolutionary Game Dynamics. The-
oretical Population Biology, 38 (1990) 219-232.
[17] M. Freidlin, A. Wentzell, Random Perturbations of Dynamical Sys-
tems, Springer -Verlag, New York, 1984.
[18] J. Friedman, A noncooperative equilibrium for supergames. Review
of Economic Studies, 38 (1971), 1-12.
[19] D. Fudenberg, D. Levin, J. Tirole, Innite Horizont Models of Bar-
gaining with One-Sided Incomplete Information, en A. Roth, Game
Theoretic Models of Bargaining, Cambridge University Press, 1985.
[20] D. Fudenberg, J. Tirole, Game Therory, The MIT Press, 1991.
[21] D. Gale, The Theory of Linear Economic Models, McGraw-Hill, 1960.
[22] R. Gardner, Juegos para Empresarios y Economistas, Antoni Bosh,
1996.
[23] R. Gibbons, Un Primer Curso de Teora de Juegos, Antoni Bosh,
1993.
[24] G. Hardin, The Tragedy of the Commons, Science, Vol. 162 (1968),
1243-1248.
402
Mezclando y Jugando en el largo Plazo 403
[25] J.C. Harsanyi A General Solution For Finite Non-Cooperative Games,
Based On Risk-Dominance, en M. Dresher, L. S. Shapley, A. W. Tuck-
er, Advances in Games Theory, Study 52, Annals of Mathematics
Studies, Princeton University Press, 1963.
[26] J. C. Harsanyi , R. Selten, A General Theory of Equilibrium Selection
in Games, MIT Press, 1988.
[27] S. Hern andez, Modelos Matem aticos sobre el Origen de la Ganancia
del Capital, Miscel anea Matem atica (por aparecer).
[28] M. Kandori, G. Mailath, R. Rob, Learning, Mutation and Long Run
Equilibria in Games, Econometrica, 61 (1993), 29-56.
[29] M. Kandori, R. Rob, Evolution of Equilibria in the Long Run: A Gen-
eral Theory and Applications, Journal of Economic Theory, 65 (1995),
383-414.
[30] H.W. Kuhn, Extensive Games and the problem of Information, en
H.W. Kuhn, A.W. Tucker, eds., Contributions to the Theory of Games,
II, Annals of Mathematics Studies, 28, Princeton University Press,
1953.
[31] H.W. Kuhn, A.W. Tucker, eds., Contributions to the Theory of Games,
I-II, Annals of Mathematics Studies Nos 24, 28, Princeton University
Press, 1950, 1953.
[32] J.E. Littlewood, Mathematical Miscellany, B. Bollobas, 1953.
[33] R. D. Luce, H. Raia, Games and Decisions, John Wiley & Sons,
1957.
[34] R. D. Luce, A.W. Tucker, eds., Contributions to the Theory of Games,
IV, Study 40, Annals of Mathematics Studies, Princeton University
Press, 1959.
[35] J. Maynard Smith, Evolution and the Theory of Games, Cambridge
University Press, 1982.
[36] J.C.C. McKinsey, Introducci on a la Teora Matem atica de los Juegos,
Aguilar, 1966.
[37] D. Monderer, L. Shapley, Ficticious Play Property for Games with
Identical Interests, Journal of Economic Theory, 68 (1996), 258-265.
403
404 Selecci on de Equilibrios
[38] J. Nash, Equilibrium Points in n-Person Games, Proc.Nat.Acad. Sci.
U.S.A, 36 (1950), 48-49.
[39] J. Nash, The Bargaining Problem, Econometrica, 18 (1950), 155-162.
[40] J. Nash, Non-Cooperative Games, Annals of Mathematics, 54 (1951),
286-295.
[41] A. Okada, K. Sakakibara, The Emergence of the State: A Game The-
oretic Approach to Theory of Social Contract. The Economic Studies
Quarterly, 42(4) (1991), 315-333.
[42] M. J. Osborne, A. Rubinstein, Bargaining and Markets, Academic
Press, 1990.
[43] G. Owen, Game Theory, Saunders Company, 1968.
[44] E. Rasmusen, Juegos e informaci on. Una introducci on a la teora de
juegos, Fondo de Cultura Econ omica, 1996.
[45] J. Robinson, An Iterative Method of Solving a Game, Annals of
Mathematics, 54 (1951), 296-301.
[46] H.E. Scarf, The Computation of Equilibrium Prices, en H. Scarf, J.
Shoven editors, Applied General Equilibrium Analysis, Cambridge
University Press, (1984), 207-230.
[47] T. C. Schelling, The Strategy of Conict, Harvard University Press,
1960. (Existe traducci on al espa nol en Editorial Fondo de Cultura
Econ omica.)
[48] T. C. Schelling, Micromotivos y Macroconducta, Fondo de Cultura
Econ omica, 1989.
[49] J. Sobel, I. Takahashi, A Multi-Stage Model of Bargaining, Review
of Economic Studies, 50 (1983), 411-426.
[50] N. Stokey, Rational Expectations and Durable Goods Pricing. Bell
Journal of Economics 12 (1981), 112-128.
[51] J. Tirole, The Theory of Industrial Organization, MIT Press, (1988).
(Existe traducci on al espa nol en Editorial Ariel.)
[52] F. Vega Redondo, Competition and Culture in an Evolutionary Pro-
cess of Equilibrium Selection: A Simple Example, Games and Econom-
ic Behavior, 5 (1993), 618-631.
404
Mezclando y Jugando en el largo Plazo 405
[53] F. Vega-Redondo, Economa y Juegos, Antoni Bosh, 2000.
[54] E. S. Ventsel, Introducci on a la Teora de Juegos, Limusa, 1963.
[55] J. von Neumann, O. Morgenstern, Theory of Games and Economic
Behavior, Princeton University Press, 1944.
[56] P. Young, The Evolution of Conventions, Econometrica, 61 (1993),
57-84.
[57] P. Young, Individual Strategy and Social Structure: An Evolutionary
Theory of Institutions, Princeton University Press, 1998.
[58] P. Zapata, Convenir para Jugar o Jugar para Convenir?, Miscel anea
Matem atica, 36 (2002), 29-48.
[59] P. Zapata, La Conjetura de Coase sobre Monopolios en Bienes
Durables, Aportaciones Matem aticas, 29 (2001), 243-267.
[60] E. Zermelo,

Uber eine Awendung der Menhenlehre auf die Theorie


des Schachspiels, Proceedings of the Fith International Congress of
Mathematicians, 2 (1913), 501-504. Volume II. E. W. Hobson, A.E.H.
Love. ed. Cambridge University Press.
405

Indice alfabetico
z- arbol, 379
D onde qued o la cabrita?, 97
Algoritmo de Juego Ficticio, 201
Algoritmo de Zermelo, 109
alternativa, 64
amenaza increble, 46
Amenazas crebles e increbles, 57
asegurable en estrategias mixtas,
247
asegurable en estrategias puras, 19
C alculo de Estrategias Conservado-
ras con Programaci on Lin-
eal, 269
clases de comunicaci on recurrente,
87
composici on de estrategia, 105
Conjetura de Coase, 317
Conjunto de Estrategias Puras, 6
Conjunto de jugadores, 6
conjunto de jugadores, 66
conjunto de vertices del jugador j,
66
conjuntos de informaci on, 67
Conocimiento Com un, 166
Conocimiento Privado, 159
convexa, 224
Coronel Blotto, 33
correspondencia, 224
correspondencia de mejor respues-
ta del juego, 212
correspondencia de mejor respues-
ta del jugador, 207
mathbf 22, 207
curva de reacci on, 212
Decisiones simult aneas e informa-
ci on no perfecta, 51
Demandas triviales, 57
descomposici on de una estrategia,
105
digr aca, 82
digr aca de mejor respuesta, 87
Digr acas de aprendizaje, 372
Digr acas Perturbadas, 378
Dilemas del Prisionero n-Personales,
14
Din amica con inercia debil, 375
din amica darwiniana de aprendiza-
je, 374
Din amica de Aprendizaje en Pobla-
ciones, 358
Din amica de Canning, 399
Din amica de historiasde Young, 366
Din amica de Mejor Replica o de
P anico, 375
Din amica de Reajuste de Nash, 376
Din amicas de Aprendizaje en Pobla-
ciones Simetricas, 363
distribuci on lmite, 396
Dominaci on por Riesgo, 353
Dominancia Simple y Dominancia
Estricta, 348
406
Mezclando y Jugando en el largo Plazo 407
El baile de Shapley, 13
El Duelo, 49
El duopolio de Bertrand, 41
El Duopolio de Cournot, 35
El juego de Gale, 96
El juego de la Cargada, 17
El juego de los cerillos, 74
El juego del Contento, 56
El juego del Nim, 96
El juego del parasitismo social, 15
El ligue de Nash, 13
El Operador de Conocimiento, 160
El P oker Simplicado, 54
El Surgimiento de una Organizaci on
Social, 296
equilibrio bayesiano, 182
Equilibrio Bayesiano de Nash, 176
equilibrio de Nash de un juego repeti-
do, 314
equilibrio de Nash en estrategias
de comportamiento, 288
equilibrio de Nash en estrategias
de comportamiento perfec-
to en subjuegos, 290
equilibrio de Nash en estrategias
mixtas, 217
Equilibrio de Nash en Estrategias
Puras, 7
equilibrio de Nash en estrategias
puras, 118
equilibrio de Nash es benicioso,
346
equilibrio perfecto en subjuegos, 127
Equilibrios intercambiables, 343
Errar es de Humanos, 370
estado absorbente, 88
estados de equilibrio a largo plazo,
396
estrategia conservadora, 21
estrategia de comportamiento, 285
estrategia en un juego extensivo,
103
estrategia mixta, 195
estrategia no dominada, 8
estrategias mixtas conservadoras,
250
estructura estrategica, 373
factible, 315
factor de descuento o probabilidad
de continuaci on, 313
Fichas de domin o en un tablero,
98
forma normal, 117
forma normal de un juego extensi-
vo, 118
funci on de pago esperado, 197
funci on de utilidad, 154, 155
funci on de utilidad de von Neu-
mann y Morgenstern, 157
G. Hardin, 14
Generalizaci on del algoritmo de Zer-
melo, 129
gr aca, 62
gr aca conexa, 62
gr aca conexa sin ciclos, 63
Harsanyi, 168
hip otesis del mundo peque n
historia de repetici on del juego, 312
Inducci on hacia atr as, 109
Inducci on hacia atr as en el caso in-
nito, 131
Inducci on hacia atr as en estrate-
gias mixtas, 328
Inducci on hacia atr as para estrate-
gias de comportamiento, 292
informaci on perfecta, 67
407
408 Selecci on de Equilibrios
interpretaci on geometrica de D. Gale
de la desmotraci on del Teo-
rema de von Neumann, 258
Juego antag onico en estrategias mix-
tas, 255
juego antag onico en estrategias puras,
23
juego bipersonal de suma cero, 10
juego de continuaci on, 169
Juego de Posiciones, 74, 76
juego estado, 313
juego extensivo, 66
juego repetido, 313
Juegos Bipersonales de Suma Cero,
8
juegos bipersonales de suma cero,
256
Juegos de Concurreccia o de Ven-
tanillas, 17
Juegos de informaci on perfecta y
sin azar, 46
juegos de informaci on completa, 173
juegos de informaci on incompleta,
151
Juegos de Informaci on no Perfec-
ta, 50
Juegos de informaci on perfecta y
con azar, 48
Juegos de Mayora, 16
Juegos de Posiciones, 75
Juegos de se nalizaci on, 179
Juegos extensivos bayesianos, 179
Juegos extensivos innitos, 57
Juegos extensivos innitos, con in-
formaci on no perfecta, 59
Juegos innitos de informaci on per-
fecta, 57
Juegos rectangulares bayesianos, 174
Juegos Simetricos 2 2, 11
Kuhn, 66
La Cadena de Supermercador de
Selten, 46
La Selecci on propuesta por Harsanyi,
345
Lema de Sperner, 232
Los juegos de informaci on incom-
pleta o bayesianos, 169
lotera, 156
m aximo asegurable para j en es-
trategias mixtas, 250
m aximo asegurable para el jugador
j, 21
metodo algebraico para encontrar
estrategias conservadoras
en juegos 2 2, 263
metodo geometrico para calcular
estrategias conservadoras
en juegos 2 m y m 2,
266
mejor respuesta del jugador, 7
mejor respuesta estricta, 200
mejor respuesta mixta, 205
mejor respuesta pura, 199
memoria perfecta, 289
Monopolio en el Mercado de un bi-
en durable, 317
n ucleo de una digr aca, 84
operador de conocimiento com un,
166
operador de creencias, 160
operador de creencias comunes, 167
partida, 64
patrones de conducta aprendidos,
88
408
Mezclando y Jugando en el largo Plazo 409
potencial estoc astico de un vertice,
379
propiedad de juego cticio, 205
punto silla, 10
punto silla de la funci on de pago
esperado, 256
punto silla del juego, 28
relaci on de preferencia, 154
repetici on del dilema del prisionero,
309
Riesgo Moral, 48
Robert Aumann, 166
Rubinstein, 145
Selecci on de Equilibrios Propuesta
por Nash, 343
soluci on de Nash, 343
subjuego, 68
superiormente semicontinua, 224
t-Soluci on, 345
Teorema de Friedman, 315
Teorema de Punto Fijo de Brouw-
er, 226
Teorema del Folklore, 315
Teorema von Neumann, 257
trayectoria, 62
triangulaci on, 230
Un Algoritmo de Scarf para Cal-
cular Puntos Fijos, 227
Un juego de negociaci on, 58
Un juego rectangular, 6
Un principio de equilibrio, 139
v-Soluci on, 345
vertice nal, 64
vector, 315
Von Neumann y Morgenstern, 155
409

También podría gustarte