Está en la página 1de 97

TEORÍA DE JUEGOS

Apuntes docentes

Rodrigo Carrasco Gaubert

Publicado por la Facultad de Economía y Negocios de la Universidad Central de Chile en


noviembre de 2017
Apuntes Docentes de Teoría de Juegos

Contenidos

Capítulo 1: Introducción

1.1. Qué es la teoría de juegos


1.2. Objetivos
1.3. Estructura del documento

Capítulo 2: Juegos simultáneos

2.1. Objetivos del capítulo


2.2. Aprendizajes esperados
2.3. Lecturas esenciales
2.4. Lecturas opcionales
2.5. Introducción al capítulo dos
2.6. Representación normal o estratégica de un juego simultáneo
2.7. Estrategias dominadas
2.8. Eliminación iterada de estrategias dominadas
2.9. Aplicaciones sobre eliminación iterada de estrategias dominadas
2.10. El método de la mejor respuesta
2.11. Juegos de coordinación
2.12. Revisión de algunos de los juegos más conocidos
2.13. Aplicaciones sobre el equilibrio de Nash
2.14. Juegos de tres jugadores
2.15. Introducción a las estrategias mixtas
2.16. Equilibrio de Nash en estrategias mixtas

Capítulo 3: Juegos dinámicos

3.1. Objetivos del capítulo


3.2. Aprendizajes esperados
3.3. Lecturas esenciales

1
Apuntes Docentes de Teoría de Juegos

3.4. Lecturas opcionales


3.5. Introducción al capítulo tres
3.6. Representación extensiva de un juego dinámico
3.7. Inducción hacia atrás
3.8. Aplicación sobre el método de inducción hacia atrás
3.9. Representación estratégica de juegos dinámicos
3.10. Equilibrio de Nash perfecto en subjuegos
3.11. Juegos dinámicos con información imperfecta

2
Apuntes Docentes de Teoría de Juegos

Capítulo Uno

Introducción
1.1.- Qué es la teoría de juegos

La teoría de juegos es una disciplina que tiene como objetivo principal el estudio de
decisiones multipersonales, es decir, cuando la decisión de una persona afecta el
bienestar de otra. En ese contexto, el concepto clave es la interdependencia
estratégica.

El estudio sistemático de una teoría de interacción estratégica nos familiarizará con


un lenguaje que permite converger e intercambiar ideas acerca del comportamiento
humano, desarrollar modelos de situaciones y ofrecer un pensamiento lógico sobre
las implicancias de tales comportamientos, en determinadas situaciones.

La teoría de juegos tiene su campo de aplicación en aquellas áreas en que se está


en presencia de interacción. En consecuencia, es común encontrar aplicaciones de
teoría de juegos en economía, ciencia política, relaciones internacionales,
negociación, estrategia, biología; entre otros.

1.2. Objetivos

Este documento está orientado a estudiar los pilares de la teoría de juegos.


Desarrolla ejemplos y aplicaciones centradas en el campo de la toma de decisiones
estratégicas.

Está dirigido a estudiantes que están cursando sus últimos cursos de pregrado y a
estudiantes de postgrado no iniciados en la teoría. Está dirigido también a
profesionales que deben tomar decisiones estratégicas.

El objetivo general del documento es apoyar el curso de Teoría de Juegos que se


dicta a nivel universitario. Los objetivos específicos son:

1. Entregar los principios y conceptos fundamentales de la materia.


2. Desarrollar en profundidad los principales y más populares juegos.

3
Apuntes Docentes de Teoría de Juegos

3. Desarrollar en profundidad algunas aplicaciones de la teoría de juegos.


4. Explorar nuevas formas de razonamiento estratégico en situaciones de
interdependencia estratégica.

El documento propone desde la teoría de juegos: (1) modelar y resolver juegos no


cooperativos de información completa con un sentido matemático preciso y (2)
analizar el comportamiento estratégico de individuos estrictamente racionales que
toman decisiones individuales con efecto en el bienestar de otros individuos.

1.3. Estructura del documento

El documento está dividido en tres capítulos. En los capítulos dos y tres se revisan
diversos juegos con las siguientes características:

1. Juegos de información completa, donde los jugadores conocen las


ganancias asociadas a cada uno de los perfiles estratégicos.
2. Juegos con jugadores estrictamente racionales, es decir, jugadores que
tienen como objetivo maximizar sus funciones de ganancia.
3. Juegos de conocimiento común, donde los jugadores tienen conocimiento
acerca de las ganancias; tienen conocimiento acerca del conocimiento del
resto de los jugadores y tienen conocimiento acerca del conocimiento del
conocimiento del resto de los jugadores.

El capítulo dos se concentra en juegos simultáneos de información imperfecta, es


decir en juegos en que los jugadores deciden (juegan) sin conocer la decisión del
resto de los jugadores.

El capítulo tres se enfoca en juegos dinámicos, es decir, la decisión de un jugador


es conocida y luego, con ese conocimiento juega el otro jugador. Se analizarán dos
tipos de estos juegos. En los primeros, los juegos son de información perfecta y en
los segundos los juegos son de información imperfecta, es decir, en algún estado
del juego los jugadores deben jugar de manera simultánea.

4
Apuntes Docentes de Teoría de Juegos

A lo largo del documento se resuelven ejercicios y ejemplos; y se proponen tareas


y preguntas que servirán de base para que los interesados puedan seguir
profundizando los diferentes tópicos que se ofrecen en el texto.

5
Apuntes Docentes de Teoría de Juegos

Capítulo Dos
Juegos Simultáneos
2.1. Objetivos del capítulo

Introducir los juegos simultáneos de información completa; su representación en


forma normal o estratégica y cómo resolverlos.

2.2. Aprendizajes esperados

 Representar los juegos en forma estratégica


 Reconocer estrategias dominadas
 Aprender el método de la eliminación iterada de estrategias dominadas
 Aprender el método de la mejor respuesta.
 Determinar el equilibrio de Nash en estrategias puras y estrategias mixtas.
 Aprender aplicaciones prácticas de la teoría
 Reconocer diversos tipos de juegos: de dilema, coordinación, negociación y
conflicto puro.

2.3. Lecturas esenciales

 Gibbons, R. 1992. A primer in Game Theory. Prentice Hall.


 Polack, B. 2007. Econ 159: Game Theory. Open Yale Courses.
 Watson, J. 2008. Strategy. W.W. Norton & Co.

2.4. Lecturas opcionales

 Axelrod, R. The Evolution of Cooperation. 1985.


 Dixit, A. y Skeath, S. 2004. Games of Strategy. W.W. Norton & Co.
 Fundenberg, D. y Tirole, J. 1991. Game Theory. MIT Press, Cambridge.
 Osborne, M. y Rubinstein, A. 1994. A Course in Game Theory. The MIT Press.
 Schelling Thomas. The strategy of conflict.
 Tirole, J. Organización industrial.

6
Apuntes Docentes de Teoría de Juegos

2.5. Introducción al capítulo dos


Como se decía en la introducción, el concepto clave en la teoría de juegos es el
concepto de la interdependencia estratégica: mi bienestar no sólo depende de mi
decisión sino también depende de la decisión de otro y al mismo tiempo el bienestar
del otro no sólo depende de su decisión sino también depende de mi decisión.

Este capítulo se concentra en los juegos simultáneos o de información


imperfecta. Esto quiere decir que cuando las personas (en adelante jugadores)
tomen sus decisiones (en adelante jugadas) lo harán de manera simultánea, es
decir, sin conocimiento de la estrategia que está tomando el resto de los jugadores.

Es muy importante considerar que cuando se habla de juegos simultáneos, la clave


está en la falta de información más que en el timing. No es condición necesaria que
dos jugadores decidan una estrategia en el mismo segundo para que el juego sea
considerado simultáneo. La condición es que los jugadores no conozcan la
estrategia decidida por el otro al momento de elegir su estrategia. En otras palabras,
los jugadores deciden sus estrategias con información imperfecta.

Se supone que el bienestar de los jugadores puede ser cuantificado en ganancias.


La función de ganancias es aquella que determina la ganancia de un jugador como
resultado de la combinación de estrategias elegidas por él y por el resto de los
jugadores. Es una condición necesaria que las ganancias estén expresadas en
números de manera que éstos se puedan ordenar.

Los jugadores tienen información completa1, es decir, conocen la función de


ganancias de cada jugador.

Los jugadores son racionales en el sentido que buscan maximizar sus ganancias.

Los jugadores tienen conocimiento común respecto a dos aspectos:

1. Todos los jugadores conocen la función de ganancias; cada jugador sabe que
todos conocen las funciones de ganancias; y todos los jugadores saben que

1 No confundir con información perfecta.

7
Apuntes Docentes de Teoría de Juegos

todos los jugadores saben que todos los jugadores conocen las funciones de
ganancias.
2. Los jugadores son racionales; los jugadores saben que todos los jugadores son
racionales; y los jugadores saben que todos los jugadores saben que todos los
jugadores saben que son racionales.

El concepto clave que se aprenderá en este capítulo es el equilibrio de Nash donde


cada jugador elige su mejor estrategia dada las mejores estrategias del resto de los
jugadores.

2.6. Representación normal o estratégica de un juego simultáneo


La representación estratégica de un juego simultáneo G requiere cumplir tres
condiciones:
1° La determinación del conjunto J = {1, 2, …, n} de jugadores donde un jugador
arbitrario es llamado jugador i. El resto de los jugadores distintos a i se denotan –i.
2° La definición del conjunto de estrategias puras Si de cada jugador i de J. El
elemento si es un miembro arbitrario de Si, es decir, una estrategia que pertenece al
conjunto estratégico del jugador i, donde si ∈ Si.
3° La determinación de la función de ganancias Ui de cada jugador i. Cada
combinación de estrategias le reporta una determinada ganancia. Por lo tanto, Ui =
U (s1, s2, …, si, …, sn), es decir, la ganancia del jugador i es función de su propia
estrategia (si) y de las estrategias del resto de los jugadores (s-i).
En resumen, una representación estratégica de un juego G de n jugadores se
denota:
G = {S1, S2, …, Sn; u1, u2, …, un}

Ejemplo 2.1.- El juego de las notas2.

Instrucciones: Suponga un juego entre dos jugadores. Ambos jugadores deben


decidir de manera simultánea entre la estrategia α y la estrategia β. Las ganancias
de cada uno dependen de la combinación de estrategias:

2 Este ejemplo fue tomado del curso de Polack (2007).

8
Apuntes Docentes de Teoría de Juegos

1.- Si el jugador uno elige α y el jugador dos elige β, el jugador uno obtendrá una
nota A y el jugador dos obtendrá una nota C.

2.- Si ambos jugadores eligen la estrategia α, ambos obtendrán una nota B-.

3.- Si ambos jugadores eligen la estrategia β, ambos obtendrán una nota B+.

4.- Si el jugador uno elige β y el jugador dos elige α, el jugador uno obtendrá una
nota C y el jugador dos obtendrá una nota A.

Para comenzar, se representan los resultados anteriores en dos matrices de


resultados. La figura 2.1 sintetiza las notas del jugador uno y la matriz 2.2 sintetiza
las notas del jugador dos.

2 2
1 α β 1 α β

α B- A α B- C

β C B+ β A B+

Figura 2.1 Figura 2.2

Para continuar fusionaremos ambas matrices en una matriz única:


2
1 α β

α B-,B- A,C

β C,A B+,B+

Figura 2.3

Note en primer lugar, que estas matrices son de resultados y no de ganancias


(recuerde que las ganancias deben ser expresadas en números). Por lo tanto, aún
no hemos representado el juego ya que falta la tercera condición.

9
Apuntes Docentes de Teoría de Juegos

La primera conclusión es que resultados no es igual a ganancias. Las ganancias


se representan con números y estos números representan utilidades o “útiles”.

Para avanzar en la representación del juego se procederá a valorizar (de manera


arbitraria) los resultados:

Resultados Ganancias jugador 1 Ganancias jugador 2


(A,C) 3 -1
(B+,B+) 1 1
(B-,B-) 0 0
(C,A) -1 3
Figura 2.4

Si ambos hubiesen elegido la estrategia α, ambos hubiesen obtenido un resultado


B-. Esa combinación de resultados es valorada de la misma forma por ambos
jugadores: ambos hubiesen valorizado dichos resultados con una ganancia de 0.

En cambio, si el jugador uno eligió la estrategia α y el jugador dos eligió la estrategia


β, el jugador uno obtiene una nota A y el jugador dos una nota C. Esa combinación
de resultados es valorizada de forma diferente por ambos jugadores: el jugador uno
percibe una ganancia de tres útiles mientras que el jugador dos recibe una ganancia
de menos un útil.

Ahora que se han valorizado los resultados, se tienen los tres ingredientes
necesarios (los jugadores, las estrategias y las ganancias) para representar el juego
en forma estratégica. Para eso se recurre a la matriz de ganancias:

2
1 α β

α 0,0 3,-1

β -1,3 1,1

Figura 2.5

10
Apuntes Docentes de Teoría de Juegos

Para entender la matriz considere:

1.- El jugador uno es el jugador fila y el jugador dos es el jugador columna.

2.- El número antes de la coma corresponde a la ganancia del jugador uno y el


número después de la coma corresponde a la ganancia del jugador dos.

3.- Cada combinación de estrategias representada en los cuadrantes de la matriz


corresponde a un perfil estratégico. Nuestro ejemplo tiene cuatro perfiles
estratégicos: (α, α), (α, β), (β, α) y (β, β).

4.- A cada perfil estratégico le corresponde una ganancia para cada jugador:

U1 (α, α) = 0: la ganancia del jugador uno correspondiente al perfil (α, α) es cero.


U1 (α, β) = 3: la ganancia del jugador uno correspondiente al perfil (α, β) es tres.
U1 (β, α) = -1: la ganancia del jugador uno correspondiente al perfil (β, α) es menos
uno.
U1 (β, β) = 1: la ganancia del jugador uno correspondiente al perfil (β, β) es uno.

U2 (α, α) = 0: la ganancia del jugador dos correspondiente al perfil (α, α) es cero.


U2 (α, β) = -1: la ganancia del jugador dos correspondiente al perfil (α, β) es menos
uno.
U2 (β, α) = 3: la ganancia del jugador uno correspondiente al perfil (β, α) es tres.
U2 (β, β) = 1: la ganancia del jugador uno correspondiente al perfil (β, β) es uno.

Pregunta 2.1

¿Si usted fuese el jugador uno, que estrategia elegiría?

2.7. Estrategias dominadas

Una estrategia estrictamente dominada es aquella que, independientemente lo


que juegue el otro jugador, arroja una ganancia estrictamente menor en
comparación a la ganancia que entrega jugar otra estrategia.

11
Apuntes Docentes de Teoría de Juegos

Una estrategia 𝑠𝑖´ está estrictamente dominada por la estrategia 𝑠𝑖" cuando la
desigualdad estricta:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) < 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )

se cumple para toda combinación de estrategias 𝑠−𝑖 (las estrategias del resto de los
jugadores, es decir, de todos los jugadores menos el jugador i).

Se dice que una estrategia 𝑠𝑖´ está débilmente dominada por la estrategia 𝑠𝑖" cuando
la desigualdad débil:
𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 ) ≤ 𝑈𝑖 (𝑠𝑖" , 𝑠−𝑖 )

se cumple para toda combinación de estrategias 𝑠−𝑖 , es decir, al jugador i le


conviene elegir la estrategia 𝑠𝑖" al menos tanto como la estrategia 𝑠𝑖´ .

Volviendo a la figura 2.5 se puede concluir que para ambos jugadores la estrategia
β es estrictamente dominada por la estrategia α. Analicemos porqué:

El jugador uno reflexionará: “si el jugador dos juega α entonces me convendrá jugar
α y no β porque la ganancia que obtengo es cero que es mayor que menos uno. Y
si el jugador dos juega β entonces me convendrá jugar α y no β porque la ganancia
que obtengo es tres que es mayor que uno”.

Es decir, independientemente si el jugador dos juega α o β, al jugador uno le


convendrá jugar α: la estrategia β está estrictamente dominada por la estrategia α
o, en otras palabras, la estrategia α domina a la estrategia β.

Analice en segundo lugar al jugador dos. Éste reflexionará: “si el jugador uno juega
α entonces me convendrá jugar α y no β porque la ganancia que obtengo es cero
que es mayor que menos uno. Y si el jugador uno juega β entonces me convendrá
jugar α y no β porque la ganancia que obtengo es tres que es mayor que uno”.

Es decir, independientemente si el jugador uno juega α o β, al jugador dos le


convendrá jugar α: la estrategia β está estrictamente dominada por la estrategia α
o, en otras palabras, la estrategia α domina a la estrategia β.

12
Apuntes Docentes de Teoría de Juegos

Ahora bien, si el jugador uno “se pone en los zapatos” del jugador dos, reflexionará
que éste, que es un jugador racional que busca maximizar sus ganancias, no jugará
nunca la estrategia β porque la ganancia que obtiene al jugar aquella estrategia es
menor que la que obtendría al jugar la estrategia α, independientemente de lo que
él juegue.

Al mismo tiempo, si el jugador dos “se pone en los zapatos” del jugador uno,
reflexionará que éste tampoco jugará la estrategia β porque la ganancia que obtiene
al jugar aquella estrategia es menor que la que obtendría al jugar la estrategia α,
independientemente de lo que él juegue.

La segunda conclusión es que jugadores racionales no jugarán nunca una


estrategia estrictamente dominada porque las ganancias que obtienen de jugar
estrategias dominadas son estrictamente menores que las que se obtienen de las
otras estrategias, independientemente de lo que jueguen el resto de los jugadores.

Esta conclusión permite desarrollar un método para resolver algunos tipos de


juegos. El método consiste en la eliminación iterada de estrategias dominadas.

2.8. Eliminación iterada de estrategias dominadas.

Si jugadores racionales no jugarán nunca estrategias dominadas entonces se


pueden eliminar de sus conjuntos estratégicos factibles. En el ejemplo, si ninguno
de los dos jugadores jugará la estrategia β entonces ésta se puede eliminar del
conjunto estratégico factible de ambos:
2
1 α β
3,-1
α 0,0

β -1,3 1,1

Figura 2.6

13
Apuntes Docentes de Teoría de Juegos

De esta forma, al eliminar las estrategias que nunca se jugarán el juego se puede,
en primer lugar, representar de una forma mucho más sencilla y, en segundo lugar,
permite obtener una solución.

2
1 α

α 0,0

Figura 2.6.1

La solución del juego es el perfil estratégico {α, α} que lleva asociado una ganancia
de (0, 0). Cuando, luego de eliminar de manera iterada todas las estrategias
dominadas sobrevive sólo un perfil estratégico dicho perfil es un equilibrio de Nash.

Aunque no se entra aún en la definición de un equilibrio de Nash, podemos


adelantar su principal característica: el equilibrio de Nash es un equilibrio estable,
es decir, los jugadores no tienen incentivo a desviarse de su decisión.

Si el jugador uno decidiese cambiar su decisión y en vez de elegir α eligiese β, su


ganancia caería de cero a menos uno. Al mismo tiempo, si el jugador dos decidiese
cambiar su decisión, su ganancia caería a menos uno. En conclusión, ninguno de
los jugadores tiene incentivos a desviarse de su decisión.

Note que la solución del juego es una solución sub óptima: ambos jugadores podrían
estar mejor si el equilibrio hubiese sido {β, β}. Las ganancias asociadas a dicho
equilibrio hubiesen sido (1, 1) mayores a (0, 0).

Una característica fundamental del equilibrio {β, β}, que se puede considerar un
equilibrio cooperativo, es que es un equilibrio inestable: ambos jugadores tienen
incentivo a desviarse.

Observe que si el jugador uno se desvía de β a α (y el jugador dos mantiene su


elección en α), las ganancias del primero aumentan de uno a tres (por lo tanto, tiene
un incentivo a desviarse) y las ganancias del otro disminuyen de uno a menos uno.

14
Apuntes Docentes de Teoría de Juegos

Al mismo tiempo, si el jugador dos se desvía de β a α (y el jugador uno mantiene su


elección en α), las ganancias del primero aumentan de uno a tres (por lo tanto,
también tiene un incentivo a desviarse) y las ganancias del otro disminuyen de uno
a menos uno.

Tercera conclusión: en algunas ocasiones, elecciones racionales (ningún jugador


jugará estrategias dominadas) puede llevar a equilibrios no eficientes o sub-óptimos
en el sentido de Pareto.

El juego que se acaba de analizar pertenece a la familia de los juegos de dilema


(del prisionero). Su principal característica es que la solución es peor para ambos
jugadores que la solución cooperativa (que no es equilibrio de Nash) en la cual cada
jugador juega una estrategia dominada.

Pregunta 2.2.
¿Cómo se pueden lograr equilibrios cooperativos de largo plazo?3

Ejercicio resuelto 2.1.


Encuentre y elimine las estrategias dominadas del siguiente juego:
2
1 L M R

U 4,3 5,1 6,2

M 2,1 8,4 3,6

D 3,0 9,6 2,8

Figura 2.7

Observe en primer lugar que las estrategias del jugador uno son {U, M, D} y las
estrategias del jugador dos son {L, M, R}. Las ganancias de cada uno dependen de

3Para estudiar en profundidad las soluciones cooperativas del dilema del prisionero, revisar Axelrod,
R. (1985).

15
Apuntes Docentes de Teoría de Juegos

la combinación de estrategias elegidas por ambos jugadores. Por ejemplo, si el


jugador uno elige U y el jugador dos elige R, la ganancia del jugador uno es 6 y la
ganancia del jugador es 2.

Para determinar las estrategias dominadas, comience por el jugador uno de acuerdo
al siguiente razonamiento:

 Compare U y M: si el jugador dos juega L, U domina a M porque la ganancia de


4 es mayor que 2. Sin embargo, si el jugador dos juega M, M domina a U porque
8 es mayor que 4. Por lo tanto, podemos concluir que U no es una estrategia
dominada por M y que M no es una estrategia dominada por U porque
dependiendo de lo que juegue el jugador dos, al jugador uno le convendrá jugar
U o M.
 Compare M y D: si el jugador dos juega L, D domina a M porque 3 es mayor que
2. Si el jugador dos juega M, D domina a M porque 9 es mayor que 8. Sin
embargo, si el jugador dos juega R, M domina a D porque 3 es mayor que 2. Por
lo tanto, podemos concluir que la estrategia M no domina a la estrategia D y que
la estrategia D no domina a la estrategia M.
 Compare U y D: si el jugador dos juega L, U domina a D porque 4 es mayor que
3. Si el jugador dos juega M, D domina a U porque 9 es mayor que 5. Por lo tanto,
podemos concluir que la estrategia U no domina a la estrategia D y que la
estrategia D no domina a la estrategia U.

Preliminarmente se concluye que el jugador uno no tiene estrategias dominadas.

Continúe analizando las posibles estrategias dominadas del jugador dos utilizando
el mismo razonamiento:

 Compare L y M. Si el jugador uno juega U, L domina a M porque 3 es mayor que


1. Sin embargo, si el jugador uno juega M, M domina a L porque 4 es mayor que
1. Por lo tanto, podemos concluir que la estrategia L no domina la estrategia M y
que la estrategia M no domina a la estrategia L.
 Compare L y R. Si el jugador uno juega U, L domina a R porque 3 es mayor que
2. Sin embargo, si el jugador uno juega M, R domina a L porque 6 es mayor que

16
Apuntes Docentes de Teoría de Juegos

1. Por lo tanto, la estrategia L no domina a la estrategia R y la estrategia R no


domina a la estrategia L.
 Compare M y R. Si el jugador uno juega U, M es dominada por R porque 1 es
menor que 2. Si el jugador uno juega M, M es dominada por R porque 4 es menor
que 6. Si el jugador uno juega D, M es dominada por R porque 6 es menor que
8. Observe que la estrategia M es dominada por la estrategia R porque la
ganancia que obtiene el jugador dos es menor, independientemente de lo que
juegue el jugador uno.

Como se supone que el jugador dos es un jugador racional se deduce que no jugará
una estrategia dominada. Por lo tanto, se puede eliminar de su conjunto estratégico
la estrategia M. Al eliminar M, el juego queda representado de la siguiente forma:

2
1 L R

U 4,3 6,2

M 2,1 3,6

D 3,0 2,8

Figura 2.7.1

El concepto de iteración sugiere que se debe seguir en la búsqueda de estrategias


dominadas.

 Compare U y M. Si el jugador dos juega L, la estrategia U domina a la estrategia


M porque 4 es mayor que 2. Si el jugador dos juega R, la estrategia U domina a
la estrategia M porque 6 es mayor que 3. Concluimos entonces que la estrategia
U domina a la estrategia M porque independientemente de lo que juega el jugador
dos (L o R) la ganancia que obtiene el jugador uno es mayor cuando juega U en

17
Apuntes Docentes de Teoría de Juegos

vez de M. Es interesante recordar que antes de la eliminación de la estrategia M


del conjunto estratégico del jugador dos, el jugador uno no tenía estrategias
dominadas.

Como se supone que el jugador uno no jugará una estrategia dominada, el juego se
puede representar de una forma reducida:

2
1 L R

U 4,3 6,2

D 3,0 2,8

Figura 2.7.2

Continúe el proceso:
 Compare U y D. Si el jugador dos juega L, U domina a D. Si el jugador dos juega
R, U domina a D. Por lo tanto, D es una estrategia dominada por U porque
independientemente de lo que juegue el jugador dos (L o R), la ganancia que
obtiene el jugador uno al jugar D es menor que la que obtiene de jugar U.

2
1 L R

U 4,3 6,2

Figura 2.7.3

Continúe:
 Compare L y R. Si el jugador uno juega U, la estrategia L domina a la estrategia
R porque la ganancia de 3 es mayor que 2. Al eliminar esta última estrategia
dominada sobrevive un único perfil estratégico:

18
Apuntes Docentes de Teoría de Juegos

2
1 L

U 4,3

Figura 2.7.4

El perfil estratégico {U, L} es el único que sobrevivió al proceso de eliminación


iterada de estrategias dominadas y, por lo tanto, es un equilibrio de Nash. El
equilibrio de Nash trae asociado ganancias de 4 y 3 para el jugador uno y dos,
respectivamente.

Tarea 2.1.

Compruebe en el juego original que ninguno de los dos jugadores tiene incentivo a
desviarse desde el equilibrio {U, L}.

Ejercicio 2.1: Suponga treinta jugadores que deben elegir, de manera simultánea,
es decir, con información imperfecta, un número entre el uno y el cien. El ganador
será aquel jugador que elija el número más cercano a dos tercios del promedio. Por
ejemplo, si el promedio es 30, el ganador será aquel jugador que haya elegido el
número más cercano a 20 (2/3 por 30 = 20). Por eliminación de estrategias
dominadas y “poniéndose en los pantalones del otro”, resuelva el equilibrio de Nash.

2.9. Aplicaciones sobre eliminación iterada de estrategias dominadas.

Primera Aplicación: Teorema del votante mediano

Suponga dos candidatos (jugadores) a una elección popular. Cada candidato debe
decidir entre diez posiciones (estrategias) del espectro político.

1 2 3 4 5 6 7 8 9 10

La posición número 1 representa la posición de extremo izquierda y la posición 10


la extrema derecha. En cada posición hay un 10% de los votos. Los electores votan

19
Apuntes Docentes de Teoría de Juegos

por el candidato más cercano a su posición política. Si ambos candidatos se ubican


en la misma posición el número de votos se reparte en partes iguales.

Ejemplos:

 Si ambos candidatos se ubican en la posición 1, ambos obtendrían el 50% de los


votos.
 Si el candidato uno se ubica en la posición 1 y el candidato dos se ubica en la
posición 2, el candidato uno obtiene el 10% de los votos y el candidato dos, el
90% de los votos.
 Si el candidato uno se ubica en la posición 1 y el candidato dos en la posición 3,
el candidato uno obtendría el 15% de los votos (10% de la posición 1 más el 5%
de la posición 2) y el candidato dos obtendría el 85% de los votos (5% de la
posición 2 más 80% de las posiciones 3 a 10).

Las ganancias de cada candidato son el porcentaje de votos. Como ambos son
racionales, tienen como objetivo maximizar la votación.

Solución:

1° Determinar si la posición 2 domina a la posición 1:

U1 (1,1) = 50% < U1 (2,1) = 90%


U1 (1,2) = 10% < U1 (2,2) = 50%
U1 (1,3) = 15% < U1 (2,3) = 20%
U1 (1,4) = 20% < U1 (2,4) = 25%
… …
U1 (1,10) = 50% < U1 (2,10) = 55%

Observe que independientemente donde se ubique el candidato dos, la votación


que obtiene el candidato uno por ubicarse en la posición 2 es siempre mayor que la
votación que obtiene al ubicarse en la posición 1. Por lo tanto, se puede concluir
que la posición 2 domina a la posición 1. Por simetría, se puede deducir que la
posición 9 domina la posición 10. Esto implica que las posiciones 1 y 10 pueden ser
eliminadas del conjunto estratégico de los candidatos.

20
Apuntes Docentes de Teoría de Juegos

2° Antes de eliminar la posición 1, determinar si la posición 3 domina a la posición 2:

U1 (2,1) = 90% > U1 (3,1) = 85%

Sólo con este paso es suficiente para determinar que, antes de eliminar la posición
1, la posición 3 no domina a la posición 2. Esto porque la ganancia del candidato
uno, asumiendo que el candidato dos se ubica en la posición 1, es mayor por
ubicarse en la posición 2 que en la 3.

3° Luego de eliminar la posición 1 y 10, determinar si la posición 3 (y 8) domina a la


posición 2 (y 9):

Ahora el conjunto estratégico de los candidatos está reducido al siguiente espectro.

2 3 4 5 6 7 8 9

Hay que aclarar que lo que se eliminó fueron las estrategias 1 y 10. No se eliminan
los votantes que se sienten identificados con dichas posiciones políticas. Esto
implica que el universo electoral sigue siendo el mismo. En este caso, los votantes
de la posición 1 y 10, votarán por el candidato que se ubique más cerca de sus
preferencias.

U1 (2,2) = 50% < U1 (3,2) = 80%

U1 (2,3) = 20% < U1 (3,3) = 50%

U1 (2,4) = 25% < U1 (3,4) = 30%

U1 (2,5) = 30% < U1 (3,5) = 35%


… …
U1 (2,9) = 50% < U1 (3,9) = 55%

Observe que luego de eliminar la estrategia 1, la estrategia 2 es dominada por la


estrategia 3. Independientemente de la estrategia que decida el candidato dos, la
ganancia que obtiene el candidato uno al ubicarse en la posición 3 es mayor a la
ganancia que obtiene al ubicarse en la posición 2. Por simetría, se puede deducir
que la estrategia 8 domina a la estrategia 9.

21
Apuntes Docentes de Teoría de Juegos

Por racionalidad, se deduce que los candidatos no utilizarán las estrategias 2 y 8


porque son dominadas. En virtud esto, ambas estrategias pueden ser eliminadas.

Si continuamos iterando, las únicas estrategias que sobrevivirán serán las


estrategias 5 y 6. En este caso, aquellas estrategias son un equilibrio de Nash.

Segunda Aplicación: Modelo de locación4

Suponga que Pat y Cris son dos vendedores de helado (jugadores) que trabajan en
la misma playa. La playa está dividida en nueve sectores. Debido a que necesitan
electricidad, deben decidir de manera independiente y simultánea, donde
localizarse. El día anterior deben llamar a la administración e informar en cual sector
se ubicarán (estrategias).

1 2 3 4 5 6 7 8 9

El precio de los helados es el mismo y cada uno gana una comisión de $25 por
helado. La demanda está estimada en 500 helados por sector. Si un vendedor
atiende a un sector y vende 500 helados, sus ventas serán de $12.500. Como los
helados son iguales, los consumidores deciden comprar en el lugar más cercano al
que están ubicados. Si los consumidores son indiferentes, asuma que comprarán
250 helados a Pat y 250 helados a Cris.

Por ejemplo:

 Si Pat se localiza en el sector 3 y Cris en el sector 8, entonces Pat venderá a


todos los consumidores localizados en los sectores 1 a 5, y Cris venderá a todos
los consumidores ubicados en los sectores 6 a 9.

Solución:

1° Determinar si el sector 2 domina al sector 1:

4 Para más detalles ver Watson, J. (2008).

22
Apuntes Docentes de Teoría de Juegos

UP (1,1) = 56.250 < UP (2,1) = 100.000


UP (1,2) = 12.500 < UP (2,2) = 56.250
UP (1,3) = 18.750 < UP (2,3) = 25.000
UP (1,4) = 25.000 < UP (2,4) = 31.250
… …
UP (1,9) = 56.250 < UP (2,9) = 62.500

Observe que independientemente donde se ubique Cris, la ganancia de Pat al


ubicarse en el sector 2 es mayor a la ganancia que obtiene al ubicarse en el sector
1. Se concluye que para Pat la estrategia 1 es dominada por la estrategia 2 para
ambos jugadores. Por simetría podemos deducir que la estrategia 9 es dominada
por la estrategia 8 para ambos jugadores.

Utilizando el método de la eliminación de estrategias dominadas, el conjunto


estratégico de ambos jugadores (que se supone no jugarán estrategias dominadas)
se reduce a:

2 3 4 5 6 7 8

Al igual que en la aplicación anterior se debe recalcar que los consumidores de los
sectores 1 y 9 seguirán comprando helados. Lo que se ha eliminado son dos
estrategias posibles, no porque las estrategias no sigan estando presentes, sino
porque suponemos que jugadores racionales no jugarán estrategias dominadas.

2° Determinar si el sector 3 domina al sector 2.

UP (2,2) = 56.250 < UP (3,2) = 100.000


UP (2,3) = 25.000 < UP (3,3) = 56.250
UP (2,4) = 31.250 < UP (3,4) = 25.000
UP (2,5) = 37.500 < UP (3,5) = 31.250
… …
UP (2,8) = 56.250 < UP (3,8) = 62.500

23
Apuntes Docentes de Teoría de Juegos

Se observa que independientemente donde se ubique Cris, la ganancia que obtiene


Pat al ubicarse en el sector 3 es mayor que la ganancia que obtiene al ubicarse en
el sector 2. Lo mismo se puede deducir respecto a Cris: independientemente donde
se ubique Pat, la ganancia que obtiene al ubicarse en el sector 3 es mayor que la
ganancia que obtiene al ubicarse en el sector 2. Por simetría, se concluye que, para
ambos jugadores, la ganancia de ubicarse en el sector 7 es mayor que la ganancia
que tienen de ubicarse en el sector 8.

La conclusión es que las estrategias 2 y 8 son estrategias dominadas y como


asumimos que Pat y Cris son racionales podemos deducir que ninguno jugará
aquellas estrategias. El conjunto estratégico se reduce a:

3 4 5 6 7

Continuando con el proceso iterativo de determinar y eliminar estrategias


dominadas, llegamos a que la solución es que ambos jugadores jugarán la
estrategia 5. Como este es el único perfil estratégico que sobrevivió a la eliminación
iterada de estrategias dominadas, este perfil es un equilibrio de Nash.

Tarea 2.2

El dilema del viajero

Una compañía aérea pierde dos maletas pertenecientes a dos viajeros diferentes.
Ambas maletas resultan ser idénticas y contienen artículos idénticos. El gerente de
la línea aérea encargada de resolver las reclamaciones de los viajeros explica que
la compañía aérea es responsable por un máximo de $100.000 por maleta (él es
incapaz de averiguar directamente el precio de los artículos), y con el fin de
determinar un valor honesto de tasación de la mercancía, el gerente de
reclamaciones separa a los viajeros para que no puedan acordar nada, y les pide
que escriban un valor de la maleta mayor a $20.000 y menor de $100.000. También
les dice, si ambos escriben el mismo número, él va a tratar ese número como el
valor monetario real de las maletas y reembolsará a los viajeros dicha cantidad. Sin
embargo, si uno escribe un número más pequeño que el otro, este número más

24
Apuntes Docentes de Teoría de Juegos

pequeño se tomará como el valor verdadero, y cada uno de los viajeros recibirá esa
cantidad junto con una recompensa o un castigo de $20.000: el viajero que escribió
el valor más bajo recibirá el valor más bajo más una recompensa de $20.000 y la
persona que escribió la cantidad más alta recibirá el valor más bajo menos una
deducción de $20.000.

¿Qué valor (estrategia) debe seguir cada uno de los viajeros?

2.10 El método de la mejor respuesta

En ocasiones hay juegos en que los jugadores no tienen estrategias dominadas o


bien si las tienen, la eliminación iterada de éstas no permite llegar a un perfil único.
En tales casos, la eliminación de estrategias dominadas pierde eficiencia como
método para encontrar el equilibrio de Nash.

Por ejemplo, observe el siguiente juego:

2
1 L C R

T 5,-1 11,3 0,0

B 6,4 0,2 2,0

Figura 2.8

Observe en primer lugar que el jugador uno no tiene estrategias dominadas. En el


caso del jugador dos, la estrategia C domina a la estrategia R. En tal caso, podemos
eliminar del conjunto estratégico del jugador dos la estrategia R y representar el
juego en una forma reducida:

25
Apuntes Docentes de Teoría de Juegos

2
1 L C

T 5,-1 11,3

B 6,4 0,2

Figura 2.8.1

Luego de eliminar la estrategia R, se llega al hecho que ninguno de los dos


jugadores tiene estrategias dominadas. Como es obvio, si no hay estrategias
dominadas el método de la eliminación pierde mucho de su valor.

La cuarta conclusión es que cuando sobrevive más de un perfil estratégico a la


eliminación iterada de estrategias dominadas, porque no hay estrategias dominadas
ni dominantes, el proceso puede producir predicciones no adecuadas.

La pregunta es cómo resolver el juego. Para eso nos basaremos en el concepto de


la racionabilidad y utilizaremos el método de la mejor respuesta. El método
consiste en encontrar la mejor respuesta de los jugadores ante todas las estrategias
factibles de ser jugadas por el resto de los jugadores.

Una estrategia 𝑠̂𝑖 es una mejor respuesta (𝑅𝑖 ) respecto a la estrategia 𝑠𝑖´ para el
jugador i ante la estrategia 𝑠−𝑖 del resto de los jugadores si se cumple que la
ganancia de jugar 𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ :

𝑈𝑖 (𝑠̂ 𝑖 , 𝑠−𝑖 ) > 𝑈𝑖 (𝑠𝑖´ , 𝑠−𝑖 )

También se puede expresar que la estrategia 𝑠̂𝑖 resuelve el problema de


optimización:
Max 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
𝑠𝑖

Al igual que el concepto de dominancia estricta, el concepto de racionabilidad


impone restricciones a los juegos.

26
Apuntes Docentes de Teoría de Juegos

Ambos procesos funcionan bajo el supuesto de que la estructura del juego


(conjuntos estratégicos y funciones de ganancias) y la racionalidad de los jugadores
son de conocimiento común.

Mientras la eliminación iterada de estrategias dominadas supone que los jugadores


no jugarán estrategias dominadas; la racionabilidad supone que los jugadores
jugarán aquellas estrategias que son la mejor respuesta a las creencias que ellos
podrían tener acerca de las estrategias jugadas por el resto de los jugadores.

De lo anterior se puede deducir que los jugadores no jugarán una estrategia que no
sea la mejor respuesta a las creencias que tengan acerca de las estrategias del
resto de los jugadores. Además, se debe suponer que los jugadores supondrán que
el resto de los jugadores también jugarán una mejor respuesta.

Una estrategia dominada nunca es una estrategia de mejor respuesta y al mismo


tiempo, una estrategia de mejor respuesta no es nunca una estrategia dominada.

El conjunto de estrategias racionalizables (o de mejor respuesta) está contenido en


el conjunto de estrategias que sobreviven a la eliminación iterada de dominancia.

Para entender mejor el método vuelva a la figura 2.8.1. En esta figura están las
estrategias que sobrevivieron a la eliminación de estrategias dominadas. El método
de la mejor respuesta consiste en:

 El jugador uno se pregunta, ¿cuál es mi mejor respuesta si el jugador dos juega


L? La mejor respuesta es jugar B porque la ganancia que entrega es 6 que es
mayor a 5 que es la ganancia que obtendría si jugara T. En la matriz se subraya
la ganancia asociada a la mejor respuesta (note que el jugador dos se preguntará,
¿cuál es la mejor respuesta del jugador uno si yo juego L?).
 El jugador uno se pregunta, ¿cuál es mi mejor respuesta si el jugador dos juega
C? La mejor respuesta es jugar T porque la ganancia que entrega es 11 que es
mayor a 0 que es la ganancia que obtendría si jugara B. En la matriz se subraya
la ganancia a la mejor respuesta.
 El jugador dos se pregunta, ¿cuál es mi mejor respuesta si el jugador uno juega
T? La mejor respuesta es jugar C porque la ganancia que entrega es 3 que es

27
Apuntes Docentes de Teoría de Juegos

mayor a -1 que es la ganancia que obtendría si jugara L. En la matriz se subraya


la ganancia asociada a la mejor respuesta.
 El jugador dos se pregunta, ¿cuál es mi mejor respuesta si el jugador uno juega
B? La mejor respuesta es jugar L porque la ganancia que entrega es 4 que es
mayor a 2 que es la ganancia que obtendría si jugara C. En la matriz se subraya
la ganancia asociada a la mejor respuesta.

2
1 L C

T 5,-1 11,3

B 6,4 0,2

Figura 2.8.2

En el juego se han encontrado dos perfiles estratégicos que cumplen con una
característica esencial: las estrategias elegidas por los jugadores constituyen las
mejores respuestas ante las mejores respuestas de los otros jugadores.

Tal definición corresponde a un equilibrio de Nash. Luego de encontrar un


equilibrio de Nash, ningún jugador tiene incentivos a desviarse de su decisión: el
equilibrio es estratégicamente estable.

Decir que la solución no es un equilibrio de Nash es equivalente a decir que existe


al menos un jugador que no jugó su mejor respuesta y, por lo tanto, aquel jugador
tiene incentivo para desviarse de su decisión.

En nuestro ejemplo, hay dos equilibrios de Nash. Observe que desde ninguno de
los equilibrios los jugadores tienen incentivo a desviarse.

En un juego G, las estrategias (𝑠1∗ , … , 𝑠𝑛∗ ) son un equilibrio de Nash si, para cada
jugador i, 𝑠𝑖∗ es, al menos, la mejor respuesta a las estrategias especificadas por el
resto de los jugadores tal que:
𝑈𝑖 (𝑠𝑖∗ , 𝑠−𝑖
∗ ∗
) > 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )

28
Apuntes Docentes de Teoría de Juegos

En otra forma, la estrategia 𝑠𝑖∗ resuelve el problema de optimización:


Max 𝑈𝑖 (𝑠𝑖 , 𝑠−𝑖 )
𝑠𝑖 ∈ 𝑆𝑖

Quinta conclusión: el equilibrio de Nash entrega una solución más fuerte que el
concepto de estrategias dominadas ya que puede haber estrategias que superen la
eliminación y no ser un equilibrio de Nash; en cambio un equilibrio de Nash implica
que las estrategias si superan la eliminación iterada de estrategias dominadas.

Sexta conclusión: el equilibrio de Nash es estratégicamente estable. Esto implica


que ningún jugador tiene incentivos a desviarse de sus decisiones.

Séptima conclusión: En juegos con jugadores y estrategias finitas siempre existe


al menos un equilibrio de Nash, ya sea en estrategias puras y/o estrategias mixtas 5.

Ejercicio 2.2.
Considere el siguiente juego6:

2
1 L C R

T 0,4 4,0 5,3

M 4,0 0,4 5,3

B 3,5 3,5 6,6

Figura 2.9

a) Encuentre estrategias dominadas.


b) Encuentre el o los equilibrios de Nash a través del método de la mejor respuesta.

5 Más adelante se repasará el concepto de estrategias mixtas.


6 La solución a este juego está en el capítulo uno de Gibbons, R.

29
Apuntes Docentes de Teoría de Juegos

2.11. Juegos de coordinación

Vuelva por un momento al ejemplo 2.1. En aquel ejemplo, los jugadores debían
elegir entre α y β. La combinación de estrategias llevaba asociada diversos
resultados para cada uno de los jugadores:

2
1 α β

α B-,B- A,C

β C,A B+,B+

Figura 2.10

Se decía que aquella representación no constituía un juego porque faltaba uno de


los tres ingredientes necesarios para representar un juego en forma estratégica. El
ingrediente faltante eran las ganancias que debían ser expresadas en números de
manera que pudiesen ordenarse. Aquella tarea se hizo valorando para cada jugador
(de manera arbitraria) los resultados obtenidos7.

En esta sección se supondrá que los jugadores tienen valoraciones diferentes.


Antes se supuso que los jugadores no tenían preocupación por las notas que
obtenían los compañeros. En su curso el profesor Polack (2007) los llama con una
nota de humor “diablos despiadados”.

Ahora supondremos que los jugadores (el profesor Polack los llama “ángeles
indignados”) tienen una legítima preocupación por sus notas, pero también tienen
una preocupación por los resultados que obtienen los compañeros.

En este caso, la ganancia del ángel se ve alterada por alguna emoción como la rabia
o la culpa. La nueva valoración de ganancias se sintetiza en la siguiente figura:

7 Ver figura 2.5

30
Apuntes Docentes de Teoría de Juegos

Resultados Ganancias jugador 1 Ganancias jugador 2


(A,C) -1 -3
(B+,B+) 1 1
(B-,B-) 0 0
(C,A) -3 -1
Figura 2.11

Aunque esta valoración sigue siendo arbitraria y tiene un estricto objetivo


metodológico, se intentará una justificación:

 (A, C) = -1 se obtiene de la suma de +3 + (-4), donde la ganancia +3 es porque


el estudiante valora de esa forma haber obtenido una A y la ganancia -4 es por
la “culpa” que siente porque su compañera obtuvo una C. La “culpa” es porque
supone que la compañera actuó bajo la creencia que también elegiría β.
 (C, A) = -3 se obtiene de la suma de -1 + -2, donde la ganancia -1 es porque el
estudiante valora de esa forma haber obtenido una C y la ganancia -2 es por la
“indignación” que siente porque su compañera obtuvo una A “a costa” de que ella
ingenuamente eligió β bajo la creencia que ella también elegiría β.

Tenga presente que este es una simulación. Dicho eso, con los resultados
valorizados, el juego se puede representar en forma estratégica.

Primera Variante: ángel versus ángel

2
1 α β

α 0,0 -1,-3

β -3,-1 1,1

Figura 2.12

Este juego es totalmente distinto al juego de la figura 2.5. El presente juego tiene
tres características:

31
Apuntes Docentes de Teoría de Juegos

1° Ninguno de los jugadores tiene estrategias dominadas.

2° Es un juego de equilibrios múltiples {α, α} y {β, β}.

3° Uno de los equilibrios es superior en el sentido de que ambos jugadores podrían


estar mejor con el equilibrio {β, β}.

Así como el tipo de juego analizado en la figura 2.5 se conocen como juegos de
dilema, este tipo de juegos se conocen como juegos de coordinación. La principal
característica de los juegos de coordinación es que tienen equilibrios múltiples (más
de un equilibrio de Nash). En general hay dos tipos de juegos de coordinación:

1. Juegos de Pareto coordinación que se caracterizan porque uno de los equilibrios


es superior al resto y por lo tanto son de fácil predicción. En nuestro ejemplo se
debería esperar que ambos jugadores eligieran la estrategia β.
2. Juegos de coordinación pura que se caracterizan porque al menos hay dos
equilibrios con las mismas ganancias para los jugadores8 y son de difícil
predicción. Un ejemplo de un juego de coordinación pura se presenta en la
siguiente figura:
2
1 α β

α 1,1 0,0

β 0,0 1,1

Figura 2.13

8 Para detalles y un análisis profundo de este tipo de juegos ver Schelling, T.

32
Apuntes Docentes de Teoría de Juegos

Segunda Variante: diablo versus ángel


Suponga que el jugador uno es un “diablo despiadado” y el jugador dos es un “ángel
indignado”. La representación estratégica del juego es:

Ángel

Diablo α β

α 0,0 3,-3

β -1,-1 1,1

Figura 2.14

Observe que:

1. El jugador uno tiene a β como estrategia dominada.


2. Jugador dos no tiene estrategias dominadas.
3. Por racionalidad, el jugador uno debe elegir α. La mejor respuesta del jugador
dos es α.
4. El equilibrio de Nash es Pareto ineficiente: ambos jugadores podrían estar mejor
en el equilibrio {β, β} el que, sin embargo, no es un equilibrio de Nash (el jugador
uno tiene incentivos a desviarse).

Tarea 2.3.
Represente y resuelva el juego en que el jugador uno sea un ángel y el jugador dos
sea un diablo.

2.12. Revisión de algunos de los juegos más conocidos

En esta sección se revisarán tres de los principales juegos simultáneos y se


resolverán los equilibrios de Nash en estrategias puras9.

9 Más adelante se hará referencia al concepto de estrategias puras.

33
Apuntes Docentes de Teoría de Juegos

1.- Dilema del prisionero.

Dos delincuentes habituales (jugadores) son arrestados cuando se acaba de


cometer un delito grave y uno menor. No hay pruebas por el delito grave, pero si
hay algunas sobre el delito menor. Son interrogados en celdas separadas. La policía
les plantea dos estrategias: callar y confesar. Ambos saben eso y saben las penas
asociadas a cada perfil estratégico. Si los dos callan serán absueltos del delito
principal y serán condenados por el delito menor (un año de cárcel); si ambos
confiesan, serán condenados por el delito mayor y se les rebajará la pena en un año
por confesar (cuatro años de cárcel); y si uno confiesa y el otro calla, el primero será
liberado (cero años de cárcel) y el otro será condenado (cinco años de cárcel).

La representación en forma estratégica es la siguiente:

2
1 Callar Confesar

Callar -1,-1 -5,0

Confesar 0,-5 -4,-4

Figura 2.15

Considere en primer lugar, que en este juego los jugadores tienen como función
objetivo minimizar sus años de condena. Segundo, la estrategia callar es una
estrategia dominada para ambos jugadores (observe que para ninguno es una mejor
respuesta). ambos sospechosos tienen como estrategia. Tercero, el equilibrio de
Nash está en el perfil estratégico {confesar, confesar}, Cuarto, la solución al juego
es un Pareto ineficiente, es decir, ambos, podrían obtener condenas menores a
cuatro años.

2.- Batalla de los sexos


Una pareja de novios se pone de acuerdo para salir al día siguiente después del
trabajo. Las alternativas (estrategias) son ir al cine o ir al fútbol. Cuando llega la
34
Apuntes Docentes de Teoría de Juegos

tarde del día siguiente, ambos se dan cuenta que no habían coordinado el lugar en
el que se reunirían. Por lo tanto, cada uno de manera simultánea debería decidir si
iba al fútbol o iba al cine. Ambos prefieren ir al mismo sitio porque desean estar
juntos, sin embargo, la novia prefiere el cine y el novio el fútbol. A continuación, se
representa el juego en la forma estratégica:

2
1 Cine Fútbol

Cine 2,1 0,0

Fútbol 0,0 1,2

Figura 2.16

Primero, los jugadores no tienen estrategias dominadas. Segundo, por el método de


la mejor respuesta se encuentran dos equilibrios de Nash: {Cine, Cine} y (Fútbol,
Fútbol}. Más adelante este juego será revisitado y se comprenderá que hay un tercer
equilibrio en estrategias mixtas. Tercero, pasar de un equilibrio a otro implica
necesariamente que la ganancia de un jugador aumenta y del otro disminuye.
Cuarto, la predicción de la solución del juego no es del todo clara. Hay un riesgo
latente que no se produzca el encuentro en ninguno de los dos sitios, es decir, que
uno vaya al cine y el otro al fútbol. En ese escenario las ganancias son cero para
ambos.

Los juegos con la estructura de la batalla de los sexos son una combinación de
juegos de conflicto puro y mutua dependencia.

Por su característica de conflicto puro, no se debería esperar colaboración. Por su


característica de mutua dependencia, se espera que exista algún tipo de
colaboración o mutua acomodación.

35
Apuntes Docentes de Teoría de Juegos

Se consideran como juegos de negociación. En este tipo de juegos está presente


el elemento esencial de los juegos de estrategia: la mejor respuesta de cada uno
depende espera de lo que cada jugador espere que haga el otro jugador.

3. Matching pennies

Dos jugadores están dotados con una moneda y deben escoger de manera
simultánea entre cara y sello. Si ambos escogen lo mismo el jugador uno gana 1 y
el jugador dos pierde 1. Si ambos escogen diferente, el jugador uno pierde uno y el
jugador dos gana 1. A continuación, se representa el juego en la forma estratégica:

2
1 Cara Sello

Cara 1,-1 -1,1

Sello -1,1 1,-1

Figura 2.17

Primero, este es un juego que se conoce como de juego de conflicto puro. Un


jugador gana y el otro pierde. También se conocen como juegos de suma cero ya
que la suma de las ganancias es cero. Segundo, ninguno de los dos jugadores tiene
estrategias dominadas. Tercero, no tiene equilibrio de Nash en estrategias puras.
Sin embargo, como se verá más adelante, tiene un equilibrio de Nash en estrategias
mixtas.

2.13 Aplicaciones sobre el equilibrio de Nash

A continuación, se revisarán dos aplicaciones del equilibrio de Nash. A diferencia


de los ejemplos que se han revisado anteriormente, en que los jugadores tenían
estrategias discretas, en estas aplicaciones, los jugadores deben decidir sobre
estrategias continuas. Por este motivo, la representación estratégica se realiza con
gráficos y no con matrices.
36
Apuntes Docentes de Teoría de Juegos

La primera aplicación es un juego de complementarios estratégicos. Usted notará


que las curvas de mejor respuesta tienen pendiente positiva. La segunda aplicación
es un juego de sustitutos estratégicos. Usted notará que las funciones de mejor
respuesta tienen pendiente negativa.

Aplicación 3.- El modelo del mínimo esfuerzo

Los jugadores son dos estudiantes que han sido contratados para una asesoría por
un pequeño empresario. La función de beneficios de la empresa se describe así:
“cuatro veces el esfuerzo del jugador uno más cuatro veces el esfuerzo del jugador
dos más cuatro veces el producto de sus esfuerzos multiplicados por un parámetro
b”. El parámetro b se puede considerar como un elemento que recoge la sinergia
que genera que ambos estudiantes trabajen de manera conjunta como un equipo.
Por simplicidad, suponga que el parámetro b puede ser mayor o igual a cero y menor
o igual a ¼ (0 ≤ b ≤ ¼)

Los esfuerzos se medirán de manera individual y cada uno decidirá cuanto esfuerzo,
medido en tiempo, le dedicará a la empresa. El número de horas (estrategias) que
le puede dedicar cada estudiante está en el rango entre cero y cuatro horas.

Las ganancias de los jugadores corresponden a un medio de los beneficios de la


empresa menos sus costos. La función de costos es individual y es igual al esfuerzo
individual al cuadrado.

En síntesis:

 Jugadores: {Estudiante uno y estudiante dos}


 Estrategias: 𝑆𝑖 = [0, 4 horas]
 Ganancias de los jugadores:

𝑈1 (𝑠1 , 𝑠2 ) = ½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠12

𝑈2 (𝑠1 , 𝑠2 ) = ½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠22

Donde, la función de beneficio de la empresa es 4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )

37
Apuntes Docentes de Teoría de Juegos

Solución:

Cada jugador debe decidir el esfuerzo que le dedicarán al trabajo con el objetivo de
maximizar su función de ganancias:

Función objetivo del jugador uno:

Max 𝑈1 (𝑠1 , 𝑠2 ) = Max {½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠12 }


𝑠1 𝑠1
Para encontrar la cantidad de esfuerzo óptima se debe derivar la función objetivo:

𝑑𝑈1
= 2 + 2 b 𝑠2 – 2𝑠1
𝑑𝑠1

Y luego, de acuerdo a la condición de primer orden para encontrar un máximo (o un


𝑑𝑈1
mínimo) se debe igualar a cero ( = 0):
𝑑𝑠1

2 + 2 b 𝑠2 – 2 𝑠̂1 = 0

𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )

donde 𝑠̂1 = 𝑅1 (𝑠2 ) es la función de mejor repuesta del estudiante uno. Observe que
su función depende de la estrategia del estudiante dos y que tiene pendiente (el
parámetro b) positiva.

De manera simétrica se determina la función de mejor respuesta del jugador dos:

Max 𝑈2 (𝑠1 , 𝑠2 ) = Max {½ [4 (𝑠1 + 𝑠2 + b 𝑠1 𝑠2 )] – 𝑠22 }


𝑠2 𝑠2
Para encontrar la cantidad de esfuerzo óptima se debe derivar la función objetivo:

𝑑𝑈2
= 2 + 2 b 𝑠1 – 2𝑠2
𝑑𝑠2

Y luego, de acuerdo a la condición de primer orden para encontrar un máximo se


𝑑𝑈
debe igualar a cero ( 𝑑𝑠 2 = 0):
2

2 + 2 b 𝑠1 – 2 𝑠̂ 2 = 0

𝑠̂2 = 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )

38
Apuntes Docentes de Teoría de Juegos

donde 𝑠̂2 = 𝑅2 (𝑠1 ) es la función de mejor repuesta del estudiante dos. Observe que
su función depende de la estrategia del estudiante uno y que su pendiente
(parámetro b) es positiva.

Los rangos de trabajo que van entre 0 y 1 y entre 2 y 4 son estrategias dominadas.
La mejor respuesta de ambos jugadores estará entre 1 y 2 horas de trabajo, es
decir, para ninguno de los dos será una mejor respuesta trabajar menos de una hora
ni tampoco será una mejor respuesta trabajar más de dos horas.

Note que por eliminación de estrategias dominadas (que nunca serán una mejor
respuesta) el equilibrio converge hasta el punto en que las funciones de mejor
respuesta son iguales. Ese punto es el equilibrio de Nash y se caracteriza porque
ninguno de los dos tiene incentivos a desviarse o de tomar una estrategia distinta
(trabajar más o menos horas en el proyecto).

Para determinar el equilibrio de Nash se debe resolver el sistema de ecuaciones


formados por las funciones de mejor respuesta de ambos jugadores:

𝑠̂1= 𝑅1 (𝑠2 ) = (1 + b 𝑠2 )

𝑠̂2= 𝑅2 (𝑠1 ) = (1 + b 𝑠1 )

39
Apuntes Docentes de Teoría de Juegos

y el resultado que se obtiene es la estrategia óptima para cada jugador:

1
𝑠1∗ = 𝑠2∗ = (1−𝑏)

el resultado depende del valor que tome el parámetro b (recuerde que en términos
matemáticos el parámetro b es la pendiente de las funciones de mejor respuesta).
Por ejemplo:

 Si b = 1/4 entonces 𝑠1∗ = 𝑠2∗ = 1,33 horas.


 Si b = 1/5 entonces 𝑠1∗ = 𝑠2∗ = 1,25 horas.

Pregunta 2.3.

¿Por qué cree que los estudiantes destinan tan pocas horas al proyecto?

Aplicación 4.- El modelo de Cournot

Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, los
vienen son sustitutos perfectos.

Las empresas deben decidir cuánto producir (estrategias)

Suponga que la demanda inversa del bien que las empresas producen está
determinada por la siguiente función:

P(q) = 12 – q, donde q = 𝑞1 + 𝑞2

Donde, 𝑞1 representa la producción de la empresa uno y 𝑞2 representa la producción


de la empresa dos.

Las ganancias son los beneficios económicos, es decir, la diferencia entre los
ingresos (I) y los costos totales (C). Los ingresos totales es el producto de lo que
produce (suponga que vende todo lo que produce) y el precio. Por simplicidad
suponga que los costos totales son iguales a cero. Las funciones de ganancias se
expresan a continuación:

40
Apuntes Docentes de Teoría de Juegos

𝑈1 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞1 − 𝐶1
𝑈1 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞1 − 0
𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1

𝑈2 (𝑞1 , 𝑞2 ) = 𝐼1 − 𝐶1
𝑈2 (𝑞1 , 𝑞2 ) = 𝑝(𝑞) ∗ 𝑞2 − 𝐶2
𝑈2 (𝑞1 , 𝑞2 ) = (12 − 𝑞) ∗ 𝑞2 − 0
𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2

Solución:

1° Encontrar la función de mejor respuesta de la empresa uno. Como se supone


que la empresa es racional y que tiene como objetivo la maximización de sus
ganancias, planteamos el problema como un problema de optimización:

Max 𝑈1 (𝑞1 , 𝑞2 ) = Max [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1


𝑞1 𝑞1

para luego derivar:

𝑑𝑈1
= 12 − 2𝑞1 − 𝑞2
𝑑𝑞1

e igualar a cero (condición de primer orden para un máximo):

12 − 2𝑞1 − 𝑞2 = 0

𝑞2
𝑞̂1 = 𝑅1 (𝑞2 ) = 6 - 2

Donde 𝑞̂1 = 𝑅1 (𝑞2 ) es la función de mejor respuesta de la empresa uno. Note que
es función de la cantidad que decida producir la empresa dos.

2° Encontrar la función de mejor respuesta de la empresa dos. Como se supone


que la empresa es racional y que tiene como objetivo la maximización de sus
ganancias, planteamos el problema como un problema de optimización:

41
Apuntes Docentes de Teoría de Juegos

Max 𝑈2 (𝑞1 , 𝑞2 ) = Max [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2


𝑞2 𝑞2

para luego derivar:

𝑑𝑈2
= 12 − 𝑞1 − 2𝑞2
𝑑𝑞2

e igualar a cero (condición de primer orden para un máximo):

12 − 𝑞1 − 2𝑞2 = 0

𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 -
2

Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que
es función de la cantidad que decida producir la empresa uno.

El equilibrio de Nash se encuentra en la intersección de ambas funciones de mejor


respuesta. Desde el equilibrio de Nash, las empresas no tienen incentivos a
desviarse. No obstante este resultado, el equilibrio de Cournot es un equilibrio

42
Apuntes Docentes de Teoría de Juegos

Pareto dominado, es decir, si ambas empresas cooperaran (se coludieran10)


podrían aumentar sus ganancias.

Note la línea de colusión. En esta línea las empresas están produciendo entre
ambas 6 unidades, que es la cantidad de monopolio. Cuando las empresas se
ubican en colusión, es necesario que estas cooperen para mantenerlo, por lo que
se encuentran en un equilibrio inestable, puesto que existen incentivos para
desviarse de estas estrategias cooperativas, aumentando la cantidad de producción
unilateralmente, ya que esto incrementaría el beneficio individual.

Lo descrito comienza con una de las dos empresas desviándose de la colusión,


aumentando su producción, por consiguiente, la otra decide adoptar la misma
estrategia y así hasta que alcanzan una cantidad de equilibrio, correspondiente a 4
unidades para cada empresa.

Cuando ocurre lo anterior, en el gráfico se puede apreciar un movimiento que se


asemeja al del teorema de la telaraña, de tipo convergente, en el cual se explica la
interdependencia en las decisiones que existe entre cada jugador.

Por lo tanto, colusión no es un equilibrio estable ya que no está en la función de


mejor respuesta de las empresas (excepto cuando la respuesta de una empresa
sea producir cero) por lo que ambas empresas poseen incentivos a desviarse hasta
el equilibrio de Nash.

Para determinar el equilibrio de Nash se debe resolver el sistema de ecuaciones


formados por las funciones de mejor respuesta de ambos jugadores:
𝑞2
𝑞̂1 = 𝑅1 (𝑞2 ) = 6 - 2

𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 -
2

Obteniendo el siguiente resultado:


q∗1 = q∗2 = 4

10 Tenga presente que la colusión no es legal.

43
Apuntes Docentes de Teoría de Juegos

El modelo de Cournot con estrategias discretas.

Suponga que las empresas sólo tienen tres estrategias: producir tres unidades,
producir cuatro unidades o producir seis unidades11, es decir:
 S1 = {3, 4, 6}
 S2 = {3, 4, 6}

Para estimar las ganancias se debe reemplazar en las funciones respectivas:


 𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1
 𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2

Por ejemplo
 𝑈1 (4, 3) = [12 – (4 + 3)] * 4 = 20
 𝑈2 (4, 3) = [12 – (4 + 3)] * 3 = 15

Es decir, si la empresa uno decide producir cuatro unidades y la empresa dos decide
producir tres unidades, las ganancias que obtienen son 20 y 15 respectivamente.
Haciendo ejercicio para los nueve perfiles estratégicos Ui (3, 3), Ui (3, 4), Ui (3, 6), Ui
(4, 3), Ui (4, 4), Ui (4, 6), Ui (6, 3), Ui (6, 4), Ui (6, 6), el juego se puede representar
estratégicamente:

2
1 3 4 6

3 18,18 15,20 9,18

4 20,15 16,16 8,12

6 18,9 12,8 0,0

Figura 2.20

11 Estrategia de colusión, estrategia de Cournot y la estrategia de monopolio, respectivamente.

44
Apuntes Docentes de Teoría de Juegos

En primer lugar, la estrategia de producir seis unidades es una estrategia dominada


para ambos jugadores. Observe que para ninguna empresa jugar seis es una mejor
respuesta.

En segundo lugar, el equilibrio de Nash se encuentra en el punto que ambas


empresas deciden producir cuatro unidades. Observe que ninguna de las empresas
tiene incentivos a desviarse a cualquiera de las otras dos estrategias. Si se
desviasen a producir tres unidades sus ganancias caerían a 15 y si se desviasen a
producir seis unidades sus ganancias caerían 12.

Por último, el equilibrio cooperativo o colusivo es aquel en que ambas empresas


decidiesen producir tres unidades (es decir, seis unidades conjuntamente que es la
cantidad de monopolio). Este equilibrio es, sin embargo, inestable: ambas empresas
tienen incentivos a desviarse. Si una de las empresas se desviase a producir cuatro
unidades en tanto la otra se mantuviera en tres, las ganancias de la primera
aumentarían a 20.

Tarea 2.4.12
Suponga dos empresas que producen un bien homogéneo. Ambas deben decidir
de manera simultánea que precio cobrarán. Suponga que la función de demanda
de la empresa uno (𝑞1 ) es: 𝑎 − 𝑝1 cuando 𝑝1 > 𝑝2 ; 0 cuando 𝑝1 < 𝑝2 ; y (𝑎 − 𝑝1 )⁄2,
cuando 𝑝1 = 𝑝2 . Suponga que no hay costos fijos y que ambas empresas tienen un
costo marginal de c, donde c < 𝑎. Muestre que el único equilibrio de Nash es que
ambas empresas cobran el precio c.

2.14 Juegos de tres jugadores

Emilia, Nina y Talía son tres vecinas que deben decidir simultáneamente si
contribuyen (C) o no contribuyen (NC) a la creación de un jardín en el pasaje que
viven. Dependiendo de las contribuciones, el tamaño del jardín será pequeño,
mediano o grande. Emilia es la jugadora uno, Nina la jugadora dos y Talía la

12 Revise el modelo de Bertrand en Tirole, J.

45
Apuntes Docentes de Teoría de Juegos

jugadora tres. Talía debe decidir una de las dos matrices. Si elige la matriz I decide
contribuir; si decide la matriz II, decide no contribuir al proyecto.

La representación estratégica del juego se presenta a continuación13:

Nina Nina
Emilia C NC Emilia C NC

C 5,5,5 3,6,3 C 3,3,6 1,4,4

NC 6,3,3 4,4,1 NC 4,1,4 2,2,2

Talía contribuye Talía no contribuye


Figura 2.21 Figura 2.22

Solución por mejor respuesta

 Encuentre las mejores respuestas de Emilia ante las posibles jugadas de Nina:
o En la figura 2.21, si Nina decide contribuir, la mejor respuesta de Emilia es
no contribuir porque la ganancia de 6 es mayor que 5. Si Nina decide no
contribuir, la mejor respuesta de Emilia es no contribuir porque 4 es mayor
que 3.
o En la figura 2.22, si Nina decide contribuir, la mejor respuesta de Emilia es
no contribuir porque 4 es mayor que 3. Si Nina decide no contribuir, la mejor
respuesta de Emilia es no contribuir porque 2 es mayor que 1.
 Encuentre las mejores respuestas de Nina ante las posibles jugadas de Emilia:
o En la figura 22.1, si Emilia decide contribuir, la mejor respuesta de Nina es
no contribuir porque 6 es mayor que 5. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 4 es mayor que 3.

13 Para más detalles de este juego, consultar Dixit y Skeath.

46
Apuntes Docentes de Teoría de Juegos

o En la figura 22.2, si Emilia decide contribuir, la mejor respuesta de Nina es


no contribuir porque 4 es mayor que 3. Si Emilia decide no contribuir, la mejor
respuesta de Nina es no contribuir porque 2 es mayor que 1.
 Encuentre las mejores respuestas de Talía ante las combinaciones de estrategias
de Emilia y Nina:
o Si Emilia y Nina deciden contribuir, la mejor respuesta de Talía es no
contribuir (elegir la matriz de la figura 22.2) porque la ganancia de 6 es mayor
que 5.
o Si Emilia decide contribuir y Nina decide no contribuir, la mejor respuesta de
Talía es no contribuir porque 4 es mayor que 3.
o Si Emilia decide no contribuir y Nina decide contribuir, la mejor respuesta de
Talía es no contribuir porque 4 es mayor que 3.
o Si Emilia y Nina deciden no contribuir, la mejor respuesta de Talía es no
contribuir porque la ganancia de 2 es mayor que 1.

Como se puede observar, el equilibrio de Nash de este juego es {NC, NC, NC} que
lleva asociado ganancias de (2,2,2). Es un equilibrio Pareto dominado ya que las
tres jugadoras hubiesen obtenido ganancias más altas si hubiesen contribuido. Este
es un juego de dilema.

Solución por dominancia

1° Encuentre si Emilia tiene estrategias dominada. Observe que


independientemente de lo que decida Nina y Talía, es decir, en las dos matrices, la
ganancia que obtiene Emilia por contribuir es menor que la ganancia que obtiene
por no contribuir. Se deduce entonces que la estrategia contribuir está dominada
por la estrategia no contribuir. Como suponemos que Emilia es una jugadora
racional, sabemos que no jugará la estrategia contribuir y, por lo tanto, se puede
eliminar de su conjunto estratégico. El juego queda reducido a:

47
Apuntes Docentes de Teoría de Juegos

Nina Nina
Emilia C NC Emilia C NC

NC 6,3,3 4,4,1 NC 4,1,4 2,2,2

Talía contribuye Talía no contribuye


Figura 2.23 Figura 2.24

2° Encuentre si Nina tiene estrategias dominadas. Observe que


independientemente de lo que decida Talía (sabemos que Emilia contribuirá), la
ganancia que obtiene Nina por contribuir es menor que la ganancia que obtiene por
no contribuir (4 es mayor que 3 en caso que Talía contribuya y 2 es mayor que 1 en
caso que Talía no contribuya). Se deduce entonces que la estrategia contribuir está
dominada por la estrategia no contribuir. Como suponemos que Nina es una
jugadora racional, sabemos que no jugará la estrategia contribuir y, por lo tanto, se
puede eliminar de su conjunto estratégico. El juego queda reducido a:

Nina Nina
Emilia NC Emilia NC

NC 4,4,1 NC 2,2,2

Talía contribuye Talía no contribuye


Figura 2.25 Figura 2.26

3° Determine se Talía tiene estrategias dominadas: Luego de haber eliminado las


estrategias dominadas de Emilia y Nina, la estrategia de Talía de contribuir es
dominada por la estrategia no contribuir porque la ganancia de 2 es mayor que 1.
En virtud de la racionalidad de Talía, la estrategia contribuir puede ser eliminada. La
nueva representación del juego se presenta a continuación:

48
Apuntes Docentes de Teoría de Juegos

Nina
Emilia NC

NC 2,2,2

Talía no contribuye
Figura 2.27

El único perfil estratégico que sobrevivió fue {NC, NC, NC} que constituye un
equilibrio de Nash.

Las tres jugadoras tenían una estrategia dominada. Aquí se comenzó con Emilia y
finalizó con Talía, pero el orden pudiese sido diferente y el resultado el mismo.

Note que las estrategias dominadas “contribuir” no son una estrategia de mejor
respuesta y las estrategias de mejor respuesta de “no contribuir” no son estrategias
dominadas.

2.15 Introducción a las estrategias mixtas

Considere el siguiente juego:

2
1 L R

U 5,1 0,2

M 1,3 4,1

D 4,2 2,3

Figura 2.28

49
Apuntes Docentes de Teoría de Juegos

El juego ilustrado en la figura anterior tiene tres características principales:

1° Ningún jugador tiene estrategias dominadas

2° No hay equilibrio de Nash en estrategias puras.

3° Cuando el jugador uno tiene una creencia (y le asigna una probabilidad igual a
uno a dicha creencia) sobre lo que jugará el jugador dos, la estrategia D no es nunca
una mejor respuesta.

La creencia de un jugador respecto a lo que va a jugar el otro jugador se configura


matemáticamente a través de la asignación de probabilidades. Cuando se asigna
una probabilidad igual a uno a la creencia que un determinado jugador tiene
respecto a la estrategia que jugará el otro jugador, decimos que aquella estrategia
es una estrategia pura14 y resolvemos en el mundo de la certidumbre. Por ejemplo:

 Si el jugador uno tuviese certeza que el jugador dos jugará L, es decir, la


probabilidad que le asigna a la ocurrencia del evento es igual a uno, entonces
su mejor respuesta sería jugar U porque 5 es mayor que 1 y 4. Entonces U
es la mejor respuesta para L.
 Si el jugador uno tuviese certeza que el jugador dos jugará R, es decir, le
asigna una probabilidad igual a uno a dicha creencia, entonces su mejor
respuesta sería jugar M porque 4 es mayor que 0 y 2. Entonces M es la mejor
respuesta para R.

Sin embargo, la inexistencia de un equilibrio de Nash en estrategias puras nos


entrega incertidumbre respecto a lo que puede decidir el jugador dos.

La probabilidad que el jugador dos juegue L la denotaremos P 2(L) y la probabilidad


que el jugador dos juegue R la denotaremos P2(R). Por definición:

P2(L) + P2(R) = 115

14 Una estrategia es pura cuando la probabilidad que le asigna un jugador a su creencia respecto a
lo que jugará el otro jugador es igual a uno.
15 La suma de las probabilidades debe ser siempre igual a uno. Por lo tanto, las probabilidades están

en un rango entre cero y uno, inclusive.

50
Apuntes Docentes de Teoría de Juegos

Por lo tanto, considere algunos casos:

 si P2(L) = 1 y P2(R) = 1 - P2(L) entonces P2(R) = 0


 si P2(L) = 1/2 y P2(R) = 1 - P2(L) entonces P2(R) = 1/2
 si P2(L) = 1/3 y P2(R) = 1 - P2(L) entonces P2(R) = 2/3
 si P2(L) = 1/4 y P2(R) = 1 - P2(L) entonces P2(R) = 3/4
 si P2(L) = 0 y P2(R) = 1 - P2(L) entonces P2(R) = 1

Con estos antecedentes, el jugador uno puede calcular su ganancia esperada


(UE1) considerando:

1° Sus estrategias

2° Sus creencias sobre la decisión del jugador dos.

La ganancia esperada del jugador uno de jugar U con la creencia que el jugador dos
jugará L con probabilidad P2(L):

UE1 (U) vs. [(P2(L), P2(R)] = [P2(L) * 5] + [P2(R) * 0]

Por ejemplo, se podría hacer una especulación y suponer que el jugador dos jugará
L con una probabilidad de ½ y, por lo tanto, jugará R con una probabilidad de ½.

La ganancia esperada del jugador uno de jugar U, con la creencia que el jugador
dos jugará L con probabilidad de ½, es:

UE1 (U) vs. [(P2(L), P2(R)] = UE1 (U) vs. [1/2, 1/2) = [(1/2) * 5] + [(1/2) * 0] = 2,5

El mismo ejercicio se puede realizar para calcular las ganancias esperadas del
jugador uno de jugar M o D, dada la creencia arbitraria que el jugador dos jugará L
con una probabilidad de ½:

UE1 (M) vs. [(P2(L), P2(R)] = UE1 (M) vs. (1/2, 1/2) = [(1/2) * 1] + [(1/2) * 4] = 2,5

UE1 (D) vs. [(P2(L), P2(R)] = UE1 (D) vs. (1/2, 1/2) = [(1/2) * 4] + [(1/2) * 2] = 3

Entonces, si la creencia del jugador uno es que el jugador dos jugará L con una
probabilidad de 1/2 (y por lo tanto jugará R con una probabilidad de 1/2), la mejor
respuesta del jugador uno ante esa creencia es jugar D porque la ganancia

51
Apuntes Docentes de Teoría de Juegos

esperada es 3 mayor a 2,5 que son las ganancias esperadas que obtendría al jugar
U o M.

Un punto crucial es cómo se configuran las creencias. Suponga que la creencia del
jugador uno cambia y la probabilidad que le asigna a que el jugador dos juegue L
fuese de 2/3. En tal caso, el cálculo de las ganancias esperadas también cambia
haciendo del proceso de toma de decisiones algo muy complicado y lento.
Con el fin de simplificar y facilitar el proceso de la toma de decisiones, se presenta
un método gráfico – algebraico. Procedimiento:

1° Trace tres líneas que representen las ganancias esperadas del jugador uno para
cada una de sus estrategias (U, M o D). Las ganancias esperadas del jugador uno
son función de la probabilidad que le asigna a que el jugador dos juegue R. Por este
motivo, en el eje de las abscisas (eje X) se representa la variable P 2 (R).
 UE1 [U, P2(R)] = [5 * (1 - P2(R))16 + 0 * P2(R)]

Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos
juegue R, es decir: P2(R) = 0, está implícitamente asignando una probabilidad
de uno a que juegue L, es decir: P2(L) = 1. Si este fuese el caso la ganancia
esperada del jugador uno de jugar U ante esa creencia sería 5.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos
juegue R, es decir: P2(R) = 1, está implícitamente asignando una probabilidad
de cero a que juegue L, es decir, P2(L) = 0. Si este fuese el caso la ganancia
esperada del jugador uno de jugar U ante esa creencia sería 0.
 UE1 [M, P2(R)] = [1 * (1 - P2(R)) + 4 * P2(R)]

Note que:
o si el jugador uno le asigna una probabilidad de cero a que el jugador dos
juegue R, la ganancia esperada del jugador uno de jugar M ante esa creencia
sería 1.

16
Recuerde que (1 - P2(R)) = P2(L)

52
Apuntes Docentes de Teoría de Juegos

o si el jugador uno le asigna una probabilidad de uno a que el jugador dos


juegue R, la ganancia esperada del jugador uno de jugar M ante esa creencia
sería 4.
 UE1 [D, P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]

Note que:

o si el jugador uno le asigna una probabilidad de cero a que el jugador dos


juegue R, la ganancia esperada del jugador uno de jugar D ante esa creencia
sería 4.
o si el jugador uno le asigna una probabilidad de uno a que el jugador dos
juegue R, la ganancia esperada del jugador uno de jugar D ante esa creencia
sería 2.

Para trazar las tres líneas (una para cada estrategia del jugador uno) una los puntos
de las ganancias esperadas cuando las probabilidades que el jugador dos juega R
sean cero y uno.

2° Las líneas se cruzan en tres puntos (sólo dos puntos son relevantes, ¿por qué?).
Dichos cruces implican que la ganancia esperada del jugador uno es la misma. Si
la ganancia esperada es la misma, el jugador uno debe ser indiferente entre las dos

53
Apuntes Docentes de Teoría de Juegos

estrategias. El objetivo es encontrar la probabilidad que el jugador dos juegue R que


hace que las dos estrategias del jugador uno, sean indiferentes.

Para determinar una política de decisión para el jugador uno proceda, sólo con los
puntos relevantes, de la siguiente manera:

a) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno
sea indiferente entre jugar U o D. Como se dijo, si son indiferentes, las
ganancias esperadas son iguales:

UE1 [U, P2(R)] = UE1 [D, P2(R)]

[5 * (1 - P2(R)) + 0 * P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]

P2(R) = 1/3

Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará
R es igual a 1/3, el jugador uno será indiferente entre jugar U o D porque la ganancia
esperada es igual.

La ganancia esperada es 10/3 y se obtiene evaluando el resultado en las funciones


de ganancia esperada:

UE1 [U, 1/3] = [5 * (1 – 1/3)) + 0 * 1/3] = 10/3

UE1 [D, 1/3] = [4 * (1 – 1/3)) + 2 * 1/3] = 10/3

b) Encontrar la probabilidad de que el jugador dos juegue R tal que el jugador uno
sea indiferente entre jugar M o D:

UE1 [M, P2(R)] = UE1 [D, P2(R)]

[1 * (1 - P2(R)) + 4 * P2(R)] = [4 * (1 - P2(R)) + 2 * P2(R)]

P2(R)) = 3/5

Es decir, si la probabilidad que el jugador uno le asigna a que el jugador dos jugará
R es igual a 3/5, el jugador uno será indiferente entre jugar M o D porque la ganancia
esperada es la misma.

54
Apuntes Docentes de Teoría de Juegos

La ganancia esperada es 14/5 y se obtiene evaluando el resultado en las funciones


de ganancia esperada:

UE1 [M, 3/5] = [1 * (1 – 3/5)) + 4 * 3/5] = 14/5

UE1 [D, 3/5] = [4 * (1 – 3/5)) + 2 * 3/5] = 14/5

3° Generar una política de decisión para el jugador uno en función de las creencias
sobre las estrategias del jugador dos:

Si: 0 ≤ P2(R) < 1/3 juegue U


Si: P2(R) = 1/3 juegue U o D
Si: 1/3 < P2(R) < 3/5 juegue D
Si: P2(R) = 3/5 juegue M o D
Si: 3/5 < P2(R) ≤ 1 juegue M

Definición: una estrategia 𝑠̂𝑖 es una mejor respuesta del jugador i (𝑅𝑖 ), respecto a
la creencia p (donde p representa la distribución de probabilidades) acerca de las
elecciones del resto de los jugadores (-i), si se cumple que la ganancia esperada de
jugar 𝑠̂𝑖 es mayor que la ganancia de jugar 𝑠𝑖´ para toda combinación de
probabilidades de las estrategias 𝑆−𝑖 (las estrategias de todo el resto de los
jugadores, es decir, de todos los jugadores menos el jugador i):

𝑈𝐸𝑖 (𝑠̂𝑖 , p) > 𝑈𝐸𝑖 (si´, p)

También se puede expresar que la estrategia 𝑠̂𝑖 resuelve el problema de


optimización:

Max 𝑈𝐸𝑖 (𝑆𝑖 , 𝑆−𝑖 )


𝑠𝑖

55
Apuntes Docentes de Teoría de Juegos

Ejercicio 2.3
De acuerdo al siguiente juego:
2
1 C S

C 1,2 0,0

S 0,0 2,1

B -1,4 3,1

Figura 2.30

Genere una política de decisión para el jugador uno.

2.16. Equilibrio de Nash en estrategias mixtas

Las estrategias mixtas es una aleatorización de estrategias puras, es decir, describe


la selección aleatoria entre posibles estrategias puras, lo que determina
una distribución de probabilidad sobre el vector de estrategias de cada jugador.

La ganancia esperada del jugador i de una estrategia mixta Pi (P por probabilidad)


es un promedio ponderado de las ganancias esperadas de cada una de las
estrategias puras consideradas en la mezcla.

Definición: En la representación estratégica de un juego de dos jugadores G = {S1,


S2; u1, u2}, las estrategias mixtas {𝑝1∗ , 𝑝2∗} son un equilibrio de Nash si cada estrategia
mixta es una mejor respuesta a las estrategias mixtas del otro jugador.

Para que el par de estrategias mixtas {𝑝1∗ , 𝑝2∗ } sea un equilibrio de Nash se deben
satisfacer dos condiciones:

Condición 1: 𝑈𝐸1 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸1 {𝑝1 , 𝑝2∗ }, para cada distribución de probabilidad de
p1 sobre S1, y

56
Apuntes Docentes de Teoría de Juegos

Condición 2: 𝑈𝐸2 {𝑝1∗ , 𝑝2∗ } ≥ 𝑈𝐸2 {𝑝1∗ , 𝑝2 }, para cada distribución de probabilidad de
p2 sobre S2.

Ejemplo 1.- La batalla de los sexos revisitada

En la figura 2.31 se reproduce la batalla de los sexos representada en la figura 2.16.


Una pareja se pone de acuerdo para salir al día siguiente después del trabajo. Las
estrategias son ir al cine (C) o ir al fútbol (F). Cuando llega la tarde del día siguiente,
ambos se dan cuenta que no habían coordinado el lugar en el que se reunirían. Por
lo tanto, cada uno de manera simultánea, con información imperfecta, debería
decidir si iba al fútbol o iba al cine. Ambos prefieren ir al mismo sitio porque desean
estar juntos, sin embargo, la novia prefiere el cine y el novio el fútbol.

En estrategias puras, el juego tiene dos equilibrios de Nash: {Cine, Cine} y {Fútbol,
Fútbol}. En adelante, se procederá a encontrar el equilibrio de Nash en estrategias
mixtas17.

Antes de proceder recuerde que definimos este juego como de negociación,


caracterizado por ser una combinación de juegos de conflicto puro y mutua
dependencia.

Por su componente de mutua dependencia, se espera que exista algún tipo de


colaboración o mutua acomodación y por su componente de conflicto puro, no se
debería esperar colaboración.

A continuación, se representa el juego en la forma estratégica:

17 Aunque todos los juegos tienen equilibrio de Nash en estrategias puras y/o mixtas, hay juegos que
tienen equilibrio de Nash sólo en estrategias puras (como los juegos de dilema); hay otros que tienen
equilibrios de Nash sólo en estrategias mixtas (como los juegos de conflicto puro); hay otros juegos
que tienen equilibrios de Nash en estrategias puras y estrategias mixtas (como los juegos de
negociación).

57
Apuntes Docentes de Teoría de Juegos

2
1 C F

C 2,1 0,0 p

F 0,0 1,2 1–p

q 1-q
Q
Figura 2.31

 P es la mezcla con que el jugador uno está jugando C y F. La estrategia mixta


del jugador uno es (p, 1 – p), es decir, jugar C con una probabilidad de p y
jugar F con una probabilidad de 1 – p.
 Q es la mezcla con que el jugador dos está jugando C y F. La estrategia mixta
del jugador dos es (q, 1 – q), es decir, jugar C con una probabilidad de q y
jugar F con una probabilidad de 1 – q.

Lo anterior se interpreta de la siguiente forma:

El jugador uno cree que el jugador dos jugará C con una probabilidad q y que jugará
F con una probabilidad 1 – q.

El jugador dos cree que el jugador uno jugará C con una probabilidad p y que jugará
F con una probabilidad 1 – p.

Solución:

La solución y comprobación del equilibrio de Nash en estrategias mixtas se obtiene


a través de una serie de pasos:

1° Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente entre
ir al cine o al fútbol.

Se calculan e igualan las ganancias esperadas de jugador uno al jugar C y F versus


la mezcla del jugador dos (Q):
58
Apuntes Docentes de Teoría de Juegos

UE1 (C, Q) = 2*q + 0*(1- q)

UE1 (F, Q) = 0*q + 1*(1- q)

Para el jugador uno, la decisión de ir al cine o al fútbol es indiferente si sus ganancias


esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:

UE1 (C, Q) = UE1 (F, Q)

2*q + 0*(1- q) = 0*q + 1*(1- q)

2q = 1 – q

q = 1/3

Para el jugador uno, las estrategias cine y fútbol son indiferentes, si el jugador dos
va al cine con una probabilidad de q = 1/3 y al fútbol con una probabilidad 1 – q =
2/3.

¿Cuál es la ganancia esperada del jugador uno al jugar C contra la estrategia mixta
del jugador dos Q = (1/3, 2/3)? ¿Cuál es la ganancia esperada del jugador uno al
jugar F contra la estrategia mixta del jugador dos Q = (1/3, 2/3)?

UE1 (C, Q) = 2*q + 0*(1- q) = 2 * (1/3) + 0 * (2/3) = 2/3

UE1 (F, Q) = 0*q + 1*(1- q) = 0 * (1/3) + 1 * (2/3) = 2/3

Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/3, 2/3),
las ganancias esperadas del jugador uno al jugar cine o fútbol son iguales.

Pregunta 2.4

¿Cuál sería la mejor respuesta del jugador uno si su creencia fuese que el jugador
dos jugará C con una probabilidad mayor a 1/3? ¿Cuál sería la mejor respuesta del
jugador uno si su creencia fuese que el jugador dos jugará C con una probabilidad
menor a 1/3?

2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre
ir al cine o al fútbol.

59
Apuntes Docentes de Teoría de Juegos

Se calculan e igualan las ganancias esperadas de jugador dos al jugar C y F versus


la mezcla del jugador uno (P):

UE2 (P, C) = 1*p + 0*(1- p)

UE2 (P, F) = 0*p + 2*(1- p)

Para el jugador dos, la decisión de ir al cine o al fútbol es indiferente si sus ganancias


esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:

UE2 (P, C) = UE2 (P, F)

1*p + 0*(1- p) = 0*p + 2*(1- p)

p = 2/3

Para el jugador dos, las estrategias cine y fútbol son indiferentes, si el jugador uno
va al cine con una probabilidad de p = 2/3 y al fútbol con una probabilidad 1 – p =
1/3.

¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta
del jugador uno P = (2/3, 1/3)? ¿Cuál es la ganancia esperada del jugador dos al
jugar F contra la estrategia mixta del jugador uno P = (2/3, 1/3)?

UE2 (P, C) = 1*p + 0*(1- p) = 1 * (2/3) + 0 * (1/3) = 2/3

UE2 (P, F) = 0*p + 2*(1- p) = 0 * 2/3 + 2 * (1/3) = 2/3

Queda comprobado entonces que si el jugador uno jugara la mezcla P = (2/3, 1/3),
las ganancias esperadas del jugador al jugar cine o fútbol dos son iguales.

Pregunta 2.5

¿Cuál sería la mejor respuesta del jugador dos si su creencia fuese que el jugador
uno jugará C con una probabilidad mayor a 2/3? ¿Cuál sería la mejor respuesta del
jugador dos si su creencia fuese que el jugador uno jugará C con una probabilidad
menor a 2/3?

3° Determinar si la ganancia esperada del jugador uno al jugar la mezcla P versus


la mezcla del jugador dos Q.

60
Apuntes Docentes de Teoría de Juegos

UE1 (P, Q) = p * [UE1 (C, Q)] + (1 - p) * [UE1 (F, Q)]

UE1 (P, Q) = 2/3 * (2/3) + 1/3 * (2/3)

UE1 (P, Q) = 2/3

Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (2/3,
1/3) versus la estrategia mixta Q= (1/3, 2/3) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta
Q del jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.

4° Determinar si la ganancia esperada del jugador dos al jugar la mezcla Q versus


la mezcla del jugador uno P.

UE2 (P, Q) = q * [UE2 (P, C)] + (1 - q) * [UE2 (P, F)]

UE2 (P, Q) = 1/3 * (2/3) + 2/3 * (2/3)

UE2 (P, Q) = 2/3

Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/3,
2/3) versus la estrategia mixta P= (2/3, 1/3) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o F versus la estrategia mixta
P del jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.

5° El equilibrio de Nash en estrategias mixtas es:

[(p, 1 – p), (q, 1 – q)] = [(2/3, 1/3), (1/3, 2/3)]

6° En conclusión, el juego tiene tres equilibrios de Nash {C, C}, {F, F} y {(2/3, 1/3),
(1/3, 2/3)} con sus respectivas ganancias (2, 1), (1, 2) y (2/3, 2/3).

Pregunta 2.6

¿Por qué los jugadores podrían aleatorizar sus estrategias si las ganancias que
obtienen de sus estrategias mixtas son tan pobres, incluso comparadas con la
ganancia más baja de los equilibrios en estrategias puras?

61
Apuntes Docentes de Teoría de Juegos

Ejemplo 2. Matching pennies

Recuerde el juego de la figura 2.17 representado nuevamente en la figura 2.32. Dos


jugadores están dotados con una moneda y deben escoger de manera simultánea
entre cara (C) y sello (S). Si ambos escogen lo mismo el jugador uno gana 1 y el
jugador dos pierde 1. Si ambos escogen diferente, el jugador uno pierde uno y el
jugador dos gana 1. A continuación, se representa el juego en la forma estratégica:

2
1 C S

C 1,-1 -1,1 p

S -1,1 1,-1 1–p

q 1-q
Q
Figura 2.32

Como se observa el juego no tiene equilibrio de Nash en estrategias puras.

Solución:

1° Encontrar la mezcla Q = (q, 1 – q) del jugador dos que hace al jugador uno
indiferente entre jugar cara o sello.

Se calculan e igualan las ganancias esperadas de jugador uno al jugar C y S versus


la mezcla del jugador dos (Q):

UE1 (C, Q) = 1*q + -1*(1- q)

UE1 (S, Q) = -1*q + 1*(1- q)

Para el jugador uno, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:

UE1 (C, Q) = UE1 (S, Q)


62
Apuntes Docentes de Teoría de Juegos

1*q + -1*(1- q) = -1*q + 1*(1- q)

4q = 2

q = 1/2

Para el jugador uno, las estrategias cara y sello son indiferentes si el jugador dos
elige cara con una probabilidad de q = 1/2 y elige sello con una probabilidad 1 – q =
1/2.

La política de decisión del jugador uno debe ser:

Si: q > ½, elija cara


Si: q = ½, elija cara o sello
Si: q < ½, elija sello

¿Cuál es la ganancia esperada del jugador uno al jugar cara contra la estrategia
mixta del jugador dos Q = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador
uno al jugar sello contra la estrategia mixta del jugador dos Q = (1/2, 1/2)?

UE1 (C, Q) = 1*q + -1*(1- q) = 1 * (1/2) + -1 * (1/2) = 0

UE1 (S, Q) = -1*q + 1*(1- q) = -1 * (1/2) + 1 * (1/2) = 0

Queda comprobado entonces que si el jugador dos jugara la mezcla Q = (1/2 1/2),
las ganancias esperadas del jugador uno al jugar cara o sello son iguales.

2° Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente entre
jugar cara o sello.

Se calculan e igualan las ganancias esperadas de jugador dos al jugar C y S versus


la mezcla del jugador uno (P):

UE2 (P, C) = -1*p + 1*(1- p)

UE2 (P, S) = 1*p + -1*(1- p)

Para el jugador dos, la decisión de jugar cara o sello es indiferente si sus ganancias
esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:

63
Apuntes Docentes de Teoría de Juegos

UE2 (P, C) = UE2 (P, S)

-1*p + 1*(1- p) = 1*p + -1*(1- p)

p = 1/2

La política de decisión del jugador dos debe ser:

Si: p > ½, elija sello


Si: p = ½, elija cara o sello
Si: p < ½, elija cara
Para el jugador dos, las estrategias cara y sello son indiferentes, si el jugador uno
elige cara con una probabilidad de p = 1/2 y elige sello con una probabilidad 1 – p =
1/2.

¿Cuál es la ganancia esperada del jugador dos al jugar C contra la estrategia mixta
del jugador uno P = (1/2, 1/2)? ¿Cuál es la ganancia esperada del jugador dos al
jugar S contra la estrategia mixta del jugador uno P = (1/2, 1/2)?

UE2 (P, C) = 1*p + -1*(1- p) = 1 * (1/2) + -1 * (1/2) = 0

UE2 (P, S) = -1*p + 1*(1- p) = -1 * 1/2 + 1 * (1/2) = 0

Queda comprobado entonces que si el jugador uno jugara la mezcla P = (1/2 1/2),
las ganancias esperadas del jugador dos de jugar cara o sello son iguales.

3° Determinar la ganancia esperada del jugador uno al jugar la mezcla P versus la


mezcla del jugador dos Q.

UE1 (P, Q) = p * [UE1 (C, Q)] + (1 - p) * [UE1 (S, Q)]

UE1 (P, Q) = 1/2 * (0) + 1/2 * (0)

UE1 (P, Q) = 0

Es decir, la ganancia esperada del jugador uno de jugar su estrategia mixta P = (1/2,
1/2) versus la estrategia mixta Q = (1/2, 1/2) del jugador dos es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta
Q del jugador dos. Por lo tanto, el jugador uno no tiene incentivos a desviarse.

64
Apuntes Docentes de Teoría de Juegos

4° Determinar la ganancia esperada del jugador dos al jugar la mezcla Q versus la


mezcla del jugador uno P.
UE2 (P, Q) = q * [UE2 (P, C)] + (1 - q) * [UE1 (P, S)]

UE2 (P, Q) = 1/2 * (0) + 2/3 * (0)

UE2 (P, Q) = 0

Es decir, la ganancia esperada del jugador dos de jugar su estrategia mixta Q = (1/2,
1/2) versus la estrategia mixta P = (1/2, 1/2) del jugador uno es igual a la ganancia
esperada que tiene al jugar sus estrategias puras C o S versus la estrategia mixta
P del jugador uno. Por lo tanto, el jugador dos no tiene incentivos a desviarse.

5° El equilibrio de Nash en estrategias mixtas es:


[(p, 1 – p), (q, 1 – q)] = [(1/2, 1/2), (1/2, 1/2)]

Octava conclusión: En la representación estratégica de un juego de n jugadores


G = {S1, S2,…,Sn; u1, u2,…, un}, si n es finito y Si es finito para cada i entonces existe
al menos un equilibrio de Nash.
Ejercicio 2.4.
Encuentre el o los equilibrios de Nash en estrategias puras y estrategias mixtas del
juego de cachipún representado en su forma estratégica en la siguiente figura:

2
1 Roca Tijera Papel

Roca 0,0 1,-1 -1,1

Tijera -1,1 0,0 1,-1

Papel 1,-1 -1,1 0,0

Figura 2.33

65
Apuntes Docentes de Teoría de Juegos

Capítulo Tres

Juegos Dinámicos
3.1. Objetivos del capítulo

Introducir los juegos dinámicos de información completa; su representación en


forma extensiva y estratégica; y cómo resolverlos.

3.2. Aprendizajes esperados

 Representar en forma extensiva


 Representar en forma estratégica
 Aprender el método de inducción hacia atrás
 Determinar el equilibrio de Nash Perfecto en Subjuegos
 Reconocer juegos dinámicos de información perfecta e imperfecta

3.3. Lecturas esenciales

 Gibbons, R. 1992. A primer in Game Theory. Prentice Hall.


 Polack, B. 2007. Econ 159: Game Theory. Open Yale Courses.
 Watson, J. 2008. Strategy. W.W. Norton & Co.

3.4. Lecturas opcionales

- Dixit, A. y Nalebuff, B. Pensar estratégicamente


- Fudenberg, D. y Tirole, J. 1991. Game Theory. MIT Press, Cambridge.
- Osborne, M. y Rubinstein, A. 1994. A Course in Game Theory. The MIT Press.
- Selten, R. ( ). The Chain Store Paradox
- Tirole, J. Organización industrial.

66
Apuntes Docentes de Teoría de Juegos

3.5. Introducción al capítulo tres

Este capítulo se concentra en los juegos dinámicos tanto de información perfecta


como imperfecta.

En un juego dinámico los jugadores deciden de manera secuencial, es decir, el


jugador uno decide su acción, el jugador dos observa la decisión del jugador uno, y
con ese conocimiento decide su acción. En un juego dinámico de información
imperfecta, los jugadores deben, en algún estado del juego, jugar de manera
simultánea.

Al igual que en el capítulo dos se supone que: (1) los jugadores tienen información
completa, es decir, conocen la función de ganancias de cada jugador; (2) los
jugadores son racionales en el sentido que buscan maximizar sus ganancias, y (3)
los jugadores tienen conocimiento común respecto a las funciones de ganancias
y a la racionalidad.

El concepto clave que se aprenderá en este capítulo es el Equilibrio de Nash


Perfecto en Subjuegos que es un refinamiento del equilibrio de Nash.

3.6. Representación extensiva de un juego dinámico


La representación extensiva de un juego dinámico puede ser vista como una
generalización de un árbol de decisiones, pero con múltiples jugadores.

La forma extensiva requiere contener la siguiente información:

1° Conjunto de jugadores.
2° El orden del juego representado por un árbol; quien mueve, cuando mueve.
3° La información que poseen los jugadores al momento de mover y elegir sus
acciones.
4° El conjunto de posibles acciones que tiene cada jugador.
5° Las ganancias como función del desarrollo del juego.

67
Apuntes Docentes de Teoría de Juegos

Un árbol es una colección finita de nodos con una relación entre ellos que se
expresa en su conexión mediante ramas. Entre los nodos hay una relación de
precedencia. Para la construcción del árbol, se establecen dos supuestos:

1° La relación de precedencia es transitiva. Si x es antes de x´ y x´ es antes de x”,


entonces x es antes de x”.

2° La relación de precedencia es asimétrica. Si x es antes de x´, entonces x´ no es


antes de x.

Los nodos representan conjuntos de información. Son una completa descripción de


todos los eventos que lo precedieron. Para asegurar que cada nodo sea una
descripción completa de los eventos que lo precedieron, se requiere que cada uno
(excepto el nodo inicial) tenga exactamente un predecesor inmediato. Hay tres tipos
de nodos: el nodo inicial, los nodos de decisión y los nodos terminales.

El nodo inicial da comienzo al juego y es el único que no tiene predecesores, pero


si tienen sucesores. Los nodos de decisión tienen predecesores y sucesores. Los
nodos terminales sólo tienen predecesores y no tienen sucesores.

Luego de los nodos terminales se deben especificar las ganancias de cada jugador
asociadas a las secuencias de movimientos que culminan en un nodo terminal.

Los nodos están conectados por ramas que representan acciones. De cada nodo
pueden surgir múltiples ramas. Un perfil estratégico es una secuencia de nodos
conectados por ramas que (1) comienzan en el nodo inicial, (2) finaliza en un nodo
terminal y (3) tiene la propiedad que los nodos sucesores son nodos sucesivos en
la secuencia. Cada perfil estratégico es un camino a través de las ramas del árbol.

En la representación extensiva de un juego dinámico, la longitud del juego se mide


contando la cantidad de ramas que van desde el nodo inicial hasta el nodo terminal
por el perfil (camino) más largo.

68
Apuntes Docentes de Teoría de Juegos

Subjuegos

Dada una representación extensiva de un juego G y un nodo de decisión x (distinto


al nodo inicial) de G, se dice que G´ es un subjuego de G con inicio en x, si G´ es
una parte de G que cumple lo siguiente:

1° Contiene el nodo x y a todos sus nodos sucesores, y sólo a ellos.


2° El nodo x es un nodo de decisión unitario.
3° Si el nodo x´ pertenece al subjuego G´, también pertenecen a G´ todos los nodos
del conjunto de información al que pertenece x´, es decir, G´ no rompe ningún
conjunto de información.

Note que:
1.- El juego G es siempre un subjuego de G.
2.- Se llaman subjuegos propios de G a aquellos subjuegos que no coinciden con
G, es decir, que no comienzan en el nodo inicial de G.
3.- Si G es un juego de información perfecta, cualquier parte que comience en un
nodo de decisión y contenga todos los nodos que le suceden es un subjuego.
4.- También se considera un subjuego a aquellos en que sólo intervendrá un solo
jugador.

69
Apuntes Docentes de Teoría de Juegos

3.7 Inducción hacia atrás

Los juegos representados en forma extensiva con información completa y perfecta,


se pueden resolver a través del método conocido como inducción hacia atrás.

El método consiste en una serie de pasos que se detallan a continuación:


1° Se identifican todos los subjuegos propios que se producen en el último estado
del juego, es decir, aquellos que comienzan en los últimos nodos de decisión
antes de los nodos terminales de cada perfil estratégico.
2° Estos subjuegos tienen un solo jugador. Se asume que jugadores racionales
jugarán las acciones con las que maximizan su ganancia por lo que la acción
elegida es un equilibrio de Nash.
3° En la medida que se van resolviendo, los subjuegos se van eliminando (el árbol
se va podando), quedando el nodo de decisión como nodo terminal y se le
atribuyen las ganancias asociadas a la acción óptima.
4° Al hacer esto el árbol se va reduciendo. El proceso continúa hasta llegar al nodo
inicial del juego global.

Ejemplo 3.1
Resuelva el siguiente juego por inducción hacia atrás.

70
Apuntes Docentes de Teoría de Juegos

El juego comienza con el jugador uno que debe decidir si juega L o R. Si juega L le
corresponde el turno al jugador dos, que debe decidir entre a o b. Si decide la acción
a el juego termina con ganancias de 5 para el jugador uno y de 2 para el jugador
dos. Si decide la acción b el juego termina con ganancias de 3 para el jugador uno
y de 1 para el jugador dos. Si el jugador uno, decide R, le corresponde al jugador
dos que debe decidir entre c o d. Si juega c, el juego termina con ganancias de 4
para el jugador uno y de 1 para el jugador dos. Si el jugador dos, juega d, le
corresponde jugar nuevamente al jugador uno, quien debe decidir entre S o T. Si
decide la acción S el juego termina con ganancias de 1 para el jugador uno y de 2
para el jugador dos. Si decide la acción T el juego termina con ganancias de 0 para
el jugador uno y de 3 para el jugador dos.

Solución

1° Se va al último subjuego (aquel que comienza en el último nodo de decisión) y


se asume que el jugador uno jugará una acción óptima. En este nodo el jugador
uno, debe decidir entre S o T. Por racionalidad elegirá S porque la ganancia de 1 es
mayor que 0. Una vez resuelto el subjuego, se representa el juego en una forma
más reducida:

71
Apuntes Docentes de Teoría de Juegos

2° Se va a los dos últimos subjuegos (aquel que comienza en los últimos nodos de
decisión) y se asume que el jugador dos jugará una acción óptima.

En estos nodos, si el jugador uno decide L, el jugador dos debe decidir entre a o b.
Por racionalidad elegirá a porque la ganancia de 5 es mayor que 3.

Si el jugador uno decide R, el jugador dos debe decidir entre c o d. Por racionalidad
elegirá d porque anticipa que si juega aquella opción, el jugador uno elegirá S y la
ganancia que obtendrá es 2 que es mayor que 1.

Una vez resueltos estos dos subjuegos, se representa el juego en una forma más
reducida, donde el jugador deberá decidir si juega L o R:

3° El jugador uno debe resolver cómo comienza el juego. Para determinar su


decisión ha ido resolviendo todos los subjuegos propios asumiendo que el jugador
dos decidirá con racionalidad y asumiendo que el jugador dos asume que él decidirá
con racionalidad. Bajo estos supuestos, el jugador uno jugará L porque la ganancia
que obtendrá es 5 que es mayor que 2 si jugará R.

La clave en el método de la inducción hacia atrás es que los jugadores pueden


anticipar las posteriores decisiones. El jugador uno anticipa lo que jugará el jugador
dos con cualquiera de sus dos acciones iniciales y el jugador sabe que el jugador
72
Apuntes Docentes de Teoría de Juegos

uno anticipará su jugada. Luego el jugador decide, anticipando lo que jugará el


jugador uno y el jugador uno sabe que el jugador anticipará su jugada posterior.

En consecuencia, la solución del juego por inducción hacia atrás es {(L, S), (a, d)}:
el jugador uno jugaría L en su primer nodo de decisión y S en su segundo nodo de
decisión. El jugador dos, jugaría a en su primer nodo de decisión, si el jugador uno
juega L y d en su segundo nodo de decisión, si el jugador uno juega R.

Note que, si el jugador uno juega L, el jugador dos no deberá decidir entre c y d. No
obstante, en la solución se debe registrar lo “que haría si” el juego llegará a ese
nodo.

La solución gráfica se registra en la siguiente figura:

Primera conclusión: Las claves en el proceso de inducción hacia atrás es la


credibilidad y la anticipación.

3.8 Aplicación sobre el método de inducción hacia atrás


El modelo de Stackelberg

Este modelo es una variante de Cournot. La diferencia crucial es que los jugadores
juegan de manera secuencial.
73
Apuntes Docentes de Teoría de Juegos

Hay dos empresas (jugadores) que producen un bien homogéneo, es decir, son
sustitutos perfectos. Las empresas deben decidir cuánto producir (estrategias) de
manera secuencial, es decir, la empresa líder (jugador uno) decide primero, la
empresa seguidora (empresa dos) observa la decisión de la empresa líder, y luego
decide cuánto producir

Suponga que la demanda inversa del bien que las empresas producen está
determinada por la siguiente función:

𝑃(𝑞) = 12 − 𝑞, donde 𝑞 = 𝑞1 + 𝑞2

Donde, 𝑞1 representa la producción de la empresa uno y 𝑞2 representa la producción


de la empresa dos.
Las ganancias son los beneficios económicos, es decir, la diferencia entre los
ingresos (I) y los costos totales (C). Los ingresos totales es el producto de lo que
produce (suponga que vende todo lo que produce) y el precio. Por simplicidad
suponga que los costos totales son iguales a cero.

Solución:
Como este es un juego dinámico de información completa y perfecta, se utilizará el
método de inducción hacia atrás, es decir, se comenzará por la empresa dos que
es aquella que debe decidir en los nodos previos a los nodos terminales:
1° Encontrar la función de mejor respuesta de la empresa dos. Como se supone
que la empresa es racional y que tiene como objetivo la maximización de sus
ganancias, planteamos el problema como un problema de optimización:
𝑀𝑎𝑥 𝑈2 (𝑞1 , 𝑞2 ) = 𝑀𝑎𝑥[12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2
𝑞2 𝑞2

para luego derivar:


𝑑𝑈2
= 12 − 𝑞1 − 2𝑞2
𝑑𝑞2

e igualar a cero (condición de primer orden para un máximo):


12 − 𝑞1 − 2𝑞2 = 0
𝑞1
𝑞̂2 = 𝑅2 (𝑞1 ) = 6 − 2

74
Apuntes Docentes de Teoría de Juegos

Donde 𝑞̂2 = 𝑅2 (𝑞1 ) es la función de mejor respuesta de la empresa dos. Note que
es función de la cantidad que decida producir la empresa uno.
2° La empresa líder conoce la función de mejor respuesta de la empresa dos. Esta
información le da la ventaja de poder anticipar las respuestas de la empresa dos
ante sus decisiones de producción. Además, como la empresa uno sabe que la
pendiente de la función de mejor respuesta de la empresa dos es negativa, anticipa
que en la medida que aumente la producción, la empresa uno disminuirá la suya.

Con estos antecedentes, el problema de la empresa uno es:


𝑀𝑎𝑥 𝑈1 (𝑞1 , 𝑞̂2 )
𝑞1

Observe que la empresa uno considera la respuesta de la empresa dos como un


dato. La función de ganancias de la empresa uno se expresa a continuación:
𝑈1 (𝑞1 , 𝑞̂2 ) = [12 − (𝑞1 + 𝑞̂2 )] ∗ 𝑞1
𝑈1 (𝑞1 , 𝑞̂2 ) = 12 𝑞1 − 𝑞12 − 𝑞1 ∗ 𝑞̂2
𝑞1
𝑈1 (𝑞1 , 𝑞̂2 ) = 12 𝑞1 − 𝑞12 − 𝑞1 ∗ (6 − )
2
𝑞12
𝑈1 (𝑞1 , 𝑞̂2 ) = 6 𝑞1 −
2
Observe que la función de ganancias de la empresa uno depende sólo de su
decisión y no de la decisión de la empresa dos.

Por lo tanto, el problema de la empresa uno es encontrar la cantidad de producción


𝑞1 que le permita maximizar su ganancia:

𝑞12
𝑀𝑎𝑥 𝑈1 (𝑞1 , 𝑞̂2 ) = 𝑀𝑎𝑥 6 𝑞1 −
2
𝑞1 𝑞1

para luego derivar:


𝑑𝑈1
= 6 − 𝑞1
𝑑𝑞1
e igualar a cero:
𝑞1 = 6
𝑞1
Si, 𝑞1 = 6 y 𝑞2 = 6 − , entonces: 𝑞2 = 3
2

75
Apuntes Docentes de Teoría de Juegos

El modelo de Stackelberg con estrategias discretas.


Suponga que las empresas sólo tienen tres acciones: producir tres unidades,
producir cuatro unidades o producir seis unidades, es decir:
 𝐴1 = {3, 4, 6}
 𝐴2 = {3, 4, 6}

Para estimar las ganancias se debe reemplazar en las funciones respectivas:


 𝑈1 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞1
 𝑈2 (𝑞1 , 𝑞2 ) = [12 − (𝑞1 + 𝑞2 )] ∗ 𝑞2

La representación extensiva del juego y su solución por inducción hacia atrás se


muestra en la siguiente figura:

Por inducción hacia atrás la solución es que la empresa líder decide producir seis
unidades. Esta decisión la toma luego de anticipar que la mejor respuesta de la
empresa dos sería producir cuatro unidades si ésta produce tres; cuatro unidades
si ésta produce cuatro y tres unidades si ésta decidiese producir seis.

3.9 Representación estratégica de juegos dinámicos

En esta sección se revisará la forma en que los juegos dinámicos se representan en


su forma estratégica.

76
Apuntes Docentes de Teoría de Juegos

Juego 1.- Considere el siguiente juego:

La solución del juego por inducción hacia atrás es {R, (R´, L´)}, es decir, si el juego
llega al primer nodo de decisión del jugador dos, luego de que el jugador uno jugara
L, su mejor respuesta sería jugar R´. Si el juego llega al segundo nodo de decisión
del jugador dos, luego de que el jugador uno jugara R, su mejor respuesta sería
jugar L´. El jugador uno que anticipa las mejores respuestas del jugador dos, jugaría
al comienzo del juego, la estrategia R:

Previo a representar el juego en su forma estratégica se hace necesario redefinir el


concepto de estrategia en juegos dinámicos. Una estrategia es un completo plan
de acción que específica una acción para el jugador en cada contingencia (nodo de
decisión) en que pueda ser llamado a decidir.

77
Apuntes Docentes de Teoría de Juegos

En el juego de la figura 3.4:

 El jugador uno tiene un nodo de decisión y tiene dos acciones (L o R). Por lo
tanto, tiene dos estrategias.
 El jugador dos tiene dos nodos de decisión y tiene dos acciones en cada nodo
(L´ o R´). Por lo tanto, tiene cuatro estrategias:
o Estrategia 1: (L´, L´): si el jugador uno juega L, entonces juega L´. Si el
jugador uno juega R, entonces juega L´.
o Estrategia 2: (L´, R´): si el jugador uno juega L, entonces juega L´. Si el
jugador uno juega R, entonces juega R´.
o Estrategia 3: (R´, L´): si el jugador uno juega L, entonces juega R´. Si el
jugador uno juega R, entonces juega L´.
o Estrategia 4: (R´, R´): si el jugador uno juega L, entonces juega R´. Si el
jugador uno juega R, entonces juega R´.

Cada estrategia del jugador dos le indica una acción a seguir en caso que tuviese
que decidir.
La representación del juego en forma estratégica se ilustra a continuación:
2
1 (L´, L´) (L´, R´) (R´, L´) (R´, R´)

L 3,1 3,1 1,2 1,2

R 2,1 0,0 2,1 0,0


Figura 3.4.2
La representación estratégica del juego permite determinar la existencia de dos
equilibrios de Nash: {R, (R´, L´)} y {L, (R´, R´)}.
Análisis de los equilibrios:
 El equilibrio {R, (R´, L´)} corresponde a todas las sendas de la solución por
inducción hacia atrás. Este equilibrio no sólo especifica el camino entre el nodo
inicial y uno de los nodos terminales sino también especifica que haría el jugador
dos si el jugador uno jugase L. Es decir, este equilibrio detalla una estrategia
completa para el jugador dos.

78
Apuntes Docentes de Teoría de Juegos

La solución de este equilibrio es la misma que sugiere el método de inducción hacia


atrás. Esto significa que los jugadores están tomando decisiones óptimas en todos
los subjuegos, es decir, hay un equilibrio de Nash en cada uno. Este equilibrio es
un equilibrio de Nash perfecto en subjuegos (ENPS)18.
 El equilibrio {L, (R´, R´)} especifica que el jugador dos jugará R´ en caso que
el jugador uno juegue L y que jugará R´ en caso que el jugador uno juegue R, lo que
no es plausible ya que jugar R´ en ese nodo no es una mejor respuesta.
La estrategia {L, (R´, R´)} se puede interpretar como una amenaza del jugador dos
al jugador uno si este juega R, con el fin de inducirlo a que juegue L. Sin embargo,
es una “amenaza no creíble” ya que si el jugador uno juega R la mejor respuesta
del jugador dos es jugar L´.
El equilibrio {L, (R´, R´)} no es un equilibrio de Nash perfecto en subjuegos porque
las acciones elegidas no constituyen un equilibrio de Nash en uno de sus subjuegos.
En particular, la decisión R´ no es óptimo en el subjuego que comienza en el nodo
de decisión que sigue la acción R por parte del jugador uno.
Segunda conclusión: en juegos dinámicos de información completa y perfecta, la
inducción hacia atrás elimina amenazas no creíbles.

Juego 2.- Considere el siguiente juego:

La solución por inducción hacia atrás es {(L, L”), L´}:

18
En la próxima sección se definirá el equilibrio de Nash perfecto en subjuegos.

79
Apuntes Docentes de Teoría de Juegos

La solución por inducción hacia atrás sugiere que al comienzo del juego el jugador
uno juega L y el juego termina con ganancias de 2 y 0 respectivamente.

Elementos para la representación en forma estratégica del juego:


 Acciones jugador uno: A1 = {L, R, L”, R”}
 Acciones jugador dos: A2 = {L´, R´}
 Estrategias jugador uno: S1 = {(L, L”), (L, R”), (R, L”), (R, R”)}
 Estrategias jugador dos: S2 = (L´, R´)

2
1 L´ R´

L, L” 2,0 2,0

L, R” 2,0 2,0

R, L” 1,1 3,0

R, R” 1,1 0,2
Figura 3.5.219

19
Note que las dos primeras filas son redundantes porque expresan las mismas ganancias. El motivo
es que, si el jugador uno juega L al comienzo de juego, éste finaliza. No obstante, debido a la
definición de estrategia que se ha adoptado como un plan de acción en todas las contingencias o
nodos de decisión, es necesario escribirla pese a su no plausibilidad. El razonamiento es “que haría
si…”. A lo largo del documento se continuará representando de esta forma a pesar de que existe una
forma reducida de presentar (para detalles sobre como representar la matriz en una forma reducida
ver Osborne y Rubinstein.

80
Apuntes Docentes de Teoría de Juegos

El juego tiene dos equilibrios de Nash: {(L, L”), L´} y {(L, R”), L´}. Sólo el equilibrio
{(L, L”), L´} induce un equilibrio de Nash en cada subjuego. En efecto, este equilibrio
es consistente con la solución por inducción hacia atrás. El segundo equilibrio es no
plausible porque descansa en una amenaza no creíble: que el jugador uno jugará
R” en su segundo nodo de decisión.

Tarea 3.1
Represente el juego de Stackelberg con variables discretas en forma estratégica.
Pista: La empresa uno tiene tres estrategias y la empresa dos tiene 9 estrategias.

3.10 Equilibrio de Nash Perfecto en Subjuegos

Un equilibrio de Nash es perfecto en subjuegos si las estrategias de los jugadores


constituyen un equilibrio de Nash en cada subjuego. Para entender lo anterior,
considere el siguiente juego en su representación extensiva:

81
Apuntes Docentes de Teoría de Juegos

Solución:
1° Encontrar los equilibrios de Nash del subjuego 1: El subjuego 1, es aquel que
comienza en el segundo nodo de decisión del jugador uno. La representación
extensiva y estratégica del subjuego se presenta a continuación:

2° Encontrar los equilibrios de Nash del subjuego 2: El subjuego 2, es aquel que


comienza en el nodo de decisión del jugador dos. La representación extensiva y
estratégica del subjuego se presenta a continuación:

82
Apuntes Docentes de Teoría de Juegos

3° Encontrar los equilibrios de Nash del juego completo: El último subjuego es el


juego completo, es decir, aquel que comienza en el nodo inicial. La representación
extensiva y estratégica del subjuego se presenta a continuación:

4° Se analizan los tres equilibrios de Nash con el objetivo de determinar cuál o


cuáles son equilibrios de Nash perfecto en subjuegos:
 El primer equilibrio es un equilibrio perfecto porque induce un equilibrio de
Nash en los dos subjuegos. Señala que el equilibrio de Nash en el primer
subjuego es u y que el equilibrio de Nash en el segundo subjuego es [u, l].
 El segundo equilibrio no es un equilibrio perfecto porque a pesar que señala
que el equilibrio de Nash en el primer subjuego es u; señala que el equilibrio
de Nash en el segundo subjuego es [u, r], el cual no es un equilibrio de Nash,
ya que, si el jugador uno juega u, la mejor respuesta del jugador dos es l y si
el jugador dos juega r, la mejor respuesta del jugador uno es d.
 El tercer equilibrio no es un equilibrio perfecto porque señala que el equilibrio
de Nash en el primer subjuego es d, la que no es una mejor respuesta del
jugador uno en ese nodo de decisión. Esta es una condición suficiente para
concluir que no es un equilibrio de Nash perfecto a pesar que señala que en
el segundo subjuego el equilibrio de Nash es [d, r], el cual efectivamente es

83
Apuntes Docentes de Teoría de Juegos

uno de los dos equilibrios de Nash de ese subjuego, ya que, si el jugador uno
juega d, la mejor respuesta del jugador dos es r.
Juego completo
Equilibrios de Nash [Uu, l] [Du, r] [Dd, r]
Subjuego 1 [u] cumple cumple no cumple
[u, l] cumple no cumple no cumple
Subjuego 2
[d, r] no cumple no cumple cumple

5° Resolver por inducción hacia atrás: se decía que el método de la inducción hacia
atrás elimina las respuestas que no son equilibrios de Nash. En el juego la solución
es: {(Uu), l}, es decir, el jugador uno juega U en el primer nodo de decisión y u en
su segundo nodo de decisión. El jugador dos en tanto, juega l en su nodo de
decisión.

En conclusión, el equilibrio de Nash [Uu, l] es un equilibrio de Nash perfecto en


subjuegos.

Ejercicio 3.1
Instrucciones: J1 elige U o D, donde D termina el juego con ganancia de 3 para J1
y 2 para J2. Si J1 eligió U entonces J2 elige L o R, donde R finaliza el juego con
ganancias de 2 para J1 y 3 para J2. Si J2 elige L entonces J1 elige entre u y d, y el

84
Apuntes Docentes de Teoría de Juegos

juego finaliza. Si elige u, J1 obtiene una ganancia de 5 y J2 una ganancia de 4; si


elige d, J1 obtiene una ganancia de 4 y J2 una ganancia de 2.
a) Represente el juego en forma extensiva.
b) Represente los subjuegos en forma estratégica y encuentre el(os) equilibrio de
Nash de cada uno.
c) Represente el juego completo en forma estratégica y encuentre el(os) equilibrio
de Nash.
d) Encuentre el equilibrio de Nash perfecto en sub juegos.
e) Resuelva por inducción hacia atrás.

3.11 Juegos dinámicos con información imperfecta

Hasta el momento, se han analizado juegos simultáneos y juegos dinámicos de


información perfecta. En los juegos simultáneos, los jugadores juegan con
información imperfecta, es decir, decidían sin conocimiento sobre la decisión del
otro jugador. En los juegos dinámicos de información perfecta, los jugadores
jugaban de manera secuencial, con perfecta información sobre la historia del juego.

Los juegos dinámicos de información imperfecta combinan ambos tipos de juegos:


dinámicos y simultáneos, esto es, en algún estado del juego, los jugadores deben
jugar con información imperfecta.

A lo largo del capítulo, los juegos simultáneos se representaron en forma estratégica


utilizando matrices de ganancias. Observe el siguiente juego simultáneo
representado en forma estratégica:

2
1 l m r

U a1, a2 b1, b2 c1, c2

D d1, d2 e1, e2 f1, f2


Figura 3.7

85
Apuntes Docentes de Teoría de Juegos

El juego se puede representar en forma extensiva de dos formas equivalentes. En


la primera el jugador uno comienza el juego; en la segunda, el jugador dos inicia el
juego. Observe que en este caso el timing no tiene importancia porque los jugadores
están jugando sin conocer la decisión del otro, es decir, el orden de las jugadas es
indiferente.

En una representación extensiva, la línea discontinua que une los nodos de decisión
denota la simultaneidad del juego.

En los juegos dinámicos de información perfecta, los nodos representan conjuntos


de información. En aquellos juegos, los conjuntos de información están compuestos
por nodos unitarios, es decir, cada nodo representa un conjunto de información. En
la representación extensiva de un juego de información imperfecta, los conjuntos de
información son no unitarios, es decir, están conformados por más de un nodo.

En la primera representación, esto quiere decir que el jugador dos sabe que el
jugador uno jugó, pero no sabe que jugó, es decir, no sabe en cuál de sus dos nodos
está. En la segunda representación, el jugador uno sabe que el jugador dos jugó,
es decir, sabe que el juego está en su conjunto de información, pero no sabe en
cuál de sus tres nodos de decisión está.
86
Apuntes Docentes de Teoría de Juegos

En este tipo de juegos, una estrategia es un completo plan de acción que específica
una acción para el jugador en cada conjunto de información en que pueda ser
llamado a decidir.

Algunas reglas para representar juegos de información imperfecta:

1° Cada conjunto de información contiene nodos de decisión para sólo uno de los
jugadores.
2° Todos los nodos en un conjunto de información deben contener el mismo número
de sucesores inmediatos.
3° Los nodos deben tener el mismo conjunto de acciones disponibles en las ramas
que llevan a los sucesores.

Ejemplo 3.2.

Resuelva por inducción hacia atrás el siguiente juego de información perfecta:

Resolviendo por inducción hacia atrás el argumento es que el jugador uno no elige
U o M porque su elección será observada por el jugador dos, y éste elegirá d o u y

87
Apuntes Docentes de Teoría de Juegos

la ganancia del jugador uno será 0. Jugador uno elegirá D porque anticipa que el
jugador dos elegirá u y por lo tanto tendrá una ganancia de 1 que es mayor que 0.

Ahora resuelva el juego incorporando información imperfecta:

Ahora, si el jugador uno eligió D, el jugador dos sabe en que nodo está. Sin
embargo, si el jugador uno eligió U o M el jugador dos no sabe en que nodo está,
es decir, no sabe si el jugador uno eligió U o M y el jugador uno sabe que el jugador
dos no sabe en que nodo está. En este caso ya no es tan obvio que el jugador uno
juegue D. El jugador uno podría pensar que el jugador dos mezclará sus acciones
(estrategias mixtas), por ejemplo, jugando ½ de las veces u y ½ de las veces d y,
por lo tanto, la ganancia esperada del jugador uno producto de la estrategia mixta
del jugador dos será 2 que es mayor que 1 que es la ganancia que obtendría al
jugar D.

Tercera conclusión: si el juego no es de información perfecta, es decir, si hay en


la forma extensiva algún conjunto de información no unitario, el algoritmo de
inducción hacia atrás puede ser no aplicable. Para resolver juegos dinámicos con
información imperfecta se pueden determinar el o los equilibrios de Nash perfectos
en subjuegos utilizando el algoritmo de inducción hacia atrás generalizada; esto es,
88
Apuntes Docentes de Teoría de Juegos

un procedimiento para determinar ENPS cuando existen subjuegos propios con


conjuntos de información no unitarios para al menos un jugador.

Ejemplo 3.3.
Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego20:

Solución:
1° Resuelva los dos subjuegos propios:

20
Ver Pérez, Jimeno y Cerda.

89
Apuntes Docentes de Teoría de Juegos

2° Una vez que se ha determinado cómo se jugará en cada uno de los subjuegos
propios, el jugador uno se enfrenta a la decisión de jugar I, C o D, que le producirían
ganancias de 6, 5 o 2, respectivamente. Represente el juego en forma reducida y
resuelva por inducción hacia atrás:

90
Apuntes Docentes de Teoría de Juegos

En conclusión, el equilibrio de Nash perfecto en subjuegos es el perfil estratégico


{(I-I´), (i-i´)}.

Ejercicio 3.4

Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego21:

Observe que este juego denota el problema con el método de la inducción hacia
atrás. El último subjuego propio es un juego de suma cero, sin estrategias
dominadas ni equilibrio de Nash en estrategias puras.

Se procede, en este caso, a encontrar el equilibrio de Nash en estrategias mixtas.


Luego de encontrar el equilibrio, se procede a podar el árbol y poner en el último las
ganancias esperadas asociadas al equilibrio mixto.

Solución:

1° Representa el subjuego en la forma estratégica:

21
Ver Fundenberg y Tirole

91
Apuntes Docentes de Teoría de Juegos

2
1 C D

C 2, -2 -2, 2 p

D -2, 2 2, -2 1–p

q 1-q
Q
Figura 3.11.1

2° Encontrar el equilibrio de Nash en estrategias mixtas:

2.1 Encontrar la mezcla Q del jugador dos que hace al jugador uno indiferente
entre jugar cara o sello y calcular las ganancias esperadas:

Se calculan e igualan las ganancias esperadas de jugador uno al jugar C y S versus


la mezcla del jugador dos (Q):

 UE1 (C, Q) = 2*q + -2*(1- q)

 UE1 (D, Q) = -2*q + 2*(1- q)

Para el jugador uno, la decisión de jugar C o D es indiferente si sus ganancias


esperadas (versus la estrategia mixta Q del jugador dos) son iguales, es decir, si:

UE1 (C, Q) = UE1 (D, Q)

q = 1/2

Para el jugador uno, las estrategias C y D son indiferentes, si el jugador dos elige C
con una probabilidad de q = 1/2 y elige D con una probabilidad 1 – q = 1/2.

Ganancias esperadas:

UE1 (C, Q) = 2*q + -2*(1- q) = 2 * (1/2) + -2 * (1/2) = 0

UE1 (D, Q) = -2*q + 2*(1- q) = -2 * (1/2) + 2 * (1/2) = 0

92
Apuntes Docentes de Teoría de Juegos

2.2 Encontrar la mezcla P del jugador uno que hace al jugador dos indiferente
entre jugar C o D.

Se calculan e igualan las ganancias esperadas de jugador dos al jugar C y D versus


la mezcla del jugador uno (P):

UE2 (P, C) = -2*p + 2*(1- p)

UE2 (P, D) = 2*p + -2*(1- p)

Para el jugador dos, la decisión de jugar C o D es indiferente si sus ganancias


esperadas (versus la estrategia mixta P del jugador uno) son iguales, es decir, si:

UE2 (P, C) = UE2 (P, D)

p = 1/2

Ganancias esperadas:

UE2 (P, C) = 2*p + -2*(1- p) = 2 * (1/2) + -2 * (1/2) = 0

UE2 (P, D) = -2*p + 2*(1- p) = -2 * 1/2 + 2 * (1/2) = 0

2.3 Determinar las ganancias esperadas de ambos jugadores al jugar las


mezclas P y Q:

UE1 (P, Q) = p * [UE1 (C, Q)] + (1 - p) * [UE1 (S, Q)]

UE1 (P, Q) = 1/2 * (0) + 1/2 * (0)

UE1 (P, Q) = 0

UE2 (P, Q) = q * [UE2 (P, C)] + (1 - q) * [UE1 (P, S)]

UE2 (P, Q) = 1/2 * (0) + 2/3 * (0)

UE2 (P, Q) = 0

2.4 El equilibrio de Nash en estrategias mixtas del subjuego es:

[(p, 1 – p), (q, 1 – q)] = [(1/2, 1/2), (1/2, 1/2)]

93
Apuntes Docentes de Teoría de Juegos

2.5 Las ganancias asociadas al equilibrio son (0, 0).

3° Reemplazar las ganancias esperadas del equilibrio de Nash en el árbol


reducido y resolver por inducción hacia atrás:

4° El equilibrio de Nash perfecto en subjuegos es {[R, (1⁄2 , 1⁄2)], [L, (1⁄2 , 1⁄2)]}.
Este equilibrio indica que el jugador uno jugará R en su primer nodo de decisión y
jugará A con una probabilidad de 1⁄2 y jugará B con una probabilidad de 1⁄2 si el
juego llega a su segundo nodo de decisión. El jugador dos por su parte, jugará L en
su primer nodo de decisión y jugará C con una probabilidad de 1⁄2 y jugará D con
una probabilidad de 1⁄2 si el juego llega a su segundo nodo de decisión.

La predicción del desarrollo del juego es que el jugador uno jugará R y luego
terminará con la decisión del jugador dos jugando L. Este equilibrio trae asociadas
ganancias de 3 y 1, respectivamente.

Ejercicio 3.5

Resuelva el equilibrio de Nash perfecto en subjuegos del siguiente juego 22:

22
Ver Pérez, Jimeno y Cerda.

94
Apuntes Docentes de Teoría de Juegos

Solución:

1° Representar el subjuego propio, que comienza en el nodo de decisión del jugador


dos, en forma estratégica y encontrar los equilibrios de Nash:

2
1 A B

A -2, -2 4, 2

B 1, 4 -1, -1

Figura 3.12.1

Note que este subjuego tiene dos equilibrios de Nash: (A, B) y (B, A).

95
Apuntes Docentes de Teoría de Juegos

2° Reemplazar en el árbol original las ganancias asociadas a los dos equilibrios de


Nash y resolver por inducción hacia atrás:

3° El juego tiene dos equilibrios de Nash perfectos: {DA, B} y {IB, A}. Si (A, B)
es el equilibrio de Nash que se supone se jugará en el subjuego, la elección óptima
del jugador uno al comienzo del juego sería jugar D. Si (B, A) es el equilibrio de
Nash que se supone se jugará en el subjuego, la elección óptima del jugador uno al
comienzo del juego sería jugar I y terminar el juego.

96

También podría gustarte