Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEORÍA DE JUEGOS
En las universidades bolivianas, la asignatura de Investigación Operativa en la
década de los ochenta, si bien incorporaba en su contenido el estudio a la Teoría de Juegos,
se hacía referencia de ella como un capítulo introductorio matemático para facilitar el
aprendizaje de la Teoría de Decisiones, mientras que matemáticos prestigiosos en todo el
orbe profundizaban en su aplicación teórica y práctica en las ciencias: económica,
informática, biología, sociología, estrategia militar y otras, de cuyos resultados se otorgaron
varios premios Nobel de Economía. Continúa siendo objeto de estudio del comportamiento
del pensamiento estructurado en la toma de decisiones. Hoy en día, en el ámbito de la
Investigación de Operaciones, merece un tratamiento que permite conocer las fronteras del
desarrollo de esta teoría, mientras que en los ámbitos de la ciencia económica ha sentado las
bases para que se convierta en ciencia exacta, por su profunda formulación matemática y de
amplia aplicación en diferentes especialidades de la Economía.
La Teoría de Juegos, por lo tanto, alejada de ser tratada como una metodología
infalible, debe ser considerada, para el fin de nuestro aprendizaje, como una herramienta que
necesariamente debe tratarse desde una óptica intelectiva muy crítica y consciente de las
limitaciones que aún presenta en su contexto.
Este primer capítulo del libro, no profundiza precisamente en la extensión de las
investigaciones de los laureados Nobel, sobre todo por el sesgo económico que no
corresponde a un curso semestral de la asignatura, pero se cumple con la presentación
ejemplificada de casos que permiten obtener una adecuada destreza en su aplicación.
En 1975 descubrió que para eliminar todos los equilibrios ¨no racionales¨ había que
introducir un refinamiento que denominó ¨la perfección de la mano temblorosa¨, un concepto
que establece que los equilibrios deben ser robustos con respecto a pequeñas
modificaciones de estrategias. Al intentar calcular el equilibrio de Nash, descubrió que
generalmente existen equilibrios múltiples, algunos de los cuales son incompatibles con la
racionalidad, para eliminarlos propuso el refinamiento de equilibrio perfecto en Subjuegos. La
idea es que una vez que una situación llega a un subjuego, todo lo que está fuera de él es
irrelevante, de manera que la lógica que fundamenta el equilibrio, también puede ser aplicado
en el juego. En acápites posteriores, se podrá observar este elemento que se analiza en este
párrafo.
En el 2007, Roger Myerson, junto con Leonid Hurwicz y Eric Maskin, recibieron
el Premio en Ciencias Económicas en memoria de Alfred Nobel por sentar las bases de la
teoría de diseño de mecanismos, a continuación se analizan las contribuciones individuales
de cada científico mencionado en este Nobel.
Roger Myerson, profesor de la Universidad de Chicago se doctoró con su contribución
a la Teoría de Juegos cooperativos y a partir de ella, trabajó afinando la teoría para el diseño
de los mecanismos que desempeña un papel clave en las relaciones políticas y económicas
que fue formulada por Leonid Hurwicz en 1960. Su contribución en el diseño de mecanismos,
ha ampliado el campo del análisis económico añadiendo restricciones relacionadas con los
incentivos a las restricciones relacionadas con los recursos en una definición del problema
económico. Las restricciones relacionadas con los incentivos proporcionan un marco analítico
que sirve para comprender los fallos de la eficiencia asignativa, mostrando cómo tales fallos
pueden depender de la asignación inicial de derechos de propiedad en una sociedad. Los
conceptos de eficiencia respecto a los incentivos se pueden aplicar para identificar buenas
reglas institucionales o mecanismos, en la actualidad el marco teórico es lo suficientemente
amplio como para analizar problemas de incentivos competitivos tanto en los mercados como
en la política.
Erick Maskin, profesor de matemáticas en Princeton desde el 2001, aportó a la base
teórica elaborada por Hurwicz con la Teoría de la implementación, que permite diseñar un
mecanismo, de modo que todos los resultados posibles sean óptimos, pero sin perder la
noción del principio de la actividad proporcional del asunto inverso de lo opuesto. Adam
Smith parte del principio que el funcionamiento eficiente del mercado es una consecuencia de
la mano invisible, sin embargo, en la práctica, las condiciones no son por regla general
óptimas, la competencia no es completamente libre y los consumidores no están
perfectamente informados, elementos que tuvieron en cuenta a la hora desarrollar su teoría.
En 1959, Leonid Hurwicz como profesor invitado de la Universidad de Stanford,
publicó su influyente artículo sobre diseño de mecanismos titulado ¨Optimality and
Informational Efficiency in Resource Allocation Processes¨. Posteriormente centró sus
investigaciones sobre el diseño de mecanismos y en teoría de la compatibilidad de
incentivos, muy relacionados con los autores anteriormente señalados, ampliamente
utilizados en economía, sociología y ciencias políticas como instrumento para conseguir el
diseño de instituciones que optimicen ciertos resultados dados. Hoy se utilizan para analizar y
comprender las iteraciones entre instituciones e individuos, así como en el funcionamiento de
los mercados.
Por sus estudios sobre el mecanismo óptimo para alcanzar al mismo tiempo objetivos
diferentes como en el bienestar social y ganancias privadas que relaciona a los aportes de
Erick Maskin y Roger Myerson, recibieron el Nobel de Economía.
En 1962, explicó cómo los individuos buscan un asociado para establecer una
amistad, si los jugadores no discrepan de las ventajas que hacen a un juego perfecto. El
¨Valor de Shapley¨ nombrado por él, es un concepto a través del cual los beneficios de la
cooperación pueden ser proporcionalmente divididas entre los participantes basados en su
contribución relativa.
Si se abstrae la idea que una situación se presenta con dos competidores en una
matriz m x n, para uno de los jugadores, J1 en la competencia, se presentan variables
controlables y no controlables, entonces:
J2
y1 y2
x1 U(X,Y)
J1
x2
De manera que un pago se expresa como U (x,y), es decir que ambas variables
influirán sobre un beneficio que recibiría, por decidir por una alternativa.
Sí además existe (x), que es una función de distribución cualquiera de
probabilidades de U, que está relacionada con la probabilidad de la alternativa a decidirse,
entonces el pago esperado, se expresa, en términos continuos como:
V = (x,y) Px Qy
D12 > 0 significa que V1 > V2 existe ganancia por parte de J1.
D12 < 0 significa que V1 < V2 existe ganancia por parte de J2.
D12 = 0 significa que V1 = V2 existe un empate ente J1 y J2.
INCREMENTAR PUBLICIDAD
POR RADIO Y TELEVISIÓN 2 6
REALIZAR VENTA PERSONAL
3 1
Los valores en la matriz de pagos son las ganancias en función del jugador 1 y se
expresan en [Bs] x 105. Estos pagos deben ser resultado de un análisis de tipo económico
financiero para establecerlos, no es indispensable para propósitos del libro plantear rutinas de
cálculo particulares, puesto que pueden ser múltiples.
Una vez que se planteó esta teoría, fueron múltiples los matemáticos de diversas
universidades del planeta que propusieron métodos de cálculo para los juegos bipersonales
de suma cero, que se plantean a continuación.
El primer método que se presenta para determinar el valor del juego de una matriz de
pagos es el punto de ensilladura que se establece mediante la aplicación del concepto
maximin para el jugador 1 y minimax para el jugador 2, concepto básico utilizado por los
creadores de la teoría.
La determinación de la estrategia para el jugador 1, inicialmente considera los peores
resultados posibles por fila y de ellos el mejor de los peores. El jugador 2, establece una
lógica de operación contraria, es decir minimax. Considera los mejores resultados en la
aplicación de sus estrategias por columna y de ellos el peor de los mejores.
En caso de encontrar correspondencia entre las estrategias asumidas por los
jugadores 1 y 2, entonces se dice que existe punto de silla y el juego es estable. Analícese
el siguiente ejemplo.
J2
y1 y2 y3 y4 y5
x1 9 3 1 8 0 0
J1 x2 6 5 4 6 7 4 maximin
x3 2 4 3 3 8 2
x4 5 6 2 2 1 1
9 6 4 8 8
minimax
y1 y2
x1 a11 a12
x2 a21 a22
xi es la probabilidad de que el jugador J1 asuma la estrategia i.
yj es la probabilidad de que el jugador J2 asuma la estrategia j.
x1 + x2 = 1 (1)
y1 + y2 = 1 (2)
Restando miembro a miembro las ecuaciones (3) de (4) y (5) de (6), se obtienen:
1 - x2 a22 - a21
=
x2 a11 - a12
Operando algebraicamente:
a11 - a12
x2 =
a11 - a12 + a22 - a21
a11 - a12
x2 = (11)
a11 + a22 - (a12 + a21)
x1 a22 - a21
=
1 - x1 a11 - a12
Operando algebraicamente:
a22 - a21
x1 =
a11 - a12 + a22 - a21
a22 - a21
x1 = (12)
(a11 + a22) - (a12 + a21)
Remplazando las ecuaciones (11) y (12) en el valor esperado del juego, ecuación (3)
a11 x1 + a21 x2 V
J2
y1 y2
x1 - 5 6
J1
x2 4 - 3
Reemplazando los valores de la matriz en la ecuación del valor esperado del juego:
1.4.3 Juegos 2 x n
J2
Y1 Y2 Y3 Y4 Y5
X1 1 4 -1 -5 6
J1
X2 3 2 6 4 -3
a i j p + a i j (1-p) Vj
GRÁFICO 1.1
GRAFICACIÓN PARA EL MÉTODO 2 X N DE JUEGOS DE ESTRATEGIA
7 - Ec. (5)
-
-
4 - Ec. (2)
-
-
- Ec. (1)
0 1 P
- Ec. (3)
-2 -
-
- DOMINIO
-5 - Ec. (4)
El dominio del juego se encuentra limitado por las inecuaciones 4 y 5, de manera que
del resultado, se obtiene una submatriz conformada por las columnas 4 y 5, siendo igual a:
J2
Y1 Y2
X1 -5 6
J1 X2 4 -3
Esta matriz de pagos no tiene punto de ensilladura, por tanto aplicando la relación del
sub epígrafe anterior, se obtiene el valor esperado del juego
V=½
No debe olvidarse la contemporaneidad entre los dos más destacados científicos del
siglo XX en esta disciplina, G. Dantzig y John Von Neumann, creadores del Simplex y la
Teoría de Juegos respectivamente. Ambos se dieron cuenta de la correspondencia entre
ambos modelos, es decir, la programación lineal puede ser expresada como juego y
recíprocamente, el juego se expresa en términos de programación lineal.
m m m
máx min a i1 x i , a i2 x i, ......., a in xi )
i=1 i=1 i=1
Es decir, determinar por fila los menores valores y de éstos, el mayor valor, dando
cumplimiento al concepto de maximin para el jugador 1 y recíprocamente para el segundo
jugador el minimax como:
n n n
min max a 1j y i , a 2j y i, ......., a nj yj )
j=1 j=1 j=1
x1 + x2 + ........ + x m = 1
y1 + y2 + ........ + y m = 1
x i, y j 0
m m m
V = min ( a i1 x i , a i2 x i, ......., a in xi )
i=1 i=1 i=1
En términos de programa lineal, se expresa como:
1
máx min V
V
m
Sujeto a: a in xi V
i=1
m
xi =1
i=1
xi0
Para que el juego tenga solución, todos los elementos de la matriz de coeficientes
tecnológicos A, deben ser mayores a cero; por ello, si existieran aij 0, debe considerarse un
elemento K, tal que sumados a todos los elementos de la matriz los convierta en mayores a
cero.
xi
Xi =
V
min V = X1 + X2 + Xn
s.a:
XI 0
Para el jugador J2, el problema se expresa exactamente como el DUAL del programa
lineal planteado, de la manera siguiente:
1
max Y = = Y1 + Y2 + Yn
V
s.a:
YJ 0
X1 3 -1 0
J1
X2 -2 1 -1
Como existen valores negativos, entonces debe sumarse una constante K = 3, que es
lo suficientemente mayor para convertir los elementos de la matriz en mayores a cero. La
nueva matriz es:
J2
Y1 Y2 Y3
X1 6 2 3
J1
X2 1 4 2
max Y = Y1 + Y2 + Y3
s.a.
6 Y1 + 2 Y2 + 3 Y3 V
Y1 + 4 Y2 + 2 Y3 V
V = (1 / max Y) - K
V = 8/3 – 3 = -1/3
yi = Yi / V
Entonces: y2 = Y1 / V = 0 / -1/3 = 0
y3 = Y3 / V = ¼ / -1/3 = -3/4
Aplicando el dual se obtienen los valores siguientes para las estrategias del jugador J 1
J2
-1 2 1 -3 1 17 17/46
J1 1 -2 2 3 -4 20 20/46
3 4 -3 -1 7 9 9/46
-2 4 -1
-2 -6 5
14 12 20 46/46
E(V) = Pj aij
Para calcular el valor esperado del juego por fila, se toma la segunda estrategia de J1.
Este método es el más aplicado debido a la sencillez del cálculo y su versatilidad para
ser programado en algún lenguaje de computador.
┌──────┬─────┬───────┐
│ 1 │ 0 │ 2 │ 0 1 1 2 2 4 6 7 9 11
├──────┼─────┼───────┤
│ 3 │ 0 │ 0 │ 0 3 3 6 6 6 6 9 9 9
├──────┼─────┼───────┤
│ 0 │ 2 │ 1 │ 2 2 4 4 6 7 8 8 9 10
└──────┴─────┴───────┘
1 0 2
1 2 3
4 2 3
4 4 4
7 4 4
7 6 5
7 8 6
7 10 7
10 10 7
10 12 8
0,8 V 1,1
Bajo esta nueva concepción, la Teoría de Juegos distingue dos modelos distintos en su
planteamiento: Juegos Cooperativos y Juegos No Cooperativos.
En un Juego Cooperativo, los jugadores disponen de mecanismos que permiten tomar
acuerdos vinculantes antes del juego, es decir, los jugadores pueden cooperar formando
coaliciones de jugadores con el fin de obtener mayores beneficios. La idea central es el
reparto de beneficios de los jugadores que forman la coalición. La Teoría de Juegos
Cooperativos analiza la importancia o influencia que ha tenido cada jugador en la obtención
del beneficio, para proponer un reparto de beneficios adecuado.
Un Juego No Cooperativo o Competitivo, no permite negociar e imponer un contrato
vinculante. Cada jugador busca su máximo beneficio, no se permite ningún tipo de acuerdo
previo entre jugadores. La Teoría de Juegos No Cooperativos estudia las múltiples
estrategias que pueden emplear cada uno de los jugadores. Dependiendo de las diferentes
estrategias que se asuman, existe una función de pagos asociada a cada jugador.
Los Juegos No Cooperativos, se clasifican en:
Juegos estáticos y dinámicos.
Juegos sin información completa y con información completa.
Los juegos estáticos son aquellos en los que las decisiones de los jugadores no saben lo
que han decidido los otros.
En los juegos dinámicos, al menos uno de los jugadores debe saber qué decisión han
tomado los otros jugadores antes de tomar la suya.
En los juegos con información completa no son el tipo de juego más habitual, pero son
muy útiles como ejemplos didácticos (dilema del prisionero).
En los juegos sin información completa, que son los más comunes, todos o alguno de los
jugadores desconocen alguna de las consecuencias, describen situaciones en las que
algunos jugadores desconocen información acerca de los otros jugadores, como pueden ser
sus pagos o preferencias.
A continuación se mencionan algunos ejemplos de juegos sin información completa:
Competencias entre empresas que desconocen los costes de sus rivales.
Un vendedor conoce la verdadera calidad del producto, pero el comprador no.
Un trabajador nuevo en la empresa conoce su verdadera productividad y el
empresario no.
Una negociación entre un vendedor y un comprador en la que el primero no conoce la
valoración del segundo.
Una subasta en la que cada participante conoce su propia valoración del objeto, pero
no la valoración de los demás.
Una vez que se tiene conformada la matriz de pago, entonces es necesario verificar las
estrategias dominantes, si el caso es de beneficio, entonces existirán probablemente unas
estrategias que sean dominantes en comparación a otras. Para los fines del juego, existen
dos tipos de dominio estratégico que son:
En un juego estratégico estático o juego simultáneo, cada jugador ejecuta una acción
sin conocer la alternativa elegida por los demás jugadores.
Estrategias racionalizables
Equilibrio de Nash
Estrategias racionalizables
J2
C1 C2 C3 C4
F1 7,0 10,100 14,109 3,5
J1
F2 0,16 10,0 0,18 0,6
F3 20,9 8,0 11,11 0,7
F4 14,20 2,300 10,8 10,7
Solución:
Se observa en las estrategias para J2, que la columna C4 se encuentra estrictamente
dominada por C3, dado que:
J2
C1 C2 C3
F1 7,0 10,100 14,109
J1
F2 0,16 10,0 0,18
F3 20,9 8,0 11,11
F4 14,20 2,300 10,8
Si J2 se anticipa, lo que requiere saber de J1, sabe que J1 es racional. Por lo tanto,
sabe que los únicos resultados posibles son:
J2
C1 C2 C3
J1 F1 7,0 10,100 14,109
F2 0,16 10,0 0,18
F3 20,9 8,0 11,11
J2
C1 C3
J1 F1 7,0 14,109
F2 0,16 0,18
F3 20,9 11,11
J2
C1 C3
J1
F1 7,0 14,109
F3 20,9 11,11
En la nueva submatriz de pagos, J2 no debe elegir C1 porque se encuentra dominada
por C3, dado que:
109 > 0 , 11 > 9
J2
C3
J1
F1 14,109
F3 11,11
J2
J1 C3
F1 14,109
Ejemplo 8. Dada la siguiente matriz de pagos que representa la utilidad esperada por
ventas en 106 Bs, determine la estrategia comunicacional más conveniente para las empresas
del problema. J1 representa a la empresa Sony y J2 a la empresa Samsung, ambas en el
mercado de Bolivia.
J2
Sin publicidad Radio Televisión
Sin publicidad 13,4 11,9 8,14
J1 Radio 17,3 13,5 10,13
Televisión 20,1 15,7 10,4
Para J1 la estrategia 'Sin publicidad' está dominada por la estrategia publicidad por
'Radio':
17 > 13 , 13 > 11 , 10 > 8
J2
Radio Televisión
Radio 13,5 10,13
J1
Televisión 15,7 10,4
15 > 13 y 10 ≥ 10
De manera que debe eliminarse la estrategia 'Radio' para J1, quedando la matriz de
pagos reducida a:
J2
Radio Televisión
J1 Televisión 15,7 10,4
J2
Sin publicidad Radio Televisión
Sin publicidad 13,4 11,9 8,14
J1 Radio 17,3 13,5 10,13
Televisión 20,1 15,7 10,4
J2
Radio Televisión
Radio 13,5 10,13
J1
Televisión 15,7 10,4
13 > 5 , 4 no es > 7
Antes de definir el concepto de equilibrio de Nash, en opinión del autor, tal vez sea
necesario comprender un fenómeno que ocurre en la venta de ¨sandwich de chola¨, durante
el funcionamiento de la feria de la ciudad de ¨El Alto¨, la mayor del continente, los días jueves
y domingo. La pregunta es comprender, el por qué las vendedoras se concentran
justamente en la mitad de la feria, pudiendo racionalmente distribuirse a lo largo de ella.
Inicialmente supongamos que por efectos de una medida municipal del GAMEA, se
distribuyen los puestos de venta a un tercio de cada extremo de la feria, tal como se
representa en la figura.
VENDEDORA A VENDEDORA B
La distribución de sus compradores se inicia con racionalidad, puesto que existe una
línea imaginaria que las divide, sin embargo la vendedora B, más viva que la otra, decide
incrementar sus ventas, de manera que decide, sin tomar en cuenta la norma municipal,
como es ¨normal¨ en este tipo de actividad comercial, moverse más a la izquierda, para así
arrebatarle más clientes a la vendedora A e incrementar sus ventas, llegando a la siguiente
posición.
VENDEDORA A VENDEDORA B
Como ha incrementado sus ventas por haber arrebatado los clientes de la vendedora
A, que ahora se encuentran más cercanas a su puesto de venta, entonces, decide acercarse
más aún hasta juntarse a la vendedora A.
VENDEDORA A VENDEDORA B
VENDEDORA B VENDEDORA A
VENDEDORA A VENDEDORA B
Es una norma autosostenible: Un vez aceptada, ningún jugador tiene incentivos para
no seguirla.
Cada jugador responde de la mejor manera que puede, frente a las estrategias de los
demás jugadores.
Es un perfil de expectativas que se autoconfirman: Si los jugadores esperan que los
demás se comporten de acuerdo con lo prescrito, entonces estas acciones ocurren
como consecuencia de la conducta de los jugadores.
Para cada jugador i Ɛ N y para cada perfil de estrategias de los demás jugadores
s-i Ɛ Si, se identifica la estrategia (o estrategias) que maximiza la utilidad del jugador i.
Esto es BRi (s’i ) como la Mejor Respuesta (Best Response) del jugador i al perfil s-i.
Esta interpretación permite reformular el concepto de equilibrio de Nash como una
solución a un sistema de ecuaciones. Sea, por ejemplo, el equilibrio de Nash S * = (
S1*, S2* ), resuelve el sistema:
{
S1 Ɛ BR1(S2)
Sistema
S2 Ɛ BR2(S1)
S1 Ɛ BR1(S2) S2 Ɛ BR2(S1)
J2
I2 D2
I1 1,1 0,0
J1
D1 0,0 1,1
Si J2 elige I2 ,la mejor opción para J1 es elegir I1 pues 1 > 0 y se marca con (×)
.
J1
{
Si J2 elige D2 la mejor opción para J1 es elegir D1 pues 1 > 0 y se marca con
asterisco (x).
J2
I2 D2
I1 1x,1 0,0
J1
D1 0,0 1x,1
Si J1 elige I1 ,la mejor opción para J2 es elegir I2 pues 1 > 0 y se marca con (°)
.
J2
{
Si J1 elige D1 la mejor opción para J2 es elegir D2 pues 1 > 0 y se
marca con asterisco (°) .
J2
I2 D2
I1 x
1 ,1° 0,0
J1
D1 0,0 1x,1°
Las entradas de la matriz donde se han marcado los pagos son (I1 , I2 ) y (D1 , D2 ),
por tanto, el equilibrio de Nash, múltiple en este caso, se establece como:
EN = {(I1,I2),(D1,D2)}
Una aplicación del equilibrio de Nash puro, es el dilema del prisionero que se analiza a
continuación:
Prisionero 2
Delata D2 No Delata ND2
Prisionero Delata D1 -6,-6 -1,-10
1 No Delata ND1 -10,-1 -2,-2
Prisionero 2
Delata D2 No Delata ND2
Prisionero Delata D1 R,R P,T
1 No Delata ND1 T,P C,C
Donde:
− 6 > − 10 y −1 > − 2
Prisionero 2
Delata D2 No Delata ND2
Prisionero
Delata D1 -6,-6 -1,-10
1
− 6 > − 10
Compañía B
Hacer No hacer
publicidad publicidad
Hacer
10,5 15,0
Compañía publicidad
A No hacer
6,8 18,2
publicidad
Compañía
B
Hacer
publicidad
Hacer
10,5
Compañía publicidad
A No hacer
6,8
publicidad
Jugador 2
Estrategia A Estrategia B
p1A , p2B
Jugador 1 Estrategia B Estrategia A
p1,B , p2A
Estrategia B
Jugador 2
P1,B , p2B
La forma extensiva debe representar la información con la que cuenta cada jugador
en el momento de tomar una decisión en forma de árbol. Cuando un jugador posee la misma
información en más de un nodo, estos nodos se unen con una línea discontinua. Así, en
estos nodos un jugador no puede distinguir su ubicación exacta en el juego.
Un Conjunto de Información es un conjunto formado por nodos entre los cuales un
jugador no puede distinguir su posición en el juego cuando toma una decisión. Es decir, al
conjunto de nodos conectados mediante líneas discontinuas. Generalmente esto ocurre
cuando el jugador no puede observar las acciones que toman otros jugadores en los nodos
predecesores.
Todo nodo de decisión pertenece a un Conjunto de Información.
Todos los nodos que pertenecen al mismo Conjunto de Información tienen el mismo
número de sucesores inmediatos y deben tener el mismo conjunto de acciones sobre las
ramas (diferentes acciones que un jugador puede elegir) que conducen a estos. Si no fuera
así, el jugador podría distinguir entre los nodos.
Cada juego en forma extensiva posee una representación en forma normal. Sin
embargo, cada juego en forma normal puede poseer más de una representación en forma
extensiva.
En este sentido, existe una discusión sobre si en realidad los juegos en forma normal
contienen toda la información requerida.
Sin embargo, los juegos estáticos (one‐shot games) poseen una buena
representación en forma normal al no existir discrepancia en la información entre esta
representación y la forma extensiva.
IZQUIERDA I
2,5
ARRIBA A
J2
DERECHA D 5,2
J1
IZQUIERDA I 0,0
ABAJO B
J2
DERECHA D 3,1
J2
Izquierda I Derecha D
Arriba A 2,5 5,2
J1
Abajo B 0,0 3,1
Sin embargo, como es un juego secuencial no es un equilibrio perfecto. Para hallar el
equilibrio perfecto en subjuegos, se debe partir hacia atrás a partir del último movimiento.
En este ejemplo, considerando los subjuegos, se sabe que el jugador 2 irá a la
izquierda, si el jugador 1 va arriba, e irá a la derecha si el jugador 1 va abajo, ya que estos
movimientos maximizan los pagos del jugador 2.
Como hay información completa y por tanto, los pagos de cada jugador se saben, el
jugador 1 anticipa estos movimientos y decide ir abajo, maximizando su pago, es decir, abajo
derecha es el equilibrio perfecto en subjuegos.
J2
Izquierda I Derecha D
Arriba A 2,5 5,2
J1
Abajo B 0,0 3,1
J2
Estrategia X Estrategia Y
Estrategia A 2,5 8,4
J1
Estrategia B 3,3 5,2
ESTRATEG A
J2
ESTRATEGIA Y 8,4
J1
ESTRATEGIA X 3,3
ESTRATEG B
J2
ESTRATEGIA Y 5,2
ESTRATEGIA X
2,5
J2
ESTRATEGIA Y 8,4
J2
ESTRATEGIA Y 5,2
ESTRATEGIA X 2,5
ESTRATEG A
J2
ESTRATEGIA Y 8,4
J1
ESTRATEGIA X 3,3
ESTRATEG B
J2
ESTRATEGIA Y 5,2
Ejemplo 14. Un juego que en su representación extensiva tiene la forma:
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,1
J1
ESTRATEG B
2,5
ESTRATEGIA C
2,3
J1
ESTRATEGIA D 3,2
J2 EST D 3,2
ESTRATEGIA Y 2,1
Seguimos por inducción hacia atrás y ahora se verá: ¿qué haría el jugador 1 en el
primer nodo porque tendría que elegir entre las estrategias A y B?. Si sigue la estrategia A,
se sabe que el jugador 2 elegirá la estrategia X, y de nuevo el jugador 1 elegirá la estrategia
D, por consiguiente, si decide por la estrategia A, acabará recibiendo un pago de 3, mientras
que si optase por la estrategia B, recibiría un pago de 2, por consiguiente siendo 3 > 2, lo
mejor que puede hacer el jugador 1, es tomar la estrategia A. Véase el subjuego como:
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,1
J1
ESTRATEG B
2,5
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,3
J1
ESTRATEG B
1,5
ESTRATEGIA C
2,3
J1
ESTRATEGIA D 3,2
Si el jugador 1 escogiera la estrategia C, obtendría un pago de 2, mientras que si
sigue la estrategia D, obtendría un pago de 3. Ahora bien, 3 > 2, por lo tanto, la estrategia a
seguir por el jugador 1 sería D, se marca y coloca una flechita para guiar la decisión.
Dando un paso hacia atrás, para ver qué es lo que haría el jugador 2, sabiendo que el
jugador 1, tiene preferencia por la estrategia D en el último subjuego, de manera que, el
jugador 2 sabe que si asume la estrategia X, el jugador 1 a continuación tomará la estrategia
D, por lo tanto, el pago que el jugador 2 esperaría al tomar la estrategia X, será 2, mientras
que si escoge la estrategia Y, tendrá un pago de 3.
EST C 2,3
ESTRATEGIA X
J1
J2 EST D 3,2
ESTRATEGIA Y 2,3
Por lo tanto la mejor estrategia que puede asumir el jugador 2, será Y, puesto que 3 >
2 y se marca con una flecha.
Dando un paso hacia atrás, se observa que el jugador 1 tiene dos estrategias A y B.
Si se toma la estrategia A, a continuación el jugador 2 hará Y, por lo tanto, el pago esperado
por el jugador 1 será 2, mientras que en el primer nodo, el jugador 1, opta por la estrategia B,
cuyo pago esperado es 1. Por consiguiente, lo mejor que puede hacer el jugador 1, es hacer
A porque sabe que el jugador 2 tomará la estrategia Y, comparando los pagos 2 > 1.
Entonces el desarrollo previsible de este subjuego, será A para el jugador 1 y Y para
el jugador 2.
¿Cuál será el resultado que obtendrían ambos jugadores?.
El jugador 1 obtendrá 2, mientras que el jugador 2 obtendrá 3 respectivamente.
Finalmente el equilibrio de Nash, sería la combinación de las estrategias A,D e Y. El
jugador 1, hará A en el primer nodo y D cuando esté en el segundo nodo, mientras que el
jugador 2 tomará la estrategia Y.
Debe recordarse que un equilibrio perfecto de Nash en subjuegos, nos informa qué
sucedería en cada uno de los subjuegos. Así la estrategia del jugador 1, AD, nos informa lo
que haría en el primer nodo y lo que tendría que hacer en el segundo nodo, donde tendría
que decidir, en cuyo caso haría D frente a la alternativa C.
Se sabe que por el desarrollo previsible del juego que, no se va a llegar a ese último
nodo, sin embargo, un equilibrio de Nash perfecto en un subjuego, nos informa de todo lo
que podría ocurrir.
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,3
J1
ESTRATEG B
1,5
Referencias
Von Neumann, J.; O. Morgenstern (1953) Theory of Games and Economic Behavior
(Princeton: Princeton University Press).
Problemas y ejercicios
J2
Y1 Y2 Y3
X1 11 -3 -4
J1 X2 8 7 -8
X3
-5 5 -6
J2
Y1 Y2 Y3
X1
4 4 3
J1 X2 8 1 7
X3 -1 2 -1
J2
Y1 Y2 Y3 Y4 Y5
X1 2 –1 5 –2 6
J1
X2 2 4 –3 1 0
4.- Aplicando la programación lineal resuelva el siguiente juego:
J2
Y1 Y2 Y3
X1 -1 1 1
J 1 X2 2 -2 2
X3 3 3 -3
5.- Una empresa planea su estrategia de negociación con su sindicato. La empresa puede
emplear 2 estrategias: negociación o boicot de la negociación. El sindicato, por su parte,
puede tomar una postura agresiva, conciliadora o pasiva. La matriz de consecuencias es:
SINDICATO
EMPRESA AGRESIVO CONCILIADOR PASIVO
B1 B2 B3
NEGOCIACIÓN A1
-2 1 2
BOICOTEO DE A2 5 -2 -3
NEGOCIACIONES
a) Gráficamente.
b) Algebraicamente.
c) Como un problema de programación lineal
6.- Un día antes de las elecciones, dos candidatos a gobernador consideran a las mismas
tres ciudades como importantes de una última visita. Ya que ninguna visita es útil a menos
que se haya realizado suficiente trabajo de avance por parte del grupo del candidato, cada
candidato deberá hacer planes antes de saber la elección realizada por su oponente. Los
grupos comisionados por ambos lados muestran idénticas proyecciones. La matriz de pagos
da la ganancia estimada ( en miles de votos ) para cada combinación de visitas del candidato
I en este último día. ¿Qué ciudad deberá elegir cada candidato para la visita?.
CANDIDATO II
CANDIDATO I A CIUDAD 1 A CIUDAD 2 A CIUDAD 3
B1 B2 B3
12 -9 14
A CIUDAD 1 A1
A CIUDAD 2 A2 -8 7 12
A CIUDAD 3 A3 11 -10 10
JUEGOS COOPERATIVOS
7.- La empresa A domina el mercado en una ciudad y una nueva empresa B está
estudiando si entra en él. Si la empresa B entra en el mercado, la empresa A tiene dos
posibilidades: Asumir la competencia de la empresa B, lo que se traduce en una disminución
de la cuota de mercado; o bien lanzar una guerra de precios.
Si la empresa A decide asumir la competencia, ambas empresas tendrán un beneficio de 5
millones de euros anuales, mientras que si decide lanzar una guerra de precios, las pérdidas
anuales seán de 5 millones para la Empresa A y 10 millones para la Empresa B. Si la
empresa B decide no entrar en el mercado, el beneficio anual para la Empresa A es de 20
millones.
J2
Entrar al No entrar al
mercado mercado
Asumir
5,5 20,0
competencia
J1
Guerra de
-5,-10 20,0
precios
Si no se desea tener valores negativos se puede sumar 10 a todos los resultados. Determine
el equilibrio de Nash
J2
A B C
X 8,15 14,7 0,9
J1 Y 16,4 5,-2 9,10
Z 5,7 13,11 6,15
9.- Suponga que una empresa compite con otras empresas para conseguir clientes. Ud. y
su rival saben que sus productos estarán obsoletos al final de cada año y deben determinar
simultáneamente si van a contratar publicidad o no. Pero, en su industria, la publicidad no
eleva la demanda total de la industria, sino que induce a los consumidores a cambiar entre
los productos de las distintas empresas.
Así pues, si tanto Ud. como su rival contratan publicidad, las dos campañas publicitarias se
compensarán entre sí, y cada una de las empresas obtendrá 4 millones de beneficios. Si
ninguna empresa contrata publicidad, cada una obtendrá 10 millones de beneficios. Sin
embargo, si una contrata publicidad y otra no, la que contrata obtendrá 20 millones de
beneficios y la que no, obtendrá 1 millón de beneficios. ¿Su elección para maximizar los
beneficios consiste en contratar publicidad o no?. Explique con la matriz de pagos.
10.- Dado el presente juego, determinar los equilibrios perfectos de Nash, la trayectoria y los
pagos.
ESTRATEGIA C 0,2
ESTRATEG A J2
ESTRATEGIA D 3,0
J1
ESTRATEGIA C 2,1
ESTRATEG B
J2
ESTRATEGIA D 1,3
11.- El juego dinámico entre dos jugadores consiste en que el Jugador 1 escoge primero
entre Ayudar (A) o No Ayudar (NA), y después el Jugador 2, conociendo la elección del
Jugador 1, decide a su vez entre sí Ayuda (A) o No Ayuda (NA). Cada Jugador recibe una
utilidad de 8 si ayudan, y de 2 si nadie ayuda. Por otra parte, sí un Jugador Ayuda y el otro No
Ayuda, el Jugador que Ayuda obtiene una utilidad de 0 y el Jugador que No Ayuda de 9.
Se solicita:
a) Representar el juego en forma extensiva y en forma estratégica.
b) Hallar el equilibrio o equilibrios de Nash (EN) en estrategias puras.
c) Hallar el equilibrio perfecto de Nash (ENPS) del juego por inducción hacia atrás. En caso
de existir, indicar un equilibrio no perfecto.
12.- El juego dinámico entre dos jugadores consiste en que el Jugador 1 escoge primero
entre Ayudar (A) o No Ayudar (NA), y después el Jugador 2, conociendo la elección del
Jugador 1, decide a su vez entre sí Ayuda (A) o No Ayuda (NA). Cada Jugador recibe una
utilidad de 8 si ayudan, y de 2 si nadie ayuda. Por otra parte, sí un Jugador Ayuda y el otro No
Ayuda, el Jugador que Ayuda obtiene una utilidad de 0 y el Jugador que No Ayuda de 9.
Se pide:
a) Representar el juego en forma extensiva y en forma estratégica.
b) Hallar el equilibrio o equilibrios de Nash (EN) en estrategias puras.
c) Hallar el equilibrio perfecto de Nash (ENPS) del juego por inducción hacia atrás. En caso
de existir, indicar un equilibrio no perfecto.
13.- La Batalla de los Sexos. Un hombre y una mujer desean salir a recrearse, bien en un
partido de fútbol o viendo una película romántica, aunque para ellos lo más importante es
estar juntos. El problema reside en que la mujer prefiere la película romántica, mientras que
el hombre prefiere ver el partido de fútbol.
Hombre
Partido de Partido de
fútbol fútbol
Partido de
2,1 0,0
fútbol
Mujer
Película
0,0 1,2
romántica
Como se darán cuenta, existe una situación que satisface a cada uno de los novios; y dos
situaciones en las que ninguno sale ganando nada (0, 0). Ésta última compara el hecho que
los novios deciden separarse y ver por su cuenta el partido o la película. En la otra situación
uno de los dos no queda muy contento, pero esto gana la compañía del otro, y por eso los
pagos se distribuyen de forma igual pero inversa.
Determinar el equilibrio de Nash.
14.- El Juego del Gallina. Este es un juego interesante, en donde se dice que dos jóvenes
conducen sus automóviles en dirección contraria a toda velocidad por una carretera estrecha.
Al aproximarse la colisión ambos jóvenes deciden entre “continuar” en la carretera o “ceder”
el paso. Si sólo uno de ellos eligiera “ceder”, sobre él recaería el deshonor, pero si ninguno de
ellos cediera, ambos morirían por el choque de los vehículos. Si únicamente uno de ellos
decide “continuar”, éste se cubre de gloria, y si ambos deciden “ceder” entonces se sienten
avergonzados.
Conductor 2
Continuar Ceder
Conducto Continuar -3,-3 2,0
r
Ceder 0,2 1,1
1
15.- Para los siguientes juegos, determine, para cada jugador, aquellas estrategias que
son estricta o débilmente dominantes. Encuentre los equilibrios de Nash del juego.
a)
J2
I D
A 2,2 0,3
J1
B 3,0 1,1
b)
J2
I D
A 2,1 0,1
J1
B 0,0 1,2
c)
J2
I D
A 4,4 -2,0
J1
B 4,3 -2,5
ESTRATEG A 2,2
J1 EST C 4,2
ESTRATEGIA X J1
EST D 2,4