Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introducción y antecedentes:
La teoría de los juegos (TJ) fue creada originalmente para proporcionar un nuevo acceso a los
problemas económicos, John von Neuman & Oskar Morgenstern (VN&M) no construyeron una
teoría simplemente como un apéndice que debería situarse como una reflexión tardía sobre la
periferia de la economía. Muy al contrario, intuyeron que los problemas típicos del
comportamiento económico son estrictamente idénticos a las nociones matemáticas de juegos
de estrategia adecuados.
El término “juego” podría sugerir que el tema es de poca amplitud y frívolo, lo cual dista
mucho de la realidad. La palabra juego tiene diferentes significados para el hombre de la calle
que para el teórico de los juegos si bien hay algunas similitudes. En ambos tipos de juegos
hay jugadores y éstos deben actuar o tomar ciertas decisiones. Como resultado del
comportamiento de los jugadores, y posiblemente del azar, hay un cierto resultado: una
recompensa o castigo para cada uno de los jugadores participantes.
Los fundamentos de la TJ fueron expuestos por VN, quien en 1928 demostró el teorema básico
del minimax, quedando establecido el tema con la publicación en 1944 de The Theory of
Games and Economic Behavior. Se demostraba que los acontecimientos sociales pueden ser
descriptos de la mejor manera mediante modelos tomados de juegos de estrategia adecuados.
Los fenómenos sociales implican que los hombres a veces actúan unos contra otros, a veces
cooperando entre ellos, tienen distintos grados de información unos acerca de otros y sus
aspiraciones les conducen a contender o cooperar. La TJ es una moderna disciplina que ha
despertado mucho interés por sus nuevas propiedades matemáticas y sus muchas aplicaciones
a los problemas sociales, económicos y políticos. La razón de que las aplicaciones sean más
numerosas y se ocupen de problemas altamente significativos encontrados por científicos
sociales se debe al hecho de que la estructura matemática de la TJ difiere profundamente de
los intentos previos de proporcionar bases matemáticas a los fenómenos sociales, los métodos
y conceptos desarrollados por las ciencias físicas no tuvieron éxito al ser aplicados a los
problemas sociales.
Además de VN&M, hubo otros autores cuyos aportes a la TJ merecieron el premio Nobel de
Economía en 1994. Ellos son John Nash, John Harsanyi y Reinhard Selten, "por su análisis
pionero del equilibrio en la teoría de los juegos no cooperativos".
John Nash (USA, 1928), mientras estudiaba en la Universidad Carnegie Mellon tomó un
curso electivo en Economía Internacional y como resultado a la exposición de ideas y
problemas económicos, llegó a la idea que los condujo al trabajo denominado “El problema del
regateo” ("The Bargaining Problem") que más tarde fuera publicado en Econométrica. Fue esta
idea la que a su vez, cuando era estudiante de posgrado en Princeton, condujo su interés al
estudió de la TJ estimulado por el trabajo de von Neumann and Morgenstern. Como estudiante
de posgrado, estudió matemáticas ampliamente y además de desarrollar la idea de los Juegos
no Cooperativos, ("Non-Cooperative Games"), también hizo desarrollos con respecto a
variedades algebraicas pensando que el trabajo de TJ no sería aceptado para su tesis doctoral.
John Harsanyi (Hungría, 1920), en la década del 50, publicó algunos trabajos sobre el uso
de las funciones de utilidad de VN&M en la economía del bienestar y en ética y sobre la
variedad de preferencias en la economía del bienestar. Su interés en los problemas de la TJ se
originó con un sentido limitado en los cuatro trabajos brillantes de John Nash, publicados en el
período 1950-53, sobre juegos cooperativos y no cooperativos, en juegos bipersonales de
negociación, y sobre estrategias de amenazas mutuamente óptimas de tales juegos, y sobre
los que hoy llamamos el equilibrio de Nash. En 1956, demostró la equivalencia matemática de
1
Teoría de los Juegos Alberto Souto
En un trabajo con otros dos autores publicado en 1967 y 1968, demostró cómo convertir un
juego con información incompleta en uno con información completa, aunque imperfecta, para
hacerlo más accesible al análisis de la TJ. En 1973, demostró que “casi todas” las estrategias
mixtas del equilibrio de Nash pueden ser reinterpretadas como estrategias puras de equilibrio
estricto de un juego especialmente seleccionado con funciones de pago fluctuantes al azar. En
1993 y 1994 escribió dos trabajos proponiendo una nueva teoría de selección de equilibrios. El
trabajo de 1993 lo hace para juegos con información completa, mientras que el de 1994 lo
hace para juegos de información incompleta. Su nueva teoría se basa en la de 1988 pero es
más simple e intuitivamente más atractiva.
Reinhard Selten (Alemania, 1930), su primer contacto con la TJ fue un artículo muy
popular de la revista Fortune que leyó en su último año de la secundaria. Inmediatamente se
sintió atraído por el tema y cuando estudió matemáticas se encontró con el libro de von
Neumann y Morgenstern. Poco después, participó de un seminario para economistas sobre TJ
dictado por el Profesor Ewald Burger quien enseñaba cursos de matemática avanzada pero
también matemática para economistas. Ewald Burger le dio la oportunidad más tarde de
escribir la tesis de la maestría sobre la teoría de los juegos cooperativos. Las tesis de la
maestría y del doctorado tenían como objetivo la axiomatización de valor para juegos de “n”
personas en forma extensiva. Este trabajo lo familiarizó con la forma extensiva, en un
momento que muy poco se había escrito sobre la forma extensiva de los juegos. Esto le
permitió ver el problema más temprano que otros y escribir los aportes que lo llevaron a ganar
el premio Nobel.
Ya dijimos que juego tenía un significado particular, la palabra jugador tampoco tiene
exactamente el significado que podría esperarse. No es necesario que un jugador sea una
persona; puede ser un equipo, una corporación, una nación. Es útil considerar como un solo
jugador a un grupo de individuos que tienen intereses idénticos con respecto al juego. Esto
también es cierto para la palabra racional cuando se emplea para explicar el comportamiento.
La respuesta a una de estas preguntas, o a ambas, se denomina la solución del juego, pero el
término “solución” no tiene un significado universal en la TJ; en contextos diferentes tiene
significados diferentes.
Estas preguntas conducen a otras. ¿Cuál es el poder de un jugador? Es decir, ¿hasta qué
punto puede un individuo determinar el resultado del juego? Más concretamente, ¿cuál es el
mínimo que un jugador puede asegurarse confiando en sus propios recursos si no recibe
cooperación de otros? ¿Es razonable suponer que los otros jugadores serán de hecho hostiles?
Para responder a estas preguntas deben saberse ciertas cosas acerca del juego. En primer
lugar, uno debe conocer las reglas del juego. Estas incluyen:
1) ¿Hasta qué punto pueden comunicarse los jugadores entre sí?
2) Si los jugadores pueden o no hacer convenios que los obliguen.
3) Si las ganancias obtenidas en el juego pueden ser compartidas con otros jugadores
(esto es, si se permiten pagos secundarios).
4) ¿Cuál es la relación formal, causal, entre las acciones de los jugadores y el resultado
del juego (es decir, la matriz de pagos)?
5) ¿Qué información tienen los jugadores?
2
Teoría de los Juegos Alberto Souto
Además, las personalidades de los jugadores, sus preferencias subjetivas, las costumbres de
la sociedad (es decir, lo que los jugadores entienden por un “resultado justo”) tienen un efecto
sobre el resultado.
Quizás la característica más significativa de un juego sea el número de jugadores, esto es, su
tamaño. Sin embargo, podemos clasificar a los juegos de las siguientes formas:
En cuanto a esta última clasificación, cuando nos referimos al conflicto, nos referimos a éste
como un continuo donde los extremos refieren a la existencia o no del mismo.
Negociación:
Situaciones de asociación precaria
O antagonismo incompleto
Generalmente cuanto menor sea el número de jugadores tanto más sencillo será el juego. Al
pasar de los juegos más sencillos a los más complicados, las teorías resultan menos
satisfactorias. En los juegos más complicados, un jugador se enfrenta a fuerzas que no puede
controlar. Cuanto menor sea el control que un jugador tiene sobre el resultado final,
tanto más difícil resulta definir el comportamiento racional. Anteriormente
preguntamos lo que debería hacer un jugador y lo que debería ser el resultado final del
juego,; debería, no en el sentido moral, sino en el sentido de lo que más apoyará a los
intereses de un jugador. La cuestión de lo que la gente hace realmente y de lo que realmente
sucede cuando se desarrolla un juego es mejor dejarla para las ciencias del comportamiento.
Desde este punto de vista, se explicará a continuación la teoría normativa. Para ello,
veremos los elementos y supuestos de la misma.
Los elementos los enunciamos anteriormente y comprenden a los jugadores (decididores), las
reglas del juego, y los resultados. Se llama movida a cada elección que realiza un jugador,
partida al conjunto de movidas y estrategia es el método predeterminado para efectuar
movidas. El supuesto básico es la racionalidad de los contendientes y esto se expresa por
el fin que tienen que es maximizar la utilidad, la utilidad se entiende como una magnitud
cardinal, y que los jugadores tienen información perfecta acerca de los resultados,
estrategias posibles y preferencias de los participantes.
El juego unipersonal
Estos juegos son los más sencillos, tan es así que algunos no los consideran juegos. En ellos
es conveniente considerar a la naturaleza como una persona y entonces los juegos
unipersonales son realmente juegos en contra de la naturaleza. Pueden agruparse en tres
categorías sobre la base del papel que juega la naturaleza. En la primera categoría, la
naturaleza no tiene ningún papel activo. El jugador hace sencillamente su elección y esa
elección determina lo que ocurre. En la segunda, las leyes del azar intervienen. Primeramente,
elige el jugador y después las reglas del azar determinan el resto. Aquí el jugador está
3
Teoría de los Juegos Alberto Souto
Ningún juego puede servir como un modelo universal; un juego único es inadecuado incluso
para representar un grupo de juegos. Por consiguiente, vamos a dividir los juegos finitos,
bipersonales, en tres categorías:
1. Juegos de suma cero con información perfecta
2. Juegos de suma cero
3. Juegos de suma no nula
Debido a que los juegos de suma cero de información perfecta son en general juegos de salón
como el ajedrez, damas, tateti, y el go. La inversa no es cierta, es decir el póker y el bridge no
son juegos de información perfecta.
Para este curso, no nos detendremos en este tipo de juegos y pasamos directamente a los
juegos sin información perfecta.
Existen dos jugadores A y B que tienen a su disposición un conjunto de estrategias, como las
siguientes: A => X (x1, x2, x3,……xm) y B => Y (y1, y2, y3,….yn)
La suposición que se hace es que el resultado del juego es cierto pago que hace B a A. El pago
de B a A será negativo si es B quien gana. Se simboliza el pago con a ij si del conjunto de
estrategias A elige xi y B elige yj. Es el pago que realiza B.
El juego queda determinado por dos conjuntos de estrategias y la matriz de pagos o tabla de
pagos según la estrategia.
Estrategias Y1 Y2 ….. Yj …. Yn
X1 a11 a12 ….. a1j ….. a1n
Jugador X2 a21 a22 ….. a2j ….. a2n
Maximizante … … … ….. … ….. …
A Xi ai1 ai2 ….. aij ….. ain
… … … ….. … ….. …
Xm am1 am2 ….. amj ….. amn
Objetivo de cada jugador: ganar tanto como pueda del juego con seguridad ante un
enemigo hábil que persiguen justamente lo contrario.
4
Teoría de los Juegos Alberto Souto
1) A es un jugador maximizante y desea actuar de tal manera que el menor número que
el pueda ganar sea tan grande como sea posible independientemente de lo que B
realice. Entonces tiene garantía de ganar por lo menos si elige Xi
2) Si B elige la estrategia Yj deberá efectuar algunos de esos pagos (a1j, aij, …amj) pero
es el jugador minimizante entonces desea que el número mayor que deba pagar al
jugador A sea el menor posible. Entonces le conviene elegir de sus estrategias aquella
donde su Sj máximo sea mínimo; es decir
Se expresa diciendo que lo más que el jugador A se puede asegurar como ganancia no es
nunca mayor que lo mínimo que el jugador B se puede asegurar como pago; o lo que es lo
mismo que: maximin ≤ minimax.
Si eligen una estrategia distinta pueden ganar más o perder menos pero también pueden
ganar menos que V1 o perder más que V2. B se protege de perder como máximo V2.
La matriz se expresa como los pagos que B le efectúa a A. El pago de B a A será negativo si B
gana.
El juego está estrictamente determinado y el valor del juego es 5 conocido como punto de
equilibrio, punto de silla, o punto de ensilladura. Puede haber varios, pero si ese es el caso,
todos tienen el mismo valor.
5
Teoría de los Juegos Alberto Souto
Estas son estrategias óptimas puras ya que el juego está estrictamente determinado.
Estrategias Mixtas:
Cuando los juegos bipersonales de suma cero tienen puntos de equilibrio, se suele convenir
que su pago común debería ser el resultado final. Sin embargo, hay también juegos sin puntos
de equilibrio y son estos los que originan la dificultad. En la “Carta Robada”, Edgar Allan Poe
discutió tal juego con el personaje de un niño de ocho años que siempre ganaba las apuestas
con sus compañeros de escuela. La forma de razonar del chico que sus compañeros llamaban
afortunada, no era más que una identificación del intelecto del razonador con el de su
oponente. Si estuviéramos a merced del niño la situación parecería desesperada ya que
siempre adivinaría nuestros movimientos por su forma de razonar. Una forma de vencerlo
sería tratar de adelantarse al niño prodigio pero él siempre nos derrotaría por lo cual la forma
de hacerlo mejor sería no razonar en absoluto. Desde luego uno siempre puede elegir una
estrategia pura pero también puede usar un artificio de azar para que haga la decisión por Ud.
Una estrategia que requiere la selección de una estrategia pura mediante un artificio de azar
se llama estrategia mixta. Desde este punto de vista Ud. tendría no dos sino infinito número
de estrategias mixtas.
Es concebible que un jugador pueda conseguir mejores resultados no utilizando el azar. Por
ejemplo, el caso del niño prodigio que se anticipa a las elecciones de su oponente puede
intentar explotar esa debilidad. Si su contrincante desconoce el empleo del azar (o
equivocadamente piensa que es más inteligente que Ud.) puede ser posible explotar su
ignorancia. Pero en el mejor de los casos esta es una ventaja dudosa: puede ser siempre
neutralizado por un oponente inteligente. También debe observarse que en el juego una vez
que un jugador recurre al azar, no solamente puede no perder (como promedio)
independientemente de lo bien que juegue su oponente; no ganará por muy mal que juegue
su contrario. Así pues, cuanto más hábil sea su oponente, tanto más atrayente será el
procedimiento al azar.
En este caso no existe punto de ensilladura, por lo tanto hay que recurrir a una estrategia
mixta, que se despeja matemáticamente, igualando las ecuaciones, o gráficamente:
6
Teoría de los Juegos Alberto Souto
Estrategias Mixtas:
Solución para jugador I, maximizante
10 10
9 9
8 8
7 7
6 Max de min 6
VE
VE
5 de II
E2 E1 de II 5
4 4
E1 de II
3 E2 de3II
2 2
1 1
0 0
P=0 0,75 P=1
Frecuencia
E1 de II E2 de II
Estrategias Mixtas:
Solución para jugador II, minimizante
10 10
9 9
8 8
7 7
E2 de 6I E1 de6I
Min de max
VE
VE
E1
5 de I 5
4 4
3 E2 de I 3
2 2
1 1
0 0
Q=0 0,50 Q=1
Frecuencia
E2 de I E1 de I
Para cada valor q que el jugador elige observa el máximo que puede perder. Elige que el
máximo sea mínimo. El minimizante elige por columna, de los mayores el menor.
Conclusiones:
Al jugador I le convine jugar ¾ E1 (p) y ¼ E2 (p) para asegurarse una utilidad de 4,5
Al jugador II le convine jugar ½ E1 (q) y ½ E2 (q) para asegurarse una pérdida de 4,5
Si el jugador I elige una estrategia óptima mixta, el otro jugador no puede hacer otra cosa
mejor que elegir su estrategia óptima mixta también.
7
Teoría de los Juegos Alberto Souto
Método abreviado
Dominancia:
Si en una columna cada pago es mayor o igual que cada uno de los pagos de la otra columna
se dice que está dominada por esta última, pudiendo suprimirse la primera (Dejo la columna
con los menores valores). Teniendo el jugador minimizante la elección de las
estrategias en las columnas habrá de dejar de lado aquella estrategia con los valores
mayores. Deja de lado las estrategias donde tiene que pagar más.
Si en las filas una de ellas tiene cada uno de sus pagos menores que los de otra se dice que la
primera está dominada por esta última. Teniendo el jugador maximizante la elección de
las estrategias en las filas habrá de dejar de lado aquella estrategia con los valores
menores. Deja de lado las estrategias donde recibe menos. Ejemplo:
Sin dominancia:
Con dominancia:
8
Teoría de los Juegos Alberto Souto
Aquí se pueden eliminar A2 por ser sus valores menores que A1 y también B1 por ser sus
valores mayores que B2.
El teorema establece que uno puede asignar a cada juego finito, bipersonal de suma cero un
valor V: la cantidad media que el jugador I puede esperar ganar el jugador II si ambos
jugadores actúan cuerdamente. VN intuyó que este resultado previsto es plausible por tres
razones:
a) Hay una estrategia para el jugador I que protegerá esta ganancia, contra ella nada que
pueda hacer el jugador II evitará que el jugador I obtenga una ganancia media de V.
Por tanto, el jugador I no se conformará con algo que sea menor que V.
b) Hay una estrategia para el jugador II que le garantizará que no perderá más de una
valor V como promedio; esto es, puede evitarse que el jugador I consiga más de V.
c) Por hipótesis, el juego es de suma cero. Lo que gane el jugador I debe perderlo el II.
Puesto que el jugador II desea minimizar sus pérdidas, este jugador está motivado
para limitar la ganancia media del jugador I a V.
Este último supuesto es crucial ya que, en los juegos de suma no nula, donde no se cumple,
no debe concluirse que justamente, porque el jugador II tenga el poder de limitar las
ganancias del jugador I, lo hará así necesariamente. Pero aquí donde el perjudicar al jugador I
es para II equivalente a apoyar sus propios objetivos, la suposición es obligada.
Con la inclusión del Teorema se pueden tratar todos los juegos bipersonales de suma
cero como si tuviesen puntos de equilibrio. El juego tiene un valor claro y cada jugador
puede forzar este valor seleccionando la estrategia adecuada. La única diferencia entre los
juegos con puntos de equilibrio reales y los que no los tienen es que un caso puede utilizarse
una estrategia pura y obtener el valor del juego con certeza mientras que en el otro caso
debe usarse una estrategia mixta y obtener el valor del juego como promedio.
La teoría de los juegos bipersonales de suma cero es excepcional en el sentido que le permite
a uno encontrar soluciones – soluciones que además están universalmente aceptadas.
En este respecto, los juegos de suma cero son distintos de los problemas reales que surgen en
la vida cotidiana que generalmente no se prestan a respuestas sencillas. En los juegos de
suma distinta de cero no hay una solución universalmente aceptada; es decir no hay
una sola estrategia que sea claramente preferible a las otras ni hay un resultado único,
definido y previsible. Como norma tendremos que contentarnos con algo menos que las
soluciones inequívocas que obtuvimos para los juegos de suma cero.
El modo más sencillo de obtener algún conocimiento del juego de suma no nula es tratar de
analizar uno de la misma forma que analizamos el juego de suma cero.
9
Teoría de los Juegos Alberto Souto
Jugador II
(0,0) (10,5)
Jugador I
(5,10) (0,0)
Los pares que figuran en las estrategias se interpretan como (pagos al jugador I, pagos al
jugador II)
Jugador II
0 10 0
Jugador I 5 0 0
5 10
No hay un punto de equilibrio. Por lo tanto, debemos utilizar una estrategia mixta
Jugador II
0 10 |10| 1/3
Jugador I 5 0 |5| 2/3
|5| |10| 15
2/3 1/3
Esto es lo que puede obtener el jugador I sin ninguna participación del jugador II. Esto sería lo
mínimo que él estaría dispuesto a fijar.
Hasta aquí es igual que la resolución del juego bipersonal de suma cero, entonces
¿por qué no se resuelve de esta manera?
El problema es que los pagos son demasiados bajos. Aunque cada jugador puede evitar que
el otro obtenga más del 10/3 (que era lógico para el juego de suma cero) no hay razón para
que lo haga. Si se encuentran en los cuadrantes (5,10) y (10,5) que son pagos distintos de
cero ganan ambos más que 10/3.
Ya no es más “cierto” que un jugador pueda volverse más rico manteniendo pobre a
su oponente.
Supongamos que el jugador I se anticipa a todo esto y adivina que el jugador II jugará E1, 1/3
del tiempo. Si el jugador I pasa a la estrategia pura E1, el jugador II obtendrá todavía 10/3
pero el jugador I obtendrá ahora 20/3.
Publicidad:
Dos firmas de publicidad se reparten el mercado de la siguiente manera: cada una de las
firmas está a punto de comprar una hora de tiempo de televisión para anunciar sus productos
competitivos. Pueden anunciarse durante la mañana o durante la noche. La audiencia de
televisión se divide en dos grupos. Un porcentaje de la gente ve la televisión durante las horas
de la mañana y el restante durante la noche; no hay intersección entre los dos grupos. Si
ambas compañías anuncian durante el mismo período, cada una venderá en igual porcentaje
10
Teoría de los Juegos Alberto Souto
de los espectadores. Si anuncian en períodos diferentes cada una venderá al mismo porcentaje
de la audiencia.
Publicidad Empresa II
Un hombre y una mujer han decidido que irán al cine o al boxeo esa noche. Ambos prefieren ir
juntos mejor que solos. Mientras el hombre preferiría ir con su mujer al boxeo, prefiere ir con
ella al cine que ir solo al boxeo. Análogamente, la primera decisión de su mujer es ir juntos al
cine, pero ella también prefiere ir juntos al boxeo que ir sola al cine. Los pagos reflejan el
orden de preferencia de los jugadores.
Batalla de Novio
los sexos
Estrategias Box Película
Juego simétrico: A menudo, es ventajoso para un jugador jugar antes que su oponente,
incluso si las reglas no exigen que lo haga, o bien, anunciar su decisión en forma irrevocable.
En el juego de suma cero, esto no pasa.
Modificar las reglas del juego: si se modifican las reglas de manera que uno de los
jugadores no puede elegir alguna de las estrategias que originariamente estaba a su alcance,
en el juego de suma cero, podría no perder nada, en el de suma no cero podría muy bien
ganar.
11
Teoría de los Juegos Alberto Souto
Conocer la función de utilidad del otro: sucede a menudo en un juego de suma no nula
que un jugador gana si su oponente no conoce su función de utilidad. Esto no es
sorprendente. Sí es una ventaja a veces que su oponente conozca la función de utilidad y
puede estar en peores circunstancias cuando la sepa. Esto no ocurre en los juegos de suma
cero ya que se supone que ambos jugadores conocen la función de utilidad del otro.
No vamos a ver en detalle cada uno de estos puntos, pero sí uno que es sumamente
relevante, la comunicación.
Ejemplo de comunicación:
Conflicto Jugador II
Estrategias A B
A (5,5) (0,6)
Jugador I
B (6,0) (1,1)
Hay dos propiedades básicas de este juego que son dignas de destacar:
Independientemente de la estrategia que juegue su pareja, un jugador consigue el mejor
resultado jugando B. También, independientemente de la estrategia que un jugador
seleccione finalmente, siempre lo hace mejor si su pareja juega la estrategia A. El
conflicto surge porque cada jugador debería jugar B, mientras que cada uno espera que el otro
juegue A. Por otra parte, es ventajoso para ambos que el conflicto se resuelva eligiendo
ambos A mejor que B. ¿Cómo hacer?
Sobre la base que vimos hasta ahora, la facultad de comunicación podría parecer una
ventaja. Hasta aquí los únicos mensajes contemplados son ofertas para cooperar y estos,
obviamente, deben ser en interés de ambos jugadores. También es posible la comunicación
de amenazas, Luce y Raiffa, idearon el siguiente juego, comparemos que ocurre cuando
pueden comunicarse y cuando no pueden hacerlo:
Conflicto Jugador II
Estrategias A B
A (1;2) (3;1)
Jugador I
B (0;-200) (2;-300)
No hay comunicación:
Si hay comunicación:
12
Teoría de los Juegos Alberto Souto
La situación del jugador II resulta aún peor. El jugador I, no sólo puede imponer la estrategia
a II, sino que también puede pedir algo bajo cuerda.
En general:
Es cierto que el jugador II puede rehusar negociar con el jugador I e ignorar sus amenazas.
Todavía sería para los mejores intereses del jugador I jugar la estrategia A, pero ¿quién puede
asegurar lo que tendrá una mayor influencia en su comportamiento, su propio interés o o su
resentimiento a ser rechazado?
Dos hombres sospechosos de cometer juntos un crimen son detenidos por la policía y situados
en celdas separadas. Cada sospechoso puede confesar o permanecer silencioso, y cada uno
conoce las posibles consecuencias de su acción. En la matriz de pago figuran los años de
prisión que enfrentarían en cada caso. El 0 indica la libertad inmediata. Se debe suponer que
no hay honor entre los ladrones y que lo que a cada sospechoso concierne es su interés.
¿Qué harían los criminales?
El debe tomar su decisión sin saber lo que hará su compinche, por lo tanto debe considerar
cada una de las estrategias que el otro tiene a su disposición:
13
Teoría de los Juegos Alberto Souto
El DP es distinto a cualquier otro tipo de juego. Como norma para analizar un juego, uno está
satisfecho con saber que harían dos jugadores racionales y predecir cuál será el resultado. En
el DP la estrategia no cooperativa es tan poco atrayente que la pregunta que trataríamos
de contestar es ¿Cómo podemos justificar el jugar una estrategia cooperativa?
En muchas situaciones estratégicas, sin embargo, existen pocos jugadores. Por ejemplo, en el
mercado de las carrocerías aéreas comerciales, existen dos productores: Boeing y Airbus. En
estas situaciones de pequeños números, una parte clave de tomar decisiones estratégicas
(precio, inversión en nuevas instalaciones, etc.) es anticipar cómo los rivales pueden
reaccionar. Una forma natural de incorporar las reacciones de los rivales en el análisis de las
alternativas estratégicas es asignar probabilidades a sus más probables acciones o reacciones
y luego tomar la decisión que maximiza el valor esperado de la ganancia, dada su distribución
de probabilidad. Pero este enfoque tiene una contra importante. ¿Cómo se asignan
probabilidades al rango de opciones que el rival puede elegir? Uno podría terminar asignando
probabilidades a alternativas que, desde la perspectiva de los competidores, serían tontas. Si
es así, entonces la calidad del análisis de decisión estaría seriamente comprometida.
14
Teoría de los Juegos Alberto Souto
La Teoría de los Juegos es la más apropiada para estos contextos. Es la rama de la economía
que se ocupa del análisis de la toma de decisiones óptima cuando todos los decididores se
presumen racionales, y cada uno está tratando de anticipar las acciones y reacciones de los
competidores.
La forma más fácil de presentar los elementos básicos de la Teoría de los Juegos es a través
de un ejemplo sencillo. Consideremos una industria con dos firmas. Alfa y Beta, que producen
idénticos productos. Cada una debe decidir si aumentar su capacidad de producción para el
año que viene. Asumiremos que cada firma siempre produce a su capacidad plena. Así, la
expansión de capacidad implica una compensación. La firma puede lograr una mayor
participación de mercado, pero también puede poner presión hacia la baja del precio de
mercado. Las consecuencias de las decisiones de cada firma se describen en la Tabla
siguiente. La primera cifra se refiere a la ganancia económica anual de Alfa y la segunda a la
ganancia económica anual de Beta (las cifras se expresan en millones por año).
Beta
Estrategias No expandir Expandir
Alfa No expandir 18 ; 18 15 ; 20
Expandir 20 ; 15 16 ; 16
Beta
Estrategias No expandir Pequeña Grande
Alfa No expandir 18 ; 18 15 ; 20 9 ; 18
Pequeña 20 ; 15 16 ; 16 8 ; 12
Grande 18 ; 9 12 ; 8 0;0
¿Por qué el equilibrio de Nash parece un resultado plausible del juego? Probablemente su
propiedad más atrayente es que es un punto focal de auto-cumplimiento: si cada parte espera
de la otra que elija su estrategia de equilibrio de Nash, entonces, ambas partes, elegirán, en
efecto, sus estrategias de equilibrio de Nash. En el equilibrio de Nash, entonces, la expectativa
es igual al resultado – comportamiento esperado y comportamiento real convergen. Esto no
sería verdad en situaciones que no tienen un equilibrio de Nash como en el juego de la Tabla
anterior. Supongamos que Alfa (quizás tontamente) espera que Beta no expanda su capacidad
y se abstiene de expandir su propia capacidad para evitar una caída en el precio de mercado.
15
Teoría de los Juegos Alberto Souto
Este conflicto entre el interés colectivo y el interés propio es a menudo denominado el dilema
del prisionero. El dilema del prisionero se origina porque en la búsqueda de su propio interés,
cada parte impone a la otra un costo que no tiene en cuenta. En el juego de la expansión de la
capacidad, la expansión de Alfa lastima a Beta porque conduce a una baja del precio de
mercado. El dilema del prisionero es un concepto clave en el equilibrio de precios y decisiones
de producción en industrias oligopólicas.
La forma de matriz es particularmente conveniente para representar juegos en los cuales cada
parte mueve simultáneamente. En muchos casos, sin embargo, la toma de decisiones es
secuencial más que simultánea, y es manudo más conveniente representar el juego con un
árbol de juego en vez de una matriz de juego.
Para ilustrar tal situación, modifiquemos el juego de la expansión de capacidad para permitir a
la firma elegir entre tres opciones: no expandir la capacidad actual, una expansión pequeña, o
una expansión grande. Como contraste, examinemos primero qué ocurre cuando ambas
firmas deciden simultáneamente. Para eso utilizamos la última tabla donde el equilibrio de
Nash es pequeña/pequeña.
Pero ahora supongamos que Alfa busca adelantarse a Beta tomando su decisión de capacidad
un año antes que Beta. Así, para el momento en que Beta tome su decisión, ya habrá
observado la decisión de Alfa y debe ajustar su toma de decisión de acuerdo con ello.
Podemos representar la dinámica de este proceso de toma de decisiones a través de un árbol
de juego.
Grande ( 9 ; 18)
Grande ( 8 ; 12)
No expandir (18 ; 9)
Grande ( 0 ; 0)
Para simplificar el problema sólo consideraremos una decisión de dos momentos o etapas; Alfa
toma su decisión primero y luego Beta responde. No consideraremos la posibilidad de que Alfa
podría responder a la decisión de capacidad tomada por Beta.
16
Teoría de los Juegos Alberto Souto
Al analizar este árbol del juego, vemos lo que se denomina un subjuego de equilibrio perfecto
de Nash (SEPN). En un SEPN, cada jugador elige la acción óptima en cada momento o etapa
del juego a la cual podría razonablemente alcanzar y cada jugador cree que todos los otros
jugadores se comportarán de la misma manera. Para desarrollar el SEPN, se utiliza el método
de “desenvolverlo” (Fold back method). Comenzamos al final del árbol, y por cada nodo de
decisión (representado por los cuadrados), encontramos la decisión óptima para la firma en
cada nodo. En el ejemplo, debemos encontrar la decisión óptima de Beta para cada una de las
tres decisiones que Alfa podría tomar: no expandir, pequeña o grande:
Las decisiones óptimas de Beta están subrayadas en el árbol. Desarrollando el árbol de esta
manera, asumimos que Alfa anticipa que Beta elegirá una respuesta de maximización de
beneficios para cualquier movimiento estratégico que Alfa podría tomar. Dadas estas
expectativas, podemos determinar la estrategia óptima de Alfa. Lo hacemos localizando la
ganancia que Alfa obtiene como resultado de cada opción que podría tomar, dado que Beta
responde óptimamente. El análisis del Fold Back nos dice que:
Si Alfa elige NO EXPANDIR, entonces dada la reacción óptima de Beta, la ganancia de Alfa será
$15 millones.
Si Alfa elige PEQUEÑA, entonces dada la reacción óptima de Beta, la ganancia de Alfa será $16
millones.
Si Alfa elige GRANDE, entonces dada la reacción óptima de Beta, la ganancia de Alfa será $18
millones.
El SEPN resulta que a Alfa le conviene elegir GRANDE. Beta responde eligiendo NO
EXPANDIR.
Nótese que el resultado del juego de movimiento secuencial difiere significativamente del
resultado de un juego de movimiento simultáneo. En realidad, el resultado incluye una
estrategia para Alfa (GRANDE) que estaría dominada si Alfa y Beta tomaran sus decisiones de
capacidad simultáneamente. ¿Por qué el comportamiento de Alfa es tan diferente cuando
puede mover primero? Porque en el juego secuencial, los problemas de decisión de la firma
están unidos por el tiempo: Beta puede ver lo que Alfa ha hecho, y Alfa puede así contar con
una respuesta racional de Beta a cualquiera de las acciones que esta tome. En un juego
secuencial, la decisión de capacidad de Alfa tiene un valor de compromiso; obliga a Beta
arrinconándolo. Comprometiéndose a una expansión de capacidad grande, Alfa fuerza a Beta a
una posición donde la mejor respuesta de Beta rinde el resultado que es más favorable a Alfa.
Por el contrario, en un juego simultáneo. Beta no puede observar la decisión de Alfa, por lo
tanto la decisión de capacidad no tiene valor de compromiso para Alfa. Debido a ello, la
decisión de GRANDE por parte de Alfa no es ni cercanamente tan poderosa como lo es en el
juego secuencial.
Bagur, B. J., & Calvo, M. B. (1975). Introducción al estudio de la teoría de los juegos y la
teoría de la negociación. Buenos Aires Universidad de Buenos Aires. Facultad de Ciencias
Económicas.
Cerdá Tenaq, E.; Pérez Navarro, J.; Jimeno Pastor, J. L. (2004). Teoría de juegos. Madrid,
PEARSON EDUCACIÓN, S.A.
Shubik, Martin (1996).Teoría de juegos en las ciencias sociales: conceptos y soluciones. Fondo
de Cultura Económica, 1996
17