P2 18. Resumen de Teoría de Los Juegos PDF

Teoría de los Juegos Alberto Souto
Introducción y antecedentes:
La teoría de los juegos (TJ) fue creada originalmente para proporcionar un nuevo acceso a los
problemas económicos, John von Neuman & Oskar Morgenstern (VN&M) no construyeron una
teoría simplemente como un apéndice que debería situarse como una reflexión tardía sobre la
periferia de la economía. Muy al contrario, intuyeron que los problemas típicos del
comportamiento económico son estrictamente idénticos a las nociones matemáticas de juegos
de estrategia adecuados.
El término “juego” podría sugerir que el tema es de poca amplitud y frívolo, lo cual dista
mucho de la realidad. La palabra juego tiene diferentes significados para el hombre de la calle
que para el teórico de los juegos si bien hay algunas similitudes. En ambos tipos de juegos
hay jugadores y éstos deben actuar o tomar ciertas decisiones. Como resultado del
comportamiento de los jugadores, y posiblemente del azar, hay un cierto resultado: una
recompensa o castigo para cada uno de los jugadores participantes.
Los fundamentos de la TJ fueron expuestos por VN, quien en 1928 demostró el teorema básico
del minimax, quedando establecido el tema con la publicación en 1944 de The Theory of
Games and Economic Behavior. Se demostraba que los acontecimientos sociales pueden ser
descriptos de la mejor manera mediante modelos tomados de juegos de estrategia adecuados.
Los fenómenos sociales implican que los hombres a veces actúan unos contra otros, a veces
cooperando entre ellos, tienen distintos grados de información unos acerca de otros y sus
aspiraciones les conducen a contender o cooperar. La TJ es una moderna disciplina que ha
despertado mucho interés por sus nuevas propiedades matemáticas y sus muchas aplicaciones
a los problemas sociales, económicos y políticos. La razón de que las aplicaciones sean más
numerosas y se ocupen de problemas altamente significativos encontrados por científicos
sociales se debe al hecho de que la estructura matemática de la TJ difiere profundamente de
los intentos previos de proporcionar bases matemáticas a los fenómenos sociales, los métodos
y conceptos desarrollados por las ciencias físicas no tuvieron éxito al ser aplicados a los
problemas sociales.
Además de VN&M, hubo otros autores cuyos aportes a la TJ merecieron el premio Nobel de
Economía en 1994. Ellos son John Nash, John Harsanyi y Reinhard Selten, "por su análisis
pionero del equilibrio en la teoría de los juegos no cooperativos".
John Nash (USA, 1928), mientras estudiaba en la Universidad Carnegie Mellon tomó un
curso electivo en Economía Internacional y como resultado a la exposición de ideas y
problemas económicos, llegó a la idea que los condujo al trabajo denominado “El problema del
regateo” ("The Bargaining Problem") que más tarde fuera publicado en Econométrica. Fue esta
idea la que a su vez, cuando era estudiante de posgrado en Princeton, condujo su interés al
estudió de la TJ estimulado por el trabajo de von Neumann and Morgenstern. Como estudiante
de posgrado, estudió matemáticas ampliamente y además de desarrollar la idea de los Juegos
no Cooperativos, ("Non-Cooperative Games"), también hizo desarrollos con respecto a
variedades algebraicas pensando que el trabajo de TJ no sería aceptado para su tesis doctoral.
El equilibrio de Nash es sin duda el concepto de una solución de la TJ más frecuentemente

aplicado en economía. Las aplicaciones económicas incluyen: oligopolio, entrada y salida de un
mercado, equilibrio de mercado, calidad de producto, remates, seguros, educación superior,
discriminación, bienes públicos. En el frente político, las aplicaciones incluyen votaciones,
control e inspección de armamento, como también modelos políticos internacionales, etc.
John Harsanyi (Hungría, 1920), en la década del 50, publicó algunos trabajos sobre el uso
de las funciones de utilidad de VN&M en la economía del bienestar y en ética y sobre la
variedad de preferencias en la economía del bienestar. Su interés en los problemas de la TJ se
originó con un sentido limitado en los cuatro trabajos brillantes de John Nash, publicados en el
período 1950-53, sobre juegos cooperativos y no cooperativos, en juegos bipersonales de
negociación, y sobre estrategias de amenazas mutuamente óptimas de tales juegos, y sobre
los que hoy llamamos el equilibrio de Nash. En 1956, demostró la equivalencia matemática de
1
los modelos de negociación de Zeuthen y Nash y estableció el criterio algebraico para

estrategias de amenaza óptimas. En 1963, extendió el valor de Shapley para juegos sin
utilidad transferible y demostró que su concepto de nueva solución era una generalización de
ambos, el valor de Shapley y de la solución de Nash con amenazas variables.
En un trabajo con otros dos autores publicado en 1967 y 1968, demostró cómo convertir un
juego con información incompleta en uno con información completa, aunque imperfecta, para
hacerlo más accesible al análisis de la TJ. En 1973, demostró que “casi todas” las estrategias
mixtas del equilibrio de Nash pueden ser reinterpretadas como estrategias puras de equilibrio
estricto de un juego especialmente seleccionado con funciones de pago fluctuantes al azar. En
1993 y 1994 escribió dos trabajos proponiendo una nueva teoría de selección de equilibrios. El
trabajo de 1993 lo hace para juegos con información completa, mientras que el de 1994 lo
hace para juegos de información incompleta. Su nueva teoría se basa en la de 1988 pero es
más simple e intuitivamente más atractiva.
Reinhard Selten (Alemania, 1930), su primer contacto con la TJ fue un artículo muy
popular de la revista Fortune que leyó en su último año de la secundaria. Inmediatamente se
sintió atraído por el tema y cuando estudió matemáticas se encontró con el libro de von
Neumann y Morgenstern. Poco después, participó de un seminario para economistas sobre TJ
dictado por el Profesor Ewald Burger quien enseñaba cursos de matemática avanzada pero
también matemática para economistas. Ewald Burger le dio la oportunidad más tarde de
escribir la tesis de la maestría sobre la teoría de los juegos cooperativos. Las tesis de la
maestría y del doctorado tenían como objetivo la axiomatización de valor para juegos de “n”
personas en forma extensiva. Este trabajo lo familiarizó con la forma extensiva, en un
momento que muy poco se había escrito sobre la forma extensiva de los juegos. Esto le
permitió ver el problema más temprano que otros y escribir los aportes que lo llevaron a ganar
el premio Nobel.
¿Cómo analizar un juego?
Ya dijimos que juego tenía un significado particular, la palabra jugador tampoco tiene
exactamente el significado que podría esperarse. No es necesario que un jugador sea una
persona; puede ser un equipo, una corporación, una nación. Es útil considerar como un solo
jugador a un grupo de individuos que tienen intereses idénticos con respecto al juego. Esto
también es cierto para la palabra racional cuando se emplea para explicar el comportamiento.
Dos preguntas básicas deberán ser contestadas acerca de cualquier juego:
1) ¿Cómo deberían comportarse los jugadores?

2) ¿Cuál debería ser el resultado final del juego?
La respuesta a una de estas preguntas, o a ambas, se denomina la solución del juego, pero el
término “solución” no tiene un significado universal en la TJ; en contextos diferentes tiene
significados diferentes.
Estas preguntas conducen a otras. ¿Cuál es el poder de un jugador? Es decir, ¿hasta qué
punto puede un individuo determinar el resultado del juego? Más concretamente, ¿cuál es el
mínimo que un jugador puede asegurarse confiando en sus propios recursos si no recibe
cooperación de otros? ¿Es razonable suponer que los otros jugadores serán de hecho hostiles?
Para responder a estas preguntas deben saberse ciertas cosas acerca del juego. En primer
lugar, uno debe conocer las reglas del juego. Estas incluyen:
1) ¿Hasta qué punto pueden comunicarse los jugadores entre sí?
2) Si los jugadores pueden o no hacer convenios que los obliguen.
3) Si las ganancias obtenidas en el juego pueden ser compartidas con otros jugadores
(esto es, si se permiten pagos secundarios).
4) ¿Cuál es la relación formal, causal, entre las acciones de los jugadores y el resultado
del juego (es decir, la matriz de pagos)?
5) ¿Qué información tienen los jugadores?
2
Además, las personalidades de los jugadores, sus preferencias subjetivas, las costumbres de
la sociedad (es decir, lo que los jugadores entienden por un “resultado justo”) tienen un efecto
sobre el resultado.
Quizás la característica más significativa de un juego sea el número de jugadores, esto es, su
tamaño. Sin embargo, podemos clasificar a los juegos de las siguientes formas:
a) Según la cantidad de jugadores, juegos unipersonales, bipersonales o de n personas.

b) Según el resultado de la suma de los beneficios, juegos de suma cero o suma no nula.
c) Según el número de estrategias, juegos de m x 2, de 2 x n, o de m x n.
d) Según la información de que disponen los jugadores, de información perfecta o no.
e) Según los planes de los jugadores, puro conflicto, negociación o pura coordinación.
En cuanto a esta última clasificación, cuando nos referimos al conflicto, nos referimos a éste
como un continuo donde los extremos refieren a la existencia o no del mismo.
Conflicto 0 (Pura cooperación) 1 (Puro conflicto)

Intereses Convergentes Divergentes
Comunicación Coordinación Secreto/Amenaza
Juego Cooperativos Competitivos
Beneficios Suma no nula Suma nula
Negociación:
Situaciones de asociación precaria
O antagonismo incompleto
Negociaciones integrativas Negociaciones distributivas
Generalmente cuanto menor sea el número de jugadores tanto más sencillo será el juego. Al
pasar de los juegos más sencillos a los más complicados, las teorías resultan menos
satisfactorias. En los juegos más complicados, un jugador se enfrenta a fuerzas que no puede
controlar. Cuanto menor sea el control que un jugador tiene sobre el resultado final,
tanto más difícil resulta definir el comportamiento racional. Anteriormente
preguntamos lo que debería hacer un jugador y lo que debería ser el resultado final del
juego,; debería, no en el sentido moral, sino en el sentido de lo que más apoyará a los
intereses de un jugador. La cuestión de lo que la gente hace realmente y de lo que realmente
sucede cuando se desarrolla un juego es mejor dejarla para las ciencias del comportamiento.
Desde este punto de vista, se explicará a continuación la teoría normativa. Para ello,
veremos los elementos y supuestos de la misma.
Los elementos los enunciamos anteriormente y comprenden a los jugadores (decididores), las
reglas del juego, y los resultados. Se llama movida a cada elección que realiza un jugador,
partida al conjunto de movidas y estrategia es el método predeterminado para efectuar
movidas. El supuesto básico es la racionalidad de los contendientes y esto se expresa por
el fin que tienen que es maximizar la utilidad, la utilidad se entiende como una magnitud
cardinal, y que los jugadores tienen información perfecta acerca de los resultados,
estrategias posibles y preferencias de los participantes.
El juego unipersonal
Estos juegos son los más sencillos, tan es así que algunos no los consideran juegos. En ellos
es conveniente considerar a la naturaleza como una persona y entonces los juegos
unipersonales son realmente juegos en contra de la naturaleza. Pueden agruparse en tres
categorías sobre la base del papel que juega la naturaleza. En la primera categoría, la
naturaleza no tiene ningún papel activo. El jugador hace sencillamente su elección y esa
elección determina lo que ocurre. En la segunda, las leyes del azar intervienen. Primeramente,
elige el jugador y después las reglas del azar determinan el resto. Aquí el jugador está
3
enterado de antemano de las probabilidades pertinentes. En la tercera categoría el jugador

toma su decisión sin información previa sobre cómo jugará la naturaleza. Podemos considerar
que este tipo de juegos son los que analiza la Teoría de la Decisión y corresponden a las
decisiones bajo certeza, riesgo e incertidumbre.
Los juegos finitos, bipersonales, de suma cero de información perfecta.
Ningún juego puede servir como un modelo universal; un juego único es inadecuado incluso
para representar un grupo de juegos. Por consiguiente, vamos a dividir los juegos finitos,
bipersonales, en tres categorías:
1. Juegos de suma cero con información perfecta
2. Juegos de suma cero
3. Juegos de suma no nula
Debido a que los juegos de suma cero de información perfecta son en general juegos de salón
como el ajedrez, damas, tateti, y el go. La inversa no es cierta, es decir el póker y el bridge no
son juegos de información perfecta.
Los elementos que definen a un juego de información perfecta son:

• Hay dos jugadores
• Tienen intereses opuestos con respecto al resultado del juego
• El juego es finito
• No hay sorpresas, ambos jugadores están completamente informados en todo momento.
Una característica general de este tipo de juegos es que están estrictamente

determinados. Esto significa para un juego donde un jugador gana y el otro pierde que uno
de los jugadores tiene una estrategia ganadora. Esto significa una estrategia que si se elige le
garantizará un triunfo independientemente de lo que haga su oponente.
Para este curso, no nos detendremos en este tipo de juegos y pasamos directamente a los
juegos sin información perfecta.
El Juego general, finito, bipersonal de suma cero, con información imperfecta.
Comenzaremos con los elementos del juego y analizaremos un ejemplo:
Existen dos jugadores A y B que tienen a su disposición un conjunto de estrategias, como las
siguientes: A => X (x1, x2, x3,……xm) y B => Y (y1, y2, y3,….yn)
La suposición que se hace es que el resultado del juego es cierto pago que hace B a A. El pago
de B a A será negativo si es B quien gana. Se simboliza el pago con a ij si del conjunto de
estrategias A elige xi y B elige yj. Es el pago que realiza B.
El juego queda determinado por dos conjuntos de estrategias y la matriz de pagos o tabla de
pagos según la estrategia.
A\B Jugador minimizante B
Estrategias Y1 Y2 ….. Yj …. Yn
X1 a11 a12 ….. a1j ….. a1n
Jugador X2 a21 a22 ….. a2j ….. a2n
Maximizante … … … ….. … ….. …
A Xi ai1 ai2 ….. aij ….. ain
… … … ….. … ….. …
Xm am1 am2 ….. amj ….. amn
Objetivo de cada jugador: ganar tanto como pueda del juego con seguridad ante un
enemigo hábil que persiguen justamente lo contrario.
4
1) A es un jugador maximizante y desea actuar de tal manera que el menor número que
el pueda ganar sea tan grande como sea posible independientemente de lo que B
realice. Entonces tiene garantía de ganar por lo menos si elige Xi
Ri = mín(j) aij de todos los pagos posibles (ai1, ai2, …ain)
Va a tratar que su mínimo sea el máximo es decir sea V1
V1 = max(i) Ri = max(i) min(j) aij
2) Si B elige la estrategia Yj deberá efectuar algunos de esos pagos (a1j, aij, …amj) pero
es el jugador minimizante entonces desea que el número mayor que deba pagar al
jugador A sea el menor posible. Entonces le conviene elegir de sus estrategias aquella
donde su Sj máximo sea mínimo; es decir
V2 = min(j) Sj = min(j) max(i) aij
3) Supongamos que cada uno eligió según los puntos 1 y 2 entonces:
A elige la estrategia Xk, en tal forma que:

Rk = V1 = max(i) Ri (Valor maximin de la matriz)
B elige la estrategia Yl, de modo que:

Sl = V2 = min(j) Sj (Valor minimax de la matriz)
4) De acuerdo a las definiciones Ri y Sj será:

V1 = Rk = min(j) akj ≤ akl
V2 = Sl = max(i) ail ≥ akl
Resultando como consecuencia que:
V1 ≤ akl ≤ V2 o sea
V1 ≤ V2
Se expresa diciendo que lo más que el jugador A se puede asegurar como ganancia no es
nunca mayor que lo mínimo que el jugador B se puede asegurar como pago; o lo que es lo
mismo que: maximin ≤ minimax.
La cantidad V1 se llama valor del juego para A

La cantidad V2 se llama valor del juego para B
Si eligen una estrategia distinta pueden ganar más o perder menos pero también pueden
ganar menos que V1 o perder más que V2. B se protege de perder como máximo V2.
Veamos con un ejemplo numérico lo expresado anteriormente:
La matriz se expresa como los pagos que B le efectúa a A. El pago de B a A será negativo si B
gana.
Jugador B, II minimizante Min fila

Jugador A, I -4 20 2 -4
Maximizante 6 6 5 5
-3 -1 1 -3
Max col 6 20 5
El juego está estrictamente determinado y el valor del juego es 5 conocido como punto de
equilibrio, punto de silla, o punto de ensilladura. Puede haber varios, pero si ese es el caso,
todos tienen el mismo valor.
5
Si A elige la segunda estrategia está seguro de recibir por lo menos 5

Si B elige la tercera estrategia está seguro de perder como máximo 5
Estas son estrategias óptimas puras ya que el juego está estrictamente determinado.
Estrategias Mixtas:
Cuando los juegos bipersonales de suma cero tienen puntos de equilibrio, se suele convenir
que su pago común debería ser el resultado final. Sin embargo, hay también juegos sin puntos
de equilibrio y son estos los que originan la dificultad. En la “Carta Robada”, Edgar Allan Poe
discutió tal juego con el personaje de un niño de ocho años que siempre ganaba las apuestas
con sus compañeros de escuela. La forma de razonar del chico que sus compañeros llamaban
afortunada, no era más que una identificación del intelecto del razonador con el de su
oponente. Si estuviéramos a merced del niño la situación parecería desesperada ya que
siempre adivinaría nuestros movimientos por su forma de razonar. Una forma de vencerlo
sería tratar de adelantarse al niño prodigio pero él siempre nos derrotaría por lo cual la forma
de hacerlo mejor sería no razonar en absoluto. Desde luego uno siempre puede elegir una
estrategia pura pero también puede usar un artificio de azar para que haga la decisión por Ud.
Una estrategia que requiere la selección de una estrategia pura mediante un artificio de azar
se llama estrategia mixta. Desde este punto de vista Ud. tendría no dos sino infinito número
de estrategias mixtas.
Resumiendo: Ud. ha tomado un juego en el que aparentemente está a merced de su

oponente inteligente y lo ha transformado en uno en que su oponente no tiene esencialmente
control sobre el resultado. Pero, si Ud. puede lograr esto cuando descubre su estrategia ¿no
lograría mejor resultado si se la guarda para Ud.? No, Ud. no puede lograr más y resulta claro
el por qué: su oponente puede hacer lo mismo que Ud. ha hecho. Puede, también, empleando
un artificio al azar, asegurar una probabilidad igual de ganar. Así pues, cada jugador tiene en
su mano el ver que el otro no consiga ventaja.
Es concebible que un jugador pueda conseguir mejores resultados no utilizando el azar. Por
ejemplo, el caso del niño prodigio que se anticipa a las elecciones de su oponente puede
intentar explotar esa debilidad. Si su contrincante desconoce el empleo del azar (o
equivocadamente piensa que es más inteligente que Ud.) puede ser posible explotar su
ignorancia. Pero en el mejor de los casos esta es una ventaja dudosa: puede ser siempre
neutralizado por un oponente inteligente. También debe observarse que en el juego una vez
que un jugador recurre al azar, no solamente puede no perder (como promedio)
independientemente de lo bien que juegue su oponente; no ganará por muy mal que juegue
su contrario. Así pues, cuanto más hábil sea su oponente, tanto más atrayente será el
procedimiento al azar.
Veamos una variante para analizar una estrategia mixta:
Jugador II minimizante min fila

Jugador I 5 4 4
Maximizante 3 6 3
Max col 5 6
En este caso no existe punto de ensilladura, por lo tanto hay que recurrir a una estrategia
mixta, que se despeja matemáticamente, igualando las ecuaciones, o gráficamente:
Solución para jugador I
Si II elige la primera estrategia E1, la ganancia esperada de I será:

E1(p) = 5p + 3 (1-p) son los pagos que II le da a I
Si II elige la segunda estrategia E2, la ganancia esperada de I será:

E2(p) = 4p + 6 (1-p) son los pagos que II le da a I
6
Estrategias Mixtas:
Solución para jugador I, maximizante
10 10
9 9
8 8
7 7
6 Max de min 6
VE
VE
5 de II
E2 E1 de II 5
4 4
E1 de II
3 E2 de3II
2 2
1 1
0 0
P=0 0,75 P=1
Frecuencia
E1 de II E2 de II
El maximizante elige por fila, de los menores el mayor.
Solución para el jugador II
Si I elige la primera estrategia E1, el pago esperado de II será:

E1(q) = 5q + 4 (1-q) son los pagos que I recibe de II
Si I elige la segunda estrategia E2, el pago esperado de II será:

E2(q) = 3q + 6 (1-q) son los pagos que I recibe de II
Estrategias Mixtas:
Solución para jugador II, minimizante
10 10
9 9
8 8
7 7
E2 de 6I E1 de6I
Min de max
VE
VE
E1
5 de I 5
4 4
3 E2 de I 3
2 2
1 1
0 0
Q=0 0,50 Q=1
Frecuencia
E2 de I E1 de I
Para cada valor q que el jugador elige observa el máximo que puede perder. Elige que el
máximo sea mínimo. El minimizante elige por columna, de los mayores el menor.
Conclusiones:
Al jugador I le convine jugar ¾ E1 (p) y ¼ E2 (p) para asegurarse una utilidad de 4,5
Al jugador II le convine jugar ½ E1 (q) y ½ E2 (q) para asegurarse una pérdida de 4,5
Si el jugador I elige una estrategia óptima mixta, el otro jugador no puede hacer otra cosa
mejor que elegir su estrategia óptima mixta también.
7
Jugador I p 1-p valor

Maximizante 5 0.75 3 0.25 4.5
4 0.75 6 0.25 4.5
Jugador II q 1-q valor

Minimizante 5 0.50 4 0.50 4.5
3 0.50 6 0.50 4.5
Método abreviado
Jugador II minimizante min fila

Jugador I 5 4 |1| ¾
Maximizante 3 6 |3| ¼
Max col |2| ½ |2| ½ 4
Dominancia:
Si en una columna cada pago es mayor o igual que cada uno de los pagos de la otra columna
se dice que está dominada por esta última, pudiendo suprimirse la primera (Dejo la columna
con los menores valores). Teniendo el jugador minimizante la elección de las
estrategias en las columnas habrá de dejar de lado aquella estrategia con los valores
mayores. Deja de lado las estrategias donde tiene que pagar más.
Si en las filas una de ellas tiene cada uno de sus pagos menores que los de otra se dice que la
primera está dominada por esta última. Teniendo el jugador maximizante la elección de
las estrategias en las filas habrá de dejar de lado aquella estrategia con los valores
menores. Deja de lado las estrategias donde recibe menos. Ejemplo:
Sin dominancia:

Jugador A, I 450 500 400 400
Maximizante 600 550 500 500
450 550 400 400
Max col 600 550 500
Con dominancia:

Jugador A, I 450 500 400
Maximizante 600 550 500
450 550 400
Max col
Eliminamos fila A1 por ser sus valores menores a A2.

Jugador A, I 600 550 500
Maximizante 450 550 400
Max col
Eliminamos luego columna B2 por ser sus valores mayores a B3.

Jugador A, I 600 500
Maximizante 450 400
Max col
8
Aquí se pueden eliminar A2 por ser sus valores menores que A1 y también B1 por ser sus
valores mayores que B2.
Por lo cual llegamos al punto de equilibrio por dominancia.
El Teorema del Minimax de VN:
El teorema establece que uno puede asignar a cada juego finito, bipersonal de suma cero un
valor V: la cantidad media que el jugador I puede esperar ganar el jugador II si ambos
jugadores actúan cuerdamente. VN intuyó que este resultado previsto es plausible por tres
razones:
a) Hay una estrategia para el jugador I que protegerá esta ganancia, contra ella nada que
pueda hacer el jugador II evitará que el jugador I obtenga una ganancia media de V.
Por tanto, el jugador I no se conformará con algo que sea menor que V.
b) Hay una estrategia para el jugador II que le garantizará que no perderá más de una
valor V como promedio; esto es, puede evitarse que el jugador I consiga más de V.
c) Por hipótesis, el juego es de suma cero. Lo que gane el jugador I debe perderlo el II.
Puesto que el jugador II desea minimizar sus pérdidas, este jugador está motivado
para limitar la ganancia media del jugador I a V.
Este último supuesto es crucial ya que, en los juegos de suma no nula, donde no se cumple,
no debe concluirse que justamente, porque el jugador II tenga el poder de limitar las
ganancias del jugador I, lo hará así necesariamente. Pero aquí donde el perjudicar al jugador I
es para II equivalente a apoyar sus propios objetivos, la suposición es obligada.
Con la inclusión del Teorema se pueden tratar todos los juegos bipersonales de suma
cero como si tuviesen puntos de equilibrio. El juego tiene un valor claro y cada jugador
puede forzar este valor seleccionando la estrategia adecuada. La única diferencia entre los
juegos con puntos de equilibrio reales y los que no los tienen es que un caso puede utilizarse
una estrategia pura y obtener el valor del juego con certeza mientras que en el otro caso
debe usarse una estrategia mixta y obtener el valor del juego como promedio.
La virtud de la estrategia del minimax es la seguridad. Empleando la estrategia del minimax,

un jugador evitará hacer algo absurdo, tal como jugar una estrategia dominada. Sin embargo,
debe destacarse que esta estrategia es esencialmente defensiva, y cuando se usa a menudo
se elimina la posibilidad de lograr un mejor resultado. Se obtiene el valor del juego; no
menos, pero no más.
El juego bipersonal de suma no nula.
La teoría de los juegos bipersonales de suma cero es excepcional en el sentido que le permite
a uno encontrar soluciones – soluciones que además están universalmente aceptadas.
En este respecto, los juegos de suma cero son distintos de los problemas reales que surgen en
la vida cotidiana que generalmente no se prestan a respuestas sencillas. En los juegos de
suma distinta de cero no hay una solución universalmente aceptada; es decir no hay
una sola estrategia que sea claramente preferible a las otras ni hay un resultado único,
definido y previsible. Como norma tendremos que contentarnos con algo menos que las
soluciones inequívocas que obtuvimos para los juegos de suma cero.
Análisis de un juego bipersonal de suma no nula.
El modo más sencillo de obtener algún conocimiento del juego de suma no nula es tratar de
analizar uno de la misma forma que analizamos el juego de suma cero.
9
Jugador II
(0,0) (10,5)
Jugador I
(5,10) (0,0)
Los pares que figuran en las estrategias se interpretan como (pagos al jugador I, pagos al
jugador II)
Cómo vería el juego el jugador I:
Jugador II
0 10 0
Jugador I 5 0 0
5 10
No hay un punto de equilibrio. Por lo tanto, debemos utilizar una estrategia mixta
Jugador II
0 10 |10| 1/3
Jugador I 5 0 |5| 2/3
|5| |10| 15
2/3 1/3
Esto es lo que puede obtener el jugador I sin ninguna participación del jugador II. Esto sería lo
mínimo que él estaría dispuesto a fijar.
Valor del juego para I sería: VjI = 0p + (1-p) 5 = 10p + 0(1-p)

VjI = 5 – 5p = 10 p
VjI = p = 1/3 => 10/3
Hasta aquí es igual que la resolución del juego bipersonal de suma cero, entonces
¿por qué no se resuelve de esta manera?
El problema es que los pagos son demasiados bajos. Aunque cada jugador puede evitar que
el otro obtenga más del 10/3 (que era lógico para el juego de suma cero) no hay razón para
que lo haga. Si se encuentran en los cuadrantes (5,10) y (10,5) que son pagos distintos de
cero ganan ambos más que 10/3.
Ya no es más “cierto” que un jugador pueda volverse más rico manteniendo pobre a
su oponente.
Supongamos que el jugador I se anticipa a todo esto y adivina que el jugador II jugará E1, 1/3
del tiempo. Si el jugador I pasa a la estrategia pura E1, el jugador II obtendrá todavía 10/3
pero el jugador I obtendrá ahora 20/3.
Ejemplos para que planteen las matrices correspondientes:
Publicidad:
Dos firmas de publicidad se reparten el mercado de la siguiente manera: cada una de las
firmas está a punto de comprar una hora de tiempo de televisión para anunciar sus productos
competitivos. Pueden anunciarse durante la mañana o durante la noche. La audiencia de
televisión se divide en dos grupos. Un porcentaje de la gente ve la televisión durante las horas
de la mañana y el restante durante la noche; no hay intersección entre los dos grupos. Si
ambas compañías anuncian durante el mismo período, cada una venderá en igual porcentaje
10
de los espectadores. Si anuncian en períodos diferentes cada una venderá al mismo porcentaje
de la audiencia.
Publicidad Empresa II
Estrategias Mañana Noche
Mañana (25,25) (10,30)

Empresa I
Noche (30,10) (15,15)
La batalla de los sexos
Un hombre y una mujer han decidido que irán al cine o al boxeo esa noche. Ambos prefieren ir
juntos mejor que solos. Mientras el hombre preferiría ir con su mujer al boxeo, prefiere ir con
ella al cine que ir solo al boxeo. Análogamente, la primera decisión de su mujer es ir juntos al
cine, pero ella también prefiere ir juntos al boxeo que ir sola al cine. Los pagos reflejan el
orden de preferencia de los jugadores.
Batalla de Novio
los sexos
Estrategias Box Película
Box (2,3) (1,1)

Novia
Película (1,1) (3,2)
Factores a tener en cuenta en los juegos de suma no nula:
1. ¿Pueden los jugadores consultarse de antemano y ponerse de acuerdo

anticipadamente para sus estrategias respectivas?
2. ¿Tienen obligatoriedad estos acuerdos a los cuales llegan? Es decir, el juez deberá insistir
en el cumplimiento o sólo tiene fuerza moral
3. ¿Existen pagos posteriores colaterales? (Ojo en el caso de la batalla de los sexos, no se
puede si se juega una vez, sí la puede compensar en un próximo juego).
4. ¿Es legal o posible que se pueda conspirar para fijar precios?
Comparación con el juego de suma nula:
Comunicación: Podría pensarse que la facultad de comunicar nunca podría actuar en

desventaja de un jugador. Después de todo, si un jugador tiene la opción de comunicarse,
puede rehusar a ejercerla y colocarse en la misma situación que si no existiesen los medios
para la comunicación; o así pudiera parecer. La incapacidad para comunicar puede muy
bien actuar a favor de un jugador y esta ventaja se pierde si hay una forma de
comunicar, incluso aunque no se produzca la comunicación. En el juego de suma cero la
facultad de comunicar no es una ventaja ni una desventaja, los jugadores no tienen nada que
decirse.
Juego simétrico: A menudo, es ventajoso para un jugador jugar antes que su oponente,
incluso si las reglas no exigen que lo haga, o bien, anunciar su decisión en forma irrevocable.
En el juego de suma cero, esto no pasa.
Modificar las reglas del juego: si se modifican las reglas de manera que uno de los
jugadores no puede elegir alguna de las estrategias que originariamente estaba a su alcance,
en el juego de suma cero, podría no perder nada, en el de suma no cero podría muy bien
ganar.
11
Conocer la función de utilidad del otro: sucede a menudo en un juego de suma no nula
que un jugador gana si su oponente no conoce su función de utilidad. Esto no es
sorprendente. Sí es una ventaja a veces que su oponente conozca la función de utilidad y
puede estar en peores circunstancias cuando la sepa. Esto no ocurre en los juegos de suma
cero ya que se supone que ambos jugadores conocen la función de utilidad del otro.
No vamos a ver en detalle cada uno de estos puntos, pero sí uno que es sumamente
relevante, la comunicación.
Ejemplo de comunicación:
Adicionalmente a los comentarios ya hechos cuando analizamos el continuo de conflicto,

consideremos aquí la siguiente situación (es una variante del dilema del prisionero):
Conflicto Jugador II
Estrategias A B
A (5,5) (0,6)
Jugador I
B (6,0) (1,1)
Hay dos propiedades básicas de este juego que son dignas de destacar:
Independientemente de la estrategia que juegue su pareja, un jugador consigue el mejor
resultado jugando B. También, independientemente de la estrategia que un jugador
seleccione finalmente, siempre lo hace mejor si su pareja juega la estrategia A. El
conflicto surge porque cada jugador debería jugar B, mientras que cada uno espera que el otro
juegue A. Por otra parte, es ventajoso para ambos que el conflicto se resuelva eligiendo
ambos A mejor que B. ¿Cómo hacer?
Si se juega una vez:

El resultado cooperativo (5,5) es poco probable. Ningún jugador puede influir en el juego.
Si se juega varias veces:

A través de la comunicación tácita, el compañero puede ser inducido a jugar A y
eventualmente se obtiene (5,5). ¿Cómo? Eligiendo una alternativa menos favorable, si el
compañero es estúpido o testarudo, volver a la estrategia asesina.
Sobre la base que vimos hasta ahora, la facultad de comunicación podría parecer una
ventaja. Hasta aquí los únicos mensajes contemplados son ofertas para cooperar y estos,
obviamente, deben ser en interés de ambos jugadores. También es posible la comunicación
de amenazas, Luce y Raiffa, idearon el siguiente juego, comparemos que ocurre cuando
pueden comunicarse y cuando no pueden hacerlo:
Conflicto Jugador II
Estrategias A B
A (1;2) (3;1)
Jugador I
B (0;-200) (2;-300)
No hay comunicación:
Obviamente no podrán amenazarse. El jugador I, lo mejor que puede hacer es jugar la

estrategia A y el jugador II también.
Si hay comunicación:
12
Hay un cambio fundamental. La situación del jugador II empeora.
Si puede obligarse el cumplimiento de los acuerdos:
El jugador I puede amenazar jugar la estrategia B a menos que el jugador II se comprometa a

jugar la estrategia B. Si el jugador II cede, el I ganará 2 y el II perderá 1 relativamente al
pago original.
Si se permiten pagos colaterales:
La situación del jugador II resulta aún peor. El jugador I, no sólo puede imponer la estrategia
a II, sino que también puede pedir algo bajo cuerda.
En general:
Es cierto que el jugador II puede rehusar negociar con el jugador I e ignorar sus amenazas.
Todavía sería para los mejores intereses del jugador I jugar la estrategia A, pero ¿quién puede
asegurar lo que tendrá una mayor influencia en su comportamiento, su propio interés o o su
resentimiento a ser rechazado?
La cuestión es que el jugador II puede evitarse todas estas complicaciones si la comunicación

es imposible.
Amenaza: es una aseveración de que se actuará de un cierto modo bajo determinadas

condiciones. El propósito de una amenaza es el de cambiar el comportamiento de alguien:
hacer que haga algo que no haría en caso contrario. Una amenaza es solamente efectiva hasta
el punto en que es plausible. Cuanto mayor sea el precio que debe pagar la parte que hace la
amenaza para llevarla a cabo, es tanto menos plausible.
El dilema del prisionero (de A. W. Tucker):
Dilema del Sospechoso II

Prisionero
Estrategias Confiesa No
Confiesa
Confiesa (5;5) (0;20)
Sospechoso
I
No (20;0) (1;1)*
confiesa
*Solución cooperativa
Dos hombres sospechosos de cometer juntos un crimen son detenidos por la policía y situados
en celdas separadas. Cada sospechoso puede confesar o permanecer silencioso, y cada uno
conoce las posibles consecuencias de su acción. En la matriz de pago figuran los años de
prisión que enfrentarían en cada caso. El 0 indica la libertad inmediata. Se debe suponer que
no hay honor entre los ladrones y que lo que a cada sospechoso concierne es su interés.
¿Qué harían los criminales?
Consideremos la situación desde el punto de vista de uno de los criminales:
El debe tomar su decisión sin saber lo que hará su compinche, por lo tanto debe considerar
cada una de las estrategias que el otro tiene a su disposición:
Supongamos que su compinche confiesa: nuestro hombre debe permanecer silencioso e ir

a la cárcel 20 años, o confesar e ir a la cárcel 5 años.
Supongamos que su compinche no confiesa: puede sacar un año si permanece en silencio
o ganar su libertad confesando.
¡¡Aparentemente en uno y otro caso sale mejor librado confesando!!
13
¿Cuál es entonces el problema?

La paradoja se basa en esto. Dos prisioneros ingenuos, demasiado ignorantes para seguir
este argumento atrayente, no hablan y van a la cárcel un año. Dos prisioneros inteligentes,
con el mejor asesoramiento de la TJ, confiesan y sacan 5 años en prisión durante los que
pueden contemplar su inteligencia y leer más libros de TJ.
Elementos esenciales del problema:

Cada jugador tiene dos estrategias básicas: puede actuar cooperativamente o no
cooperativamente. Cuando todos los jugadores actúan cooperativamente cada uno
consigue un mejor resultado que cuando actúan no cooperativamente. Para cualquier
estrategia fijada del otro jugador siempre consigue más jugando no cooperativamente.
Otros ejemplos de la economía:

• Pago de impuestos y evasión.
• Escasez de agua y se le pide a los ciudadanos que restrinjan el uso de la misma.
• Dos naciones armando su presupuesto militar, cuanto más gasten terminarán en una
misma posición relativa de poder pero más pobres.
Comentarios finales del dilema del prisionero:
Al jugar repetidamente el dilema del prisionero, no un número determinado de veces, sino

un período indefinido, es cuando la estrategia cooperativa hace valer sus méritos. Y
éstas son normalmente las condiciones bajo las cuales se juega el dilema del prisionero. Dos
firmas competitivas saben que no estarán en el negocio siempre, pero generalmente no tiene
forma de saber cuando desaparecerán por fusión, absorción, cierre o liquidación. El argumento
a favor de la estrategia no cooperativa se desmorona y respiramos aliviados ya que no se
sabe cuando será el último juego.
El DP es distinto a cualquier otro tipo de juego. Como norma para analizar un juego, uno está
satisfecho con saber que harían dos jugadores racionales y predecir cuál será el resultado. En
el DP la estrategia no cooperativa es tan poco atrayente que la pregunta que trataríamos
de contestar es ¿Cómo podemos justificar el jugar una estrategia cooperativa?
Juegos secuenciales y árboles de juegos.
La firma perfectamente competitiva enfrenta muchos competidores, pero al tomar su decisión

de producción, no considera las probables reacciones de sus rivales. Esto es porque las
decisiones de una sola firma tienen un impacto insignificante en el precio de mercado. El
desafío estratégico clave de una firma perfectamente competitiva es anticipar el futuro patrón
de los precios en la industria y maximizar en función de ello.
En muchas situaciones estratégicas, sin embargo, existen pocos jugadores. Por ejemplo, en el
mercado de las carrocerías aéreas comerciales, existen dos productores: Boeing y Airbus. En
estas situaciones de pequeños números, una parte clave de tomar decisiones estratégicas
(precio, inversión en nuevas instalaciones, etc.) es anticipar cómo los rivales pueden
reaccionar. Una forma natural de incorporar las reacciones de los rivales en el análisis de las
alternativas estratégicas es asignar probabilidades a sus más probables acciones o reacciones
y luego tomar la decisión que maximiza el valor esperado de la ganancia, dada su distribución
de probabilidad. Pero este enfoque tiene una contra importante. ¿Cómo se asignan
probabilidades al rango de opciones que el rival puede elegir? Uno podría terminar asignando
probabilidades a alternativas que, desde la perspectiva de los competidores, serían tontas. Si
es así, entonces la calidad del análisis de decisión estaría seriamente comprometida.
Un enfoque más penetrante sería tratar de meterse en la mente de los competidores,

imaginarse cuáles son sus intereses, y luego maximizar de acuerdo con ello. Sin embargo, las
decisiones óptimas de los rivales a menudo dependerán de sus expectativas de lo que uno
intenta hacer, lo cual a su vez, depende de sus evaluaciones de las evaluaciones de uno sobre
ellos. ¿Cómo uno podría analizar la toma de decisiones seriamente con este círculo?
14
La Teoría de los Juegos es la más apropiada para estos contextos. Es la rama de la economía
que se ocupa del análisis de la toma de decisiones óptima cuando todos los decididores se
presumen racionales, y cada uno está tratando de anticipar las acciones y reacciones de los
competidores.
Juegos en forma de matriz y el concepto de equilibrio de Nash.
La forma más fácil de presentar los elementos básicos de la Teoría de los Juegos es a través
de un ejemplo sencillo. Consideremos una industria con dos firmas. Alfa y Beta, que producen
idénticos productos. Cada una debe decidir si aumentar su capacidad de producción para el
año que viene. Asumiremos que cada firma siempre produce a su capacidad plena. Así, la
expansión de capacidad implica una compensación. La firma puede lograr una mayor
participación de mercado, pero también puede poner presión hacia la baja del precio de
mercado. Las consecuencias de las decisiones de cada firma se describen en la Tabla
siguiente. La primera cifra se refiere a la ganancia económica anual de Alfa y la segunda a la
ganancia económica anual de Beta (las cifras se expresan en millones por año).
Beta
Estrategias No expandir Expandir
Alfa No expandir 18 ; 18 15 ; 20
Expandir 20 ; 15 16 ; 16
Cada firma tomará su decisión de expansión simultáneamente e independientemente de la

otra firma. Para identificar el resultado probable de los juegos como el que se muestra en la
tabla anterior, los teóricos de los juegos usan el concepto de equilibrio de Nash. El resultado
del equilibrio de Nash es que cada jugador está haciendo lo mejor que puede, dadas las
estrategias de los otros jugadores. En el contexto del juego de la expansión de capacidad, el
equilibrio de Nash es aquel par de estrategias (una para Alfa y otra para Beta) tales que:
• La estrategia de Alfa maximiza su ganancia, dada la estrategia de Beta.
• La estrategia de Beta maximiza su ganancia, dada la estrategia de Alfa.
En el juego de la expansión de capacidad, el equilibrio de Nash es Expandir/Expandir, esto es

cada firma expande su capacidad. Dado que Alfa expande su capacidad, la mejor opción para
Beta es expandir su capacidad (obteniendo una ganancia de 16 en vez de 15). Dado que Beta
expande su capacidad, la mejor opción de Alfa es expandir su capacidad. En este ejemplo la
determinación del equilibrio de Nash es bastante fácil porque para cada firma, la estrategia
“expandir” maximiza la ganancia sin importar la decisión que tome el competidor. En esta
situación, decimos que “expandir” es una estrategia dominante. Cuando un jugador tiene una
estrategia dominante, se sigue que (por la definición del equilibrio de Nash) esa estrategia
debe también ser la estrategia del equilibrio de Nash del jugador. Sin embargo, las estrategias
dominantes no son inevitables, en muchos juegos los jugadores no poseen estrategias
dominantes como por ejemplo en la siguiente Tabla:
Beta
Estrategias No expandir Pequeña Grande
Alfa No expandir 18 ; 18 15 ; 20 9 ; 18
Pequeña 20 ; 15 16 ; 16 8 ; 12
Grande 18 ; 9 12 ; 8 0;0
¿Por qué el equilibrio de Nash parece un resultado plausible del juego? Probablemente su
propiedad más atrayente es que es un punto focal de auto-cumplimiento: si cada parte espera
de la otra que elija su estrategia de equilibrio de Nash, entonces, ambas partes, elegirán, en
efecto, sus estrategias de equilibrio de Nash. En el equilibrio de Nash, entonces, la expectativa
es igual al resultado – comportamiento esperado y comportamiento real convergen. Esto no
sería verdad en situaciones que no tienen un equilibrio de Nash como en el juego de la Tabla
anterior. Supongamos que Alfa (quizás tontamente) espera que Beta no expanda su capacidad
y se abstiene de expandir su propia capacidad para evitar una caída en el precio de mercado.
15
Beta, persiguiendo su propio interés, confundiría las expectativas de Alfa, expandiendo su

capacidad, y haciendo que Alfa empeore su situación más de lo que espera estar.
El juego de la expansión de capacidad ilustra un aspecto notable del equilibrio de Nash. El

equilibrio de Nash no necesariamente corresponde a un resultado que maximiza la ganancia
conjunta de los jugadores. Alfa y Beta estarían conjuntamente mejor absteniéndose de
expandir sus capacidades. Sin embargo, la persecución racional del interés propio conduce a
cada parte a tomar una acción que es en detrimento de su interés conjunto.
Este conflicto entre el interés colectivo y el interés propio es a menudo denominado el dilema
del prisionero. El dilema del prisionero se origina porque en la búsqueda de su propio interés,
cada parte impone a la otra un costo que no tiene en cuenta. En el juego de la expansión de la
capacidad, la expansión de Alfa lastima a Beta porque conduce a una baja del precio de
mercado. El dilema del prisionero es un concepto clave en el equilibrio de precios y decisiones
de producción en industrias oligopólicas.
Árboles de juegos y subjuego perfecto.
La forma de matriz es particularmente conveniente para representar juegos en los cuales cada
parte mueve simultáneamente. En muchos casos, sin embargo, la toma de decisiones es
secuencial más que simultánea, y es manudo más conveniente representar el juego con un
árbol de juego en vez de una matriz de juego.
Para ilustrar tal situación, modifiquemos el juego de la expansión de capacidad para permitir a
la firma elegir entre tres opciones: no expandir la capacidad actual, una expansión pequeña, o
una expansión grande. Como contraste, examinemos primero qué ocurre cuando ambas
firmas deciden simultáneamente. Para eso utilizamos la última tabla donde el equilibrio de
Nash es pequeña/pequeña.
Pero ahora supongamos que Alfa busca adelantarse a Beta tomando su decisión de capacidad
un año antes que Beta. Así, para el momento en que Beta tome su decisión, ya habrá
observado la decisión de Alfa y debe ajustar su toma de decisión de acuerdo con ello.
Podemos representar la dinámica de este proceso de toma de decisiones a través de un árbol
de juego.
No expandir (18 ; 18)
No Expandir Beta Pequeña (15 ; 20)
Grande ( 9 ; 18)
Alfa Pequeña Beta Pequeña (16 ; 16)
Grande ( 8 ; 12)
Grande Beta Pequeña (12 ; 8)
Grande ( 0 ; 0)
Para simplificar el problema sólo consideraremos una decisión de dos momentos o etapas; Alfa
toma su decisión primero y luego Beta responde. No consideraremos la posibilidad de que Alfa
podría responder a la decisión de capacidad tomada por Beta.
16
Al analizar este árbol del juego, vemos lo que se denomina un subjuego de equilibrio perfecto
de Nash (SEPN). En un SEPN, cada jugador elige la acción óptima en cada momento o etapa
del juego a la cual podría razonablemente alcanzar y cada jugador cree que todos los otros
jugadores se comportarán de la misma manera. Para desarrollar el SEPN, se utiliza el método
de “desenvolverlo” (Fold back method). Comenzamos al final del árbol, y por cada nodo de
decisión (representado por los cuadrados), encontramos la decisión óptima para la firma en
cada nodo. En el ejemplo, debemos encontrar la decisión óptima de Beta para cada una de las
tres decisiones que Alfa podría tomar: no expandir, pequeña o grande:
• Si Alfa elige NO EXPANDIR, la decisión óptima de Beta es PEQUEÑA

• Si Alfa elige PEQUEÑA, la decisión óptima de Beta es PEQUEÑA
• Si Alfa elige GRANDE, la decisión óptima de Beta es NO EXPANDIR
Las decisiones óptimas de Beta están subrayadas en el árbol. Desarrollando el árbol de esta
manera, asumimos que Alfa anticipa que Beta elegirá una respuesta de maximización de
beneficios para cualquier movimiento estratégico que Alfa podría tomar. Dadas estas
expectativas, podemos determinar la estrategia óptima de Alfa. Lo hacemos localizando la
ganancia que Alfa obtiene como resultado de cada opción que podría tomar, dado que Beta
responde óptimamente. El análisis del Fold Back nos dice que:
Si Alfa elige NO EXPANDIR, entonces dada la reacción óptima de Beta, la ganancia de Alfa será
$15 millones.
Si Alfa elige PEQUEÑA, entonces dada la reacción óptima de Beta, la ganancia de Alfa será $16
millones.
Si Alfa elige GRANDE, entonces dada la reacción óptima de Beta, la ganancia de Alfa será $18
millones.
El SEPN resulta que a Alfa le conviene elegir GRANDE. Beta responde eligiendo NO
EXPANDIR.
Nótese que el resultado del juego de movimiento secuencial difiere significativamente del
resultado de un juego de movimiento simultáneo. En realidad, el resultado incluye una
estrategia para Alfa (GRANDE) que estaría dominada si Alfa y Beta tomaran sus decisiones de
capacidad simultáneamente. ¿Por qué el comportamiento de Alfa es tan diferente cuando
puede mover primero? Porque en el juego secuencial, los problemas de decisión de la firma
están unidos por el tiempo: Beta puede ver lo que Alfa ha hecho, y Alfa puede así contar con
una respuesta racional de Beta a cualquiera de las acciones que esta tome. En un juego
secuencial, la decisión de capacidad de Alfa tiene un valor de compromiso; obliga a Beta
arrinconándolo. Comprometiéndose a una expansión de capacidad grande, Alfa fuerza a Beta a
una posición donde la mejor respuesta de Beta rinde el resultado que es más favorable a Alfa.
Por el contrario, en un juego simultáneo. Beta no puede observar la decisión de Alfa, por lo
tanto la decisión de capacidad no tiene valor de compromiso para Alfa. Debido a ello, la
decisión de GRANDE por parte de Alfa no es ni cercanamente tan poderosa como lo es en el
juego secuencial.
ALGUNAS REFERENCIAS BIBLIOGRÁFICAS
Bagur, B. J., & Calvo, M. B. (1975). Introducción al estudio de la teoría de los juegos y la
teoría de la negociación. Buenos Aires Universidad de Buenos Aires. Facultad de Ciencias
Económicas.
Davis, Morton D. (1998) Introducción a la teoría de juegos. Madrid, Editorial ALIANZA
Cerdá Tenaq, E.; Pérez Navarro, J.; Jimeno Pastor, J. L. (2004). Teoría de juegos. Madrid,
PEARSON EDUCACIÓN, S.A.
Shubik, Martin (1996).Teoría de juegos en las ciencias sociales: conceptos y soluciones. Fondo
de Cultura Económica, 1996
17

P2 18. Resumen de Teoría de Los Juegos PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

P2 18. Resumen de Teoría de Los Juegos PDF

Cargado por

Copyright:

Formatos disponibles

Teoría de los Juegos Alberto Souto

El equilibrio de Nash es sin duda el concepto de una solución de la TJ más frecuentemente

los modelos de negociación de Zeuthen y Nash y estableció el criterio algebraico para

¿Cómo analizar un juego?

Dos preguntas básicas deberán ser contestadas acerca de cualquier juego:

1) ¿Cómo deberían comportarse los jugadores?

a) Según la cantidad de jugadores, juegos unipersonales, bipersonales o de n personas.

Conflicto 0 (Pura cooperación) 1 (Puro conflicto)

Negociaciones integrativas Negociaciones distributivas

enterado de antemano de las probabilidades pertinentes. En la tercera categoría el jugador

Los juegos finitos, bipersonales, de suma cero de información perfecta.

Los elementos que definen a un juego de información perfecta son:

Una característica general de este tipo de juegos es que están estrictamente

El Juego general, finito, bipersonal de suma cero, con información imperfecta.

Comenzaremos con los elementos del juego y analizaremos un ejemplo:

A\B Jugador minimizante B

Ri = mín(j) aij de todos los pagos posibles (ai1, ai2, …ain)

Va a tratar que su mínimo sea el máximo es decir sea V1

V1 = max(i) Ri = max(i) min(j) aij

V2 = min(j) Sj = min(j) max(i) aij

3) Supongamos que cada uno eligió según los puntos 1 y 2 entonces:

A elige la estrategia Xk, en tal forma que:

B elige la estrategia Yl, de modo que:

4) De acuerdo a las definiciones Ri y Sj será:

La cantidad V1 se llama valor del juego para A

Veamos con un ejemplo numérico lo expresado anteriormente:

Jugador B, II minimizante Min fila

Si A elige la segunda estrategia está seguro de recibir por lo menos 5

Resumiendo: Ud. ha tomado un juego en el que aparentemente está a merced de su

Veamos una variante para analizar una estrategia mixta:

Jugador II minimizante min fila

Solución para jugador I

Si II elige la primera estrategia E1, la ganancia esperada de I será:

Si II elige la segunda estrategia E2, la ganancia esperada de I será:

El maximizante elige por fila, de los menores el mayor.

Solución para el jugador II

Si I elige la primera estrategia E1, el pago esperado de II será:

Si I elige la segunda estrategia E2, el pago esperado de II será:

Jugador I p 1-p valor

Jugador II q 1-q valor

Jugador II minimizante min fila

Jugador B, II minimizante Min fila

Jugador B, II minimizante Min fila

Eliminamos fila A1 por ser sus valores menores a A2.

Jugador B, II minimizante Min fila

Eliminamos luego columna B2 por ser sus valores mayores a B3.

Jugador B, II minimizante Min fila

Por lo cual llegamos al punto de equilibrio por dominancia.

El Teorema del Minimax de VN:

La virtud de la estrategia del minimax es la seguridad. Empleando la estrategia del minimax,

El juego bipersonal de suma no nula.

Análisis de un juego bipersonal de suma no nula.

Cómo vería el juego el jugador I:

Valor del juego para I sería: VjI = 0p + (1-p) 5 = 10p + 0(1-p)

Ejemplos para que planteen las matrices correspondientes:

Estrategias Mañana Noche

Mañana (25,25) (10,30)

La batalla de los sexos

Box (2,3) (1,1)

Factores a tener en cuenta en los juegos de suma no nula:

1. ¿Pueden los jugadores consultarse de antemano y ponerse de acuerdo

Comparación con el juego de suma nula:

Comunicación: Podría pensarse que la facultad de comunicar nunca podría actuar en