Capítulo 1

CAPÍTULO 1
TEORÍA DE JUEGOS
En las universidades bolivianas, la asignatura de Investigación Operativa en la
década de los ochenta, si bien incorporaba en su contenido el estudio a la Teoría de Juegos,
se hacía referencia de ella como un capítulo introductorio matemático para facilitar el
aprendizaje de la Teoría de Decisiones, mientras que matemáticos prestigiosos en todo el
orbe profundizaban en su aplicación teórica y práctica en las ciencias: económica,
informática, biología, sociología, estrategia militar y otras, de cuyos resultados se otorgaron
varios premios Nobel de Economía. Continúa siendo objeto de estudio del comportamiento
del pensamiento estructurado en la toma de decisiones. Hoy en día, en el ámbito de la
Investigación de Operaciones, merece un tratamiento que permite conocer las fronteras del
desarrollo de esta teoría, mientras que en los ámbitos de la ciencia económica ha sentado las
bases para que se convierta en ciencia exacta, por su profunda formulación matemática y de
amplia aplicación en diferentes especialidades de la Economía.
La Teoría de Juegos, por lo tanto, alejada de ser tratada como una metodología
infalible, debe ser considerada, para el fin de nuestro aprendizaje, como una herramienta que
necesariamente debe tratarse desde una óptica intelectiva muy crítica y consciente de las
limitaciones que aún presenta en su contexto.
Este primer capítulo del libro, no profundiza precisamente en la extensión de las
investigaciones de los laureados Nobel, sobre todo por el sesgo económico que no
corresponde a un curso semestral de la asignatura, pero se cumple con la presentación
ejemplificada de casos que permiten obtener una adecuada destreza en su aplicación.
1.1 Desarrollo y estado del arte

Existen evidencias arqueológicas que demuestran que las sociedades del mundo
antiguo, se divertían aplicando juegos de diversa índole, donde la participación de dos o más
jugadores, bajo ciertas reglas permitían lograr vencer al eventual contrincante. La cultura
romana que es la base de las sociedades modernas, conjuncionadas con la árabe, hindú y
de extremo oriente, también dieron curso a juegos más sofisticados como el ajedrez y otros,
que motivaron a los hombres de ciencia de los siglos XIX a dar una explicación matemática
sobre el comportamiento en la ejecución de las jugadas.
El impulso que se diera al desarrollo del mercantilismo mundial, en los siglos XVII y
XVIII, por la circulación de monedas de plata producidas en la Villa Imperial de Potosí y otros
yacimientos de México, dieron paso en el siglo XIX al capitalismo, y en él, a intrincados
problemas económicos como la caracterización de los oligopolios, que inspiraron a varios
intelectuales matemáticos europeos y de otras partes del orbe a brindar interpretación del
comportamiento de los participantes en este tipo de mercados.
Antoine Augustin Cournot, en 1870 planteó el modelo de competencia en oligopolio,
que describe una estructura de compañías que compiten en las cantidades que se van a
producir, las mismas que deciden independientemente de la otra industria y toman decisión al
mismo tiempo, bajo el supuesto que las empresas son económicamente racionales y actúan
de manera estratégica, buscando maximizar sus beneficios.
Entre los años 1921 a 1927, el matemático francés Emile Borel, en la Escuela Normal
Superior de París, produjo una serie de trabajos primigenios sobre la teoría de juegos, donde
construyó sus ejemplos basándose en el póquer, definiendo los elementos que constituyen
los juegos con información imperfecta. Su esfuerzo teórico estuvo orientado hacia la
búsqueda generalizada y constructiva de una estrategia óptima para un juego determinado.
Anticipó la formalización de la información de un juego mediante una tabla que la denominó
forma normal. Sin embargo, no resolvió el problema de saber si se puede identificar
matemáticamente, lógica y racionalmente una estrategia ganadora, debido a la complejidad
que presentaba el análisis de las estrategias, siendo éstas, al fin y al cabo, producto de algo
tan imprevisible como la decisión de la mente humana. Se mostró pesimista en sus
investigaciones respecto a la existencia de una solución óptima general del problema, y por
tanto sobre la validez del teorema del minimax en un caso general.
Contemporáneamente, John von Neumann en 1928, en la Universidad de Gotinga en
Alemania, donde era profesor, publicó su investigación ¨Zur Theorie der Gesellschaftspiele¨
(Hacia una teoría de juegos en la sociedad), teoría matemática de los juegos de estrategia en
la revista ¨Mathematische Annalen¨, de cuyo análisis motivó, años más tarde en Estados
Unidos de América, a Morgenstern trabajar conjuntamente para aplicar el comportamiento
humano en el ámbito de la economía.
El punto de inflexión para la creación de la Teoría de Juegos como parte de las
matemáticas con aplicación a la Economía, es la publicación conjunta en 1944 de los
profesores de la Universidad de Princeton, en los Estados Unidos de América: el más grande
matemático del siglo XX, John von Neumann y el politólogo economista Oskar Morgenstern,
el primero de ellos, de nacionalidad húngara y el segundo de origen austriaco, nieto del
Kaiser Guillermo II, ambos refugiados por la hostilidad del nacionalsocialismo alemán en
Europa de la década de los 30. El libro publicado se denomina ¨Theory of games and
Economic Behavior¨, cuyo objetivo fue bastante ambicioso, dotar a la ciencia económica de
un instrumento para convertirla en ciencia exacta, y que al cabo de varias décadas, se
consolida en su beneficio. Este capítulo plantea los juegos desde dos ópticas, la primera es el
tratamiento estratégico no cooperativo, que especifica detalladamente lo que los jugadores
pueden o no hacer durante el juego y después buscar para cada jugador una estrategia
óptima, principalmente para juegos dos por dos y de suma cero, con la aplicación del
concepto minimax. La segunda, aunque con resultados menos precisos, plantearon los
juegos cooperativos, que al cabo de varias décadas posteriores fueron objeto de estudio por
otros investigadores con resultados ya comentados.
Como juego de estrategia militar, de manera totalmente empírica, fue aplicada por el
General estadounidense George Kenney, comandante de las fuerzas aliadas en el sud oeste
del Pacífico, durante la Segunda Guerra Mundial, en la batalla aeronaval del Mar de Bismarck
en febrero de 1943.
En 1949, John Forbes Nash, becario de la Universidad de Princeton publicó el artículo
¨Puntos de equilibrio en juegos de n-personas¨, en el que se definió el equilibrio de Nash y
que fue la base para la otorgación del premio Nobel cuatro décadas después. En 1950, se
doctoró con una tesis de menos de 30 hojas sobre los juegos no cooperativos, bajo la
dirección de Albert Tucker. El punto de equilibrio de Nash es una situación en la que ninguno
de los jugadores siente la tentación de cambiar de estrategia ya que cualquier cambio
implicaría una disminución en sus pagos.
Durante toda la década de los años cincuenta, hubo una inusitada actividad intelectual
en la Teoría de los Juegos, es así que en 1950, los investigadores de la RAND Corporation,
en Santa Mónica, California, Merril Flood y Melvin Dresher, publicaron por primera vez el
modelo de juegos cooperativos de suma no cero, el mismo que fue matemáticamente
formalizado por Albert Tucker, de la Universidad de Princeton como el ¨Dilema del prisionero¨,
la más conocida paradoja de esta teoría.
En 1953, Lloyd Stowell Shapley, futuro premio Nobel, publicó en la Universidad de
California, en Los Ángeles, dos artículos científicos sobre juegos: Ä value for n-person
Games¨ en la revista Contributions to the Theory of Games, Vol II, editada por los
matemáticos Kuhn y Tucker, y ¨Stochastic Games¨, en la revista Proceeding of National
Academy of Science, Vol 39. En esta misma época aparecieron las primeras aplicaciones de
la Teoría de Juegos en la filosofía y ciencias políticas.
Harold Kuhn presentó una forma matemática para resolver juegos cooperativos, en
1953, en su artículo Ä simplified two persons poker. Contributions to the Theory of Games¨.
Los investigadores de la Universidad de Princeton, R.D. Luce y Howard Raiffa
publicaron Ïntroduction and Critical Suvey¨ en 1957, afinando las ideas publicadas por Kuhn
y John Forbes Nash, permitiendo establecer una forma de plantear los juegos cooperativos.
John Nash durante la década de los años 50 continuó publicando soluciones
originales para problemas de la Teoría de Juegos, donde se destaca la ¨Solución de regateo
de Nash¨ para juegos bipersonales cooperativos. En 1959 por enfermedad mental de
esquizofrenia paranoica, le dejó marginado de la actividad intelectual por dos décadas. Ya en
los años 70, recuperada su salud, realizó nuevas aportaciones hasta la otorgación del
compartido premio Nobel con John Harsanyi y Reinhart Selten por su investigaciones en el
equilibrio en juegos no cooperativos en 1994.
Leonard Savage en 1954 publicó su investigación ¨Fundations of Statistics¨, donde
introduce varios elementos sobre la Teoría de Juegos y elabora la teoría de la utilidad
esperada subjetiva, que compara la relación entre la probabilidad de un evento y la utilidad
del evento para un jugador. Estableció las bases para la estadística bayesiana racional y su
aplicación a la Teoría de Juegos, así como un criterio usado en la teoría de decisiones
conocido como minimax regret o del arrepentimiento. Las probabilidades subjetivas se
distinguen de la objetivas, porque estas últimas se encargan de hacer inferencias basadas en
sucesos empíricos a partir de muestras que se suponen representativas de la realidad,
mientas que las primeras son calculadas por los individuos de acuerdo a sus estimaciones de
certidumbre con respecto a un hecho o grados de creencias. Estas son la bayesianas
porque, a través de probabilidades a priori, se consiguen las probabilidades a posteriori. El
ser racional implica que los individuos son consistentes, en el sentido de que sólo se toman
decisiones cuando éstas no reflejen pérdidas, es decir, se maximiza la ganancia esperada.
Con este enfoque de Savage, las investigaciones que le suceden en el campo de la Teoría
de Juegos, seguirán este concepto para dar forma a las estrategias hechas por los
jugadores.
En la década de 1970 la Teoría de Juegos se aplicó extensamente a la biología, en

gran parte como resultado del trabajo de John Maynard Smith y su concepto estrategia
estable evolutiva. Además, los conceptos del equilibrio correlacionado, equilibrio perfecto de
mano temblorosa, y del conocimiento común fueron introducidos y analizados.
En 1965, Reinhard Selten investigó el equilibrio de juegos no cooperativos y replanteó

la Teoría de Juegos sobre bases más relevantes, fue el primero que refinó el equilibrio de
Nash para analizar juegos dinámicos. Postuló que la Teoría de Juegos es más bien un
modelo de explicación que una instrucción sobre el modo de proceder de los jugadores; así
mismo, indicó que las estrategias no solamente deben ser las mejores respuestas, dado el
comportamiento esperado de los oponentes, sino frente a todas las contingencias.
El profesor Selten analizó la racionalidad con el comportamiento oligopólico, sobre la

base de los trabajos de Herbert Alexander Simon de la Universidad de Berkeley, cuya teoría
de la racionalidad limitada indica que la cognición humana es limitada e imperfecta, incluso si
lográramos obtener toda la información disponible en torno a un problema que debamos
resolver, nuestros fallos de razonamiento impedirían que tomáramos la decisión óptima. Por
este hecho, afirma que existen dos clases de limitaciones a la racionalidad plena, la que
deriva de la falta de conocimientos y la que surge de cuestiones motivacionales.
En 1975 descubrió que para eliminar todos los equilibrios ¨no racionales¨ había que
introducir un refinamiento que denominó ¨la perfección de la mano temblorosa¨, un concepto
que establece que los equilibrios deben ser robustos con respecto a pequeñas
modificaciones de estrategias. Al intentar calcular el equilibrio de Nash, descubrió que
generalmente existen equilibrios múltiples, algunos de los cuales son incompatibles con la
racionalidad, para eliminarlos propuso el refinamiento de equilibrio perfecto en Subjuegos. La
idea es que una vez que una situación llega a un subjuego, todo lo que está fuera de él es
irrelevante, de manera que la lógica que fundamenta el equilibrio, también puede ser aplicado
en el juego. En acápites posteriores, se podrá observar este elemento que se analiza en este
párrafo.
El Dr. Selten analizó también los modelos multietápicos, dentro de la Teoría de

Juegos, que pueden ser analizados sobre la base del concepto del equilibrio perfecto de los
juegos, que es el refinamiento más simple del equilibrio ordinario. En muchas situaciones, la
diferencia entre la decisión de más largo plazo y otra de más corto plazo, se explica por la
diferencia en el tiempo de la demora. De ahí la creación de los súperjuegos con demora, en
los cuales los participantes tiene información sobre la historia del juego, pero no sobre las
decisiones contemporáneas realizadas por los otros participantes.
John Harsanyi de origen húngaro, pero que trabajó en la Universidad Berkeley,
extendió la teoría de juegos de información incompleta, es decir, aquellos en que los
jugadores no conocen todas las características del juego: por ejemplo, no saben lo que
obtienen los otros jugadores como recompensa. También estableció las bases de la
economía de la información, centrada en situaciones en las que no existe certidumbre y
donde los agentes desconocen los objetivos de sus competidores.
Por los conceptos en Teoría de Juegos desarrollados por Harsanyi, del
estadounidense Nash que presentó las bases teóricas del análisis del equilibrio y del alemán
Selten que desarrolló las bases con respecto a la dinámica, el Banco de Suecia les otorgó el
Premio Nobel de Economía en 1994.
El siguiente premio Nobel de Economía en Teoría de Juegos, fue otorgado el 2005 a

los profesores Thomas Schelling y Robert Aumann, a quienes analizamos en sus
contribuciones a continuación.
Robert Aumann, profesor de la Universidad Hebrea de Jerusalén fue el primero en
realizar un completo y formal análisis de los llamados juegos de repetición infinita. Su
investigación identificó con exactitud los resultados que pueden ser sostenidos en el tiempo
en relaciones a largo plazo. La teoría de los juegos repetidos incrementa el entendimiento
sobre los prerrequisitos para la cooperación, porque es más difícil cuando: hay muchos
actores, cuando interactúan con frecuencia, cuando las posibilidades de la rotura de la
interrelación son elevadas, cuando el horizonte temporal es corto o, cuando las acciones de
otros no pueden ser observadas con claridad. El discernimiento sobre estos temas ayuda a
explicar conflictos económicos como las guerras de precios o comerciales. Asimismo ayudan
a explicar el porqué del éxito de algunas comunidades frente a otras en el uso de recursos
comunes.
Thomas Schelling de la Universidad de Maryland, empieza con una idea altamente
contra intuitiva: la negociación no es un juego de suma cero, ya que a pesar de existir
conflictos de intereses, en ésta, los jugadores parecen preferir el acuerdo al desacuerdo.
Schelling plantea que, un negociador puede asegurar una mejor posición si puede persuadir
de manera creíble a su contraparte de que su única opción es ceder, esto lleva a la segunda
idea contra intuitiva de Schelling: restringir la libertad de acción de que uno dispone, puede
ser conveniente en este tipo de negociación, esta idea del compromiso se ha convertido en
uno de los campos teóricos más fructíferos de la economía.
Los planteamientos de Schelling son inversos respecto a la Teoría de Juegos
tradicional, en tanto esta última plantea todos los elementos de la interacción para después
identificar una respuesta mediante algún concepto de solución, Schelling se plantea la
pregunta inversa: dado el juego ¿qué podría hacer para mejorar mi posición relativa?. Esta
lógica guarda un parecido grande con la teoría de diseño de mecanismos pero con una
mayor cantidad de matices. Schelling expresa su concepto de estrategia como acciones
que pueden de algún modo alterar el juego, inquiriendo en costos, o reduciendo el rango de
elección.
En el 2007, Roger Myerson, junto con Leonid Hurwicz y Eric Maskin, recibieron
el Premio en Ciencias Económicas en memoria de Alfred Nobel por sentar las bases de la
teoría de diseño de mecanismos, a continuación se analizan las contribuciones individuales
de cada científico mencionado en este Nobel.
Roger Myerson, profesor de la Universidad de Chicago se doctoró con su contribución
a la Teoría de Juegos cooperativos y a partir de ella, trabajó afinando la teoría para el diseño
de los mecanismos que desempeña un papel clave en las relaciones políticas y económicas
que fue formulada por Leonid Hurwicz en 1960. Su contribución en el diseño de mecanismos,
ha ampliado el campo del análisis económico añadiendo restricciones relacionadas con los
incentivos a las restricciones relacionadas con los recursos en una definición del problema
económico. Las restricciones relacionadas con los incentivos proporcionan un marco analítico
que sirve para comprender los fallos de la eficiencia asignativa, mostrando cómo tales fallos
pueden depender de la asignación inicial de derechos de propiedad en una sociedad. Los
conceptos de eficiencia respecto a los incentivos se pueden aplicar para identificar buenas
reglas institucionales o mecanismos, en la actualidad el marco teórico es lo suficientemente
amplio como para analizar problemas de incentivos competitivos tanto en los mercados como
en la política.
Erick Maskin, profesor de matemáticas en Princeton desde el 2001, aportó a la base
teórica elaborada por Hurwicz con la Teoría de la implementación, que permite diseñar un
mecanismo, de modo que todos los resultados posibles sean óptimos, pero sin perder la
noción del principio de la actividad proporcional del asunto inverso de lo opuesto. Adam
Smith parte del principio que el funcionamiento eficiente del mercado es una consecuencia de
la mano invisible, sin embargo, en la práctica, las condiciones no son por regla general
óptimas, la competencia no es completamente libre y los consumidores no están
perfectamente informados, elementos que tuvieron en cuenta a la hora desarrollar su teoría.
En 1959, Leonid Hurwicz como profesor invitado de la Universidad de Stanford,
publicó su influyente artículo sobre diseño de mecanismos titulado Öptimality and
Informational Efficiency in Resource Allocation Processes¨. Posteriormente centró sus
investigaciones sobre el diseño de mecanismos y en teoría de la compatibilidad de
incentivos, muy relacionados con los autores anteriormente señalados, ampliamente
utilizados en economía, sociología y ciencias políticas como instrumento para conseguir el
diseño de instituciones que optimicen ciertos resultados dados. Hoy se utilizan para analizar y
comprender las iteraciones entre instituciones e individuos, así como en el funcionamiento de
los mercados.
Por sus estudios sobre el mecanismo óptimo para alcanzar al mismo tiempo objetivos
diferentes como en el bienestar social y ganancias privadas que relaciona a los aportes de
Erick Maskin y Roger Myerson, recibieron el Nobel de Economía.
En el 2012, Lloyd Stowell Shapley y Alvin E. Roth ganan el Premio en Ciencias

Económicas en memoria de Alfred Nobel por dar nombre dentro de este campo a media
docena de teoremas, algoritmos, principios, soluciones e índices que cimientan la Teoría de
Juegos.
Llody Shapley Stowell es Profesor emérito de la Universidad de California, que junto a

Alvin Roth recibieron el Premio Nobel en reconocimiento a su trabajo de diseño de mercado y
la Teoría de Juegos. Su teoría trata de explicar que las alternativas que disponen los
competidores, en ciertas situaciones, requiere del pensamiento estratégico.
En 1962, explicó cómo los individuos buscan un asociado para establecer una
amistad, si los jugadores no discrepan de las ventajas que hacen a un juego perfecto. El
¨Valor de Shapley¨ nombrado por él, es un concepto a través del cual los beneficios de la
cooperación pueden ser proporcionalmente divididas entre los participantes basados en su
contribución relativa.
Alvin Roth, Profesor de la Universidad de Standford premiado junto a Shapley por la

teoría sobre la asignación estable y la práctica del diseño de mercados, ayudó a rediseñar los
mecanismos para seleccionar a los residentes médicos a las escuelas secundarias de la
ciudad de Nueva York y de las escuelas públicas primarias de Boston, con sus amplios
conocimientos en la Investigación Operativa.
Al describir el funcionamiento de un mercado, postula que a medida que cambian las

condiciones de mercado, el comportamiento de las personas cambia de reglas, se
descartarán las no operativas y crearán nuevas reglas. El Profesor Roth aplicó las ideas de
Shapley a problemas prácticos.
Por su trascendencia en la forma de razonar humano en diversos campos de la

ciencia, existen varias líneas de investigación en Universidades de los Estados Unidos,
Europa y Asia. Con seguridad que en los próximos años se conocerán los avances en la
Teoría de Juegos y los nombres de brillantes científicos que llevan esta teoría a nuevas
fronteras para comprender el comportamiento de las personas, organizaciones y sociedad
frente a la estructura que se conforma en un ámbito y en un determinado tiempo, con
múltiples variables que cambian.
1.2 Estructura formal de situaciones no competitivas
Si se abstrae la idea que una situación se presenta con dos competidores en una
matriz m x n, para uno de los jugadores, J1 en la competencia, se presentan variables
controlables y no controlables, entonces:
Sea x una variable controlable.

Sea y una variable no controlable.
J2
y1 y2
x1 U(X,Y)
J1
x2
De manera que un pago se expresa como U (x,y), es decir que ambas variables
influirán sobre un beneficio que recibiría, por decidir por una alternativa.
Sí además existe  (x), que es una función de distribución cualquiera de
probabilidades de U, que está relacionada con la probabilidad de la alternativa a decidirse,
entonces el pago esperado, se expresa, en términos continuos como:
E(U) =  U(x,y) (x) dx
Ahora en términos discretos:

Sí existe un jugador J1 que escoge la alternativa x, tendrá una PX (Probabilidad de x)
adjunta, la probabilidad de que J2 (el otro jugador) escoja la alternativa y, será Q Y
(probabilidad de y).
Sí la función del pago se denomina  (x,y), entonces, el pago esperado se
representa como:
V =    (x,y) Px Qy
Si se denomina V1 el pago esperado para el jugador J 1 y V2 para jugador J2,

entonces surge la situación de conflicto o de competencia cuando:
D12 > 0 significa que V1 > V2  existe ganancia por parte de J1.
D12 < 0 significa que V1 < V2  existe ganancia por parte de J2.
D12 = 0 significa que V1 = V2  existe un empate ente J1 y J2.
1.3 Juegos bipersonales de suma cero
Un juego es una situación de conflicto o de competencia regulada, en este acápite se

estudiarán los modelos de juegos bipersonales de suma cero. Se denominan bipersonales
porque son dos personas las que compiten y de suma cero porque lo que gana un jugador
pierde el otro. Sin embargo es necesario indicar que los resultados del juego siempre estarán
referidos al primer jugador (J1).
Esta es la representación más simple de una situación de conflicto que fue analizada
por John von Neumann y Oskar Morgenstern, se analiza con la finalidad de comprender
didácticamente en este modelo, los elementos de la estructura del problema y una posible
aplicación práctica.
Imagínese el mercado de productos lácteos de la ciudad constituido por dos
empresas distribuidoras. La primera empresa que se constituye en el jugador 1, puede
asumir dos estrategias para captar mayor número de clientes y mejorar las utilidades. La
estrategia 1 (x1) es aumentar la publicidad en medio televisivos y radiales y la segunda
estrategia ( x2 ), implementar la venta personal en toda la ciudad.
La empresa de la competencia puede asumir dos estrategias, la primera ( y1 ) es
mejorar los canales de distribución, aumentando casetas de distribución. La segunda
estrategia ( y2 ) es implementar un programa de publicidad sólo en radiodifusoras.
Este problema de juego de estrategia de mercado puede ser expresado a través de la
siguiente matriz de pagos.
ESTRATEGIAS DEL JUGADOR 2
ESTRATEGIAS DEL MEJORAR CANALES DE DIS- INCREMENTAR PUBLICIDAD

JUGADOR 1 TRIBUCIÓN. AUMENTO DE POR RADIO.
CASETAS DE DISTRIBUCIÓN.
INCREMENTAR PUBLICIDAD
POR RADIO Y TELEVISIÓN 2 6
REALIZAR VENTA PERSONAL
3 1
Los valores en la matriz de pagos son las ganancias en función del jugador 1 y se
expresan en [Bs] x 105. Estos pagos deben ser resultado de un análisis de tipo económico
financiero para establecerlos, no es indispensable para propósitos del libro plantear rutinas de
cálculo particulares, puesto que pueden ser múltiples.
Una vez que se planteó esta teoría, fueron múltiples los matemáticos de diversas
universidades del planeta que propusieron métodos de cálculo para los juegos bipersonales
de suma cero, que se plantean a continuación.
Punto de silla o de ensilladura.

Juegos 2 * 2.
Juegos 2 * n.
Aplicación de la programación lineal
Método iterativo.
1.4 Métodos de cálculo de juegos bipersonales de suma cero
1.4.1 Punto de ensilladura
El primer método que se presenta para determinar el valor del juego de una matriz de
pagos es el punto de ensilladura que se establece mediante la aplicación del concepto
maximin para el jugador 1 y minimax para el jugador 2, concepto básico utilizado por los
creadores de la teoría.
La determinación de la estrategia para el jugador 1, inicialmente considera los peores
resultados posibles por fila y de ellos el mejor de los peores. El jugador 2, establece una
lógica de operación contraria, es decir minimax. Considera los mejores resultados en la
aplicación de sus estrategias por columna y de ellos el peor de los mejores.
En caso de encontrar correspondencia entre las estrategias asumidas por los
jugadores 1 y 2, entonces se dice que existe punto de silla y el juego es estable. Analícese
el siguiente ejemplo.
Ejemplo 1. Punto de ensilladura
J2
y1 y2 y3 y4 y5
x1 9 3 1 8 0 0
J1 x2 6 5 4 6 7 4 maximin
x3 2 4 3 3 8 2
x4 5 6 2 2 1 1
9 6 4 8 8
minimax
En la intersección de la segunda fila y la tercera columna, el valor del juego es 4 en

aplicación de los conceptos indicados.
1.4.2 Juegos 2 x 2.-
Existen situaciones en la que no es posible encontrar punto ensilladura, entonces se

establece que el juego no es estable, uno de estos casos se presenta en las matrices 2 x 2,
cuya relación matemática para determinar el valor del juego se deduce a partir de la siguiente
matriz:
y1 y2
x1 a11 a12
x2 a21 a22
xi es la probabilidad de que el jugador J1 asuma la estrategia i.
yj es la probabilidad de que el jugador J2 asuma la estrategia j.
x1 + x2 = 1 (1)
y1 + y2 = 1 (2)
Aplicando el concepto de valor esperado en el juego
a11 x1 + a21 x2  V (3)

a12 x1 + a22 x2  V (4)
a11 y1 + a12 y2  V (5)
a21 y1 + a22 y2  V (6)
Restando miembro a miembro las ecuaciones (3) de (4) y (5) de (6), se obtienen:
x1 (a11 - a12 ) + x2 (a21 - a22) = 0 x1 (a11 - a12) - x2 (a22 - a21) = 0 (7)

y1 (a11 - a21 ) + y2 (a12 - a22) = 0 y1 (a11 - a21) - y2 (a22 - a12) = 0 (8)
Despejando las variables x1 y x2 de las ecuaciones (7) y (8).
x1 a22 - a21 y1 a22 - a12

 =  (9)  =  (10)
x2 a11 - a12 y2 a11 - a21
Remplazando la ecuación (1): x1 = 1 – x2 en ecuación (9)
1 - x2 a22 - a21
 = 
x2 a11 - a12
Operando algebraicamente:
(1 - x2) (a11 - a12) = x2 (a22 - a21)
a11 - a12 - x2 a11 + x2 a12 = x2 a22 - x2 a21
a11 - a12 - x2 a11 + x2 a12 - x2 a22 + x2 a21 = 0
a11 - a12 - x2 (a11 - a12 + a22 - a21) = 0
a11 - a12
x2 = 
a11 - a12 + a22 - a21
a11 - a12
x2 =  (11)
a11 + a22 - (a12 + a21)
Remplazando la ecuación (1): x2 = 1 – x1 en ecuación 9
x1 a22 - a21
 = 
1 - x1 a11 - a12
Operando algebraicamente:
x1 (a11 - a12) = (1 - x1) (a22 - a21)
x1 a11 - x1 a12 = a22 - a21 - x1 a22 + x1 a21
x1 a11 - x1 a12 + x1 a22 - x1 a21 = a22 - a21
x1 (a11 - a12 + a22 - a21) = a22 - a21
a22 - a21
x1 = 
a11 - a12 + a22 - a21
a22 - a21
x1 =  (12)
(a11 + a22) - (a12 + a21)
Remplazando las ecuaciones (11) y (12) en el valor esperado del juego, ecuación (3)
a11 x1 + a21 x2  V
Se obtiene la siguiente relación:
a22 - a21 a11 - a12

a11 [  ] + a21 [  ]  V
(a11 + a22) - (a12 + a21) a11 + a22 - (a12 + a21)
a11 a22 - a11 a21 a21 a11 - a21 a12

 +   V
(a11 - a22) + (a12 + a21) a11 + a22 - (a12 + a21)
a11 a22 - a11 a21 + a21 a11 - a21 a12
  V
a11 + a22 - (a12 + a21)
Entonces el valor esperado del juego es:
a11 a22 - a21 a12

V = 
a11 + a22 - (a12 + a21)
Ejemplo 2.- Sea la siguiente matriz de pagos 2 x 2.
J2
y1 y2
x1 - 5 6
J1
x2 4 - 3
Reemplazando los valores de la matriz en la ecuación del valor esperado del juego:
(-5)(-3) - (4) (6) 15 - 24 -9 1

V =  =  =  = 
-5 -3 - (4 + 6) -8 - 10 -18 2
1.4.3 Juegos 2 x n
La resolución de este tipo de juegos es gráfica y considera la probabilidad que el

jugador 1 asuma las estrategias 1 ó 2.
Ejemplo 3. Mediante el siguiente ejemplo se emplea la metodología de cálculo.
J2
Y1 Y2 Y3 Y4 Y5
X1 1 4 -1 -5 6
J1
X2 3 2 6 4 -3
Denomínense las variables en función del parámetro p:

x1 = p y x2 = ( 1 – x1 ) = ( 1 – p )
Consiguientemente, el valor esperado del juego se construye con la siguiente

relación:
a i j p + a i j (1-p)  Vj
De manera que podrán construirse tantas inecuaciones como columnas existan en la

matriz de pagos.
1P + 3(1-P)  V (1) P + 3 – 3P  V -2P + 3  V (1)

4P + 2(1-P)  V (2) 4P + 2 – 2P  V 2P + 2  V (2)
-P + 6(1-P)  V (3) -P + 6 – 6P  V -7P + 6  V (3)
-5P + 4(1-P)  V (4) -5P + 4 – 4P  V -9P + 4  V (4)
6P + (-3)(1-P)  V (5) 6P – 3 + 3P  V 9P – 3  V (5)
GRÁFICO 1.1
GRAFICACIÓN PARA EL MÉTODO 2 X N DE JUEGOS DE ESTRATEGIA
7 - Ec. (5)
-
-
4 - Ec. (2)
-
-
- Ec. (1)
0 1 P
- Ec. (3)
-2 -
-
- DOMINIO
-5 - Ec. (4)
El dominio del juego se encuentra limitado por las inecuaciones 4 y 5, de manera que
del resultado, se obtiene una submatriz conformada por las columnas 4 y 5, siendo igual a:
J2
Y1 Y2
X1 -5 6
J1 X2 4 -3
Esta matriz de pagos no tiene punto de ensilladura, por tanto aplicando la relación del
sub epígrafe anterior, se obtiene el valor esperado del juego
V=½
1.4.4 Resolución de juegos aplicando programación lineal
No debe olvidarse la contemporaneidad entre los dos más destacados científicos del
siglo XX en esta disciplina, G. Dantzig y John Von Neumann, creadores del Simplex y la
Teoría de Juegos respectivamente. Ambos se dieron cuenta de la correspondencia entre
ambos modelos, es decir, la programación lineal puede ser expresada como juego y
recíprocamente, el juego se expresa en términos de programación lineal.
En este epígrafe se presenta la última interpretación que permite resolver problemas

de juegos cuando el número de filas y columnas es grande y existe dificultad en la aplicación
de otros métodos.
La abstracción realizada en juegos con punto de ensilladura y los juegos 2 x 2,

permite generalizar el planteamiento de un juego de estrategia en términos de:
m m m
máx  min   a i1 x i ,  a i2 x i, .......,  a in xi ) 
i=1 i=1 i=1
Es decir, determinar por fila los menores valores y de éstos, el mayor valor, dando
cumplimiento al concepto de maximin para el jugador 1 y recíprocamente para el segundo
jugador el minimax como:
n n n
min  max   a 1j y i ,  a 2j y i, .......,  a nj yj ) 
j=1 j=1 j=1
Donde xi e yj corresponden a las probabilidades de las estrategias i y j ,

consecuentemente, las anteriores relaciones se encuentran sujetas a:
x1 + x2 + ........ + x m = 1
y1 + y2 + ........ + y m = 1
x i, y j  0
Si se revisa el planteamiento de un programa lineal, podrá inferir que el modelo de

juegos de estrategia es asimilable a él. Por ello, a continuación se expresa la primera relación
como el mínimo valor esperado del juego en los siguientes términos:
m m m
V = min ( a i1 x i ,  a i2 x i, .......,  a in xi )
i=1 i=1 i=1
En términos de programa lineal, se expresa como:
1
máx   min V
V
m
Sujeto a:  a in xi  V
i=1
m
 xi =1
i=1
xi0
Para que el juego tenga solución, todos los elementos de la matriz de coeficientes
tecnológicos A, deben ser mayores a cero; por ello, si existieran aij  0, debe considerarse un
elemento K, tal que sumados a todos los elementos de la matriz los convierta en mayores a
cero.
Las restricciones  a in xi  V, recién ahora son divisibles por V de la forma:
xi
Xi = 
V
De forma que el programa lineal expresado para el jugador J 1 , se expresa como:
min V = X1 + X2 + Xn
s.a:
a11 X1 + a21 X2 + ....... + am1 Xm  V

a12 X1 + a22 X2 + ....... + am2 Xm  V
..............................................................
a1n X1 + a2n X2 + ....... + amn Xm  V
XI  0
Para el jugador J2, el problema se expresa exactamente como el DUAL del programa
lineal planteado, de la manera siguiente:
1
max Y =  = Y1 + Y2 + Yn
V
s.a:
a11 Y1 + a12 Y2 + ....... + a1n Yn ≤ V

a21 Y1 + a22 Y2 + ....... + a2N Yn ≤ V
..............................................................
am1 Y1 + am2 Y2 + ....... + amn Yn ≤ V
YJ  0
Ejemplo 4. Dada la siguiente matriz de pagos, determine el valor del juego de

estrategia:
J2
Y1 Y2 Y3
X1 3 -1 0
J1
X2 -2 1 -1
Como existen valores negativos, entonces debe sumarse una constante K = 3, que es
lo suficientemente mayor para convertir los elementos de la matriz en mayores a cero. La
nueva matriz es:
J2
Y1 Y2 Y3
X1 6 2 3
J1
X2 1 4 2
El planteamiento en términos de programa lineal es
max Y = Y1 + Y2 + Y3
s.a.
6 Y1 + 2 Y2 + 3 Y3  V
Y1 + 4 Y2 + 2 Y3  V
Y1, Y2, Y3 >= 0
Aplicando el simplex, se obtiene:

V.B. Y1 Y2 Y3 Y4 Y5 B
Y4 6 2 3 1 0 1
Y5 1 4 2 0 1 1
-z -1 -1 -1 0 0 X
Y3 2 2/3 1 1/3 0 1/3
5 -3 8/3 0 2/3 1 1/3
-z 1 -1/3 0 1/3 0 1/3
Y3 11/4 0 1 ½ -1/4 ¼
Y1 -9/8 1 0 -1/4 3/8 1/8
-z 5/8 0 0 ¼ 1/8 3/8
El valor del juego se determina como:
V = (1 / max Y) - K
V = 8/3 – 3 = -1/3
Calculándose las probabilidades de las estrategias para el jugador J 2 con la relación:
yi = Yi / V
Entonces: y2 = Y1 / V = 0 / -1/3 = 0
y1 = Y2 / V = 1/8 / -1/3 = -3/8
y3 = Y3 / V = ¼ / -1/3 = -3/4
Aplicando el dual se obtienen los valores siguientes para las estrategias del jugador J 1
x1 = 2/3 x2 = 1/3 Z = 3/8
1.4.5 Método de las submatrices
Este método se aplica en algunas matrices 3 x 3. La primera submatriz se obtiene de

la diferencia de la primera columna con la segunda y de la segunda con la tercera. La
segunda submatriz se construye con la diferencia de la primera fila con la segunda y de la
segunda con la tercera.
De estas submatrices calculadas, se obtienen los valores absolutos de las

determinantes complementarias para cada fila y columna respectivamente. La probabilidad
para cada estrategia se calcula dividiendo el valor absoluto de la determinante con la suma
por fila o columna de los anteriores valores.
El valor del juego se obtiene aplicando el concepto de valor esperado, es decir, la

sumatoria de los coeficientes sea por fila o columna multiplicados por su probabilidad.
Ejemplo 5. Método de las submatrices.
J2
-1 2 1 -3 1 17 17/46
J1 1 -2 2 3 -4 20 20/46
3 4 -3 -1 7 9 9/46
-2 4 -1
-2 -6 5
14 12 20 46/46
14/46 12/46 20/46
Para calcular el valor esperado del juego, se toma aleatoriamente la segunda

estrategia de J2
E(V) =  Pj aij
E(V) = 2(17/46) + (-2)(20/46) + 4(9/46) = 34/46 - 40/46 + 36/46 = 30/46
Para calcular el valor esperado del juego por fila, se toma la segunda estrategia de J1.
E(V) = 1(14/46) + (-2)(12/46) + 2(20/46) = 14/46 - 24/46 + 40/46 = 30/46
En ambos cálculos se ha obtenido el mismo valor del juego.
1.4.6 Método de las iteraciones
Este método es el más aplicado debido a la sencillez del cálculo y su versatilidad para
ser programado en algún lenguaje de computador.
El algoritmo consiste en tomar arbitrariamente una fila de la matriz del juego y

colocarla en la parte inferior, se marca el menor valor de los componentes del vector fila y se
copia la columna correspondiente de la matriz de pagos, al lado derecho de la matriz. De esta
columna, se toma el mayor valor y la fila correspondiente de la matriz, se suma a la fila
anotada anteriormente. De esta nueva fila en la base de la matriz, se marca el menor valor.
Las operaciones se realizan sucesivamente en función del grado de exactitud que se quiera
obtener.
Ejemplo 6. Método de las iteraciones.
┌──────┬─────┬───────┐
│ 1 │ 0 │ 2 │ 0 1 1 2 2 4 6 7 9 11
├──────┼─────┼───────┤
│ 3 │ 0 │ 0 │ 0 3 3 6 6 6 6 9 9 9
├──────┼─────┼───────┤
│ 0 │ 2 │ 1 │ 2 2 4 4 6 7 8 8 9 10
└──────┴─────┴───────┘
1 0 2
1 2 3
4 2 3
4 4 4
7 4 4
7 6 5
7 8 6
7 10 7
10 10 7
10 12 8
El número de iteraciones es igual a N = 10. Consecuentemente el valor del juego se

encuentra entre los siguientes rangos.
8 11 En términos ai min aj max

  V   generales :   V  
10 10 N N
0,8  V  1,1
Apenas publicadas las investigaciones de John von Neumann y Oskar Morgenstern,

otros científicos desarrollaron nuevos conceptos en el campo que denominaron metajuegos
sus creadores, es decir, los resultados que se expresan en la matriz de pagos, son
resultados diferentes para ambos jugadores.
Es importante indicar que existen dos formas para describir un juego la forma normal
y la forma extensiva.
En la forma normal o estratégica, la descripción del juego se realiza de forma
matricial, para el caso de dos jugadores, y se centra principalmente en las estrategias de los
jugadores, interpretando que estos son capaces de tomar sus decisiones a la vez.
En la forma extensiva la descripción del juego se realiza en forma de árbol, dando
más importancia a la secuencia del juego, esto es, a la forma en la que pueden desarrollarse
las acciones de cada jugador para llegar a los resultados.
Bajo esta nueva concepción se desarrolla la clasificación que a continuación se estudia.
1.5 Juegos cooperativos y juegos no cooperativos
Bajo esta nueva concepción, la Teoría de Juegos distingue dos modelos distintos en su
planteamiento: Juegos Cooperativos y Juegos No Cooperativos.
En un Juego Cooperativo, los jugadores disponen de mecanismos que permiten tomar
acuerdos vinculantes antes del juego, es decir, los jugadores pueden cooperar formando
coaliciones de jugadores con el fin de obtener mayores beneficios. La idea central es el
reparto de beneficios de los jugadores que forman la coalición. La Teoría de Juegos
Cooperativos analiza la importancia o influencia que ha tenido cada jugador en la obtención
del beneficio, para proponer un reparto de beneficios adecuado.
Un Juego No Cooperativo o Competitivo, no permite negociar e imponer un contrato
vinculante. Cada jugador busca su máximo beneficio, no se permite ningún tipo de acuerdo
previo entre jugadores. La Teoría de Juegos No Cooperativos estudia las múltiples
estrategias que pueden emplear cada uno de los jugadores. Dependiendo de las diferentes
estrategias que se asuman, existe una función de pagos asociada a cada jugador.
Los Juegos No Cooperativos, se clasifican en:
 Juegos estáticos y dinámicos.
 Juegos sin información completa y con información completa.
Los juegos estáticos son aquellos en los que las decisiones de los jugadores no saben lo
que han decidido los otros.
En los juegos dinámicos, al menos uno de los jugadores debe saber qué decisión han
tomado los otros jugadores antes de tomar la suya.
En los juegos con información completa no son el tipo de juego más habitual, pero son
muy útiles como ejemplos didácticos (dilema del prisionero).
En los juegos sin información completa, que son los más comunes, todos o alguno de los
jugadores desconocen alguna de las consecuencias, describen situaciones en las que
algunos jugadores desconocen información acerca de los otros jugadores, como pueden ser
sus pagos o preferencias.
A continuación se mencionan algunos ejemplos de juegos sin información completa:
 Competencias entre empresas que desconocen los costes de sus rivales.
 Un vendedor conoce la verdadera calidad del producto, pero el comprador no.
 Un trabajador nuevo en la empresa conoce su verdadera productividad y el
empresario no.
 Una negociación entre un vendedor y un comprador en la que el primero no conoce la
valoración del segundo.
 Una subasta en la que cada participante conoce su propia valoración del objeto, pero
no la valoración de los demás.
1.6 Estrategias dominantes
Una vez que se tiene conformada la matriz de pago, entonces es necesario verificar las
estrategias dominantes, si el caso es de beneficio, entonces existirán probablemente unas
estrategias que sean dominantes en comparación a otras. Para los fines del juego, existen
dos tipos de dominio estratégico que son:
 Estrategia estrictamente dominante: Cuando siempre proporciona a un jugador mayor

utilidad, independientemente de la estrategia del otro jugador.
 Estrategia débilmente dominante: Cuando proporciona a un jugador al menos la
misma utilidad para todas las estrategias del otro jugador, y estrictamente superior
para alguna de sus estrategias.
Un equilibrio de estrategias dominantes se alcanza cuando cada jugador tiene su propia

estrategia dominante. Luego se alcanza un equilibrio.
1.6.1 Juegos estáticos
En un juego estratégico estático o juego simultáneo, cada jugador ejecuta una acción
sin conocer la alternativa elegida por los demás jugadores.
A continuación se mencionan los elementos de un juego simultáneo:
 Conjunto de jugadores: N= {1, 2, ... , n}

 Conjunto de estrategias posibles Si para cada jugador.
 Función de utilidad esperada sobre cada uno de los perfiles de estrategias.
Ui : S ⎯⎯→ R para cada jugador i
Un juego en forma normal es una terna (N, S, U)
Se analizan dos tipos de solución:
 Estrategias racionalizables
 Equilibrio de Nash
Estrategias racionalizables
a) Estrategia estrictamente dominada.

La estrategia de un jugador está estrictamente dominada si existe otra estrategia posible
que proporciona al jugador un pago mayor, independientemente de lo que hagan los demás
jugadores. Un ejemplo de estrategia estrictamente dominada es el Dilema del Prisionero que
se analizará en un acápite posterior y referido al equilibrio de Nash.
Un jugador racional nunca utilizará una estrategia estrictamente dominada, dado que esta
conducta sería inconsistente con adoptar siempre aquellas acciones que maximizan su
bienestar. El orden de eliminación de estrategias estrictamente dominadas no afecta al
resultado.
El método para operar las estrategias racionalizables es:
♦ En el juego (N, S, U) se eliminan todas las estrategias estrictamente dominadas. Se
obtiene un nuevo juego (N, S1 ,U)
♦ En este juego (N, S1 ,U) se vuelven a eliminar las estrategias estrictamente
dominadas para obtener el juego (N, S2 ,U)
♦ Se procede iterativamente hasta que no se puedan eliminar más estrategias.
Cuando se finaliza en Sk , este será el conjunto de estrategias racionalizables.
Nota: Para encontrar estrategias racionalizables no se deben eliminar estrategias débilmente

dominadas.
Ejemplo 7. Determinar las estrategias que sobreviven, luego de la eliminación iterada

de las estrategias estrictamente dominadas, razonando las hipótesis que hay que hacer al
eliminar cada estrategia sobre la racionalidad de los jugadores. El planteamiento de la matriz
de pagos es la que se muestra en la matriz siguiente:
J2
C1 C2 C3 C4
F1 7,0 10,100 14,109 3,5
J1
F2 0,16 10,0 0,18 0,6
F3 20,9 8,0 11,11 0,7
F4 14,20 2,300 10,8 10,7
Solución:
Se observa en las estrategias para J2, que la columna C4 se encuentra estrictamente
dominada por C3, dado que:
109 > 5 , 18 > 6 , 11 > 6 , 8 > 7
Si la estrategia por columna es racional, J2 nunca eligirá C4.

Si el jugador J1 sabe que J2 es racional, entenderá que los únicos resultados posibles
son:
J2
C1 C2 C3
F1 7,0 10,100 14,109
J1
F2 0,16 10,0 0,18
F3 20,9 8,0 11,11
F4 14,20 2,300 10,8
En la nueva submatriz de pagos, razonando ahora para el J1, la estrategia F4 está

dominada por F3, puesto que las utilidades indican que:
20 > 14 , 8 > 2 , 11 > 10

Si J1 es racional, nunca eligirá la estrategia F4.
Si J2 se anticipa, lo que requiere saber de J1, sabe que J1 es racional. Por lo tanto,
sabe que los únicos resultados posibles son:
J2
C1 C2 C3
J1 F1 7,0 10,100 14,109
F2 0,16 10,0 0,18
F3 20,9 8,0 11,11
En la nueva submatriz de pagos, desde la perspectiva del J2, la estrategia C2 está

dominada por C3, pues
109 > 100 , 18 > 0 , 11 > 0
Si J2 es racional, nunca jugará C2

Si J1 se anticipa, lo que requiere saber de J2, sabe que J2 es racional. Por lo tanto,
sabe que los únicos resultados posibles son:
J2
C1 C3
J1 F1 7,0 14,109
F2 0,16 0,18
F3 20,9 11,11
Suponiendo que la racionalidad es de conocimiento público, J1 no debería jugar F2

puesto que está dominada tanto por F1 como por F3, adviértase que
7 > 0 , 14 > 0 y 20 > 0 , 11 > 0
Si J1 es racional, nunca jugará F2.

Si J2 se anticipa, lo que requiere saber que J1 sabe que J2 es racional, sabe que los
únicos resultados posibles son:
J2
C1 C3
J1
F1 7,0 14,109
F3 20,9 11,11
En la nueva submatriz de pagos, J2 no debe elegir C1 porque se encuentra dominada
por C3, dado que:
109 > 0 , 11 > 9
Los únicos resultados posibles son:
J2
C3
J1
F1 14,109
F3 11,11
J1 no debe elegir F3 al encontrarse dominada por F 1, dado que 14 > 11

El único resultado posible es:
J2
J1 C3
F1 14,109
Se concluye por eliminación, J1 eligirá F1 y J2 eligirá C3.
b) Resolución con el método de argumentos de dominación EID (Eliminación Iterativa

Débil)
Eliminando todas las estrategias dominadas se obtiene un nuevo juego reducido, una vez
que se obtiene el nuevo juego se vuelve a repetir el proceso hasta llegar al modelo en el que
no hayan estrategias dominadas.
Las estrategias resultantes pueden ser distintas en función de si se ha eliminado primero
una estrategia dominada u otra.
Ejemplo 8. Dada la siguiente matriz de pagos que representa la utilidad esperada por
ventas en 106 Bs, determine la estrategia comunicacional más conveniente para las empresas
del problema. J1 representa a la empresa Sony y J2 a la empresa Samsung, ambas en el
mercado de Bolivia.
J2
Sin publicidad Radio Televisión
Sin publicidad 13,4 11,9 8,14
J1 Radio 17,3 13,5 10,13
Televisión 20,1 15,7 10,4
Para J1 la estrategia 'Sin publicidad' está dominada por la estrategia publicidad por
'Radio':
17 > 13 , 13 > 11 , 10 > 8
Para J2 la estrategia 'Sin publicidad' está dominada por la estrategia publicidad

'Radio':
9>4,5>3,7>1
En atención a este análisis de dominancia, entonces para ambos jugadores, se elimina

la estrategia 'Sin Publicidad'.
J2
Radio Televisión
Radio 13,5 10,13
J1
Televisión 15,7 10,4
Para el J1 la estrategia 'Radio' está dominada por la estrategia 'Televisión'.
15 > 13 y 10 ≥ 10
De manera que debe eliminarse la estrategia 'Radio' para J1, quedando la matriz de
pagos reducida a:
J2
Radio Televisión
J1 Televisión 15,7 10,4
Para el jugador J2 la estrategia 'Televisión' está dominada por la opción 'Radio',

puesto que 7 > 4, así que se elimina la opción 'Televisión'. Por tanto, queda una solución
'Televisión ‐ Radio'.
Para el jugador J1 la única estrategia que le queda es 'Televisión'.
Se puede observar que existen diferentes soluciones dependiendo del razonamiento que se
utilice para resolver el problema.
c) Resolución con el método de argumentos de dominación EIE (Eliminación
Iterativa Estricta)
Es un método análogo al EID (Eliminación Iterativa Débil) con la particularidad de que
para que se elimine una estrategia debe ser estrictamente dominada por otra.
En este caso, al contrario que en el EID, la estrategia resultante es siempre la misma,
independientemente del orden en el que se eliminen las estrategias.
Ejemplo 9. Dada la siguiente matriz de pagos, determine la estrategia más conveniente

para las empresas del problema.
J2
Sin publicidad 13,4 11,9 8,14
J1 Radio 17,3 13,5 10,13
Para el jugador J1 la estrategia 'Sin publicidad' está dominada estrictamente por la

estrategia 'Radio':
17 > 13 , 13 > 11 , 10 > 8
Para el jugador J2 la estrategia 'Sin publicidad' está dominada estrictamente por la

estrategia 'Radio':
9>4,5>3,7>1
En consecuencia, se elimina la opción 'Sin publicidad' en las dos empresas.
J2
Radio Televisión
Radio 13,5 10,13
J1
Televisión 15,7 10,4
Para el jugador J1 no hay más estrategias estrictamente dominadas, porque:
15 > 13 ,pero, 10 no es > 10

Para el jugador J2 no hay más estrategias estrictamente dominadas, porque:
13 > 5 , 4 no es > 7
En consecuencia, hay cuatro soluciones posibles:
Radio ‐ Radio , Radio ‐ Televisión , Televisión ‐ Radio y Televisión ‐ Televisión
1.7.- Equilibrio de Nash
Antes de definir el concepto de equilibrio de Nash, en opinión del autor, tal vez sea
necesario comprender un fenómeno que ocurre en la venta de ¨sandwich de chola¨, durante
el funcionamiento de la feria de la ciudad de Ël Alto¨, la mayor del continente, los días jueves
y domingo. La pregunta es comprender, el por qué las vendedoras se concentran
justamente en la mitad de la feria, pudiendo racionalmente distribuirse a lo largo de ella.
Inicialmente supongamos que por efectos de una medida municipal del GAMEA, se
distribuyen los puestos de venta a un tercio de cada extremo de la feria, tal como se
representa en la figura.
VENDEDORA A VENDEDORA B
La distribución de sus compradores se inicia con racionalidad, puesto que existe una
línea imaginaria que las divide, sin embargo la vendedora B, más viva que la otra, decide
incrementar sus ventas, de manera que decide, sin tomar en cuenta la norma municipal,
como es ¨normal¨ en este tipo de actividad comercial, moverse más a la izquierda, para así
arrebatarle más clientes a la vendedora A e incrementar sus ventas, llegando a la siguiente
posición.
Como ha incrementado sus ventas por haber arrebatado los clientes de la vendedora
A, que ahora se encuentran más cercanas a su puesto de venta, entonces, decide acercarse
más aún hasta juntarse a la vendedora A.
Evidentemente la vendedora B, al margen de tener bajo su dominio a los

consumidores de la derecha, le ha arrebatado los clientes de la vendedora A, quedándose
esta última con los clientes del lado izquierdo en poca magnitud. Sin embargo la vendedora
A, es también inteligente y decide contraatacar y pasa al lado derecho para arrebatarle los
clientes a la vendedora B, quedando la configuración de la manera siguiente.
VENDEDORA B VENDEDORA A
En esta situación ahora, la aventajada es ahora la vendedora A. Dándose cuenta de

su situación, la vendedora B, decide entonces retornar a su territorio, mientras que la
vendedora avanza hasta el máximo de su conveniencia, tal como se muestra en la figura.
A partir de este momento, las vendedoras toman posesión de la mitad y no se

mueven, porque saben ambas que han llegado a un equilibrio, cualquier avance o retroceso,
les implicaría perder clientes, de manera que han llegado al equilibrio de Nash.
El equilibrio de Nash es una situación en la cual los competidores no necesitan
ponerse de acuerdo, simplemente deben tener en cuenta a sus adversarios a la hora de
tomar la decisión. Cada competidor busca su beneficio, pero al mismo tiempo tiene en cuenta
el beneficio de los competidores a la hora de decidir. Actuar como monopolio es inestable.
Cada competidor busca su beneficio, pero al mismo tiempo tiene en cuenta el beneficio de
los competidores a la hora de decidir.
El concepto de equilibrio de Nash (EN) identifica los perfiles de estrategias en los que
ningún jugador tiene incentivos para desviarse, si espera que los demás adopten las
acciones que el equilibrio prescribe para ellos.
Cada jugador tiene que estar jugando su mejor estrategia dadas las elecciones de los
otros jugadores. Ningún jugador tiene incentivos a cambiar su estrategia unilateralmente.
DEFINICIÓN: Un equilibrio de Nash (EN) de un juego en forma normal es un perfil de

estrategias S* = (S1*, …. Sn*,), tal que para cada jugador i y cada estrategia si Ɛ Si , se tiene:
Ui (Si*, S-i*) ≥ Ui (Si, S-i*)
Interpretación del equilibrio de Nash (EN):
 Es una norma autosostenible: Un vez aceptada, ningún jugador tiene incentivos para
no seguirla.
 Cada jugador responde de la mejor manera que puede, frente a las estrategias de los
demás jugadores.
 Es un perfil de expectativas que se autoconfirman: Si los jugadores esperan que los
demás se comporten de acuerdo con lo prescrito, entonces estas acciones ocurren
como consecuencia de la conducta de los jugadores.
 Para cada jugador i Ɛ N y para cada perfil de estrategias de los demás jugadores
s-i Ɛ Si, se identifica la estrategia (o estrategias) que maximiza la utilidad del jugador i.
Esto es BRi (s’i ) como la Mejor Respuesta (Best Response) del jugador i al perfil s-i.
Esta interpretación permite reformular el concepto de equilibrio de Nash como una
solución a un sistema de ecuaciones. Sea, por ejemplo, el equilibrio de Nash S * = (
S1*, S2* ), resuelve el sistema:
{
S1 Ɛ BR1(S2)
Sistema
S2 Ɛ BR2(S1)
La forma de resolver el sistema depende del juego en concreto:
a) Si las mejores respuestas son funciones, el problema se reduce a resolver un sistema

de ecuaciones (juegos en los que las estrategias están descritas por una variable
continua):
S1 Ɛ BR1(S2) S2 Ɛ BR2(S1)
b) En juegos donde se busca la mejor respuesta de un jugador para cada elección

de los otros jugadores (puede ser difícil). Observando las mejores respuestas que
satisfacen el sistema se encuentra el equilibrio de Nash.
c) En los juegos que se pueden representar matricialmente se puede reflejar la mejor
respuesta de cada jugador ante lo que hacen los demás, marcando el pago
correspondiente. En las entradas de la matriz donde se haya marcado todos los
pagos se tendrá un equilibrio de Nash.
Se toma el siguiente ejemplo:
J2
I2 D2
I1 1,1 0,0
J1
D1 0,0 1,1
Desde la óptica del jugador 1, se tiene:
Si J2 elige I2 ,la mejor opción para J1 es elegir I1 pues 1 > 0 y se marca con (×)
.
J1
{
Si J2 elige D2 la mejor opción para J1 es elegir D1 pues 1 > 0 y se marca con
asterisco (x).
La matriz de pagos modificada se muestra a continuación:
J2
I2 D2
I1 1x,1 0,0
J1
D1 0,0 1x,1
Desde la óptica del jugador 2, se tiene:
Si J1 elige I1 ,la mejor opción para J2 es elegir I2 pues 1 > 0 y se marca con (°)
.
J2
{
Si J1 elige D1 la mejor opción para J2 es elegir D2 pues 1 > 0 y se
marca con asterisco (°) .
La matriz de pagos modificada se muestra a continuación:
J2
I2 D2
I1 x
1 ,1° 0,0
J1
D1 0,0 1x,1°
Las entradas de la matriz donde se han marcado los pagos son (I1 , I2 ) y (D1 , D2 ),
por tanto, el equilibrio de Nash, múltiple en este caso, se establece como:
EN = {(I1,I2),(D1,D2)}
Una aplicación del equilibrio de Nash puro, es el dilema del prisionero que se analiza a
continuación:
DILEMA DEL PRISIONERO.

Ejemplo 10. Describe una situación en la que dos prisioneros, sospechosos de robo,
pasan a estar en custodia de la policía. Sin embargo, los policías no tienen suficientes
pruebas para condenarlos de ese crimen, sólo para condenarlos por el cargo de posesión de
bienes robados, que conlleva una pena mucho menor.
Si ninguno de ellos confiesa (cooperan entre sí), ambos serán sentenciados a la pena
menor, dos años de prisión cada uno. La policía los interrogará en salas de interrogatorio
diferentes, lo que significa que los dos prisioneros no pueden comunicarse entre ellos (por lo
tanto tendrán información imperfecta). La policía tratará de convencer a cada prisionero de
que confiese el crimen, ofreciéndoles salir libres en un año, mientras que el otro prisionero
será condenado a una pena de diez años. Si ambos prisioneros confiesan, cada preso será
condenado a seis años. A ambos prisioneros se les ofrece el mismo trato, ambos conocen
las consecuencias de cada acción (información completa) y son completamente conscientes
de que al otro prisionero se le ha ofrecido el mismo trato (por lo tanto la información es
de conocimiento común).
Prisionero 2
Delata D2 No Delata ND2
Prisionero Delata D1 -6,-6 -1,-10
1 No Delata ND1 -10,-1 -2,-2
El Prisionero 1 tiene dos estrategias (D 1 , ND1)

El Prisionero 2 tiene dos estrategias (D 2 , ND2)
Antes de resolver este problema de juegos, se realiza la siguiente teorización

respecto a los pagos de cada una de las estrategias de ambos jugadores en los siguientes
términos:
Prisionero 2
Prisionero Delata D1 R,R P,T
1 No Delata ND1 T,P C,C
Donde:
T es el pago de la tentación que supone no delatar, si el otro prisionero si lo hace.

R es el pago o recompensa que obtienen ambos prisioneros por haber tenido un
comportamiento cooperativo (delatar).
C es el pago del castigo por haber tenido un comportamiento no cooperativo (no
delatar).
P es el pago del prisionero que coopera frente al comportamiento del otro que no
delata.
La característica básica de este problema en general se presenta en las siguientes
dos proposiciones:
T>R>C>P
P + T < 2R
Resolviendo ahora el problema por medio de estrategias dominadas, en el Prisionero

1, la estrategia D1 domina a la estrategia ND1 pues
− 6 > − 10 y −1 > − 2
Por lo que se elimina la estrategia ND1
Prisionero 2
Prisionero
Delata D1 -6,-6 -1,-10
1
En el Prisionero 2, la estrategia D2 domina a la estrategia ND2 pues
− 6 > − 10
En consecuencia, en el dilema del prisionero, la estrategia dominante para ambos

jugadores es delatar, lo que significa que delatar‐delatar es el equilibrio de la estrategia
dominante (equilibrio de Nash).
Si hubieran podido pactar, estarían mejor decidiendo no delatar (−1 , −1) ≡ equilibrio
óptimo de Pareto, ambos serían condenados a 1 año de prisión, aunque sería inestable (hay
incentivos de desviarse). Al no existir ninguna relación entre los prisioneros, no existe
confianza entre ellos, y no hay motivos para pensar que puedan colaborar.
En necesario aclarar que cualquier equilibrio de estrategia dominante es siempre un
equilibrio de Nash. Sin embargo, no todos los equilibrios de Nash son equilibrios de
estrategias dominantes.
GUERRA DE PUBLICIDAD.
Ejemplo 11. Las compañías A y B forman un duopolio en el sector de grandes
almacenes de supermercados, ambas destinan una gran inversión en publicidad, medida en
millones de bolivianos, y se adjuntan las utilidades esperadas en la siguiente matriz de
pagos. ¿Cuál será la decisión óptima para el duopolio?
Compañía B
Hacer No hacer
publicidad publicidad
Hacer
10,5 15,0
Compañía publicidad
A No hacer
6,8 18,2
publicidad
La compañía A no tiene una estrategia dominante: 10 > 6 , 15 no es > 18.

En la compañía B la estrategia dominante es 'Hacer Publicidad': 5 > 0 , 8 > 2
Por lo tanto, eliminando la columna de No hacer publicidad, se tiene la matriz
siguiente:
Compañía
B
Hacer
publicidad
Hacer
10,5
Compañía publicidad
A No hacer
6,8
publicidad
La estrategia de la compañía A es 'Hacer Publicidad' porque así obtiene una utilidad

de 10 millones de bolivianos en lugar de 6 millones.
El equilibrio de Nash es que ambas empresas hagan publicidad.
1.8.- Representación en forma extensiva

La forma extensiva de un juego es una forma de mostrar un juego usando un árbol de
juegos, es un diagrama que muestra qué decisiones se pueden tomar en diferentes
momentos del tiempo, y por tanto, suelen utilizarse en juegos: secuenciales, con información
imperfecta y en juegos simultáneos.
Los nodos son puntos en el tiempo en los que se toman decisiones, para mejor
comprensión, teóricamente se muestra en la siguiente figura, donde p es el pago
correspondiente.
Estrategia A p1A , p2A
Jugador 2
Estrategia A Estrategia B
p1A , p2B
Jugador 1 Estrategia B Estrategia A
p1,B , p2A
Estrategia B
Jugador 2
P1,B , p2B
La forma extensiva debe representar la información con la que cuenta cada jugador
en el momento de tomar una decisión en forma de árbol. Cuando un jugador posee la misma
información en más de un nodo, estos nodos se unen con una línea discontinua. Así, en
estos nodos un jugador no puede distinguir su ubicación exacta en el juego.
Un Conjunto de Información es un conjunto formado por nodos entre los cuales un
jugador no puede distinguir su posición en el juego cuando toma una decisión. Es decir, al
conjunto de nodos conectados mediante líneas discontinuas. Generalmente esto ocurre
cuando el jugador no puede observar las acciones que toman otros jugadores en los nodos
predecesores.
Todo nodo de decisión pertenece a un Conjunto de Información.
Todos los nodos que pertenecen al mismo Conjunto de Información tienen el mismo
número de sucesores inmediatos y deben tener el mismo conjunto de acciones sobre las
ramas (diferentes acciones que un jugador puede elegir) que conducen a estos. Si no fuera
así, el jugador podría distinguir entre los nodos.
Cada juego en forma extensiva posee una representación en forma normal. Sin
embargo, cada juego en forma normal puede poseer más de una representación en forma
extensiva.
En este sentido, existe una discusión sobre si en realidad los juegos en forma normal
contienen toda la información requerida.
Sin embargo, los juegos estáticos (one‐shot games) poseen una buena
representación en forma normal al no existir discrepancia en la información entre esta
representación y la forma extensiva.
Ejemplo 12. Presentada la siguiente matriz de pagos, determinar el equilibrio de

Nash para un juego estático en su forma extensiva.
J2
Izquierda I Derecha D
Arriba A 2,5 5,2
J1
Abajo B 0,0 3,1
Su representación en forma extensiva es:
IZQUIERDA I
2,5
ARRIBA A
J2
DERECHA D 5,2
J1
IZQUIERDA I 0,0
ABAJO B
J2
DERECHA D 3,1
El jugador 1 sabe que el jugador 2 prefiere ir a la izquierda porque le reportará pagos

superiores 5 > 2 (gana más que ir por la derecha), por tanto, al jugador 1 le conviene ir por
arriba, ya que obtendrá mayores pagos.
Por otro lado el jugador 2 sabe que al jugador 1 le conviene ir por arriba, por tanto, al
jugador 2 le conviene ir por la izquierda ya que obtendrá mayores pagos.
Se observa que arriba y la izquierda es un equilibrio de Nash porque son las mejores
estrategias tomando en cuenta las estrategias del otro jugador, tal como se observa en el
cuadro siguiente.
J2
Arriba A 2,5 5,2
J1
Abajo B 0,0 3,1
Sin embargo, como es un juego secuencial no es un equilibrio perfecto. Para hallar el
equilibrio perfecto en subjuegos, se debe partir hacia atrás a partir del último movimiento.
En este ejemplo, considerando los subjuegos, se sabe que el jugador 2 irá a la
izquierda, si el jugador 1 va arriba, e irá a la derecha si el jugador 1 va abajo, ya que estos
movimientos maximizan los pagos del jugador 2.
Como hay información completa y por tanto, los pagos de cada jugador se saben, el
jugador 1 anticipa estos movimientos y decide ir abajo, maximizando su pago, es decir, abajo
derecha es el equilibrio perfecto en subjuegos.
J2
Arriba A 2,5 5,2
J1
Abajo B 0,0 3,1
Los subjuegos son importantes al tiempo de analizar juegos repetidos también

conocidos como superjuegos, ya que las restricciones son más fáciles de analizar con un
árbol de juegos con varias ramas.
1.9.- Juegos Dinámicos

Los juegos dinámicos son juegos en los que un jugador tiene que tomar una decisión
tras conocer parte del desarrollo del juego, en concreto qué hizo al conocer la decisión de sus
rivales. El modelo matemático del juego se desarrolla en forma extensiva.
En la forma extensiva la descripción del juego se realiza en forma de árbol de
decisión, dando mayor importancia a la secuencia del juego, es decir, a la forma en que se
desarrollan o se pueden desarrollar las acciones de cada jugador para llegar a los resultados.
Para realizar la representación se utiliza un árbol de decisión, formado por los
jugadores; nodos que incluyen los resultados de las elecciones de alguno de los jugadores o
del fin del juego; acciones que relacionan los nodos y que equivalen a las elecciones de los
jugadores; y los vectores de pago que se asocian con cada nodo al final del juego.
En un juego representado en forma extensiva se deben especificar:
• El orden en que los jugadores van tomando sus decisiones
• La información que tienen en cada momento
• Las alternativas que tienen a su disposición
• El resultado final de cada posible camino que se haya podido seguir
Estrategia: Es un plan contingente que prescribe qué acción tomará el jugador en

cada una de las posibles ocasiones (vértices) en las que le puede tocar mover, incluso en
aquellas situaciones en las que no sigue el plan inicial.
Se debe señalar que la definición de estrategia no requiere que se lleven a cabo todas las
acciones en ella. Se realizarán unas acciones u otras según el desarrollo del juego.
Perfil de estrategia: Es un vector de estrategias, una para cada jugador,
S = (s1 , s2 , … , sn ).
S ≡ Conjunto de perfiles de estrategia: S = S1 x S2 x … x Sn
En esta línea:
Si S1= { A, B } y S2 = { X, Y } ⇒ S = S1 x S2 = {(A, X) , (A, Y) , (B, X) , (B, Y)}
Denotando por s-1 ≡ El perfil de estrategia para todos los jugadores excepto para el
jugador i
Un perfil de estrategia se puede denotar como s (s i ,s-i )
Juegos Dinámicos con información incompleta

Se caracteriza porque todos los jugadores conocen lo ocurrido hasta el momento en
que juegan. Los elementos de la forma extensiva son:
♦ Árbol de decisión: Vértice inicial del que salen varias ramas que llegan a otros vértices, de
los que pueden salir otras ramas, y así sucesivamente. Los vértices de los que no salen
ramas se denominan vértices finales.
♦ Asignación de los vértices no finales entre los jugadores: Cada vértices debe de ser de
algún jugador y ningún vértice puede corresponder a más de un jugador.
♦ Asignación de acciones a cada jugador en cada uno de los vértices que tiene asignados.
♦ Asignación de pagos (utilidades): En cada vértice final se asigna un pago a cada jugador.
A continuación se desarrollan tres problemas de juegos dinámicos, en cuya solución
se incluye el concepto de subjuego y el punto de equilibrio de Nash.
Ejemplo 13. Presentada la siguiente matriz de pagos, determinar el equilibrio de

Nash para un juego dinámico en su forma extensiva.
J2
Estrategia X Estrategia Y
Estrategia A 2,5 8,4
J1
Estrategia B 3,3 5,2
Su representación en forma extensiva es:

ESTRATEGIA X
2,5
ESTRATEG A
J2
ESTRATEGIA Y 8,4
J1
ESTRATEGIA X 3,3
ESTRATEG B
J2
ESTRATEGIA Y 5,2
Inicialmente y de acuerdo a un razonamiento normal, el jugador uno, puede elegir

entre las estrategias A y B y el jugador 2, entre las estrategias X e Y. Los resultados a los que
llegan son los que tienen a la derecha.
La forma de resolverlo es por inducción hacia atrás, en primer lugar se resuelven
los subjuegos que quedan en la parte derecha del juego, es decir, cuando toca decidir al
jugador J2.
ESTRATEGIA X
2,5
J2
ESTRATEGIA Y 8,4
No debe olvidarse que de los pagos, en la expresión binomial, el segundo número

corresponde al valor del juego para el jugador 2. Consecuentemente, 5 > 4, por lo que se
conviene tomar la estrategia X y se señala con una flecha.
A continuación, se resuelve el subjuego de la parte inferior, donde el jugador 2 tiene
dos alternativas X e Y.
ESTRATEGIA X
3,3
J2
ESTRATEGIA Y 5,2
La estrategia X tiene un valor de 3 y la estrategia Y tiene 2, consiguientemente 3 > 2,

por esta razón se toma la estrategia X.
La pregunta ahora es: ¿ qué haría el jugador 1, si opta por la estrategia A? . A
continuación el jugador 2 toma la estrategia X, por lo tanto el pago que tendrá el jugador 1 es
de 2 del binomio (2,5). Si el jugador 1 toma la estrategia B, a continuación el jugador 2 toma
la estrategia que ya se había establecido en X, por lo tanto, el jugador 1, necesariamente
opta por 3 del binomio (3,3), luego la decisión del jugador 1 es entre ganar 2 ó 3, siendo 3 >
2, entonces opta por la estrategia B.
Por consiguiente el equilibrio de Nash perfecto en subjuegos, el jugador 1 haría la
estrategia B y el jugador 2 sería X,X porque le conviene estas estrategias (B, XX), situación
que no es igual al desarrollo del juego que será B para el jugador 1 y X para el jugador 2.
ESTRATEGIA X 2,5
ESTRATEG A
J2
ESTRATEGIA Y 8,4
J1
ESTRATEGIA X 3,3
ESTRATEG B
J2
ESTRATEGIA Y 5,2
Ejemplo 14. Un juego que en su representación extensiva tiene la forma:
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,1
J1
ESTRATEG B
2,5
Determinar el equilibrio de Nash.

En este juego dinámico se puede apreciar que el jugador 1 puede elegir entre las
estrategias A y B. A continuación si el jugador 1 ha elegido la estrategia A, el jugador 2
deberá elegir entre las estrategias X e Y, y finalmente, si el jugador 2 ha elegido la estrategia
X, el jugador 1, de nuevo, tendrá que elegir y escoger entre las estrategias C y D.
La forma de resolver este juego dinámico, será por inducción hacia atrás, y se partirá
de esta última decisión que ha de tomar el jugador 1 entre las estrategias C y D, para ello, se
tienen que comparar los pagos que obtendría en uno y otro caso. Si toma la estrategia C,
obtendrá un pago de 2, y si toma la estrategia D, obtiene un pago de 3.
Siendo 3 > 2, entonces se decide por lógica, por la estrategia D porque recibe mayor
pago, maximiza su utilidad y se marca con una flecha.
ESTRATEGIA C
2,3
J1
ESTRATEGIA D 3,2
A continuación, se da un paso hacia atrás, de ahí el nombre de inducción hacia atrás, de la

forma de resolución de los juegos dinámicos. Tendrá que ser en esta ocasión el jugador 2, el
que elija entre las estrategia X e Y, sabe que si elige la estrategia X, a continuación el jugador
1 seguirá la estrategia D, por consiguiente, el pago que el jugador 2 obtendrá será 2. Por el
contrario, si sigue la estrategia Y, obtendría un valor de 1. Por lo tanto, lo mejor que podría
hacer el jugador 2, sería seguir la estrategia X, para que el jugador 1 siga la estrategia D y
así, el jugador 2, se llevará un pago de 2, que es mejor que 1.
EST C 2,3
ESTRATEGIA X
J1
J2 EST D 3,2
ESTRATEGIA Y 2,1
Seguimos por inducción hacia atrás y ahora se verá: ¿qué haría el jugador 1 en el
primer nodo porque tendría que elegir entre las estrategias A y B?. Si sigue la estrategia A,
se sabe que el jugador 2 elegirá la estrategia X, y de nuevo el jugador 1 elegirá la estrategia
D, por consiguiente, si decide por la estrategia A, acabará recibiendo un pago de 3, mientras
que si optase por la estrategia B, recibiría un pago de 2, por consiguiente siendo 3 > 2, lo
mejor que puede hacer el jugador 1, es tomar la estrategia A. Véase el subjuego como:
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,1
J1
ESTRATEG B
2,5
El desarrollo previsible de este juego será A X D, el jugador 1 tomará la estrategia A,

luego el jugador 2 tomará la estrategia X y nuevamente el jugador 1 tomará la estrategia D.
El resultado de ese juego será, por tanto, que el jugador 1, se llevará 3 y el jugador 2,
se llevará 2.
Finalmente el equilibrio perfecto de Nash, será la combinación de estrategias A D X,
puesto que se toma en primer lugar, la estrategia que sigue el jugador 1 y detrás de la coma
estará la estrategia del jugador 2.
Nótese que una estrategia, es un plan de acción completa que no indica qué haría un
jugador en un nodo en el cual tenga que decidir, en este caso el jugador 1, en el primer nodo
decidirá por A, y en el segundo haría D, por eso que el equilibrio de Nash será A D X, el
equilibrio perfecto en subjuegos.
Ejemplo 15. Un juego que en su representación extensiva tiene la forma:
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,3
J1
ESTRATEG B
1,5

El juego es parecido al anterior, pero es mejor analizarlo en detalle.
Se ve inicialmente que el jugador 1, elegirá entre A y B. A continuación si el jugador 1
elige la estrategia A, el jugador 2 puede elegir entre las estrategias X e Y, finalmente si el
jugador 2 ha elegido la estrategia X, el jugador 1 elegirá entre las estrategias C y D.
Se resolverá este juego dinámico por inducción hacia atrás. En primer lugar se
observa qué pasa en el último subjuego.
ESTRATEGIA C
2,3
J1
ESTRATEGIA D 3,2
Si el jugador 1 escogiera la estrategia C, obtendría un pago de 2, mientras que si
sigue la estrategia D, obtendría un pago de 3. Ahora bien, 3 > 2, por lo tanto, la estrategia a
seguir por el jugador 1 sería D, se marca y coloca una flechita para guiar la decisión.
Dando un paso hacia atrás, para ver qué es lo que haría el jugador 2, sabiendo que el
jugador 1, tiene preferencia por la estrategia D en el último subjuego, de manera que, el
jugador 2 sabe que si asume la estrategia X, el jugador 1 a continuación tomará la estrategia
D, por lo tanto, el pago que el jugador 2 esperaría al tomar la estrategia X, será 2, mientras
que si escoge la estrategia Y, tendrá un pago de 3.
EST C 2,3
ESTRATEGIA X
J1
J2 EST D 3,2
ESTRATEGIA Y 2,3
Por lo tanto la mejor estrategia que puede asumir el jugador 2, será Y, puesto que 3 >
2 y se marca con una flecha.
Dando un paso hacia atrás, se observa que el jugador 1 tiene dos estrategias A y B.
Si se toma la estrategia A, a continuación el jugador 2 hará Y, por lo tanto, el pago esperado
por el jugador 1 será 2, mientras que en el primer nodo, el jugador 1, opta por la estrategia B,
cuyo pago esperado es 1. Por consiguiente, lo mejor que puede hacer el jugador 1, es hacer
A porque sabe que el jugador 2 tomará la estrategia Y, comparando los pagos 2 > 1.
Entonces el desarrollo previsible de este subjuego, será A para el jugador 1 y Y para
el jugador 2.
¿Cuál será el resultado que obtendrían ambos jugadores?.
El jugador 1 obtendrá 2, mientras que el jugador 2 obtendrá 3 respectivamente.
Finalmente el equilibrio de Nash, sería la combinación de las estrategias A,D e Y. El
jugador 1, hará A en el primer nodo y D cuando esté en el segundo nodo, mientras que el
jugador 2 tomará la estrategia Y.
Debe recordarse que un equilibrio perfecto de Nash en subjuegos, nos informa qué
sucedería en cada uno de los subjuegos. Así la estrategia del jugador 1, AD, nos informa lo
que haría en el primer nodo y lo que tendría que hacer en el segundo nodo, donde tendría
que decidir, en cuyo caso haría D frente a la alternativa C.
Se sabe que por el desarrollo previsible del juego que, no se va a llegar a ese último
nodo, sin embargo, un equilibrio de Nash perfecto en un subjuego, nos informa de todo lo
que podría ocurrir.
EST C 2,3
ESTRATEGIA X
J1
ESTRATEG A
J2 EST D 3,2
ESTRATEGIA Y 2,3
J1
ESTRATEG B
1,5
Referencias
Álvarez, P. Teoría de Juegos. Universidad de Cantabria. España. 2013.

Ackoff – Sasieni. Fundamentos de Investigación de Operaciones. Ed. Wiley & Sons. México.
1982.
Bronson Richard. Teoría y problemas de Investigación de Operaciones. McGraw-Hill. México.
1986.
Cerdá, E; Pérez, J; Jimeno, P. Teoría de Juegos. Pearson Educación, SA. Madrid. 2004.
Harsany, J. (1967) “Games with incomplete information played by ‘Bayesian’players, parts
I and II”. Management Science, vol. 14.
Hurwicz, Leonid. (1953) “What Has Happened to The Theory of Games”. The Economic
Journal: STOR, 43 (2), 398-405.
Kuhn, Harold W. (1953) “Extensive Games and the Problem of Information”, enH. W.
Kuhn y A. W. Tucker (eds.), Contributions to the Theory of Games, Volume II, Princeton
University Press, Princeton
Myerson, Roger B. (1999) “Nash Equilibrium and the History of Economic Theory”. Journal
of Economic Literature. 37 (9), 1067-1082.
Nash, J. (1950) “Equilibrium points in n-person games”. Proceedings of the National
Academy of Sciences of the United States of America, 36, 48–49.
Prawda Juan. Métodos y modelos de Investigación de Operaciones. LIMUSA. México. 1980.
Pag. 744.
Selten, R. (1975) “Reexamination of the perfectness concept for equilibrium points in
extensive games”. International Journal of Game Theory, 4, 25–55.
Shapley, L. (1953) “A value for n-person games” en R. Tucker, A.W. Y Luce, editores,
Contributions to the Theory of Games II,. Princeton University Press.
Taha Hamdy. Investigación de Operaciones. Una introducción. Representaciones y servicios
de ingeniería. México. 1981.
Von Neumann, J.; O. Morgenstern (1953) Theory of Games and Economic Behavior
(Princeton: Princeton University Press).
Problemas y ejercicios
1.- Determine el valor del juego para la siguiente matriz de pagos:
J2
Y1 Y2 Y3
X1 11 -3 -4
J1 X2 8 7 -8
X3
-5 5 -6
2.- Determine el valor del juego para la siguiente matriz de pagos:
J2
Y1 Y2 Y3
X1
4 4 3
J1 X2 8 1 7
X3 -1 2 -1
3.- Aplicando el método gráfico determine el valor del juego:
J2
Y1 Y2 Y3 Y4 Y5
X1 2 –1 5 –2 6
J1
X2 2 4 –3 1 0
4.- Aplicando la programación lineal resuelva el siguiente juego:
J2
Y1 Y2 Y3
X1 -1 1 1
J 1 X2 2 -2 2
X3 3 3 -3
5.- Una empresa planea su estrategia de negociación con su sindicato. La empresa puede
emplear 2 estrategias: negociación o boicot de la negociación. El sindicato, por su parte,
puede tomar una postura agresiva, conciliadora o pasiva. La matriz de consecuencias es:
SINDICATO
EMPRESA AGRESIVO CONCILIADOR PASIVO
B1 B2 B3
NEGOCIACIÓN A1
-2 1 2
BOICOTEO DE A2 5 -2 -3
NEGOCIACIONES
Resuelva este problema
a) Gráficamente.
b) Algebraicamente.
c) Como un problema de programación lineal
(Tomado de Juan Prawda. Métodos y modelos de investigación de operaciones. Tomo II ).
6.- Un día antes de las elecciones, dos candidatos a gobernador consideran a las mismas
tres ciudades como importantes de una última visita. Ya que ninguna visita es útil a menos
que se haya realizado suficiente trabajo de avance por parte del grupo del candidato, cada
candidato deberá hacer planes antes de saber la elección realizada por su oponente. Los
grupos comisionados por ambos lados muestran idénticas proyecciones. La matriz de pagos
da la ganancia estimada ( en miles de votos ) para cada combinación de visitas del candidato
I en este último día. ¿Qué ciudad deberá elegir cada candidato para la visita?.
CANDIDATO II
CANDIDATO I A CIUDAD 1 A CIUDAD 2 A CIUDAD 3
B1 B2 B3
12 -9 14
A CIUDAD 1 A1
A CIUDAD 2 A2 -8 7 12
A CIUDAD 3 A3 11 -10 10
JUEGOS COOPERATIVOS
7.- La empresa A domina el mercado en una ciudad y una nueva empresa B está
estudiando si entra en él. Si la empresa B entra en el mercado, la empresa A tiene dos
posibilidades: Asumir la competencia de la empresa B, lo que se traduce en una disminución
de la cuota de mercado; o bien lanzar una guerra de precios.
Si la empresa A decide asumir la competencia, ambas empresas tendrán un beneficio de 5
millones de euros anuales, mientras que si decide lanzar una guerra de precios, las pérdidas
anuales seán de 5 millones para la Empresa A y 10 millones para la Empresa B. Si la
empresa B decide no entrar en el mercado, el beneficio anual para la Empresa A es de 20
millones.
El juego en forma normal:
J2
Entrar al No entrar al
mercado mercado
Asumir
5,5 20,0
competencia
J1
Guerra de
-5,-10 20,0
precios
Si no se desea tener valores negativos se puede sumar 10 a todos los resultados. Determine
el equilibrio de Nash
8.- En la presentación del siguiente juego, determinar el equilibrio de Nash aplicando

estrategias dominantes.
J2
A B C
X 8,15 14,7 0,9
J1 Y 16,4 5,-2 9,10
Z 5,7 13,11 6,15
9.- Suponga que una empresa compite con otras empresas para conseguir clientes. Ud. y
su rival saben que sus productos estarán obsoletos al final de cada año y deben determinar
simultáneamente si van a contratar publicidad o no. Pero, en su industria, la publicidad no
eleva la demanda total de la industria, sino que induce a los consumidores a cambiar entre
los productos de las distintas empresas.
Así pues, si tanto Ud. como su rival contratan publicidad, las dos campañas publicitarias se
compensarán entre sí, y cada una de las empresas obtendrá 4 millones de beneficios. Si
ninguna empresa contrata publicidad, cada una obtendrá 10 millones de beneficios. Sin
embargo, si una contrata publicidad y otra no, la que contrata obtendrá 20 millones de
beneficios y la que no, obtendrá 1 millón de beneficios. ¿Su elección para maximizar los
beneficios consiste en contratar publicidad o no?. Explique con la matriz de pagos.
10.- Dado el presente juego, determinar los equilibrios perfectos de Nash, la trayectoria y los
pagos.
ESTRATEGIA C 0,2
ESTRATEG A J2
ESTRATEGIA D 3,0
J1
ESTRATEGIA C 2,1
ESTRATEG B
J2
ESTRATEGIA D 1,3
11.- El juego dinámico entre dos jugadores consiste en que el Jugador 1 escoge primero
entre Ayudar (A) o No Ayudar (NA), y después el Jugador 2, conociendo la elección del
Jugador 1, decide a su vez entre sí Ayuda (A) o No Ayuda (NA). Cada Jugador recibe una
utilidad de 8 si ayudan, y de 2 si nadie ayuda. Por otra parte, sí un Jugador Ayuda y el otro No
Ayuda, el Jugador que Ayuda obtiene una utilidad de 0 y el Jugador que No Ayuda de 9.
Se solicita:
a) Representar el juego en forma extensiva y en forma estratégica.
b) Hallar el equilibrio o equilibrios de Nash (EN) en estrategias puras.
c) Hallar el equilibrio perfecto de Nash (ENPS) del juego por inducción hacia atrás. En caso
de existir, indicar un equilibrio no perfecto.
12.- El juego dinámico entre dos jugadores consiste en que el Jugador 1 escoge primero
entre Ayudar (A) o No Ayudar (NA), y después el Jugador 2, conociendo la elección del
Jugador 1, decide a su vez entre sí Ayuda (A) o No Ayuda (NA). Cada Jugador recibe una
utilidad de 8 si ayudan, y de 2 si nadie ayuda. Por otra parte, sí un Jugador Ayuda y el otro No
Ayuda, el Jugador que Ayuda obtiene una utilidad de 0 y el Jugador que No Ayuda de 9.
Se pide:
a) Representar el juego en forma extensiva y en forma estratégica.
b) Hallar el equilibrio o equilibrios de Nash (EN) en estrategias puras.
c) Hallar el equilibrio perfecto de Nash (ENPS) del juego por inducción hacia atrás. En caso
de existir, indicar un equilibrio no perfecto.
13.- La Batalla de los Sexos. Un hombre y una mujer desean salir a recrearse, bien en un
partido de fútbol o viendo una película romántica, aunque para ellos lo más importante es
estar juntos. El problema reside en que la mujer prefiere la película romántica, mientras que
el hombre prefiere ver el partido de fútbol.
Hombre
Partido de Partido de
fútbol fútbol
Partido de
2,1 0,0
fútbol
Mujer
Película
0,0 1,2
romántica
Como se darán cuenta, existe una situación que satisface a cada uno de los novios; y dos
situaciones en las que ninguno sale ganando nada (0, 0). Ésta última compara el hecho que
los novios deciden separarse y ver por su cuenta el partido o la película. En la otra situación
uno de los dos no queda muy contento, pero esto gana la compañía del otro, y por eso los
pagos se distribuyen de forma igual pero inversa.
14.- El Juego del Gallina. Este es un juego interesante, en donde se dice que dos jóvenes
conducen sus automóviles en dirección contraria a toda velocidad por una carretera estrecha.
Al aproximarse la colisión ambos jóvenes deciden entre “continuar” en la carretera o “ceder”
el paso. Si sólo uno de ellos eligiera “ceder”, sobre él recaería el deshonor, pero si ninguno de
ellos cediera, ambos morirían por el choque de los vehículos. Si únicamente uno de ellos
decide “continuar”, éste se cubre de gloria, y si ambos deciden “ceder” entonces se sienten
avergonzados.
Conductor 2
Continuar Ceder
Conducto Continuar -3,-3 2,0
r
Ceder 0,2 1,1
1
15.- Para los siguientes juegos, determine, para cada jugador, aquellas estrategias que
son estricta o débilmente dominantes. Encuentre los equilibrios de Nash del juego.
a)
J2
I D
A 2,2 0,3
J1
B 3,0 1,1
b)
J2
I D
A 2,1 0,1
J1
B 0,0 1,2
c)
J2
I D
A 4,4 -2,0
J1
B 4,3 -2,5
16.- En el siguiente juego en forma normal:

J2
Publicidad 2,0 1,1 4,2
J1 Radio 3,4 1,2 2,3
a) ¿Qué estrategias sobreviven a la eliminación sucesiva de estrategias estrictamente

dominadas?
(b) Encuentre los equilibrios de Nash en estrategias puras.
(c) ¿Algún jugador eliminó una estrategia que fuera mejor respuesta a alguna estrategia
del otro jugador?.
17.- Determine el equilibrio de Nash para el siguiente juego dinámico.
ESTRATEG A 2,2
J1 EST C 4,2
ESTRATEGIA X J1
ESTRATEG B J2 EST D 0,0

EST C
ESTRATEGIA Y J1 -1,-1
EST D 2,4

Capítulo 1 - Teoría de Juegos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Capítulo 1 - Teoría de Juegos

Cargado por

Copyright:

Formatos disponibles

1.1 Desarrollo y estado del arte

En la década de 1970 la Teoría de Juegos se aplicó extensamente a la biología, en

En 1965, Reinhard Selten investigó el equilibrio de juegos no cooperativos y replanteó

El profesor Selten analizó la racionalidad con el comportamiento oligopólico, sobre la

El Dr. Selten analizó también los modelos multietápicos, dentro de la Teoría de

El siguiente premio Nobel de Economía en Teoría de Juegos, fue otorgado el 2005 a

En el 2012, Lloyd Stowell Shapley y Alvin E. Roth ganan el Premio en Ciencias

Llody Shapley Stowell es Profesor emérito de la Universidad de California, que junto a

Alvin Roth, Profesor de la Universidad de Standford premiado junto a Shapley por la

Al describir el funcionamiento de un mercado, postula que a medida que cambian las

Por su trascendencia en la forma de razonar humano en diversos campos de la

Sea x una variable controlable.

E(U) =  U(x,y) (x) dx

Ahora en términos discretos:

Si se denomina V1 el pago esperado para el jugador J 1 y V2 para jugador J2,

1.3 Juegos bipersonales de suma cero

Un juego es una situación de conflicto o de competencia regulada, en este acápite se

ESTRATEGIAS DEL JUGADOR 2

ESTRATEGIAS DEL MEJORAR CANALES DE DIS- INCREMENTAR PUBLICIDAD

Punto de silla o de ensilladura.

1.4.1 Punto de ensilladura

Ejemplo 1. Punto de ensilladura

En la intersección de la segunda fila y la tercera columna, el valor del juego es 4 en

1.4.2 Juegos 2 x 2.-

Existen situaciones en la que no es posible encontrar punto ensilladura, entonces se

Aplicando el concepto de valor esperado en el juego

a11 x1 + a21 x2  V (3)

x1 (a11 - a12 ) + x2 (a21 - a22) = 0 x1 (a11 - a12) - x2 (a22 - a21) = 0 (7)

Despejando las variables x1 y x2 de las ecuaciones (7) y (8).

x1 a22 - a21 y1 a22 - a12

Remplazando la ecuación (1): x1 = 1 – x2 en ecuación (9)

(1 - x2) (a11 - a12) = x2 (a22 - a21)

a11 - a12 - x2 a11 + x2 a12 = x2 a22 - x2 a21

a11 - a12 - x2 a11 + x2 a12 - x2 a22 + x2 a21 = 0

a11 - a12 - x2 (a11 - a12 + a22 - a21) = 0

Remplazando la ecuación (1): x2 = 1 – x1 en ecuación 9

x1 (a11 - a12) = (1 - x1) (a22 - a21)

x1 a11 - x1 a12 = a22 - a21 - x1 a22 + x1 a21

x1 a11 - x1 a12 + x1 a22 - x1 a21 = a22 - a21

x1 (a11 - a12 + a22 - a21) = a22 - a21

Se obtiene la siguiente relación:

a22 - a21 a11 - a12

a11 a22 - a11 a21 a21 a11 - a21 a12

Entonces el valor esperado del juego es:

a11 a22 - a21 a12

Ejemplo 2.- Sea la siguiente matriz de pagos 2 x 2.

(-5)(-3) - (4) (6) 15 - 24 -9 1

La resolución de este tipo de juegos es gráfica y considera la probabilidad que el

Ejemplo 3. Mediante el siguiente ejemplo se emplea la metodología de cálculo.

Denomínense las variables en función del parámetro p:

Consiguientemente, el valor esperado del juego se construye con la siguiente

De manera que podrán construirse tantas inecuaciones como columnas existan en la

1P + 3(1-P)  V (1) P + 3 – 3P  V -2P + 3  V (1)

1.4.4 Resolución de juegos aplicando programación lineal

En este epígrafe se presenta la última interpretación que permite resolver problemas

La abstracción realizada en juegos con punto de ensilladura y los juegos 2 x 2,

Donde xi e yj corresponden a las probabilidades de las estrategias i y j ,

Si se revisa el planteamiento de un programa lineal, podrá inferir que el modelo de

Las restricciones  a in xi  V, recién ahora son divisibles por V de la forma:

De forma que el programa lineal expresado para el jugador J 1 , se expresa como:

a11 X1 + a21 X2 + ....... + am1 Xm  V

a11 Y1 + a12 Y2 + ....... + a1n Yn ≤ V

Ui (Si, S-i) ≥ Ui (Si, S-i*)