Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teoría de juegos
Estudia la interacción estratégica entre dos o más agentes, denominados jugadores, en el que sus decisiones
van a afectar de alguna manera la decisión de los otros. Su estudio busca la estrategia que maximice los
beneficios de los jugadores.
N° Jugadores
Probabilidades de
Pago de cada
ocurrencia de cada
acción o
acción de los
estrategia demás jugadores
Resultado del
juego
Acciones o
estrategias
posibles
Se supone que todos los jugadores actúan simultáneamente o, al menos, sin saber la
elección que toma el otro.
1 … n
aij es el pago que recibe el primer jugador si él opta por su estrategia i-ésima y el segundo
jugador por la j-ésima, y bij es el pago que recibe el segundo jugador si eligen ambos esas
mismas estrategias.
3
Juegos No Cooperativos
Son modelos en los que se parte de una especificación detallada de las condiciones en las que deciden los
jugadores (las reglas del juego) y el objetivo es analizar el comportamiento que cabe esperar por parte de
cada uno de ellos.
En este tipo de juego, los jugadores interactúan de manera competitiva, es decir, cada uno busca maximizar
sus propios beneficios.
4
Juegos No Cooperativos
Juegos de dos personas y suma Cero
Participan sólo dos adversarios o jugadores y son llamados de suma cero porque un jugador gana lo que el
otro pierde, de manera que la suma de sus ganancias netas es cero.
Si se representan los dos jugadores con A y B, con m y n estrategias, respectivamente, el juego se suele
representar con la matriz de recompensa siguiente:
La representación indica que si A usa la estrategia i y B usa la estrategia j, la recompensa para A es aij, y
entonces la recompensa para B es - aij.
El valor del juego es el Max(Min Fila). Si Max(Min Fila) = Min(Max Columna) hay Punto de Equilibrio (punto
de silla).
5
Juegos No Cooperativos
Juegos de dos personas y suma Cero
Ejemplo:
6
Juegos No Cooperativos
Juegos de dos personas y suma constante
En este caso, la suma de los pagos de los dos jugadores es una constante fija (positiva o
negativa) sin que importe qué combinación de estrategias se seleccione. Esto quiere decir, que
los dos jugadores pueden compartir alguna recompensa (si la constante es positiva) o algún
costo (si la constante es negativa) por participar en el juego. El valor del juego es diferente para
cada jugador.
Ejemplo:
Dos cadenas de TV están tratando de captar una audiencia de 100 mil tele-espectadores en el
horario 20:00 – 22:00. Para ello, publicitaran sus emisiones. Las posibles opciones y el número
de espectadores esperado está indicado en la tabla siguiente:
A1 = E1 : Película de Acción
A2 = E2 : Opera
A3 = E3 : Programa de Conversación
7
Juegos No Cooperativos
Juegos de dos personas y suma constante
Solución:
Existe punto de equilibrio que es igual a 45. El valor del juego para el jugador Fila es 45 y para
el jugador Columna es 100 – 45 = 55
8
Juegos No Cooperativos
Juegos de dos personas y suma no constante
Punto de Equilibrio:
Una elección de estrategia de cada jugador (prisionero) se llama punto de equilibrio si ninguno
de los jugadores puede beneficiarse de un cambio unilateral de estrategia.
Si los jugadores no se están cooperando (si ambos confiesan) ambos perderán mucho más que
si eligen una estrategia cooperadora. Si los jugadores están cooperando (si cada uno elige no
confesar) cada jugador puede ganar por delatar a su oponente (suponiendo que el otro no
cambia su estrategia).
9
Juegos No Cooperativos
Juegos de dos personas y suma no constante
Así, (-5;-5) es un punto de equilibrio porque si algún prisionero cambia su estrategia su retorno
disminuye de -5 a -20. Sin embargo, les conviene el punto (-1;-1) pero no es punto de
equilibrio porque es un punto inestable ya que si algún jugador decide cambiar su estrategia
puede aumentar su retorno desde -1 a 0.
10
Juegos No Cooperativos
Juegos de dos personas y suma Cero
Ejemplos de Formulación:
1. Un ejército está luchando por el control de dos lugares estratégicos. El ejército tiene dos
regimientos, y el enemigo tiene tres. Un ejército capturará un lugar si tiene más regimientos.
En cualquier otro caso, la batalla será un empate. Formule el problema como juego entre dos
personas con suma cero.
2. En un picnic, se forman equipos de dos personas para jugar al escondite. Hay cuatro
escondites (A, B, C y D) y los dos miembros del equipo que se esconde pueden hacerlo por
separado en dos lugares cualesquiera de los cuatro. El otro equipo tendrá oportunidad de
buscar en dos lugares cualesquiera. El equipo de búsqueda gana un punto si encuentra a los
dos miembros del equipo que se esconde. Si fallan los dos, pierden un punto. En cualquier otro
caso, el juego se empata. Formule el problema como un juego entre dos personas con suma
cero, y formúlelo como un problema de programación lineal.
11
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
Dominancia
Una estrategia es dominada por una segunda estrategia si esta última es siempre al menos tan buena (y
algunas veces mejor) como la primera, sin que importe lo que haga el oponente.
R1 y R3 dominadas por R2
Q3 dominada por Q2
Estrategias puras
Cuando no hay estrategias dominadas, se debe decidir a través del punto de silla o punto de
equilibrio (Equilibrio Nash).
La solución del juego se basa en el principio de asegurar lo mejor de lo peor para cada jugador
(criterio minimax (columnas) y maximin (filas)).
Ejemplo :
Las dos principales cadenas de televisión nacional (Caracol y RCN) deben seleccionar qué tipo
de programación colocar en su parrilla para el horario estelar. Cada una de ellas tiene tres
posibles opciones (Drama, Telenovela o Comedia). De acuerdo con las realizaciones de las
producciones anteriores se ha podido determinar el número de puntos porcentuales de
audiencia que ganaría la cadena Caracol con cada una de sus posibles estrategias, para las
estrategias tomadas por su competidor, tal como se muestra en la siguiente tabla:
13
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
Solución:
En este juego no hay estrategias dominadas, por lo que no es obvio qué deben hacer los
jugadores. Para el jugador 1 (filas) se determina el máximo de los mínimos de cada fila y para
el jugador 2 (columnas) se determina el valor mínimo de los máximos de cada columna.
Dado lo anterior, el jugador 1 debería seleccionar la estrategia 2, ya que con esa alternativa
garantiza una ganancia mínima de cero (0). Con cualquier otra alternativa su ganancia podría
ser menor. Y el jugador 2 debería seleccionar la estrategia 2, ya que con esa alternativa
garantiza una pérdida máxima de cero (0). Si escoge una alternativa diferente podría tener
pérdidas mayores.
En este caso decimos que el valor del juego es cero (0) y que ambos jugadores están utilizando
una solución de punto de silla.
14
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
Estrategias mixtas
Un juego en forma estratégica no siempre tiene un equilibrio de Nash (punto de silla), en el
cual cada jugador de forma determinística selecciona una de sus estrategias (estrategias
puras). Cuando un juego no tiene punto de silla, la teoría de juegos aconseja a cada jugador
asignar una distribución de probabilidad sobre su conjunto de estrategias.
Ejemplo:
Dos políticos contienden entre sí por la presidencia. En este momento elaboran sus planes
de campaña para los dos últimos días antes de las elecciones, ambos quieren emplearlos
para hacer campaña en dos ciudades importantes: Ciudad A y Ciudad B.
Para evitar pérdidas de tiempo, planean viajar en la noche y pasar un día completo en cada
ciudad o dos días en sólo una de ellas. Como deben hacer los arreglos necesarios por
adelantado, ninguno de los dos conocerá lo que su oponente tiene planeado hacer hasta
después de concretar sus propios planes.
15
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
La siguiente tabla representa la matriz de pagos, en número de votos ganados (en miles de
unidades), del político 1:
Solución:
E1: Pasar un día en cada ciudad.
E2: Pasar los dos días en la ciudad A.
E3: Pasar los dos días en la ciudad B.
16
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
El valor máximo (-2) y el valor mínimo (2) no coinciden, por lo que no hay punto de silla, y la
solución planteada (E1-Jugador 1 y E3-Jugador 2) es inestable, por lo que requiere disponer de
estrategias mixtas.
Sea:
donde pij es el pago que recibe el jugador 1 si este usa la estrategia pura i y el jugador 2 usa la
estrategia pura j.
17
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
La estrategia mixta del jugador 1 que es óptima, según este criterio, es la que proporciona
el máximo de los mínimos pagos esperados. Este es el valor maximin y se denota por .
La estrategia óptima del jugador 2 es la que proporciona el mínimo de las máximas
perdidas esperadas. Este es el valor minimax que se denota por .
18
Estrategias Mixtas
Procedimiento de solución gráfico
Es utilizado cuando uno de los jugadores tenga sólo dos estrategias puras (no dominadas).
Cuando son juegos más grandes, el método a utilizar es el de transformación del problema
en uno de programación lineal.
Ejemplo:
Considere el siguiente juego con estrategias mixtas tal que después de eliminar las
estrategias dominadas, uno de los jugadores tiene sólo dos estrategias puras. Considerando
al jugador 1, tendría sus estrategias mixtas a x1 y x2, donde x2= 1 – x1:
19
Estrategias Mixtas
Procedimiento de solución gráfico
Para cada estrategia pura de que dispone el jugador 2, el pago esperado del jugador 1 será:
m
E[ pago] v pij xi j
i 1
20
Estrategias Mixtas
Procedimiento de solución gráfico
El jugador 2 quiere minimizar su máxima pérdida y el jugador 1 maximizar su mínima ganancia, se debe
elegir el valor de x1 más alto de la envolvente inferior de la figura. Así el valor optimo de x1 se obtiene en
la intersección de las rectas (-3 + 5x1) y (4-6x1). Por lo que la estrategia mixta optima del jugador 1 es
(x1,x2)=(0.64,0.36) y el valor del juego es:
v 3 5(0.64) 0.18
21
Estrategias Mixtas
Procedimiento de solución gráfico
Como E[ pago] v , para encontrar la estrategia mixta óptima correspondiente del jugador 2, se reemplaza
el valor del juego obtenido en la ecuación general
m n
E[ pago] v pij xi y j
i 1 j 1
Entonces, para obtener y2* y y3* se seleccionan dos valores de x1 (como 0 y 1) y se resuelven las dos
ecuaciones simultáneas obtenidas:
4 y2 3 y3 0.18 - 2 y2 2 y3 0.18
22
Estrategias Mixtas
Programación lineal
La estrategia optima del jugador 1 puede determinarse resolviendo el siguiente problema maximin:
Maximizar z = v
Sujeto a:
23
Estrategias Mixtas
Programación lineal
La estrategia optima del jugador 2 puede determinarse resolviendo el siguiente problema minimax:
Minimizar w = v
Sujeto a:
Los dos problemas optimizan la misma variable v (irrestricta), el valor del juego. La razón, es que el problema
de 2 es el dual del problema de 1. Esto significa que la solución óptima de un problema da automáticamente
la solución optima del otro.
24
Estrategias Mixtas
Programación lineal
Ejemplo:
Solución:
Sujeto a
25
Estrategias Mixtas
Programación lineal
Sujeto a
26