Teoria de Juegos

1
Teoría de juegos
Estudia la interacción estratégica entre dos o más agentes, denominados jugadores, en el que sus decisiones
van a afectar de alguna manera la decisión de los otros. Su estudio busca la estrategia que maximice los
beneficios de los jugadores.
N° Jugadores
Probabilidades de
Pago de cada
ocurrencia de cada
acción o
acción de los
estrategia demás jugadores
Resultado del
juego
Acciones o
estrategias
posibles
Ambos jugadores son racionales.

Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar.
2
Teoría de juegos
Representación
Forma normal o estratégica:

La representación en forma normal de un juego se realiza utilizando una matriz en la que
se representan las estrategias (puras) de cada jugador y los resultados (pagos) a los que se
llega en cada posible combinación de estrategias.
Se supone que todos los jugadores actúan simultáneamente o, al menos, sin saber la
elección que toma el otro.
1 … n
aij es el pago que recibe el primer jugador si él opta por su estrategia i-ésima y el segundo
jugador por la j-ésima, y bij es el pago que recibe el segundo jugador si eligen ambos esas
mismas estrategias.
3
Juegos No Cooperativos
Son modelos en los que se parte de una especificación detallada de las condiciones en las que deciden los
jugadores (las reglas del juego) y el objetivo es analizar el comportamiento que cabe esperar por parte de
cada uno de ellos.
En este tipo de juego, los jugadores interactúan de manera competitiva, es decir, cada uno busca maximizar
sus propios beneficios.
Juegos de Suma Juegos de Suma No

Constante Constante
Juegos de Suma Cero

La teoría de los juegos no cooperativos se centra más en el procedimiento (en como deciden los jugadores).
4
Juegos de dos personas y suma Cero
Participan sólo dos adversarios o jugadores y son llamados de suma cero porque un jugador gana lo que el
otro pierde, de manera que la suma de sus ganancias netas es cero.
Si se representan los dos jugadores con A y B, con m y n estrategias, respectivamente, el juego se suele
representar con la matriz de recompensa siguiente:
La representación indica que si A usa la estrategia i y B usa la estrategia j, la recompensa para A es aij, y
entonces la recompensa para B es - aij.
El valor del juego es el Max(Min Fila). Si Max(Min Fila) = Min(Max Columna) hay Punto de Equilibrio (punto
de silla).
5
Ejemplo:
Dos compañías, Q y R, venden dos marcas de medicamento para la gripe. La compañía Q se

anuncia en radio (Q1), televisión (Q2) y periódicos (Q3). La compañía R además de utilizar la
radio (R1), la televisión (R2) y los periódicos (R3), también envía folletos por correo (R4).
Dependiendo de la efectividad de cada campaña publicitaria, una compañía puede capturar
una parte del mercado de la otra. La siguiente matriz resume el porcentaje del mercado
capturado o perdido por la compañía Q:
El valor del juego para ambos jugadores es de 5, y existe punto de equilibrio.
6
Juegos de dos personas y suma constante
En este caso, la suma de los pagos de los dos jugadores es una constante fija (positiva o
negativa) sin que importe qué combinación de estrategias se seleccione. Esto quiere decir, que
los dos jugadores pueden compartir alguna recompensa (si la constante es positiva) o algún
costo (si la constante es negativa) por participar en el juego. El valor del juego es diferente para
cada jugador.
Ejemplo:
Dos cadenas de TV están tratando de captar una audiencia de 100 mil tele-espectadores en el
horario 20:00 – 22:00. Para ello, publicitaran sus emisiones. Las posibles opciones y el número
de espectadores esperado está indicado en la tabla siguiente:
A1 = E1 : Película de Acción
A2 = E2 : Opera
A3 = E3 : Programa de Conversación
7
Juegos de dos personas y suma constante
Solución:
Existe punto de equilibrio que es igual a 45. El valor del juego para el jugador Fila es 45 y para
el jugador Columna es 100 – 45 = 55
8
Juegos de dos personas y suma no constante
Muchos modelos de juegos de dos personas no corresponden a juegos de suma constante,

debido a que es poco usual que los competidores (jugadores) están en un conflicto total.
Punto de Equilibrio:
Una elección de estrategia de cada jugador (prisionero) se llama punto de equilibrio si ninguno
de los jugadores puede beneficiarse de un cambio unilateral de estrategia.
Dilema del prisionero
Si los jugadores no se están cooperando (si ambos confiesan) ambos perderán mucho más que
si eligen una estrategia cooperadora. Si los jugadores están cooperando (si cada uno elige no
confesar) cada jugador puede ganar por delatar a su oponente (suponiendo que el otro no
cambia su estrategia).
9
Juegos de dos personas y suma no constante
Dilema del prisionero
Así, (-5;-5) es un punto de equilibrio porque si algún prisionero cambia su estrategia su retorno
disminuye de -5 a -20. Sin embargo, les conviene el punto (-1;-1) pero no es punto de
equilibrio porque es un punto inestable ya que si algún jugador decide cambiar su estrategia
puede aumentar su retorno desde -1 a 0.
10
Ejemplos de Formulación:
1. Un ejército está luchando por el control de dos lugares estratégicos. El ejército tiene dos
regimientos, y el enemigo tiene tres. Un ejército capturará un lugar si tiene más regimientos.
En cualquier otro caso, la batalla será un empate. Formule el problema como juego entre dos
personas con suma cero.
2. En un picnic, se forman equipos de dos personas para jugar al escondite. Hay cuatro
escondites (A, B, C y D) y los dos miembros del equipo que se esconde pueden hacerlo por
separado en dos lugares cualesquiera de los cuatro. El otro equipo tendrá oportunidad de
buscar en dos lugares cualesquiera. El equipo de búsqueda gana un punto si encuentra a los
dos miembros del equipo que se esconde. Si fallan los dos, pierden un punto. En cualquier otro
caso, el juego se empata. Formule el problema como un juego entre dos personas con suma
cero, y formúlelo como un problema de programación lineal.
11
Estrategias de solución
¿qué estrategia debe elegir cada jugador?
Dominancia
Una estrategia es dominada por una segunda estrategia si esta última es siempre al menos tan buena (y
algunas veces mejor) como la primera, sin que importe lo que haga el oponente.
R1 y R3 dominadas por R2
Q3 dominada por Q2
Q1 dominada por Q2 R4 dominada por R2

La estrategia óptima para la compañía Q es Q2 y para la compañía R es R2, que representa una ganancia de
5 por ciento del mercado para la compañía Q y una pérdida equivalente para la compañía R.
12
Estrategias puras
Cuando no hay estrategias dominadas, se debe decidir a través del punto de silla o punto de
equilibrio (Equilibrio Nash).
La solución del juego se basa en el principio de asegurar lo mejor de lo peor para cada jugador
(criterio minimax (columnas) y maximin (filas)).
Ejemplo :
Las dos principales cadenas de televisión nacional (Caracol y RCN) deben seleccionar qué tipo
de programación colocar en su parrilla para el horario estelar. Cada una de ellas tiene tres
posibles opciones (Drama, Telenovela o Comedia). De acuerdo con las realizaciones de las
producciones anteriores se ha podido determinar el número de puntos porcentuales de
audiencia que ganaría la cadena Caracol con cada una de sus posibles estrategias, para las
estrategias tomadas por su competidor, tal como se muestra en la siguiente tabla:
13
Solución:
En este juego no hay estrategias dominadas, por lo que no es obvio qué deben hacer los
jugadores. Para el jugador 1 (filas) se determina el máximo de los mínimos de cada fila y para
el jugador 2 (columnas) se determina el valor mínimo de los máximos de cada columna.
Dado lo anterior, el jugador 1 debería seleccionar la estrategia 2, ya que con esa alternativa
garantiza una ganancia mínima de cero (0). Con cualquier otra alternativa su ganancia podría
ser menor. Y el jugador 2 debería seleccionar la estrategia 2, ya que con esa alternativa
garantiza una pérdida máxima de cero (0). Si escoge una alternativa diferente podría tener
pérdidas mayores.
En este caso decimos que el valor del juego es cero (0) y que ambos jugadores están utilizando
una solución de punto de silla.
14
Estrategias mixtas
Un juego en forma estratégica no siempre tiene un equilibrio de Nash (punto de silla), en el
cual cada jugador de forma determinística selecciona una de sus estrategias (estrategias
puras). Cuando un juego no tiene punto de silla, la teoría de juegos aconseja a cada jugador
asignar una distribución de probabilidad sobre su conjunto de estrategias.
Una estrategia mixta es una distribución de probabilidad sobre el conjunto de estrategias

puras.
Ejemplo:
Dos políticos contienden entre sí por la presidencia. En este momento elaboran sus planes
de campaña para los dos últimos días antes de las elecciones, ambos quieren emplearlos
para hacer campaña en dos ciudades importantes: Ciudad A y Ciudad B.
Para evitar pérdidas de tiempo, planean viajar en la noche y pasar un día completo en cada
ciudad o dos días en sólo una de ellas. Como deben hacer los arreglos necesarios por
adelantado, ninguno de los dos conocerá lo que su oponente tiene planeado hacer hasta
después de concretar sus propios planes.
15
La siguiente tabla representa la matriz de pagos, en número de votos ganados (en miles de
unidades), del político 1:
Solución:
E1: Pasar un día en cada ciudad.
E2: Pasar los dos días en la ciudad A.
E3: Pasar los dos días en la ciudad B.
Si se aplica el criterio minimax y maximin:
16
El valor máximo (-2) y el valor mínimo (2) no coinciden, por lo que no hay punto de silla, y la
solución planteada (E1-Jugador 1 y E3-Jugador 2) es inestable, por lo que requiere disponer de
estrategias mixtas.
Sea:
xi = probabilidad de que el jugador 1 use la estrategia i (i = 1; 2; : : : ;m)

yj = probabilidad de que el jugador 2 use la estrategia j (j = 1; 2; : : : ; n)
donde m y n son los números respectivos de estrategias disponibles.
Para evaluar el desempeño de una estrategia mixta se usa el pago esperado:

m n
E[ pago]  v   pij xi y j
i 1 j 1
donde pij es el pago que recibe el jugador 1 si este usa la estrategia pura i y el jugador 2 usa la
estrategia pura j.
17
La estrategia mixta del jugador 1 que es óptima, según este criterio, es la que proporciona
el máximo de los mínimos pagos esperados. Este es el valor maximin y se denota por .
La estrategia óptima del jugador 2 es la que proporciona el mínimo de las máximas
perdidas esperadas. Este es el valor minimax que se denota por .
Teorema minimax: Si se permiten estrategias mixtas, el par de estrategias que es optimo de

acuerdo con el criterio minimax proporciona una solución estable con , (que es
el valor del juego), de manera que ninguno de los dos jugadores puede mejorar si cambia de
manera unilateral su estrategia.
18
Estrategias Mixtas
Procedimiento de solución gráfico
Es utilizado cuando uno de los jugadores tenga sólo dos estrategias puras (no dominadas).
Cuando son juegos más grandes, el método a utilizar es el de transformación del problema
en uno de programación lineal.
Ejemplo:
Considere el siguiente juego con estrategias mixtas tal que después de eliminar las
estrategias dominadas, uno de los jugadores tiene sólo dos estrategias puras. Considerando
al jugador 1, tendría sus estrategias mixtas a x1 y x2, donde x2= 1 – x1:
19
Estrategias Mixtas
Para cada estrategia pura de que dispone el jugador 2, el pago esperado del jugador 1 será:
m
E[ pago]  v   pij xi j
i 1
Si el Jugador 2 juega: El pago esperado del Jugador 1 es:

y1 0x1 + 5(1-x1) = 5-5x1
Y2 -2x1 + 4(1-x1) = 4-6x1
Y3 2x1-3(1-x1) =-3 + 5x1
A continuación se grafican estas rectas.
20
Estrategias Mixtas
El jugador 2 quiere minimizar su máxima pérdida y el jugador 1 maximizar su mínima ganancia, se debe
elegir el valor de x1 más alto de la envolvente inferior de la figura. Así el valor optimo de x1 se obtiene en
la intersección de las rectas (-3 + 5x1) y (4-6x1). Por lo que la estrategia mixta optima del jugador 1 es
(x1,x2)=(0.64,0.36) y el valor del juego es:
v  3  5(0.64)  0.18
21
Estrategias Mixtas
Como E[ pago]  v , para encontrar la estrategia mixta óptima correspondiente del jugador 2, se reemplaza
el valor del juego obtenido en la ecuación general
m n
E[ pago]  v   pij xi y j
i 1 j 1
(4  6 x1 ) y2  (3  5x1 ) y3  v  0.18
Entonces, para obtener y2* y y3* se seleccionan dos valores de x1 (como 0 y 1) y se resuelven las dos
ecuaciones simultáneas obtenidas:
4 y2  3 y3  0.18 - 2 y2  2 y3  0.18
Así, la estrategia mixta optima del jugador 2 es (y2, y3)=(0.45,0.54) .
22
Estrategias Mixtas
Programación lineal
La estrategia optima del jugador 1 puede determinarse resolviendo el siguiente problema maximin:
Maximizar z = v
Sujeto a:
El valor del juego, v, no esta restringido en cuanto a signo.
23
Estrategias Mixtas
La estrategia optima del jugador 2 puede determinarse resolviendo el siguiente problema minimax:
Minimizar w = v
Sujeto a:
Los dos problemas optimizan la misma variable v (irrestricta), el valor del juego. La razón, es que el problema
de 2 es el dual del problema de 1. Esto significa que la solución óptima de un problema da automáticamente
la solución optima del otro.
24
Estrategias Mixtas
Ejemplo:
Solución:
Programa lineal del jugador A es:
Sujeto a
La solución óptima es:
25
Estrategias Mixtas
Programa lineal del jugador B es:
Sujeto a
La solución óptima es:
26

Teoria de Juegos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoria de Juegos

Cargado por

Copyright:

Formatos disponibles

1

Ambos jugadores son racionales.

Forma normal o estratégica:

Juegos de Suma Juegos de Suma No

Juegos de Suma Cero

Dos compañías, Q y R, venden dos marcas de medicamento para la gripe. La compañía Q se

El valor del juego para ambos jugadores es de 5, y existe punto de equilibrio.

Muchos modelos de juegos de dos personas no corresponden a juegos de suma constante,

Dilema del prisionero

Dilema del prisionero

Q1 dominada por Q2 R4 dominada por R2

Una estrategia mixta es una distribución de probabilidad sobre el conjunto de estrategias

Si se aplica el criterio minimax y maximin:

xi = probabilidad de que el jugador 1 use la estrategia i (i = 1; 2; : : : ;m)

donde m y n son los números respectivos de estrategias disponibles.

Para evaluar el desempeño de una estrategia mixta se usa el pago esperado:

Teorema minimax: Si se permiten estrategias mixtas, el par de estrategias que es optimo de

Si el Jugador 2 juega: El pago esperado del Jugador 1 es:

A continuación se grafican estas rectas.

(4  6 x1 ) y2  (3  5x1 ) y3  v  0.18

Así, la estrategia mixta optima del jugador 2 es (y2, y3)=(0.45,0.54) .

El valor del juego, v, no esta restringido en cuanto a signo.

Programa lineal del jugador A es:

La solución óptima es:

Programa lineal del jugador B es:

La solución óptima es:

También podría gustarte