Está en la página 1de 10

Taha (2012). “Teoría de Juegos” en: Investigación de Operaciones. México, D.F.

Pearson
Education; pp. 541 – 550. 15.4 Teoría de juegos 541

(a) Recomiende un curso de acción para Hank (basado en cada uno de los cuatro crite-
rios de decisión bajo incertidumbre).
(b) Suponga que a Hank le interesa más la calificación que obtendrá. Las calificaciones
aprobatorias que van de la A a la D, son 90, 80, 70 y 60, respectivamente. ¿Exigiría
esta actitud hacia las calificaciones un cambio del curso de acción de Hank?
2. Para la temporada de siembra venidera, Farmer McCoy puede sembrar maíz (a1), trigo
(a2), o soya (a3), o utilizar el terreno para pastoreo (a4). Las retribuciones asociadas con
las diferentes acciones dependen de la cantidad de lluvia: lluvia fuerte (s1), lluvia mode-
rada (s2), lluvia ligera (s3), o sequía (s4). La matriz de retribuciones (en miles de dólares)
se estima como
s1 s2 s3 s4

a1 -20 60 30 -5

a2 40 50 35 0

a3 -50 100 45 -10

a4 12 15 15 10

Desarrolle un curso de acción para Farmer McCoy basado en cada una de las cuatro de-
cisiones bajo criterios de incertidumbre.
3. Hay que seleccionar una de N máquinas para fabricar Q unidades de un producto espe-
cífico. Las demandas mínima y máxima del producto son Q* y Q**, respectivamente.
El costo de producción total de Q artículos con la máquina i implica un costo fijo Ki y
un costo variable por unidad ci, y está dado como
TCi = Ki + ciQ
(a) Idee una solución para el problema conforme a cada uno de los cuatro criterios de
decisión bajo incertidumbre.
(b) Con 1000 # Q # 4000 y el siguiente conjunto de datos, resuelva el problema:

Máquina i Ki ($) Ci ($)

1 100 5
2 40 12
3 150 3
4 90 8

15.4 TEORÍA DE JUEGOS


Esta teoría tiene que ver con situaciones de decisión en la que dos oponentes inteligen-
tes con objetivos conflictivos (en caso de suma cero) compiten intensamente para su-
perar al otro. Ejemplos típicos incluyen el lanzamiento de campañas publicitarias de
productos que compiten y estrategias de planeación de batallas en la guerra.
En un conflicto, cada uno de los dos jugadores (oponentes) tiene una cantidad
(finita o infinita) de alternativas o estrategias. Asociada con cada par de estrategias
está la retribución que un jugador recibe del otro. Tal situación se conoce como juego
de suma cero entre dos personas porque la ganancia de un jugador es igual a la pérdi-
da del otro. Esto significa que podemos representar el juego en función de la retribu-
ción que recibe un jugador. Designando los dos jugadores A y B con m y n estrategias,

www.FreeLibros.com
542 Capítulo 15 Análisis de decisiones y juegos

respectivamente, el juego se presenta usualmente en función de la matriz de retribu-


ciones que recibe el jugador A como
B1 B2 Á Bn

A1 a11 a12 Á a1m

A2 a21 a22 Á a2m

o o o o o

Am am1 am1 Á amn

La representación indica que si A utiliza la estrategia i y B utiliza la estrategia j, la re-


tribución para A es aij, y la retribución para B es 2aij.

Aplicación de la vida real. Ordenación de golfistas en el último día de juegos


por parejas de la copa Ryder
En el día final de un torneo de golf, dos equipos compiten por el campeonato. El ca-
pitán de cada equipo presenta una pizarra (una lista ordenada de los golfistas) que de-
termina las parejas. Para dos golfistas que ocupan el mismo orden en sus respectivas
pizarras, es plausible suponer que haya una probabilidad de 50-50 de que cualquiera de
ellos gane el juego. La probabilidad de ganar se incrementa para un golfista de más
alto orden cuando se enfrenta a uno de más bajo orden. El objetivo es desarrollar un
procedimiento analítico que apoye o refute la idea de utilizar pizarras. El caso 12, capí-
tulo 26, en el sitio web detalla el estudio basado en la teoría de juegos.

15.4.1 Solución óptima de juegos de suma cero entre dos personas


Debido a que los juegos de suma cero o constante implican un conflicto de intereses, la
base para la selección de estrategias óptimas garantiza que ninguno de los jugadores
intenta buscar una estrategia diferente porque el resultado será una retribución peor.
Estas soluciones pueden ser en la forma de una sola estrategia o varias estrategias
combinadas al azar.

Ejemplo 15.4-1
Dos compañías, A y B, venden dos marcas de un medicamento para la gripe. La compañía A se
anuncia en radio (A1), televisión (A2) y periódicos (A3). La compañía B, además de utilizar la
radio (B1), la televisión (B2) y los periódicos (B3), también envía folletos por correo (B4).
Dependiendo de la efectividad de cada campaña publicitaria, una compañía puede capturar una
parte del mercado de la otra. La siguiente matriz resume el porcentaje del mercado capturado o
perdido por la compañía A.
B1 B2 B3 B4 Fila mín

A1 8 -2 9 -3 -3
A2 6 5 6 8 5 ; Maximin
A3 -2 4 -9 5 -9

Columna máx 8 5 9 8
c
Minimax

www.FreeLibros.com
15.4 Teoría de juegos 543

La solución del juego se basa en el principio de asegurar lo mejor de lo peor para cada juga-
dor. Si la compañía A selecciona la estrategia A1, entonces, independientemente de lo que haga
B, lo peor que puede suceder es que A pierda 3% del segmento del mercado ante B. Esto se re-
presenta por medio del valor mínimo de las entradas en la fila 1. Asimismo, con la estrategia A2,
el peor resultado es que A capture 5% de B, y con la estrategia A3, el peor resultado es que A
pierda 9% ante B. Estos resultados aparecen bajo fila mín. Para lograr lo mejor de lo peor, la
compañía A elige la estrategia A2 porque corresponde a un valor maximin.
Luego, para la compañía B, la matriz de retribuciones dada es para A, la mejor de la peor solu-
ción de B está basada en el valor minimax. El resultado es que la compañía B elegirá la estrategia B2.
La solución óptima del juego exige seleccionar las estrategias A2 y B2, lo que significa que
ambas compañías deben utilizar la publicidad por televisión. La retribución favorecerá a la com-
pañía A porque su segmento del mercado se incrementará 5%. En este caso decimos que el valor
del juego es 5% y que A y B están utilizando una solución de punto de silla.
La solución de punto de silla impide seleccionar una mejor estrategia por parte de cual-
quiera de las compañías. Si B cambia de estrategia (B1, B3 o B4), la compañía A puede seguir con
la estrategia A2, lo que resultaría en una pérdida peor para B (6 u 8%). Por la misma razón, A no
buscaría una estrategia diferente porque B puede cambiar a B3 para obtener 9% de ganancia del
mercado si se utiliza A1, y 3% si se utiliza A3.

La solución de punto de silla óptima de un juego no tiene que ser una estrategia
pura. En su lugar, la solución puede requerir combinar dos o más estrategias al azar,
como lo ilustra el siguiente ejemplo.

Ejemplo 15.4-2
Dos jugadores, A y B, juegan a tirar la moneda. Cada jugador, sin saberlo el otro, escoge cara (H)
o cruz (T). Ambos jugadores revelan sus elecciones al mismo tiempo. Si coinciden (HH o TT), el
jugador A recibe $1 de B. De lo contrario, A le paga $1a B.
La siguiente matriz de retribuciones para el jugador A da los valores de fila mín y columna
máx correspondientes a las estrategias de A y B, respectivamente.

BH BT Fila mín

AH 1 -1 -1
AT -1 1 -1

Columna máx 1 1

Los valores maximin y minimax de los juegos son 2 $1 y $1, respectivamente, y el juego no
tiene una estrategia pura porque los dos valores no son iguales. Específicamente, si el jugador A
selecciona AH, el jugador B puede seleccionar BT para recibir $1 de A. Si esto sucede, A puede
cambiar a la estrategia AT para invertir el resultado al recibir $1 de B. La constante tentación
de cambiar de estrategia muestra que una solución de estrategia pura no es aceptable. Lo que se
requiere en este caso es que ambos jugadores combinen al azar sus estrategias puras respectivas.
El valor óptimo del juego ocurrirá entonces en alguna parte entre los valores maximin y mini-
max del juego; es decir,
valor maximin (menor) # valor del juego # valor minimax (mayor)
En el ejemplo de tirar la moneda, el valor del juego debe quedar entre 2 $1 y 1 $1 (vea el pro-
blema 5 del conjunto 15.4a).

www.FreeLibros.com
544 Capítulo 15 Análisis de decisiones y juegos

CONJUNTO DE PROBLEMAS 15.4A


1. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A. Cada
juego tiene una solución de estrategia pura. En cada caso, determine las estrategias que
definan el punto de silla y el valor del juego.
*(a) B1 B2 B3 B4 (b) B1 B2 B3 B4

A1 8 6 2 8 A1 4 -4 -5 6
A2 8 9 4 5 A2 -3 -4 -9 -2
A3 7 5 3 5 A3 6 7 -8 -9
A4 7 3 -9 5

2. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A.


Determine los valores de p y q que harán de (A2, B2) un punto de silla:
(a) B1 B2 B3 (b) B1 B2 B3

A1 1 q 6 A1 2 4 5

A2 p 5 10 A2 10 7 q

A3 6 2 3 A3 4 p 6

3. En los juegos (a) y (b) dados a continuación, la retribución es para el jugador A.


Especifique el intervalo del valor del juego en cada caso.
*(a) B1 B2 B3 B4 (b) B1 B2 B3 B4

A1 1 9 6 0 A1 -1 9 6 8
A2 2 3 8 4 A2 -2 10 4 6
A3 -5 -2 10 -3 A3 5 3 0 7
A4 7 4 -2 -5 A4 -2 8 4

(c) B1 B2 B3 (d) B1 B2 B3 B4

A1 3 6 1 A1 3 7 1 3

A2 5 2 3 A2 4 8 0 -6

A3 4 2 -5 A3 6 -9 -2 4

4. Dos compañías promueven dos productos competidores. En la actualidad, cada producto


controla 50% del mercado. Debido a mejoras recientes en los dos productos, cada compañía
planea lanzar una campaña publicitaria. Si ninguna de las dos compañías se anuncia, conti-
nuarán iguales las partes del mercado. Si alguna de las compañías lanza una campaña más
agresiva, la otra compañía con toda certeza perderá un porcentaje proporcional de sus clien-
tes. Un encuesta del mercado muestra que se puede llegar a 50% de los clientes potenciales
por medio de la televisión, a 30% por medio de periódicos, y a 20% por medio de la radio.
(a) Formule el problema como un juego de suma cero entre dos personas, y determine
el medio publicitario para cada compañía.
(b) Determine un intervalo para el valor del juego. ¿Puede operar cada compañía con
una estrategia pura única?

www.FreeLibros.com
15.4 Teoría de juegos 545

5. Si aij es el elemento (i, j)-ésimo de una matriz de retribuciones con m estrategias para el
jugador A y n estrategias para el jugador B, la retribución es para el jugador A.
Demuestre que
máx mín aij … mín máx aij
i j j i

15.4.2 Solución de juegos con estrategias combinadas


Los juegos con estrategias combinadas pueden resolverse por medio de métodos gráfi-
cos o programación lineal. La solución gráfica es adecuada para juegos con exactamen-
te dos estrategias puras de uno o ambos jugadores. Por otra parte, la PL (programación
lineal) puede resolver cualquier juego de suma cero entre dos personas. El método grá-
fico es interesante porque explica la idea de un punto de silla visualmente.
Solución gráfica de juegos. Comenzamos con el caso de (2 3 n) juegos en los cuales
el jugador A tiene dos estrategias, A1 y A2.

y1 y2 Á yn
x1: A1 B1 B2 Á Bn
1 - x1: A2 a11 a12 Á a1m
a21 a22 Á a2m

El jugador A combina las estrategias A1 y A2 con probabilidades x1 y 1 2 x1, 0 # x1


# 1. El jugador B combina las estrategias B1, B2,…, y Bn con probabilidades y1, y2,…, y
yn, yj $ 0 para j 5 1,2,…, n, y y1 1 y2 1 … 1 yn 5 1. En este caso, la retribución espe-
rada de A correspondiente a la estrategia pura j-ésima de B es
(a 1j - a2j)x1 + a2j, j = 1, 2, Á , n
El jugador A busca el valor de x1 que maximice las retribuciones mínimas esperadas, es
decir,
máx mín {(a1j - a2j)x1 + a2j }
xj j

Ejemplo 15.4-3
Considere el siguiente juego de 2 3 4. La retribución es para el jugador A.
B1 B2 B3 B4
A1 2 2 3 -1
A2 4 3 2 6

El juego no tiene ninguna solución de estrategia pura porque los valores maximin y
minimax no son iguales (¡compruébelo!). Las retribuciones esperadas de A correspon-
dientes a las estrategas puras de B se dan como

Estrategia pura de B Retribución esperada de A

1 -2x1 + 4
2 -x1 + 3
3 x1 + 2
4 -7x1 + 6

www.FreeLibros.com
546 Capítulo 15 Análisis de decisiones y juegos

FIGURA 15.7
Solución gráfica del juego de suma cero entre dos personas del ejemplo 15.4-3 obtenida con TORA
(archivo toraEx15.4-3.txt)

La figura 15.7 muestra una gráfica creada por TORA de las cuatro líneas rectas asociadas
con las estrategias puras de B (archivo toraExl5.4-3.txt).3 Para determinar la mejor de la peor so-
lución, la envolvente inferior de las cuatro líneas (delineada por franjas verticales) representa la
retribución mínima (peor) esperada para A, independientemente de las elecciones de B. El má-
ximo (mejor) de la envolvente inferior corresponde al punto de solución maximin x*1 = 0.5. Este
punto es la intersección de las líneas asociadas con las estrategias B3 y B4. La solución óptima del
jugador A demanda una combinación 50-50 de A1 y A2. El valor correspondiente del juego, v, se
determina sustituyendo x1 5 0.5 en la función o bien de la línea 3, o de la línea 4, lo cual da
1
+ 2 = 25, desde la línea 3
v = e 1
2
- 7(2) + 6 = 25, desde la línea 4
La combinación óptima del jugador B se determina por medio de las dos estrategias que de-
finen la envolvente inferior de la gráfica. Esto significa que B puede combinar las estrategias B3
y B4 en cuyo caso y1 5 y2 5 0 y y4 5 1 2 y3. En consecuencia, las retribuciones esperadas de B
correspondientes a estrategias puras de A son

3
Del menú Main , seleccione la opción Zero-sum Games e ingrese los datos del problema, luego seleccione
la opción Graphical en el menú desplegable SOLVE/MODIFY .

www.FreeLibros.com
15.4 Teoría de juegos 547

Estrategia pura de A Retribuciones esperadas de B

1 4y3 - 1
2 -4y3 + 6

La mejor de la peor solución para B es el punto mínimo de la envolvente superior de las dos
líneas dadas (será instructivo que trace las dos líneas e identifique la envolvente superior). Este
proceso equivale a resolver la ecuación

4y3 - 1 = - 4y3 + 6

La solución da y3 = 78, la cual da el valor del juego como v = 4 * ( 87 ) - 1 = 52 .


La solución del juego exige que el jugador combine A1 y A2 con probabilidades iguales, y
que el jugador B combine B3 y B4 con probabilidades 78 y 18. (En realidad, el juego tiene solucio-
nes alternativas para B, porque el punto máximo en la figura 15.7 está determinado por más de
dos líneas. Cualquier combinación no negativa de estas soluciones alternativas también es una
solución legítima.)

Comentarios. Los juegos en que el jugador A tiene m estrategias y el jugador B sólo


tiene dos, pueden tratarse del mismo modo. La diferencia principal es que
graficaremos la retribución esperada de B correspondiente a estrategias puras de A.
Por consiguiente, buscaremos el punto minimax en lugar del punto maximin de la
envolvente superior de las líneas trazadas. Sin embargo, para resolver el problema con
TORA, es necesario expresar la retribución en función del jugador que tiene dos
estrategias, multiplicándola por 2 1.

CONJUNTO DE PROBLEMAS 15.4B4


*1. Resuelva gráficamente el juego de tirar la moneda del ejemplo 15.4-2.
*2. Robin viaja entre dos ciudades y puede utilizar dos rutas. La ruta A es una carretera rápi-
da de cuatro carriles, y la ruta B es una larga carretera sinuosa. Robin maneja “superrá-
pido”. La patrulla de caminos cuenta con una fuerza policial limitada. Si se asignara toda
la fuerza a la ruta por la que maneja Robin, con toda certeza recibiría una multa de $100
por exceso de velocidad. Si la fuerza se reparte 50-50 entre las dos rutas, hay 50% de pro-
babilidades de que reciba una multa de $100 en la ruta A, y sólo 30% de que reciba la
misma multa en la ruta B. Desarrolle una estrategia tanto para Robin como para la pa-
trulla de caminos.
3. Resuelva gráficamente los siguientes juegos. La retribución es para el jugador A.
(a) B1 B2 B3 (b) B1 B2

A1 1 -3 7 A1 5 8

A2 2 4 -6 A2 6 5

A3 5 7

4
Puede usar el módulo Zero-sum games de TORA para verificar su respuesta.

www.FreeLibros.com
548 Capítulo 15 Análisis de decisiones y juegos

4. Considere el siguiente juego de suma cero entre dos personas:

B1 B2 B3

A1 5 50 50

A2 1 1 .1

A3 10 1 10

(a) Compruebe que las estrategias 1 61, 0, 56 2 para A y 1 49 5


54 , 54 , 02 para B son óptimas, y
determine el valor del juego.
(b) Demuestre que el valor óptimo del juego es igual a
3 3

a a aijxiyj
i=1 j=1

Solución de juegos por medio de programación lineal. La teoría de juegos está


estrechamente relacionada con la PL en el sentido de que cualquier juego de suma
cero entre dos personas puede expresarse como un programa lineal, y viceversa. De
hecho, G. Dantzig (1963, pág. 24) expresa que cuando J. von Neumann, padre de la
teoría de juegos, la introdujo por primera vez al método simplex en 1947, de inmediato
reconoció esta relación y además precisó y recalcó el concepto de dualidad en la
programación lineal. Esta sección explica cómo se resuelven los juegos mediante PL.
Las probabilidades óptimas del jugador A, x1, x2,…, y xm, pueden determinarse
resolviendo el siguiente problema maximin:

máx c mína a ai1xi, a ai2xi, Á , a ainxi b s


m m m

xi i=l i=1 i=1

x1 + x2 + Á + xm = 1
xi Ú 0, i = 1, 2, Á , m
Sea
m m m
v = mín e a ai1xi, a ai2xi, Á , a ainxi f
i=1 i=1 i=1

La ecuación implica que


m

a aijxi Ú v, j = 1, 2, Á , n
i=1

El problema del jugador A puede escribirse por lo tanto como

Maximizar z = v

www.FreeLibros.com
15.4 Teoría de juegos 549

sujeto a
m
v - a aijxi … 0, j = 1, 2, Á , n
i=1
x1 + x2 + Á + xm = 1
xi Ú 0, i = 1, 2, Á , m
v irrestricta
Observe que el valor del juego, v, no está restringido en cuanto a signo.
Las estrategias óptimas del jugador B y1, y2,…, y yn, se determinan resolviendo el
problema

mín c máx a a a1jyj, a a2jyj, Á , a amjyj b s


n n n

yj j=1 j=1 j=1

y1 + y2 + Á + yn = 1
yj Ú 0, j = 1, 2, Á , n
Utilizando un procedimiento similar al del jugador A, el problema de B se reduce a

Minimizar w = v

sujeto a
n
v - a aijyj Ú 0, i = 1, 2, Á , m
j=1

y1 + y2 + Á + yn = 1
yj Ú 0, j = 1, 2, Á , n
v irrestricta
Los dos problemas optimizan la misma variable v (irrestricta), el valor del juego.
La razón es que el problema de B es el dual del problema de A (verifique esta afirma-
ción por medio de la definición de dualidad del capítulo 4). Esto significa que la solución
óptima de un problema da automáticamente la solución óptima del otro.

Ejemplo 15.4-4
Resuelva el siguiente juego mediante programación lineal. El valor del juego, v, queda entre
2 2 y 2.

B1 B2 B3 Fila mín

A1 3 -1 -3 -3
A2 -2 4 -1 -2
A3 -5 -6 2 -6

Columna máx 3 4 2

www.FreeLibros.com
550 Capítulo 15 Análisis de decisiones y juegos

Programa lineal del jugador A


Maximizar z = v
sujeto a
v - 3x1 + 2x2 + 5x3 … 0
v + x1 - 4x2 + 6x3 … 0
v + 3x1 + x2 - 2x2 … 0
x1 + x2 + x3 = 1
x 1, x 2, x 3 Ú 0
v irrestricta
La solución óptima5 es x1 5 0.39, x2 5 0.31, x3 5 0.29, y v 5 2 0.91

Programa lineal del jugador B


Minimizar z = v
sujeto a
v - 3y1 + y2 + 3y3 Ú 0
v + 2y1 - 4y2 + y3 Ú 0
v + 5y1 + 6y2 - 2y3 Ú 0
y1 + y2 + y3 = 1
v irrestricta
La solución da y1 5 .32, y2 5.08, y3 5 .60, y v 5 20.91.

CONJUNTO DE PROBLEMAS 15.4C


1. En un paseo campestre, 2 equipos de dos personas juegan a las escondidas. Hay cuatro
escondites (A,B,C y D) y los dos miembros del equipo que se esconden pueden hacerlo
por separado en dos de los cuatro escondites. El otro equipo puede entonces buscar en
los otros dos escondites restantes. El equipo que busca obtiene un punto si encuentra
a los dos miembros del equipo que se esconde; si no encuentra a los dos pierde un punto.
De lo contrario, el resultado es un empate.
*(a) Desarrolle el problema como un juego de suma cero entre dos personas.
(b) Determine la estrategia óptima y el valor del juego.
2. La U de A y la U de D están ideando sus estrategias para el juego de básquetbol colegial
varonil del campeonato de 1994. Valorando las fuerzas de sus respectivas “bancas”, cada
entrenador aparece con cuatro estrategias para rotar a los jugadores durante el encuen-
tro. La habilidad de cada equipo de encestar canastas de 2 puntos, 3 puntos y tiros libres
es la clave para determinar el marcador final del juego. La siguiente tabla resume los
puntos netos que la U de A anotará por posesión como una función de las diferentes es-
trategias disponibles para cada equipo:

5
Puede usarse la opción Zero-sum Games Q Solve Q LP-based de TORA para resolver cualquier juego
de suma cero entre dos personas.

www.FreeLibros.com

También podría gustarte