Está en la página 1de 36

Prof. Ing. Claudio L. R.

Sturla

REPBLICA ARGENTINA

FRBA TEORA DE
JUEGOS
Puede reproducirse libremente. Se agradecer citar la fuente.
THE RECORDING, COPYING, LOAN, UNAUTHORIZED HIRE, PUBLIC SHOWING OR
BROADCAST OF THIS DATAGRAM IS STRONGLY ENCOURAGED.

Claudio L. R. Sturla
Bibliografa:
Buffa, Elwood S. y Taubert, William H., Sistemas de Produccin e Inventario, Planeacin y
Control, Editorial Limusa, Mxico, 1.978.
Dorfman, R., Samuelson, P. A., y Solow, R. M., Programacin Lineal y Anlisis Econmico, Aguilar.
Dresdner, Mario O., Evelson, Abel R. y Dredner, Eduardo C., Tcnicas Cuantitativas Aplicadas a
las Decisiones en la Economa de Empresas, Editorial El Coloquio, Buenos Aires.
Gass, Saul, Programacin Lineal ,Mtodos y Aplicaciones, CECSA, Mxico, 1.985, ISBN
968-26-0057-X.
Heims, Steve J., Von Newmann y N. Wiener, 2 tomos, Biblioteca Salvat de Grandes Biografas,
Salvat Editores, S. A., Barcelona, 1.986.
Mc Kinsey, J. C. C., Introduccin a la Teora Matemtica de los Juegos, Aguilar.
Shubik, Martin, Game Theory in the Social Sciencies, Concepts and Solution, The MIT Press,
Massachusetts, EE.UU., ISBN 0-262-69091-8. (Hay traduccin castellana bajo el ttulo de Teora de
los juegos en las Ciencias Sociales, Fondo de Cultura Econmica).

A su vez:

Enfrentamiento con oponentes no racionales.

Problemas de decisin
Enfrentamiento con oponentes racionales.

Certidumbre.

Enfrentamiento con oponentes no racionales Riesgo.


Incertidumbre.

Certidumbre: Un nico futuro posible cuya probabilidad es p = 1 (Simplex).


Riesgo: Varios futuros posibles con probabilidades p j CONOCIDAS (Stocks).
Incertidumbre: Varios futuros posibles con probabilidades p j DESCONOCIDAS.
Teora de
Enfrentamiento con oponentes racionales
juegos.
juegos.doc

66

Prof. Ing. Claudio L. R. Sturla


Se denominan situaciones de CONFLICTO a aquellas en las cuales chocan los intereses de dos (o ms)
partes que persiguen objetivos distintos (y a veces opuestos).
Para hacer posible un anlisis del conflicto se construye su modelo matemtico.
Un ejemplo de situacin de conflicto es mostrada por [Buffa et al].
"Las alternativas que se le presentan a un ejecutivo que trata de adaptarse a las fluctuaciones de la
demanda son las siguiente: 1)ajustar el tamao de la fuerza de trabajo, contratando y despidiendo
personas, en respuesta a las fluctuaciones; 2) ajustar la tasa de produccin trabajando ms o menos
que el tiempo normal con la misma fuerza de trabajo; 3) absorber las fluctuaciones mediante las
fluctuaciones de los inventarios, del nmero de pedidos pendientes y mediante la prdida de algunas
ventas; 4) aumentar o disminuir la cantidad total de subcontrataciones, para absorber las
fluctuaciones de la demanda; 5) variar la asignacin de los recursos, en funcin del mercado, para
atenuar las fluctuaciones de la demanda; y 6) combinar las 5 estrategias puras."

Definiremos juego como el conjunto de reglas establecidas para resolver situaciones


de conflicto (incluye las reglas de terminacin)
El problema principal es: "Si n jugadores P1 , P2 , Pn juegan un juego , cmo debe jugar
el i-simo jugador para conseguir los resultados ms favorables?
Partida:
una realizacin posible particular de las reglas del juego.
Al final de cada partida de cada jugador Pi recibe un pago vi llamado pago al jugador Pi . Cada
jugador tratar entonces de maximizar vi . Por ejemplo en el pker el total de dinero ganado por los
ganadores es igual al total de dinero perdido por los perdedores. En ese caso tenemos
v1 + v2 + + vn = 0
Si vi 0 ganancia.
Si vi 0 prdida.
Si vi = 0 no hay pago.
Los juegos donde la suma algebraica de pagos es cero se llaman juegos de suma cero.
Ejemplo de juegos de suma no cero son el PRODE, la quiniela y en general todos los juegos organizados por el estado.
Hay juegos finitos: se los denomina as porque el nmero de movimientos es finito: por ejemplo el
ajedrez.
Un fabricante de jabn en panes quiere saber qu cantidad debe envasar para venderlo a 5 UM la pieza.
Su objetivo es hacer el pan de la cantidad suficiente de manera de competir favorablemente con los
dems fabricantes pero sin que resulte excesiva (para evitar prdidas). Y como hay infinitos pesos
posibles para el pan de jabn (o, al menos, un nmero tan grande que es conveniente considerarlo como
infinito) la situacin equivale a la de un juego en el que los jugadores hacen sus elecciones de entre un
conjunto infinito de alternativas.
De all que convenga extender nuestra nocin de juego de tal manera que incluya tambin a los juegos
infinitos. Otro ejemplo de juego infinito es un duelo.
Un juego jugado por parejas como se estila en los juegos de naipes es un juego cooperativo. El ajedrez
es no cooperativo.
Nos interesamos en los juegos de dos personas, de suma cero y no cooperativos. Adems finitos.
Como ejemplo tomaremos el juego de los disparejos.
El primer jugador, P1 , elige ya sea "guila" o "sol" y el segundo jugador elige "guila" o "sol" sin conocer la eleccin del jugador P2 . Despus de hacerse esto (es una partida) se comparan las elecciones.

juegos.doc

67

Prof. Ing. Claudio L. R. Sturla


Si P2 coincide con P1 paga una unidad a P1 . Si no coinciden le paga -1. -1 significa que P1 le paga una
unidad a P2 . Los pagos se estn expresando en trminos de P1 . En este caso P1 es el jugador
maximizante. El otro es el minimizante. Siempre usaremos esta convencin.
El enunciado puede resumirse en el siguiente diagrama:
Selecciones de P2
guila
Sol
Selecciones de P1
1
-1
guila
-1
1
Sol
El problema se puede resumir an ms por medio de la matriz:
1 1

1 1
P1 selecciona filas y P2 columnas. La interseccin de la fila y la columna seleccionadas da el valor de lo
pagado a P1 .
Supongamos que yo soy P1 y juego con frecuencia 0,5 a cada fila. Mi probabilidad de ganar (esperanza
matemtica de la ganancia), si P2 juega a guila es:
1

1
1
+ ( 1) = 0
2
2

Si P2 selecciona Sol es:

( 1)

1
1
+1 = 0
2
2

Se llega al mismo resultado cualquiera sea la eleccin de P2 .


De este modo (frecuencias de 0,5 a cada fila) P1 se asegura de no exponerse a perder, CUALQUIERA
sea la eleccin de P2 .
Esta es la NICA forma que tiene P1 de jugar sin correr el riesgo de perder si P2 descubre lo que va a
hacer.
Si P1 juega a guila con probabilidad x y Sol con probabilidad (1-x), si P2 juega guila, la esperanza
matemtica de la ganancia estar dada por:
E ( x1 , x 2 , y1 ) = 1 x + ( 1 x )( 1) = x 1 + x = 2 x 1
Si P1 juega a guila con probabilidad x y Sol con probabilidad (1-x), si P2 juega Sol, la esperanza
matemtica de la ganancia de P1 est dada por:
E ( x1 , x 2 , y 2 ) = ( 1) x + ( 1 x ) 1 = x + 1 x = 1 2 x
Si x

1
por ejemplo 0,7
2
E ( x1 , x 2 , y1 ) = 2 0,7 1 = 0,4 ; E ( x1 , x 2 , y 2 ) = 1 2 0,7 = 0,4

Si x

1
, por ejemplo 0,2
2

juegos.doc

68

Prof. Ing. Claudio L. R. Sturla


E ( x1 , x 2 , y1 ) = 2 x 1 = 2 0,2 1 = 0,6 ; E ( x1 , x 2 , y 2 ) = 1 2 x = 1 2 0,2 = 0,6
Por lo tanto, si P1 no quiere exponerse a prdidas debe jugar con una frecuencia relativa de 0,5 a cada
una de las filas. Lo mismo debe hacer P2 .
Intuitivamente se ve que hay una eleccin de selecciones mejor que las otras.
Veamos otro ejemplo. Considrese la siguiente matriz de pago:
1 3

4 2
La esperanza matemtica de la ganancia de P1 es:
E ( x , y ) = 1 x y + 3 x( 1 y ) + 4( 1 x ) y + 2( 1 x )( 1 y ) =
= x y + 3 x 3 x y + 4 y 4 x y + 2( 1 y x + x y ) =
= x y+ 3 x 3 x y+ 4 y 4 x y+ 2 2 y 2 x+ 2 x y =
1
1 5

= 4 x y + x + 2 y + 2 = 4 x y +

2
4 2
1
(en los grandes nmeros
2
1
ganar 5/2). Anlogamente, si P2 se resigna a perder 5/2 debe jugar con y = .
4
Despus lo veremos formalmente pero nuevamente se ve que hay una seleccin mejor que otras (si uno
es prudente).
Consideremos el siguiente juego dado por la matriz de pago:
Si yo soy P1 y me conformo con ganar 5/2 me basta con jugar con x =

1 5 0 4

2 1 3 3

4 2 1 0
Para el jugador P1 se presentan tres opciones. Sera importante que uno buscara primero lo peor que le
puede pasar por fila. Entonces:
mn a1 j = a13 = 0
j

mn a2 j = a22 = 1
j

mn a3 j = a33 = 1
j

Como P1 puede elegir cualquier i, tambin puede elegir el


mx mn aij = a22 = 1
i

juegos.doc

69

Prof. Ing. Claudio L. R. Sturla


Las elecciones de P2 son por columna, entonces:
mx ai1 = a31 = 4
i

mx ai 2 = a12 = 5
i

mx ai 3 = a23 = 3
i

mx ai4 = a14 = 4
i

Y nada me impide elegir:


min max a ij = 3
j

Si se diera que
mx mn aij = mn mx aij = v
i

P1 puede estar seguro de ganar como mnimo v y P2 puede impedir que P1 gane ms que v.
Pero.. cmo son estos jugadores?
Son inteligentes o sea si conociere cada jugador la estrategia que
el otro va a elegir, l seleccionar la estrategia que le
reportar el mayor beneficio.
Son prudentes o sea buscan obtener el resultado con la mayor seguridad posible. Obran con cuidado.
Si se cumpliera que:
mx mn aij = mn mx aij = v
i

P1 jugar a la fila de v y P2 a la columna de v.


Cualquier desvo de esto significar una prdida para P1 o para P2 .
Definicin 1: Por estrategia mixta de P1 queremos indicar un vector fila
x = ( x1 ; x 2 ; ; x m ) de nmeros no negativos xi tales que
x1 + x2 + + xm = 1

Por estrategia mixta de P2 queremos significar un vector columna y =

ros no negativos y j tales que


y1 + y2 + + yn = 1
juegos.doc

y1

y2
y 3 de nme

yn

70

Prof. Ing. Claudio L. R. Sturla


xi e y j
representan respectivamente, las frecuencias con que P1 selecciona su
movimiento i-simo y P2 selecciona su movimiento j-simo.
Para el juego de los disparejos la estrategia mixta para P1 podra ser (0;1) (1;0) (1/4;3/4).
Definicin 2: Para cada i = 1, 2 , 3, , m la estrategia mixta que es uno en el i-simo
componente y cero en cualquier otro, recibe el nombre de i-sima estrategia pura
para el maximizante. Se la designa i.
La j-sima estrategia pura para el minimizante, designada por j es una estrategia mixta
para el minimizante, la cual es uno para el j-simo componente y cero para
cualquier otro.
Dijimos que si exista un valor
mx mn aij = mn mx aij = v
i

la solucin del juego es nica y P1 cobra v y P2 pierde v.


El juego que presenta esa propiedad se dice que tiene punto de ensilladura o punto de silla.
Por ejemplo:
3 5 6

1 2 3

0 7 2
mx mn aij = mn mx aij = a11 = 3
i

a11 es el mnimo en su fila y mximo en su columna. El jugador P1 no jugar a las filas 2 y 3. P2 no


jugar a las columnas 2 y 3. Las estrategias puras sern:
1

x = ( 1,0,0) ; y = 0

0
Son estrategias puras ptimas.
Ejemplo N 1
Dada la matriz de pago de A a B, hallar la matriz de pago de B a A.
1 2 1
B=
; A=
3 2 2

1 3

2 2

1 2

Ejemplo N 2
Los siguientes juegos tienen solucin de punto minimax. Determinar las estrategias puras ptimas para
cada jugador.

juegos.doc

71

Prof. Ing. Claudio L. R. Sturla


6 8 6 6

; x = ( 1,0) ; y =
4 12 2 2
6

1 0

0 0

0 1

12 6

5 2 0 7 5

5 6 4 8 4 ; x = ( 0 1 0) ; y =

4 0 2 3 3
5

0

0
1

0

Si no hubiera punto de ensilladura con los conocimientos que tenemos no existe solucin. Slo un
circuito de elecciones posibles. En el caso de que no haya punto de minimax no hay equilibrio en el
juego.
Tomemos por ejemplo el siguiente juego que no tiene punto de ensilladura:
B
4 2 5
A

1 3 1
Si A juega 25 veces a la fila 1 y 75 veces a la fila 2, la ganancia media de A si B elige la columna 1 ser:
V( 0,25; B1 ) = 0,25 4 + ( 1) 0,75 = 0,25
Si B eligiera la columna 2:
V( 0,25; B2 ) = 0,25( 2) + 3 0,75 = 1,75
Si B eligiera la columna 3:
V( 0,25; B3 ) = 5 0,25 + 1 0,75 = 2
B ignora las estrategias de A.
Teorema de VON NEWMANN
Llamaremos E ( x ) a la esperanza matemtica de la ganancia de P1 . Tambin llamada funcin de pago.
El teorema dice:
*
*
"Existe para el maximizante una estrategia mixta ptima x1 , x 2 para la cual su

*
*
ganancia media E x1 , x 2

ser superior o igual a una cantidad v llamada valor del

*
*
*
juego y existe para el minimizante una estrategia mixta ptima y1 , y 2 , y 3

para la

*
*
*
cual su prdida media E y1 , y 2 , y 3 ser inferior o igual al valor del juego v."

Definicin 3: La funcin de pago para P1 , o sea la esperanza matemtica de P1 se


define por

juegos.doc

72

Prof. Ing. Claudio L. R. Sturla


E ( x , y ) = x ( A) y =

x i aij y j

i= 1 j= 1

donde x e y son estrategias mixtas cualesquiera de P1 y P2 respectivamente.


y1
4 2 5
E ( x , y ) = ( x1 x 2 )
y2 =
1 3 1
y3
= ( 4 x1 x 2 ) y1 + ( 2 x1 + 3 x 2 ) y 2 + ( 5 x1 + x 2 ) y 3

Definicin 4: Una solucin a un juego matricial son dos estrategias mixtas ptimas

x * = x1* , x 2* , , x m*

*
y =

y1*

y 2*

y n*

y un nmero v tal que

E x * , j v para las estrategias puras j = 1, 2, , n

E i , y * v para las estrategias puras i = 1, 2, , m


Las x * e y * se llaman estrategias mixtas ptimas.
v puede ser negativa, positiva o cero.
En el juego de los disparejos cuya matriz era
1 1

1 1
1 / 2
1 1
*
*
el valor del juego es cero y las estrategias ptimas son x = , ; y =
. Sin demostrarlo
2 2
1 / 2
aceptamos como axioma que un juego con v = 0 es justo.
Todo nos permite decir ahora que

E x, y * E x * , y * E x * , y

(a)

expresin escrita para el maximizante.


juegos.doc

73

Prof. Ing. Claudio L. R. Sturla


La expresin (a) es equivalente a:
m xmn E ( x , y ) = mnm xE ( x , y ) = v
x

(a) recibe el nombre de punto de ensilladura de los juegos matriciales.


Definicin 5: Un juego simtrico tiene una matriz de pago oblicua simtrica, esto
es aij = a ji ; aij = 0 si i = j .
Se puede demostrar que el valor del juego es cero y que ambos jugadores tienen estrategias ptimas simtricas.

Ejemplo N 3
Dos jugadores hablan simultneamente diciendo o piedra o papel o tijeras. La combinacin de papel y
piedra gana una unidad para el jugador que dijo papel (el papel envuelve a la piedra); para piedra y
tijeras gana la piedra (la piedra rompe las tijeras) y para tijeras y papel ganan las tijeras (cortan al papel).
Si los dos jugadores mencionan lo mismo no hay pago.
Plantear la matriz de pago y dar el valor del juego.
La matriz de pago si P1 es el jugador maximizante es:
Piedra Papel Tijeras
Piedra

Papel

Tijeras

0
1
1

1
0
1

Por la definicin 5 el valor del juego es cero pues la matriz es oblicua simtrica.

Propiedad: Para una nueva matriz de pago donde el valor de los elementos es
aij + w y w es un nmero positivo, las estrategias ptimas son las mismas que
para el juego original y el valor del nuevo juego es v + w .

Teorema fundamental de los juegos matriciales


Para todo juego matricial existen
m xmn E ( x , y ) y mnm xE ( x , y )
x

y son iguales. Esto es, todo juego matricial tiene una solucin.
Ejemplo N 4
Un jugador extiende alguno o algunos de sus dedos y al mismo tiempo supone (dicindolo) cuntos
dedos extiende el otro. El nmero de dedos que se puede extender es 1, 2 3.
Si uno solo de los jugadores adivina, su pago es el total del nmero de dedos extendidos. De lo contrario su pago es cero.
Equivalencia del juego matricial y el problema de programacin lineal
Supondremos que se nos da un juego matricial arbitrario:

juegos.doc

74

Prof. Ing. Claudio L. R. Sturla


a11

a21

am1

a12
a22

am2

a1n

a2 n

amn

Por definiciones 3 y 4 el problema es encontrar para P1 un vector x = ( x1 , x 2 , , x m ) y un nmero v


tales que:
a11 x1 +
a x +
12 1


a1n x1 +

a 21 x 2 + + a m1 x m v
a 22 x 2 + + a m 2 x m v

a 2 n x 2 + + a mn x m v

x1 + x2 + + xm = 1 ; xi 0 i
En forma similar para P2 :
a11 y1 + a12 y 2 + + a1n y n v
a y + a y + + a y v
21 1
22
2
2n
n

am1 y1 + a m2 y 2 + + amn y n v
y1 + y2 + + yn = 1 ; y j 0 i
Como cada elemento de (A) puede hacerse positivo mediante la suma de una constante apropiada a
todas las aij podemos suponer que v 0.
Si hacemos
x1 =
m

x1

1 m
1
= xi =
v i= 1
v

y j

1 n
1
= yj =
v j= 1
v

i= 1
n

j= 1

Al minimizar

i= 1

xi

yj
xi
; y j =
v
v

, P1 maximizar el valor del juego v y al maximizar

j= 1

y j , P2 minimizar el valor

del juego.
Entonces podemos redefinir el problema de programacin lineal de la siguiente manera:
Primal:
Encuentre un vector
juegos.doc

75

Prof. Ing. Claudio L. R. Sturla

x = x1 , x 2 , , x m

tal que minimice

x1 + x2 + + xm

sujeto a:
a11

a12

a
1n

x1 + a 21 x 2 + + a m1 x m 1
x1 + a 22 x 2 + + am2 x m 1

x + a2 n x + + a mn x

xi 0 i
El problema dual:
Encuentre un vector

y =

y1

y 2
y 3

y 4

tal que maximice


y1 + y2 + + yn
sujeto a
a11 y1 + a12 y 2 + + a1n y n 1

a12 y1 + a22 y 2 + + a2 n y n 1

a y + a y + + a y 1
m2
2
mn
n
m1 1
y j 0 j
Puesto que el juego tiene solucin, existen soluciones ptimas a los problemas anteriores y
m

mn

i= 1

xi = mx

j= 1

y j =

1
v

Ejemplo N 5
Dada la matriz de pago

juegos.doc

76

Prof. Ing. Claudio L. R. Sturla


6 0 3 8

8 2 3 9

4 6 5 7
Determinar, aplicando programacin lineal, las estrategias ptimas para los dos jugadores.
6 x1 + 8 x 2

2 x2

3 x1 + 3 x 2
8 x1 + 9 x 2

+
+
+
+

4
6
5
7

x3
x3
x3
x3

v
v
v
v

x1 + x2 + x3 = 1 ; xi 0 i
El dual ser:
6 y1 +
+ 3 y3 + 8 y4 v

8 y1 2 y 2 + 3 y 3 + 9 y 4 v
4 y + 6 y + 5 y + 7 y v
1
2
3
4

y1 + y2 + y3 + y4 = 1 ; y j 0 i
Si dividimos miembro a miembro por v:
6 y1 +
+ 3 y 3 + 8 y 4 1

8 y1 2 y 2 + 3 y 3 + 9 y 4 1
4 y + 6 y + 5 y + 7 y 1
1
2
3
4

1
y1 + y2 + y3 + y4 = mx
v
Sumamos un nmero w = 2 a la matriz original.
8 2 5 10

10 0 5 11

6 8 7 9
El dual ser:
8 y1 + 2 y 2 + 5 y 3 + 10 y 4 1

+ 5 y 3 + 11 y 4 1
10 y1
6 y + 8 y + 7 y + 9 y 1
1
2
3
4

y1 + y 2 + y 3 + y 4 =
juegos.doc

1
max
v*
77

Prof. Ing. Claudio L. R. Sturla


Si agregamos las variables de holgura:
8 y1 + 2 y 2 + 5 y 3 + 10 y 4 + 1
=1

10 y1 + 5 y 3 + 11 y 4 + 2 = 1

+ 3=1
6 y1 + 8 y 2 + 7 y 3 + 9 y 4
La resolucin por programacin lineal es:

0
1
1

ck
0
0
0

0
0
1

Base
P5
P6
P7

P0
1
1
1
0

1
P1
8
10
6
-1

1
P2
2
0
8
-1

1
P3
5
5
7
-1

1
P4
10
11
9
-1

0
P5
1
0
0
0

0
P6
0
1
0
0

0
P7
0
0
1
0

P5
P6
P3

2/7
2/7
1/7
1/7

26/7
40/7
6/7
-1/7

-26/7
-40/7
8/7
1/7

0
0
1
0

25/7
32/7
9/7
2/7

1
0
0
0

0
1
0
0

-5/7
-5/7
1/7
1/7

P5
P1
P3

1/10
1/20
1/10
3/20

0
1
0
0

0
-1
2
0
D

0
0
1
0

6/10
16/20
6/10
8/20
D

3
y1 =

y1 + y3 =

1
0
0
0
x1

-13/20
7/40
-3/20
1/40
x2

1/5
1/5
1/7

2/26
2/40
1/6

-1/4
-1/8
1/4
1/8
x3

1
1
; y3 =
20
10
1

3
* 20
=

v
=
3
v * 20

y1 =

y1

1 20 1
*

y
=
y
v
=
=
1
1
20 3 3
v*

y3 =

y3

v*

1 20 2
y3 = y3 v * =
=
10 3 3

y1 + y3 =

1 2
+ =1
3 3

1
1
x1 = 0 ; x2 =
; x3 =
40
8

juegos.doc

78

Prof. Ing. Claudio L. R. Sturla


x2 =

1 20 1
1 20 20 5
=
; x3 =
=
=
40 3 6
8 3 24 6
x1 + x2 + x3 = 0 +
v* =

1 5
+ =1
6 6

20
; v* = v + 2
3

20
14
v = v* 2 =
2=
3
3
Aqu, si sobrare tiempo, se puede intercalar
programacin lineal de papel, piedra y tijeras.

la

resolucin

por

Principio de dominancia
Sea el juego definido por la siguiente matriz:
2 4 1 0

3 1 4 2
El valor del juego para A si juega a la primera fila con probabilidad p1 y si B juega a la primera columna
es:
V A ( p1 , B1 ) = 2 p1 + 3( 1 p1 ) = 2 p1 + 3 3 p1 = 3 p1
El valor calculado es la esperanza matemtica de la ganancia para el jugador A si A juega a la primer fila
con probabilidad p1 y el jugador B juega a la primer columna.
Si B juega con estrategia B1 y A juega a la primera fila pierde 2 y si juega a la segunda pierde 3.
Si B jugara a la cuarta columna y A a la primera fila, B pierde 0.
Si A jugara a la segunda fila, B perdera 2.
Siempre convendr a B jugar en la cuarta columna. B nunca jugar a la primera. Se dice que la primera
columna es dominada. Entonces el juego se transforma es una matriz como:
4 1 0

1 4 2
De la misma manera, toda fila dominada por otra puede ser suprimida en la matriz de un juego.
Es importante porque permite reducir algunos juegos al tamao 2 x 2 que se resuelven fcilmente en
forma grfica.
Ejemplo N 6
Reducir el siguiente juego aplicando dominancias:
3 0 2

4 5 1

4 3 3
juegos.doc

79

Prof. Ing. Claudio L. R. Sturla


La columna uno tiene valores superiores respecto a la tercera. Entonces se elimina la primera que es
dominada
0 2

5 1

3 3
Ahora todos los elementos de la primera fila son menores a los de la tercera. La tercera domina a la
primera. Se anula la primera.
5 1

3 3
Ejemplo N 7
Reducir el siguiente juego aplicando dominancias:
3 10 16

5 4
3
2 8 3

Resolucin analtica y grfica de juegos.


Supongamos que se nos presenta el siguiente juego:

Jugador A

x1

y1
4

y2
8

x2
6
2
que no tiene punto de ensilladura. El jugador seleccionara por minimax la peor situacin de cada alternativa (4 para x1 y 2 para x2 ) para luego optar por la que asegura la mayor de dichas ganancias
mnimas. El valor del juego para A es:
VA = 4
que es la retribucin mnima que espera ganar jugando su estrategia x1.
De la misma manera el valor del juego para el jugador B es
VB = 6
pero esto es un crculo vicioso. Por ello deberan recurrir a estrategias mixtas. Supongamos que A juega
a sus alternativas x1 y x 2 con probabilidades p1 y ( 1 p1 ) . Su ganancia no depende de lo que l juega
sino de la estrategia seguida por B.
Por ejemplo si B juega su estrategia y1 , la ganancia de A ser:
V A ( p1 , y1 ) = 4 p1 + 6( 1 p1 ) = 4 p1 + 6 6 p1 = 6 2 p1
Expresin que da la esperanza matemtica de la ganancia del jugador A si l juega a la primer fila
con frecuencia relativa x1 y el jugador B juega a la primera columna.
Si B jugara a la estrategia y2 :
juegos.doc

80

Prof. Ing. Claudio L. R. Sturla


V A ( p1 , y 2 ) = 8 p1 + 2( 1 p1 ) = 8 p1 + 2 2 p1 = 2 + 6 p1
A tratar de hacer mxima la ganancia independientemente de la estrategia de B. Eso significa:
V A ( p1 , y1 ) = V A ( p1 , y 2 )
6 2 p1 = 2 + 6 p1
6 2 = 6 p1 + 2 p1 = 8 p1
4 = 8 p1
p1 = 0, 5
Haciendo el mismo razonamiento para B.
V B ( q1 , x1 ) = 4 q1 + 8( 1 q1 ) = 4 q1 + 8 8 q1 = 8 4 q1
V B ( q1 , x 2 ) = 6 q1 + 2( 1 q1 ) = 6 q1 + 2 2 q1 = 2 + 4 q1
8 4 q1 = 2 + 4 q1
8 2 = 8 q1
6 = 8 q1
q1 =

6
= 0, 75
8

Hasta aqu ha sido una mera resolucin con geometra analtica elemental.
Ahora veamos como se puede resolver grficamente.
La figura muestra la variacin de la ganancia esperada por el jugador A para diversos valores de p1
cuando su adversario juega sus estrategias y1 e y2 .
V A ( p1 = 0,5; y1 ) = 4 0,5 + 6 0,5 = 5
V A ( p1 = 0,5; y 2 ) = 8 0,5 + 2 0,5 = 5

juegos.doc

81

Prof. Ing. Claudio L. R. Sturla


VA

M
4

2+6 p
Q

6-2 p1

p*1

0,3
Supongamos que A carga su bolillero con p1* bolillas blancas. En ese caso su beneficio oscilara entre
SN y SM de acuerdo a las estrategias que adopte el jugador B. Con criterio conservador A esperara
ganar SN. Es decir, SN sera el

( )

V A p1*

Para otros valores de p1 entre 0 y 1 el valor esperado ser la quebrada PQR. Como A pretende maximizar su ganancia mnima, es obvio que eligir el valor p1 = 0, 5 con lo que se asegura un valor esperado de la ganancia de
V A ( p1 ) = 5
El punto Q es el mayor. Por un razonamiento anlogo en la figura se ve que la estrategia ptima para B
es con q1 = 0, 75
V B ( q1 ) = 5

juegos.doc

82

Prof. Ing. Claudio L. R. Sturla


VB

8-4 q 1
6
4
2

2+4 q

0,75

q1

0,3
Este mtodo de resolucin grfica de juegos puede utilizarse tambin para aquellos juegos cuya matriz
consta de 2 filas y ms de 2 columnas o de 2 columnas y ms de 2 filas.
Sea por ejemplo el siguiente juego:
2 4 1 0

3 1 4 2
p1 + p2 = 1 ; p2 = 1 p1
Analticamente puede hallarse:
V A ( p1 , y1 ) = 2 p1 + 3( 1 p1 ) = 2 p1 + 3 3 p1 = 3 p1
V A ( p1 , y 2 ) = 4 p1 + ( 1 p1 ) = 4 p1 + 1 p1 = 1 + 3 p1
V A ( p1 , y 3 ) = p1 + 4( 1 p1 ) = p1 + 4 4 p1 = 4 5 p1
V A ( p1 , y 4 ) = 2( 1 p1 ) = 2 2 p1
La figura muestra como varan las ganancias esperadas al variar p1 entre 0 y 1.

juegos.doc

83

Prof. Ing. Claudio L. R. Sturla


VA

6
4
2

4-5p 1

1+3p1
3-p 1
2-2p 1

Analizando la figura se ve claramente que el jugador B no est interesado en las estrategias y1 e y3 pues
le aseguran una prdida mayor que la ganancia esperada por A. Entonces q1 = q3 = 0. Slo resta hallar
los valores de q2 y q4 .
La columna 1 es dominada por la 4.
En cambio la columna 3 no es dominada estrictamente.
Una dominancia estricta significa que las relaciones entre elementos de filas o columnas se expresan
mediante los signos y no .
q2 + q4 = 1 ; q4 = 1 q2
V B ( q 2 , x1 ) = 4 q 2 + 0( 1 q 2 ) = 4 q 2
V B ( q 2 , x 2 ) = q 2 + 2( 1 q 2 ) = q 2 + 2 2 q 2 = 2 q 2

juegos.doc

84

Prof. Ing. Claudio L. R. Sturla


VB

6
4
2

4q2
1,6

2-2q 1

q 2
0,4

Ejemplo N 8
Resolver grficamente el juego asociado con la siguiente matriz de pago:
1 3 11

8 5 2
V A ( p1 , y1 ) = p1 + 8( 1 p1 ) = p1 + 8 8 p1 = 8 7 p1
V A ( p1 , y 2 ) = 3 p1 + 5( 1 p1 ) = 3 p1 + 5 5 p1 = 5 2 p1
V A ( p1 , y 3 ) = 11 p1 + 2( 1 p1 ) = 11 p1 + 2 2 p1 = 2 + 9 p1
VA

2+9p1
8-7p 1
6
4

4,5
5-2p 1

2
0,27
juegos.doc

1
85

Prof. Ing. Claudio L. R. Sturla


5 2 p1 = 2 + 9 p1
3 = 11 p1
3
p1 =
= 0,27
11
VA = 5 2 p1 = 5 2

3
5 49
= 5
=
= 4 ,45
11
11 11

y1 = 0 ; p1 = 0, 27 ; p2 = 0, 73 ; V A = 4 , 45
Planteamos para B.
V B ( q 2 , x1 ) = 3 q 2 + 11( 1 q 2 ) = 3 q 2 + 11 11 q 2 = 11 8 q 2
V B ( q 2 , x 2 ) = 5 q 2 + 2( 1 q 2 ) = 5 q 2 + 2 2 q 2 = 2 + 3 q 2
VB
11-8q

6
4,5

4
2

2+3q2
q 2

0,81
11 8 q2 = 2 + 3 q2
9 = 11 q2
q2 =
11 8 q2 = 11 8

9
11

9 121 72 49
=
=
4, 5
11
11
11

Ejemplo N 9
Un supermercado desea implantar un sistema de vigilancia para su sector ventas. A tal efecto se han
considerado dos zonas (A y B) en el edificio, el cual consta de una sola planta. La primera, donde se
juegos.doc

86

Prof. Ing. Claudio L. R. Sturla


exhiben la mayora de los artculos, es frecuentada por una gran cantidad de clientes, mientras que la
segunda no es tan concurrida.
Se han instalado dos cmaras de T.V. que permiten observar las zonas A y B desde el local T donde
estn ubicados los monitores.
De esta forma, los policas pueden situarse en A, en B o en T mientras que los ladrones pueden presentarse en A o en B.
Los policas han hecho una estimacin de las probabilidades de descubrir y capturar al ladrn. Una de las
hiptesis es suponer que es muy raro que varios ladrones acten al mismo tiempo en el supermercado.
Segn la experiencia se estima que si el ladrn se encuentra en A y el polica en T, la probabilidad de
captura es 0,3. Para el resto de posibilidades se obtiene la siguiente tabla:
El ladrn
A
B
T
0,3
0,5
Polica
A
0,4
0,2
B
0,1
0,7
Se pide:
1. Construir la matriz de pago.
2. Definir las estrategias ptimas de los policas.
Los dos policas se pueden encontrar juntos o separados en A, B T. Las probabilidades de captura
sern entonces para los casos TT (ambos en T); AA (los dos en A); TA (uno en T y otro en A), etc. La
captura del ladrn por el primer polica ser representada por la variable aleatoria x1 que puede tomar
valor 1 (capturado) 0 (ladrn no capturado). La captura del ladrn por parte del segundo polica ser
x2 . Y se acepta la hiptesis de que x1 e x2 son variables independientes,
pTA( y el ladrn en A ) = pT + p A ( 1 pT ) =
= 0,3 + 0,4( 1 0,3) = 0,58
pTA( y el ladrn en A) = probabilidad de captura por parte del primer polica + probabilidad de
captura por parte del segundo polica si el primero no lo ha capturado.
As se pueden calcular todas las posibilidades de posicin del ladrn con la disponibilidad conjunta de
los dos policas.
El ladrn

Los dos
policas

TT
AA
BB
TA
TB
AB

A
0,51
0,64
0,19
0,58
0,37
0,46
y1

B
0,75
0,36
0,91
0,6
0,85
0,76
y2

x1
x2
x3
x4
x5
x6

Otro ejemplo.

juegos.doc

87

Prof. Ing. Claudio L. R. Sturla


pTT( y el ladron en A ) = pT + pT ( 1 pT ) = 0,3 + 0,3( 1 0,3) = 0,51
Las ecuaciones de los policas son:
0, 51 x1 + 0, 64 x2 + 0, 19 x3 + 0, 58 x4 + 0, 37 x5 + 0, 46 x6 v
0, 75 x1 + 0, 36 x2 + 0, 91 x3 + 0, 60 x4 + 0, 85 x5 + 0, 76 x6 v
x1 + x2 + x3 + x4 + x5 + x6 = 1 ; xi 0 i
Y las del ladrn sern
0, 51 y1 + 0, 75 y2 v (1)
0, 64 y1 + 0, 36 y2 v ( 2 )
0, 19 y1 + 0, 91 y2 v ( 3)
0, 58 y1 + 0, 6 y2 v ( 4 )
0, 37 y1 + 0, 85 y2 v (5)
0, 46 y1 + 0, 76 y2 v ( 6)
y1 + y2 = 1 ; y j 0 j
Resolvemos por el mtodo grfico.
v

(3)
(1)
0,63

0,6 (4)

(6)

0,4 (2)
(5)
0,2
y1
0,58
juegos.doc

88

Prof. Ing. Claudio L. R. Sturla


y1 = 0, 58 ; y2 = 0, 42 ; v = 0, 63
No intervienen las inecuaciones (2), (3), (5) y (6). Por lo tanto x 2 , x 3 , x 5 y x 6 son nulas. Las inecuaciones de los policas se reducen a:
0,51 x1 + 0,58 x 4 v
0,75 x1 + 0,6 x 4 v
x1 + x 3 = 1 ; x i 0

que se puede resolver fcilmente usando el mtodo grfico.


Juegos contra la naturaleza.
Es un problema de decisin que aparece cuando conociendo varios futuros posibles no se pueden determinar las probabilidades de cada uno de esos futuros. Por ejemplo la demanda que tendr un producto de acuerdo a su precio.
Ejemplo N 10
(Donde es razonable usar el criterio minimax)
Supongamos que quiero invertir 10.000 UM para un perodo donde no sabemos si habr paz, guerra fra
o la guerra. Se puede elegir entre:
Bonos del tesoro;
Acciones de empresas que producen armas;
Acciones de empresas comerciales.
Las tasas de rendimiento anual son:
Guerra Guerra fra Paz
2

18

3
6
7

3,2 Bonos del Tesoro

2 Valores en armamentos

12 Acciones comerciales

La lnea 3 domina (en forma no estricta) a la lnea 1. Esto transforma la matriz de pago:
18 6 2

2 7 12
Las inecuaciones que rigen el juego son: (si y slo si la naturaleza fuese racional, pero no se comporta como tal desde nuestro punto de vista).
18 x2 + 2 x3 v
6 x2 + 7 x3 v
2 x2 + 12 x3 v
x2 + x3 = 1
Aplicando el mtodo grfico se encuentra:
juegos.doc

89

Prof. Ing. Claudio L. R. Sturla


x2 =

5
12
; x3 =
; v = 6, 7
17
17

Si hay guerra la ganancia ser:


18

5
12
+ 2 = 6, 7
17
17

Si hay guerra fra:


6

5
12
+ 7 = 6, 7
17
17

Si hay paz:

( 2)

5
12
+ 12
= 7,88
17
17

5
12
= 2. 941 UM en armamento y 10. 000 UM
= 7. 059 UM en acciones
17
17
comerciales, el financista se asegura por lo menos una ganancia de 670 UM.
Colocando 10. 000 UM

Ejemplo con informacin parcial.


Ejemplo N11
Para calentar una casa se necesitan 4 t de carbn si el invierno es suave, 5 t si es normal y 6 t si es riguroso. El carbn se compra en verano. En verano se paga 200 UM/t. Si el invierno es suave la t cuesta
200 UM, si es normal 220 UM y 240 UM si es muy fro. Qu decisin tomar?
Si se compran 4 t en verano se deber gastar:
800 UM si el invierno es suave;
800 UM + 220 UM = 1.020 UM si es normal y
800 UM +2 x 240 UM = 1.280 UM si es riguroso.
Cuando se adquieran 6 t en verano se debern desembolsar 1.200 UM cualquiera sea la temperatura del
invierno.
Suave Normal Riguroso
.
4t
-800 -1.020 -1.280 1280

.
5t
-1.000 -1.000 -1.240 1240

.
6t
-1.200 -1.200 -1.200 1200
Si ahora la oficina meteorolgica afirma que el invierno no ser riguroso. Cul ser la estrategia ptima?. Se suprimen las filas y columnas terceras.
Suave

Normal

. 1020
.
4t
800 1020

.
1000
. 1000
.
5t
1000
v = 1. 000
juegos.doc

90

Prof. Ing. Claudio L. R. Sturla


Se puede enunciar la siguiente propiedad:

Toda informacin parcial o total sobre el estado de la naturaleza no podr jams


disminuir el valor del juego si se est maximizando."

Ejemplo donde el criterio minimax resulta inaceptable.


Ejemplo N 12
Un vendedor de diarios vende una revista quincenal. Los martes recibe un cierto nmero de ejemplares y
devuelve los sobrantes el martes siguiente. Cada vez que vende una revista gana 0,5 UM y si devuelve
pierde 0,3 UM por revista. La nica informacin de que dispone es que nunca se venden ms de 50
ejemplares.
Supondremos que vara su compra de a 10 ejemplares. Hacemos la siguiente tabla:
0

10

20 30 40

50

0 0 0 0 0 0 ej. 0 UM
0

3 5 5 5 5 5 10 ej. 3 UM
6 2 10 10 10 10 20 ej. 6 UM

9 1 7 15 15 15 30 ej. 9 UM
12 4 4 12 20 20 40 ej. 12 UM

15 7 1 9 17 25 50 ej. 15 UM
Lo prudente es que no venda. Pero de eso vive. El vendedor tratar de obtener datos sobre la demanda.
Los juegos contra la naturaleza son juegos donde si bien se conocen los varios futuros posibles no se
conoce su distribucin de probabilidades.
Habr que recurrir a algn criterio para aplicar en cada problema de decisin.
Criterio de LAPLACE
Trabaja con incertidumbre. Dado que no se conocen las probabilidades de los estados futuros, se
considera a stos equiprobables.
1
Si hay n futuros posibles supondremos que las probabilidades de cada uno de ellos es . Adoptaremos
n
el mayor valor esperado.
Para cada estrategia las esperanzas son:
Ei =

aij

1
n

Ei
y luego se elige mx
i
Ejemplo N 13
Una empresa debe optar entre dos mquinas (A y B) para procesar una pieza. Para una de ellas (la A) el
costo de preparacin es de 2.000 UM y el costo unitario de produccin 20 UM. La otra (la B) tiene
costos de 5.000 y 10 UM respectivamente. Qu mquina es la ms conveniente si el precio de venta es
de 30 UM/u y la produccin requerida est dentro del rango 100 Q 400 u ?
La ganancia bruta que se obtiene con A B es:

juegos.doc

91

Prof. Ing. Claudio L. R. Sturla


G A ( A) = 30 Q ( 2.000 + 20 Q) = 30 Q 2.000 20 Q = 10 Q 2.000
G A ( B) = 30 Q ( 5.000 + 10 Q) = 30 Q 5.000 10 Q = 20 Q 5.000
Si consideramos como nicos niveles posibles los niveles de demanda F1 = 100 u ; F2 = 250 u ;
F3 = 400 u.
F1

F2

F3

.
500 2.000 A1 (m quina A)
1000

3.000 0 3.000 A2 (m quinaB)


Aplicando LAPLACE asignamos a cada futuro la probabilidad p = 0, 33. El valor esperado de la ganancia es:
VE ( A1 ) = 1000
.
0,33 + 500 0,33 + 2.000 0,33 = 500

VE ( A2 ) = 3.000 0,33 + 3.000 0,33 = 0

Podra objetarse el conjunto de futuros que se han enunciado. Este es el inconveniente de LAPLACE.
La decisin puede ser condicionada por la forma en que se plantean los futuros posibles. Veamos el
mismo ejemplo con ms posibilidades de demanda:
100

150

200

250

300

350

400

.
500
0
500 1000
.
1500
.
2.000 A1
1000

.
0 1000
.
2.000 3.000 A2
3.000 2.000 1000
VE ( A1 ) = 1000
.

1
1
1
1
1
1
500 + 500 + 1000
.
+ 1500
.
+ 2.000 = 500
7
7
7
7
7
7

VE ( A2 ) = 3.000

1
1
1
1
1
1
2.000 1000
.
+ 1000
.
+ 2.000 + 3.000 = 0
7
7
7
7
7
7

Se elige la alternativa 1.
Criterio de WALD
Es un criterio de pesimismo. La persona que decide se pone en la posicin de mayor pesimismo. En el
ejemplo visto se preguntara: qu es lo peor que me puede pasar?
Peor compensacin
A1
-1.000
A2
-3.000
y ahora se elige el ms favorable de los peores ( A1 ) . Es el criterio en que se bas VON NEWMANN.
Criterio de HURWICZ
Supongamos que tenemos la siguiente matriz de pago:
9 2

3 7
juegos.doc

92

Prof. Ing. Claudio L. R. Sturla


Se selecciona el MAX (lo mejor) y el MIN (lo peor) de cada estrategia.
MAX
MIN
primera fila
9
2
segunda fila
7
3
Se elige un coeficiente 0 1 de optimismo y se multiplica a los MAX por y los MIN por el
pesimismo ( 1 )
H1 = 9 + 2( 1 ) = 2 + 7
H 2 = 7 + 3( 1 ) = 3 + 4
i

H1
H2

6
4
2
= 1 /3

Si la posicin del jugador es pesimista 0 elige la estrategia 2 que le asegura menos prdida.

3
1
1

Si la posicin es optimista 1 elige la estrategia 1 donde arriesga ms de de su capital pero


3

3
tiene esperanzas ms altas.
Ejemplo N 14
Naturaleza
1

2 UM

5 UM

-4 UM

1.000 UM

H1 =

99
1
2+
5 = 2 , 03
100
100

Jugador

Si =

1
100

juegos.doc

93

Prof. Ing. Claudio L. R. Sturla


H2 =

99
1
1000 = 5,94
( 4) +
100
100

Se puede calcular el coeficiente de optimismo para el cual la lnea 2 sea preferida sobre la 1.

(1 ) 2 +

5 = ( 4)( 1 ) + 1000
.

2 2 + 5 = 4 + 4 + 1000
.

2 + 3 = 4 + 1004
.
6 = 1. 001 =

6
0, 006
1. 001

Recordemos que el caso de minimax corresponde a 0.


Criterio de SAVAGE
En el problema de las mquinas que vimos la tabla era:
F1
-1.000
-3.000

Mquina A
Mquina B

F2
500
0

F3
2.000
3.000

Si realmente ocurriera F3 , quien hubiera elegido la mquina A se lamentar por las


3. 000 UM 2. 000 UM = 1. 000 UM .
Si hubiera elegido la mquina B no habra ninguna afliccin (3.000 - 3.000 = 0 UM).
Entonces SAVAGE considera el caso de las personas que se enfrentan con un problema de decisiones y
al elegir una de las alternativas tienden a lamentarse por no haber elegido la alternativa ptima.
El grado de satisfaccin est dado por "la diferencia existente entre la compensacin que realmente
recibi y la que debiera correspondido si hubiera sabido con antelacin el estado natural que habra de
producirse".
Con el razonamiento para hallar los lamentos podra confeccionarse la matriz de lamentos que en
nuestro caso es:

Mquina A
Mquina B

F1
0
2.000

F2
0
500

F3
1.000
0

Estos son pesares. De ellos queremos, por supuesto, el menor. En nuestro problema tendremos:

Mquina A
Mquina B

Afliccin
1.000
2.000

La eleccin recae en A.
Ejemplo N 15

juegos.doc

94

Prof. Ing. Claudio L. R. Sturla


Una empresa desea lanzar un producto al mercado y est estudiando la posibilidad de venderlo a 8, 10,
12, 14, 16, 18 20 UM/u. El beneficio de la empresa variar tal como indica la siguiente matriz de
ganancia (en millones de UM).

A1 ( 8 UM / u)

A2 ( 10 UM / u)
A3 ( 12 UM / u)
A4 ( 14 UM / u)
A5 ( 16 UM / u)

A6 ( 18 UM / u)

A7 ( 20 UM / u)

F1
-30

Precios de la competencia
F2
F3
F4
10
15
20

F5
20

-20

20

20

30

40

-10

10

20

30

60

-15

20

40

80

-20

-15

10

40

90

-30

-20

20

100

-50

-30

-20

40

F1
-20

F2
20

F3
20

F4
30

F5
40

-10

10

20

30

60

-15

20

40

80

-20

-15

10

40

90

-30

-20

20

100

A1 es dominada. Puede eliminarse.


A7 es dominada. Puede eliminarse.
La matriz queda reducida a:
A2 ( 10 UM / u)
A3 ( 12 UM / u)
A4 ( 14 UM / u)
A5 ( 16 UM / u)

A6 ( 18 UM / u)
a) Criterio de Laplace:

VE A2 = 20 0, 2 + 20 0, 2 + 20 0, 2 + 30 0, 2 + 40 0, 2 = 18
VE A3 = 10 0, 2 + 10 0, 2 + 20 0, 2 + 30 0, 2 + 60 0, 2 = 22
VE A4 = 15 0, 2 + 0 0, 2 + 20 0, 2 + 40 0, 2 + 80 0, 2 = 25
VE A5 = 20 0,2 15 0,2 + 10 0,2 + 40 0,2 + 90 0,2 = 21
VE A6 = ( 30 + 20 + 0 + 20 + 100) 0,2 = 14

b) Criterio de WALD:
A2 = 20
A3 = 10
A4 = 15
A5 = 20
A6 = 30
c) Criterio de HURWICZ
c.1) = 0, 2

juegos.doc

95

Prof. Ing. Claudio L. R. Sturla


H 2 = 0,2 40 + 0,8( 20) = 8

H 3 = 0,2 60 + 0,8( 10) = 4

H 4 = 0,2 80 + 0,8( 15) = 4


H 5 = 0,2 90 + 0,8( 20) = 2

H 6 = 0,2 100 + 0,8( 30) = 4


c.2) = 0, 5
H 2 = 0,5 40 + 0,5( 20) = 20
H 3 = 0,5 60 + 0,5( 10) = 25

H 4 = 0,5 80 + 0,5( 15) = 32,5

H 5 = 0,5 90 + 0,5( 20) = 35

H 6 = 0,5 100 + 0,5( 30) = 35


c.3) = 0, 8
H 2 = 0,8 40 + 0,2( 20) = 28
H 3 = 0,8 60 + 0,2( 10) = 46
H 4 = 0,8 80 + 0,2( 15) = 61

H 5 = 0,8 90 + 0,2( 20) = 68

H 6 = 0,8 100 + 0,2( 30) = 72


En los tres casos queda descartada la alternativa 2.
d) Criterio de SAVAGE.
La tabla de lamentos es:
A2
A3
A4
A5
A6

F1
10
0
5
10
20

F2
0
10
20
35
40

F3
0
0
0
10
20

F4
10
10
0
0
20

F5
60
40
20
10
0

Buscamos ahora el mnimo de entre los mximos lamentos.


Alternativa
A2
A3
A4
A5
A6

Valor mximo
60
40
20
35
40

A4 pareciera ser el ms conveniente. Pero se puede cuestionar esta decisin con un criterio ms o menos
pesimista.
Ejemplo N 16
juegos.doc

96

Prof. Ing. Claudio L. R. Sturla


Un panadero desea conocer el nmero de panes que debe fabricar por da. Tiene dos empleados: un
obrero de panadera que le cuesta 35 UM/da y una empleada que le insume 25 UM/da.
Tiene otros gastos como impuestos, patentes, amortizaciones del negocio, instalaciones, etc. que suman
60 UM/da.
El precio de costo del pan es 0,2 UM/u sin incluir mano de obra y se vende a 0,8 UM/u.
El panadero sabe que puede vender entre 300 y 800 panes.
Para fabricar ms de 500 panes debe pagar 2 horas extra a sus empleados, lo que le supone 20 UM/da.
Adems cada pan que no se vende al pblico se vende para alimento de animales a 0,10 UM/u.
Supongamos que se fabrican 400 panes y se venden 300.
Ingreso por ventas
Costo de lo fabricado
Obreros, empleados e impuestos
Beneficio por venta de
sobrantes a animales

240 UM
(80) UM
(120) UM
10 UM
========
50 UM

De esta forma se puede construir la matriz de beneficios (se indican slo algunas filas).
Demanda
300 400 500 600 700 800
60 60 60 60 60 60 300

50 120 120 120 120 120 400


40
500 Oferta

10
600

700

800
Determinar el nmero de panes a fabricar cotidianamente aplicando los diferentes criterios. Tomar
1
= para el criterio de HURWICZ.
2
Ejemplo N 17
Se va a fabricar un cierto objeto muy costoso el cual consta de tres partes anlogas y tales que el objeto
es satisfactorio si cada una de las partes lo es. Para mayor precisin puede suponerse que el objeto es
una rueda con tres radios. Para que la rueda sea satisfactoria, cada radio debe tener una resistencia
mecnica (y para dar la idea de que es costosa podemos pensar que se trata de una rueda bastante
grande que debe obtenerse en una sola pieza).
El consumidor, G, de esta rueda (el gobierno o un laboratorio astronmico) no est en condiciones de
fabricarla l mismo, por tanto la encarga a un fabricante M en las siguientes condiciones: G paga a M
una cierta cantidad para que fabrique la rueda bajo ciertas especificaciones; una vez terminada de
construir de acuerdo con dichas especificaciones, M puede tirarla a la basura (en cuyo caso cabe suponer
que su valor de rescate es cero) o puede entregarla a G el cual la someter a prueba; si la encuentra
satisfactoria G pagar a M una cantidad adicional A; en caso contrario es M quien satisface a G con una
multa B (A y B son, naturalmente, nmeros positivos).
No obstante, como G ha pagado ya a M por fabricar la rueda y como no desea dejar abierta la posibilidad de que ste pueda fabricarla solo por el pago inicial, impone la condicin adicional de que M no
juegos.doc

97

Prof. Ing. Claudio L. R. Sturla


tirar la rueda a la basura, a menos que al ser ensayada resulte defectuosa (aunque, si M lo desea, puede
entregarla a G sin ninguna prueba.)
Esta prueba puede hacerse en cada uno de los tres radios, costndole a M, por cada uno, la cantidad C.
La prueba es adecuada en el siguiente sentido: G encontrar la rueda aceptable slo cuando cada radio
pase la prueba al ser realizada sta.
El problema de si se va a probar uno o todos los radios antes de aceptar la rueda (es decir, antes de
entregarla a G) corresponde a M. ste tiene la posibilidad de actuar de cuatro maneras diferentes
(estrategias puras):
I. Aceptar la rueda sin ningn ensayo previo.
II. Elegir uno de los radios al azar y probarlo. Si este radio resulta satisfactorio se acepta la rueda. Si
no lo es se la rechaza.
III. Ensayar un radio elegido al azar. Si resulta defectuoso rechaza la rueda. Si no lo es, elige uno de
los dos restantes al azar y lo prueba. Si el resultado es desfavorable, rechaza la rueda. Si no lo es, la
acepta.
IV. Probar un radio elegido al azar. Si es defectuoso, rechaza la rueda. Si es satisfactorio, elige uno
de los restantes tambin al azar y lo prueba. Si es defectuoso, rechaza la rueda. Si es satisfactorio
prueba el tercer radio y acepta o rechaza la rueda segn que el ltimo radio pase o no satisfactoriamente la prueba.
Y adems la naturaleza tiene otras cuatro posibilidades. Puede ocurrir que ninguno, uno, dos o tres
radios sean defectuosos. Vamos a indicar estas 4 estrategias con los nmeros 0, 1, 2 y 3.
Examinaremos el beneficio de M para las diversas combinaciones de estrategias.
Si M juega a la estrategia I y la naturaleza la 0, entonces M no hace ningn ensayo y ninguno de los
rayos es defectuoso. As, pues, G encontrar la rueda satisfactoria y pagar A a M. El pago a M ser en
este caso A.
Si M juega la estrategia II y la naturaleza la 0, entonces M realizar una prueba y la rueda es satisfactoria
para G. G pagar A a M pero ste tendr que gastar C en la realizacin de la prueba. Por lo tanto el
pago de M ser A C.
Anlogamente si M juega la estrategia III y la naturaleza 0 el pago para M ser A 2 C . Y si M emplea
la IV y la naturaleza la 0, el pago ser A 3 C.
Si M juega la I y la naturaleza la 1, entonces M entrega la rueda a G , el cual la encontrar defectuosa.
M ha de pagar a G la multa B, por tanto el pago es -B (En este caso, como M no realiza ninguna prueba,
no tendr ningn gasto por este concepto).
Tambin es -B cuando M juega I y la naturaleza utiliza una de las estrategias 2 3.
Si la naturaleza emplea la estrategia 3, todos los radios son defectuosos. As, pues, en el caso de que M
efecte algn ensayo descubrir que la rueda es defectuosa y, por tanto, la rechazar.
Luego el pago para M es simplemente el costo de probar un radio, o sea, -C. Esto se verifica cuando la
naturaleza juega la estrategia 3 y M la II, III la IV.
Si M juega la estrategia II y la naturaleza la 1, la probabilidad de que M descubra un radio defectuosa
ser 1/3 y de que no lo descubra ser 2/3. Si descubre el defecto, el pago para l ser de -C. Si no lo
descubre, tiene que pagar la multa B y adems debe pagar por realizar la prueba, por lo tanto en este
caso el pago es -B-C. Luego la esperanza de M es:
1
2
1
2
2
2
( C) + ( B C) = C B C = B C
3
3
3
3
3
3
De manera similar vemos que en el caso de que M juegue la II y la naturaleza a 2, el pago esperado para
M es:
2
1
2
1
1
1
( C) + ( B C) = C B C = B C
3
3
3
3
3
3
juegos.doc

98

Prof. Ing. Claudio L. R. Sturla


Si M juega III y la naturaleza 1, la probabilidad de que M descubra el rayo defectuoso en la primera
21 1
= ; luego la probabilidad de que el radio deprueba es 1/3, la de que lo descubra en la segunda
32 3
fectuoso escape a las pruebas es:
1 1 1
1 + =
3 3 3
Si el rayo defectuoso se descubre en el primer ensayo, el pago para M es -C y si se descubre en el segundo es -2C; si queda sin descubrir el pago es -B-2C. Por lo tanto el pago esperado para M es:
1
1
1
1
2
1
2
( C ) + ( 2 C ) + ( B 2C ) = C C B C =
3
3
3
3
3
3
3
=

1
5
C C
3
3

Continuando de esta manera llegamos a la matriz:


0

B
B
B I
A

2
1
A C
B C
B C
C II

3
3

1
5
4
A 2C
B C
C
C
3
3
3

III

4
A 3C
2C
C
C IV

3
El valor de este juego para M y sus estrategias ptimas al jugarlo, dependen de los valores relativos de
A, B y C.
As por ejemplo si tomamos A = 100, B = 300 y C = 3 (de manera que la multa por entregar una rueda
defectuosa sea muy grande en comparacin con el costo de comprobacin) obtendremos la matriz:
0

100 300 300 300 300

97 203 103 3 203

94 155 4
3 155

4
3 6
91 6 *

I
II
III
IV

As, lo peor que puede sucederle es que la rueda tenga un solo radio defectuoso y la mejor estrategia de
M ser la IV ( es decir, probar todos los radios de la rueda). Jugando dicha estrategia M puede estar
seguro de no perder una cantidad mayor a 6. Por lo tanto al hacer el contrato M debe exigir a G un pago
inicial que exceda al costo de produccin en por lo menos 6 unidades.
Por otra parte si tenemos A = 100, B = 300 y C = 303 (de manera que sea costoso hacer la prueba)
obtenemos la matriz:
juegos.doc

99

Prof. Ing. Claudio L. R. Sturla


0

100 300 * 300 * 300 * I

203 503 403 303 II

506 655 404


303 III

303 IV
809 606 404
En este caso la forma ms desfavorable de actuar de la naturaleza con respecto a M es hacer uno o ms
(no importa cuantos) radios defectuosos. Lo mejor para M ser jugar la estrategia I (o sea, no realizar
ninguna prueba). De este modo, al ser mayor el costo de comprobacin, slo puede estar seguro de que
su prdida ser a lo sumo 300.
Mediante una eleccin adecuada de A, B y C puede incluso ocurrir que la matriz no tenga una lnea
nica para elegir. As sucede si tomamos A = 100, B = 900 y C = 300, en cuyo caso se obtiene la matriz:
0
100

200
500

800

900 900 900 I

900 600 300 II

800 400 300 III

600 400 300 IV

5
1
Se puede comprobar que ahora la estrategia mixta ptima para M es , 0, 0, y que el valor del
6
6
juego es -650.
Por lo tanto, la manera en que debe jugar M es la siguiente: arroja un dado, si el dado sale 6 se entrega
la rueda sin realizar ningn ensayo, caso contrario probar los tres rayos. Puesto que el valor del juego
es -650 hay motivos para que M pida por lo menos 650 como pago inicial adems de su costo de
produccin.
Ejemplo N 18
Dos polticos son adversarios en una campaa electoral. Ambos deben preparar su plan de actividades
para los tres das anteriores a la eleccin. Es difcil anticipar el resultado de dicha eleccin, lo que
requiere para ganarlas un esfuerzo inteligente de los contrincantes.
El plan de ambos polticos se basa en actuar en esos 3 das sobre 2 reas que tienen 10.000 y 5.000
votantes cada una.
Para no perder tiempo, los candidatos viajan de noche y piensan pasar un nmero entero de das (0, 1, 2,
3) en las reas mencionadas. La restriccin surgira porque slo hay transporte entre las 2 zonas de
noche, lo que obliga a pasar das enteros en cada zona.
El problema es cuntos das pasar en cada lugar si ambos polticos saben que obtienen en cada rea el 50
% de los votos si pasan el mismo nmero de das. Si un poltico no va a un rea, el otro obtendr el 55
%, el 58 % o el 60 % segn pase 1, 2 3 das.
Si un poltico pasa un da en una zona y el otro 2, el segundo tendr el 53 % de los votos y si pasa tres
das obtendr el 55 % de los votos.
Finalmente si un poltico pasa 2 das y el otro pasa tres das en cada zona, el segundo poltico obtendr
el 52 % de los votos.
Por supuesto ningn poltico puede esperar a ver que hace el otro ya que los arreglos para los viajes
deben ser hechos con anticipacin.
Cul ser la estrategia ptima?
juegos.doc

100

Prof. Ing. Claudio L. R. Sturla


Las estrategias de cada poltico a los que llamaremos I y II son pasar 3 das en la zona de 10.000 votantes y 0 en la otra 2 en la de 10.000 y 1 en la de 5.000 1 en la de 10.000 y 2 en la otra 0 en la de
10.000 y 3 en la de 5.000.
Es fcil entonces estudiar cuantos votos obtiene I en cada interseccin de estrategias.
I) 3 das en 10.000; 0 das en 5.000 - II) 3 en 10.000; o en 5.000
En este caso pasan el mismo nmero de das en las 2 reas. De acuerdo a esto es evidente que I obtiene
10.000 * 0,5 + 5.000 * 0,5 = 7.500
I) 3, 10.000; 0, 5.000 - II) 2, 10.000; 1, 5.000
En este caso I pasa ms das en la de 10.000 votos y el poltico II pasa 1 da ms en la de 5.000. Luego I
obtendr el 52 % en la primer zona y el (100 - 55) % en la segunda
10.000 * 0,52 + 5.000 * 0,45 = 7.450
I) 3, 10.000; 0, 5.000 - II) 1, 10.000; 2, 5.000
I pasa dos das ms en la zona de 10.000 que II. II pasa un da por lo que obtiene el 55 % de los votos y
el poltico II pasa dos das en la de 5.000 votos sin haber pasado I por la zona (58 % de los votos)
10.000 * 0,55 +5.000 * 0,42 = 7.600
I) 3, 10.000; 0, 5.000 - II) 0, 10.000; 3, 5.000
10.000 * 0,6 +5.000 * 0,4 = 8.000
I) 2, 10.000; 1, 5.000 - II) 3, 10.000; 0, 5.000
10.000 * 0,48 + 5.000 * 0,55 = 7.550
I) 2, 10.000; 1, 5.000 - II) 2, 10.000; 1, 5.000
10.000 * 0,5 +5.000 * 0,5 = 7.500
I) 2, 10.000; 1, 5.000 - II) 1, 10.000; 2, 5.000
10.000 * 0,53 + 5.000 * 0,47 = 7.650
I) 2, 10.000; 1, 5.000 - II) 0, 10.000; 3, 5.000
10.000 * 0,58 + 5.000 * 0,45 = 8.050
I) 1, 10.000; 2, 5.000 - II) 3, 10.000; 0, 5.000
10.000 * 0,45 + 5.000 * 0,58 = 7.400*
y as siguiendo.
La matriz de pago quedar:
3,10000
0,5000

2,10000
1,5000

110000
,
2,5000

0,10000
3,5000

7.500

7.550
7.400

7.000

7.450
7.500
7.350
6.950

7.600
7.650
7.500
7.100

8.000 3,10000; 0,5000

8.050 2,10000; 1,5000

7.900 110000
,
; 2,5000

7.500 0,10000; 3,5000

Actualizado al 14/9/2.002
D:\INVESTIGACIN OPERATIVA\FRBA JUEGOS
Este archivo fue impreso el 18/03/2008.

juegos.doc

101

También podría gustarte