Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Juegos
Juegos
Sturla
REPBLICA ARGENTINA
FRBA TEORA DE
JUEGOS
Puede reproducirse libremente. Se agradecer citar la fuente.
THE RECORDING, COPYING, LOAN, UNAUTHORIZED HIRE, PUBLIC SHOWING OR
BROADCAST OF THIS DATAGRAM IS STRONGLY ENCOURAGED.
Claudio L. R. Sturla
Bibliografa:
Buffa, Elwood S. y Taubert, William H., Sistemas de Produccin e Inventario, Planeacin y
Control, Editorial Limusa, Mxico, 1.978.
Dorfman, R., Samuelson, P. A., y Solow, R. M., Programacin Lineal y Anlisis Econmico, Aguilar.
Dresdner, Mario O., Evelson, Abel R. y Dredner, Eduardo C., Tcnicas Cuantitativas Aplicadas a
las Decisiones en la Economa de Empresas, Editorial El Coloquio, Buenos Aires.
Gass, Saul, Programacin Lineal ,Mtodos y Aplicaciones, CECSA, Mxico, 1.985, ISBN
968-26-0057-X.
Heims, Steve J., Von Newmann y N. Wiener, 2 tomos, Biblioteca Salvat de Grandes Biografas,
Salvat Editores, S. A., Barcelona, 1.986.
Mc Kinsey, J. C. C., Introduccin a la Teora Matemtica de los Juegos, Aguilar.
Shubik, Martin, Game Theory in the Social Sciencies, Concepts and Solution, The MIT Press,
Massachusetts, EE.UU., ISBN 0-262-69091-8. (Hay traduccin castellana bajo el ttulo de Teora de
los juegos en las Ciencias Sociales, Fondo de Cultura Econmica).
A su vez:
Problemas de decisin
Enfrentamiento con oponentes racionales.
Certidumbre.
66
juegos.doc
67
1 1
P1 selecciona filas y P2 columnas. La interseccin de la fila y la columna seleccionadas da el valor de lo
pagado a P1 .
Supongamos que yo soy P1 y juego con frecuencia 0,5 a cada fila. Mi probabilidad de ganar (esperanza
matemtica de la ganancia), si P2 juega a guila es:
1
1
1
+ ( 1) = 0
2
2
( 1)
1
1
+1 = 0
2
2
1
por ejemplo 0,7
2
E ( x1 , x 2 , y1 ) = 2 0,7 1 = 0,4 ; E ( x1 , x 2 , y 2 ) = 1 2 0,7 = 0,4
Si x
1
, por ejemplo 0,2
2
juegos.doc
68
4 2
La esperanza matemtica de la ganancia de P1 es:
E ( x , y ) = 1 x y + 3 x( 1 y ) + 4( 1 x ) y + 2( 1 x )( 1 y ) =
= x y + 3 x 3 x y + 4 y 4 x y + 2( 1 y x + x y ) =
= x y+ 3 x 3 x y+ 4 y 4 x y+ 2 2 y 2 x+ 2 x y =
1
1 5
= 4 x y + x + 2 y + 2 = 4 x y +
2
4 2
1
(en los grandes nmeros
2
1
ganar 5/2). Anlogamente, si P2 se resigna a perder 5/2 debe jugar con y = .
4
Despus lo veremos formalmente pero nuevamente se ve que hay una seleccin mejor que otras (si uno
es prudente).
Consideremos el siguiente juego dado por la matriz de pago:
Si yo soy P1 y me conformo con ganar 5/2 me basta con jugar con x =
1 5 0 4
2 1 3 3
4 2 1 0
Para el jugador P1 se presentan tres opciones. Sera importante que uno buscara primero lo peor que le
puede pasar por fila. Entonces:
mn a1 j = a13 = 0
j
mn a2 j = a22 = 1
j
mn a3 j = a33 = 1
j
juegos.doc
69
mx ai 2 = a12 = 5
i
mx ai 3 = a23 = 3
i
mx ai4 = a14 = 4
i
Si se diera que
mx mn aij = mn mx aij = v
i
P1 puede estar seguro de ganar como mnimo v y P2 puede impedir que P1 gane ms que v.
Pero.. cmo son estos jugadores?
Son inteligentes o sea si conociere cada jugador la estrategia que
el otro va a elegir, l seleccionar la estrategia que le
reportar el mayor beneficio.
Son prudentes o sea buscan obtener el resultado con la mayor seguridad posible. Obran con cuidado.
Si se cumpliera que:
mx mn aij = mn mx aij = v
i
y1
y2
y 3 de nme
yn
70
1 2 3
0 7 2
mx mn aij = mn mx aij = a11 = 3
i
1 3
2 2
1 2
Ejemplo N 2
Los siguientes juegos tienen solucin de punto minimax. Determinar las estrategias puras ptimas para
cada jugador.
juegos.doc
71
; x = ( 1,0) ; y =
4 12 2 2
6
1 0
0 0
0 1
12 6
5 2 0 7 5
5 6 4 8 4 ; x = ( 0 1 0) ; y =
4 0 2 3 3
5
0
0
1
0
Si no hubiera punto de ensilladura con los conocimientos que tenemos no existe solucin. Slo un
circuito de elecciones posibles. En el caso de que no haya punto de minimax no hay equilibrio en el
juego.
Tomemos por ejemplo el siguiente juego que no tiene punto de ensilladura:
B
4 2 5
A
1 3 1
Si A juega 25 veces a la fila 1 y 75 veces a la fila 2, la ganancia media de A si B elige la columna 1 ser:
V( 0,25; B1 ) = 0,25 4 + ( 1) 0,75 = 0,25
Si B eligiera la columna 2:
V( 0,25; B2 ) = 0,25( 2) + 3 0,75 = 1,75
Si B eligiera la columna 3:
V( 0,25; B3 ) = 5 0,25 + 1 0,75 = 2
B ignora las estrategias de A.
Teorema de VON NEWMANN
Llamaremos E ( x ) a la esperanza matemtica de la ganancia de P1 . Tambin llamada funcin de pago.
El teorema dice:
*
*
"Existe para el maximizante una estrategia mixta ptima x1 , x 2 para la cual su
*
*
ganancia media E x1 , x 2
*
*
*
juego y existe para el minimizante una estrategia mixta ptima y1 , y 2 , y 3
para la
*
*
*
cual su prdida media E y1 , y 2 , y 3 ser inferior o igual al valor del juego v."
juegos.doc
72
x i aij y j
i= 1 j= 1
Definicin 4: Una solucin a un juego matricial son dos estrategias mixtas ptimas
x * = x1* , x 2* , , x m*
*
y =
y1*
y 2*
y n*
1 1
1 / 2
1 1
*
*
el valor del juego es cero y las estrategias ptimas son x = , ; y =
. Sin demostrarlo
2 2
1 / 2
aceptamos como axioma que un juego con v = 0 es justo.
Todo nos permite decir ahora que
E x, y * E x * , y * E x * , y
(a)
73
Ejemplo N 3
Dos jugadores hablan simultneamente diciendo o piedra o papel o tijeras. La combinacin de papel y
piedra gana una unidad para el jugador que dijo papel (el papel envuelve a la piedra); para piedra y
tijeras gana la piedra (la piedra rompe las tijeras) y para tijeras y papel ganan las tijeras (cortan al papel).
Si los dos jugadores mencionan lo mismo no hay pago.
Plantear la matriz de pago y dar el valor del juego.
La matriz de pago si P1 es el jugador maximizante es:
Piedra Papel Tijeras
Piedra
Papel
Tijeras
0
1
1
1
0
1
Por la definicin 5 el valor del juego es cero pues la matriz es oblicua simtrica.
Propiedad: Para una nueva matriz de pago donde el valor de los elementos es
aij + w y w es un nmero positivo, las estrategias ptimas son las mismas que
para el juego original y el valor del nuevo juego es v + w .
y son iguales. Esto es, todo juego matricial tiene una solucin.
Ejemplo N 4
Un jugador extiende alguno o algunos de sus dedos y al mismo tiempo supone (dicindolo) cuntos
dedos extiende el otro. El nmero de dedos que se puede extender es 1, 2 3.
Si uno solo de los jugadores adivina, su pago es el total del nmero de dedos extendidos. De lo contrario su pago es cero.
Equivalencia del juego matricial y el problema de programacin lineal
Supondremos que se nos da un juego matricial arbitrario:
juegos.doc
74
a21
am1
a12
a22
am2
a1n
a2 n
amn
a1n x1 +
a 21 x 2 + + a m1 x m v
a 22 x 2 + + a m 2 x m v
a 2 n x 2 + + a mn x m v
x1 + x2 + + xm = 1 ; xi 0 i
En forma similar para P2 :
a11 y1 + a12 y 2 + + a1n y n v
a y + a y + + a y v
21 1
22
2
2n
n
am1 y1 + a m2 y 2 + + amn y n v
y1 + y2 + + yn = 1 ; y j 0 i
Como cada elemento de (A) puede hacerse positivo mediante la suma de una constante apropiada a
todas las aij podemos suponer que v 0.
Si hacemos
x1 =
m
x1
1 m
1
= xi =
v i= 1
v
y j
1 n
1
= yj =
v j= 1
v
i= 1
n
j= 1
Al minimizar
i= 1
xi
yj
xi
; y j =
v
v
j= 1
y j , P2 minimizar el valor
del juego.
Entonces podemos redefinir el problema de programacin lineal de la siguiente manera:
Primal:
Encuentre un vector
juegos.doc
75
x = x1 , x 2 , , x m
x1 + x2 + + xm
sujeto a:
a11
a12
a
1n
x1 + a 21 x 2 + + a m1 x m 1
x1 + a 22 x 2 + + am2 x m 1
x + a2 n x + + a mn x
xi 0 i
El problema dual:
Encuentre un vector
y =
y1
y 2
y 3
y 4
a12 y1 + a22 y 2 + + a2 n y n 1
a y + a y + + a y 1
m2
2
mn
n
m1 1
y j 0 j
Puesto que el juego tiene solucin, existen soluciones ptimas a los problemas anteriores y
m
mn
i= 1
xi = mx
j= 1
y j =
1
v
Ejemplo N 5
Dada la matriz de pago
juegos.doc
76
8 2 3 9
4 6 5 7
Determinar, aplicando programacin lineal, las estrategias ptimas para los dos jugadores.
6 x1 + 8 x 2
2 x2
3 x1 + 3 x 2
8 x1 + 9 x 2
+
+
+
+
4
6
5
7
x3
x3
x3
x3
v
v
v
v
x1 + x2 + x3 = 1 ; xi 0 i
El dual ser:
6 y1 +
+ 3 y3 + 8 y4 v
8 y1 2 y 2 + 3 y 3 + 9 y 4 v
4 y + 6 y + 5 y + 7 y v
1
2
3
4
y1 + y2 + y3 + y4 = 1 ; y j 0 i
Si dividimos miembro a miembro por v:
6 y1 +
+ 3 y 3 + 8 y 4 1
8 y1 2 y 2 + 3 y 3 + 9 y 4 1
4 y + 6 y + 5 y + 7 y 1
1
2
3
4
1
y1 + y2 + y3 + y4 = mx
v
Sumamos un nmero w = 2 a la matriz original.
8 2 5 10
10 0 5 11
6 8 7 9
El dual ser:
8 y1 + 2 y 2 + 5 y 3 + 10 y 4 1
+ 5 y 3 + 11 y 4 1
10 y1
6 y + 8 y + 7 y + 9 y 1
1
2
3
4
y1 + y 2 + y 3 + y 4 =
juegos.doc
1
max
v*
77
10 y1 + 5 y 3 + 11 y 4 + 2 = 1
+ 3=1
6 y1 + 8 y 2 + 7 y 3 + 9 y 4
La resolucin por programacin lineal es:
0
1
1
ck
0
0
0
0
0
1
Base
P5
P6
P7
P0
1
1
1
0
1
P1
8
10
6
-1
1
P2
2
0
8
-1
1
P3
5
5
7
-1
1
P4
10
11
9
-1
0
P5
1
0
0
0
0
P6
0
1
0
0
0
P7
0
0
1
0
P5
P6
P3
2/7
2/7
1/7
1/7
26/7
40/7
6/7
-1/7
-26/7
-40/7
8/7
1/7
0
0
1
0
25/7
32/7
9/7
2/7
1
0
0
0
0
1
0
0
-5/7
-5/7
1/7
1/7
P5
P1
P3
1/10
1/20
1/10
3/20
0
1
0
0
0
-1
2
0
D
0
0
1
0
6/10
16/20
6/10
8/20
D
3
y1 =
y1 + y3 =
1
0
0
0
x1
-13/20
7/40
-3/20
1/40
x2
1/5
1/5
1/7
2/26
2/40
1/6
-1/4
-1/8
1/4
1/8
x3
1
1
; y3 =
20
10
1
3
* 20
=
v
=
3
v * 20
y1 =
y1
1 20 1
*
y
=
y
v
=
=
1
1
20 3 3
v*
y3 =
y3
v*
1 20 2
y3 = y3 v * =
=
10 3 3
y1 + y3 =
1 2
+ =1
3 3
1
1
x1 = 0 ; x2 =
; x3 =
40
8
juegos.doc
78
1 20 1
1 20 20 5
=
; x3 =
=
=
40 3 6
8 3 24 6
x1 + x2 + x3 = 0 +
v* =
1 5
+ =1
6 6
20
; v* = v + 2
3
20
14
v = v* 2 =
2=
3
3
Aqu, si sobrare tiempo, se puede intercalar
programacin lineal de papel, piedra y tijeras.
la
resolucin
por
Principio de dominancia
Sea el juego definido por la siguiente matriz:
2 4 1 0
3 1 4 2
El valor del juego para A si juega a la primera fila con probabilidad p1 y si B juega a la primera columna
es:
V A ( p1 , B1 ) = 2 p1 + 3( 1 p1 ) = 2 p1 + 3 3 p1 = 3 p1
El valor calculado es la esperanza matemtica de la ganancia para el jugador A si A juega a la primer fila
con probabilidad p1 y el jugador B juega a la primer columna.
Si B juega con estrategia B1 y A juega a la primera fila pierde 2 y si juega a la segunda pierde 3.
Si B jugara a la cuarta columna y A a la primera fila, B pierde 0.
Si A jugara a la segunda fila, B perdera 2.
Siempre convendr a B jugar en la cuarta columna. B nunca jugar a la primera. Se dice que la primera
columna es dominada. Entonces el juego se transforma es una matriz como:
4 1 0
1 4 2
De la misma manera, toda fila dominada por otra puede ser suprimida en la matriz de un juego.
Es importante porque permite reducir algunos juegos al tamao 2 x 2 que se resuelven fcilmente en
forma grfica.
Ejemplo N 6
Reducir el siguiente juego aplicando dominancias:
3 0 2
4 5 1
4 3 3
juegos.doc
79
5 1
3 3
Ahora todos los elementos de la primera fila son menores a los de la tercera. La tercera domina a la
primera. Se anula la primera.
5 1
3 3
Ejemplo N 7
Reducir el siguiente juego aplicando dominancias:
3 10 16
5 4
3
2 8 3
Jugador A
x1
y1
4
y2
8
x2
6
2
que no tiene punto de ensilladura. El jugador seleccionara por minimax la peor situacin de cada alternativa (4 para x1 y 2 para x2 ) para luego optar por la que asegura la mayor de dichas ganancias
mnimas. El valor del juego para A es:
VA = 4
que es la retribucin mnima que espera ganar jugando su estrategia x1.
De la misma manera el valor del juego para el jugador B es
VB = 6
pero esto es un crculo vicioso. Por ello deberan recurrir a estrategias mixtas. Supongamos que A juega
a sus alternativas x1 y x 2 con probabilidades p1 y ( 1 p1 ) . Su ganancia no depende de lo que l juega
sino de la estrategia seguida por B.
Por ejemplo si B juega su estrategia y1 , la ganancia de A ser:
V A ( p1 , y1 ) = 4 p1 + 6( 1 p1 ) = 4 p1 + 6 6 p1 = 6 2 p1
Expresin que da la esperanza matemtica de la ganancia del jugador A si l juega a la primer fila
con frecuencia relativa x1 y el jugador B juega a la primera columna.
Si B jugara a la estrategia y2 :
juegos.doc
80
6
= 0, 75
8
Hasta aqu ha sido una mera resolucin con geometra analtica elemental.
Ahora veamos como se puede resolver grficamente.
La figura muestra la variacin de la ganancia esperada por el jugador A para diversos valores de p1
cuando su adversario juega sus estrategias y1 e y2 .
V A ( p1 = 0,5; y1 ) = 4 0,5 + 6 0,5 = 5
V A ( p1 = 0,5; y 2 ) = 8 0,5 + 2 0,5 = 5
juegos.doc
81
M
4
2+6 p
Q
6-2 p1
p*1
0,3
Supongamos que A carga su bolillero con p1* bolillas blancas. En ese caso su beneficio oscilara entre
SN y SM de acuerdo a las estrategias que adopte el jugador B. Con criterio conservador A esperara
ganar SN. Es decir, SN sera el
( )
V A p1*
Para otros valores de p1 entre 0 y 1 el valor esperado ser la quebrada PQR. Como A pretende maximizar su ganancia mnima, es obvio que eligir el valor p1 = 0, 5 con lo que se asegura un valor esperado de la ganancia de
V A ( p1 ) = 5
El punto Q es el mayor. Por un razonamiento anlogo en la figura se ve que la estrategia ptima para B
es con q1 = 0, 75
V B ( q1 ) = 5
juegos.doc
82
8-4 q 1
6
4
2
2+4 q
0,75
q1
0,3
Este mtodo de resolucin grfica de juegos puede utilizarse tambin para aquellos juegos cuya matriz
consta de 2 filas y ms de 2 columnas o de 2 columnas y ms de 2 filas.
Sea por ejemplo el siguiente juego:
2 4 1 0
3 1 4 2
p1 + p2 = 1 ; p2 = 1 p1
Analticamente puede hallarse:
V A ( p1 , y1 ) = 2 p1 + 3( 1 p1 ) = 2 p1 + 3 3 p1 = 3 p1
V A ( p1 , y 2 ) = 4 p1 + ( 1 p1 ) = 4 p1 + 1 p1 = 1 + 3 p1
V A ( p1 , y 3 ) = p1 + 4( 1 p1 ) = p1 + 4 4 p1 = 4 5 p1
V A ( p1 , y 4 ) = 2( 1 p1 ) = 2 2 p1
La figura muestra como varan las ganancias esperadas al variar p1 entre 0 y 1.
juegos.doc
83
6
4
2
4-5p 1
1+3p1
3-p 1
2-2p 1
Analizando la figura se ve claramente que el jugador B no est interesado en las estrategias y1 e y3 pues
le aseguran una prdida mayor que la ganancia esperada por A. Entonces q1 = q3 = 0. Slo resta hallar
los valores de q2 y q4 .
La columna 1 es dominada por la 4.
En cambio la columna 3 no es dominada estrictamente.
Una dominancia estricta significa que las relaciones entre elementos de filas o columnas se expresan
mediante los signos y no .
q2 + q4 = 1 ; q4 = 1 q2
V B ( q 2 , x1 ) = 4 q 2 + 0( 1 q 2 ) = 4 q 2
V B ( q 2 , x 2 ) = q 2 + 2( 1 q 2 ) = q 2 + 2 2 q 2 = 2 q 2
juegos.doc
84
6
4
2
4q2
1,6
2-2q 1
q 2
0,4
Ejemplo N 8
Resolver grficamente el juego asociado con la siguiente matriz de pago:
1 3 11
8 5 2
V A ( p1 , y1 ) = p1 + 8( 1 p1 ) = p1 + 8 8 p1 = 8 7 p1
V A ( p1 , y 2 ) = 3 p1 + 5( 1 p1 ) = 3 p1 + 5 5 p1 = 5 2 p1
V A ( p1 , y 3 ) = 11 p1 + 2( 1 p1 ) = 11 p1 + 2 2 p1 = 2 + 9 p1
VA
2+9p1
8-7p 1
6
4
4,5
5-2p 1
2
0,27
juegos.doc
1
85
3
5 49
= 5
=
= 4 ,45
11
11 11
y1 = 0 ; p1 = 0, 27 ; p2 = 0, 73 ; V A = 4 , 45
Planteamos para B.
V B ( q 2 , x1 ) = 3 q 2 + 11( 1 q 2 ) = 3 q 2 + 11 11 q 2 = 11 8 q 2
V B ( q 2 , x 2 ) = 5 q 2 + 2( 1 q 2 ) = 5 q 2 + 2 2 q 2 = 2 + 3 q 2
VB
11-8q
6
4,5
4
2
2+3q2
q 2
0,81
11 8 q2 = 2 + 3 q2
9 = 11 q2
q2 =
11 8 q2 = 11 8
9
11
9 121 72 49
=
=
4, 5
11
11
11
Ejemplo N 9
Un supermercado desea implantar un sistema de vigilancia para su sector ventas. A tal efecto se han
considerado dos zonas (A y B) en el edificio, el cual consta de una sola planta. La primera, donde se
juegos.doc
86
Los dos
policas
TT
AA
BB
TA
TB
AB
A
0,51
0,64
0,19
0,58
0,37
0,46
y1
B
0,75
0,36
0,91
0,6
0,85
0,76
y2
x1
x2
x3
x4
x5
x6
Otro ejemplo.
juegos.doc
87
(3)
(1)
0,63
0,6 (4)
(6)
0,4 (2)
(5)
0,2
y1
0,58
juegos.doc
88
18
3
6
7
2 Valores en armamentos
12 Acciones comerciales
La lnea 3 domina (en forma no estricta) a la lnea 1. Esto transforma la matriz de pago:
18 6 2
2 7 12
Las inecuaciones que rigen el juego son: (si y slo si la naturaleza fuese racional, pero no se comporta como tal desde nuestro punto de vista).
18 x2 + 2 x3 v
6 x2 + 7 x3 v
2 x2 + 12 x3 v
x2 + x3 = 1
Aplicando el mtodo grfico se encuentra:
juegos.doc
89
5
12
; x3 =
; v = 6, 7
17
17
5
12
+ 2 = 6, 7
17
17
5
12
+ 7 = 6, 7
17
17
Si hay paz:
( 2)
5
12
+ 12
= 7,88
17
17
5
12
= 2. 941 UM en armamento y 10. 000 UM
= 7. 059 UM en acciones
17
17
comerciales, el financista se asegura por lo menos una ganancia de 670 UM.
Colocando 10. 000 UM
.
5t
-1.000 -1.000 -1.240 1240
.
6t
-1.200 -1.200 -1.200 1200
Si ahora la oficina meteorolgica afirma que el invierno no ser riguroso. Cul ser la estrategia ptima?. Se suprimen las filas y columnas terceras.
Suave
Normal
. 1020
.
4t
800 1020
.
1000
. 1000
.
5t
1000
v = 1. 000
juegos.doc
90
10
20 30 40
50
0 0 0 0 0 0 ej. 0 UM
0
3 5 5 5 5 5 10 ej. 3 UM
6 2 10 10 10 10 20 ej. 6 UM
9 1 7 15 15 15 30 ej. 9 UM
12 4 4 12 20 20 40 ej. 12 UM
15 7 1 9 17 25 50 ej. 15 UM
Lo prudente es que no venda. Pero de eso vive. El vendedor tratar de obtener datos sobre la demanda.
Los juegos contra la naturaleza son juegos donde si bien se conocen los varios futuros posibles no se
conoce su distribucin de probabilidades.
Habr que recurrir a algn criterio para aplicar en cada problema de decisin.
Criterio de LAPLACE
Trabaja con incertidumbre. Dado que no se conocen las probabilidades de los estados futuros, se
considera a stos equiprobables.
1
Si hay n futuros posibles supondremos que las probabilidades de cada uno de ellos es . Adoptaremos
n
el mayor valor esperado.
Para cada estrategia las esperanzas son:
Ei =
aij
1
n
Ei
y luego se elige mx
i
Ejemplo N 13
Una empresa debe optar entre dos mquinas (A y B) para procesar una pieza. Para una de ellas (la A) el
costo de preparacin es de 2.000 UM y el costo unitario de produccin 20 UM. La otra (la B) tiene
costos de 5.000 y 10 UM respectivamente. Qu mquina es la ms conveniente si el precio de venta es
de 30 UM/u y la produccin requerida est dentro del rango 100 Q 400 u ?
La ganancia bruta que se obtiene con A B es:
juegos.doc
91
F2
F3
.
500 2.000 A1 (m quina A)
1000
Podra objetarse el conjunto de futuros que se han enunciado. Este es el inconveniente de LAPLACE.
La decisin puede ser condicionada por la forma en que se plantean los futuros posibles. Veamos el
mismo ejemplo con ms posibilidades de demanda:
100
150
200
250
300
350
400
.
500
0
500 1000
.
1500
.
2.000 A1
1000
.
0 1000
.
2.000 3.000 A2
3.000 2.000 1000
VE ( A1 ) = 1000
.
1
1
1
1
1
1
500 + 500 + 1000
.
+ 1500
.
+ 2.000 = 500
7
7
7
7
7
7
VE ( A2 ) = 3.000
1
1
1
1
1
1
2.000 1000
.
+ 1000
.
+ 2.000 + 3.000 = 0
7
7
7
7
7
7
Se elige la alternativa 1.
Criterio de WALD
Es un criterio de pesimismo. La persona que decide se pone en la posicin de mayor pesimismo. En el
ejemplo visto se preguntara: qu es lo peor que me puede pasar?
Peor compensacin
A1
-1.000
A2
-3.000
y ahora se elige el ms favorable de los peores ( A1 ) . Es el criterio en que se bas VON NEWMANN.
Criterio de HURWICZ
Supongamos que tenemos la siguiente matriz de pago:
9 2
3 7
juegos.doc
92
H1
H2
6
4
2
= 1 /3
Si la posicin del jugador es pesimista 0 elige la estrategia 2 que le asegura menos prdida.
3
1
1
3
tiene esperanzas ms altas.
Ejemplo N 14
Naturaleza
1
2 UM
5 UM
-4 UM
1.000 UM
H1 =
99
1
2+
5 = 2 , 03
100
100
Jugador
Si =
1
100
juegos.doc
93
99
1
1000 = 5,94
( 4) +
100
100
Se puede calcular el coeficiente de optimismo para el cual la lnea 2 sea preferida sobre la 1.
(1 ) 2 +
5 = ( 4)( 1 ) + 1000
.
2 2 + 5 = 4 + 4 + 1000
.
2 + 3 = 4 + 1004
.
6 = 1. 001 =
6
0, 006
1. 001
Mquina A
Mquina B
F2
500
0
F3
2.000
3.000
Mquina A
Mquina B
F1
0
2.000
F2
0
500
F3
1.000
0
Estos son pesares. De ellos queremos, por supuesto, el menor. En nuestro problema tendremos:
Mquina A
Mquina B
Afliccin
1.000
2.000
La eleccin recae en A.
Ejemplo N 15
juegos.doc
94
A1 ( 8 UM / u)
A2 ( 10 UM / u)
A3 ( 12 UM / u)
A4 ( 14 UM / u)
A5 ( 16 UM / u)
A6 ( 18 UM / u)
A7 ( 20 UM / u)
F1
-30
Precios de la competencia
F2
F3
F4
10
15
20
F5
20
-20
20
20
30
40
-10
10
20
30
60
-15
20
40
80
-20
-15
10
40
90
-30
-20
20
100
-50
-30
-20
40
F1
-20
F2
20
F3
20
F4
30
F5
40
-10
10
20
30
60
-15
20
40
80
-20
-15
10
40
90
-30
-20
20
100
A6 ( 18 UM / u)
a) Criterio de Laplace:
VE A2 = 20 0, 2 + 20 0, 2 + 20 0, 2 + 30 0, 2 + 40 0, 2 = 18
VE A3 = 10 0, 2 + 10 0, 2 + 20 0, 2 + 30 0, 2 + 60 0, 2 = 22
VE A4 = 15 0, 2 + 0 0, 2 + 20 0, 2 + 40 0, 2 + 80 0, 2 = 25
VE A5 = 20 0,2 15 0,2 + 10 0,2 + 40 0,2 + 90 0,2 = 21
VE A6 = ( 30 + 20 + 0 + 20 + 100) 0,2 = 14
b) Criterio de WALD:
A2 = 20
A3 = 10
A4 = 15
A5 = 20
A6 = 30
c) Criterio de HURWICZ
c.1) = 0, 2
juegos.doc
95
F1
10
0
5
10
20
F2
0
10
20
35
40
F3
0
0
0
10
20
F4
10
10
0
0
20
F5
60
40
20
10
0
Valor mximo
60
40
20
35
40
A4 pareciera ser el ms conveniente. Pero se puede cuestionar esta decisin con un criterio ms o menos
pesimista.
Ejemplo N 16
juegos.doc
96
240 UM
(80) UM
(120) UM
10 UM
========
50 UM
De esta forma se puede construir la matriz de beneficios (se indican slo algunas filas).
Demanda
300 400 500 600 700 800
60 60 60 60 60 60 300
10
600
700
800
Determinar el nmero de panes a fabricar cotidianamente aplicando los diferentes criterios. Tomar
1
= para el criterio de HURWICZ.
2
Ejemplo N 17
Se va a fabricar un cierto objeto muy costoso el cual consta de tres partes anlogas y tales que el objeto
es satisfactorio si cada una de las partes lo es. Para mayor precisin puede suponerse que el objeto es
una rueda con tres radios. Para que la rueda sea satisfactoria, cada radio debe tener una resistencia
mecnica (y para dar la idea de que es costosa podemos pensar que se trata de una rueda bastante
grande que debe obtenerse en una sola pieza).
El consumidor, G, de esta rueda (el gobierno o un laboratorio astronmico) no est en condiciones de
fabricarla l mismo, por tanto la encarga a un fabricante M en las siguientes condiciones: G paga a M
una cierta cantidad para que fabrique la rueda bajo ciertas especificaciones; una vez terminada de
construir de acuerdo con dichas especificaciones, M puede tirarla a la basura (en cuyo caso cabe suponer
que su valor de rescate es cero) o puede entregarla a G el cual la someter a prueba; si la encuentra
satisfactoria G pagar a M una cantidad adicional A; en caso contrario es M quien satisface a G con una
multa B (A y B son, naturalmente, nmeros positivos).
No obstante, como G ha pagado ya a M por fabricar la rueda y como no desea dejar abierta la posibilidad de que ste pueda fabricarla solo por el pago inicial, impone la condicin adicional de que M no
juegos.doc
97
98
1
5
C C
3
3
B
B
B I
A
2
1
A C
B C
B C
C II
3
3
1
5
4
A 2C
B C
C
C
3
3
3
III
4
A 3C
2C
C
C IV
3
El valor de este juego para M y sus estrategias ptimas al jugarlo, dependen de los valores relativos de
A, B y C.
As por ejemplo si tomamos A = 100, B = 300 y C = 3 (de manera que la multa por entregar una rueda
defectuosa sea muy grande en comparacin con el costo de comprobacin) obtendremos la matriz:
0
94 155 4
3 155
4
3 6
91 6 *
I
II
III
IV
As, lo peor que puede sucederle es que la rueda tenga un solo radio defectuoso y la mejor estrategia de
M ser la IV ( es decir, probar todos los radios de la rueda). Jugando dicha estrategia M puede estar
seguro de no perder una cantidad mayor a 6. Por lo tanto al hacer el contrato M debe exigir a G un pago
inicial que exceda al costo de produccin en por lo menos 6 unidades.
Por otra parte si tenemos A = 100, B = 300 y C = 303 (de manera que sea costoso hacer la prueba)
obtenemos la matriz:
juegos.doc
99
303 IV
809 606 404
En este caso la forma ms desfavorable de actuar de la naturaleza con respecto a M es hacer uno o ms
(no importa cuantos) radios defectuosos. Lo mejor para M ser jugar la estrategia I (o sea, no realizar
ninguna prueba). De este modo, al ser mayor el costo de comprobacin, slo puede estar seguro de que
su prdida ser a lo sumo 300.
Mediante una eleccin adecuada de A, B y C puede incluso ocurrir que la matriz no tenga una lnea
nica para elegir. As sucede si tomamos A = 100, B = 900 y C = 300, en cuyo caso se obtiene la matriz:
0
100
200
500
800
5
1
Se puede comprobar que ahora la estrategia mixta ptima para M es , 0, 0, y que el valor del
6
6
juego es -650.
Por lo tanto, la manera en que debe jugar M es la siguiente: arroja un dado, si el dado sale 6 se entrega
la rueda sin realizar ningn ensayo, caso contrario probar los tres rayos. Puesto que el valor del juego
es -650 hay motivos para que M pida por lo menos 650 como pago inicial adems de su costo de
produccin.
Ejemplo N 18
Dos polticos son adversarios en una campaa electoral. Ambos deben preparar su plan de actividades
para los tres das anteriores a la eleccin. Es difcil anticipar el resultado de dicha eleccin, lo que
requiere para ganarlas un esfuerzo inteligente de los contrincantes.
El plan de ambos polticos se basa en actuar en esos 3 das sobre 2 reas que tienen 10.000 y 5.000
votantes cada una.
Para no perder tiempo, los candidatos viajan de noche y piensan pasar un nmero entero de das (0, 1, 2,
3) en las reas mencionadas. La restriccin surgira porque slo hay transporte entre las 2 zonas de
noche, lo que obliga a pasar das enteros en cada zona.
El problema es cuntos das pasar en cada lugar si ambos polticos saben que obtienen en cada rea el 50
% de los votos si pasan el mismo nmero de das. Si un poltico no va a un rea, el otro obtendr el 55
%, el 58 % o el 60 % segn pase 1, 2 3 das.
Si un poltico pasa un da en una zona y el otro 2, el segundo tendr el 53 % de los votos y si pasa tres
das obtendr el 55 % de los votos.
Finalmente si un poltico pasa 2 das y el otro pasa tres das en cada zona, el segundo poltico obtendr
el 52 % de los votos.
Por supuesto ningn poltico puede esperar a ver que hace el otro ya que los arreglos para los viajes
deben ser hechos con anticipacin.
Cul ser la estrategia ptima?
juegos.doc
100
2,10000
1,5000
110000
,
2,5000
0,10000
3,5000
7.500
7.550
7.400
7.000
7.450
7.500
7.350
6.950
7.600
7.650
7.500
7.100
7.900 110000
,
; 2,5000
Actualizado al 14/9/2.002
D:\INVESTIGACIN OPERATIVA\FRBA JUEGOS
Este archivo fue impreso el 18/03/2008.
juegos.doc
101