Está en la página 1de 23

08/04/2014

1
Teora de
Juegos
Parte 2
Universidad
Nacional San
Agustn
Dra. Norka Bedregal 1
Estrategias Mixtas
Dra. Norka Bedregal
2
Si existe un punto de silla, el juego es estrictamente
determinado y se tienen las estrategias ptimas para
ambos jugadores
Sin embargo, no todos los juegos tienen puntos de
silla
En estos casos cada jugador puede mejorar su
pago eligiendo diferentes
Cada jugador, en lugar de usar una sola estrategia,
puede jugar todas sus estrategias de acuerdo a un
conjunto predeterminado de probabilidades
08/04/2014
2
Estrategias Mixtas
Dra. Norka Bedregal
3
Sea A la matriz de orden m x n que define un
juego
Sean x
1
, x
2
, , x
m
las probabilidades de que el
jugador F elija la fila 1, 2, , m respectivamente
(estrategias puras)
Sean y
1
, y
2
, , y
m
las probabilidades de que el
jugador C elija la columna 1, 2, , n
respectivamente (estrategias puras)
Luego:
1
1 1
= =
= = i
m
i i
m
i
y x
Estrategias Mixtas
Dra. Norka Bedregal
4
En forma matricial:
Jugador
C
prob y1 y2 yn
x1 a11 a12 a1n
Jugador F x2 a21 a22 a2n

xm am1 am2 amn


La solucin del problema de estrategias mixtas
est basada en el criterio minimax-maximin
08/04/2014
3
Estrategias Mixtas
Dra. Norka Bedregal
5
La diferencia est en que:
el jugador de las filas elige la estrategia
asociada a x
i
que maximice el pago esperado
ms pequeo en una columna


= = =
i in
m
i
i i
m
i
i i
m
i x
x a x a x a
i 1
2
1
1
1
..., , , min max
El jugador de las columnas selecciona la
estrategia asociada a y
i
que minimiza el mayor
pago esperado en una fila


= = =
j mj
n
j
j j
n
j
j j
n
j y
y a y a y a
j 1
2
1
1
1
..., , , max min
Estrategias Mixtas
Dra. Norka Bedregal
6
Estos valores se denominan pagos maximin y
minimax esperados, respectivamente
Como en el caso de las estrategias puras se
verifica que
pago esperado minimax >= pago esperado maximin
Cuando se est en la solucin ptima se cumple
la igualdad y los valores resultantes llegan a ser
iguales al valor esperado (ptimo) del juego
Existen varios mtodos para resolver juegos de 2
personas, suma cero para valores x
i
, y
j
08/04/2014
4
Soluciones Matriciales
Dra. Norka Bedregal
7
Ejemplo:
Sea A la matriz que define un juego
C1 C2 prob
F1 5 35 x1
F2 20 10 x2
prob y1 y2
Como no hay puntos de silla, hay que emplear
estrategias mixtas
Si F selecciona F1, el pagos esperado es:
5 y1 + 35 y2
Si F selecciona F2, el pago esperado es
20 y1 + 10 y2
Soluciones Matriciales
Dra. Norka Bedregal
8
Ambos pagos esperados deben ser iguales
5 y1 + 35 y2 = 20 y1 + 10 y2
-15 y1 + 25 y2 = 0
Como y1, y2 son probabilidades
y1 + y2 = 1
Resolviendo el sistema
y1 = 0.625 y2 = 0.375
Anlogamente se procede con el jugador C
Se obtiene el sistema
-30 x1 + 10 x2 = 0
x1 + x2 = 1
08/04/2014
5
Soluciones Matriciales
Dra. Norka Bedregal
9
Cuya solucin es
x1 = 0.25 x2 = 0.75
Luego el valor ptimo del juego ser:
V* = 5 (0.25) + 20 (0.75)
= 35 (0.25) + 10 (0.75)
= 5 (0.625) + 20 (0.375)
= 20 (0.625) + 10 (0.375)
= 16.25
Soluciones Matriciales
Dra. Norka Bedregal
10
TRABAJO GRUPAL
1. Exponer los pasos de este mtodo de manera
general
2. Ejemplificar
08/04/2014
6
Solucin Grfica
Dra. Norka Bedregal
11
Ejemplo: Pares y Nones
Dos jugadores Par y Non escogen en forma
simultnea el nmero de dedos que van a ensear
(1 2). Si la suma de los dedos que muestran
ambos jugadores es impar, Non gana un sol que le
paga Par, si la suma de los dedos es par entonces
Par le gana un dlar a Non.
Suponiendo que Non es el jugador de la fila y Par
el de las columnas, se tiene:
1 dedo 2 dedos
1 dedo -1 1
2 dedos 1 -1
Solucin Grfica
Dra. Norka Bedregal
12
El juego no tiene puntos de silla
Haciendo el anlisis en funcin de Non, se
supone que no va a seguir una estrategia pura,
sino mas bien una estrategia mixta, luego cada
alternativa debe tener una probabilidad de
seleccin
1 dedo 2 dedos prob
1 dedo -1 1 x1
2 dedos 1 -1 x2
pero x1 + x2 = 1, luego cualquier estrategia mixta
se puede escribir:
(x1, 1 x1)
08/04/2014
7
Solucin Grfica
Dra. Norka Bedregal
13
Si Par muestra un dedo, la recompensa esperada
para Non es:
(-1)(x1) + (1)(1 x1) = 1 - 2 x1
Anlogamente si Par muestra dos dedos la
recompensa esperada por Non es :
2 x1 - 1
Se pueden graficar ambas rectas:
Solucin Grfica
Dra. Norka Bedregal
14
X1
X2
(1, -1)
(1, 1)
(0, -1)
(0, 1)
(1/2, 0)
08/04/2014
8
Solucin Grfica
Dra. Norka Bedregal
15
Observacin:
Esta tcnica slo es til cuando uno de los dos
jugadores tiene dos posibles estrategias
independientemente de cuntas estrategias tenga
el otro jugador
TRABAJO GRUPAL
1. Exponer los pasos de este mtodo para el caso
en que el jugador de las filas tiene dos
estrategias y el de las columnas n estrategias
posibles
2. Ejemplificar
Solucin:
Programacin Lineal
Dra. Norka Bedregal
16
Objetivo:
Determinar las estrategias ptimas de los dos
competidores F y C
Supuestos:
Se supone que la matriz de juegos no tiene filas ni
columnas recesivas, ya que al buscar estrategias
ptimas nunca se elegirn las estrategias recesivas.
Tambin se supone que todos los pagos de la matriz
son positivos. Si esto no es as se define una nueva
matriz de juegosB tal que
b
ij
= a
ij
+ k
Donde k es una constante positiva lo
suficientemente grande para que todo elemento de la
nueva matriz de pagos sea positivo
08/04/2014
9
Solucin:
Programacin Lineal
Dra. Norka Bedregal
17
Motivacin:
La teora de juegos tienen una relacin
estrecha con la programacin lineal, ya que
todo juego finito de dos personas y suma cero
puede expresarse como un problema lineal
Recprocamente, todo problema lineal puede
expresarse como un juego
La programacin lineal es especialmente til
cuando el juego est representado por una
matriz grande
Solucin:
Programacin Lineal
Dra. Norka Bedregal
18
En el desarrollo de las estrategias mixtas se
mostr que:


= = =
i in
m
i
i i
m
i
i i
m
i p
p a p a p a
i 1
2
1
1
1
..., , , min max
Donde se cumple:
0
1 ...
2 1

= + + +
i
m
p
p p p
El problema, as planteado puede ponerse en la
forma de un problema lineal, haciendo:

=
= = =
i in
m
i
i i
m
i
i i
m
i
x a x a x a v
1
2
1
1
1
..., , , min
08/04/2014
10
Solucin:
Programacin Lineal
Dra. Norka Bedregal
19
Luego se tendra:
max Z = v
Donde v representa al valor del juego
La formulacin completa ser:
m i p
p
n j v p a
a sujeto
v z
i
i
m
i
i ij
m
i
,..., 2 , 1 0
1
,..., 2 , 1
:
max
1
1
=
=
=
=
=
=
Solucin:
Programacin Lineal
Dra. Norka Bedregal
20
La formulacin anterior puede simplificarse
dividiendo entre v, las n+1 restricciones funcionales
Esta divisin es correcta si v es mayor que cero (no
cambia la desigualdad)
Si v es menor que cero (cambia la desigualdad)
Si v es cero no estara definida la divisin
Estos problemas se solucionan agregando una
constante positiva k a todos los elementos de la matriz
de pagos, garantizando as que para la matriz
modificada el valor del juego sea positivo
08/04/2014
11
Solucin:
Programacin Lineal
Dra. Norka Bedregal
21
El valor real del juego se determina restando k del
valor modificado del juego
En general, si el valor maximin del juego e son
negativo, entonces el valor del juego es mayor que cero
(siempre que el juego no tenga puntos de silla)
TRABAJO GRUPAL!!!!!!
1. Plantear el problema lineal dividiendo cada
restriccin funcional entre el valor v
2. Haga el trabajo de manera anloga pa encontrar el
problema lineal que corresponde al jugador de las
columnas
3. Ejemplifique cada caso
Juegos: Suma no cero
Dra. Norka Bedregal
22
Pueden ser:
Cooperativos. Si los jugadores pueden negociar
contratos obligatorios que les permitan planear
estrategias conjuntas
No Cooperativos: Si no son posibles la
negociacin y la aplicacin de un contrato
obligatorio.
Equilibrio en juegos que no son de suma cero
Hay dos Tipos de Equilibrio:
De estrategia dominante
De Nash
08/04/2014
12
Equilibrio:
Estrategias Dominantes
Dra. Norka Bedregal
23
La filosofa para resolver este caso es:
Estoy haciendo lo mejor que puedo sin
importar lo que tu hagas
Tu estas haciendo lo mejor que puedes
sin importar lo que yo haga.
Equilibrio de Nash
Dra. Norka Bedregal
24
La filosofa aqu es:
Yo estoy haciendo lo mejor que puedo dado
lo que tu estas haciendo
Tu estas haciendo lo mejor que puedes dado
lo que yo estoy haciendo.
Los equilibrios de Nash (definidos por John
Forbes Nash) forman parte de la teora de juegos y
son muy empleados en la economa, se definen
como una manera de obtener una estrategia
ptima para juegos que involucren a dos o ms
jugadores.
08/04/2014
13
Equilibrio de Nash
Dra. Norka Bedregal
25
El objetivo es verificar un conjunto de
estrategias, por las cuales ningn jugador se
beneficie cambiando su estrategia mientras los
otros no cambien la suya.
Nash demostr que si se permite estrategias
mixtas entonces todos los juegos finitos de n
jugadores tienen al menos un equilibrio de Nash
con estrategias mixtas.
De esta manera si el juego tiene un nico
equilibrio de Nash (considerando a los jugadores
racionales), los jugadores escogern las
estrategias que forman el equilibrio.
Equilibrio de Nash
Dra. Norka Bedregal
26
Se dice que una combinacin de estrategias (una
por jugador) que est en equilibrio de Nash si
ningn jugador puede aumentar sus ganancias por
un cambio unilateral de estrategia.
El adjetivo unilateral, especifica el carcter no
cooperativo de las elecciones individuales (el
cada cual para s mismo)
08/04/2014
14
Equilibrios
Dra. Norka Bedregal
27
Estrategias dominantes:
Elijo mi mejor estrategia posible,
independientemente de lo que t hagas.
Eliges tu mejor estrategia posible,
independientemente de lo que yo haga.
Equilibrio de Nash:
Elijo mi mejor estrategia posible, a la vista
de lo que t haces.
Eliges tu mejor estrategia posible, teniendo
en cuenta lo que yo he elegido.
Juegos: Suma no cero
Dra. Norka Bedregal
28
Ejemplo:
Considere el juego con las siguientes caractersticas:
Suma no cero
De dos personas
Cada jugador con tres estrategias
Se analizar el juego en funcin del jugador 1
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
08/04/2014
15
Juegos: Suma no cero
Dra. Norka Bedregal
29
Entonces 1 debera escoger A, pues la mejor
respuesta de 1 a D es A.
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
Suponga que 1 piensa que 2 escoger D
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
Juegos: Suma no cero
Dra. Norka Bedregal
30
Entonces 1 debera escoger A, pues la mejor
respuesta de 1 a E es A.
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
Suponga ahora que 1 piensa que 2 escoger E
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
08/04/2014
16
Juegos: Suma no cero
Dra. Norka Bedregal
31
Entonces 1 debera escoger A, pues la mejor
respuesta de 1 a F es A.
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
Suponga ahora que 1 piensa que 2 escoger F
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
Juegos: Suma no cero
Dra. Norka Bedregal
32
Independientemente de si el Jugador 2 escoge D,
E o F; la mejor respuesta del Jugador 1 es escoger
A
A es la Estrategia Dominante para el Jugador 1
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
08/04/2014
17
Juegos: Suma no cero
Dra. Norka Bedregal
33
Qu debera hacer el Jugador 2?
2 no tiene una estrategia dominante
Pero 2 debera razonar que 1 va a escoger
A.
Entonces el jugador 2 debe escoger F.
Jugador 2
Jugador 1
D E F
A 12, 11 11, 12 14, 13
B 11, 10 10, 11 12, 12
C 10, 15 10, 13 13, 14
Este resultado se conoce como Equilibrio de
Nash:
A es la mejor respuesta del jugador 1 a F
F es la mejor respuesta del Jugador 2 a A.
Juegos: Suma no cero
Dra. Norka Bedregal
34
Ejemplo:
Dos empresas A y B venden productos
competidores; estn decidiendo si han de
emprender campaas de publicidad o no.
No negocian entre ellos, pero ambas se vern
afectadas por la decisin de su competidora.
Analizar:
1. Si es un juego cooperativo o no
2. El equilibrio de estrategia dominante
3. El o los equilibrios de Nash
08/04/2014
18
Juegos: Suma no cero
Dra. Norka Bedregal
35
Suponga que la matriz correspondiente es:
Empresa B
Empresa A
Hacer
publicidad
No hacer
publicidad
Hacer
publicidad 10, 5 15, 0
No hacer
publicidad 6, 8 10, 2
Es no cooperativo, ya que las empresas no
negocian
Para la empresa A la estrategia pura dominante
es hacer publicidad, (No importa lo que haga B,
tiene pagos mayores a lo de B 10 > 5 y 15 > 0).
Juegos: Suma no cero
Dra. Norka Bedregal
36
Para la empresa B una estrategia pura dominante
es hacer publicidad ya que sus pagos 5 y 8 son
mayores a los de no hacer publicidad 0 y 2.
Como ambas estrategias coinciden para este
juego no cooperativo la estrategia dominante es
hacer publicidad.
Empresa B
Empresa A
Hacer
publicidad
No hacer
publicidad
Hacer
publicidad 10, 5 15, 0
No hacer
publicidad 6, 8 10, 2
08/04/2014
19
Juegos: Suma no cero
Dra. Norka Bedregal
37
El equilibrio de Nash se obtienen en aquellos
puntos donde cada jugador esta haciendo lo mejor
que puede dadas las acciones del oponente.
Tambin coincide con la estrategia de que ambas
empresas hagan publicidad, cada empresa esta
satisfecha y no tiene ningn incentivo para
cambiarla.
El Dilema del Prisionero
Dra. Norka Bedregal
38
El Dilema del Prisionero (Prisoner's dilemma) es
un modelo de conflictos muy frecuentes en la
sociedad que ha sido profundamente estudiado
por la Teora de Juegos.
Andrs y Ral fueron capturados robando un
automvil.
El Ministerio Pblico sospecha que son
responsables de un robo cometido hace unos
meses.
El Ministerio Pblico decide hacerlos participar
en un juego de forma que no pueden comunicarse
entre ellos.
08/04/2014
20
El Dilema del Prisionero
Dra. Norka Bedregal
39
Reglas del juego
A los prisioneros se les coloca en habitaciones
separadas y no pueden comunicarse entre s.
Se les informa que son sospechosos del robo
anterior.
Si ambos confiesan, sern sentenciados a cinco
aos.
Si uno confiesa y el otro no, el que confiese
ser sentenciado a 5 aos y el otro a 10 aos.
Si ambos lo niegan slo se les dar dos aos
por delito menor.
El Dilema del Prisionero
Dra. Norka Bedregal
40
Estrategias (posibles acciones)
Ambos pueden:
Confesar el robo anterior
Negar haber cometido el robo anterior
Recompensas
Existen cuatro resultados posibles:
Ambos confiesan.
Ambos lo niegan.
Andrs confiesa y Ral lo niega.
Ral confiesa y Andrs lo niega.
Las alternativas para cada prisionero pueden
representarse en forma de matriz de pagos.
08/04/2014
21
El Dilema del Prisionero
Dra. Norka Bedregal
41
Matriz de Pagos del Dilema de los Prisioneros,
los valores son negativos pues nadie quiere ser
condenado
Ral
Andrs
Confiesa Niega
Confiesa -5, -5 -5, 10
Niega -10, -5 -2, -2
Surge una estrategia dominante.
Ambos deberan negarlo
Si ambos lo niegan, sern sentenciados
solamente a 2 aos; pero no saben si el otro lo
negar.
El Dilema del Prisionero
Dra. Norka Bedregal
42
Matriz de Pagos del Dilema de los Prisioneros
Si Andrs lo niega pero Ral no, Andrs recibir
10 aos.
Si Andrs confiesa pero Ral lo niega, Andrs
recibir solamente 5 aos.
Al final, ambos deciden que les conviene
confesar, equilibrio de Nash.
Ral
Andrs
Confiesa Niega
Confiesa -5, -5 -5, 10
Niega -10, -5 -2, -2
08/04/2014
22
El Dilema del Prisionero
Dra. Norka Bedregal
43
Este es un juego no cooperativo ya que no
pueden ponerse de acuerdo
La estrategia dominante para cada prisionero es
confesar sin importar lo que haga el otro
El equilibrio de Nash tambin seria confesar,
considerando lo que haga el otro prisionero (-5,-5).
Como vemos la estrategia de confesar es una
estrategia dominante para ambos, aunque
terminan peor que si ambos se hubieran puesto de
acuerdo para negarlo.
El Dilema del Prisionero
Dra. Norka Bedregal
44
Dos individuos que persiguen sus intereses
personales, se ven guiados a un resultado adverso
para ambos salvo que existan normas que impidan
la traicin.
El resultado es una solucin de equilibrio.
08/04/2014
23
INTRODUCCION
Dra. Norka Bedregal
45

También podría gustarte