Documentos de Académico
Documentos de Profesional
Documentos de Cultura
8295 PDF
8295 PDF
Juegos
COMPLETA (e. 2)
::~::
dil1tmicos
COI1 il1formacill
completa
y perfecta
/ 59
.
dor 2 lo sea: si 1piensa que 2 podra no ser racionill,
ro no que el Juga
1"
O'
pe
.
ger D en la primera etapa confiando en que 2 e 19wril, en
1 podna esCO
'.
'
I"
1 tercera
se nda, dando con ello la oportunida~.a 1 de Jug~r.
~n.8
la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el
~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonal
Juga or. es.que 2 cree que 1 podra no ser racional, 1 podna. escoger /) en
pero pIensa
.
l
.
' tapa confiando en que 2 pensara que 1 no es raClona, y, por
la pnmera e
"1
t
El
.
DI con la esperanza de que 1jugara D en a tercera e ilpa._"
tanto, Jugara
1 '. d D
r 'parte
USO de la induccin.hacia
atrs presupone que la e eCClOn e po.
eda
explicarse siguiendo este razonamiento. Para algunos Juegos,
,d e l pu
.
l'
. D arque 1
sin embargo, podra ser ms razonable suponer que J~go
~.'
.
.
.'
1
En
tales
J'uegosel
uso
de
la
mducClon
hacla
es, efectivamente, lrraClOna .
, . .
..
atrs pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal como
le a'sa al equilibrio de Nash en juegos en los que la teona de Juegos no
p
.'
una solucin nica y no cabe esperar acuerdo alguno enbe
proporclOna
los jugadores.
2.1.B El mod~lo de duopolio de Stackelberg
,.'0
,
temporal del juego es el sig'uiente: (1) La empresa 1
escoge una can t'd
1 a d ql >
_ O., (2) la empresa 2 observa ,11 .y escoge entonces
.
una cantidad q2 ? O; (3) las ganancias de la empresa ~Vlenen dadas pOI la
funcin de beneficio
'7ri(q;,qj)
donde P(Q)
= qi[P(Q)
el,
a - Q es el precio de equilibrio
de mercado cuando la
ql -
qz 2:0
q2 -
el,
lo que resulta en
R2(ql) =="
a-ql-e
'
,.'
,.'
==maxqIfa - ql - R2(qi)
Ql2:0 .
. '.
-:- el
.
.. a- ql.""'"C
==maxql
'2
. ,.
Q2:0
lo que resulta' en
a-c
qi == -. -2-
a-c
R2(qi) ==-4-
que es el resultado por induccin hacia atrs del juego del duopolio de
Stackelberg.4
'..
'.
4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" se
refieren tpicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mencin
del "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas en
vez de ~u:nultneas. Sin embargo, como se ha constatado en la secci'nanterior, los juegos
con deaslones sucesivas poseen a menudo mltiples equilibrios de Nash, de los cuales slo
uno est asociado can el resultado obtenido por induccin hacia atrs del juego, Por tanto, el
"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como al
uso de unrnterio de solucin ms poderoso que el mero equilibrio de Nash.
..
'
".
,"
1\3
= O.
=maxR(L)
L2:0
- wL,
max7r(w,L)
L2:0
Pendiente =
R(L)
L * (w)
Figura 2.1.1
Para garantizar que la condicin de primer orden R'(L) -w =. O ~enga
solucin, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la
figura 2.1.1.
La figura 2.1.2 representa L * (w) en funcin de tu (pero ~tiliza l~s e!es
de forma que faciliten la comparacin con grficos postenores) e lnchca
que L*(w) corta cada una de las curvas de isobeneficio de la e~1presa
en su punto mximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.anto
mejor cuanto menor sea w, de forma que las curvas :sobenefIClo Dfenores
representan niveles de beneficio ms altos. La fi.gura 2.1.3 representa
las curvas de indiferencia del sindicato. Mantemendo L constante, el
sindicato est tanto mejor cuanto ms alto sea w, de forma que las curvas
de indiferencia ms altas corresponden a niveles de utilidad mayores del
sindicato.
6 Esta
dado 'UJ.
concreta
beneficio
ltima propiedad es simplemente otra manera~e decir que L *('UJ) maximiza 7f( ["w)
Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa se
en la eleccin de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel de
posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por
'UJ
1J)'.
1
1
-w,
2 ,~ + 2-wB
- g(e*)
>- Ua.
Juegos repetidos / 81
(2.2.7)
Jugador 2
Iz
Jugador 1
WB
= 2Ua
+ 2g(e*) -
WA.
(WA -
WB)
f(j)2dj
1,
Y (2.2.8)determina entonces
WA Y"illB.
2.3Juegos repetidos
En esta seccin analizarnos si las amenazas y promesas sobre el comportamiento futuro pueden influir en el comportamiento presente en situaciones que se repiten en el tiempo. Buena parte de lo que hay que entender
en estas situaciones se ha visto ya en el caso de dos periodos; pocas ideas
nuevas se requieren para entender los juegos con un horizonte infinito.
Hemos definido tambin el equilibrio de Nash perfecto en subjuegos. Esta
defircin tiene una expresin ms sencilla para el caso especial de los juegos repetidos que en el general de los juegos dinmicos con informcin
completa que considerarnos en la seccin 2.4.B. La introducirnos aqu para
tacilitar la exposicin posterior.
. '.
2.3.A Teora: Juegos repetidos en dos etapas
Consideremos el dilema de los presos dado en forma normal de la figura
2.3.1. Supongamos que hay dos participantes en este juego que deciden
simultneamente en dos ocasiones, habiendo observado el resultad"ode li,'l
primera decisin antes de decidir por segunda vez, y supongamos que las
D2
1,1 5,0
0,5 4,4
(2.2.8)
('.
Figura 2.3.1
Jugador 2
Iz
D2
2,2 6,1
Jugador 1
1,6 5,5
Figura 2.3.2
Llamaremos a este juego repetido el dilema de los presos en:dos etapas.
Este juego pertenece a la clase de los juegos analizada en la seccin 2.2.A.
Aqu los jugadores 3 y 4 son idnticos a los jugadores 1 y 2, los espaCios
de acciones A3 y A4 son idnticos a Al y AZ Y las ganancias ui(al,a2,a3,a1l
son simplemente la suma de las ganancias en la'pnmera etapa (i.;a2)
y en la segunda etapa (a3,a4)' Adems, el dilema de los presos en d.s
etapas satisface el supuesto que hicimos en la seccin 2.2.A: para cada
resultado factible de la primera etapa del juego, (al,a21, el juego restant.e
en la segunda etapa entre los jugadores 3 y 4 tiene un nico equilibrio
de Nash, que denotamos por (a3(al,a21,a,i(al,a2'
De hecho, el dilema
de los presos en dos etapas satisface este supuesto de forma clara, como
seguidamente indicamos. En la seccin 2.2.A peTInitini.osla posibilidad de
que el equilibrio de Nash del juego restante en la segunda etapa dependa
del resultado de la primera etapa -de aqu la notacin (a; (al ,a2) ,a (al ,a2
en vez de simplemente (aj,a). (En el juego de los aranceles, por ejemplo;
las cantidades de equilibrio escogidas por las empresas en la segunda
etapa dependan de los aranceles escogidos por los gobiernos en la primera
etapa.) Sin embargo, en el dilema de los presos en dos tapas, el nico
~'.
[IleSOS
...
}:
Definicin. Dado un juego de etapa G, G(T) denota el juego r.epetido finitamente en el que G se juega T veces, habiendo los jugadores observado los
resultados de todas las jugadas anteriores antes de que empiece la siguiente. Las
ganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .
etapa.
Proposicin. Si el juego de etapa G .tiene un nicQequilibrio de Nash, entonces,
para cualquier T finito, el juego repetido G(T) tiene un ~ico resultado perfecto
en subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3
13 Se ~btienen resUltados anlogos si el juego de etapa G es un jego dinmic con informadn completa. Supongamos que G es un juego dinmico con inJonndn completa y
perfecta de la clase definida en la secdn 21.A. Si G tiene un rjco resultado por inducdn
hada atrs, G(T) tiene un nico resultado perfecto en subjuegos: en cada etapa se juega el
resultado por inducdn hacia atrs de G. Sinillarmente, supongamos que G es un juego en
repef idos / 83
lora al caso de dos periodos, pero consideramos la posi.. vodlvdemqo:::1 J'uego de etapa G tenga mltiples equilibrios :le ..NilSh,
blhda
e
. d
. d
[y C ll1utan 1
3 3 1~as estrateglils enOillma as ./. d /
en l a fi gura 2 ..,
. 1
como
enOJ1Unal
.
de los presos d e l a fi gura 23.. I , pero las estrategias
. 'b .ilS
dIlem; sido aadidas al juego de forma que ahora existen dos eqUlh nos
Di ha
'.
(1 J) como en el dilema de los presos, y
,2
.
"1'
I
N h en estrategIas puras.
de as d
1
' (D D) Natura men te, es artl' f)' cial aadir un eqUllt mo a
a~ora a de~as pr~~os2de esta manera, pero nuestro inters en este juego
dIlema, e os 't'vo que sustan h' va. En la prxima seccin veremos que
es mas exposll
, 'h d
uilibrios
.
tidos infinitamente comparten este espm I e eq ..
los Juegos ~epe
'1'
d etapa que se repiten infinitamente tienen
. "
u'Iti les mc1uso SI os Juegos e
m . ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en
un UNCOeq.
.
de etapa artificial en el contexto Sl1nple
. , n analIZamos un Juego
est~::cC1:riodos, y nos preparamos con ello para el anlisis poster~or de
de
p
..'
'co en un contexto con honzonte
un juego de etapa con mteres economl ,
infinito.
1-:'"
--
1,6
]1 1,1
1,1 1,1
~''!.
Figura 2.3.4
Existen tres equilibrios de Nash con estrategias puras en el juego
de la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2,
los equilibrios de Nash de este juego de una etapa corresponden a los
resultados perfectos en subjuegos del juego repetido original. Denotemos
con w,x),(y,z)
un resultado del juego repetido: (w,x) en la primera etapa
y (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4
corresponde al resultado perfecto en subjuegos (1],[Z),(1],[2 del juego
repetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z)
como consecuencia de cualquier resultado en la primera etapa excepto de
(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura
~.3.4 corresponde al resultado perfecto en subjuegos Dl,Dz),(11'!Z
del
Juego repetido. Estos dos resultados perfectos en subjuegos del juego
repehdo simplemente enlazan los resultados de los equilibrios de Nash
de los juegos de etapa, pero el tercer equilibrio de Nash de la figura
2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura
todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones es
nunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidones
mduso mas generales.
Juegos rq;elidos / 85
2.3.4 corresponde al resultado perfecto en subjuegos Cl,Cz),(D],D2)
del
juego repetido, puesto que el resultado previsto en la segunda etapa es
(Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'
anteriormente, se puede alcanzar la cooperacin en la primera etapa de
un resultado perfecto en subjuegos del juego repetido. Esto es un ejemplo
de un resultado ms general: si G = {Al,'"
,An; uI- ... ,un} es un juego
esttico con informacin completa que tiene mltiples equilibrios, pueden
existir resultados perfectos en subjuegos del juego repetido G(T) en los
que, para cualquier t < T, el resultado de la etapa t no es un equilibrio
de Nash de G. Volveremos sobre esta idea en el anlisis de un juego con
horizonte infinito en la prxima seccin.
Juegos repetidos / 87
que
el
repetidos
infinitamente
''-.-
(,
~
..
1'.
~,
COMPLETA (c. 2)
Jugador 2
D2
1,1 5,0
Jugador 1
0,5 4,4
Figura 2.3.6
Supongamos que el dilema de los presos de la figura 2.3.6 se repite
infinitamente y que, para cada t, los resultados de las t - 1 jugadas anteriores del juego de etapa se han observado antes de que la t-sima etapa
empiece. Sumar simplemente las ganancias de esta sucesin infinita de
juegos de etapa no proporciona una medida til de la ganancia de un
jugador en el juego repetido infinitamente. Recibir una ganancia de 4 en
cada periodo es mejor que recibir una ganancia de 1 en cada periodo, por
ejemplo, pero la suma de ganancias es infinita en ambos casos. , Recordemos (en el modelo de negociacin de Rubinstein <;lela seccin 2.1.D)
que el factor de descuento 5 = l/O + 1') es el valor actual de lila peseta
que se vaya a recibir en el periodo siguiente, donde l' es el tipo de inters
por periodo. Dados un factor de descuento y las ganancias de un jugador
obtenidos de una sucesin infinita de juegos de etapa, podemos calcular
16 El teorema de tradicin oral original se referia a las ganancias en todos los equilibrios
de Nash de un,juego repetido infinitamente. A este resultado se le llam teorema de tradicin
oral por ser ampliamente conocido entre los tericos de juegos de os "aos cincuenia, aun
sin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgnancias
en ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y,
por tanto, refuerza el teorema de tradicin oral original al utilizar un criterio de solucin ms
fuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo,
el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)
se les llama a veces teoremas ele tradicin oral, aun cuando' no hayan sido ampliamente
conocidos entre los tericos de juegos antes de ser publicados.
.'
L 5 l7f
de la sucesin
00
t.
t=I
c..
';-',
"'~'-
,,",
'.'
Juegos repetidos ! 91
5 + 0.1 +
.0
.1 + ... = 5 + -"-.
1-0
.::
..,'
_.
. _
'.
"'.~
~,.~-
V =5+ 1_
Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel
disparador(trigger strategy);.
'llamadaas p'orque el jugad~i coopera hastaquealguieridefa de Cooperar,
lo qu~Aesencadena' la;dcisln'de. rtovivi '~'.'cooperair.Utlcaffis: Si
ambos jugadores adoptnla, estrat~gia derdlsparador, el resUltado d~l"
juegorepeti~o inffuitamertte ser (Dl,D~)enCdaetapa.' Yerembs pnmeio
que si o est' lo suficientemente Cerca de uno, el hecho de que los dos
jugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash del
juegorepetid infinitamente. Veremos a contiriu~cin que este equilibrio
de Nash es'perfecto en subjuegos, en un sentido que se precisar ms
adelante.
Para demostrar que la adopcin de la estrategia del disparador por
parte de los dos jUi?adores es un equilibrio de Nash del juego repetido
infinitamente, supondremos que el jugador i ha adoptado la estrategia
del disparador ydemostraremos a'continuacin, siempre que o est lo
suficientemente cerca de uno, que adoptar esta estrategia es tambin la
mejor respuesta del jugador j. Dado que el jugador i jugar I para
siempreeuand el resultado de alguna ronda difiera de (Dl~D2), lafuejor
respuesta del jugador j es efectivamente jugar Ij para siempre ruando el
resultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar la
mejor respuesta del jugador ien la primera etapa yen cualquier etapa tal
que los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionara
una ganancia de 5 en esta etapa, pero desencadenara la riocooperacin
del jugador"i (y, por tanto, tambin del jugador j) enio sucesivo, de forma
que la ganancia en cada etapa futUra sera 1: Comd'1++2+:. /=1/(1-0),
el valor presente de esta:sucesin de ganancias es
.
V=4+l/,
;.0
<
o'
5 + 1 _ '
(2.3.1)
,"
Juegos repetidos I 93
clor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores del
jllego de etapa son conocidos antes de que empiece la t-sima etapa. La ganancia
de cada jugador en G(co,o) es el valor presente de las ganancias que el jugador
outiene en la sucesin infinita de juegos de etapa.
En cualquier juego (repetido o no), la estrategia de un jugador es un
plan completo de accin, es decir, especifica una accin factible del jugador
en cada contingencia en la que le pudiera corresponder actuar. Dicho de
forma algo ms frvola, si un j~ga_dordejara una estrateg!a a su abogado
anles de que el juego empezase, el abogado podra sustituir al jugador
en el juego, sin necesitar en ningn caso de instrucciones adicionales
sobre cmo jugar. En un juego esttico con informacin completa, por
ejemplo, una estrategia es simplemente una accin. (Por esto describimos
lal juego como G = {S,,,,,Sn;'U,
... ,un} en el capitulo t pero aqu
pu:de describirse tambin como G = {A], ... ,An; U, '" ,un}: en un juego
estallco con informacin 120mpletael ~spacio de estrategias del jugador i,
Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juego
dinmico, una estrategia es ms complicada.
Consideremos el dilema de los presos en dos etapas analizado en la
seccin anterior. Cada jugador acruados veces, de forma que podra
pensarse que una estrategia es simplemente un par d irIstrucciones (b,c),
donde b es la decisin en la primera etapa y e es la decisin en la segunda
elapa. Pero existen cuatro resultados posibles de la pr11leraetapa, (1,1z),
U,Dz),(D1,1 y (D,D, que representan cuatro contingencias diferentes
en las que al jugador l~ podra corresponder actuar. Por tanto, la estrategia
de cada jugador consta de cinco instrucciones, que indicamos mediante
(VW,x,y,z), donde v es la decisin en la primera etapa y w,x,y y zson''!as
decisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (DJz) y
(D,Dz) respectivamente. Usando esta notacin, las instrucciones "jugar b
en la primera etapa y jugar e en la segunda pase lo que pase enla primera"
se describen como (b,c,c,c,c), pero esta notacin tambin puede expresar
estrategias en las que la decisin de la segunda etapa es contingente del
resultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b en
la pnmera etapa y jugar e en la segunda ronda a menos que el resultado
de la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, en
el juego. repetido en dos etapas basado en la figura 2.3.3, la estrategia
de cada Jugador consta de diez instrucciones, una decisin en la primera
etapa y nueve decisiones contingentes en la segunda etapa, una para cada
resultado posible de la primera etapa. Recordemos que al analizar el
liegos "e'e/idos
al juego original G(oo,o). Como en el caso con horizonte finito, existen tantos
subjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias del
juego hasta la etapa t.
Obsrvese que la t-sima etapa de un juego repetido no es por s misma
un subjuego del juego repetido (suponiendo que t < T en el caso finito).
Un subjuego es una parte del juego original que no slo empieza en un
momento en que la historia del juego hasta entonces es informacin del
domino pblico entre todos los jugadores, sino que tambin incluye todas
las decisiones posteriores a ese rnome~toen el juego original. Analizar la
t-sima etapa aisladamente sera equivaierit~a considerar la t-sima etapa
corno la etapa final del juego repetido .. Tal anlisis podra llevarse a cabo
pero no sera relevante para el juego repetido original.
Estamos ahora preparados para la definicin de equilibrio de Nash
perfecto en subjuegos, la cual depende a su vez de la definicin de equilibrio de Nash. Esta ltima no 11acambiado desde el captulo 1, pero ahora
apreciamos la complejidad potencial de la estrategia de un jugador en
un juego dinmico: en cualquier juego, un equilibrio de Nash es una coleccin de estrategias, una para cada jugador, tal que la estrategia de cada
jugador es la mejor respuesta a las estrategias de los dems jugadores.
Definicin. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegos
si las estrategias de los jugadores constituyen un equilibrio de Nash en cada
subjuego.
'
,
,
qs
(0,5)
(5,0)
Ganancia al
jugador 1
Figura 2.3.7
'
Aplicamos seguidamente argumentos anlogos al juego repet.do infi'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman
(1971) para juegos repetidos infinitamente. Para enunciar' el teorema, necesitarnos dos ltimas definiciones. Primero, llamamos factIbles a las ga. (Xl,"" x n ) en ell'uego de etapa G si son una combinacin
convexa
nanCIas
.
(es decir, una media ponderada donde las ponderaciones son no-negativas
y suman uno) de las ganancias a las estrategias puras de. G. El conju.llto
de ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es la
regin sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras
(1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los
, ) para 1 < x., < 4 que resultan de las medias ponderadas de (1,
pares (X,X
1) Y (4, 4), Y los pares (y,z) para y + z = 5 Y O < Y < 5, que resl1.ltan.de
las medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenor
de) la regin sombreada de la figura 2.3.7 son medIas ponderadas de las