Está en la página 1de 9

EL USO DE SISTEMAS DINMICOS ESTOCSTICOS

EN LA TEORA DE JUEGOS Y LA ECONOMA

Roberto Serrano

CEMFI Working Paper No. 0707

Julio 2007

CEMFI
Casado del Alisal 5; 28014 Madrid
Tel. (34) 914 290 551. Fax (34) 914 291 056
Internet: www.cemfi.es

Agradezco la hospitalidad del CEMFI en Madrid.

CEMFI Working Paper 0707


Julio 2007

EL USO DE SISTEMAS DINMICOS ESTOCSTICOS


EN LA TEORA DE JUEGOS Y LA ECONOMA

Resumen

Este breve artculo glosa algunas de las aplicaciones recientes de sistemas dinmicos
estocsticos de la Teora de Juegos y la Economa. El modelo que se describe con
ms detalle demuestra que la nica asignacin estocsticamente estable de un
proceso de intercambio entre coaliciones sujeto a errores en la toma de decisiones es
la asociada al equilibrio de mercado. Resultados como ste proveen una nueva
fundamentacin a un concepto central en la Teora Econmica.

Roberto Serrano
Brown University and IMDEA
roberto_serrano@brown.edu

Introducci
on

El enfoque evolutivo a la Biologa se puede emprender con herramientas de la Teora de Juegos, porque lo
que se est
a estudiando es el juego de la vida o el juego de la supervivencia entre las distintas especies.
Cada especie exhibe unos patrones de comportamiento, hay interacci
on entre ellas, y uno puede preguntarse
que tipo de comportamientos son los que sobrevivir
an en el largo plazo. Por ejemplo, uno puede intentar
capturar la l
ogica de Darwin de este modo. Fijemos un modo de comportamiento o estrategia que todos
los individuos de una poblaci
on est
an por el momento siguiendo. Supongamos que hay una mutaci
on en
los genes de esta poblaci
on. Esto es, de repente una peque
na proporci
on  > 0 de individuos empiezan a
comportarse de otro modo. A partir de ahora hay tres tipos de interacciones que uno puede encontrar en el
juego b
asico: no mutante con no mutante, no mutante con mutante y mutante con mutante. Si uno
interpreta los pagos del juego a cada individuo como el n
umero de descendientes, una pregunta interesante
es si esta mutaci
on tender
a a desaparecer porque la descendencia relativa del mutante, con respecto al no
mutante, es menor. De lo contrario, estamos ante una mutaci
on con exito que eventualmente se extiende
a todo el sistema.
Esta l
ogica lleva al concepto de estrategias evolutivamente estables, esto es, aquellas que son inmunes a
este tipo de invasiones por parte de mutantes arbitrarios. Una observaci
on de interes es que este concepto
est
a basado en una manera de perturbar el sistema din
amico que es bastante irrealista. La perturbaci
on,
consistente en la aparici
on aleatoria del mutante, se concibe como un hecho aislado en el tiempo, y de
hecho sus efectos se estudian bajo el supuesto de que, mientras est
an pasando, el sistema no est
a sujeto
a ninguna otra perturbaci
on. Pero en general uno debera esperar que, mientras los efectos de la primera
perturbaci
on se est
an a
un notando, el sistema reciba un nuevo shock. Y m
as a
un: mientras los efectos de
estas dos perturbaciones est
an teniendo lugar, una tercera ocurra, etc., etc. Este argumento motiva el uso
de sistemas din
amicos estoc
asticos, en los cuales la matriz de transici
on ya incorpora las probabilidades
de toda posible perturbaci
on. (Una referencia b
asica importante es el libro de Freidlin y Wentzell [5].)
En las u
ltimas dos decadas la metodologa de sistemas din
amicos estoc
asticos se ha venido utilizando
con creciente frecuencia en la Teora de Juegos y en la Economa. Entre las primeras aplicaciones de la
metodologa se encuentra su uso en la Biologa evolutiva, como en el trabajo de Foster y Young [4], pero
muy pronto surgieron aplicaciones a la Teora de Juegos en general en los trabajos de Kandori, Mailath
y Rob [7] y Young [12]. Desde el punto de vista conceptual, hay un gran interes en la adopci
on de esta
metodologa en juegos. El concepto del equilibrio de Nash, la soluci
on central de la Teora de Juegos, es
algunas veces atacado debido a la gran racionalidad que requiere de parte de los jugadores. Sera deseable
en aras del realismo el que tal concepto no dependiera de tan grandes niveles de sofisticaci
on intelectual
de los agentes. Esta metodologa evolutiva, basada en los sistemas din
amicos estoc
asticos, tiene mucho
que decir al respecto.
El modelo que se estudia habitualmente fija un juego, esto es, conjuntos de estrategias y funciones de
pagos. En el juego participan agentes que, lejos de ser racionales, est
an programados para usar una
determinada estrategia. Estos agentes no son conscientes del complejo mundo en el que viven, ni dedican
gran parte de su tiempo a pensar en que estrategia deben emplear. De hecho, la mayora del tiempo,
siguiendo un fuerte componente de inercia, emplean la misma estrategia que usaron el periodo anterior
(aquella que, por ejemplo, aprendieron en su entorno social de familia y amigos). De vez en cuando, sin
embargo, este proceso de inercia se ve interrumpido por una fuerza de selecci
on, en el sentido biol
ogico
del termino. Es decir, alg
un agente decide poner un poco m
as de esfuerzo en pensar en su estrategia,
determinando por ejemplo que debera elegir una mejor respuesta al perfil de estrategias que los otros
eligieron el periodo anterior. Finalmente, hay adem
as fuerzas aleatorias en el sistema mutaciones, errores,
experimentaci
on que llevan a que, con probabilidad positiva aunque peque
na, cualquier estrategia se elija.
La pregunta relevante es si se puede determinar cu
ales ser
an las estrategias que se eligen en el juego la
mayora del tiempo en el largo plazo. Tales estrategias se denominan estoc
asticamente estables. Y la
respuesta, m
as que interesante, is que, bajo ciertas condiciones, se puede demostrar que tales estrategias
est
an relacionadas con cierto tipo de equilibrios de Nash. Una gran fuente de consulta que describe muchas

de las aplicaciones a juegos es el libro de Young [13].


En este artculo, para fijar ideas, nos concentraremos en la aplicaci
on de las mismas herramientas a
economas de intercambio. Una economa de intercambio es un sistema donde los agentes intercambian los
bienes que cada uno posee para llegar a una mejor asignaci
on de los recursos disponibles. En tal contexto,
uno puede preguntar si la asignaci
on final es eficiente, o si tiene alguna relaci
on con aquella que saldra
de un equilibrio en una red de mercados competitivos. Modelos as se han estudiado en los artculos de
Ben-Shoham, Serrano y Volij [1], Kandori, Serrano y Volij [8], o Serrano y Volij [10]. De hecho, el modelo
que describiremos m
as en detalle lo tomaremos prestado de este u
ltimo artculo. Pasamos a describirlo.
Fijemos una economa de intercambio, esto es, preferencias de los agentes y dotaciones individuales de
bienes. El proceso din
amico de intercambio que analizaremos, una formalizaci
on de las ideas de Edgeworth
[2], es el siguiente. Cada periodo, obedeciendo a fuerzas de inercia, los agentes intercambian sus dotaciones
iniciales como lo hicieron en el periodo pasado para llegar a una nueva asignaci
on de recursos, y tras ese
intercambio, consumo de los bienes tiene lugar. Sin embargo, de vez en cuando, una coalici
on de agentes
puede formarse. Esta coalici
on eval
ua si, mediante la redistribuci
on entre sus miembros de los recursos
coalicionales, todos pueden mejorar. Si as fuera, la coalici
on firma este nuevo contrato, que por tanto
puede romper los contratos previos que sybyacan el anterior status quo. Esta posibilidad de contratos
coalicionales es an
aloga a la fuerza de selecci
on descrita anteriormente. Por u
ltimo, las fuerzas aleatorias
en el sistema pueden venir dadas porque los agentes pueden equivocarse con una peque
na probabilidad, y
firmar un contrato coalicional que no les favorece. Como antes, la pregunta en este contexto es si se pueden
caracterizar las asignaciones de recursos en la economa a las que este proceso de intercambio llevar
a la
mayora del tiempo en el largo plazo, es decir, las asignaciones estoc
asticamente estables del proceso.
Como describiremos, bajo ciertas condiciones, la respuesta ser
a la asignaci
on asociada con el equilibrio
competitivo de mercados.

Metodologa: Primeros Auxilios en Procesos de Markov

A menudo un proceso de Markov M0 sin perturbaciones tiene m


ultiples distribuciones estacionarias o
invariantes, correspondientes a las m
ultiples clases recurrentes. Una clase recurrente del proceso es un
conjunto de estados tal que, si el proceso visita uno de ellos, no ser
a capaz de salir de dicho conjunto.
Cuando una clase recurrente contiene un solo estado, el estado en cuesti
on se denomina absorbente. Cuando
existen m
ultiples clases recurrentes, se hace difcil dar una predicci
on de largo plazo sobre la posici
on del
sistema: tal predicci
on depender
a en general de las condiciones iniciales.
El problema descrito justifica el uso de procesos de Markov perturbados. Para un arbitrariamente
peque
no  (0, 1), el proceso M perturbado es irreducible y las probabilidades de transici
on entre estados
convergen a las del proceso sin perturbaciones a una tasa exponencial. Tal proceso es erg
odico, lo cual
implica que tiene una u
nica distribuci
on estacionaria. La denotamos  . En efecto, las perturbaciones
hacen inviable el concepto de clase recurrente, ya que tales perturbaciones pueden llevar el sistema de
cualquier estado a cualquier otro en un n
umero finito de periodos. Una vez que el sistema ha echado a
andar durante un largo intervalo de tiempo, la distribuci
on estacionaria proporciona un buen estimador
de la frecuencia relativa con la que el sistema visita cada uno de los estados.
Se puede demostrar que la distribuci
on lmite, lim0  = existe, y es una de las distribuciones
estacionarias del proceso sin perturbaciones. Denominamos estados estoc
asticamente estables de M A

los que Asigna probabilidad positiva. Estos estados est


an Caracterizados como aquellos con mnimo
potencial estoc
astico (los de m
as f
acil acceso desde cualquier otro estado). La tarea de este enfoque
es la identificaci
on de tales estados, los cuales constituyen nuestra predicci
on de largo plazo cuando las
perturbaciones del sistema original obedecen el proceso M .

Aplicaci
on: Una Economa de Intercambio

Consideremos una de las economas de intercambio m


as simples, el llamado modelo de casas de Shapley y
Scarf [11]. Una economa de intercambio de casas,
E = hN, H, (i , ei )iN i,
donde
N = {1, . . . , n} es un conjunto finito de individuos,
H = {h1 , . . . , hn } es un conjunto finito de casas,
i es la relaci
on binaria de preferencias sobre H del agente i, la cual suponemos completa, transitiva
y antisimetrica, y
ei es la casa dotaci
on inicial de i.
Esto es, hay el mismo n
umero de individuos y casas. Cada agente est
a dotado inicialmente con una casa,
y tiene preferencias estrictas sobre las |N | casas.
Las siguientes son definiciones de importancia en la economa:
Coalici
on S: subconjunto no-vaco de N .
Asignaci
on factible para la coalici
on S: redistribuci
on de (ei )iS . Denotamos este conjunto AS .
Tambien, AN = A es el conjunto de |N |! asignaciones factibles en la economa.
Asignaci
on individualmente racional x A: no existe i N tal que ei i xi .
Asignaci
on del n
ucleo x A: no existe S N con y AS tal que yi i xi para todo i S.
Asignaci
on del n
ucleo fuerte x A: no existe S N con y AS tal que yi i xi para todo i S y
un j S.
yj j xj para alg
Asignaci
on competitiva x A: p IRH
+ \{0} tal que i N , h i xi implica ph > pei .
La u
ltima definici
on es el concepto central en la Teora Econ
omica de mercados. Es decir, existen
precios, uno por casa, que igualan la oferta y la demanda por cada casa. La economa se encuentra en
equilibrio: las fuerzas competitivas del mercado hacen ajustar los precios de tal manera que todo exceso de
demanda u oferta queda eliminado. La condici
on en la definici
on dice que aquellas casas que un individuo
prefiera a la que recibe en la asignaci
on de equilibrio caen fuera de su conjunto presupuestario (para
comprar una casa s
olo puede vender la que es su dotaci
on inicial). Por tanto, la casa que cada agente
recibe en equilibrio es una de las que a ella m
as le gustan entre las que se puede permitir comprar.
En estas economas, el siguiente resultado es de interes:
Lema (Roth y Postlewaite [9]): Sea E una economa de intercambio de casas como la definida. Entonces,
(i) Existe una u
nica asignaci
on competitiva w de la economa E.
(ii) La asignaci
on w es la u
nica en el n
ucleo fuerte.
(iii) Para cada asignaci
on x A, x 6= w, existe una coalici
on S tal que wS AS y satisface que wi i xi
para todo i S y wj j xj para alg
un j S.
Introduzcamos a continuaci
on el proceso de intercambio coalicional que estudiaremos. Como hemos
dicho, es una formalizaci
on de ideas de Edgeworth, que ya recibieron una modelizaci
on formal en los
trabajos de Feldman [3] y Green [6]. Nuestro tratamiento ser
a esencialmente una versi
on estoc
astica de
los procesos de estos autores.
Consideremos pues el proceso de intercambio M0 sin perturbaciones. En cada periodo t, si el sistema
est
a en la asignaci
on estado x(t), cualquier coalici
on S es elegida con probabilidad positiva.
4

(i) Si y AS tal que yi i xi (t) i S, la coalici


on llega a cualquiera de tales y con probabilidad
positiva. Entonces, el nuevo estado es
/ AS ,
o
x(t + 1) = (y, eS ) si xS (t)
x(t + 1) = (y, xS (t)) si xS (t) AS .
(ii) En otro caso, x(t + 1) = x(t).
Ejemplo. Sea N = {1, 2, 3}.
Las preferencias de los agentes son:
e3 1 e2 1 e1
e1 2 e3 2 e2
e2 3 e1 3 e3
Consideremos las tres asignaciones siguientes, y observemos que constituyen una clase recurrente del
proceso especificado:
x = (e1 , e3 , e2 ), y = (e2 , e1 , e3 ), z = (e3 , e2 , e1 ). Esto es, x {1,2} y {1,3} z {2,3} x. Tenemos un ciclo
del cual es imposible salir llamado ciclo de Condorzet en la Teora de Elecci
on Social.
Nuestra primera tarea es la identificaci
on de las clases recurrentes del proceso de intercambio sin
perturbaciones:
Proposici
on: Las clases recurrentes del proceso M0 sin perturbaciones son de los dos tipos siguientes:
(i) Clases recurrentes unitarias, o estados absorbentes: cada una de las asignaciones del n
ucleo.
(ii) Clases recurrentes con m
ultiples elementos: en cada una de ellas, las asignaciones son individualmente
racionales, pero no del n
ucleo (ver el ejemplo anterior).
Por tanto, queda claro que la predicci
on de largo plazo no se puede dar con independencia de las
condiciones iniciales. Procedamos a introducir perturbaciones.
na la
Consideremos ahora el proceso M con perturbaciones. Sea  (0, 1) arbitrariamente peque
probabilidad de que un agente intercambie y acabe con la misma casa ; sea  la probabilidad de aceptar
un intercambio coalicional donde el agente acaba con una casa peor, donde es un entero positivo suficientemente grande. Es decir, aunque los dos tipos de errores en la toma de decisiones del agente ocurren
con baja probabilidad, los del segundo tipo errores m
as graves son mucho m
as improbables.
Supongamos que el estado es la asignaci
on x, que la coalici
on S se forma, y que el sistema llega a y.
Definamos:
nI = |{i S : xi = yi }|
nW = |{i S : xi i yi }|.
Esto es, estos dos n
umeros son respectivamente el n
umero de agentes que acaban con la misma casa o con
una peor en esta transici
on.
Ahora podemos definir la resistencia de pasar de x a y a traves de S:
Si yS
/ AS ,
rS (x, y) = ;
Si yS AS ,
rS (x, y) = nW + nI .

Una vez que calculamos as la resistencia de toda transici


on, llegamos a obtener la resistencia de la
transici
on x y como la resistencia del camino m
as barato, esto es, la mnima resistencia total de toda
transici
on x y:
x S0 z1 S1 . . . zk Sk y.
Con el cuidadoso c
alculo de tales resistencias, en este modelo se puede demostrar el siguiente resultado:
Teorema: Sea E una economa de intercambio de casas, y sea > |N | 2. Entonces, la u
nica asignaci
on
estoc
asticamente estable de M es la asignaci
on competitiva w.
Podemos concluir con una breve idea de la demostraci
on: Para cada x 6= w, la transici
on x w
solamente encuentra resistencias asociadas a indiferencias (recordemos la parte (iii) del lema). Por tanto,
esto produce una resistencia que a lo sumo es |N | 2. Sin embargo, en la transici
on opuesta, w x, al
menos un individuo debe empeorar estrictamente (parte (ii) del lema), lo cual implica que la resistencia
de tal transici
on es al menos . Poniendo los dos argumentos juntos, se puede probar que la asignaci
on
competitiva es la u
nica estoc
asticamente estable, pero hemos llegado a ella sin ninguna apelaci
on a precios
de mercado.

Bibliografa
1. A. Ben-Shoham, R. Serrano, O. Volij, The evolution of exchange, Journal of Economic Theory 114,
(2004), 310-328.
2. F. Y. Edgeworth, Mathematical Psychics, Kegan Paul Publishers, London, (1881).
3. A. M. Feldman, Recontracting stability, Econometrica 42, (1974), 35-44.
4. D. P. Foster, H. P. Young, Stochastic evolutionary game dynamics, Theoretical Population Biology 38, (1990), 219-232.
5. M. Freidlin, A. Wentzell, Random Perturbations of Dynamical Systems, Springer-Verlag, Berlin,
(1984).
6. J. R. Green, The stability of Edgeworths recontracting process, Econometrica 42, (1974), 21-34.
7. M. Kandori, G. Mailath, R. Rob, Learning, mutations and long run equilibria in games, Econometrica 61, (1993), 29-56.
8. M. Kandori, R. Serrano, O. Volij, Decentralized trade, random utility and the evolution of social
welfare, forthcoming in Journal of Economic Theory.
9. A. E. Roth, A. Postlewaite, Weak versus strong domination in a market for indivisible goods, Journal
of Mathematical Economics 4, (1977), 131-137.
10. R. Serrano, O. Volij, Mistakes in cooperation: the stochastic stability of Edgeworths recontracting,
Working Paper 2003-23, Department of Economics, Brown University.
11. L. S. Shapley, H. Scarf, On cores and indivisibility, Journal of Mathematical Economics 1, (1974),
23-28.
12. H. P. Young, The evolution of conventions, Econometrica 61, (1993), 57-84.
13. H. P. Young, Individual Strategy and Social Structure: an Evolutionary Theory of Institutions,
Princeton university Press, Princeton, NJ, (1998).

CEMFI WORKING PAPERS


0501 Claudio Michelacci and Vincenzo Quadrini: Borrowing from employees: Wage
dynamics with financial constraints.
0502 Gerard Llobet and Javier Suarez: Financing and the protection of innovators.
0503 Juan-Jos Ganuza and Jos S. Penalva: On information and competition in
private value auctions.
0504 Rafael Repullo: Liquidity, risk-taking, and the lender of last resort.
0505 Marta Gonzlez and Josep Pijoan-Mas: The flat tax reform: A general
equilibrium evaluation for Spain.
0506 Claudio Michelacci and Olmo Silva: Why so many local entrepreneurs?.
0507 Manuel Arellano and Jinyong Hahn: Understanding bias in nonlinear panel
models: Some recent developments.
0508 Aleix Calveras, Juan-Jos Ganuza and Gerard Llobet: Regulation and
opportunism: How much activism do we need?.
0509 ngel Len, Javier Menca and Enrique Sentana: Parametric properties of
semi-nonparametric distributions, with applications to option valuation.
0601 Beatriz Domnguez, Juan Jos Ganuza and Gerard Llobet: R&D in the
pharmaceutical industry: a world of small innovations.
0602 Guillermo Caruana and Liran Einav: Production targets.
0603 Jose Ceron and Javier Suarez: Hot and cold housing markets: International
evidence.
0604 Gerard Llobet and Michael Manove: Network size and network capture.
0605 Abel Elizalde: Credit risk models I: Default correlation in intensity models.
0606 Abel Elizalde: Credit risk models II: Structural models.
0607 Abel Elizalde: Credit risk models III: Reconciliation reduced structural
models.
0608 Abel Elizalde: Credit risk models IV: Understanding and pricing CDOs.
0609 Gema Zamarro: Accounting for heterogeneous returns in sequential schooling
decisions.
0610 Max Bruche: Estimating structural models of corporate bond prices.
0611 Javier Daz-Gimnez and Josep Pijoan-Mas: Flat tax reforms in the U.S.: A
boon for the income poor.
0612 Max Bruche and Carlos Gonzlez-Aguado:
probabilities and the credit cycle.

Recovery

rates,

default

0613 Manuel Arellano and Jinyong Hahn: A likelihood-based approximate solution to


the incidental parameter problem in dynamic nonlinear models with multiple
effects.
0614 Manuel Arellano and Stphane Bonhomme: Robust priors in nonlinear panel
data models.
0615 Laura Crespo: Caring for parents and employment status of European mid-life
women.
0701 Damien Geradin, Anne Layne-Farrar and A. Jorge Padilla: Royalty stacking in
high tech industries: separating myth from reality.

0702 Anne Layne-Farrar, A. Jorge Padilla and Richard Schmalensee: Pricing


patents for licensing in standard setting organizations: Making sense of FRAND
commitments.
0703 Damien Geradin, Anne Layne-Farrar and A. Jorge Padilla: The ex ante auction
model for the control of market power in standard setting organizations.
0704 Abel Elizalde: From Basel I to Basel II: An analysis of the three pillars.
0705 Claudio Michelacci and Josep Pijoan-Mas: The effects of labor market
conditions on working time: the US-UE experience.
0706 Robert J. Aumann and Roberto Serrano: An economic index of riskiness.
0707 Roberto Serrano: El uso de sistemas dinmicos estocsticos en la Teora de
Juegos y la Economa.

También podría gustarte