Está en la página 1de 25

un ps a

El s u r gi mi e n t o d e l a c o o p e r a ci ó n e nt r e e g o ís t a s
Au t o r ( es ) : Ro b e r t Ax e l r o d
Trabajo (s) revisado (s):
Fuente: The American Political Science Review, vol. 75, No. 2 (junio de 1981), págs. 306 -318
Publicado por: Asociación Americana de Ciencias Políticas
URL estable: http://www.istor.org/stable/1961366
Consultado: 28/11/2012 10:32

Su uso del archivo JSTOR indica su aceptación de los Términos y condiciones de uso, disponibles en http:
//www.j stor.org/page/info/about/policies/terms.j sp

JSTOR es un servicio sin fines de lucro que ayuda a académicos, investigadores y estudiantes a descubrir, usar y desarrollar una
amplia gama de contenido en un archivo digital confiable. Utilizamos tecnologías y herramientas de la información para
aumentar la productividad y facilitar nuevas formas de becas. Para obtener más información sobre JSTOR, comuníquese
consupport@jstor.org.

Asociación Americana de Ciencias Políticas colabora con JSTOR para digitalizar, preservar y ampliar el
acceso a The American Political Science Review.

http://www.jstor.org
ALM
ACEN
AR Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de
2012 10:32:16 a.m. Todo uso sujeto a
JSTOR Condiciones Y condiciones
El surgimiento de la cooperación entre egoístas
ROBERT A X E L R O D
Universidad de Michigan

Este artículo investiga las condiciones bajo las cuales surgirá la cooperación en un mundo de
egoístas sin autoridad central. Este problema juega un papel importante en campos tan diversos como
la filosofía política, la política internacional y el intercambio económico y social. El problema se
formaliza como un dilema del prisionero repetido con interacción por pares entre una población de
individuos.
Se informan los resultados de tres enfoques: el enfoque de torneo, el enfoque ecológico y el
enfoque evolutivo. El enfoque evolutivo es el más general, ya que se pueden tener en cuenta todas las
estrategias posibles. Se presenta una serie de teoremas que muestran: (I) las condiciones bajo las
cuales ninguna estrategia puede funcionar mejor que el promedio de la población Y.Las otras están
usando la estrategia de cooperación recíproca deTAL PARA CUAL, (2) las condiciones necesarias
y suficientes para que una estrategia sea colectivamente estable, y (3) cómo la cooperación puede
emergen de un pequeño grupo de discriminar a los individuos incluso cuando todos los demás utilizan
una estrategia de deserción incondicional.

¿Bajo qué condiciones surgirá la cooperación desertar si el otro defectos del jugador. Por lo
en un mundo de egoístas sin autoridad central? tanto, no importa lo que haga el otro jugador,
Esta pregunta ha jugado un papel importante en vale la pena desertar. Pero si ambos tienen
una variedad de dominios, incluida la filosofía defectos, ambos obtienen P en lugar del R ambos
política, la política internacional y el intercambio podrían haberlo conseguido si ambos hubieran
económico y social. Este artículo proporciona
nuevos resultados que muestran de forma más cooperado. PeroR es se supone que es mayor que
completa de lo que era posible anteriormente las P. De ahí el dilema. La racionalidad individual
condiciones bajo las cuales surgirá la cooperación. conduce a un resultado peor para ambos de lo
Los resultados son más completos de dos formas. que es posible.
En primer lugar, se tienen en cuenta todas las Para asegurar que una posibilidad uniforme de
estrategias posibles, no simplemente un explotación o ser explotado no sea un resultado tan
subconjunto seleccionado arbitrariamente. En bueno como la cooperación mutua, se agrega una
segundo lugar, no solo se establecen las desigualdad final en la definición estándar del
condiciones de equilibrio, sino que también se Dilema del Prisionero. Esto es solo R> (T + .5) 12.
especifica un mecanismo que puede mover a una Por lo tanto, dos egoístas que juegan el juego
población del equilibrio no cooperativo al una vez elegirán su elección dominante, la
cooperativo. deserción, y obtendrán una recompensa, F, que
La situación que se analizará es aquella en la que es peor para ambos que la R que podrían haber
la conducta de auto maximización estrecha de cada obtenido si ambos hubieran cooperado. Si el
persona conduce a un resultado pobre para todos. juego se juega un número finito conocido de
Este es el famoso juego Prisoner's Dilemma. Dos veces, los jugadores aún no tienen incentivos
individuos pueden cooperar o desertar cada uno. No para
importa lo que haga el otro, la deserción produce Cooperar
una recompensa mayor que la cooperación. Pero si
Cooperar Delawarefecto
ambos desertan, a ambos les va peor que si ambos defecto
cooperaran. La Figura 1 muestra la matriz de pagos
con ejemplos de números de servicios públicos R = 3, R = 3 S-0, T- = 5
adjuntos a los pagos. Si el otro jugador coopera, hay 1
una elección entre la cooperación que produce R (la 7-'7-5, S = 0 f '= 1, /) - 7-1 1
recompensa por la cooperación mutua) o la
deserción que produceT (la tentación de desertar).
Por suposición,T> R, por lo que vale la pena T> R> F> S R>
desertar si el otro jugador coopera. Por otro (S + 7) / 2
lado, si el otro jugador deserta, hay una elección Fuente: Robert Axelrod, "Elección eficaz en el El
entre la cooperación que produceS (la dilema del prisionero," Diario de La resolución de
recompensa del tonto), o la deserción que produce conflictos 24 (1980): 3 a 25; "Elección más
P (el castigo eficaz en el El dilema del prisionero," Revista de
resolución de conflictos 24 (1980); 379-403.

Me gustaría agradecer a John Chamberlin, Michael Cohen, Nota: Los beneficios del selector de filas se enumeran
Bernard Grofmau, William Hamilton, John Kingdon, Larry
Mohr, John Padgett y Reinhard Selten por su ayuda, y al primero.
Instituto de Estudios de Políticas Públicas por su apoyo Figura I. El dilema del prisionero
financiero. ment por deserción mutua). Por
supuesto, P> S, por lo que vale la pena
306
Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
1981 El surgimiento de la cooperación entre egoístas 307
cooperar. Esto es ciertamente cierto en el último probable que las interacciones futuras se vean
movimiento, ya que no hay futuro para influir. En afectadas por el resultado del intercambio actual.
el penúltimo movimiento tampoco tendrán ningún 4. Economia politica internacional. Las
incentivo para cooperar, ya que pueden anticipar corporaciones multinacionales pueden jugar con
la deserción mutua en el último movimiento. Esta los gobiernos anfitriones para reducir sus cargas
línea de razonamiento implica que el juego se tributarias en ausencia de políticas fiscales
desentrañará hasta la deserción mutua en el coordinadas entre los gobiernos afectados. Así, el
primer movimiento de cualquier secuencia de país exportador de productos básicos y el país
jugadas que sea de duración finita conocida (Luce importador de productos básicos se encuentran en
y Raiffa, 1957, págs. 94-102). Este razonamiento un dilema del prisionero repetido entre sí, ya sea
no se aplica si los jugadores interactuarán un que lo aprecien plenamente o no (Laver, 1977).
número indefinido de veces. Con un número En la literatura de estos ámbitos, se ha producido
indefinido de interacciones, puede surgir la una convergencia sobre la naturaleza del problema a
cooperación. Este artículo explorará las analizar. Todos están de acuerdo en que el dilema del
condiciones precisas necesarias para que esto prisionero de dos personas captura una parte
suceda. importante de la interacción estratégica. Todos
La importancia de este problema se indica coinciden en que lo que hace posible el surgimiento de
mediante una breve explicación del papel que ha la cooperación es la posibilidad de que la interacción
desempeñado en una variedad de campos. continúe. Las herramientas del análisis han sido
1.Filosofia politica. Hobbes consideró el sorprendentemente similares, y la teoría de juegos ha
estado de naturaleza como equivalente a lo que servido para estructurar la empresa.
ahora llamamos el dilema del prisionero de dos Como caso paradigmático del surgimiento de la
personas, y construyó su justificación para el cooperación, considere el desarrollo de las normas
estado sobre la supuesta imposibilidad de una de un cuerpo legislativo, como el Senado de
cooperación sostenida en tal situación (Taylor, Estados Unidos. Cada senador tiene un incentivo
1976, págs. 98-116). . Una demostración de que para parecer eficaz para sus electores, incluso a
la cooperación mutua podría surgir entre costa de entrar en conflicto con otros senadores
egoístas racionales que juegan el repetido Dilema que están tratando de parecer eficaces para sus
del Prisionero proporcionaría un poderoso electores. Pero este no es un juego de suma cero, ya
argumento de que el papel del estado no debería que hay muchas oportunidades para actividades
ser tan universal como algunos han mutuamente gratificantes entre dos senadores.
argumentado. Una de las consecuencias es que ha surgido en el
2.Politica internacional. Hoy las naciones Senado un elaborado conjunto de normas o
interactúan sin un control central y, por lo tanto, las costumbres populares. Entre las más importantes
conclusiones sobre los requisitos para el surgimiento se encuentra la norma de reciprocidad, una
de la cooperación tienen relevancia empírica para costumbre que implica ayudar a un colega y
muchos temas centrales de la política internacional. recibir un reembolso en especie. Incluye el
Los ejemplos incluyen muchas variedades del intercambio de votos, pero se extiende a tantos
dilema de seguridad (Jervis, 1978), como la tipos de comportamientos mutuamente
competencia de armas ysu anverso, el desarme gratificantes que "
(Rapoport, 1960); competencia de alianzas (Snyder, Washington no siempre fue así. Los primeros
1971); y conflicto comunal en Chipre (Lumsden, 1973). observadores vieron a los miembros de la comunidad
La selección de la respuesta estadounidense a la de Washington como bastante inescrupulosos, poco
invasión soviética de Afganistán en 1979 ilustra el confiables y caracterizados por "falsedad, engaño,
problema de elegir una estrategia eficaz en el contexto traición" (Smith, 1906, p. 190). Pero ahora la práctica
de una relación continua. Si se hubiera percibido a los de la reciprocidad está bien establecida. Incluso los
Estados Unidos como un negocio continuo como de cambios significativos en el Senado durante las últimas
costumbre, se podría haber alentado a la Unión dos décadas hacia una mayor descentralización, más
Soviética a probar otras formas de comportamiento no apertura y una distribución más equitativa del poder se
cooperativo más adelante. Por otro lado, cualquier han producido sin disminuir la forma popular de la
disminución sustancial de la cooperación de Estados reciprocidad (Ornstein, Peabody y Rhode, 1977).
Unidos corría el riesgo de alguna forma de represalia Demostraré que no es necesario que asumamos que los
que luego podría desencadenar una contra represalia, senadores son más honestos, más generosos o más
estableciendo un patrón de deserción mutua del que públicos que en años anteriores para explicar cómo la
podría ser difícil salir. Gran parte del debate interno cooperación basada en la reciprocidad ha surgido y ha
sobre política exterior gira en torno a problemas de este demostrado ser estable. El surgimiento de la
tipo. cooperación se puede explicar como consecuencia de
3.Intercambio económico y social. Nuestra vida que los senadores persiguen sus propios intereses.
cotidiana contiene muchos intercambios cuyos El enfoque adoptado aquí es investigar cómo
términos no son impuestos por ninguna autoridad actuarán los individuos que persiguen sus propios
central. Incluso en los intercambios económicos, la intereses y luego ver qué efectos tendrá esto para el
ética empresarial se mantiene sabiendo que es sistema en su conjunto. Dicho de otra forma, el
enfoque es
Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
308 The American Political Science Review, vol. 75
hacer algunas suposiciones acerca de los cualquier consideración que cada jugador tenga
micromotivos y luego deducir las consecuencias por los intereses del otro (Taylor, 1976, págs. 69-
del macrocomportamiento (Schelling, 1978). 83).
Pensar en el caso paradigmático de una En estas condiciones, las palabras que no están
legislatura es una conveniencia, pero el mismo respaldadas por acciones son tan baratas que
estilo de razonamiento puede aplicarse al carecen de sentido. Los jugadores pueden
surgimiento de la cooperación entre individuos en comunicarse entre sí solo a través de la secuencia
muchos otros escenarios políticos, o incluso a las de su propio comportamiento. Este es el problema
relaciones entre naciones. Al investigar las del dilema del prisionero repetido en su forma
condiciones que propician el surgimiento de la fundamental.
cooperación, se debe tener en cuenta que la Quedan por especificar dos cosas: cómo la
cooperación no siempre es socialmente deseable. recompensa de un movimiento en particular se
Hay momentos en los que la política pública se relaciona con la recompensa en una secuencia
beneficia mejor mediante la prevención de la completa, y el significado preciso de una
cooperación, como en la necesidad de una acción estrategia.Una forma natural de agregar
reguladora para evitar la colusión entre empresas recompensas a lo largo del tiempo es asumir que las
comerciales oligopólicas. recompensas posteriores valen menos que las
La situación básica que analizaré implica anteriores. unos, y que esta relación se expresa
interacciones por parejas '. Supongo que el como un descuento constante por movimiento
jugador puede reconocer a otro jugador y (Shubik, 1959, 1970). Por lo tanto, la próxima
recordar cómo los dos han interactuado hasta recompensa vale solo una fracción, w, de la misma
ahora. Esto permite que la estrategia de un recompensa de este movimiento. Toda una serie de
jugador tenga en cuenta el historial de la deserciones mutuas tendría entonces un "valor
interacción particular. presente" deP + wP + w2P + ... = P / (1 —
Se han desarrollado diversas formas de resolver w). El parámetro de descuento, w, puede tener
el dilema del dilema del prisionero. Cada uno dos interpretaciones. La interpretación
implica permitir alguna actividad adicional que económica estándar es que el consumo
altere la interacción estratégica de tal manera que
posterior no se valora tanto como el consumo
cambie fundamentalmente la naturaleza del
anterior. Una interpretación alternativa es que
problema. Sin embargo, el problema original
permanece porque hay muchas situaciones en las los movimientos futuros pueden no ocurrir
que estos remedios no están disponibles.1 deseo realmente, ya que la interacción entre un par
considerar el problema en su forma de jugadores tiene solo una cierta probabilidad
fundamental. de continuar para otro movimiento. En
1. No hay ningún mecanismo disponible para cualquier interpretación, o en una
que los jugadores hagan amenazas o compromisos combinación de las dos, w está estrictamente
exigibles (Schelling, 1960). Dado que los jugadores entre cero y uno. Cuanto menor sea w, los
no pueden comprometerse, deben tener en cuenta movimientos posteriores menos importantes
todas las estrategias posibles que podría utilizar el son en relación con los anteriores.
otro jugador, y tienen todas las estrategias posibles Para un ejemplo concreto, suponga que un
a su disposición. jugador sigue la política de siempre desertar y el
2. No hay forma de estar seguro de lo que otro jugador sigue la política de TIT FOR TAT.
hará el otro jugador en un movimiento TAL PARA CUAL es la política de cooperar en
determinado. Esto elimina la posibilidad del el primer movimiento y luego hacer lo que hizo
análisis del metajuego (Howard, 1971) que el otro jugador en el movimiento anterior. Esto
permite opciones como "hacer la misma elección significa queTAL PARA CUAL desertará una
que el otro jugador está a punto de hacer". vez por cada deserción del otro jugador.
También elimina la posibilidad de una Cuando el otro jugador está usandoTAL PARA
reputación confiable, como la que podría basarse CUAL, un jugador que siempre deserta obtener T
en ver al otro jugador interactuar con terceros. en el primer movimiento, y PAG en todos los
3. Hay de ninguna manera para cambiar la del movimientos posteriores. La recompensa para
otro jugador alguien que usaTODO D cuando se juega con
alguien que usa TIT FOR TAT es así:
'Un solo jugador puede estar interactuando con I "(TODOS DI TFT) = T + wP + WTI + w3P
muchos otros, pero el jugador está interactuando con ...
ellos uno a la vez. Las situaciones que implican más que T + w P (1 + w w1 ...)
una interacción por parejas se pueden modelar con el
modelo más complejo de n-personas
Pri- T + wP / (1 — w).
El dilema de Soner (Olson, 1965; G. Hardin, 1968; R.
Hardin, 1971; Schelling, 1973). La aplicación
principal es la provisión de bienes colectivos.
Ambos TODO D y TAL PARA CUAL son
Esposible que los resultados de las interacciones por
pares ayudarán a sugerir cómo realizar un análisis más estrategias. En general, unestrategia (o regla de
profundo del caso de n personas también, pero eso debe decisión) es una función de la historia del juego
esperar. Para un tratamiento paralelo de los casos de hasta ahora en una probabilidad de cooperación
dos personas y de n personas, véase Taylor (1976, págs. en el próximo movimiento. Las estrategias
29-62).utilidades. Las utilidades ya incluyen pueden ser estocásticas, como en el ejemplo de
una regla que es completamente aleatoria con del patrón de resultados en el juego hasta ahora
iguales probabilidades de cooperación y para determinar qué hacer a continuación.
deserción en cada movimiento. Una estrategia Puede, por ejemplo
también puede ser bastante sofisticada en su uso

Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
1981 El surgimiento de la cooperación entre egoístas 309
En general, use técnicas bayesianas para estimar comportamiento futuro no se verá muy afectado por
los parámetros de algún modelo que pueda tener esta interacción (ver, por ejemplo,
de la regla del otro jugador. O puede ser una Hinckley, 1972). La posibilidad misma de lograr una
combinación compleja de otras estrategias. Pero cooperación mutua estable depende de que exista una
una estrategia debe depender únicamente de la buena posibilidad de una interacción continua,
información disponible a través de esta secuencia medida por la magnitud de w. Empíricamente, la
de interacciones con el jugador en particular. posibilidad de que dos miembros del Congreso
La primera pregunta que uno se siente tengan una interacción continua ha aumentado
tentado a hacer es: "¿Cuál es la mejor dramáticamente a medida que las tasas de rotación
estrategia?" Ésta es una buena pregunta, pero bianual en el Congreso han caído de alrededor del 40
desafortunadamente hay No mejor regla por ciento en los primeros 40 años de la República a
independiente del entorno al que pueda tener que alrededor del 20 por ciento o menos en los últimos
enfrentarse. La razón es que lo que funciona mejor años (Young, 1966 , págs. 87-90; Jones, 1977, pág.
cuando el otro jugador es incondicionalmente 254; Patterson, 1978, págs. 143-44). Que la creciente
cooperativo no funcionará bien en general cuando institucionalización del Congreso ha tenido sus
el otro jugador es condicionalmente cooperativo, y efectos en el desarrollo de las normas del Congreso
viceversa. Para probar esto, 1 introducirá el ha sido ampliamente aceptado (Polsby, 1968, esp. N.
concepto de una buena estrategia, es decir, una que 68).
nunca será la primera en desertar.
Pero decir que una oportunidad continua de
interacción es necesaria para el desarrollo de la
TEOREMA 1. Si el parámetro de descuento, w ,
cooperación no es lo mismo que decir que es
es lo suficientemente alto, no existe una mejor suficiente. La demostración de que no existe una
estrategia independiente de la estrategia utilizada única mejor estrategia deja abierta la cuestión de
por el otro jugador. qué patrones de comportamiento se puede esperar
que surjan cuando en realidad existe una
PRUEBA. Suponga que A es una estrategia que
probabilidad suficientemente alta de interacción
es mejor independientemente de la estrategia continua entre dos personas.
utilizada por el otro jugador. Esto significa que
para cualquier estrategia A 'y B, V (AV (A'IB).
los Enfoque del torneo
Considere por separado los casos en los que A es
bueno y A no es bueno. Si A es bueno, sea A' =.
TODOS Haga y deje B = TODO C. Entonces 11 El hecho de que no exista una única regla de
(A IB) = R / (1— w) que es menor que li (A1B) = decisión óptima no significa que el análisis sea
77 (1 — w). Por otro lado, si A no es bueno, sea A inútil. Por ejemplo, se puede avanzar en la cuestión
'= TODOS Co y sea B la estrategia de cooperar de qué estrategia funciona mejor en un entorno de
hasta que el otro jugador deseche y luego siempre jugadores que también están usando estrategias
falte. Eventualmente, A será el primero en fallar, diseñadas para hacerlo bien. Para explorar esta
digamos, al moverlo El valor de n es irrelevante cuestión, llevé a cabo un torneo de estrategias
para la comparación a seguir, así que suponga que presentadas por teóricos de juegos en economía,
n = 1 . Para darle a A la máxima ventaja, suponga psicología, sociología, ciencias políticas y
que A siempre falla después de su primera matemáticas (Axelrod, 1980a). Al anunciar la matriz
deserción. Entonces 17 (A IB) = T wPI (1 — w). de pagos que se muestra en la Figura 1, y una
Pero V (A'IB) = —w) = R + wR / ( 1 — w). Por duración del juego de 200 movimientos, ejecuté las
tanto, V (AlB) <V (A11.8) siempre que w> (T — 14 entradas y ALEATORIA entre sí en un torneo de
R) I (T — P). Así, la ventaja inmediata obtenida todos contra todos. El resultado fue que el puntaje
por la deserción de A eventualmente será más que promedio más alto se obtuvo con la más simple de
compensada por la desventaja a largo plazo de la todas las estrategias presentadas, TIT FOR TAT.
deserción interminable de B, asumiendo que w es Luego hice circular el informe de los
suficientemente grande. Por tanto, si w es lo resultados y solicité las entradas para una segunda
suficientemente grande, no existe una mejor ronda. Esta vez recibí 62 entradas de seis países '.
estrategia. La mayoría de los concursantes eran aficionados a
la informática, pero también había profesores de
En el caso paradigmático de una legislatura, este evoluciónbiología,
teorema dice que si existe una probabilidad
suficientemente grande de que un miembro del
Congreso interactúe nuevamente con otro miembro 'En En la segunda ronda, la duración de los juegos era
del Congreso, entonces no existe una mejor incierta, con una duración media esperada de 200
estrategia para usar independientemente de la movimientos. Esto se logró estableciendo la probabilidad de
estrategia que esté utilizando la otra persona. Sería que un movimiento dado no fuera el último en w = .99654.
Como en la primera ronda, cada pareja se emparejó en cinco
mejor cooperar con alguien que corresponda a esa juegos, ver Axelrod (1980b) para una descripción completa,
cooperación en el futuro, pero no con alguien cuyo

Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
310 The American Political Science Review, vol. 75
física e informática, así como la cinco disciplinas La motivación biológica de este enfoque se basa
representadas en la primera ronda. TAL PARA en la interpretación de los beneficios en términos
CUAL fue presentado nuevamente por el de aptitud (supervivencia y fecundidad). Todas las
ganador de la primera ronda, Anatol Rapoport mutaciones son posibles, y si alguna hubiera
del Instituto de Estudios Avanzados (Viena). Y podido invadir una población determinada, habría
ganó de nuevo. Un análisis de las 3.000.000 de tenido la oportunidad de hacerlo. Por lo tanto, solo
elecciones que se hicieron en la segunda ronda se espera que una estrategia colectivamente estable
muestra queTAL PARA CUAL era una regla pueda mantenerse en el equilibrio de largo plazo
muy sólida porque era agradable, provocable en como la estrategia utilizada por todos. ° Las
una represalia por un defección del otro, y sin estrategias colectivamente estables son
embargo perdonador después de que tomó su importantes porque son las únicas que una
única represalia (Axelrod, 1980b). población entera puede mantener a largo plazo si
las mutaciones se introducen una a la vez.
La motivación política de este enfoque se basa
en el supuesto de que todas las estrategias son
El enfoque ecológico posibles y que si hubiera una estrategia que se
Para ver si TAL PARA CUAL Lo haría bien beneficiaría un individual, seguro que alguien
en toda una serie de torneos simulados, calculé lo intentará. Por tanto, sólo una estrategia
lo que sucedería si cada una de las estrategias colectivamente estable puede mantenerse como
en la segunda ronda se sometiera a una la estrategia utilizada por todos, siempre que
próxima ronda hipotética en proporción a su los individuos que están probando estrategias
éxito en la ronda anterior. Este proceso se novedosas no interactúen demasiado entre sí ».
repitió luego para generar la ruta temporal de Como veremos más adelante, si interactúan en
la distribución de estrategias. Los resultados grupos, entonces son posibles nuevos y muy
mostraron que a medida que se desplazaban las importantes desarrollos.
reglas menos exitosas, TIT FOR Una dificultad en el uso de este concepto de
TATcontinuación para hacerlo bien con las reglas estabilidad colectiva es que puede ser muy difícil
que inicialmente anotaron cerca de la cima. A la determinar qué estrategias lo tienen y cuáles no.
larga,TAL PARA CUAL desplazó todas las En la mayoría de las aplicaciones biológicas,
demás reglas y pasó a lo que los biólogos llaman incluidas ambas el dilema del prisionero y otros
fijación (Axelrod, 1980b). tipos de interacciones, esta dificultad se ha
abordado en
Este es un enfoque ecológico porque toma
como dadas las variedades que están presentes e
investiga cómo lo hacen a lo largo del tiempo
cuando interactúan entre sí. Proporcionamás
lejos evidencia de la naturaleza robusta del Aquellos que estén familiarizados con los conceptos de
éxito de TIT FOR TAT. la teoría de juegos reconocerán esto como una estrategia
que está en equilibrio de Nash consigo misma. Mis
definiciones de invasión y estabilidad colectivason
El enfoque evolutivo ligeramente diferente de las definiciones de invasión
y estabilidad evolutiva de Maynard Smith (1974). Su
A Un enfoque mucho más general sería definición de invasión permite IAA IB) = V (B IS)
siempre que V (BI A)> V (Al A). He utilizado las
permitir que se consideren todas las reglas de nuevas definiciones para simplificar las pruebas y
decisión posibles y preguntar cuáles son las resaltar la diferencia entre el efecto de un solo
características de las reglas de decisión que son mutante y el efecto de un pequeño número de
estables a largo plazo. Un enfoque evolutivo mutantes. Cualquier regla que sea evolutivamente
introducido recientemente por los biólogos ofrece estable también es colectivamente estable. Para una
un concepto clave que hace que tal análisis sea buena regla, las definiciones son equivalentes. Todos
manejable (Maynard Smith,1974, 1978). Este los teoremas en el texto siguen siendo verdaderos si
enfoque imagina la existencia de toda una "estabilidad evolutiva" se sustituye por "estabilidad
población de individuos que emplean una colectiva" con la excepción del Teorema 3, donde la
caracterización es necesaria pero ya no suficiente.
determinada estrategia, B, y un solo individuo
mutante empleando otra estrategia, UNA. 'Para la aplicación de los resultados de este artículo
Estrategia A se dice que es invadir estrategia B si a contextos biológicos, ver Axelrod y Hamilton (1981).
Para el desarrollo en biología de los conceptos de
V (AIB)> V (B1 B) dónde reciprocidad y estrategia estable, véase Hamilton
1,6) es la recompensa esperada un A obtiene (1964), Trivers (1971), Maynard Smith (1974) y
al jugar un B, y V (B1B) es la recompensa Dawkins (1976).
esperada un B se pone al jugar otro B. Dado que “La estabilidad colectiva también se puede
los B están interactuando prácticamente por interpretar en términos de un compromiso de un
completo con otros B, el concepto de invasión es jugador, en lugar de la estabilidad de toda la población.
equivalente a que el individuo mutante único Supongamos que el jugador Y está comprometido a
pueda hacerlo mejor que el promedio de la usar la estrategia B. Entonces el jugador X no puede
población. Esto conduce directamente al concepto hacer nada mejor que usar esta misma estrategia B si y
clave del enfoque evolutivo.Una estrategia es solo si la estrategia B es colectivamente estable.
colectivamente estable si ninguna estrategia
puede invadirlo '.
Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre 2012 10:32:16 AM
Todo uso sujeto a Términos y condiciones de JSTOR
1981 El surgimiento de la cooperación entre egoístas 311
una de dos formas. Un método ha sido restringir el
análisis a situaciones en las que las estrategias TAL PARA CUAL coopera en el primer
adoptan alguna forma particularmente simple, movimiento y luego hace lo que hizo el otro
como en los modelos de un parámetro de jugador en el movimiento anterior. Esto
proporción de sexos (Hamilton, 1967). El otro significa que cualquier regla que comience con
método ha sido restringir las estrategias en sí una deserción obtendrá T, la recompensa más
mismas a un conjunto relativamente estrecho, de alta posible, en el primer movimiento al jugar
modo que pudieran obtenerse algunos resultados TIT FOR TAT. En consecuencia, TIT FOR
ilustrativos (Maynard Smith y Price, 1973; TAT solo puede evitar siendo invadible por tal
Maynard Smith, 1978). regla si es probable que el juego dure lo
Michael Taylor (1976), un politólogo que suficiente para la represalias para contrarrestar la
buscaba una comprensión más profunda de las tentación de desertar. De hecho, ninguna regla
cuestiones planteadas por Hobbes y Hume sobre si puede invadir TIT FOR TAT si el parámetro de
las personas en un estado de naturaleza también descuento, w, es suficientemente grande. Este es
enfrentó la dificultad de abordar todas las estrategias el corazón del resultado formal contenido en el
posibles sería esperado cooperar con cada otro. siguiente teorema. Los lectores que deseen omitir
Éltambién empleó el método de usar un estrecho las pruebas pueden hacerlo sin pérdida de
conjunto de estrategias para lograr algunos continuidad.
ilustrativo resultados. Taylor se limitó a la
investigación.de cuatro estrategias particulares TEOREMA 2. TIT FOR TAT es una
(incluso TODO D, TODO C, TIT PARA TAT, y estrategia colectivamente estable si y solo si w>
la regla "cooperar hasta que los otros defectos, m áx (T – R, T – R) .
y luego siempre desertar"), y un conjunto de T – PR – S Una formulación alternativa de
estrategias que toma represalias en un número
cada vez mayor de deserciones por cada el mismo resultado es que TAL PARA
deserción de la otra. Desarrolló con éxito las CUAL es una estrategia colectivamente
condiciones de equilibrio cuando estas son las estable si y solo si no es invadible ni por
únicas reglas posibles. TODOS D ni la estrategia que alterna
Antes de organizar el torneo de computadoras, deserción y cooperación.
creía que era imposible progresar mucho si todos PRUEBA. Primero probamos que las dos
Se permitió que las posibles estrategias entraran en el formulaciones del teorema son equivalentes, y
análisis. Sin embargo, una vez que obtuve suficiente
experiencia con una amplia variedad dereglas de luego probamos ambas implicaciones de la
decisión, y con el análisis de lo que sucedió cuando segunda formulación. Decir que TODOS
estas reglas interactuaron, 1 pude formular y los 19 no pueden invadir TAL PARA CUAL
responde algo importante preguntas sobre lo que significa que NALL DITFT) <V
sucedería si todas las estrategias posibles fueron (TFTITPT). Como se mostró anteriormente,
tenido en cuenta, NA LL DITFT) = T + wP 1 (1 –w). Ya que
El resto de este artículo se dedicará a responder TFT siempre coopera con su gemelo,
las siguientes preguntas específicas sobre el NTFTITFT) = R + wR + w2 k. . = RI (1 – w).
surgimiento de la cooperación en el repetido Dilema Por lo tanto, TODO D no puede invadir TIT
del Prisionero: PARA TAT cuando T + wi) 1 (1 – w) R / (1. –
w), o T (1 –w) + w1) <R, o T – R <w (T- P) o
¿En qué condiciones es colectivamente T–P
estable TIT FOR TAT? De manera similar, decir que la alternancia de
2. ¿Qué soy necesario y suficiente? condiciones D y C no puede invadir TIT PARA TAT
para cualquier estrategia para ser
colectivamente ¿estable? significa que (T + wS) I (1 — w ') <RI (1 – w)
3. Si prácticamente todo el mundo está siguiendo o R — T – R <w, Por lo tanto w ›—T – R yw> T –
una estrategia de deserción incondicional, cuando R ies equivalente a decir
la cooperación emerger de un pequeño grupo de T–P R–S
los recién llegados que introducen la cooperación que TIT PARA TAT es invadible por ni A Li. D
basada en la reciprocidad? ni la estrategia que alterna deserción
ycooperación. Esta muestra que las dos
formulaciones son equivalentes.
Ahora probamos ambas implicaciones de la
'Para las condiciones de equilibrio comparables cuando segunda formulación. Una implicación se establece
se permiten todas las estrategias posibles, ver a por la simple observación de que si TIT FOR TAT
continuación, los teoremas 2 al 6. Para obtener resultados es uncolectivamente estrategia estable, entonces no
relacionados sobre la estabilidad potencial de la regla puede invadir, y por tanto tampoco
comportamiento cooperativo, ver Luce y Raiffa (1957, pueden las dos reglas especificadas. La otra
p. 102), Kurz (19771 y Hirshleifer (1978). implicación de serprobado es que si ni TODO D
TAL PARA CUAL como un ni La alternancia de D y C puede invadir TIT
Estrategia colectivamente estable FOR TAT. entonces ninguna estrategia puede
hacerlo.
Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
312 The American Political Science Review vol. 75
TAL PARA CUAL tiene solo dos estados, un factor de mano dura lo haga. encontrar un
dependiendo de lo que hizo el otro jugador en el sustituto (Mayer, 1974, p. 280).
movimiento anterior (en el primer movimiento se De manera similar, cualquier miembro del
supone, en efecto, que el otro jugador acaba de Congreso que se considere probable que sea
cooperar). Por lo tanto, si A está interactuando derrotado en las próximas elecciones puede tener
con TIT FOR TAT, lo mejor que puede hacer algunas dificultades para hacer negocios
cualquier estrategia, A, después de elegir D es legislativos con sus colegas sobre la base habitual
elegir de confianza y buen crédito ”.
C o D. De manera similar, lo mejor que puede Hay muchos otros ejemplos de la importancia
hacer A después de elegir D es elegir C o D. Esto de la interacción a largo plazo para la estabilidad
deja cuatro posibilidades para lo mejor que de la cooperación en el repetido Dilema del
puede hacer A con TIT FOR TAT: secuencias Prisionero. Es fácil mantener las normas de
repetidas de CC, CD, DC o DD. El primero hace reciprocidad en un pueblo pequeño estable o en
lo mismo que TIT FOR TAT con otro TIT FOR un vecindario étnico. Por el contrario, un
TAT. El segundo no puede hacerlo mejor que el profesor invitadoes Es probable que reciban un
primero y el tercero. Esto implica que si la mal trato por parte de otros miembros de la
tercera y cuarta posibilidades no pueden invadir facultad en comparación con la forma en que
TIT FOR TAT, entonces ninguna estrategia estos mismos profesionales tratan a sus colegas
puede hacerlo. Estos dos son equivalentes, habituales.
respectivamente, a la alternancia de Otra consecuencia del teorema anterior es
D y C, y TODOS D. Así, si ninguno de estos dos que si se quiere prevenir en lugar de promover
puede invadir TIT FOR TAT, ninguna regla la cooperación, se debe evitar que los mismos
puede hacerlo, y TIT FOR TAT es una estrategia individuos interactúen con demasiada
colectivamente estable. regularidad. Considere la práctica del gobierno
que selecciona dos empresas aeroespaciales
La importancia de este teorema es que para contratos de desarrollo competitivos.
demuestra que si todos en una población cooperan Dado que las empresas se especializan hasta
con todos los demás porque cada uno está usando cierto punto en aviones de la Fuerza Aérea o de
la estrategia TIT FOR TAT, nadie puede hacerlo la Armada, existe una tendencia a que
mejor con cualquier otra estrategia siempre que el empresas con las mismas especialidades
parámetro de descuento sea lo suficientemente alto. aparezcan frecuentemente en la competición
Por ejemplo, utilizando los valores numéricos de los final (Art, 1968). Para dificultar la colusión
parámetros de pago dados en la Figura 1, TIT tácita entre empresas, el gobierno debería
FOR TAT no es invadible cuando el parámetro de buscar métodos para compensar la
descuento, w, es mayor que 2/3. Si w cae por debajo especialización. Los pares de empresas que
de este valor crítico, y todos los demás están usando comparten una especialización esperarían
TIT FOR TAT, valdrá la pena desertar en interactuar con menos frecuencia en las
movimientos alternativos. Por w menos de1/2, competiciones finales. Esto haría que las
TODO D también puede invadir. interacciones posteriores entre ellos valieran
Una implicación específica es que si es poco relativamente menos que antes, reduciendo el
probable que el otro jugador esté presente por valor de w. Siw es suficientemente baja, la
mucho más tiempo debido a una aparente cooperación recíproca en forma de colusión
debilidad, entonces el valor percibido de w cae tácita deja de ser una política estable.
y la reciprocidad de TIT FOR TAT ya no es Saber cuándo no se puede invadir TIT FOR
estable. Tenemos la explicación de César de por TAT es valioso, pero eso es solo una parte de la
qué los aliados de Pompeyo dejaron de historia. Otras estrategias pueden ser, y de hecho,
cooperar con él. "Consideraban que sus también colectivamente estables. Esto sugiere la
perspectivas [de Pompey] eran desesperadas y pregunta de qué tiene que hacer una estrategia
actuaron de acuerdo con la regla común por la para ser colectivamente estable. En otras palabras,
cual los amigos de un hombre se convierten en ¿qué políticas, si todas las adoptan, evitarán que un
sus enemigos en la adversidad" (traducción de individuo se beneficie de una desviación de la
Warner, 1960, p. 328). Otro ejemplo es la estrategia común?
institución comercial del factor que compra las
cuentas por cobrar de un cliente. Esto se hace los Caracterización de estrategias colectivamente
con un descuento muy sustancial cuando la estables
empresa tiene problemas porque

una vez un fabricante comienza a hundirse, La caracterización de todas las estrategias


incluso sus mejores clientes comienzan a rechazar colectivamente estables se basa en la idea de que
el pago de la mercancía, alegando defectos de la invasión puede prevenirse si la regla puede
calidad, incumplimiento de especificaciones, empeorar al invasor potencial que si acabara de
entrega tardía o lo que sea. El gran reforzador de seguirla.
la moralidad en el comercio es la relación continua,
la creencia de que uno tendrá que hacer negocios 'Una consideración compensatoria es que un legislador
nuevamente con este cliente o este proveedor, y en problemas electorales puede recibir ayuda de colegas
cuando una empresa en quiebra pierde este amistosos que deseen aumentar las posibilidades de
ejecutor automático, es probable que ni siquiera reelección de alguien que ha demostrado en el pasado ser
cooperativo, digno de confianza y eficaz. Dos ejemplos agradecer a un revisor anónimo por estopunto.)
actuales son Morris Udall y Thomas Foley. (Deseo

Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
1981 El surgimiento de la cooperación entre egoístas 313
la estrategia común. La regla B puede demasiado grande, específicamente cuando V n
prevenir la invasión por la regla A si B (A1B)> V (I3113)
puede estar seguro de que no importa lo I (T + wP / (1 — w)). Usando la ecuación (1) se
que A haga más tarde, B mantendrá el obtiene:
puntaje total de A lo suficientemente bajo.
V n f i (A I B) V ( BIB) w " -1 F / (1
Esto conduce a la siguiente definición útil: -

B tiene una posición segura sobre A en el — w) wn — tp


movimiento n si no importa lo que A haga
desde el movimiento n en adelante, IAA lin + 1 (AIB) a V (BIB) - wnPI (1 — w).
IB) c V (BIB), asumiendo que B falla
desde el movimiento n en adelante. Sea V, En segundo lugar, B solo cooperará en el
(A 18) la puntuación acumulada movimiento n cuando
descontada de A en los movimientos antes V ,, (A1B) <V (BIB) - wn-1 (T + wPI (1 - w)).
del movimiento n. Entonces, otra forma de
decir que B tiene una posición segura Como A puede obtener como máximo T en el
sobre A en el movimiento n es que
movimiento n, tenemos lin + 1 (A1B) V (BIB) -
VnG4110 + w "-1P / (1 — w) 4 V (BIB),
w n — i (7, + palabras por minuto w)) +
ya que lo mejor que puede hacer A desde el
movimiento n en adelante si B defectos es
17,4,1(A <- wnPI (1- w).
obtener P cada vez. Mover el segundo término
al lado derecho de la desigualdad da el resultado Por lo tanto, B siempre tiene una posición
útil de que B tiene una posición segura sobre A segura sobre A y, en consecuencia, B es una
en el movimiento n si 17 ,, (A1B) es lo estrategia colectivamente estable.
suficientemente pequeño, es decir, si La segunda parte de la prueba opera por
contradicción. Suponga que B es una estrategia
Vn (AIB) <V (BIB) —wn-1P1 (1 — w). (1) colectivamente estable y hay una A y una n tales
que B no falla en el movimiento n cuando
El teorema que sigue encarna el consejo de
que si desea emplear una estrategia 11 ,, (A1B)> V (BIB) - wPi (1 semana)),
colectivamente estable, solo debe cooperar
cuando pueda permitirse una explotación por es decir, cuando
parte del otro lado y aún así conservar su
posición segura. Vn (A111) + WI-1 (T + wP / (1 — w))>
IAMB).

TEOREMA 3. EL TEOREMA DE LA (2)


CARACTERIZACIÓN. B es una estrategia Defina A como lo mismo que A en el primer
colectivamente estable si y solo si B falla en el n — I se mueve y D en lo sucesivo. A
movimiento n siempre que la puntuación 'obtiene T en el movimiento n (ya que B
acumulada del otro jugador hasta el momento sea cooperó entonces), y al menos P a partir de
entonces. Asi que,

V (A'IB) 14, (A1B) + wn-1 (T + wP / (1 —w)).


PRUEBA. En p rimer lug ar, se
mostrará que una estrat egia B que t eng a 11,1 (A1B) <17 ,, (A1B) + wn-1P. Combinado
los d efect os nece sarios siem pre te ndr á con (2) esto da V (2411B)> V (BIB). Por tanto, A
una po sició n segu ra sobr e cual quier A y, 'invade B, contrariamente a la suposición de que B
por lo t anto, t end rá 1 / (A 1 B) s V ( BIB), es una estrategia colectivamente estable. Por lo
lo que a su v ez h ace que B se a un a
estrategi a cole cti vame nte esta ble. La tanto, si B es una estrategia colectivamente
prue ba fun cion a por in ducci ón. P ara qu e estable, debe fallar cuando sea necesario.
B ten ga un a posi ción s egur a en la ju gad a La figura 2 ilustra el uso de este teorema. La línea
1 sig nifica que V ( A IA LL D) 4 V (A LI. de puntos muestra el valor que no debe ser superado
DIA LL D) según la definición de posición por ningún A para que B sea una estrategia
segura aplicada an = 1. Dado que esto es cierto
colectivamente estable. Este valor es solo V (B 1B),
para todo A, B tiene una posición segura en la la recompensa esperada que obtiene un jugador que
jugada 1. Si B tiene una posición segura sobre A usa B cuando prácticamente todos los demás
en la jugada n, tiene una posición segura en la jugadores también usan B. La curva sólida
jugada n + 1. Esto se muestra en dos partes. representa el valor crítico de la recompensa
Primero, si B falla en el movimiento n, A acumulada de A hasta el momento. El teorema
obtiene como máximo P, entonces simplemente dice que B es una estrategia
colectivamente estable si y solo si falla siempre que
el valor acumulativo del otro jugador hasta ahora en el juego esté por encima de esta línea. Al hacerlo,

Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo uso sujeto a
Términos y condiciones de JSTOR
314 The American Political Science Review, vol. 75
B es capaz de evitar que el otro jugador Sin embargo, la flexibilidad de una buena regla
eventualmente obtenga un valor total esperado de no es ilimitada, como muestra el siguiente
más de la regla B obtiene al jugar otra regla B. teorema. De hecho, una buena regla debe
El teorema de caracterización es serprovocado por la primera deserción de la otro
"relevante para las políticas" en el sentido jugador, es decir, en algún movimiento posterior,
abstracto de que especifica qué estrategia, B, la regla debe tener una posibilidad finita de tomar
tiene que ver en cualquier momento en función represalias con una deserción propia.
de la historia previa de la interacción para B para
ser una estrategia colectivamente estable '. Es una
caracterización completa porque este requisito es TEOREMA 4. Para que una buena estrategia
una condición necesaria y suficiente para la sea estable colectivamente, debe ser provocada por
estrategia.B para ser colectivamente estable. la primera deserción del otro jugador.
En la Figura 2 se pueden ver dos consecuencias
adicionales sobre las estrategias colectivamente
estables. Primero, siempre que el otro jugador no
haya acumulado una puntuación demasiado alta, una PRUEBA. Siun buen la estrategia no fue
provocada por una deserción en movimiento
estrategia tiene la flexibilidad de cooperar o desertar
norte, entonces no sería colectivamente estable
y seguir siendo colectivamente estable. Esta porque podría ser invadido por una regla que
flexibilidad explica por qué normalmente hay desertó solo en el movimiento n.
muchas estrategias que son colectivamente estables.
La segunda consecuencia esese una buena regla Además de la provocación, existe otro requisito
(una que nunca fallará primero) tiene la mayor para que una buena regla sea colectivamente
flexibilidad ya que tiene la puntuación más alta estable. Este requisito es que el parámetro de
posible cuando se juega una regla idéntica. Dicho descuento w, sea suficientemente grande. Esta es
de otra manera, las buenas reglas pueden una generalización del segundo teorema, que
mostró que para TITPOR HACER ENCAJE para
permitirse ser más generosas que otras ser colectivamente estable, w tiene que ser lo
suficientemente grande. La idea se extiende más
Ser - estar precisa, 1 / (Blil) también debe allá de las reglas agradables a cualquier regla que
especificarse de antemano. Por ejemplo, si8 nunca es el pueda ser la primera en cooperar.
primero en fallar, II (BIB) = R1 (1-w). reglas con
invasores potenciales porque las reglas agradables
funcionan muy bien entre sí.

Debe defecto V (E3113) -wn-1(T+wW(1-w))

Vnorte(AIB)

Puede defecto

Moverntiempo

Fuente: Dibujado por el autor.

Figura 2. Caracterización de una estrategia colectivamente estable


Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo
uso sujeto a
Términos y condiciones de JSTOR
1981 El surgimiento de la cooperación entre egoístas 315
TEOREMA 5. Cualquier regla, B, que puede Considerar la llegada en grupos en lugar de
ser el primero en cooperar, es estable individualmente, necesitamos ampliar la idea
colectivamente solo cuando w es de "invasión" para incluir la invasión de un
suficientemente grande. grupo ». Como antes, supondremos que esa
estrategiaB prácticamente todo el mundo lo
PRUEBA. Si Bcoopera en el primer utiliza. Pero ahora suponga que un pequeño
movimiento, V (TODOS MUEREN) T + wP / grupo de personas que utilizan estrategias A
(1 – w). Pero para cualquier B, R / (1 – w)> V llega e interactúa con los otros A y los B
(BIB) ya que R es la mejor B puede hacer con nativos. Para ser específico, suponga que la
proporción de interacciones de alguien que usa
otro B por los supuestos de que R> P y R> (S
estrategiaA con otro individuo usando
+ T) / 2. Por lo tanto V (TODOS DIB)> V la estrategia A es p. Suponiendo que el Como son
(BIB) es así que cuando sea T + wPI (1 – raros en relación con los B, prácticamente todas
w)> R / (1 – w). Esto implica queTODO D las interacciones de los B son con otro B's.
invade un B que coopera en el primer Entonces el puntaje promedio de alguien
movimiento siempre que que usa A es p V (A IA) + (1 -19) 17
w <7– –PR Si B tiene una probabilidad positiva (AIB) y la puntuación media de alguien que
.

utiliza B es V (BIB). Por lo tanto, un pag grupo -

de cooperar de A invade B si pV (A1A) + (1 –p) V (A IB)> V


(BIB), dónde p es la proporción de
en el prime r movimi ent o, lue go l a interacciones de un jugador que usa la
gan an cia de V (TODOS MUEREN) sobre VI estrategia A con otro jugador de este tipo.
(BIB) solo se puede anular si w es Resolviendo para pag, Esto significa que la
suficientemente grande. Asimismo, siB no será invasión es posible si los recién llegados
el primero en cooperar hasta que mueva n, Vn interactúan lo suficiente entre sí, es decir, cuando
(TODOS DIB) = 11, (13113) y la ganancia de V (BIB) –V (AIB)
V, 4.1 (TODO DIB) sobre Ifn + i (BIB) solo se > (3)
V (AIA) –V (AIB)
puede anular si w es suficientemente largo.
Tenga en cuenta que esto supone que el
Hay una estrategia que es siempre
emparejamiento en las interacciones no es
colectivamente estable, que es independientemente aleatorio. Con emparejamiento aleatorio, unA
del valor de w o de los parámetros de pago T, R, P,
Rara vez encontraría a otro UNA. En cambio, el
y S. Este es TODO D, la regla que falla pase lo
que pase. concepto de agrupamiento trata el caso en el que
los A son una parte trivial del entorno de los B,
TEOREMA 6. TODO D es siempre pero una parte no trivial del entorno. de la otra
colectivamente estable. A 's.
Lo sorprendente es lo fácil que es la
PRUEBA. TODO D es siempre colectivamente invasión de TODO D por grupos puede ser.
Específicamente, el valor de pag que se requiere
estable porque siempre falla y por lo tanto falla para la invasión por TAL PARA CUAL de un
cuando lo requiere la condición del teorema de mundo de TODAS LAS D es sorprendentemente
caracterización. bajo. Por ejemplo, suponga que los valores de
pago son los de la Figura 1 y que w = .9, que
Este es un teorema importante debido a sus corresponde a una probabilidad del 10 por ciento
implicaciones para la evolución de la cooperación. Si de que dos jugadores que interactúan nunca se
imaginamos un sistema que comienza con volverán a encontrar. DejarA ser TAL PARA
individuos que no pueden ser incitados a cooperar, CUAL y B ser TODO D. Entonces V (BIB) =
la estabilidad colectiva deTODO D implica que –W) = 10; KAIB) = S + WP / (1 – w) = 9; yV
ningún individuo puede esperar hacer algo (AIA) = R 1 (1 –w) = 30. Reemplazar estos
mejor que simplemente seguir adelante y no números en la ecuación (3) muestra que un
cooperar. Un mundo de "malvados" puede grupo p de TAL PARA CUAL invade TODO D
resistir la invasión de cualquiera que utilice cuando p> 1/21. Por tanto, si los recién
cualquier otra estrategia, siempre que los recién llegados TAL PARA CUAL tener más de
aproximadamente 5 por ciento de sus
llegados lleguen uno a la vez. interacciones con otros usando TAL PARA
El problema, por supuesto, es que un solo CUAL, pueden prosperar en un mundo en el
recién llegado en un mundo tan mezquino no que todos los demás se niegan a cooperar.
tiene a nadie que corresponda a ninguna De esta manera, un mundo de los malvados
cooperación. Sin embargo, si los recién llegados pueden ser invadidos por un grupo de TIT FOR
llegan en pequeños grupos, tendrán la TA T — y bastante fácilmente a eso. Para ilustrar
oportunidad de prosperar. La siguiente sección este punto, suponga que una empresamaestro de
muestra cómo puede suceder esto. escuela enseñado una clase para dar cooperativa
comportamiento una oportunidad, y para
cooperación recíproca
Las implicaciones de la agrupación en
clústeres
'Para conceptos relacionados de la biología, ver
Wilson (1979) y Axelrod y Hamilton (1981).

Este contenido descargado por el autorizado usuario de 192.168.82.205 el miércoles, 28 de noviembre 2012 10:32:16 AM Asunto
de uso general
a JSTOR Términos y condiciones
316 The American Political Science Review, vol. 75
de otras firmas. Si los estudiantes lo hicieran, y si de este tipo porque siempre coopera para n =
no se dispersaran demasiado (de modo que una 1, coopera solo una vez con TODOS D, y
proporción suficiente de sus interacciones fueran siempre coopera con otro TIT FOR TAT.
con otros de la misma clase), entonces los
estudiantes encontrarían que sus lecciones El teorema final demuestra que las reglas
valieron la pena. agradables (aquellas que nunca fallan primero)
Cuando se espera que las interacciones sean son en realidad más capaces que otras reglas
de mayor duración (o el factor de descuento por para protegerse de la invasión de un grupo.
tiempo no es tan grande), es necesario incluso
menos agrupamiento. Paraejemplo, si la TEOREMA 8. Si una buena estrategia no
duración media del juego es de 200 movimientos puede ser invadida por un solo individuo,
(correspondiente a w = .99654) y los parámetros tampoco puede ser invadida por ningún grupo
de pago se muestran en la Figura 1, incluso una de individuos.
interacción de a mil con un seguidor de TIT
FOR TAT de ideas afines es suficiente para PRUEBA. Para un grupo de la regla
que la estrategia invada un mundo de TODAS Ainvadir un población de la regla B, debe haber
las D's. Incluso cuando la duración media del una semejante q u e p) ( 1 — p) RA I B)> V
juego es de solo dos movimientos (w = .5), ( B1 B). Pe ro si B e s b ue n o, e nt on ce s 1 1
cualquier cosa superior a una quinta parte de ( AI A) a V ( BI B). Est o es a sí p or q ue V
las interacciones de los jugadores de TIT FOR ( BI B) = RR I—W), que es el valor más grande
TAT con tipos de ideas afines es suficiente para que se puede obtener cuando el otro jugador está
que la invasión tenga éxito y surja la usando la misma estrategia. Es el valor más
cooperación. grande desde R> (S-FT) / 2. Desde 11 (A IA)4 V
El siguiente resultado muestra qué estrategias (BIB), una lata invadir como un grupo solo si
son las más eficientes para invadir TODO D con 11 (A LB)> V (BIB). Pero eso es equivalente a
la menor cantidad de agrupamiento. Estas son las A invadir como unindividual.
estrategias que mejor pueden discriminar entre
ellos y TODOS D. Una estrategia discrimina al
máximo si eventualmente cooperará incluso si el Esto muestra que las buenas reglas no tienen la
otro nunca ha cooperado todavía, y una vez que debilidad estructural que se muestra en ALL D.
coopere, nunca volverá a cooperar con TODOS D, ALL D puede resistir la invasión de cualquier
pero siempre lo hará. cooperar con otro jugador estrategia, siempre y cuando los jugadores que usan
usando la misma estrategia. otras estrategias vengan uno a la vez. Pero si vienen
en grupos (incluso en grupos bastante pequeños),
TEOREMA 7. Las estrategias que pueden TODO D puede ser invadido. Con buenas reglas, la
invadir TODO D en un grupo con el valor más situación es diferente. Si una buena regla puede
pequeño de p son las que discriminan al máximo, resistir la invasión por otras reglas que vienen una a
como TAL PARA CUAL. la vez, entoncesesopuede resistir la invasión de
grupos, sin importar cuán grandes sean. Así que
las reglas agradables pueden protegerse a sí
PRUEBA. Ser capaz deinvadir TODOS D, a mismas de una manera que TODOS D no puede.
La regla debe tener una posibilidad positiva de °
cooperar primero. La cooperación estocástica no En el caso ilustrativo del Senado, el Teorema 8
es tan buena como la cooperación determinista con demuestra que una vez que se ha establecido la
otro jugador que usa la misma regla, ya que la cooperación basada en la reciprocidad, puede
cooperación estocástica produce la misma permanecer estable incluso si un grupo de recién
probabilidad de S y T, y (Si-T) 12 <R en el Dilema llegados no respeta esta costumbre senatorial. Y el
del Prisionero. Por lo tanto, una estrategia que Teorema 6 ha demostrado que sin la agrupación (o
pueda invadir con la p más pequeña debe cooperar algún mecanismo comparable) el patrón original de
primero en algún movimiento, n, incluso si el otro
"traición" mutua no podría haberse superado.
jugador nunca ha cooperado todavía. El empleo de
Quizás estos primeros grupos críticos se basaron en
la ecuación (3) muestra que las reglas que invaden
los arreglos de pensiones en la capital durante la era
B = TODOS D con el valor más bajo de p son
jeffersoniana (Young, 1966). O quizás las
aquellas que tienen el valor más bajo de p *, donde
delegaciones estatales y las delegaciones estatales del
p * [V (BIB)V (AIB)] f I V (AIA) - V (A IB) 1. partido fueron más críticas (Bogue y Marlaire,
El valor de p * se minimiza cuando ii (A1A) y V 1975). Pero ahora que se ha establecido el patrón de
(A IS) se maximizan (sujeto a la restricción de que reciprocidad, los teoremas 2 y 5 muestran que es
A coopera por primera vez en el movimiento n) ya
que 1 / (211A)> V (BIB)> V ( A IB). KA1A) yIB)
se maximizan sujetos a esta restricción si
y solo si A es una r egla de discriminación "'Esta propiedad está poseída por población,
máxima. (Por cierto, no importa para el mezclas de buenas reglas también. Si noun solo
valor mínimo de p solo cuando A comienza individuo puede invadir una población de reglas
agradables, ningún grupo puede hacerlo tampoco.
a cooperar.) TIT FOR TAT es una estrategia
Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo
uso sujeto a
Términos y condiciones de JSTOR
1981 La aparición de Cooperación entre los egoístas 317
estable, siempre que la tasa de rotación bienal no Oppenheimer (eds.), Congress Reconsidered. Nueva
sea demasiado elevada. York: Praeger.
Por tanto, la cooperación puede surgir incluso en Kurz, Mordecai (1977). "Equilibrio altruista". En
un mundo de deserción incondicional. El desarrollo Bela Balassa y Richard Nelson (eds.), Progreso
económico, valores privados y políticas públicas.
no puede tomar pino si solo lo prueban individuos Amsterdam: Holanda Septentrional.
dispersos que no tienen oportunidad de interactuar Laver, Michael (1977). "Política intergubernamental
entre sí. Pero la cooperación puede surgir de sobre empresas multinacionales, un modelo simple
pequeños grupos de individuos discriminatorios, de impuestosNegociación." Revista europea de
siempre que estos individuos tengan incluso una investigación política 5: 363-80,
pequeña proporción de sus interacciones entre sí. Luce, R. Duncan y Howard Raiffa (1957). Juegos y
Además, si las estrategias agradables (las que nunca decisiones. Nueva York: Wiley.
son las primeras en desertar) finalmente llegan a ser Lumsden, Malvern (1973), "El conflicto de Chipre como
adoptadas por prácticamente todos, entonces esas dilema del prisionero". Revista de resolución de
personas pueden permitirse ser generosas al tratar conflictos 17: 7-32.
Matthews, Donald R. (1960). Senadores
con las demás. La población de reglas agradables estadounidenses y su mundo. Chapel Hill: Prensa
también puede protegerse a sí mismos contra grupos de la Universidad de Carolina del Norte,
de individuos que utilizan cualquier otra estrategia, Mayer, Martín (1974). Los banqueros. Nueva York:
así como pueden protegerse contra individuos Ballantine Books.
individuales. Pero para que una buena estrategia sea Mayhew, David R. (1975). Congreso: La Conexión
estable en el sentido colectivo, debe ser pro-vocable. Electoral. New Haven, Connecticut: Prensa de la
Universidad de Yale.
Maynard Smith, John (1974). "La teoría de los juegos
y la evolución del conflicto animal". Revista de
Referencias biología teórica 47: 209-21.
(1978). "La evolución del comportamiento". Científico
Arte, Robert J. (1969). La decisión TFX: McNamara americano 239: 176-92.
y los militares. Boston: pequeño, marrón. y GR Price (1973). "LosLógica del conflicto
Axelrod, Robert (1980a), "Elección eficaz en el dilema animal ". Nature 246: 15-18.
del prisionero". Revista de resolución de conflictos
24: 3-25. Olson, Mancur, Jr. (1965). La lógica de la acción
(1980b). "Elección más eficaz en el dilema del colectiva. Cambridge, Mass .: Harvard University
prisionero". Revista de resolución de conflictos Press.
24: 379-403. Ornstein, Norman, Robert L. Peabody y David W,
y William D. Hamilton (1981). "La evolución Rhode (1977). "El Senado cambiante: de la década
de la cooperación". Science 2: 1390-96. de 1950 a la de 1970". En Lawrence C. Dodd y
Bruce I. Oppenheimer (eds.), Congreso.
Bogue, Allan G. y Mark Paul Marlaire (1975). "Of Reconsiderado. Nueva York: Praeger.
Mess and Men: The Boardinghouse and Congressional Patterson, Samuel (1978). "El Congreso Semi-
Voting, 1821-1842". Revista Estadounidense de Soberano". En Anthony King (ed,), The New
Ciencias Políticas 19: 207-30. AmericanPolítico Sistema. Washington, DC:
Dawkins, Richard (1976). El egoísta inquietante. Nueva American Enterprise Institute.
York: Oxford University Press. Polsby, Nelson (1968). "La institucionalización de la
Hamilton, William D. (1964). "La teoría genética del Cámara de Representantes de Estados Unidos".
comportamiento social (Iy II) ". Revista de biología
Revista Estadounidense de Ciencias Políticas 62:
teórica 7: 1-16; 17-32.
(1967). "Relaciones sexuales 144-68.
Rapoport, Anatol (1960). Peleas, Juegos y Debates.
extraordinarias". Science 156: 477-88.
Hardin, Garrett (1968). "La tragedia de los Ann Arbor: Prensa de la Universidad de
Michigan. Schelling, Thomas C. (1960). La
comunes." Science 162: 1243-48.
estrategia de Con-
Hardin, Russell (1971). "Acción colectivacomo un
flict. Cambridge, Mass .: Harvard University
agradable n-Prisoner's Dilema. "Ciencias del Press.
comportamiento dieciséis: 472-81. __________ (1973). "Cascos de hockey, armas ocultas,
Hinckley, Barbara (1972). "Coaliciones en el y Horario de verano: un estudio de opciones binarias
Congreso: tamaño y distancia ideológica". con externalidades ". Revista de resolución de
Midwest Journal of Political Science 26: 197-207.
conflictos
1-lirshleifer, J. (1978). "Economía natural versus 17: 381-428.
economía política". Revista de estructuras sociales y (1978). "Micromotivos y macrocomportamiento".
biológicas 1:319-37. En Thomas Schelling (ed.), Micromotives and Micro.
Howard, Nigel (1971). Paradojas de la racionalidad: comportamiento. NuevoYork: Norton, págs. 9-43.
teoría de los metagatnes y comportamiento político. Shubik, Martin (1959). Estrategia y estructura de
Cambridge, Mass .:Prensa del MIT. mercado. Nueva York: Wiley.
Jervis, Robert (1978). "Cooperación bajo la seguridad (1970). "Teoría de juegos, comportamiento y la
Dilema. "Política mundial 30: 167-214. paradoja del dilema del prisionero: tres soluciones".
Jones, Charles 0. (1977). "¿Cambiará la reforma el Revista de resolución de conflictos 14: 181-94.
Congreso?" En Lawrence C. Dodd y Bruce I. Smith, Margaret Bayard (1906). losPrimero Cuarenta
años
Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo
uso sujeto a
Términos y condiciones de JSTOR
318 The American Political Science Review, vol. 75
de la Sociedad de Washington. Nueva York: Warner, Rex, trad. (1960). Comentarios de guerra
Scribner's. de César. Nueva York: New American Library.
Snyder, Glenn H. (1971). "El dilema del prisionero y los Wilson, David Sloan (1979). Selección natural de
modelos de la gallina en la política internacional". poblaciones y comunidades. Menlo Park,
International Studies Quarterly 15: 66-103. California: Benjamin / Cummings.
Taylor, Michael (1976). Anarquía y cooperación. Joven, James Sterling (1966). La comunidad de
Nueva York: Wiley.
Trivers, Robert L. (1971). "La evolución del altruismo Washington, 1800-1828. Nueva York: Harcourt,
recíproco." Revisión trimestral de biología 46: 35- Brace & World.
57.

Este contenido descargado por el usuario autorizado de 192.168.82.205 el miércoles 28 de noviembre de 2012 10:32:16 a.m. Todo
uso sujeto a
Términos y condiciones de JSTOR

También podría gustarte