Está en la página 1de 3

EL DILEMA DEL PRISIONERO

AVINASH DIXIT Y BARRY NALEBUFF

El dilema del prisionero es el juego de estrategia más conocido en ciencias sociales. Nos
ayuda a comprender qué gobierna el equilibrio entre cooperación y competencia en los
negocios, en la política y en los ambientes sociales.
En la versión tradicional del juego, la policía ha arrestado a dos sospechosos y los está
interrogando en habitaciones separadas. Cada uno puede o bien confesar, implicando en
consecuencia al otro, o guardar silencio. No importa lo que el otro sospecha que hace, cada
uno puede mejorar su propia posición confesando. Si el otro confiesa, entonces será mejor
que haga lo trismo para evitar la sentencia especialmente dura que aguarda al recalcitrante. Si
el otro guarda silencio, entonces puede obtener el trato de favor concedido a un testigo del
estado confesando. Así pues, la confesión es la estrategia dominante (véase TEORIA DE
LOS JUEGOS) para Cada uno. Itero SI los dos confiesan, el resultado será peor para ambos
que si los dos guardan silencio. El concepto del dilema del prisionero fue desarrollado por los
científicos de la Rand Corporation Merrill Flood y Melvin Dresher y formalizado
por un matemático de Princeton, Albert W Tucker.
El dilema del prisionero tiene aplicaciones en la economía y los negocios. Consideremos dos
firmas, digamos Coca-Cola y Pepsi, que venden productos similares. Cada una tiene que
decidir sobre una estrategia de precios. Explotarán mucho mejor su mercado conjunto si
ambas cargan un precio alto; cada una conseguirá unos beneficios de lo millones de dólares al
mes. Si una establece un precio competitivamente bajo, ganará una gran cantidad de cuentes
que robará a su rival. Supongamos que sus beneficios ascienden a 12 millones de dólares, y
que los de la rival descienden a 7 millones. Si ambas establecen precios bajos, el beneficio de
cada una será de 9 millones. Aquí, la estrategia del precio bajo es similar a la confesión del
prisionero, y el precio alto es similar a guardar silencio. Llamemos a lo primero hacer trampa,
y a lo segundo cooperación. Entonces hacer trampa es la estrategia dominante de cada firma,
pero el resultado cuando ambas «hacen trampa» es peor para cada una que el que las dos
cooperen.
Las carreras de armamentos entre superpotencias o naciones locales rivales ofrecen otro
importante ejemplo del dilema. Ambos países están mucho mejor cuando cooperan y evitan
una carrera de armamentos. Sin embargo, la estrategia dominante para cada uno es armarse
enormemente.
A nivel superficial, el dilema del prisionero parece ir en contra de la idea de Adam Smith de
la mano invisible. Cuando cada persona en el juego persigue sus intereses particulares, no
promueve los intereses colectivos del grupo. Pero a menudo la cooperación de un grupo no se
halla en los intereses de la sociedad como un conjunto. La colusión para mantener los precios
altos, por ejemplo, no entra en los intereses de la sociedad debido a que el coste para los
consumidores de la colusión es en general mayor que el incremento del beneficio de las
firmas. En consecuencia, las compañías que persiguen sus propios intereses haciendo trampas
en los acuerdos colusorios ayudan a menudo al resto de la sociedad. De un modo similar, la
cooperación entre prisioneros sometidos a interrogatorio hace que a la policía le resulte más
difícil obtener condenas. Es preciso comprender el mecanismo de la cooperación antes de que
uno pueda o bien promocionarla o derrotarla en persecución de los intereses de una política
más amplia.
¿Pueden los «prisioneros» extricarse del dilema y mantener la cooperación cuando cada uno
tiene un poderoso incentivo a hacer trampa? Y si es así, ¿cómo? El camino más común a la
cooperación surge de las repeticiones del juego. En el ejemplo Coke-Pepsi, un mes de hacer
trampas le reporta al tramposo 2 millones de dólares extras. Pero un cambio de la
cooperación mutua al engaño mutuo hace perder 1 millón. En consecuencia, si un mes de
hacer trampas es seguido por dos meses de represalias, el resultado es el tiro por la culata
para el tramposo. Cualquier castigo fuerte para alguien que haga trampas será un claro
elemento disuasorio. Esta idea necesita un cierto comentario y elaboración.
i. La recompensa al tramposo se produce de inmediato, mientras que la pérdida por el castigo
se halla en el futuro. Si los jugadores prescinden enérgicamente de rentabilidades futuras,
entonces las pérdidas pueden ser insuficientes para desalentar el hacer trampa. Así, la
cooperación es más difícil de mantener entre jugadores muy
impacientes (gobiernos, por ejemplo).
2. El castigo no funcionará a menos que las trampas puedan ser detectadas y castigadas. En
consecuencia, las compañías cooperan más cuando sus acciones son más fácilmente
detectadas (establecer precios, por ejemplo) y menos cuando sus acciones son menos
fácilmente detectadas (decidir sobre atributos de bienes que no tienen precio especificado,
como garantías de reparación). El castigo es en general más fácil de plantear en grupos
pequeños y cerrados. Así, las industrias con pocas firmas y menos amenazas de nuevas
entradas tienen más probabilidades de ser colusorias.
3. El castigo puede convertirse en automático siguiendo estrategias como «golpe por golpe»,
popularizada por el científico político Robert Axelrod de la Universidad de Michigan. Aquí,
uno hace trampa si, y tan sólo si, su rival hizo trampa en el round anterior. Pero si las
acciones inocentes del rival pueden ser mal interpretadas como hacer trampa, entonces la
estrategia del golpe por golpe corre el riesgo de establecer rounds sucesivos de injustificadas
represalias.
4. Un número fijo y finito de repeticiones es lógicamente inadecuado para producir
cooperación. Algunos o todos los jugadores saben que hacer trampas es la estrategia
dominante en la última jugada. Sentado esto, cabe decir lo mismo para la penúltima jugada,
luego para la antepenúltima, y así sucesivamente. Pero en la práctica vemos alguna
cooperación en los rounds anteriores de un conjunto fijo de repeticiones. La razón puede ser o
bien que los jugadores no conocen seguro el número de rounds, o que pueden explotar la
posibilidad de la «delicadeza irracional» en provecho mutuo.
5. También puede surgir la cooperación si el grupo tiene un gran líder, que resista
personalmente el perder mucho en competencia declarada y en consecuencia ejerza
contención, aunque sepa que otros jugadores pequeños harán trampa. El papel de Arabia
Saudita como «productor oscilante» en el cártel de la OPEP es un ejemplo de esto.
Avinash Dixit y Barry Nalebuff

Biografías: Avinash Dixit es profesor de economía John J. Sherred en la Universidad de


Princeton.
Barry Nalebuff es profesor de economía y dirección en la Escuela de Organización y
Dirección de la Universidad de Yale.

Lecturas adicionales
Introductorias
Axelrod, Robert. The Evolution of Cooperation. 1984.
Dixit, Avinash, y Barry Nalebuff. Thinking Strategically: A Competitive Edge in Business,
PoÍitics, and Everyday Life. 1991.
Rapoport, Anatol, y A. M. Chammah. Prisoners' Dilemma, 1965.
Hofstader, Douglas. «Mathamagical Themas.» Scientific American (mayo 1983): 16-26.

Avanzadas
Kreps, David, Robert Wilson, Paul Milgrom, y John Roberts. «Rational Cooperation in the
Finitely Repeated Prisoners' Dilemma» Journal of Economic Theory 27, núm. 2 (agosto
1982): 245-52.
Milgrom, Paul: «Axelrod's The Evolution of Cooperation.» Rand Journal of Economics 15,
núm. 2 (verano 1984): 305-9.

También podría gustarte