Está en la página 1de 4

Dilema del prisionero

Cooperarn los dos prisioneros para minimizar la prdida total de libertad o uno de ellos, confiando
en la cooperacin del otro, lo traicionar para quedar en libertad?

El dilema del prisionero es un problema fundamental de la teora de juegos que muestra


que dos personas pueden no cooperar incluso si ello va en contra del inters de ambas.
Fue desarrollado originariamente por Merrill M. Flood y Melvin Dresher mientras trabajaban
en RAND en 1950. Albert W. Tuckerformaliz el juego con la frase sobre las recompensas
penitenciarias y le dio el nombre del "dilema del prisionero" (Poundstone, 1995).
Es un ejemplo de problema de suma no nula. Las tcnicas de anlisis de la teora de
juegos estndar, por ejemplo determinar el equilibrio de Nash, pueden llevar a cada
jugador a escoger traicionar al otro, pero ambos jugadores obtendran un resultado mejor
si colaborasen.
En el dilema del prisionero iterado, la cooperacin puede obtenerse como un resultado
de equilibrio. Aqu se juega repetidamente, por lo que, cuando se repite el juego, se ofrece
a cada jugador la oportunidad de castigar al otro jugador por la no cooperacin en juegos
anteriores. As, el incentivo para defraudar puede ser superado por la amenaza del
castigo, lo que conduce a un resultado cooperativo.

ndice
[ocultar]

1El dilema del prisionero clsico


2Un juego similar pero distinto
3Matriz de pagos del dilema del prisionero
4Criterio egosta versus criterio del bien comn en la matriz de resultados del dilema del
prisionero
o 4.1Crtica al imperativo del bien comn como criterio de racionalidad cooperativa
5Ejemplos en la vida real
6El dilema del prisionero iterado
o 6.1Sociedades secretas en el dilema del prisionero iterado
7Variantes
o 7.1Gallina
o 7.2Juego de confianza
o 7.3Amigo o enemigo
o 7.4La "tragedia de los comunes"
8Referencias
9Bibliografa
10Enlaces externos
El dilema del prisionero clsico[editar]
La enunciacin clsica del dilema del prisionero es:
La polica arresta a dos sospechosos. No hay pruebas suficientes para
condenarlos y, tras haberlos separado, los visita a cada uno y les ofrece el mismo
trato. Si uno confiesa y su cmplice no, el cmplice ser condenado a la pena total,
diez aos, y el primero ser liberado. Si uno calla y el cmplice confiesa, el primero
recibir esa pena y ser el cmplice quien salga libre. Si ambos confiesan, ambos
sern condenados a seis aos. Si ambos lo niegan, todo lo que podrn hacer ser
encerrarlos durante un ao por un cargo menor.
Lo que puede resumirse como:

T confiesas T lo niegas

l T eres condenado a 10 aos y l sale


Ambos son condenados a 6 aos.
confiesa libre.

l es condenado a 10 aos y t sales


l lo niega Ambos son condenados a 1 ao.
libre.

Vamos a suponer que ambos prisioneros son completamente egostas y su nica meta
es reducir su propia estancia en la crcel. Como prisioneros tienen dos opciones:
cooperar con su cmplice y permanecer callado, o traicionar a su cmplice y confesar.
El resultado de cada eleccin depende de la eleccin del cmplice. Por desgracia, uno
no conoce qu ha elegido hacer el otro. Incluso si pudiesen hablar entre s, no podran
estar seguros de confiar mutuamente.
Si uno espera que el cmplice escoja cooperar con l y permanecer en silencio, la
opcin ptima para el primero sera confesar, lo que significara que sera liberado
inmediatamente, mientras el cmplice tendr que cumplir una condena de 10 aos. Si
espera que su cmplice decida confesar, la mejor opcin es confesar tambin, ya que
al menos no recibir la condena completa de 10 aos, y slo tendr que esperar 6, al
igual que el cmplice. Y, sin embargo, si ambos decidiesen cooperar y permanecer en
silencio, ambos seran liberados en slo 1 ao.
Confesar es una estrategia dominante para ambos jugadores. Sea cual sea la eleccin
del otro jugador, pueden reducir siempre su sentencia confesando. Por desgracia para
los prisioneros, esto conduce a un resultado regular, en el que ambos confiesan y
ambos reciben largas condenas. Aqu se encuentra el punto clave del dilema. El
resultado de las interacciones individuales produce un resultado que no es ptimo -en
el sentido de eficiencia de Pareto-; existe una situacin tal que la utilidad de uno de los
detenidos podra mejorar (incluso la de ambos) sin que esto implique un
empeoramiento para el resto. En otras palabras, el resultado en el cual ambos
detenidos no confiesan domina al resultado en el cual los dos eligen confesar.
Si se razona desde la perspectiva del inters ptimo del grupo (de los dos prisioneros),
el resultado correcto sera que ambos lo negaran, ya que esto reducira el tiempo total
de condena del grupo a un total de dos aos. Cualquier otra decisin sera peor para
ambos si se consideran conjuntamente. A pesar de ello, si siguen sus propios
intereses egostas, cada uno de los dos prisioneros recibir una sentencia dura.
Si has tenido una oportunidad para castigar al otro jugador por confesar, entonces un
resultado cooperativo puede mantenerse. La forma iterada de este juego (mencionada
ms abajo) ofrece una oportunidad para este tipo de castigo. En ese juego, si el
cmplice traiciona y confiesa una vez, se le puede castigar traicionndolo a la prxima.
As, el juego iterado ofrece una opcin de castigo que est ausente en el modo clsico
del juego.
Una opcin es considerar este dilema como una simple "mquina de la verdad". El
jugador puede tomar no dos, sino tres opciones: cooperar, no cooperar o,
sencillamente, no jugar. La respuesta lgica en este caso es "no jugar", pues el
prisionero carece de informacin suficiente para jugar correctamente: no sabe cul
ser la opcin de su compaero. No hay tal dilema, pues no es posible el juego. Si
juega, se trata de una "apuesta", ms que de una solucin lgica.
Pensemos tambin que el prisionero en realidad est "jugando" con su carcelero, no
con el otro prisionero. El carcelero le ofrece una opcin. Para l, la mayor ganancia
sera condenar al prisionero a la pena mayor, pues ese es su trabajo. Si logra
condenar a los dos a la mxima pena, doble ganancia. El prisionero sabe eso, en el
fondo. Slo "jugara" si supiera con toda certeza que el polica cumplira su palabra a
pesar de su confesin. Pero tampoco lo sabe. En realidad, prisionero-carcelero y
prisionero-prisionero estn jugando al mismo juego: encubrir o traicionar (en el caso
del ejemplo de los prisioneros, no concuerda el verdad o mentira puesto que decir la
verdad sera traicionar).

T encubres T traicionas

l encubre Mximo beneficio comn T ganas, l pierde

l traiciona l gana, t pierdes Mximo perjuicio comn

En este caso, decir la verdad equivale a cooperar, a callarse. Pero un jugador slo
optar por la casilla "verdad" si sabe que el otro jugador tambin opta por la misma
solucin. En la vida real, eso no lo sabemos: hay que "jugar", es decir, arriesgarse.
Todo se basa en la "relacin de confianza" existente entre los dos jugadores.
Pongamos, por ejemplo, que los dos prisioneros son hermanos, con una relacin de
confianza muy estrecha. O que lo son uno de los prisioneros y el carcelero. Entonces
s sabran (casi con toda seguridad, pero nunca completa) cul sera la opcin de su
compaero, y entonces siempre jugaran correctamente: cooperaran.
La nica solucin lgica es, por tanto, cooperar entre si. Y adems ser la que dar el
mximo beneficio comn. Este planteamiento nos lleva a la correcta solucin del
dilema, que es decir la verdad, cooperar. Pero en este caso el error estaba en el
planteamiento correcto del dilema, que no es pensar en nuestro beneficio (ser egosta)
sino en el del "otro" (ser generoso). En este caso, jugando a "verdad" siempre
conseguiremos que el "otro" gane. Si el objetivo del juego es que siempre gane el rival,
hay pues una nica solucin lgica, y que no depende de la jugada del
rival. Dilema resuelto.
Una solucin "incorrecta" sera en el caso que el hermano traicione al hermano. Aun
as, el juego es correcto (pues todo juego tiene una y slo una solucin lgica). Lo que
ha sucedido es que ha cambiado el nombre del juego: ahora lo podramos llamar
"Descubre al mentiroso". Hemos ganado, pues descubrimos a un mentiroso.

T ganas T pierdes

l gana Los dos dijeron la verdad l minti

l pierde T mentiste Los dos mintieron


Es entonces una autntica "mquina de la verdad".
El dilema del prisionero es pues siempre un juego dual; pero siempre tiene una
solucin lgica. Si los dos juegan lgicamente, es decir, con honestidad, el juego es
beneficioso para ambos. Si uno engaa y el otro no, el juego se llama "Descubre al
Mentiroso", y ambos vuelven a ganar.
Pero si pensamos en el Dilema como bsqueda egosta, y no generosa, la jugada
"incorrecta" del dilema impide la iteracin, luego finaliza el juego. Por esa razn, el
jugador "ilgico" siempre tendr dos objetivos: uno, engaar al honesto; y dos,
convencerle a posteriori de que no fue engaado, mediante otro ardid, para poder
seguir engandole. Un mentiroso siempre necesitar otra mentira para cubrir la
primera.
Este tipo de estrategias es muy comn en la vida cotidiana y se conoce como
"manipulacin". Para algunos, quizs exagerando, la poltica (la mala poltica) es el
arte de la manipulacin continua. Y que la estrategia funcione tiene tanto que ver con
la "mentira" del tramposo como la "doble ingenuidad" del honesto. Fiarse de un
mentiroso no es honestidad, sino estupidez. (De ah que la estrategia conocida como
"vengativa no rencorosa", o Toma y daca (tit for tat) ver ms adelante sea la ms
eficaz). Pero sabemos que el nico resultado correcto es bueno para todos los
jugadores, y este slo sucede cuando todos dicen la verdad. Si alguien miente,
engaa o manipula, la solucin siempre ser incorrecta. O, dicho de otro modo, si la
solucin es incorrecta, es que alguien nos enga o nos minti.

También podría gustarte