Está en la página 1de 4

Teoría de juegos: dilema del prisionero y juegos de

cooperación

Introducción
La teoría de juegos es una rama de las matemáticas aplicadas que representa algunos
procesos de toma de decisiones frente a situaciones donde hay competencia e incentivos.
Es importante destacar que no tiene por objeto arribar a las mejores decisiones para ganar
juegos. De hecho, los juegos que tienen estrategias ganadoras o no-perdedoras (tatetí) sino
que son todos triviales; los juegos que interesan son precisamente aquellos que no tienen
solución (es decir, los no triviales).

Todo juego básico en matemáticas se caracteriza por tres elementos:

1. Un conjunto de jugadores que compiten por ganar.


2. Un conjunto de estrategias (opciones) que pueden escoger los jugadores frente a
una situación dada.
3. Un sistema de pagos o castigos que dice cuánto gana o pierde cada jugador una vez
finalizado el juego.

Paralelamente, cada juego tiene sus propias reglas, límites dentro de los cuales
pueden/deben actuar los jugadores. La característica de los juegos no triviales es que no
existe una ‘estrategia ganadora’ porque el pago o castigo no depende solo de la estrategia
de un jugador, sino que es el resultado de la interacción entre todas las estrategias, y por lo
tanto es impredecible.

© Universidad de Palermo. Prohibida la reproducción total o parcial de imágenes y textos. 1


Dilema del prisionero
El ejemplo más famoso para introducir a la teoría de juegos es el dilema del prisionero. En
este caso, dos individuos (en adelante, jugadores) son acusados de un cometer un crimen.
Para resolverlo, los detectives deciden aislarlos uno del otro e interrogarlos por separado.
La estrategia (alternativa) de cada jugador es delatar o no delatar, con las siguientes
consecuencias:

 Si ninguno delata, cada uno cumplirá 2 años de prisión.


 Si ambos deciden delatar, cada uno cumplirá 6 años de prisión.
 Si solo uno delata, este cumplirá 1 año de prisión, y el delatado tendrá una pena de
10 años.

Prisionero 1

No delatar Delatar
2
No delatar (2, 2) (10, 1)

Delatar (1, 10) (6, 6)

La resolución de este problema es conocida como equilibrio de Nash: consiste en la mejor


respuesta a la estrategia del otro jugador, o el mejor par de estrategias que maximiza el
pago a ambos jugadores dada la estrategia del otro jugador. En equilibrio, ningún jugador
tiene incentivos para abandonar cualquier estrategia si el otro jugador no abandona la
estrategia que está empleando. El equilibrio implica estabilidad en las decisiones.

Volviendo al caso bajo análisis, cada prisionero escogerá por separado la opción que
minimiza su condena (delatar a su compañero), aunque eso no lleve a la mejor solución
común (que ninguno delate). Este equilibrio se da siempre que un jugador individual pueda
empeorar su resultado al modificar su estrategia mientras el resto mantenga la misma
estrategia. Es decir, si uno de los jugadores decide no delatar pero es delatado por su
compañero, su condena será la máxima posible (10 años), lo que hace naturalmente difícil
que cualquiera de los jugadores adopte la estrategia de no delatar.

© Universidad de Palermo. Prohibida la reproducción total o parcial de imágenes y textos. 2


Algunas conclusiones al respecto:

1. Que existe un óptimo social, donde ambos obtienen el máximo beneficio sumando
las penas. Esto se da cuando ninguno de los dos decide delatar (suma de años: 4)

2. Que existe un peor escenario social donde la suma de penalidad de ambos es


máxima. Esto se da si los dos deciden delatar (suma de años: 12)

3. Que existen sub-óptimos sociales donde uno se beneficia y el otro se perjudica


mucho. Esto se da cuando el que delata recibe un año de condena, mientras que el
que decide no delatar recibe 10 años.

4. Que no hay ninguna receta (dentro de las reglas del juego) que asegure un buen
resultado. El dilema no tiene solución: por eso se llama dilema.

Sin embargo, juegos repetidos pueden modificar la estructura de incentivos del dilema del
prisionero habilitando un equilibrio eficiente donde la mutua cooperación resulta atractiva.
Muchas veces, además, la reciprocidad tiene lugar solo cuando las personas interactúan de
modo reiterado y es alta la probabilidad de mantener una nueva interacción con esa
persona. La condición más importante para la cooperación en dilemas del prisionero de dos
jugadores es la importancia que estos le dan al futuro. Simplemente la reciprocidad es tanto
más robusta cuanto más importancia los jugadores otorgan al futuro. Si mañana fuese el fin
del mundo, por ejemplo, habría pocos incentivos para cooperar, al menos en relaciones
impersonales. Si la reciprocidad es la regla, también sabemos que no es lo mismo cooperar
con una persona con la que interactuamos muy seguido que con aquellas con quienes
tenemos pocas probabilidades de volver a interactuar. Cuanto mayor sea la probabilidad de
reencontrarse en el futuro, mayor será la posibilidad de la cooperación.

© Universidad de Palermo. Prohibida la reproducción total o parcial de imágenes y textos. 3


Juegos de cooperación
Además del dilema del prisionero, existen otras categorías de juegos, llamados ‘de
coordinación’. Supongamos que Ana quiere salir a bailar, mientras que Blas prefiere ir al
cine. El juego tiene una regla muy sencilla: si no se ponen de acuerdo, se quedarán sin
planes.

Recordemos que el pago de la izquierda representa la utilidad de Ana y el de la derecha la


utilidad de Blas. Si salen a bailar, Ana gana más, aunque Blas no pierde todo porque al
menos puede compartir un plan con su amiga. Sucede a la inversa con el plan alternativo
de ir al cine. Es claro que si no se ponen de acuerdo, pierden ambos. Este es un juego de
coordinación donde una de las partes tiene que ceder para no perderlo todo. Estos puntos
donde uno de los jugadores cede también son llamados "equilibrio de Nash" (en el caso,
bailar-bailar / cine-cine).

A lo que lleva este juego es a una situación donde los jugadores tienden a no moverse, lo
que podría empeorar la situación de cada uno, quedándose ambos sin planes. Un equilibrio
de este tipo siempre tiene un resultado sub-óptimo: (6,2) / (2,6).

Tal como fue descripto en el caso de los prisioneros, el equilibrio de Nash consiste en la
mejor respuesta a la estrategia del otro jugador, o el mejor par de estrategias que maximiza
el pago a ambos jugadores dada la estrategia del otro jugador. En este caso, el equilibrio
implica estabilidad en las decisiones.

© Universidad de Palermo. Prohibida la reproducción total o parcial de imágenes y textos. 4

También podría gustarte