Se usa como ejemplo del clásico conflicto entre intereses individuales y
colectivos de quienes toman decisiones, y también para justificar los beneficios de la colaboración. En este juego, se supone que cada uno de los jugadores, de forma independiente, trata de maximizar su beneficio sin importarle el resultado de su adversario. Dilema del prisionero Matriz de Pagos (años de cárcel) Preso Y lealtad traición lealtad 2 \ 2 10 \ 1 Preso X traición 1 \ 10 5\5 Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos. En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general. Dilema del prisionero Matriz de Pagos (orden de preferencias) Preso Y lealtad traición lealtad 2 \ 2 4\1 Preso X traición 1 \ 4 3 \ 3* La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este resultado es un punto de equilibrio de Nash y está señalado en la matriz mediante un asterisco. El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula, bipersonal, biestratégico y simétrico. Fue formalizado y analizado por primera vez por A. W. Tucker en 1950. Es posiblemente el juego más conocido y estudiado en la teoría de juegos. En base a él se han elaborado multitud de variaciones, muchas de ellas basadas en la repetición del juego y en el diseño de estrategias reactivas.