Está en la página 1de 30

Von Neumann, Nash, Mentes Brillantes y la

Teora de Juegos
Guillermo Durn
Departamento de Computacin
Facultad de Ciencias Exactas y Naturales
Universidad de Buenos Aires

Imaginemos el siguiente juego (macabro, por cierto):


Dos personas, que llamaremos A y B, son colocadas en
habitaciones separadas con un botn prximo a cada una.
Saben que ambos sern matados a menos que uno apriete su
respectivo botn en la prxima hora.
La primer persona que apriete el botn salvar a la otra, pero se
condenar a su propia muerte.
Asumiremos que A y B se aman mutuamente.
Qu estrategia tendr cada uno?

Claramente, ambos deben hacer una evaluacin de quien debe


salvarse y obrar en consecuencia.
Representemos las estrategias posibles en una matriz:
B
Salvar a A

Salvar a B

Salvar a A

(1,1)

(1,2)

Salvar a B

(2,1)

(2,2)

El caso sencillo es cuando los dos llegan a la misma conclusin: A


debe salvarse y B sacrificarse, o viceversa.
Seran los casos (1,1) y (2,2) de la matriz.
En el primero A espera que B toque el botn, y ambos estn de
acuerdo.
En el segundo, B espera que A toque el botn, y listo.

Los casos de conflicto son los otros dos, y en cierta medida son
similares entre s.
El de (2,1) lo podramos llamar el de amor profundo. Ambos
quieren salvar al otro. En este caso se desatara una carrera por
llegar primero al botn para cumplir con el deseo.
El de (1,2) lo podramos llamar el de amor, pero no tanto.
Ambos esperan el sacrificio del otro. En este caso, van a esperar
hasta el ltimo segundo para apretar el botn (una especie de
carrera para llegar ltimo al botn).

El dilema nuclear: un juego un poco ms real


En Agosto de 1949 la Unin Sovitica explot su primer bomba
atmica en Siberia, demostrando que ya posea la tecnologa
necesaria.
Mucho antes de lo que los americanos (y sus aliados) haban
esperado ya haba dos poderes atmicos.
El mundo estaba ante una situacin similar a la que mostramos
en el juego anterior.

Estados Unidos y la Unin Sovitica tenan dos opciones: apretar


el botn nuclear y hacer desaparecer a su enemigo de la faz de
la tierra o mantener su podero nuclear como una amenaza
latente.
URSS

U
S
A

Apretar

No Apretar

Apretar

(1,1)

(1,2)

No Apretar

(2,1)

(2,2)

El caso (1,1) de la matriz ahora no es posible, por motivos


obvios.
Los casos simtricos (1,2) y (2,1) permitan terminar
definitivamente con el enemigo, pero pagando el costo
mundial del uso de la bomba.
El caso (2,2) apareca como una suerte de equilibrio donde
los dos mantenan la amenaza latente (y de hecho fue lo que
pas en la prctica).

Para 1950, importantes sectores de USA y sus aliados


europeos crean que Estados Unidos deba contemplar
seriamente la idea de un ataque nuclear sobre la entonces
URSS.
Lo llamaban la guerra preventiva.
Contra lo que uno podra suponer, la guerra preventiva
estaba defendida por algunos de los principales intelectuales
americanos, entre ellos dos de los ms famosos matemticos
del momento: Bertrand Russell y John von Neumann.

John von Neumann (1903-1957) fue el creador de la teora de juegos.


Desde la dcada del 20 estuvo trabajando en la estructura matemtica
del poker y otros juegos, pero enseguida vio que sus teoremas podan
ser aplicados a economa, poltica, relaciones internacionales, etc.
JVN demostr matemticamente que siempre hay un curso racional
de accin para juegos de dos jugadores, con intereses completamente
opuestos (uno gana y el otro pierde).
Esta prueba es conocida como el Teorema Minimax.

La clase de juegos cubiertos por este Teorema incluye un montn de


juegos recreativos, desde el ta-te-ti hasta el ajedrez.
JVN prob que siempre hay una forma optimal de jugar a dichos
juegos.
La primer referencia bibliogrfica que aparece sobre estos temas es
un artculo de von Neumann de 1928, ampliado aos despus en el
libro Theory of Games and Economic Behavior, de von Neumann
y Morgenstern, publicado en 1944.

Qu es la Teora de Juegos?
Es la teora matemtica que modela situaciones de conflicto. Una
situacin de conflicto (un juego) es una situacin en la cual
individuos (jugadores) interactan y obtienen resultados que
dependen de tal interaccin.
Cada jugador tiene control parcial de la situacin.
Cada jugador tiene ciertas preferencias sobre los resultados posibles
y se asume que estas preferencias son descriptas por una funcin
numrica (funcin de utilidad).
Cada jugador trata de llevar a cabo las estrategias que resulten ms
favorables a sus intereses, o sea, trata de maximizar su funcin de
utilidad.

Tradicionalmente la TdJ clsica se ha dividido en dos ramas: Teora


Cooperativa y No Cooperativa.
La TdJ No Cooperativa asume que no hay lugar para comunicacin,
correlacin o acuerdos entre los jugadores, de no ser los
explcitamente estipulados por las reglas del juego.
Es de inters el describir recomendaciones para los jugadores tales
que ninguno tenga incentivos para unilateralmente desviarse (si los
dems siguen las recomendaciones, y yo me muevo, pierdo).
Esta idea corresponde al concepto de Equilibrio de Nash. Es el
concepto ms importante en Teora No Cooperativa y su estudio
formal (John Nash, 1950) marc un hito en el tema, que le termin
dando a Nash el premio Nobel de Economa en 1994 por su
anlisis pionero del equilibrio en la teora de los juegos no
cooperativos.

El Dilema del Prisionero


Es el problema madre en Teora de Juegos y tiene infinitas
formulaciones diferentes.
Veamos una de ellas: son detenidos dos hombres acusados de
cometer un crimen y son encarcelados en celdas diferentes.
El juez tiene ciertos indicios sobre la culpabilidad de ambos, pero
decide hacer un interrogatorio plantendoles el siguiente dilema:

Si ambos se declaran inocentes, sern condenados a 3


aos de prisin cada uno.
Si ambos acusan al otro, sern condenados a 10 aos de
prisin cada uno.
Si uno se declara inocente y es acusado por su
compaero, ser condenado a 20 aos de prisin,
mientras al otro le corresponde slo 1.
Llamaremos C a la estrategia cooperativa (declararse
inocente) y D a la estrategia defraudativa (acusar al
otro).

La matriz de pagos queda entonces de la siguiente manera:


C

(3,3)

(20,1)

(1,20)

(10,10)

Una interpretacin ms interesante de situaciones que presentan


las caractersticas del Dilema del Prisionero se presenta cuando
dos empresas compiten en la venta de un mismo producto y
tienen que fijar el precio del mismo.
Pueden definir una estrategia de competicin con la otra
empresa y fijar un precio bajo (estrategia D), o elegir una
estrategia de cooperacin y fijar un precio alto (estrategia C).
Es inmediato verificar que el nico equilibrio de Nash de este
juego es (D,D) .

Sin embargo, a simple vista resulta muy atractivo el resultado


que surge de usar las estrategias (C,C) y naturalmente uno se
preguntar si en alguna otra versin del modelo esta estrategia
goza de una estabilidad apropiada.
Un camino que da respuesta satisfactoria a este hecho surge de
considerar un modelo donde el juego en cuestin se repite.

Ejemplos de estrategias en juegos repetidos:


Estrategia Gatillo:
C

Estrategia C-tft:
C

Observacin: estas estrategias asumen que los juegos son


infinitos. La asuncin de finitud modifica en parte las
estrategias (excepto que el juego se repita una cantidad finita de
veces, pero el nmero final sea desconocido).

Freno o no freno?
En la vida cotidiana nos topamos con este tipo de decisiones
todos los das.
Supongamos que llegamos a una esquina en simultneo con otro
auto.
Para darle un sentido econmico al ejemplo, supongamos
tambien que Lavagna abri el corralito en forma muy restringida
y que cada sucursal va a devolverle la plata al primero que
llegue, y que justamente quien maneja el otro auto que lleg a la
esquina conmigo tiene su plazo fijo en la misma sucursal que yo
(y que adems somos los dos que estamos por llegar primero).

La matriz de pagos podra ser la siguiente:

(5,5)

(0,10)

(10,0)

(-2,-2)

Cules son los equilibrios de Nash de este juego?

La Teora de Movidas (TOM)


(Theory of Moves, Steven Brams, 1994)
Asume juegos estrictamente ordinales. Supongamos que tenemos
dos actores (el jugador fila F y el jugador columna C) cada uno con
dos posibles decisiones.
Cada jugador ranquea los 4 estados del juego de 1 a 4 (1 es el peor
estado, 4 es el mejor).
Por ejemplo:
C1

C2

F1

(2,4)

(4,2)

F2

(1,1)

(3,3)

Estos resultados son slo ordinales, indican slo un


ordenamiento de los resultados de mejor a peor.
No da ninguna graduacin sobre cuanto la prefiere un jugador a
un resultado sobre los otros.
Slo indica las preferencias de los jugadores.
Primera diferencia entre la TOM y la TJC es que para la TJC
importan las utilidades mientras que para la TOM no son
relevantes.

Otra diferencia es que en la TJC los movimientos son en


simultneo, o al menos se realizan sin conocer el movimiento
del otro jugador.
En la TOM vamos a suponer que se mueve en forma alternada
partiendo de un estado inicial y llegando a un estado final.
Aparecen nuevos conceptos de equilibrios y estrategias que me
llevan a mover o detenerme en un estado determinado.
Veamos aplicaciones de la TOM a ejemplos que nos van a
resultar cotidianos y cercanos.

La renuncia de Chacho Alvarez a la vicepresidencia


Corra octubre del 2000 y se empezaba a resquebrajar la Alianza
que haba ganado las elecciones unos pocos meses antes.
El vicepresidente de la Nacin (y lder de uno de los partidos de
la Alianza) haba denunciado coimas en el Senado en la
aprobacin de la ley de reforma laboral.
El presidente de la Nacin (y uno de los lderes del otro partido
de la Alianza) se debata entre investigar a fondo las denuncias
apoyando a su vicepresidente (y fortaleciendo la Alianza) o no
hacer nada, dejando pedalear en el aire a Chacho.
Chacho Alvarez se debata entre renunciar o no renunciar.

Cmo repesentamos este juego en trminos de la TOM?


1) La realidad (desde mi ptica)
I

NI

(3,1)

(2,3)

NR

(4,2)

(1,4)

Cul es el estado inicial?


Cul es el estado final?

2) De la Rua estadista (obviamente ficticio !)


I

NI

(3,1)

(2,2)

NR

(4,3)

(1,4)

Cul es el estado inicial?


Cul es el estado final?

El asalto
Supongamos que soy asaltado por una persona armada.
Definamos mi objetivo y el del ladrn en trminos de prioridades:
Los mos:
1)No salir herido.
2)Que no me roben.
3)Atraer la atencin de la gente.
El del ladrn (inteligente):
1)Robarme todo lo que tenga.
2)No llamar la atencin.
3)Evitar el uso de la fuerza (si lo llegan a agarrar la pena
es mucho peor)

Cmo repesentamos este juego en trminos de la TOM?


V

NV

(2,2)

(4,1)

NR

(1,3)

(3,4)

Cul es el estado inicial?


Cul es el estado final?

Juegos Cooperativos
Supongamos que tenemos 100 presos y se les plantea el
siguiente problema.
Se los coloca en una fila, cada uno con un gorro negro o blanco.
El ltimo de la fila ve todos los gorros, excepto el suyo.
El anteltimo de la fila ve todos los gorros, excepto el suyo y el
del ltimo. Y asi siguiendo...
Cada preso para ser liberado debe acertar el color de su gorro,
empieza a arriesgar el ltimo, luego el anteltimo, etc.
Todos escuchan lo que dicen todos.Lo nico que tienen
permitido es arriesgar el color de su gorro, absolutamente
ninguna cosa ms.

Cul ser la estrategia conjunta para salvar a la mayor cantidad


de presos?
Una estrategia para salvar al menos al 50 %:
Consiste en que cada preso de orden par dice el color del gorro del
que tiene adelante. As, garantizamos salvar a todos los de orden
impar, ya que la estrategia es conocida por todos de antemano.
Una estrategia para salvar seguro a todos menos al ltimo de la
fila (el primero que arriesga):
El preso de orden 100 dice blanco si la cantidad de blancos que
tiene adelante es impar, y negro en caso contrario.
De ah en adelante todos pueden deducir que gorro tienen contando
la paridad de blancos y negros de los que tienen adelante.

También podría gustarte