Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DOBLE IMPLICACIÓN
... POR LO TANTO
V……..>O
IMPLICACIÓN
¿QUÉ ES UN ENSAYO?
ES UNA NARRATIVA QUE EMPLEA UN MODELO METODOLÓGICO (CUALITATIVA O
CUANTITATIVA) PARA DEMOSTRAR UN ARGUMENTO.
DEFINICIÓN DOS:
EJEMPLO
TRATA DE LOS VALORES DEL HUMANO DEL SENTIR Y DECIR LA VERDAD.
PRECIO II
Y-C= U.NETA= 6 MIL
DE 2 PERSONAS GANAN 15+15=30 MIL TOYOTA LOS JAPONESES NO SE DEVALUAN
MUCHO
SEGURO=
INTRODUCCION
ANALISIS
CONCLUSIÓN
En esta primera parte no aprenderemos ningún concepto nuevo, sino que estaremos dándole
vueltas a los que ya conocemos, para profundizar y aprender cosas nuevas en la segunda.
El juego consiste en que dos automovilistas se dirigen uno contra otro a gran velocidad. Si
uno de ellos se Aparta, pierde un poquito de estatus social por cobarde, mientras que el otro
lo gana. Si ambos se Apartan, ninguno pierde nada, mientras que si ambos Siguen, se
estrellan y se matan.
Jugador 1
Se Aparta Sigue
Jugador Se Aparta 0,0 +1,-1
2 Sigue -1,+1 -100,-100
¿Qué haríais?
La versión más famosa de este juego es la de la película “Rebelde sin causa” (¿no la has
visto? Ya estás tardando), donde los automovilistas, en vez de dirigirse uno contra otro, se
dirigen hacia un acantilado con el coche. Pero, en cuanto al juego, no cambia mucho.
Características
Antes de continuar, vamos a dedicar unas líneas a analizar el juego según los conceptos que
hemos visto a lo largo de la serie, para que nos sirva de ejercicio (si no logras descubrir por
qué decimos cada punto, revisa el artículo correspondiente o pregunta en los comentarios):
Es un juego simétrico.
No es de suma cero.
No existe una estrategia dominante para ninguno de los jugadores.
Existen dos equilibrios de Nash en estrategias puras: Seguir/Apartar y
Apartar/Seguir.
Dependiendo de cómo consideremos el juego, podemos tomarlo como secuencial o
como simultáneo. Cuando yo tengo que decidir si Seguir o si Apartarme, sé que el
otro, al menos hasta ahora, ha decidido Seguir. Porque si él hubiera decidido
Apartarse, yo ya habría ganado. Así que desde este punto de vista es secuencial.
Pero por el mismo motivo, sabemos que ambos jugadores seguiremos apurando la
decisión hasta el ultimísimo momento, en que ya no podamos esperar más a ver qué
hace el otro. Por lo tanto, todas las decisiones iniciales son triviales, sabemos que
ambos decidiremos Seguir. La única decisión que importa es la que tomamos en el
últimísimo momento. Y por lo tanto, podemos considerarlo simultáneo (la forma
más habitual).
Puede serte interesante comparar este juego con el de la batalla de sexos. En aquel
momento dijimos que aquellos juegos se llamaban genéricamente “de coordinación”,
porque el mejor resultado se daba cuando ambos jugadores elegían “bien” (recuerda el
ejemplo paradigmático de conducir por la izquierda o la derecha). Pues bien, a veces estos
juegos se llaman genéricamente “de anticoordinación”, porque el peor resultado se obtiene
cuando ambos deciden la misma cosa (el -100/-100).
¿Cuál es la estrategia adecuada? Luego iremos a eso, porque primero queremos dedicar
unos párrafos a demostrar que, aunque afortunadamente no existen muchos automovilistas
que se dediquen a jugar a esto, el juego es muy, muy práctico.
Ejemplos
Podemos empezar con una situación sencilla. Estamos buscando aparcamiento en un centro
comercial. Llevamos diez minutos dando vueltas; empezamos a cansarnos, y en el asiento
de atrás los niños se están poniendo pesados. De pronto vemos un hueco, hacia el que
también se dirige como un kamikaze otro conductor. Tenemos dos opciones: intentar
colarnos nosotros primero (Seguir) o cederle el sitio (Apartarnos). Si nosotros Seguimos y
el otro se Aparta, ganamos un poco (aunque solo sea porque nuestros hijos en el asiento de
atrás dejan de enfurruñarse). Si nos Apartamos, perdemos un poco, porque tenemos que
seguir buscando sitio otro rato. Si ambos Seguimos, al final tenemos un accidente y en vez
de perder otros diez minutos buscando otro sitio, tenemos que perder veinte arreglando los
papeles del seguro, y el coche una semana en el taller. Nótese que la combinación
Apartarse/Apartarse no se puede producir, ya que el último en Apartarse cambiará su
decisión.
Vamos a hacerla ahora un poco más grave. Estamos negociando un acuerdo comercial con
un cliente. Él nos necesita, porque necesita nuestro servicio: si no lo contrata, él no podrá
hacer su trabajo y perderá dinero. Pero claro, ambos queremos hacernos los duros (nosotros
para subir el precio y él para bajarlo). Si nosotros apretamos y él cede, le vendemos el
servicio más caro de lo normal. Si él aprieta y nosotros cedemos, le vendemos el servicio
más barato de lo normal. Si ambos apretamos, el trato no se cierra, nosotros no ganamos
ese dinero y él no puede hacer su trabajo (perdiendo dinero también). Si ambos cedemos un
poco, es la situación normal.
Una de las formas de enfrentarse a este juego es eliminar una de nuestras opciones. Por
ejemplo, en el juego del gallina con los automóviles, podemos encadenar el volante de
forma que sea imposible girarlo para Apartarse. De esa forma el otro jugador ya no tiene
duda de cuál va a ser nuestra decisión, y solo tiene una decisión racional: Apartarse.
Esto es lo que hace muchas veces el comercial cuando intenta vender algo: “no es que no
quiera bajarte el precio, es que no puedo, no está en mi mano. El precio me lo fijan desde la
central, no puedo bajarlo más”. O cuando el cliente negocia: “si a mí me gusta lo que me
ofreces, pero a ese precio no puedo comprártelo, perdería dinero”. Que sea verdad o no…
eso ya no depende de este artículo.
La expresión “quemar las naves” parece venir de la invasión del imperio azteca por parte de
Hernán Cortes, con apenas 300 ó 400 soldados españoles. Para evitar que sus hombres
tuvieran la tentación de volver navegando a la seguridad de La Habana, ordenó barrenar los
cascos de las naves que les habían llevado a Nueva España,[1] de modo que solo les quedara
la opción de ir hacia adelante. La gracia no es solo que los españoles sepan que no pueden
retroceder, y por lo tanto luchen mejor, sino que los enemigos también saben que aquellos
no pueden retroceder, y por lo tanto saben que los españoles van a luchar como leones,
favoreciendo el que ellos mismos se retiren.
En algunos sitios se dice que la expresión viene de la invasión de Fenicia por parte de
Alejandro Magno, donde se supone que usó una estratagema similar, pero
nuestro desasnador alejandrino oficial dice que no hay pruebas suficientes de dicho
proceder. Por si os la encontráis alguna vez, los ingleses usan la expresión “burn the
bridges” (quemar los puentes) para representar esto.
Relacionado con esto está la estrategia de “quien da primero, da dos veces”. Si el juego no
es completamente simultáneo, sino que podemos decidir ser los primeros en elegir,
podemos intentar elegir Seguir. Al elegir los primeros la estrategia agresiva, el otro está
forzado a elegir la estrategia pasiva, pues de lo contrario causaría su propia destrucción…
¿o no?
¿Qué impide que esta sea la mejor estrategia? Lo impide el hecho de que no sabemos si el
otro está loco y va a sacrificarse para castigarnos.
Esto es un juego de palabras en inglés, imposible de traducir. Mad significa loco, pero
también son las siglas de Mutual Assured Destruction (Destrucción Mutua Asegurada). A
veces también se dice “jugar la carta del loco” como referencia a usar esta estrategia,
imagino que en referencia a la carta del comodín.
Este fue el corazón de la Guerra Fría: si tú me atacas, empezará una escalada que nos
obligará a ambos a disparar nuestros misiles nucleares y ambos seremos destruidos. [2] Así
que no me ataques. Es más, ni siquiera acerques tus soldados a los míos, no sea que haya un
accidente y la liemos.
A menudo se llama a este resultado “suma cero”, pero no en el mismo sentido en que lo
hemos utilizado nosotros, sino en el sentido de 1+1=0. Si ambos “ganan” la guerra, ambos
resultan destruidos. Y todos los demás, de paso, también.
En cambio, cuando ambos empezaron a reducir sus arsenales… por ejemplo en vez de
millones ya solo había 1.000 cabezas en cada bando… el 99% de destrucción en el primer
ataque dejaría 10 cabezas vivas. Suficientes para lanzar un contraataque, sí; dañino, sí; pero
no suficiente para aniquilar al otro. A lo peor alguien podría pensar que el coste de sufrir el
ataque de esas 10 cabezas era asumible…
En este momento tengo que recordar el estupendo cuento de Arthur C. Clarke “La última
orden”:
«― Os habla el presidente. El hecho de que estéis oyendo este mensaje significa que ya he
muerto y que nuestro país ha sido destruido. Pero vosotros sois soldados… sois los más
adiestrados de toda nuestra historia. Vosotros sabéis obedecer órdenes. Ahora tenéis que
obedecer la más dura que jamás habéis recibido…»
Hasta aquí puedo leer. Es un cuento muy cortito (en la edición que yo tengo, no llega a dos
páginas), así que si pongo más ya no creo que pudiera acogerme al derecho de cita, y
además te lo estropearía. Si no lo has leído, ya estás tardando. Casi lloré la primera vez que
lo leí.[3]
Vamos a dejarlo aquí, mientras damos tiempo a los lectores para ir a repasar las películas y
lecturas que hemos recomendado, y para que se sequen las lagrimitas después. En la
segunda parte buscaremos otra estrategia, y buscaremos la iteración del juego, acabando
con otra forma del juego del gallina que nos resultará más fácil de analizar.
Teoría de juegos XXIV – La guerra de sexos
En el último artículo nos quedamos con las ganas de ver cómo se solucionaba la guerra de
sexos entre Ana y Alberto… bien, vamos a ello.
Ana
Gusta Odia
Alberto Gusta 1,1 3,2
Odia 2,3 0,0
Solución Maximin
Si ambos jugadores aplican una estrategia Maximin, Alberto elegirá Tenis y Ana elegirá
Discoteca. No vamos a contar cómo hemos llegado a esa conclusión, porque la estrategia
Maximin ya la hemos contado antes. Si alguien quiere resolverlo como ejercicio en los
comentarios, bienvenido sea. Y si no, que cada uno se lo resuelva en su cabeza.
El caso es que ambos cobran 1, por lo que no parece una solución muy buena, ¿no? Bueno,
ya dijimos que Maximin era una estrategia conservadora…
Además, es una situación inestable: cualquiera de los dos mejora si cambia su decisión.
Por un lado, cada uno de los equilibrios de Nash es “injusto”, en el sentido de que uno de
los jugadores gana más que el otro. Así que si Ana tiene la mala suerte de caer en el
equilibrio Tenis/Tenis, ella siempre ganará 2… Alberto estará contentísimo, pero Ana…
siempre le quedará el reconcome de que no sale ganando tanto como ella querría.
Por otro lado, son… ¿cómo llamarlo?… “equilibrios inestables”… en el sentido de que si
uno de los jugadores, incluso en contra de su interés, cambia, el otro está “obligado” a
cambiar también.
Ejemplo: están en Tenis/Tenis (cobrando 3/2). Ana decide “tirarse un farol” y pasar a
Tenis/Discoteca (cobrando 1/1) incluso en contra de su propio interés. Si Ana sostiene su
farol, la mejor solución para Alberto es pasar a Discoteca/Discoteca (pasando a cobrar 2/3).
Pero claro, entonces puede ser Alberto el que se “tire el farol”, pasando a Tenis/Discoteca.
¿Qué hará Ana?
¿Cuál es el riesgo entonces? Que ambos se “tiren el farol” y sostengan el estado
Tenis/Discoteca (cobrando 1/1).
Como ya hemos avanzado mucho en la serie, sabemos que una alternativa es usar
estrategias mixtas. Si intentamos un método del gradiente como hicimos en el juego de los
tenistas, veremos que no se alcanza una solución. Esto es algo que podíamos haber
deducido, ya que tanto Tenis/Discoteca como Discoteca/Tenis son dos pozos de la curva, y
ambos son igual de profundos.[1] Si intentamos aplicar un método de gradiente en una curva
que tiene dos pozos, y ambos iguales… a veces caeremos en uno, otras en otro, otras veces
iremos saltando… Si recordáis el artículo de los tenistas, metíamos “ruido” para provocar
saltos en la bolita que eventualmente nos sacaran de un mínimo local y nos llevaran a un
mínimo global; pues bien, podemos asimilar ese ruido a los “faroles” que se tiran uno y
otro para obligar a cambiar. Solo que aquí no existe uno de los mínimos que sea local y el
otro global: ambos mínimos son igual de importantes. En resumen, ese procedimiento no
nos lleva a ningún lado nuevo.
Esto no debería sorprendernos, ya que las estrategias puras no son sino un caso particular
de las mixtas.
Así que, ¿cómo descubrimos el otro equilibrio de estrategias mixtas? Mejor dicho, ¿existe
algún otro equilibrio en estrategias mixtas? Pues sí, existe.
En este punto, voy a hacer un poco de trampa. Primero voy a presentarte resultados
numéricos, para que veas de manera obvia que ese equilibrio existe, y luego vamos a
utilizar ese conocimiento para resolverlo analíticamente.
Hemos hecho unas hojas de cálculo con la esperanza de pago según la probabilidad de uno
y otro de elegir lo que le Gusta. Nótese que son dos hojas, una para el pago que recibe
Alberto y otra para el pago que recibe Ana:
Hay una columna del pago de Alberto que
nos resulta curiosa, y por eso la hemos resaltado en verde. Resulta que, para cualquier una
estrategia mixta de Ana, Alberto recibe el mismo pago (1,50) independientemente de la
probabilidad con que él elija. Curioso, ¿no? Evidentemente, dado que el juego es simétrico,
ocurre lo mismo con una de las filas del pago de Ana.
Tomaos un minuto para volver a mirar esas tablas, porque es fácil no darse cuenta del
siguiente detalle: cuando está decidiendo Alberto, la tabla que debemos mirar es la de
Alberto; y cuando esté decidiendo Ana, la de Ana. Por lo tanto, en la primera tabla, la de
Alberto, siempre nos moveremos en vertical, hacia arriba o hacia abajo. Consecuentemente,
en la segunda tabla, la de Ana, siempre nos moveremos en horizontal.
Así que, si por el motivo que fuera, Alberto hubiera usado una estrategia 0,75 y Ana
hubiera usado una estrategia 0,75, estaríamos en la posición 0,75/0,75, y el pago sería 1,50
para cada uno. Si Alberto se moviera, en vertical, modificando su estrategia mixta…
¿mejoraría su pago? No, seguiría siendo 1,50. ¿Y si se moviera Ana en horizontal en su
tabla? Lo mismo, sigue cobrando 1,50. ¡Justo eso es la definición de equilibrio de Nash!
[2]
¡0,75/0,75 es un equilibrio de Nash!
Y… Uhm… qué casualidad… ambos valores coinciden, son el mismo número, 0,75…
¿será casualidad? Pues no, no es casualidad. Esto es lo que se llama equilibrio simétrico, y
se demuestra que todo juego simétrico tiene un equilibrio simétrico en estrategias
mixtas.[3]
¿Cómo encontramos ese punto analíticamente? Una vez vistas las tablas, es fácil. Solo
tenemos que darnos cuenta de que, por ejemplo para Ana, cuando estamos por encima de la
línea verde, sus pagos crecen cuando se mueve hacia la derecha; y cuando estamos por
debajo de la línea verde, sus pagos crecen cuando nos movemos hacia la izquierda. Una vez
más, el concepto de derivada, que ya hemos usado antes.
Si existen filas donde la derivada es positiva, y filas donde la derivada es negativa, existe
necesariamente una fila donde la derivada es nula (que es justo lo que estamos buscando).
Así que podemos llamar PanaG a la probabilidad de que Ana elija lo que le Gusta (y
análogamente definimos PalbG). Luego calculamos la esperanza del pago para Ana de la
siguiente manera:
Sabemos que en la línea verde, esa derivada es 0, así que igualamos a 0, resolvemos la
ecuación y nos sale:
PalbG=0,75
Ana
Gusta Odia
Alberto Gusta C,C A,D
Odia D,A B,B
¿Es un buen equilibrio? Pues no, no mucho. Podemos fijarnos en los otros dos equilibrios,
los de estrategias puras, que parece que no nos gustaban porque uno ganaba menos que el
otro; vemos que en aquellos, incluso el que menos gana de los dos, gana 2 (y el otro gana
3). Y en este otro equilibrio, ambos ganan 1,5…
¿Y eso como es posible? Es posible, porque en los otros dos casos (Gusta/Odia y
Odia/Gusta), siempre elegían lo mismo. Es verdad que uno de ellos no ganará tanto como
podía, pero bueno. En cambio, en este caso, ambos eligen al azar, con un 75% de
probabilidades de elegir lo que a ellos les gusta. Eso conlleva que algunas veces (con un
probabilidad nada desdeñable) elegirán Gusta/Gusta o incluso Odia/Odia, lo que hace bajar
mucho la media. Es lo que se llama un equilibrio ineficiente. Ni siquiera es que uno gane
más y otro menos que antes, es que ambos ganan menos que antes.
Pero es que además, si los otros equilibrios nos parecían inestables, porque alguien podría
intentar tirarse un farol… aquí es más inestable aún. Basta con que uno de ellos se desvíe
mínimamente del 0,75 para que la tendencia natural sea a incrementar aún más esa
desviación, acabando una vez más en Gusta/Odia u Odia/Gusta (dependiendo de hacia
dónde fuera la desviación inicial). Un ejemplo: si en lugar de 0,75/0,75 están en 0,80/0,75,
el pago es 1,50/1,45. Pero ahora Ana ya sale ganando si reduce su PanaG, así que lo
reducirá hasta llegar a PanaG=0 (que es con lo que más gana ella, en concreto 1,60) y
entonces Alberto aumentará su PalbG hasta llegar a 1. Es decir, la estrategia pura
Gusta/Odia.
Por si alguien se lo estaba preguntando, este es el motivo de que el método del gradiente no
encuentre este equilibrio: a menos que estemos exactamente en 0,75/0,75, el gradiente
tenderá a alejarse, no a acercarse. Es porque es un equilibrio que no está en un máximo,
sino en un punto arbitrario.
A lo largo de la serie algún lector ha confundido, probablemente por la forma en que hemos
ido explicado las cosas, la idea de que un punto sea equilibrio de Nash con el hecho de que
sea la mejor estrategia. A menudo es verdad que los equilibrios son la mejor estrategia (al
menos para alguna de las definiciones de “mejor”), como por ejemplo en Piedra-Papel-
Tijera… pero no siempre. Como demostración trivial, en este caso tenemos 3 equilibrios
posibles y no pueden ser todos a la vez la mejor estrategia; luego no puede ser cierto que el
equilibrio de Nash sea la mejor estrategia.
Aún podemos mejorar. Ana y Alberto pueden saber mucho de teoría de juegos y saber que,
como hemos visto más arriba, todo juego simétrico tiene un equilibrio simétrico en
estrategias mixtas. Así que podrían autolimitarse a buscar estrategias simétricas. Es decir,
estrategias en que PalbG = PanaG. Llamemos a eso P, para abreviar.
Es decir, nos estaríamos moviendo por la diagonal de las dos tablas que veíamos antes, y
dado que el juego es simétrico, esa diagonal es la misma para ambas tablas. O dicho de otro
modo: podemos reducir esas funciones, que eran de dos dimensiones y con resultado
compuesto por dos valores,[4] a una función de una sola dimensión y con un único resultado
que aplica a ambos, Alberto y Ana:
No olvidemos que el juego es simétrico y nos estamos moviendo por la diagonal, así que
ambos deben elegir lo que les gusta con probabilidad 0,625 y obtendrán un pago esperado
de 1,56.
Fijaos en esto: si uno de los dos cediera, y siempre hiciera lo que quiere el otro, obtendría
un pago de 2 (y además su pareja obtendrá un pago de 3). Pero si ambos aplican la máxima
estrategia mixta simétrica, ambos cobran 1,56 de media. Algo hemos ganado respecto al
equilibrio del 0,75/0,75 de antes, pero no mucho. Y además, si aquel era un equilibrio
inestable y eso nos molestaba… es que este no es ni siquiera equilibrio.
Cooperación
¿Aún te extraña que llevemos intentando resolver esta guerra de sexos desde que
aprendimos a caminar erguidos?
Menos mal que la reproducción es un fuerte incentivo para llegar a un entendimiento, que si
no…
Conductor B
Izquierda Derecha
Conducto Izquierda 0,0 -100,-100
rA Derecha -100,-100 0,0
Existen 3 equilibrios en este juego: los dos de estrategias puras I/I y D/D y otro de
estrategia mixta en el que los conductores eligen con un 50%. Este último es obviamente
peor que los otros dos, pero en realidad no hay, desde este punto de vista, nada que diga
que I/I o D/D sea mejor uno que otro, así que la Ley determina una forma arbitrariamente y
listo.
¿Qué sería el equivalente a la Ley en nuestro ejemplo de la guerra de sexos? Pues la propia
evolución. Ya lo hemos visto cuando estudiamos los algoritmos genéticos en el dilema del
prisionero iterado. Si no cooperamos, difícilmente sobreviviremos como especie… o dicho
de otro modo: “la reproducción es un fuerte incentivo para llegar a un entendimiento” (eso
ya lo he dicho, ¿no?)… ¿o hay alguna otra solución?
Calzonazos
Como decía un amigo, parafraseando un refrán sobre moteros: “solo hay dos tipos de
hombres y nada más que dos: los que saben que son unos calzonazos y los que no lo
saben”.
Me vais a permitir este toque de humor sexista (aunque no sé si machista o feminista) para
explicar la modificación más habitual al juego: uno de los jugadores rompe la simetría.
Si uno de ellos en realidad prefiere su actividad más que la compañía del otro, la matriz
puede parecerse a esta otra:
Ana
Tenis Discoteca
Alberto Tenis 3,1 1,2
Discoteca 0,0 2,3
Es decir, Ana sí que quiere ir con Alberto… pero le Gusta más ir a la Discoteca, aunque sea
sola, que ir al Tenis, aunque sea con Alberto.
Cuidado: que sea el único equilibrio en estrategias puras no quiere decir que sea el único
equilibrio.
Puede existir otro equilibrio en estrategias mixtas, porque no todos los posibles valores de
la asimetría llevan a que Discoteca/Discoteca sea el único equilibrio. No vamos a
demostrarlo, pero sí a dejarlo aquí por completitud. En un juego de coordinación, si la
matriz tiene la forma genérica:
Ana
Gusta Odia
Alberto Gusta C,c A,a
Odia D,d B,b
Han sido un par de artículos duros, y además la conclusión parece que nos deja un sabor
agridulce: por mucho que analizamos, no acabamos de encontrar una solución
satisfactoria… pues sí… real como la vida misma. A veces no podemos encontrar una
solución buena y tenemos que conformarnos con una solución no demasiado mala.
La suma cero.
El juego dice algo así: tenemos dos lobos, Rómulo y Remo, que pueden decidir ir a cazar
un Conejo o cooperar para cazar un Ciervo.
Si uno de ellos decide cazar un Conejo, come. No es que se pegue un festín, pero vaya,
come.
Si ambos deciden ir juntos a cazar un Ciervo, ambos se pegan un festín de la leche. No solo
comen, sino que además se ponen las botas, y pueden dedicar las energías sobrantes a, por
ejemplo, la reproducción.
Pero si uno de ellos decide ir a por el Ciervo, y el otro va a por el Conejo, el que decidió ir
a por el Ciervo se queda sin nada, porque él solo no es capaz de cazarlo (no obstante, su
“amigo”, que se fue a por el Conejo, sí come).
Remo
Ciervo Conejo
Rómulo Ciervo 4,4 0,3
Conejo 3,0 3,3
Si ambos eligieron Conejo, el que cambie su elección a Ciervo se queda sin nada,
así que no está tentado de cambiar. Luego Conejo-Conejo es un equilibrio de Nash.
Si ambos eligieron Ciervo, el que cambie su elección a Conejo pasa de cobrar 4 a
cobrar 3, así que no le interesa hacerlo. Luego Ciervo-Ciervo es un equilibrio de
Nash.
Si uno elige Conejo y otro Ciervo, cualquiera de los dos cambios beneficia a
alguien. Si el que eligió Conejo cambia a Ciervo, pasa de ganar 3 a ganar 4. Así que
está tentado de cambiar. Y el que eligió Ciervo, que actualmente gana 0, también
sale beneficiado (pasando a ganar 3) si cambia a Conejo. Luego Conejo-Ciervo y
Ciervo-Conejo no son equilibrios de Nash.
Aunque a algunos les parecerá obvio, debemos darnos cuenta de que las situaciones no son
las mismas que en el dilema del prisionero, porque la matriz no es exactamente igual,
aunque sea parecida. Tomando una matriz de pagos genérica como la siguiente:
Jugador 2
Alfa Beta
Jugador Alfa a,a c,b
1 Beta b,c d,d
Generalmente se supone que estamos en un juego como la caza del ciervo si se cumple la
relación a>b>=d>c (en nuestro juego, 4>3>=3>0), pero estamos en uno como el dilema del
prisionero si se cumple la relación c>d>a>b (en nuestro ejemplo, 0>-1>-6>-10). [1] Como
estamos considerando solo estrategias puras, los valores exactos de los números no
afectan, pero si estudiáramos estrategias mixtas, que veremos más adelante, entonces no
solo la relación es importante, sino también su valor exacto. Y también son importantes
para saber si el juego es de suma cero o no.
Suma cero
Juego de suma cero: un juego es de suma cero si para todas las combinaciones de
decisiones, la suma de las recompensas de todos los jugadores es cero (o cualquier otro
número constante).
A lo largo de la serie hemos visto juegos que sí eran de suma cero y juegos que no:
De suma cero: piedra-papel-tijera (al menos alguna de las versiones que dimos), el
ultimátum, el dictador; y muchos que no hemos visto, pero que a cualquiera se le
ocurren: el ajedrez, las damas, el póker…
No de suma cero: alguna de las versiones de piedra-papel-tijera, la subasta del dólar,
el ciempiés, el juego de confianza, las pensiones y el dilema del prisionero.
Pero decidir si la Bolsa es un juego de suma cero o no (o mejor dicho: suma constante o no)
tiene consecuencias más graves. ¿Para que alguien gane dinero en Bolsa, debe dejar de
ganar algún otro (hoy o en el futuro)? O… ¿es posible que todos ganen? Durante años ha
parecido que las ganancias de la Bolsa podían seguir creciendo y creciendo indefinidamente
y que todo el mundo ganaba… pero las caídas de los últimos años han hecho perder a
muchos… ¿la ganancia de aquellos era la pérdida de estos? A menudo se dice sobre la
Bolsa que “para que alguien gane, tiene que haber un gilipollas que pierda. Y si no sabes
quién es el gilipollas, es que el gilipollas eres tú”. Pues saber si la Bolsa es un juego de
suma cero o no lo es es determinar si esa frase es cierta o no.
Por supuesto, también lo contrario es malo. Suponer que un juego es de suma cero cuando
no lo es se conoce como falacia de suma cero, y puede llevar a análisis equivocados (o
incluso malintencionados).
Una de las falacias de suma cero más habituales es que la cantidad de trabajo disponible es
constante y por lo tanto, si las máquinas lo hacen por nosotros, los humanos nos
quedaremos sin trabajo. Solo hace falta ver la evolución histórica para ver si es verdad:
Cooperación social
Para muchos autores, el dilema del prisionero (y sobre todo su forma iterada, como hemos
visto) es la mejor forma de estudiar la cooperación social.
Para otros autores, en cambio, la caza del ciervo es mejor forma de estudiarla, y de hecho
muchos de los ejemplos reales que se nos ocurran pueden corresponderse a uno u otro
juego dependiendo de los valores que elijamos en la matriz de recompensas. La
especialización de las células en los seres pluricelulares, la caza en manada de los lobos y
muchas otras especies, la especialización del trabajo en las sociedades humanas… todo ello
son situaciones en que quizá podría aplicarse mejor la caza del ciervo que el dilema del
prisionero.
Además del ejemplo que ya hemos visto de los lobos en manada, pensemos por ejemplo en
unos hombres prehistóricos. Si toda la tribu se va a recolectar bayas, todos comerán bayas.
Al fin y al cabo, no se morirán de hambre, pues los monos llevan milenios haciéndolo. Pero
también pueden cooperar. Si quien fabrica buenas lanzas se dedica a fabricar lanzas, el que
lanza muy bien podrá usar ese arma para cazar un mamut… mamut que habrá sido avistado
por el mejor observador y perseguido por el mejor rastreador; y luego el que mejor cocina
podrá ocuparse de conservar ese mamut durante meses; y el que mejor curte la piel se
encargará de hacer buenos abrigos; y así respectivamente, hasta que todos ganan más que si
simplemente recolectaran bayas. Por ejemplo, pueden dedicar el exceso de ganancia a
pensar cómo mejorar sus casas, inventar el arco o simplemente reproducirse más porque
hay más comida para las crías.
La explicación de por qué este juego les parece mejor se debe a los matices que existen
entre ambos equilibrios. Porque no, no todos los equilibrios son iguales. El equilibrio
Ciervo-Ciervo es lo que se llama de recompensa dominante, porque obtienen mayor
recompensa,[4] mientras que el equilibrio Conejo-Conejo se llama de riesgo dominante,
porque el que lo elige está prefiriendo no arriesgarse a quedarse con 0 (en el próximo
artículo veremos la estrategia Maximin y formalizaremos un poco esto). Parece que los
equilibrios de recompensa dominante se eligen más a menudo cuando los jugadores
conocen bien la matriz de pagos, pero los de riesgo dominante se eligen más cuando hay
dudas (sobre las recompensas del otro, fundamentalmente, que son las que nos impiden
deducir qué es lo que hará el otro).
Estoy deseando leer en los comentarios las opiniones de los lectores sobre cuál de los dos
representa mejor la cooperación social.
Para ir abriendo el debate, doy la mía: en mi opinión, el dilema del prisionero es una mejor
representación de la cooperación social. ¿Por qué opino eso? Porque Ciervo-Ciervo es
un equilibrio de Nash, así que el hecho de que los seres sociales elijan Ciervo-Ciervo puede
no significar más que el sostener el equilibrio de Nash, y no un comportamiento
verdaderamente social. En cambio, el punto Callar-Callar del dilema del prisionero no era
un equilibrio de Nash, era un punto inestable que va en contra de las estrategias
dominantes de ambos jugadores, y, a pesar de ello, los jugadores sociales lo elijen. Para no
sesgar demasiado el debate con mi opinión, doy a la vez el contraargumento: parece que los
seres sociales elegimos el equilibrio de recompensa dominante, aún sin conocer realmente
al otro. Es como cuando a las 2 de la madrugada, en una carretera desierta, paras para
ayudar a un desconocido que está parado en el arcén con el capó abierto y el coche echando
humo.
https://eltamiz.com/elcedazo/2011/04/25/teoria-de-juegos-xxiv-la-guerra-de-sexos-y-ii/
https://eltamiz.com/elcedazo/2011/01/03/teoria-de-juegos-xvii-la-caza-del-ciervo/
https://eltamiz.com/elcedazo/2011/07/14/teoria-de-juegos-xxvii-juego-del-gallina-i/
TEORÍA DE JUEGOS EN LA ECONOMÍA
En este apartado se van a analizar una serie de situaciones en la economía
que se resuelven con la Teoría de Juegos. 5.1 CAMPAÑA PUBLICITARIA La
publicidad es una variable muy importante en los mercados de oligopolio ya
que transmite información como precio o características a los consumidores
que modifica sus preferencias.
Las empresas suelen tener un presupuesto fijo con respecto a la publicidad
competitiva. Cuando una empresa solo tiene un competidor importante, su
objetivo con la publicidad debe ser conseguir la mayor parte de clientes
quitándoseles a la empresa contraria. Un método simple sobre cómo la
publicidad afecta a los beneficios de la empresa se puede ver en el siguiente
ejemplo:
Existen dos empresas, a las que denominaremos A y B, que tienen unos beneficios de 20 y 10,
respectivamente. Ambas tienen que decidir entre utilizar publicidad o no, con unos costes de 10.
Si la empresa A utiliza publicidad y la empresa B no, aumentará sus beneficios en 15 y los de la
empresa B disminuirán en 1; pero si la empresa B también utiliza publicidad sus beneficios
aumentaran tan solo en 9. Si la empresa B, que es menos conocida que la A, utiliza publicidad y la
empresa A no, tendrá unos beneficios de 20 y los de la empresa A disminuirán en 5, pero si la
empresa A utiliza también publicidad los beneficios se mantendrán en 10.
Solución mediante argumentos de dominación En este caso es indiferente utilizar la EIE o la EID ya
que no hay valores iguales y por lo tanto ambos métodos conducen a la misma solución. Se
observa que en el caso de la empresa A, ``publicidad´´ domina estrictamente a ``no publicidad´´
(25>20 y 19>15) y que en el caso de la empresa 2 ``publicidad´´ también domina estrictamente a
``no publicidad´´ (20>10 y 10>9). Por lo tanto existe un equilibrio dominante ``publicidad-
publicidad´´. - Solución mediante equilibrio de Nash
De las tres opciones que puede coger la empresa A escoge las que menos beneficio le pueden
reportar que son 15 si utiliza ``no publicidad´´, 17 si utiliza ``radio´´ y 17 si utiliza ``televisión´´; y de
esas tres se queda con ``radio´´ y con ``televisión´´. La empresa B escoge 8 si utiliza ``no publicidad
´´, 11 si utiliza ``radio´´ y 10 si utiliza ``televisión´´; y de esas tres se queda con utilizar ``radio´´. Por
lo tanto se observa que existen dos equilibrios prudentes en ``radio-radio´´ y ``televisión-radio´´. -
Solución mediante argumentos de dominación o EID La opción ``no publicidad´´ de la empresa A
esta dominada por la opción ``televisión´´ y la opción ``no publicidad´´ de la empresa B esta
también dominada por la opción ``radio´´ por lo tanto las eliminamos:
La opción ``radio´´ de la empresa A esta dominada por la opción ``televisión´´ así que la
eliminamos también y quedaría:
La opción ``radio´´ de la empresa B domina a la opción televisión y por lo tanto quedaría una
solución en ``televisión-radio´´. o EIE La opción ``no publicidad´´ de la empresa A está dominada
estrictamente por la opción ``televisión´´ y la opción ``no publicidad´´ de la empresa B está
dominada estrictamente por la opción ´`radio`´, por lo tanto las eliminamos:
Una vez aquí, ya no hay más estrategias estrictamente dominadas y por lo tanto hay cuatro
soluciones posibles: ``radio-radio´´, ``radio-televisión´´, televisiónradio´´ y ``televisión-televisión´´. -
Solución mediante equilibrio de Nash
Empresa A: si la empresa B escoge ``no publicidad´´, la mejor opción para la empresa A es utilizar
``televisión´´; si la empresa B escoge usar ``radio´´, la mejor opción para la empresa A es también
utilizar ``televisión´´; y si la empresa B escoge usar ``televisión´´, la mejor opción para la empresa A
es utilizar ``radio´´ o ``televisión´´ indiferentemente. Empresa B: si la empresa A escoge ``no
publicidad´´, la mejor opción para la empresa B es usar ``televisión´´; si la empresa A escoge usar ``
radio´´, la mejor B A RADIO TELEVISIÓN RADIO 19,11 17,19 TELEVISION 22,13 17,10 B A NO
PUBLICIDAD RADIO TELEVISION NO PUBLICIDAD 20,10 18,15 15,20´ RADIO 22,9 19,11 17*,19´
TELEVISION 25*,8 22*,13´ 17*,10 24 opción para la empresa B es utilizar ``televisión´´; y si la
empresa A escoge usar ``televisión´´ la mejor opción para la empresa B es utilizar ``radio´´. Por lo
tanto se encuentran dos equilibrios de Nash en ``radio-televisión´´ y en ``televisión-radio´´. En este
segundo ejemplo se ha podido comprobar que, al contrario que en el primero, existen diferentes
soluciones dependiendo del método que se utilice para resolver el problema.
Teor´ıa de Juegos En su forma mas simple, un juego queda representado por un conjunto de N
jugadores, donde cada jugador n posee, primero, un conjunto de estrategias puras Sn en que cada
estrategia del conjunto queda representada por sn ∈ Sn, y luego una funci´on de utilidad un(s) que
entrega la utilidad del n-´esimo jugador para cada combinaci´on posible de estrategias s = (s1, . . . ,
sN ) ∈ S1 × . . . × SN . 13 Cap´ıtulo 3. Teor´ıa de Juegos y Seguridad El objetivo en teor´ıa de juegos
es dar alg´un indicio de cual ser´a el resultado que se obtendr´ıa cuando jugadores racionales se
vean enfrentados en una situaci´on determinada con las caracter´ısticas anteriormente descritas.
A este resultado se le denomina un equilibrio, y estos tendr´an sus propias particularidades
dependiendo de las especificaciones del juego. En ciertas situaciones los jugadores pueden
preferir aleatorizar sus estrategias de manera que en vez de utilizar una estrategia pura, juegan
cada estrategia sn con una probabilidad σi(sn) en que P sn∈Sn σi(sn) = 1. A este tipo de estrategias
se les denomina Estrategias Mixtas. El espacio de estrategias mixtas para el jugador n se denota
por Σn, y el espacio de los posibles perfiles de estrategias mixtas σ = (σ1, . . . , σN ) se denota por Σ.
En general existen dos grandes formas de clasificar un juego, primero seg´un la relevancia que
tiene la dimensi´on temporal en la forma en que se desarrolla el juego y segundo, la cantidad de
informaci´on que manejan los jugadores al momento de tomar decisiones. Un juego en el que los
jugadores toman decisiones de manera simultanea se denomina en teor´ıa de juegos un juego est
´atico. Por el contrario, cuando al menos uno de los jugadores puede observar las decisiones
tomadas por el resto, y considerar esta informaci´on antes de escoger su propia estrategia, se est
´a en presencia de un juego din´amico. Por otra parte, cuando los jugadores poseen total
conocimiento de las funciones de utilidad tanto propias como las del resto de los jugadores, se est
´a en presencia de un juego de informaci´on completa, mientras que cuando no se tiene certeza
absoluta de los pagos que recibir´an el resto de los jugadores o de la forma que tiene la funci´on
de utilidad de los contrincantes, se est´a en presencia de un juego de informaci´on incompleta.
http://repositorio.uchile.cl/bitstream/handle/2250/147451/Modelos-de-teor%C3%ADa-de-juegos-
para-el-control-de-la-delincuencia-en-la-via-publica.pdf?sequence=1&isAllowed=y
En teoría de juegos no tenemos que preguntarnos qué vamos a hacer, tenemos que
preguntarnos qué vamos a hacer teniendo en cuenta lo que pensamos que harán los demás, y
a su vez, ellos actuarán pensando según crean cuales van a ser nuestras actuaciones.
El primer fenómeno que hemos analizado, los efectos de incrementar la penalización por infringir
la ley, nos ha resultado útil para ilustrar por qué es conveniente usar el enfoque de teoría de
juegos. Una ventaja de este enfoque consiste en que incorpora explícitamente el hecho de que
diversos agentes involucrados en un problema no deben ser vistos como entes pasivos, sino como
jugadores que reaccionan racionalmente a cambios en su entorno de acuerdo a sus preferencias.
El segundo objeto de análisis ha sido la aprobación de reformas que eliminan la posibilidad de que
se usen los recursos públicos con fines partidistas. Este fenómeno ha sido ubicado en el contexto
de aquellos países de América Latina que han tenido largos periodos de regímenes democráticos
competidos. El tercer fenómeno ha sido el de los recursos de uso común. Hemos establecido las
características que los definen, así como los problemas que implican tanto su privatización como
su expropiación por parte del gobierno —soluciones tradicionales al riesgo de que sufran un uso
excesivo—. Posteriormente, hemos abordado el análisis, usando el enfoque de teoría de juegos,
del manejo de los recursos por parte de un grupo delimitado de usuarios locales. Hemos señalado
que la teoría de juegos demuestra que cuando sólo un mismo grupo de personas tiene acceso a un
recurso de uso común durante un tiempo indefinido, es posible proveer los incentivos adecuados
para que este grupo lo maneje exitosamente. También demuestra que un tamaño reducido del
grupo de individuos con acceso al recurso y una detección rápida de una posible sobreexplotación
son dos variables que facilitan este éxito. Hemos hecho referencia a algunos experimentos que
confirman la relevancia de las predicciones derivadas de los modelos de teoría de juegos, pero que
también muestran la existencia de factores adicionales que requieren la incorporación de otros
enfoques analíticos .
http://www.redalyc.org/pdf/598/59806604.pdf
T
El equilibrio de Nash
Esta investigación, liderada por la Universidad de Purdue lidera y financiada por la National
Science Foundation y Sandia National Laboratories, está basada en el “Equilibrio de Nash”,
desarrollado por el Premio Nobel de Economía John Nash.
En el equilibrio de Nash la estrategia que elige cada uno de los participantes de un conflicto o
juego es óptima, dada la estrategia que han elegido los demás.
Teoría prospectiva
El trabajo también aplica la «Teoría prospectiva», que describe cómo las personas toman
decisiones cuando hay incertidumbre y riesgo, decisiones que a menudo son solo en parte
racionales.
La investigación conducirá a una comprensión más completa de las vulnerabilidades que surgen en
los sistemas interconectados a gran escala y nos guiará al diseño de sistemas más seguros, con los
correspondientes beneficios sociales, explica Shreyas Sundaram, profesor asistente en la Escuela
de Ingeniería Eléctrica y Computación de Purdue.
Sundaram lidera la parte financiada por NSF del proyecto, trabajando con los investigadores co-
principales Saurabh Bagchi, profesor en la Escuela de Ingeniería Eléctrica e Informática y
Departamento de Informática, y Timothy Cason, profesor de economía en la Escuela de
Administración Krannert, con el objetivo de abordar, con ambos proyectos, la complejidad de
proteger los sistemas actuales a gran escala.
El estudio global proporcionará nuevos conocimientos sobre los tipos de decisiones que toman los
humanos cuando enfrentan amenazas de seguridad, a través de un enfoque integral que abarca la
teoría y los experimentos.
Gestión del riesgo de seguridad
Bagchi, describe que cualquier sistema a gran escala, como una red eléctrica, un sistema de
control industrial o una agencia de informes crediticios del consumidor, contiene muchas partes,
tanto físicas como cibernéticas, que puede ser necesario asegurar. Los responsables de las
decisiones humanas deben tomar decisiones pragmáticas sobre qué proteger y en qué medida.
Para complicar las cosas, muchos sistemas a gran escala involucran a «múltiples propietarios» y
compañías subsidiarias que son interdependientes y pueden ser vulnerables a los ataques, lo que
representa vínculos débiles en la red.
Sin embargo, las restricciones presupuestarias ponen límites a las medidas de seguridad. El
proyecto abordará el complejo funcionamiento de la toma de decisiones humanas y el hecho de
que varias partes interesadas podrían estar actuando en su propio interés, dijo Bagchi. Se podrían
usar modelos cooperativos donde todos decidan hacer lo mejor para el sistema, pero eso puede
no ser realista en la práctica, dijo. La gente puede no querer revelar sus propios secretos
comerciales.
Los investigadores han demostrado cómo formular un «problema de optimización» que hace
posible calcular de manera eficiente cuánto decidirá invertir una determinada parte interesada.
Según las consideraciones de Bagchi, la premisa básica es que la forma en que se configuran la
mayoría de los sistemas es que son un blanco fácil. El atacante puede intentar una y otra vez y solo
tener éxito una, mientras que el defensor tiene que tener éxito cada vez, cada ataque, al cien por
ciento. La defensa del objetivo móvil intenta cambiar esta dinámica y dice que el sistema que
quiero proteger no es un blanco fácil. Se va a reconfigurar a sí mismo; va a cambiar algún aspecto
de sí mismo de vez en cuando, de modo que si el atacante sigue intentando lo mismo, sus
posibilidades de éxito no van a aumentar porque el objetivo que está siendo atacado cambia.
Los primeros resultados de investigación en este aspecto del proyecto se presentaron durante la
conferencia de seguridad y privacidad de IEEE en mayo de 2017, en un documento en coautoría de
Bagchi y Clements, junto con Matthias Payer, profesor asistente de informática de Purdue.
Alex Roesler, subdirector del Centro integrado de sistemas militares de Sandia National Labs,
explica que no solo serán personas las encargadas de la toma de decisiones, sino también robots y
vehículos aéreos no tripulados y estos sistemas autónomos también toman decisiones
independientes.
Entonces, ¿los algoritmos harán que estos sistemas multi-UAV sean más seguros?
Las futuras tecnologías militares autónomas, como los UAV y los vehículos terrestres, serán
capaces de funcionar como inteligencia, vigilancia y reconocimiento persistentes, o PISR.
A su vez, Sundaram describe que la idea es que se implemente una flota de UAV u otros sistemas
móviles, estén monitoreando un área permanentemente. Ese es un aspecto fundamental:
recopilar inteligencia, vigilar, hacer reconocimiento. Cuando las comunicaciones con las estaciones
base se vean comprometidas, los vehículos podrán operar de manera «autoorganizada”.
Si algunos de los vehículos aéreos no tripulados se dañan, los demás deben poder seguir
funcionando juntos en una red que necesita ser lo suficientemente inteligente como para evitar
estos nodos defectuosos o mal funcionamiento.
https://www.thenewnow.es/negocio/teoria-juegos-la-ciberseguridad/