Está en la página 1de 36

HIPÓTESIS+EXPLICACIÓN DE LA= ARGUMENTO

DOBLE IMPLICACIÓN
... POR LO TANTO
V……..>O
IMPLICACIÓN

SINOPSIS: INFORMACIÓN SINTETIZADA. O RESUMEN.


AUTOR QUIEN HACE EL ESAYO
QUE EXPLICA
QUE CONCLUSION LLEGA
FECHA QUE SE HIZO

ESPURIA.LO QUE NO ES NUTRITIVO SE DESECHA.


SINOPSIS
1. AUTOR
2. ARGUMENTO PRINCIPAL (HIPÓTESIS+CONCLUSIÓN)
3. OPINIÓN QUE REALIZA LA SINOPSIS
4. CONTEXTO QUE SE HIZO.

ALTAMENTE RECOMENDABLE PUNTO 3 Y 4

¿QUÉ ES UN ENSAYO?
ES UNA NARRATIVA QUE EMPLEA UN MODELO METODOLÓGICO (CUALITATIVA O
CUANTITATIVA) PARA DEMOSTRAR UN ARGUMENTO.

DEFINICIÓN DOS:

¿QUÉ ES UN ANÁLISIS? ES LA CONCANETACIÓN (ENLAZAR) DE ARGUMENTOS(ES


UNA HIPÓTESIS DE LA EXPLICACIÓN)

EJEMPLO
TRATA DE LOS VALORES DEL HUMANO DEL SENTIR Y DECIR LA VERDAD.

* METODOLOGÍA DE LA INVESTIGACIÓN* TE AYUDA A DEPURAR Y ENTENDER TODA LA


INFORMACIÓN QUE SE TIENE.
VARIABLES EXOGENAS, ENDOGENAS, QUE ES UNA CORRELACION, CODEPENDENCIA.
VARIABLES PARA COMPRA DE COCHE
PRECIO
INGRESOS
USOS V NECESIDADES
SEGURO
COSTOS DE SERVICIOS.
TIPO Y USOS

PRECIO II
Y-C= U.NETA= 6 MIL
DE 2 PERSONAS GANAN 15+15=30 MIL TOYOTA LOS JAPONESES NO SE DEVALUAN
MUCHO
SEGURO=

 INTRODUCCION
 ANALISIS
 CONCLUSIÓN

TEORIA DE JUEGOS (ESCENARIOS ÓPTIMOS)


PELI DE UNA MENTE BRILLANTE DE TEORIA DE JUEGOS
JOHN FORBES NASH
Fuéun matemático estadounidense. Especialista en teoría de juegos, geometría
diferencial y ecuaciones en derivadas parciales, fue laureado con el Premio del Banco de
Suecia en Ciencias
MEGALÓMANO= ENFERMO DE PODER
*UNIVERSIDAD LUBUMBA
*TAREA BUSCAR* VARIABLES ESTOCASTICAS
TEORÍA DE JUEGOS
JUEGO DE CHIKEN RON, JUEGO SUMA CERO, BUDDLE OF SEXOS, APLICACIONES
PRÁCTICAS EN TEORIA DE JUEGOS EN SEGURIDAD PÚBLICA, ECONOMÍA, Y CIENCIAS
SOCIALES.

DILEMA DEL PRISIONERO


Teoría de juegos XXVII – Juego del gallina

En esta primera parte no aprenderemos ningún concepto nuevo, sino que estaremos dándole
vueltas a los que ya conocemos, para profundizar y aprender cosas nuevas en la segunda.

El juego consiste en que dos automovilistas se dirigen uno contra otro a gran velocidad. Si
uno de ellos se Aparta, pierde un poquito de estatus social por cobarde, mientras que el otro
lo gana. Si ambos se Apartan, ninguno pierde nada, mientras que si ambos Siguen, se
estrellan y se matan.

Veamos la matriz de pagos que resumiría esta situación.

Jugador 1
Se Aparta Sigue
Jugador Se Aparta 0,0 +1,-1
2 Sigue -1,+1 -100,-100

¿Qué haríais?

La versión más famosa de este juego es la de la película “Rebelde sin causa” (¿no la has
visto? Ya estás tardando), donde los automovilistas, en vez de dirigirse uno contra otro, se
dirigen hacia un acantilado con el coche. Pero, en cuanto al juego, no cambia mucho.

Características

Antes de continuar, vamos a dedicar unas líneas a analizar el juego según los conceptos que
hemos visto a lo largo de la serie, para que nos sirva de ejercicio (si no logras descubrir por
qué decimos cada punto, revisa el artículo correspondiente o pregunta en los comentarios):

 Es un juego simétrico.
 No es de suma cero.
 No existe una estrategia dominante para ninguno de los jugadores.
 Existen dos equilibrios de Nash en estrategias puras: Seguir/Apartar y
Apartar/Seguir.
 Dependiendo de cómo consideremos el juego, podemos tomarlo como secuencial o
como simultáneo. Cuando yo tengo que decidir si Seguir o si Apartarme, sé que el
otro, al menos hasta ahora, ha decidido Seguir. Porque si él hubiera decidido
Apartarse, yo ya habría ganado. Así que desde este punto de vista es secuencial.
Pero por el mismo motivo, sabemos que ambos jugadores seguiremos apurando la
decisión hasta el ultimísimo momento, en que ya no podamos esperar más a ver qué
hace el otro. Por lo tanto, todas las decisiones iniciales son triviales, sabemos que
ambos decidiremos Seguir. La única decisión que importa es la que tomamos en el
últimísimo momento. Y por lo tanto, podemos considerarlo simultáneo (la forma
más habitual).

Puede serte interesante comparar este juego con el de la batalla de sexos. En aquel
momento dijimos que aquellos juegos se llamaban genéricamente “de coordinación”,
porque el mejor resultado se daba cuando ambos jugadores elegían “bien” (recuerda el
ejemplo paradigmático de conducir por la izquierda o la derecha). Pues bien, a veces estos
juegos se llaman genéricamente “de anticoordinación”, porque el peor resultado se obtiene
cuando ambos deciden la misma cosa (el -100/-100).

¿Cuál es la estrategia adecuada? Luego iremos a eso, porque primero queremos dedicar
unos párrafos a demostrar que, aunque afortunadamente no existen muchos automovilistas
que se dediquen a jugar a esto, el juego es muy, muy práctico.

Ejemplos

Buscando aparcamiento (Flickr de Alex92287, cc-by)

Podemos empezar con una situación sencilla. Estamos buscando aparcamiento en un centro
comercial. Llevamos diez minutos dando vueltas; empezamos a cansarnos, y en el asiento
de atrás los niños se están poniendo pesados. De pronto vemos un hueco, hacia el que
también se dirige como un kamikaze otro conductor. Tenemos dos opciones: intentar
colarnos nosotros primero (Seguir) o cederle el sitio (Apartarnos). Si nosotros Seguimos y
el otro se Aparta, ganamos un poco (aunque solo sea porque nuestros hijos en el asiento de
atrás dejan de enfurruñarse). Si nos Apartamos, perdemos un poco, porque tenemos que
seguir buscando sitio otro rato. Si ambos Seguimos, al final tenemos un accidente y en vez
de perder otros diez minutos buscando otro sitio, tenemos que perder veinte arreglando los
papeles del seguro, y el coche una semana en el taller. Nótese que la combinación
Apartarse/Apartarse no se puede producir, ya que el último en Apartarse cambiará su
decisión.

Vamos a hacerla ahora un poco más grave. Estamos negociando un acuerdo comercial con
un cliente. Él nos necesita, porque necesita nuestro servicio: si no lo contrata, él no podrá
hacer su trabajo y perderá dinero. Pero claro, ambos queremos hacernos los duros (nosotros
para subir el precio y él para bajarlo). Si nosotros apretamos y él cede, le vendemos el
servicio más caro de lo normal. Si él aprieta y nosotros cedemos, le vendemos el servicio
más barato de lo normal. Si ambos apretamos, el trato no se cierra, nosotros no ganamos
ese dinero y él no puede hacer su trabajo (perdiendo dinero también). Si ambos cedemos un
poco, es la situación normal.

Más grave aún. Ya lo hemos visto cuando estudiamos “dos-tercios-de-la-media“: la crisis


de los misiles cubanos. Dos países (que en aquel artículo eran la URSS y EEUU) se
enfrentan en una escalada de violencia: el primero mata a un soldado por accidente, el otro
ataca a una patrulla por despecho, el primero bombardea una base, el otro una ciudad, el
primero lanza sus misiles nucleares… y el segundo también. Game over.
Cualquiera puede ceder (Apartarse) en cualquier momento, o Seguir escalando. El que cede
cuando el otro amenaza sufre un daño político, que es la recompensa del otro. Pero si
ambos siguen escalando, ambos resultan aniquilados.

Y entonces, ¿hay alguna estrategia adecuada?

Pues alguna hay, pero su éxito no está en absoluto garantizado.

Quemar las naves o quien da primero da dos veces

Una de las formas de enfrentarse a este juego es eliminar una de nuestras opciones. Por
ejemplo, en el juego del gallina con los automóviles, podemos encadenar el volante de
forma que sea imposible girarlo para Apartarse. De esa forma el otro jugador ya no tiene
duda de cuál va a ser nuestra decisión, y solo tiene una decisión racional: Apartarse.

Esto es lo que hace muchas veces el comercial cuando intenta vender algo: “no es que no
quiera bajarte el precio, es que no puedo, no está en mi mano. El precio me lo fijan desde la
central, no puedo bajarlo más”. O cuando el cliente negocia: “si a mí me gusta lo que me
ofreces, pero a ese precio no puedo comprártelo, perdería dinero”. Que sea verdad o no…
eso ya no depende de este artículo.

La expresión “quemar las naves” parece venir de la invasión del imperio azteca por parte de
Hernán Cortes, con apenas 300 ó 400 soldados españoles. Para evitar que sus hombres
tuvieran la tentación de volver navegando a la seguridad de La Habana, ordenó barrenar los
cascos de las naves que les habían llevado a Nueva España,[1] de modo que solo les quedara
la opción de ir hacia adelante. La gracia no es solo que los españoles sepan que no pueden
retroceder, y por lo tanto luchen mejor, sino que los enemigos también saben que aquellos
no pueden retroceder, y por lo tanto saben que los españoles van a luchar como leones,
favoreciendo el que ellos mismos se retiren.

En algunos sitios se dice que la expresión viene de la invasión de Fenicia por parte de
Alejandro Magno, donde se supone que usó una estratagema similar, pero
nuestro desasnador alejandrino oficial dice que no hay pruebas suficientes de dicho
proceder. Por si os la encontráis alguna vez, los ingleses usan la expresión “burn the
bridges” (quemar los puentes) para representar esto.

Relacionado con esto está la estrategia de “quien da primero, da dos veces”. Si el juego no
es completamente simultáneo, sino que podemos decidir ser los primeros en elegir,
podemos intentar elegir Seguir. Al elegir los primeros la estrategia agresiva, el otro está
forzado a elegir la estrategia pasiva, pues de lo contrario causaría su propia destrucción…
¿o no?

MAD, o estrategia del loco

¿Qué impide que esta sea la mejor estrategia? Lo impide el hecho de que no sabemos si el
otro está loco y va a sacrificarse para castigarnos.

Esto es un juego de palabras en inglés, imposible de traducir. Mad significa loco, pero
también son las siglas de Mutual Assured Destruction (Destrucción Mutua Asegurada). A
veces también se dice “jugar la carta del loco” como referencia a usar esta estrategia,
imagino que en referencia a la carta del comodín.
Este fue el corazón de la Guerra Fría: si tú me atacas, empezará una escalada que nos
obligará a ambos a disparar nuestros misiles nucleares y ambos seremos destruidos. [2] Así
que no me ataques. Es más, ni siquiera acerques tus soldados a los míos, no sea que haya un
accidente y la liemos.

A menudo se llama a este resultado “suma cero”, pero no en el mismo sentido en que lo
hemos utilizado nosotros, sino en el sentido de 1+1=0. Si ambos “ganan” la guerra, ambos
resultan destruidos. Y todos los demás, de paso, también.

Curiosamente, cuando la Guerra Fría empezaba a enfriarse (valga la paradoja), y ambos


bandos empezaron a reducir su arsenal, fue, según algunos analistas, cuando mayor peligro
hubo. En pleno apogeo de la guerra fría, había millones de cabezas nucleares en cada bando
(no sé el número, ni siquiera el orden de magnitud, y de hecho tampoco estoy seguro de que
realmente esta fuera la situación real, pero sigue el razonamiento sin detenerte en esa
menudencia). Si uno lanzaba un ataque preventivamente, es probable que destruyera el 99%
de las cabezas nucleares del enemigo cuando aún estaban en sus silos. Pero ese 1% que
quedaba seguían siendo miles de cabezas, suficiente para lanzar un contraataque de
represalia que aniquilase al primero sin ninguna duda.

En cambio, cuando ambos empezaron a reducir sus arsenales… por ejemplo en vez de
millones ya solo había 1.000 cabezas en cada bando… el 99% de destrucción en el primer
ataque dejaría 10 cabezas vivas. Suficientes para lanzar un contraataque, sí; dañino, sí; pero
no suficiente para aniquilar al otro. A lo peor alguien podría pensar que el coste de sufrir el
ataque de esas 10 cabezas era asumible…

En este momento tengo que recordar el estupendo cuento de Arthur C. Clarke “La última
orden”:

«― Os habla el presidente. El hecho de que estéis oyendo este mensaje significa que ya he
muerto y que nuestro país ha sido destruido. Pero vosotros sois soldados… sois los más
adiestrados de toda nuestra historia. Vosotros sabéis obedecer órdenes. Ahora tenéis que
obedecer la más dura que jamás habéis recibido…»

Hasta aquí puedo leer. Es un cuento muy cortito (en la edición que yo tengo, no llega a dos
páginas), así que si pongo más ya no creo que pudiera acogerme al derecho de cita, y
además te lo estropearía. Si no lo has leído, ya estás tardando. Casi lloré la primera vez que
lo leí.[3]

Vamos a dejarlo aquí, mientras damos tiempo a los lectores para ir a repasar las películas y
lecturas que hemos recomendado, y para que se sequen las lagrimitas después. En la
segunda parte buscaremos otra estrategia, y buscaremos la iteración del juego, acabando
con otra forma del juego del gallina que nos resultará más fácil de analizar.
Teoría de juegos XXIV – La guerra de sexos

En el último artículo nos quedamos con las ganas de ver cómo se solucionaba la guerra de
sexos entre Ana y Alberto… bien, vamos a ello.

Comenzamos recordando la matriz de pagos que habíamos propuesto:

Ana
Gusta Odia
Alberto Gusta 1,1 3,2
Odia 2,3 0,0

Si no tienes fresco aquel primer artículo, conviene que lo refresques.

Solución Maximin

Si ambos jugadores aplican una estrategia Maximin, Alberto elegirá Tenis y Ana elegirá
Discoteca. No vamos a contar cómo hemos llegado a esa conclusión, porque la estrategia
Maximin ya la hemos contado antes. Si alguien quiere resolverlo como ejercicio en los
comentarios, bienvenido sea. Y si no, que cada uno se lo resuelva en su cabeza.

El caso es que ambos cobran 1, por lo que no parece una solución muy buena, ¿no? Bueno,
ya dijimos que Maximin era una estrategia conservadora…

Además, es una situación inestable: cualquiera de los dos mejora si cambia su decisión.

Equilibrio de Nash en estrategias puras

En este juego existen dos equilibrios de Nash en estrategias puras: Tenis/Tenis y


Discoteca/Discoteca. De nuevo, si no tienes claro por qué esos son equilibrios de Nash,
revisa el artículo correspondiente y resuélvelo como ejercicio en los comentarios si quieres.

Por un lado, cada uno de los equilibrios de Nash es “injusto”, en el sentido de que uno de
los jugadores gana más que el otro. Así que si Ana tiene la mala suerte de caer en el
equilibrio Tenis/Tenis, ella siempre ganará 2… Alberto estará contentísimo, pero Ana…
siempre le quedará el reconcome de que no sale ganando tanto como ella querría.

Por otro lado, son… ¿cómo llamarlo?… “equilibrios inestables”… en el sentido de que si
uno de los jugadores, incluso en contra de su interés, cambia, el otro está “obligado” a
cambiar también.

Ejemplo: están en Tenis/Tenis (cobrando 3/2). Ana decide “tirarse un farol” y pasar a
Tenis/Discoteca (cobrando 1/1) incluso en contra de su propio interés. Si Ana sostiene su
farol, la mejor solución para Alberto es pasar a Discoteca/Discoteca (pasando a cobrar 2/3).
Pero claro, entonces puede ser Alberto el que se “tire el farol”, pasando a Tenis/Discoteca.
¿Qué hará Ana?
¿Cuál es el riesgo entonces? Que ambos se “tiren el farol” y sostengan el estado
Tenis/Discoteca (cobrando 1/1).

Equilibrio de Nash en estrategias mixtas

Como ya hemos avanzado mucho en la serie, sabemos que una alternativa es usar
estrategias mixtas. Si intentamos un método del gradiente como hicimos en el juego de los
tenistas, veremos que no se alcanza una solución. Esto es algo que podíamos haber
deducido, ya que tanto Tenis/Discoteca como Discoteca/Tenis son dos pozos de la curva, y
ambos son igual de profundos.[1] Si intentamos aplicar un método de gradiente en una curva
que tiene dos pozos, y ambos iguales… a veces caeremos en uno, otras en otro, otras veces
iremos saltando… Si recordáis el artículo de los tenistas, metíamos “ruido” para provocar
saltos en la bolita que eventualmente nos sacaran de un mínimo local y nos llevaran a un
mínimo global; pues bien, podemos asimilar ese ruido a los “faroles” que se tiran uno y
otro para obligar a cambiar. Solo que aquí no existe uno de los mínimos que sea local y el
otro global: ambos mínimos son igual de importantes. En resumen, ese procedimiento no
nos lleva a ningún lado nuevo.

Esto no debería sorprendernos, ya que las estrategias puras no son sino un caso particular
de las mixtas.

Así que, ¿cómo descubrimos el otro equilibrio de estrategias mixtas? Mejor dicho, ¿existe
algún otro equilibrio en estrategias mixtas? Pues sí, existe.

En este punto, voy a hacer un poco de trampa. Primero voy a presentarte resultados
numéricos, para que veas de manera obvia que ese equilibrio existe, y luego vamos a
utilizar ese conocimiento para resolverlo analíticamente.

Hemos hecho unas hojas de cálculo con la esperanza de pago según la probabilidad de uno
y otro de elegir lo que le Gusta. Nótese que son dos hojas, una para el pago que recibe
Alberto y otra para el pago que recibe Ana:
Hay una columna del pago de Alberto que
nos resulta curiosa, y por eso la hemos resaltado en verde. Resulta que, para cualquier una
estrategia mixta de Ana, Alberto recibe el mismo pago (1,50) independientemente de la
probabilidad con que él elija. Curioso, ¿no? Evidentemente, dado que el juego es simétrico,
ocurre lo mismo con una de las filas del pago de Ana.

Tomaos un minuto para volver a mirar esas tablas, porque es fácil no darse cuenta del
siguiente detalle: cuando está decidiendo Alberto, la tabla que debemos mirar es la de
Alberto; y cuando esté decidiendo Ana, la de Ana. Por lo tanto, en la primera tabla, la de
Alberto, siempre nos moveremos en vertical, hacia arriba o hacia abajo. Consecuentemente,
en la segunda tabla, la de Ana, siempre nos moveremos en horizontal.

Así que, si por el motivo que fuera, Alberto hubiera usado una estrategia 0,75 y Ana
hubiera usado una estrategia 0,75, estaríamos en la posición 0,75/0,75, y el pago sería 1,50
para cada uno. Si Alberto se moviera, en vertical, modificando su estrategia mixta…
¿mejoraría su pago? No, seguiría siendo 1,50. ¿Y si se moviera Ana en horizontal en su
tabla? Lo mismo, sigue cobrando 1,50. ¡Justo eso es la definición de equilibrio de Nash!
[2]
 ¡0,75/0,75 es un equilibrio de Nash!

Y… Uhm… qué casualidad… ambos valores coinciden, son el mismo número, 0,75…
¿será casualidad? Pues no, no es casualidad. Esto es lo que se llama equilibrio simétrico, y
se demuestra que todo juego simétrico tiene un equilibrio simétrico en estrategias
mixtas.[3]

¿Cómo encontramos ese punto analíticamente? Una vez vistas las tablas, es fácil. Solo
tenemos que darnos cuenta de que, por ejemplo para Ana, cuando estamos por encima de la
línea verde, sus pagos crecen cuando se mueve hacia la derecha; y cuando estamos por
debajo de la línea verde, sus pagos crecen cuando nos movemos hacia la izquierda. Una vez
más, el concepto de derivada, que ya hemos usado antes.

Si existen filas donde la derivada es positiva, y filas donde la derivada es negativa, existe
necesariamente una fila donde la derivada es nula (que es justo lo que estamos buscando).
Así que podemos llamar PanaG a la probabilidad de que Ana elija lo que le Gusta (y
análogamente definimos PalbG). Luego calculamos la esperanza del pago para Ana de la
siguiente manera:

Eana(PanaG, PalbG) = 1·PalbG·PanaG + 2·PalbG·(1-PanaG) + 3·(1-PalbG)·PanaG

Podemos calcular su derivada respecto a PanaG:

Eana’(PanaG, PalbG) = 1·PalbG -2·PalbG + 3 – 3·PalbG

Sabemos que en la línea verde, esa derivada es 0, así que igualamos a 0, resolvemos la
ecuación y nos sale:

PalbG=0,75

Análogo procedimiento podemos hacer, con Ealb(PalbG, PanaG) para obtener la columna


verde de la primera tabla.

En el caso general, en que los pagos sean:

Ana
Gusta Odia
Alberto Gusta C,C A,D
Odia D,A B,B

la fórmula del punto de equilibrio es 

¿Es un buen equilibrio? Pues no, no mucho. Podemos fijarnos en los otros dos equilibrios,
los de estrategias puras, que parece que no nos gustaban porque uno ganaba menos que el
otro; vemos que en aquellos, incluso el que menos gana de los dos, gana 2 (y el otro gana
3). Y en este otro equilibrio, ambos ganan 1,5…

¿Y eso como es posible? Es posible, porque en los otros dos casos (Gusta/Odia y
Odia/Gusta), siempre elegían lo mismo. Es verdad que uno de ellos no ganará tanto como
podía, pero bueno. En cambio, en este caso, ambos eligen al azar, con un 75% de
probabilidades de elegir lo que a ellos les gusta. Eso conlleva que algunas veces (con un
probabilidad nada desdeñable) elegirán Gusta/Gusta o incluso Odia/Odia, lo que hace bajar
mucho la media. Es lo que se llama un equilibrio ineficiente. Ni siquiera es que uno gane
más y otro menos que antes, es que ambos ganan menos que antes.

Pero es que además, si los otros equilibrios nos parecían inestables, porque alguien podría
intentar tirarse un farol… aquí es más inestable aún. Basta con que uno de ellos se desvíe
mínimamente del 0,75 para que la tendencia natural sea a incrementar aún más esa
desviación, acabando una vez más en Gusta/Odia u Odia/Gusta (dependiendo de hacia
dónde fuera la desviación inicial). Un ejemplo: si en lugar de 0,75/0,75 están en 0,80/0,75,
el pago es 1,50/1,45. Pero ahora Ana ya sale ganando si reduce su PanaG, así que lo
reducirá hasta llegar a PanaG=0 (que es con lo que más gana ella, en concreto 1,60) y
entonces Alberto aumentará su PalbG hasta llegar a 1. Es decir, la estrategia pura
Gusta/Odia.

Por si alguien se lo estaba preguntando, este es el motivo de que el método del gradiente no
encuentre este equilibrio: a menos que estemos exactamente en 0,75/0,75, el gradiente
tenderá a alejarse, no a acercarse. Es porque es un equilibrio que no está en un máximo,
sino en un punto arbitrario.

A lo largo de la serie algún lector ha confundido, probablemente por la forma en que hemos
ido explicado las cosas, la idea de que un punto sea equilibrio de Nash con el hecho de que
sea la mejor estrategia. A menudo es verdad que los equilibrios son la mejor estrategia (al
menos para alguna de las definiciones de “mejor”), como por ejemplo en Piedra-Papel-
Tijera… pero no siempre. Como demostración trivial, en este caso tenemos 3 equilibrios
posibles y no pueden ser todos a la vez la mejor estrategia; luego no puede ser cierto que el
equilibrio de Nash sea la mejor estrategia.

Estrategia mixta máxima

Aún podemos mejorar. Ana y Alberto pueden saber mucho de teoría de juegos y saber que,
como hemos visto más arriba, todo juego simétrico tiene un equilibrio simétrico en
estrategias mixtas. Así que podrían autolimitarse a buscar estrategias simétricas. Es decir,
estrategias en que PalbG = PanaG. Llamemos a eso P, para abreviar.

Es decir, nos estaríamos moviendo por la diagonal de las dos tablas que veíamos antes, y
dado que el juego es simétrico, esa diagonal es la misma para ambas tablas. O dicho de otro
modo: podemos reducir esas funciones, que eran de dos dimensiones y con resultado
compuesto por dos valores,[4] a una función de una sola dimensión y con un único resultado
que aplica a ambos, Alberto y Ana:

E(P) = P·P·1+ P·(1-P)·3 + (1-P)·P·2 + (1-P)·(1-P)·0 = -4P2+5P

Podemos dibujar esta curva, que tiene la siguiente forma:


Si queremos encontrar analíticamente el máximo, podemos simplemente derivar e igualar a
0, como hacíamos cuando estábamos en el cole, y encontraremos que el máximo es
para P=5/8=0,625, que nos da una esperanza de 1,56.

No olvidemos que el juego es simétrico y nos estamos moviendo por la diagonal, así que
ambos deben elegir lo que les gusta con probabilidad 0,625 y obtendrán un pago esperado
de 1,56.

Fijaos en esto: si uno de los dos cediera, y siempre hiciera lo que quiere el otro, obtendría
un pago de 2 (y además su pareja obtendrá un pago de 3). Pero si ambos aplican la máxima
estrategia mixta simétrica, ambos cobran 1,56 de media. Algo hemos ganado respecto al
equilibrio del 0,75/0,75 de antes, pero no mucho. Y además, si aquel era un equilibrio
inestable y eso nos molestaba… es que este no es ni siquiera equilibrio.

Cooperación

¿Aún te extraña que llevemos intentando resolver esta guerra de sexos desde que
aprendimos a caminar erguidos?

Menos mal que la reproducción es un fuerte incentivo para llegar a un entendimiento, que si
no…

A pesar de que dijimos inicialmente que el juego no permite la coordinación previa a la


decisión, no te sorprenderá si decimos que la única solución satisfactoria es romper las
reglas y negociar ir la mitad de las veces a cada sitio coordinadamente.[5]

Genéricamente, se llama a eso un juego de coordinación. El juego de coordinación clásico


y paradigmático es la elección del sentido de la conducción (por ejemplo, en España
estamos acostumbrados a conducir por la derecha, mientras que en Reino Unido conducen
por la izquierda). Dos conductores puede decidir ir cada uno de ellos por la derecha o por la
izquierda:

Conductor B
Izquierda Derecha
Conducto Izquierda 0,0 -100,-100
rA Derecha -100,-100 0,0

Si ambos coinciden en la elección, todo perfecto. Si no coinciden, acaban chocando.

Existen 3 equilibrios en este juego: los dos de estrategias puras I/I y D/D y otro de
estrategia mixta en el que los conductores eligen con un 50%. Este último es obviamente
peor que los otros dos, pero en realidad no hay, desde este punto de vista, nada que diga
que I/I o D/D sea mejor uno que otro, así que la Ley determina una forma arbitrariamente y
listo.

¿Qué sería el equivalente a la Ley en nuestro ejemplo de la guerra de sexos? Pues la propia
evolución. Ya lo hemos visto cuando estudiamos los algoritmos genéticos en el dilema del
prisionero iterado. Si no cooperamos, difícilmente sobreviviremos como especie… o dicho
de otro modo: “la reproducción es un fuerte incentivo para llegar a un entendimiento” (eso
ya lo he dicho, ¿no?)… ¿o hay alguna otra solución?

Calzonazos
Como decía un amigo, parafraseando un refrán sobre moteros: “solo hay dos tipos de
hombres y nada más que dos: los que saben que son unos calzonazos y los que no lo
saben”.

Me vais a permitir este toque de humor sexista (aunque no sé si machista o feminista) para
explicar la modificación más habitual al juego: uno de los jugadores rompe la simetría.
Si uno de ellos en realidad prefiere su actividad más que la compañía del otro, la matriz
puede parecerse a esta otra:

Ana
Tenis Discoteca
Alberto Tenis 3,1 1,2
Discoteca 0,0 2,3

Es decir, Ana sí que quiere ir con Alberto… pero le Gusta más ir a la Discoteca, aunque sea
sola, que ir al Tenis, aunque sea con Alberto.

Ahora el juego ya no es simétrico, y el único equilibrio en estrategias puras es


Discoteca/Discoteca.

Si acaso estuvieran en Tenis/Tenis, Ana cambiaría a Discoteca, pero no por “tirarse un


farol” como veíamos antes, sino porque realmente ella sale ganando, así que no tiene
ningún incentivo para volver al Tenis, y Alberto acabará cediendo y cambiando también a
Discoteca. Y a Alberto no le vale de nada “tirarse un farol”, porque si vuelve a
Tenis/Discoteca, Ana jamás cambiará a Tenis/Tenis.

Cuidado: que sea el único equilibrio en estrategias puras no quiere decir que sea el único
equilibrio.

Puede existir otro equilibrio en estrategias mixtas, porque no todos los posibles valores de
la asimetría llevan a que Discoteca/Discoteca sea el único equilibrio. No vamos a
demostrarlo, pero sí a dejarlo aquí por completitud. En un juego de coordinación, si la
matriz tiene la forma genérica:

Ana
Gusta Odia
Alberto Gusta C,c A,a
Odia D,d B,b

existe un equilibrio de Nash en estrategias mixtas en el punto:[6]

Han sido un par de artículos duros, y además la conclusión parece que nos deja un sabor
agridulce: por mucho que analizamos, no acabamos de encontrar una solución
satisfactoria… pues sí… real como la vida misma. A veces no podemos encontrar una
solución buena y tenemos que conformarnos con una solución no demasiado mala.
La suma cero.
El juego dice algo así: tenemos dos lobos, Rómulo y Remo, que pueden decidir ir a cazar
un Conejo o cooperar para cazar un Ciervo.

Si uno de ellos decide cazar un Conejo, come. No es que se pegue un festín, pero vaya,
come.

Si ambos deciden ir juntos a cazar un Ciervo, ambos se pegan un festín de la leche. No solo
comen, sino que además se ponen las botas, y pueden dedicar las energías sobrantes a, por
ejemplo, la reproducción.

Pero si uno de ellos decide ir a por el Ciervo, y el otro va a por el Conejo, el que decidió ir
a por el Ciervo se queda sin nada, porque él solo no es capaz de cazarlo (no obstante, su
“amigo”, que se fue a por el Conejo, sí come).

Podemos representar esto según la siguiente matriz de pagos (primero ponemos la


recompensa de Rómulo y luego la de Remo):

Remo
Ciervo Conejo
Rómulo Ciervo 4,4 0,3
Conejo 3,0 3,3

Representamos con un 3 el hecho de que comen, con 4 el hecho de que no solamente


comen, sino que se pegan un festín, y con 0 el hecho de que se quedan con el estómago
vacío.

La alternativa también es entrañable... en algunos sitios, hasta son animales de compañía


(Image*After)

¿Existe una estrategia dominante para alguno de los jugadores? Recordemos cómo se


buscaba: para cada una de las posibles decisiones del otro jugador, elegíamos nuestra mejor
opción. Si en todos los casos es la misma elección, eso es una estrategia dominante.

Pues no, en este caso no existe estrategia dominante.


Si Remo elige Ciervo, la mejor elección de Rómulo es Ciervo. Pero si Remo elige Conejo,
la mejor elección de Rómulo es Conejo. Es decir, Rómulo no tiene una estrategia
dominante (ni tampoco Remo, pues su situación es la misma).

¿Existe algún equilibrio de Nash? Sí, existen dos equilibrios de Nash: Ciervo-Ciervo y


Conejo-Conejo.

 Si ambos eligieron Conejo, el que cambie su elección a Ciervo se queda sin nada,
así que no está tentado de cambiar. Luego Conejo-Conejo es un equilibrio de Nash.
 Si ambos eligieron Ciervo, el que cambie su elección a Conejo pasa de cobrar 4 a
cobrar 3, así que no le interesa hacerlo. Luego Ciervo-Ciervo es un equilibrio de
Nash.
 Si uno elige Conejo y otro Ciervo, cualquiera de los dos cambios beneficia a
alguien. Si el que eligió Conejo cambia a Ciervo, pasa de ganar 3 a ganar 4. Así que
está tentado de cambiar. Y el que eligió Ciervo, que actualmente gana 0, también
sale beneficiado (pasando a ganar 3) si cambia a Conejo. Luego Conejo-Ciervo y
Ciervo-Conejo no son equilibrios de Nash.

Aunque a algunos les parecerá obvio, debemos darnos cuenta de que las situaciones no son
las mismas que en el dilema del prisionero, porque la matriz no es exactamente igual,
aunque sea parecida. Tomando una matriz de pagos genérica como la siguiente:

Jugador 2
Alfa Beta
Jugador Alfa a,a c,b
1 Beta b,c d,d

Generalmente se supone que estamos en un juego como la caza del ciervo si se cumple la
relación a>b>=d>c (en nuestro juego, 4>3>=3>0), pero estamos en uno como el dilema del
prisionero si se cumple la relación c>d>a>b (en nuestro ejemplo, 0>-1>-6>-10). [1] Como
estamos considerando solo estrategias puras, los valores exactos de los números no
afectan, pero si estudiáramos estrategias mixtas, que veremos más adelante, entonces no
solo la relación es importante, sino también su valor exacto. Y también son importantes
para saber si el juego es de suma cero o no.

Suma cero

Juego de suma cero: un juego es de suma cero si para todas las combinaciones de
decisiones, la suma de las recompensas de todos los jugadores es cero (o cualquier otro
número constante).

Obviamente, la caza del ciervo, tal y como lo hemos planteado, es un juego que no es de


suma cero:[2] si los lobos coinciden en su decisión (sea Conejo-Conejo o Ciervo-Ciervo),
ambos ganan. Incluso en el caso peor, el que no gana nada, tampoco pierde.

Pero si hubiéramos elegido otros números…

A lo largo de la serie hemos visto juegos que sí eran de suma cero y juegos que no:

 De suma cero: piedra-papel-tijera (al menos alguna de las versiones que dimos), el
ultimátum, el dictador; y muchos que no hemos visto, pero que a cualquiera se le
ocurren: el ajedrez, las damas, el póker…
 No de suma cero: alguna de las versiones de piedra-papel-tijera, la subasta del dólar,
el ciempiés, el juego de confianza, las pensiones y el dilema del prisionero.

Se utiliza también el término suma cero aunque no sume cero estrictamente, sino cualquier


otro número fijo. Por ejemplo, podemos decir que las elecciones al Congreso son un juego
de suma cero, porque la suma de todos los diputados de todos los partidos es 350. Si uno
gana diputados, es porque los pierde otro (o, mejor dicho, los deja de ganar). Estrictamente,
deberíamos decir que es un juego de “suma 350″, pero cuando decimos que suma cero, se
entiende, ¿no? Algunos autores utilizan el término suma constantepara representar esta
situación, pero no todos, así que conviene pensar que suma cero podría referirse a cuando
suman un número fijo, independientemente de que sea 0 u otro.

Suma cero y la bolsa

El hecho de saber si un juego es de suma cero o no lo es, es importante. Fijaos que si la


suma debe ser cero, para que alguien gane, otro debe perder. Por ejemplo, decidir si el
ajedrez es de suma cero o no es una discusión ociosa. Si has perdido la partida, pues la has
perdido, solo tu ego sale dañado.

Pero decidir si la Bolsa es un juego de suma cero o no (o mejor dicho: suma constante o no)
tiene consecuencias más graves. ¿Para que alguien gane dinero en Bolsa, debe dejar de
ganar algún otro (hoy o en el futuro)? O… ¿es posible que todos ganen? Durante años ha
parecido que las ganancias de la Bolsa podían seguir creciendo y creciendo indefinidamente
y que todo el mundo ganaba… pero las caídas de los últimos años han hecho perder a
muchos… ¿la ganancia de aquellos era la pérdida de estos? A menudo se dice sobre la
Bolsa que “para que alguien gane, tiene que haber un gilipollas que pierda. Y si no sabes
quién es el gilipollas, es que el gilipollas eres tú”. Pues saber si la Bolsa es un juego de
suma cero o no lo es es determinar si esa frase es cierta o no.

Falacia de suma cero y la cantidad de trabajo

Por supuesto, también lo contrario es malo. Suponer que un juego es de suma cero cuando
no lo es se conoce como falacia de suma cero, y puede llevar a análisis equivocados (o
incluso malintencionados).

Una de las falacias de suma cero más habituales es que la cantidad de trabajo disponible es
constante y por lo tanto, si las máquinas lo hacen por nosotros, los humanos nos
quedaremos sin trabajo. Solo hace falta ver la evolución histórica para ver si es verdad:

 Siglo XV a.C. Había unos 5M de humanos, y todos trabajaban.


 Siglo I. Población: 300M de humanos. Se han inventado el acueducto (no hacen
falta aguadores), el carro (no hacen falta porteadores), el arado (no hacen falta
tantos agricultores)… ¿Quiere eso decir que ahora solo trabajan 3M de humanos?
No. Trabajan los 300M de humanos.
 Siglo XIX. Población: 1.000M de humanos. Se han inventado la máquina de vapor
(no se fabrican más carros), la máquina de coser (menos costureras), la imprenta
(menos escribanos)… ¿Cuánta gente trabaja? Los 1.000M de humanos.
 Siglo XXI. Población: 6.000M de humanos. Se han inventado el ordenador (no más
contables), el walkman (no más músicos), el email (no más carteros)… ¿hay menos
gente trabajando? No, hay más. Trabajan los 6.000M de humanos.[3]
 Siglo XXX. Población: 10.000M de humanos y 10.000M de androides. El ser
humano no vuelve a poner una piedra sobre otra, agachar el lomo, realizar una sola
tarea pesada o repetitiva. ¿Y qué? Se dedicará a la ciencia, el arte, el ocio, la
enseñanza…

Cuantas más máquinas tenemos, más gente trabaja.

Si creemos que la necesidad laboral es de suma cero, prohibiremos las máquinas. Si


sabemos que no es de suma cero, entonces fomentaremos la investigación y construcción de
máquinas. Es posible que, a corto plazo, automatizar una planta de producción mande al
paro a 10 obreros, pero a largo plazo eso beneficiará a la humanidad en su conjunto.
Mientras tanto, si queremos (y esto ya no es teoría de juegos sino política), podemos dar
protección social a esos parados y/o formarlos para que dejen de realizar ese trabajo, que ya
no es necesario, y aprendan a realizar otro.

Cooperación social

Para muchos autores, el dilema del prisionero (y sobre todo su forma iterada, como hemos
visto) es la mejor forma de estudiar la cooperación social.

Para otros autores, en cambio, la caza del ciervo es mejor forma de estudiarla, y de hecho
muchos de los ejemplos reales que se nos ocurran pueden corresponderse a uno u otro
juego dependiendo de los valores que elijamos en la matriz de recompensas. La
especialización de las células en los seres pluricelulares, la caza en manada de los lobos y
muchas otras especies, la especialización del trabajo en las sociedades humanas… todo ello
son situaciones en que quizá podría aplicarse mejor la caza del ciervo que el dilema del
prisionero.

Además del ejemplo que ya hemos visto de los lobos en manada, pensemos por ejemplo en
unos hombres prehistóricos. Si toda la tribu se va a recolectar bayas, todos comerán bayas.
Al fin y al cabo, no se morirán de hambre, pues los monos llevan milenios haciéndolo. Pero
también pueden cooperar. Si quien fabrica buenas lanzas se dedica a fabricar lanzas, el que
lanza muy bien podrá usar ese arma para cazar un mamut… mamut que habrá sido avistado
por el mejor observador y perseguido por el mejor rastreador; y luego el que mejor cocina
podrá ocuparse de conservar ese mamut durante meses; y el que mejor curte la piel se
encargará de hacer buenos abrigos; y así respectivamente, hasta que todos ganan más que si
simplemente recolectaran bayas. Por ejemplo, pueden dedicar el exceso de ganancia a
pensar cómo mejorar sus casas, inventar el arco o simplemente reproducirse más porque
hay más comida para las crías.

La explicación de por qué este juego les parece mejor se debe a los matices que existen
entre ambos equilibrios. Porque no, no todos los equilibrios son iguales. El equilibrio
Ciervo-Ciervo es lo que se llama de recompensa dominante, porque obtienen mayor
recompensa,[4] mientras que el equilibrio Conejo-Conejo se llama de riesgo dominante,
porque el que lo elige está prefiriendo no arriesgarse a quedarse con 0 (en el próximo
artículo veremos la estrategia Maximin y formalizaremos un poco esto). Parece que los
equilibrios de recompensa dominante se eligen más a menudo cuando los jugadores
conocen bien la matriz de pagos, pero los de riesgo dominante se eligen más cuando hay
dudas (sobre las recompensas del otro, fundamentalmente, que son las que nos impiden
deducir qué es lo que hará el otro).

Estoy deseando leer en los comentarios las opiniones de los lectores sobre cuál de los dos
representa mejor la cooperación social.
Para ir abriendo el debate, doy la mía: en mi opinión, el dilema del prisionero es una mejor
representación de la cooperación social. ¿Por qué opino eso? Porque Ciervo-Ciervo es
un equilibrio de Nash, así que el hecho de que los seres sociales elijan Ciervo-Ciervo puede
no significar más que el sostener el equilibrio de Nash, y no un comportamiento
verdaderamente social. En cambio, el punto Callar-Callar del dilema del prisionero no era
un equilibrio de Nash, era un punto inestable que va en contra de las estrategias
dominantes de ambos jugadores, y, a pesar de ello, los jugadores sociales lo elijen. Para no
sesgar demasiado el debate con mi opinión, doy a la vez el contraargumento: parece que los
seres sociales elegimos el equilibrio de recompensa dominante, aún sin conocer realmente
al otro. Es como cuando a las 2 de la madrugada, en una carretera desierta, paras para
ayudar a un desconocido que está parado en el arcén con el capó abierto y el coche echando
humo.

https://eltamiz.com/elcedazo/2011/04/25/teoria-de-juegos-xxiv-la-guerra-de-sexos-y-ii/
https://eltamiz.com/elcedazo/2011/01/03/teoria-de-juegos-xvii-la-caza-del-ciervo/
https://eltamiz.com/elcedazo/2011/07/14/teoria-de-juegos-xxvii-juego-del-gallina-i/
TEORÍA DE JUEGOS EN LA ECONOMÍA
En este apartado se van a analizar una serie de situaciones en la economía
que se resuelven con la Teoría de Juegos. 5.1 CAMPAÑA PUBLICITARIA La
publicidad es una variable muy importante en los mercados de oligopolio ya
que transmite información como precio o características a los consumidores
que modifica sus preferencias.
Las empresas suelen tener un presupuesto fijo con respecto a la publicidad
competitiva. Cuando una empresa solo tiene un competidor importante, su
objetivo con la publicidad debe ser conseguir la mayor parte de clientes
quitándoseles a la empresa contraria. Un método simple sobre cómo la
publicidad afecta a los beneficios de la empresa se puede ver en el siguiente
ejemplo:
Existen dos empresas, a las que denominaremos A y B, que tienen unos beneficios de 20 y 10,
respectivamente. Ambas tienen que decidir entre utilizar publicidad o no, con unos costes de 10.
Si la empresa A utiliza publicidad y la empresa B no, aumentará sus beneficios en 15 y los de la
empresa B disminuirán en 1; pero si la empresa B también utiliza publicidad sus beneficios
aumentaran tan solo en 9. Si la empresa B, que es menos conocida que la A, utiliza publicidad y la
empresa A no, tendrá unos beneficios de 20 y los de la empresa A disminuirán en 5, pero si la
empresa A utiliza también publicidad los beneficios se mantendrán en 10.

Solución mediante estrategias prudentes :


De las dos opciones que puede coger la empresa A escoge las que menos beneficio le pueden
reportar que son 15 si ``no utiliza publicidad´´ y 19 si ``utiliza publicidad´´ y de esas dos escoge 19,
y de las dos opciones que puede coger la empresa B escoge 9 si ``no utiliza publicidad´´ y 10 si
``utiliza publicidad´´ y de esas dos se queda con 10. Por lo tanto existe un equilibrio prudente en
``publicidad-publicidad´´.

Solución mediante argumentos de dominación En este caso es indiferente utilizar la EIE o la EID ya
que no hay valores iguales y por lo tanto ambos métodos conducen a la misma solución. Se
observa que en el caso de la empresa A, ``publicidad´´ domina estrictamente a ``no publicidad´´
(25>20 y 19>15) y que en el caso de la empresa 2 ``publicidad´´ también domina estrictamente a
``no publicidad´´ (20>10 y 10>9). Por lo tanto existe un equilibrio dominante ``publicidad-
publicidad´´. - Solución mediante equilibrio de Nash

Empresa A: si la empresa B escoge ``no


publicidad´´, la mejor opción para la empresa A es hacer ``publicidad´´; si la empresa B escoge
hacer ``publicidad´´, la mejor opción para la empresa A es hacer ``publicidad´´. Empresa B: si la
empresa A escoge ``no publicidad´´, la mejor opción para la empresa B es hacer ``publicidad´´; si la
empresa A escoge hacer ``publicidad´´, la mejor opción para la empresa B es hacer ``publicidad´´.
Se observa que con los tres métodos se obtiene la misma solución que es que ambas empresas
deben hacer publicidad, sin embargo este modelo está incompleto, ya que las empresas no solo
deben decidir hacer publicidad o no hacerla, sino que también deben tener en cuenta la diversidad
de métodos que pueden usar para su publicidad y es que estos diversos métodos pueden tener
unos costes mayores o menores, ya que pueden llegar a distintos tipos de personas y también
pueden llegar a una mayor o menor cantidad de público dependiendo de su repercusión. Esto se
ve mejor en el siguiente ejemplo. Existen dos empresas, A y B, con unos beneficios de 20 y 10
unidades, respectivamente. Ambas empresas tienen dos métodos para la publicidad que son
televisión, con costes de 10, y radio, con costes de 5. Si la empresa A escoge B A NO PUBLICIDAD
PUBLICIDAD NO PUBLICIDAD 20,10 15,20´ PUBLICIDAD 25*,9 19*,10´ 21 utilizar publicidad en
televisión y la empresa B no utiliza publicidad o utiliza publicidad en la radio, aumentará sus
beneficios en 15 y disminuirá los beneficios de la empresa B en 2, si la empresa B también utiliza
publicidad en televisión los beneficios solo aumentan 7; si elige utilizar publicidad en la radio y la
empresa B decide no utilizar publicidad o utilizar publicidad en la televisión aumentará sus
beneficios en 7 y disminuirá los beneficios de la empresa B en 1, pero si la empresa B decide usar
también publicidad en la radio los beneficios tan solo aumentaran en 4. En cuanto a la empresa B,
que es menos conocida, si decide utilizar publicidad en televisión y la empresa A no utiliza
publicidad o utiliza publicidad en la radio, aumentará sus beneficios en 20 y los beneficios de A
disminuirán en 5, pero si la empresa A utiliza también publicidad en televisión los beneficios
aumentaran tan solo en 10; si decide utilizar publicidad en la radio y la empresa A no utiliza
publicidad o utiliza publicidad en la televisión los beneficios aumentaran en 10 y los de la empresa
A disminuirán en 3, pero si la empresa A utiliza también publicidad en la radio los beneficios tan
solo aumentarán en 6

Solución mediante estrategias prudentes:

De las tres opciones que puede coger la empresa A escoge las que menos beneficio le pueden
reportar que son 15 si utiliza ``no publicidad´´, 17 si utiliza ``radio´´ y 17 si utiliza ``televisión´´; y de
esas tres se queda con ``radio´´ y con ``televisión´´. La empresa B escoge 8 si utiliza ``no publicidad
´´, 11 si utiliza ``radio´´ y 10 si utiliza ``televisión´´; y de esas tres se queda con utilizar ``radio´´. Por
lo tanto se observa que existen dos equilibrios prudentes en ``radio-radio´´ y ``televisión-radio´´. -
Solución mediante argumentos de dominación o EID La opción ``no publicidad´´ de la empresa A
esta dominada por la opción ``televisión´´ y la opción ``no publicidad´´ de la empresa B esta
también dominada por la opción ``radio´´ por lo tanto las eliminamos:
La opción ``radio´´ de la empresa A esta dominada por la opción ``televisión´´ así que la
eliminamos también y quedaría:

La opción ``radio´´ de la empresa B domina a la opción televisión y por lo tanto quedaría una
solución en ``televisión-radio´´. o EIE La opción ``no publicidad´´ de la empresa A está dominada
estrictamente por la opción ``televisión´´ y la opción ``no publicidad´´ de la empresa B está
dominada estrictamente por la opción ´`radio`´, por lo tanto las eliminamos:

Una vez aquí, ya no hay más estrategias estrictamente dominadas y por lo tanto hay cuatro
soluciones posibles: ``radio-radio´´, ``radio-televisión´´, televisiónradio´´ y ``televisión-televisión´´. -
Solución mediante equilibrio de Nash

Empresa A: si la empresa B escoge ``no publicidad´´, la mejor opción para la empresa A es utilizar
``televisión´´; si la empresa B escoge usar ``radio´´, la mejor opción para la empresa A es también
utilizar ``televisión´´; y si la empresa B escoge usar ``televisión´´, la mejor opción para la empresa A
es utilizar ``radio´´ o ``televisión´´ indiferentemente. Empresa B: si la empresa A escoge ``no
publicidad´´, la mejor opción para la empresa B es usar ``televisión´´; si la empresa A escoge usar ``
radio´´, la mejor B A RADIO TELEVISIÓN RADIO 19,11 17,19 TELEVISION 22,13 17,10 B A NO
PUBLICIDAD RADIO TELEVISION NO PUBLICIDAD 20,10 18,15 15,20´ RADIO 22,9 19,11 17*,19´
TELEVISION 25*,8 22*,13´ 17*,10 24 opción para la empresa B es utilizar ``televisión´´; y si la
empresa A escoge usar ``televisión´´ la mejor opción para la empresa B es utilizar ``radio´´. Por lo
tanto se encuentran dos equilibrios de Nash en ``radio-televisión´´ y en ``televisión-radio´´. En este
segundo ejemplo se ha podido comprobar que, al contrario que en el primero, existen diferentes
soluciones dependiendo del método que se utilice para resolver el problema.

TEORÍA DE JUEGOS EN LA SEGURIDAD PÚBLICA

Teor´ıa de Juegos En su forma mas simple, un juego queda representado por un conjunto de N
jugadores, donde cada jugador n posee, primero, un conjunto de estrategias puras Sn en que cada
estrategia del conjunto queda representada por sn ∈ Sn, y luego una funci´on de utilidad un(s) que
entrega la utilidad del n-´esimo jugador para cada combinaci´on posible de estrategias s = (s1, . . . ,
sN ) ∈ S1 × . . . × SN . 13 Cap´ıtulo 3. Teor´ıa de Juegos y Seguridad El objetivo en teor´ıa de juegos
es dar alg´un indicio de cual ser´a el resultado que se obtendr´ıa cuando jugadores racionales se
vean enfrentados en una situaci´on determinada con las caracter´ısticas anteriormente descritas.
A este resultado se le denomina un equilibrio, y estos tendr´an sus propias particularidades
dependiendo de las especificaciones del juego. En ciertas situaciones los jugadores pueden
preferir aleatorizar sus estrategias de manera que en vez de utilizar una estrategia pura, juegan
cada estrategia sn con una probabilidad σi(sn) en que P sn∈Sn σi(sn) = 1. A este tipo de estrategias
se les denomina Estrategias Mixtas. El espacio de estrategias mixtas para el jugador n se denota
por Σn, y el espacio de los posibles perfiles de estrategias mixtas σ = (σ1, . . . , σN ) se denota por Σ.
En general existen dos grandes formas de clasificar un juego, primero seg´un la relevancia que
tiene la dimensi´on temporal en la forma en que se desarrolla el juego y segundo, la cantidad de
informaci´on que manejan los jugadores al momento de tomar decisiones. Un juego en el que los
jugadores toman decisiones de manera simultanea se denomina en teor´ıa de juegos un juego est
´atico. Por el contrario, cuando al menos uno de los jugadores puede observar las decisiones
tomadas por el resto, y considerar esta informaci´on antes de escoger su propia estrategia, se est
´a en presencia de un juego din´amico. Por otra parte, cuando los jugadores poseen total
conocimiento de las funciones de utilidad tanto propias como las del resto de los jugadores, se est
´a en presencia de un juego de informaci´on completa, mientras que cuando no se tiene certeza
absoluta de los pagos que recibir´an el resto de los jugadores o de la forma que tiene la funci´on
de utilidad de los contrincantes, se est´a en presencia de un juego de informaci´on incompleta.

http://repositorio.uchile.cl/bitstream/handle/2250/147451/Modelos-de-teor%C3%ADa-de-juegos-
para-el-control-de-la-delincuencia-en-la-via-publica.pdf?sequence=1&isAllowed=y

TEORIA DE JUEGOS APLICADA EN SEGURIDAD


Desde 2017, en Chile se ha estado desarrollando el trabajo con la Teoría de juegos para planificar
de mejor forma los sistemas de seguridad, 
asi como ayudar en el trabajo de los policias de dicho pais, las relaciones entre policías y
criminales, las decisiones internacionales en función de esto.
En entrevista al Dr. Fernando Ordoñez, investigador del instituto de sistemas complejos de
ingenieria (ISCI), se habla de un algoritmo que busca incrementar la probabilidad de captura, 
como funciona esta tecnología y como esta se está aplicando.
para esto el Doctor menciona la conocida película de mente brillante, de cómo se representan ahí
los modelos matemáticos para ejemplificar mejor el como interactúan las personas que no actúan
de forma coordinada,
como cuando cada uno espera el mejor resultado para sí mismo.
Se menciona que llevan 12 años trabajando en modelos de teoría de juego para representar la
relación de la policía o mecanismos de seguridad con criminales y terroristas. 
Menciona también que esto se ocupa ya en Estados Unidos para idear el cómo patrullar los
aeropuertos, donde poner a los agentes federales en los aviones internacionales, y para la guardia
costera, para elegir como patrullar los puertos.
habla en ejemplos de malls, el cómo elegir los puntos donde rotara el personal de seguridad, la
necesidad de hacer el cambio continuo de puntos, para eliminar el factor previsible; haciéndole
difícil la tarea de delinquir al posible criminal 
y con ello esperando abrirle otras opciones de vida que puedan parecerle más atractivas, como
estudiar o trabajar.
En síntesis hablamos de un encarecimiento de opciones del adversario y un aumento de
posibilidad de captura.
La idea surgió de una charla con colegas en Estados Unidos, después de los atentados de las torres
gemelas, tocando los temas de terrorismo. Se volvió motivo de investigación al concluir que se
necesitaba de un método que se tienen que ir adaptando; 
y que en hoy día cuenta con financiamiento del estado para su investigación.
El crimen o delito sucede todos los días en muy diversas formas, asi que hay que establecer que el
adversario tiene muchas facetas; están los narcotraficantes, el robo con violencia, los terroristas,
etc.
Cada uno tiene distinta función/objetivo y eso se traduce en el cómo se configura el juego, los
datos suponen el que tan atractiva es un área para patrullar o no, asi que se conforma por las
denuncias, información situacional, acerca de donde están los cajeros,
donde están las joyerías, los colegios, y con esta información se determinan los objetivos, se busca
desaparecer costos, y darle una seguridad a la policía de concebir el ser capaz de proteger algo.
Esto se puede aterrizar en sistemas de geo información o geo referencia que se puedan consultar
para tomar medidas de decisión; esto es construir modelos de decisión que lleven ya los patrones
y constituyan el aporte a la seguridad ciudadana, que muestre un beneficio y de una mayor
seguridad.
La complicación se hallaba en convencer bien a la autoridad de que esto es la forma de hacer bien
el patrullaje, balanceando los beneficios.
La aplicación en Estados Unidos, desde el 2007, se ocupa en el aeropuerto Internacional de los
Ángeles, especialmente en los vuelos a Europa, en el patrullaje por delito y en las guardias
costeras. Se demuestra que hay beneficio y entonces se implementa. Todas están
implementaciones lograron reconocimientos internacional;
al desarrollar estas teorías y lograr que fueran usados día a día.
La teoría de juegos es un procedimiento metodológico relativo a la toma de decisiones que
un individuo debe adoptar para llegar a un desenlace esperado, y para que tenga éxito, tiene
que tener en cuenta las decisiones tomadas por el resto de los agentes que intervienen en la
situación. La teoría de juegos se ha utilizado en la Economía, el Derecho, la Sociología, la
Ciencia Política, la Psicología, la Educación, la Antropología, etc.

En teoría de juegos no tenemos que preguntarnos qué vamos a hacer, tenemos que
preguntarnos qué vamos a hacer teniendo en cuenta lo que pensamos que harán los demás, y
a su vez, ellos actuarán pensando según crean cuales van a ser nuestras actuaciones.

LA TEORÍA DE JUEGOS EN LAS CIENCIAS SOCIALES

El primer fenómeno que hemos analizado, los efectos de incrementar la penalización por infringir
la ley, nos ha resultado útil para ilustrar por qué es conveniente usar el enfoque de teoría de
juegos. Una ventaja de este enfoque consiste en que incorpora explícitamente el hecho de que
diversos agentes involucrados en un problema no deben ser vistos como entes pasivos, sino como
jugadores que reaccionan racionalmente a cambios en su entorno de acuerdo a sus preferencias.
El segundo objeto de análisis ha sido la aprobación de reformas que eliminan la posibilidad de que
se usen los recursos públicos con fines partidistas. Este fenómeno ha sido ubicado en el contexto
de aquellos países de América Latina que han tenido largos periodos de regímenes democráticos
competidos. El tercer fenómeno ha sido el de los recursos de uso común. Hemos establecido las
características que los definen, así como los problemas que implican tanto su privatización como
su expropiación por parte del gobierno —soluciones tradicionales al riesgo de que sufran un uso
excesivo—. Posteriormente, hemos abordado el análisis, usando el enfoque de teoría de juegos,
del manejo de los recursos por parte de un grupo delimitado de usuarios locales. Hemos señalado
que la teoría de juegos demuestra que cuando sólo un mismo grupo de personas tiene acceso a un
recurso de uso común durante un tiempo indefinido, es posible proveer los incentivos adecuados
para que este grupo lo maneje exitosamente. También demuestra que un tamaño reducido del
grupo de individuos con acceso al recurso y una detección rápida de una posible sobreexplotación
son dos variables que facilitan este éxito. Hemos hecho referencia a algunos experimentos que
confirman la relevancia de las predicciones derivadas de los modelos de teoría de juegos, pero que
también muestran la existencia de factores adicionales que requieren la incorporación de otros
enfoques analíticos .

Es en un contexto característico de muchos fenómenos sociales: situaciones en que el resultado de


las acciones de cada tomador de decisiones depende crucialmente de las acciones de otros
tomadores de decisiones. En un juego, existe un conjunto de “jugadores” involucrados en una
situación tal que el resultado que obtiene cada uno de ellos depende no sólo de sus propias
decisiones, sino de las decisiones de todos los demás. Puesto que las decisiones de los otros
jugadores, actuando conforme a sus propios deseos, influyen en el resultado de las acciones de un
jugador, éste debe considerar los deseos de aquéllos al tomar sus decisiones. Estas interacciones
estratégicas son importantes en muchos problemas sociales. En este artículo presentamos varios
ejemplos de cómo su consideración puede enriquecer el análisis. El resto de este artículo está
estructurado de la siguiente manera. Dedicamos una primera sección a un ejemplo que ilustra de
una forma muy simple, en el contexto del estudio de diversas modalidades de infracción de la ley
cómo se modifican las predicciones de ciertas medidas cuando se adopta el enfoque de
interacción estratégica característico de la teoría de juegos. En la sección siguiente presentamos
un modelo sobre las reformas que limitan el uso de los recursos públicos con fines partidistas y
constatamos cómo las predicciones del modelo son consistentes con la experiencia
latinoamericana. En la penúltima sección abordamos algunos aspectos del llamado problema de
los bienes de uso común

http://www.redalyc.org/pdf/598/59806604.pdf
T

TEORÍA DE JUEGOS PARA LA CIBERSEGURIDAD


lunes, 27 de noviembre de 2017   —   Escrito por Editor

Un grupo de investigadores ha sentado las bases de un método para mejorar la seguridad


cibernética en sistemas a gran escala, como la red eléctrica y las redes autónomas de defensa
militar, mediante el aprovechamiento de la teoría de juegos y la creación de nuevos algoritmos
inteligentes.

El equilibrio de Nash

Esta investigación, liderada por la Universidad de Purdue lidera y financiada por la National
Science Foundation y Sandia National Laboratories, está basada en el “Equilibrio de Nash”,
desarrollado por el Premio Nobel de Economía John Nash.

El Equilibrio de Nash es un concepto perteneciente a la “Teoría de Juegos”, una rama de la


Economía que estudia modelos matemáticos de conflicto y cooperación entre individuos
supuestamente racionales.

En el equilibrio de Nash la estrategia que elige cada uno de los participantes de un conflicto o
juego es óptima, dada la estrategia que han elegido los demás.

Teoría prospectiva

El trabajo también aplica la «Teoría prospectiva», que describe cómo las personas toman
decisiones cuando hay incertidumbre y riesgo, decisiones que a menudo son solo en parte
racionales.

La investigación conducirá a una comprensión más completa de las vulnerabilidades que surgen en
los sistemas interconectados a gran escala y nos guiará al diseño de sistemas más seguros, con los
correspondientes beneficios sociales, explica Shreyas Sundaram, profesor asistente en la Escuela
de Ingeniería Eléctrica y Computación de Purdue.

Sundaram lidera la parte financiada por NSF del proyecto, trabajando con los investigadores co-
principales Saurabh Bagchi, profesor en la Escuela de Ingeniería Eléctrica e Informática y
Departamento de Informática, y Timothy Cason, profesor de economía en la Escuela de
Administración Krannert, con el objetivo de abordar, con ambos proyectos, la complejidad de
proteger los sistemas actuales a gran escala.

El estudio global proporcionará nuevos conocimientos sobre los tipos de decisiones que toman los
humanos cuando enfrentan amenazas de seguridad, a través de un enfoque integral que abarca la
teoría y los experimentos.
Gestión del riesgo de seguridad

El investigador de Sandia Abraham A. Clements ha estado trabajando con el equipo mientras


cursaba un doctorado en Purdue. Su investigación se detalla en un capítulo incluido en una nueva
monografía titulada «Teoría de juegos para la gestión del riesgo de seguridad: de la teoría a la
práctica», que se publicará a principios de 2018 como parte de la serie Springer / Birkhauser sobre
«Teoría del juego estática y dinámica: fundamentos y Aplicaciones. El capítulo, “Un marco teórico
de juegos para la defensa descentralizada de activos interdependientes en redes de gran escala»,
ha sido escrito por el estudiante de doctorado de Purdue Ashish R. Hota, con Clements, Bagchi y
Sundaram.

Bagchi, describe que cualquier sistema a gran escala, como una red eléctrica, un sistema de
control industrial o una agencia de informes crediticios del consumidor, contiene muchas partes,
tanto físicas como cibernéticas, que puede ser necesario asegurar. Los responsables de las
decisiones humanas deben tomar decisiones pragmáticas sobre qué proteger y en qué medida.

Para complicar las cosas, muchos sistemas a gran escala involucran a «múltiples propietarios» y
compañías subsidiarias que son interdependientes y pueden ser vulnerables a los ataques, lo que
representa vínculos débiles en la red.

Sin embargo, las restricciones presupuestarias ponen límites a las medidas de seguridad. El
proyecto abordará el complejo funcionamiento de la toma de decisiones humanas y el hecho de
que varias partes interesadas podrían estar actuando en su propio interés, dijo Bagchi. Se podrían
usar modelos cooperativos donde todos decidan hacer lo mejor para el sistema, pero eso puede
no ser realista en la práctica, dijo. La gente puede no querer revelar sus propios secretos
comerciales.

Los investigadores han demostrado cómo formular un «problema de optimización» que hace
posible calcular de manera eficiente cuánto decidirá invertir una determinada parte interesada.

Defensa de objetivo móvil

Según las consideraciones de Bagchi, la premisa básica es que la forma en que se configuran la
mayoría de los sistemas es que son un blanco fácil. El atacante puede intentar una y otra vez y solo
tener éxito una, mientras que el defensor tiene que tener éxito cada vez, cada ataque, al cien por
ciento. La defensa del objetivo móvil intenta cambiar esta dinámica y dice que el sistema que
quiero proteger no es un blanco fácil. Se va a reconfigurar a sí mismo; va a cambiar algún aspecto
de sí mismo de vez en cuando, de modo que si el atacante sigue intentando lo mismo, sus
posibilidades de éxito no van a aumentar porque el objetivo que está siendo atacado cambia.

Los primeros resultados de investigación en este aspecto del proyecto se presentaron durante la
conferencia de seguridad y privacidad de IEEE en mayo de 2017, en un documento en coautoría de
Bagchi y Clements, junto con Matthias Payer, profesor asistente de informática de Purdue.

El proyecto incluirá experimentos de economía del comportamiento en seres humanos para


evaluar las predicciones teóricas y potencialmente generar nuevos modelos de toma de
decisiones.

Alex Roesler, subdirector del Centro integrado de sistemas militares de Sandia National Labs,
explica que no solo serán personas las encargadas de la toma de decisiones, sino también robots y
vehículos aéreos no tripulados y estos sistemas autónomos también toman decisiones
independientes.
Entonces, ¿los algoritmos harán que estos sistemas multi-UAV sean más seguros?

Las futuras tecnologías militares autónomas, como los UAV y los vehículos terrestres, serán
capaces de funcionar como inteligencia, vigilancia y reconocimiento persistentes, o PISR.

A su vez, Sundaram describe que la idea es que se implemente una flota de UAV u otros sistemas
móviles, estén monitoreando un área permanentemente. Ese es un aspecto fundamental:
recopilar inteligencia, vigilar, hacer reconocimiento. Cuando las comunicaciones con las estaciones
base se vean comprometidas, los vehículos podrán operar de manera «autoorganizada”.

Si algunos de los vehículos aéreos no tripulados se dañan, los demás deben poder seguir
funcionando juntos en una red que necesita ser lo suficientemente inteligente como para evitar
estos nodos defectuosos o mal funcionamiento.

https://www.thenewnow.es/negocio/teoria-juegos-la-ciberseguridad/

También podría gustarte