Está en la página 1de 20

Capítulo 12: Juegos bayesianos

En todos los ejemplos y herramientas apropiadas para el análisis que hemos encontrado hasta
ahora, hemos hecho un supuesto importante: que el juego jugado posee common knowledge. En
particular, hemos asumido que los jugadores son conscientes de quién está jugando, de cuáles son
las posibles acciones de cada jugador y de cómo se traducen los resultados en pagos. Además,
hemos asumido que este conocimiento del juego es en sí mismo common knowledge. Estos
supuestos nos permitieron sentar las bases metodológicas para conceptos de solución como la
eliminación iterada de estrategias dominadas, la racionalización y los más importantes: equilibrio
de Nash y el equilibrio perfecto en subjuegos.

Se necesita poco esfuerzo para convencer a alguien de que estas situaciones idealizadas rara vez
son encontradas en la realidad. Por ejemplo, considere uno de nuestros primeros ejemplos, el
juego de duopolio de mercado. Hemos analizado los modelos de competencia duopolística de
Cournot y Bertrand, y para cada uno tenemos un resultado claro y preciso, fácil de entender. Una
suposición del modelo fue que los beneficios de las empresas, como sus espacios de acción, son
de conocimiento común. Sin embargo, ¿es razonable suponer que las tecnologías de producción
son de conocimiento común? Y si lo son, ¿deberíamos creer que la productividad de los
trabajadores en cada empresa es conocida por la otra empresa? Más generalmente, ¿es razonable
suponer que la función de costo de cada empresa es precisamente conocida por su adversario?

Quizás sea más convincente creer que las empresas tienen una idea razonablemente buena sobre
los costos de sus oponentes, pero no saben exactamente lo que son. Sin embargo, la caja de
herramientas para el análisis que hemos desarrollado hasta ahora no es adecuada para abordar
tales situaciones. ¿Cómo pensamos en situaciones en las que los jugadores tienen alguna idea
sobre las características de sus oponentes, pero no saben con seguridad cuáles son estas
características? En algún nivel esto no es tan diferente de la situación en un juego de movimiento
simultáneo en el que el jugador no sabe qué acciones están tomando sus oponentes, sino que
conoce el conjunto de acciones que puede ser. Como hemos visto anteriormente, un jugador debe
formular una conjetura acerca del comportamiento de sus oponentes para elegir su mejor
respuesta, e identificamos esta idea como la creencia del jugador sobre las acciones que elegirán
sus oponentes. También requerimos que estas creencias, y las mejores respuestas apropiadas, sean
mutuamente consistentes y correctas para que podamos usar el concepto de equilibrio como
método de análisis.

A mediados de la década de 1960, John Harsanyi se dio cuenta de la similitud entre las creencias
sobre acciones de un jugador y las creencias sobre sus otras características, tales como costos y
preferencias. Harsanyi procedió a desarrollar una forma elegante y extremadamente operativa
para capturar la idea que las creencias sobre las características de otros jugadores, sus tipos, se
pueden integrar de forma natural en el marco de la teoría de juegos que ya tenemos desarrollado.
Este avance hizo que Harsanyi fuera el tercer Premio Nobel en compartir el prestigioso premio
con John Nash y Reinhard Selten en 1994.

Llamamos a los juegos que incorporan la posibilidad de que los jugadores puedan ser de diferentes
tipos (un concepto que pronto estará bien definido) juegos de información incompleta. Al igual
que con los juegos de información completa, desarrollaremos una teoría del comportamiento de
equilibrio que requiere que los jugadores tengan creencias sobre las características de sus
oponentes y sus acciones, y además requiere que estas creencias sean coherentes o correctas. No
es de extrañar que esto requerirá suposiciones muy fuertes sobre el conocimiento de los jugadores:
asumimos que el conocimiento común reina sobre las posibles características de jugadores y sobre
la posibilidad de que cada tipo de jugador sea parte del juego.

Para desarrollar más este concepto, volvamos a la estructura de un juego en forma estratégica en
donde hay un conjunto de jugadores N= {1, 2, …, n} y para cada jugador i que pertenece a N, un
conjunto de acciones Ai. Se continúa asumiendo que el conjunto de jugadores y las posibles
acciones que posee cada jugador son conocimiento común. El componente que falta es el conjunto
de funciones de pago o preferencias que los jugadores poseen sobre los resultados. Para capturar
la idea de que las características de un jugador pueden ser desconocidas para otros jugadores,
introducimos incertidumbre sobre las preferencias de los jugadores. Es decir, en lugar de tener
una única función de pago para cada jugador que transforma perfiles de acciones en pagos los
juegos de información imperfecta permiten a los jugadores tener una de las muchas funciones de
pago posibles. Asociamos cada una de las posibles funciones de pago de un jugador con un tipo,
lo que captura la idea de que las preferencias de un jugador o su tipo, pueden no ser de
conocimiento común.

Para poner en práctica esta idea y dotar a los jugadores con creencias bien definidas sobre los
tipos de otros jugadores, Harsanyi (1967–68) sugirió el siguiente marco: Imagina que antes de
que se juegue el juego, la naturaleza elige las preferencias o el tipo de cada jugador de su posible
conjunto de tipos. Otra forma de pensar acerca de este enfoque es que la Naturaleza está eligiendo
un juego de entre un gran conjunto de juegos, en que cada juego tiene los mismos jugadores con
los mismos conjuntos de acción, pero con diferentes funciones de pago. Si la Naturaleza elige
aleatoriamente entre muchos juegos posibles, entonces debe haber una distribución de
probabilidad bien definida entre los diferentes juegos. Es esta observación, junto con el requisito
de que todo sobre un juego debe ser de conocimiento común, que hará que esta configuración sea
susceptible de análisis de equilibrio.
En esta etapa es útil un ejemplo. Considera el siguiente simple "juego de entrada" representado
en la Figura 12.1, en la cual una empresa entrante, jugador 1, decide si debe o no entrar en un
mercado. La empresa titular en ese mercado, el jugador 2, decide cómo responder a una decisión
de entrada del jugador 1 peleando o acomodando la entrada. Los pagos dados en la Figura 12.1
muestran que, si el jugador 1 entra, la mejor respuesta del jugador 2 es acomodar, lo que a su vez
implica que el único equilibrio perfecto en subjuegos es para el jugador 1 entrar y para el jugador
2 acomodar la entrada. (Convéncete a ti mismo que hay otro equilibrio de Nash de estrategias
puras que no es perfecto en subjuegos.)

Ahora imagine que hay un tipo de jugador 1 con pagos como se muestra en la Figura 12.1, y hay
dos tipos de jugadores 2. El primer tipo, llamado "racional", tiene recompensas como se ha
mostrado en la Figura 12.1. El segundo tipo llamado “loco” disfruta de pelear y el pago que recibe
por (Entrar, Pelear) es 2 en vez de -1.

La estructura del juego está fijada por el conjunto de jugadores N y los espacios de acción Ai para
cada jugador i ∈ N, sin embargo, la naturaleza elige qué tipo de jugador 2 está jugando el juego
con el jugador 1. Para completar la estructura de este juego debemos indicar la probabilidad de
que cada tipo sea seleccionado por Naturaleza. Sea p la probabilidad de que la Naturaleza elija el
tipo racional, ahora podemos representar la forma extensiva de este juego de entrada de
información incompleta en la Figura 12.2.
Antes de poder analizar este juego, debemos abordar el problema de qué saben los jugadores
cuándo juegan el juego. Recordemos que nuestros ejemplos motivadores fueron descripciones de
situaciones en las que los jugadores no estaban seguros de las preferencias de otros jugadores.
Para discutir el comportamiento óptimo, debemos permitir que los jugadores maximicen sus
pagos dadas sus creencias sobre la situación en la que se encuentran, tal como lo hicimos con el
análisis de decisiones de una sola persona y con juegos de información completa. Así debemos
asumir que los jugadores conocen sus propias preferencias, lo que a su vez nos permitirá analizar
la mejor respuesta dadas sus suposiciones sobre el comportamiento de sus oponentes. Este es el
motivo del conjunto de información establecido en la Figura 12.2, que muestra que el jugador 1
no está seguro de las preferencias del jugador 2, pero el jugador 2 sabe cuáles son sus preferencias
y cuando necesita tomar una decisión.

Todavía queda por resolver un problema final. Si los jugadores conocen sus propias preferencias,
pero no conocen las preferencias o los tipos de sus oponentes, entonces, ¿qué deben saber los
jugadores con el fin de que tengan una mejor respuesta bien definida y esto, a su vez, nos permita
realizar análisis de equilibrio? El paso natural, como se dio cuenta Harsanyi, es requerir que los
jugadores formen creencias correctas sobre las preferencias y tipos de sus oponentes. Esto, a su
vez, hace posible que los jugadores formulen conjeturas racionales sobre la forma en que sus
oponentes jugarán el juego.

Por esta razón, asumimos que, a pesar de que cada jugador no necesariamente conoce las
preferencias sus oponentes, él sabe la manera precisa en que la Naturaleza elige estas preferencias.
Es decir, cada jugador conoce la distribución de probabilidad sobre los tipos, y esto en sí mismo
es de conocimiento común entre los jugadores del juego. En el juego de la entrada de la figura
12.2 se proporciona especificando que p es de conocimiento común, y, por lo tanto, el jugador 1
sabe que la probabilidad de que esté en el nodo izquierdo en su conjunto de información es p.
Esto se suele llamar el supuesto previo común, y significa que todos los jugadores están de
acuerdo en cómo funciona el mundo, según lo descrito por las probabilidades de acuerdo con las
que Naturaleza elige los diferentes tipos de jugadores. Esto es, por supuesto, una suposición
fuerte, pero sin ella ni siquiera podremos discutir el comportamiento de equilibrio.

Ahora que hemos completado la representación extensa de este juego, puede transformarse a su
forma normal. Note que en la forma normal el jugador 2 debe tener cuatro estrategias puras: en
cada uno de sus conjuntos de información tiene dos acciones para elegir.

Definamos una estrategia del jugador 2 como xy ∈ {AA, AF, FA, FF}, donde x describe qué hace
el jugador 2 racional e y lo que un jugador 2 loco hace. Esta es una vista previa de lo que veremos
pronto de manera más general: cuando introducimos información incompleta, una estrategia de
un jugador ahora es una receta que le dice a cada tipo de jugador qué debe hacer si este es
el tipo que la Naturaleza eligió para el juego. El conjunto de estrategias para el jugador 1 es
simplemente {E, O}.

Como hemos visto anteriormente en la Sección 7.3, cada par de estrategias puras resultará en una
camino único de juego que comienza con la elección de la Naturaleza y luego sigue con las
acciones de ambos jugadores. En este ejemplo si decimos que el jugador 2 juega AF (A si es
racional y F si es loco) y si el jugador 1 juega E, entonces con probabilidad p el resultado rendirá
el pago (1,1) y con probabilidad (1-p) el pago será (-1,2). Así, en expectativas el par de pagos del
par de estrategias (AF,E) será:

v1= p × 1+ (1− p) × (−1) = 2p − 1

v2 = p × 1+ (1− p) × 2 = 2 − p.

Así podemos computar el pago esperado de los dos jugadores para cada par de estrategias, lo que
resulta en la siguiente matriz:

Ahora que tenemos la matriz de forma normal de este juego, podemos ser agnósticos acerca de
sus orígenes y la forma en que lo construimos, y en lugar de eso, lo tratamos como lo haríamos
con cualquier otro juego de forma normal, utilizando las herramientas estándar para encontrar los
posibles equilibrios de Nash. Es decir, podemos tratar las entradas de pago en la matriz como si
provinieran de alguna alternativa sin tipos o Naturaleza, en el que el jugador 1 tiene dos estrategias
puras y un jugador 2 tiene cuatro. Considerando la mejor respuesta de cada jugador, este juego
tiene tres Equilibrios de Nash en estrategias puras: (O, FA), (O, FF) y (E, AF). Además, de estos
tres solamente (E, AF) es un equilibrio perfecto en subjuegos.

Aunque nuestro análisis de este juego parece completo (ignorando estrategias mixtas), todavía
puede ser confuso apreciar completamente los pasos que tomamos desde el comienzo,
describiendo un mundo en el que los jugadores no estaban seguros acerca de ciertos elementos
del juego. Primero, modelamos esta situación como una en la que los jugadores tienen
incertidumbre sobre las preferencias de otros jugadores. En segundo lugar, asumimos que los
jugadores comparten las mismas creencias sobre esta incertidumbre, lo que nos permitió crear un
nuevo juego para el que aplicaba el análisis de equilibrio estándar. En particular el juego matricial
tiene dos jugadores con pagos esperados derivados de la distribución de probabilidad de los
diferentes tipos de cada jugador (en este caso solo el jugador 2 tenía tipos). Esta era la ingeniosa
solución de John Harsanyi: no podemos realizar un análisis de equilibrio a menos que
supongamos que cada jugador conoce la distribución de los tipos de sus oponentes (la común
suposición previa). Luego, con este requisito, una vez que un jugador asume algunos
comportamientos de los diferentes tipos de sus oponentes, entonces él puede calcular el pago
esperado de sus propias acciones. De esta manera Harsanyi cambió el complejo y desafiante
concepto de información incompleta en un conocido juego de información imperfecta, en la que
la Naturaleza elige los tipos de jugadores y luego podemos utilizar nuestras herramientas estándar
de análisis.

Queda un punto potencialmente confuso que vale la pena aclarar antes de ir a las definiciones
formales más generales. Podemos ver cómo cada tipo de jugador i puede calcular sus pagos
esperados dada una creencia sobre las acciones de cada tipo de sus opositores. Pero al escribir un
solo juego de información imperfecta como lo hicimos, estamos promediando los pagos de todos
los tipos para cada jugador usando la probabilidad de cada tipo como el peso. Es decir, hemos
producido un "meta-jugador" (por ejemplo, el jugador 2 en el ejemplo) a quién le importa este
pago promedio a través de sus diferentes tipos en lugar de mirando el juego un tipo a la vez.

Sin embargo, hay un punto importante que vale la pena enfatizar más. La solución de Harsanyi al
problema de la información incompleta no es algo que obtenemos gratis. Debemos dar un gran
salto de fe al asumir que la distribución de tipos (En el ejemplo dado por p) es de conocimiento
común. Antes de introducir información incompleta, el concepto de equilibrio de Nash requería
que los jugadores formaran conjeturas, o creencias, que en equilibrio tienen que coincidir con las
elecciones de sus oponentes. Aquí nosotros debemos pedir más: todos los jugadores están de
acuerdo en la forma en que los tipos de jugadores difieren unos de otros, y en la forma en que la
Naturaleza elige entre estos perfiles de tipos. Por lo tanto, cuando aplicamos nuestros modelos y
herramientas a situaciones realistas, debemos tener en cuenta las fuertes suposiciones
informativas que debemos hacer, que deben guiarnos a confiar en nuestras predicciones o
prescripciones. Esto es donde el arte se encuentra con la ciencia: el modelador debe ser
concienzudo de cuándo hace sentido aplicar modelos con suposiciones tan fuertes, y cuándo este
salto requiere también mucha fe.
1. Representación estratégica de los juegos bayesianos:
Jugadores, Acciones, Información y Preferencias:

Un juego normal de información completa está representado por

Donde N= {1, 2, …, n} es el conjunto de jugadores, Si es el espacio de estrategias del jugador i y


vi: S R es la función de pago del jugador i, en donde S= S1x S2x …xSn. Además, en un juego
simultáneo el conjunto de estrategias Si de cada jugador está asociado con su conjunto de acciones
Ai.

Para modelar situaciones en las que los jugadores conocen sus propios pagos de los resultados.
(diferentes perfiles de acciones), pero no conocen los pagos de los otros jugadores, introducimos
el concepto de información incompleta, que se compone de tres nuevos componentes. Primero,
las preferencias de un jugador están asociadas con su tipo. Si un jugador puede tienen varias
preferencias diferentes sobre los resultados, cada uno de ellos estará asociado con un tipo
diferente. Más generalmente la información que el jugador tiene sobre sus propios pagos, o
información que pueda tener sobre otros atributos relevantes del juego, es también parte de lo que
define el tipo de jugador. En segundo lugar, se describe la incertidumbre sobre los tipos a través
de la Naturaleza escogiendo tipos para los diferentes jugadores. Así introducimos “type spaces”
para cada jugador, que representan los sets de los que la Naturaleza elige los tipos de los
jugadores. Por último, pero no menos importante, existe un conocimiento común sobre la forma
en que la naturaleza elige entre perfiles de tipos de jugadores. Esto está representado por un
common prior, que es la distribución de probabilidad sobre los tipos que es de conocimiento
común entre los jugadores. Como cada agente aprende su propio tipo, puede usar el common prior
para formar creencias sobre los tipos de los otros agentes. Formalmente, se ofrece la siguiente
definición:

La representación en forma normal de un juego bayesiano estático de información incompleta


de n jugadores es:

Como lo indica la definición, además de los tres componentes básicos de los jugadores, las
acciones, y preferencias, la adición de tipos, preferencias dependientes del tipo y creencias sobre
los tipos de otros jugadores capturan las ideas ilustradas anteriormente. Note que, en la definición,
asumimos que el espacio de tipo de cada jugador es finito, de modo que hay un total de tipos ki
para cada jugador. No es difícil expandir la definición para incluir un type spaces infinito.
Es conveniente pensar un juego bayesiano estático como uno que sigue los siguientes pasos:
1. La Naturaleza elige un perfil de tipos (θ1, θ2, . . . , θn).
2. Cada jugador i aprende su propio tipo θi, el cual es información privada y luego usa su
common prior φi para formar creencias posteriores sobre los otros tipos de jugadores.
3. Los jugadores simultáneamente (debido a que es un juego estático) eligen acciones ai que
pertenecen a Ai.
4. Dadas las elecciones de los jugadores a= (a1, a2, …, an), los pagos vi (a, θi) se completan
para cada jugador i.
En la definición anterior, el pago de un jugador vi (a; θi) depende de las acciones de todos los
jugadores y solo del tipo de i, pero no depende de los tipos de otros jugadores θ − i. Este supuesto
particular se conoce como el caso de los valores privados porque el pago de cada tipo depende
solo de su información privada. Este caso no es lo suficientemente rico para capturar todos los
ejemplos interesantes que analizaremos, y por este motivo presentaremos más adelante el caso de
valores comunes, en el que vi (a1, a2, ..., an; θ1, θ2, ..., θn) es posible. Para mayor claridad
expositiva, primero exploramos la configuración de valores privados.
Observación. Adoptamos un enfoque muy simple al asumir efectivamente que las creencias de
un jugador son sobre las preferencias de otros jugadores. Por supuesto que la vida es más compleja
que eso. Para utilizar rigurosamente las herramientas de análisis estratégico, las creencias de los
jugadores i también necesitan estar bien definidas sobre las creencias de sus oponentes sobre las
preferencias del jugador i, sobre las creencias de los otros jugadores sobre las creencias del
jugador i sobre las creencias de los otros jugadores sobre sus preferencias, y así sucesivamente
hasta el infinito. Como puedes imaginar, todo esto se vuelve confuso muy rápido. La solución
célebre de Harsanyi a este problema siguió de su argumento de que, en lugar de anotar toda la
jerarquía de creencias, es posible considerar un modelo en el que el "tipo" de cada jugador
describa sus preferencias y todas sus creencias. Años más tarde, Mertens y Zamir (1985) y
Brandenburger y Dekel (1993) hicieron que la idea de Harsanyi fuera precisa y demostraron que,
de hecho, es posible definir un espacio de tipo rico que permita todas las jerarquías posibles de
creencias. (Estos dos artículos son muy técnicos y matemáticamente sofisticados.)

Deriving Posteriors from a Common Prior: A Player’s Beliefs


En la definición de un juego bayesiano, introdujimos el concepto de un common prior, es decir,
todos los jugadores comparten las mismas creencias acerca de la distribución sobre las elecciones
hechas por la Naturaleza. En esta sección exploramos el significado de cada jugador i usando el
common prior para derivar una creencia posterior sobre la distribución de los otros tipos de
jugadores. Este concepto es una aplicación simple de probabilidades condicionales.
Las probabilidades condicionales siguen una regla matemática que deriva la forma en que un
jugador o un tomador de decisiones debe cambiar una creencia previa o prior (inicial) a la luz de
nueva evidencia, resultando en una creencia posterior (actualizada). En nuestra aplicación la idea
puede ser descrito de la siguiente manera: primero, antes de que la Naturaleza elija el tipo real de
cada jugador, imagina que cada jugador aún no sabe cuál será su tipo; pero él sabe la distribución
de probabilidad que la Naturaleza utiliza para elegir los tipos para todos los jugadores. Más tarde,
después de que la Naturaleza haya elegido un tipo para cada jugador, todos ellos
independientemente y en privado aprenden sus tipos. Esta nueva pieza de información para cada
jugador, su tipo, puede proporcionar alguna nueva evidencia sobre cómo los tipos de otros
jugadores pueden haber sido elegidos. Es en este sentido que un jugador puede derivar nuevas
creencias sobre otros jugadores una vez que aprende su tipo.
Como ejemplo concreto, imagine que hay dos de los muchos estados posibles de Naturaleza o
eventos (las posibles elecciones que la naturaleza puede hacer). Una es que estará soleado (S) y
la otra es que las olas serán altas (H). Estos dos estados pueden ocurrir exclusivamente o en
conjunto de acuerdo con alguna distribución previa φ (.). Es decir, φ (.) describe las probabilidades
asignadas a cualquier combinación de estos estados que son verdaderas. Entonces, φ (S) es la
probabilidad previa de que esté soleado, φ (H) es la probabilidad previa de que las olas sean altas
y φ (S ∩ H) será la probabilidad previa de que esté soleado y que las olas sean altas. Imaginemos
que te despiertas y ves que está soleado; sin verlos, ¿qué puedes inferir sobre la probabilidad de
que las olas sean altas? No es necesariamente cierto que sea φ (H), porque acabas de aprender que
está soleado y esta nueva información puede ser relevante. Aquí es donde el condicional. se aplica
la fórmula de probabilidad, porque calcula con precisión la probabilidad del estado H dado que
usted sabe que el estado S pasó. Formalmente tenemos:
Definición. Dado que el evento S es cierto, la probabilidad condicional de que H sea cierto está
dada por:

La intuición es simple. Si sabemos que S es verdad entonces hay dos posibilidades: o bien H es
verdadera o no lo es. Por lo tanto, podemos pensar en dos posibles eventos "combinados". El
primer evento es que tanto S como H son verdaderos, lo cual, dado la creencia anterior ocurre con
probabilidad φ (S ∩ H). El segundo evento es que S es verdadera pero H es falsa, lo que sucede
con probabilidad φ (S ∩ [no H]). Pensando en S y H juntos, podemos preguntar ¿Cuál es la
probabilidad de que S sea verdadera? Debe ser la suma φ (S) = φ (S ∩H) + φ (S ∩ [no H]) porque
S puede ser cierto ya sea que H sea verdadera o que [no H] sea verdadera, y claramente H y [no
H] son eventos mutuamente exclusivos. Como consecuencia, si sé que S es verdadera y, luego,
depende de este conocimiento, la probabilidad de que H sea verdadera es la probabilidad relativa
de que tanto S como H sean verdaderas, entre todos los estados en los que S puede ser cierto.
Usando nuestro ejemplo particular:

Para poner esto en el contexto de un juego bayesiano, considere el siguiente ejemplo. Imagina
que hay dos jugadores, 1 y 2, cada uno con dos tipos posibles, θ1∈ {a, b} y θ2 ∈ {c, d}. La
naturaleza elige estos tipos de acuerdo con un prior sobre las cuatro posibles combinaciones de
tipos, donde la siguiente matriz de distribución conjunta describe el prior de la Naturaleza:
Es decir, la probabilidad previa de que el jugador 1 sea de tipo A y el jugador 2 de tipo D sea
igual a la probabilidad previa de que el jugador 1 sea de tipo b y el jugador 2 sea de tipo c, y esta
probabilidad es 1/3. De manera similar, la probabilidad previa de que el jugador 1 sea de tipo A
y el jugador 2 de tipo C es igual a la probabilidad previa de que el jugador 1 sea de tipo b y el
jugador 2 sea de tipo d, y esta probabilidad es 1/6. El supuesto de common prior implica que cada
uno de los dos jugadores da por sentado que la naturaleza elige los tipos según la matriz. Ahora
imagina que el jugador 1 aprende que su tipo es a. ¿Cuál debe ser su creencia acerca del tipo del
jugador 2? Esto se calcula usando la fórmula de probabilidad condicional:

Estrategias y Equilibrio de Bayes-Nash:


Recuerde que en los juegos estáticos de forma normal de información completa no hicimos una
distinción entre acciones y estrategias porque las elecciones se hacían de una vez por todas. Para
juegos de información incompleta, sin embargo, necesitamos ser un poco más cuidadosos para
especificar las estrategias correctamente. La representación de un juego bayesiano descrito
anteriormente tiene conjuntos de acciones, Ai, para cada jugador i ∈ N. Sin embargo, cada jugador
puede ser uno de varios tipos i ∈ Θi, y cada tipo θi puede elegir una acción diferente del conjunto
Ai. Así, para definir una estrategia para el jugador i necesitamos especificar cual cada tipo θi ∈
Θi del jugador i elegirá cuando la Naturaleza seleccione a ese tipo.
Considerando un Juego Bayesiano estático, una estrategia pura para el jugador i es una función
si: Θi Ai que especifica una acción pura si (θi) que el jugador i elegirá cuando su tipo sea θi.
Una estrategia mixta es una distribución de probabilidad sobre las estrategias puras de un
jugador.
Esto resulta ser una manera conveniente de especificar estrategias para los juegos bayesianos.
Puede pensar en ello como si cada jugador eligiera su estrategia de tipo contingente antes de que
aprendiera su tipo y luego juega de acuerdo a esa estrategia. Esto debería recordarte estrategias
para juegos de forma extensiva que se definen como asignaciones de acciones a conjuntos de
información, donde una estrategia pura es un reglamento de qué elegir en cada conjunto de
información. En los juegos bayesianos, podemos pensar que los tipos de jugadores son sus
conjuntos de información: cuando el jugador aprende su tipo, es como si estuviera en un conjunto
de información único que se identifica con este tipo.
Esta observación es útil porque nos permite considerar consistentemente las creencias de
jugadores sobre las estrategias de sus oponentes cuando sus oponentes pueden ser de diferentes
tipos. Para ilustrar este punto, considere el juego de entrada usado para demostrar las ideas
centrales desarrolladas aquí, mostradas en la Figura 12.2 y en su forma normal por la siguiente
matriz:
Como podemos ver ahora, este juego es solo un caso especial del juego Bayesiano más general
descrito en la definición 12.1. La estrategia del jugador titular 2 depende de su tipo, y por lo tanto,
la representación matricial de este juego incluye cuatro tipos estrategias puras. El jugador 1 tiene
creencias correctas sobre la distribución de los tipos dada por la distribución de probabilidad de
la Naturaleza, y junto con una estrategia específica del jugador 2, el jugador 1 tendrá creencias
bien definidas sobre los diferentes caminos de continuación y resultados del juego.

Es útil enfatizar la forma en que las creencias sobre los resultados se determinan en los juegos
estáticos bayesianos de información incompleta, que permiten a los jugadores evaluar los pagos
esperados de sus opciones alternativas. En el juego de entrada de la figura 12.2, sea θ2 ∈ {r, c} el
tipo de jugador 2 (para racional y loco), siendo p la common prior de que el jugador 2 sea racional.
Ahora consideremos el caso en el que el jugador 1 cree que el jugador 2 está usando la estrategia
pura AF, que se puede describir como:

Hay dos observaciones que vale la pena enfatizar en este punto. Primero, note que si el jugador i
está utilizando una estrategia pura (dependiente del tipo), mientras que la Naturaleza elige los
tipos del jugador i al azar, luego en cuanto a los jugadores j ≠ i están conscientes que se enfrentan
a un jugador i que esta usando una estrategia mixta. Nuevamente, usando el ejemplo del juego de
entrada, si el jugador 2 utiliza la estrategia AF, en lo que respecta al jugador 1, es como si el
jugador 2 estuviera eligiendo A con probabilidad p y F con probabilidad 1− p.
En segundo lugar, como se mencionó brevemente anteriormente, estamos especificando
efectivamente la estrategia para todos sus conjuntos de información del jugador i, uno para cada
tipo, al igual que en cualquier juego en forma extensiva. Así, dada una cierta realización de la
naturaleza, estamos especificando qué hará cada jugador i incluso para aquellos tipos que no se
hayan realizado. La razón por la que la estrategia de i debe especificarse completamente es para
que los oponentes del jugador i puedan formarse creencias bien definidas sobre el comportamiento
de i. Sin esta especificación completa, los jugadores j≠i no pueden calcular los pagos esperados
de sus propias acciones.
Ahora que hemos definido completamente qué es un juego bayesiano estático y qué son las
estrategias para cada jugador, es fácil definir un concepto de solución que se deriva desde el
equilibrio de Nash como sigue:
Es decir, independientemente de la realización del tipo, ningún jugador quiere cambiar su
estrategia si*(.).

Ejemplos:
Adolescentes y el juego de la gallina.
A menudo se halla el caso de un jugador que se encuentra en un juego de conflicto que aguantará
y sufrirá sólo para parecer fuerte, en lugar de dejar que su rival lo supere. Ya sean empresas en el
mercado, políticos en el gobierno, países en guerra, o incluso niños en el patio de recreo, el
comportamiento óptimo dependerá de alguna combinación de la tendencia de cada jugador a ser
agresivo y su creencia sobre la tendencia de su oponente a ser agresivo.
Para ilustrar esta idea, considere un juego simple de agresión que es conocido por muchos
adolescentes: el juego de la "gallina". La película de 1955 Rebel Without a Cause presenta a
James Dean como un delincuente juvenil e introduce a la pantalla de plata una variante bastante
peligrosa del juego. En la película dos adolescentes conducen simultáneamente sus autos hacia el
borde de un acantilado. El primero en saltar se considera gallina y pierde el concurso. (En la
película, uno muere y, casualmente, el mismo Dean murió en un accidente automovilístico. antes
de que se estrenara la película.) Muchas otras películas han presentado variaciones de este juego
de la gallina, un ejemplo bien conocido es Grease (1978), protagonizada por John Travolta. El
siguiente ejemplo es otra variante del juego.
Dos adolescentes, jugadores 1 y 2, han tomado prestado el auto de sus padres y decidieron jugar
al juego de la gallina como sigue: manejan uno hacia a otro en el medio de una calle y justo antes
del impacto deben simultáneamente decidir si son una gallina y doblar a la derecha o continuar
manejando derecho. Si los dos son gallinas, entonces ninguno gana el respeto de sus amigos, pero
no sufren pérdidas, así ambos obtienen un pago de 0. Si el jugador i continua derecho mientras el
jugador j≠ i juega gallina, entonces i gana todo el respeto, el cual representa un pago de R y j no
gana ningún respeto lo que vale 0. En este caso ninguno de los dos jugadores sufre pérdidas
adicionales. Finalmente, si ambos continúan manejando comparten el respeto, pero sucederá un
accidente y al menos serán retados por sus padres si es que no terminan gravemente heridos. Un
accidente implica una pérdida personal de k para cada jugador, por lo cual el pago que recibe cada
uno es R/2-k.
Sin embargo, existe una potencial diferencia entre ambos jóvenes: el castigo k depende del tipo
de padre que tengan. Para cada uno, los padres pueden ser duros (H) o blandos (L) con igual
probabilidad y los sorteos de la Naturaleza sobre el tipo de padre está distribuida
independientemente. Esto significa que la probabilidad que los padres del jugador i sean duros es
igual a ½ y es independiente del tipo de padre que tenga el jugador j. Si los padres del jugador i
son duros, esto implica un alto costo por un accidente denotado como k= H. Mientras que si los
padres son blandos implica un menor costo por accidente denotado como k= L < H. Cada chico
conoce el tipo de sus padres, pero no conoce el tipo de los padres de su oponente. La distribución
de los tipos es de common knowledge.

La forma extensiva de este juego es descrita en la siguiente figura. Hay cuatro estados de la
Naturaleza θ1θ2 ∈ {LL, LH,HL, HH} que denotan los tipos del jugador 1 y del jugador 2
respectivamente, y cada uno de estos cuatro estados ocurre con igual probabilidad debido a la
distribución de probabilidad descrita anteriormente. La estructura de los conjuntos de información
se sigue del conocimiento de los jugadores cuando hacen sus movimientos. El jugador 1 por
ejemplo, no puede distinguir entre LL y LH (su tipo es L) ni tampoco entre HL y HH (su tipo es
H). Sin embargo, el sabe cual es su propio tipo y por ende puede distinguir entre estos dos pares
de estados. Una lógica similar explica los conjuntos de información del jugador 2. El conjunto de
acciones de cada jugador son A1= {C,D} y A2= {c,d} donde C o c representa gallina y D o d
representa seguir derecho.

A partir de la forma extensiva se puede derivar la matriz que sigue. Una estrategia para el jugador
1 está denotada como xy ∈S1= {CC, CD, DC, DD} donde x es lo que él decide si es un tipo L y
en y lo que decide si es un tipo H. Lo mismo ocurre para S2 = {cc, cd, dc, dd}. Los pagos son
calculados utilizando las probabilidades sobre los estados de la Naturaleza junto con las
estrategias de los jugadores. Por ejemplo, si 1 elige CD y el jugador 2 elige dd, entonces los pagos
esperados del jugador 1 son:
Para resolver el Equilibrio de Bayes- Nash necesitamos más información acerca de los parámetros
R, H y L. Si se asume que R=8, H=16 y L=0, esto resulta en la siguiente matriz:

Un rápido análisis revela que el juego tiene un único equilibrio de Bayes- Nash de estrategias
puras en (DC,dc). Esto es, los hijos de padres indulgentes van a continuar manejando mientras
que los hijos de padres duros van a doblar para evitar las costosas consecuencias. Si los pagos que
asumimos, son realmente representativos de la situación entonces el punto de vista de que la
crianza dura produce mejores resultados puede ser apoyado. Sin embargo, quizás los hijos de
padres blandos respeten la propiedad de sus padres mientras que los hijos de padres duros no, a
pesar de anticipar el dolor de un castigo duro. En este caso podríamos asumir que L=16 y H=0,
lo cual resultará en una predicción diferente a la anterior.

Comercio ineficiente y selección adversa:


Una de las principales conclusiones del análisis de mercado competitivo en economía es que los
mercados asignan bienes a las personas que más los valoran. La simple intuición detrás de esta
conclusión se trabaja de la siguiente manera: si un bien se asigna de manera que algunas personas
que lo tienen, lo valoran menos que las personas que no lo hacen, entonces las llamadas presiones
del mercado hacen que el precio de ese bien aumente a un nivel en el que los propietarios actuales
preferirán venderlo en lugar de aferrarse a él, y las personas que lo valoren más estarán dispuestas
a pagar ese precio. La determinación de tal precio no está claramente especificada, pero varios
mecanismos tales como negociación, subastas o intermediarios de mercado pueden ayudar a
conseguirlo.

Este poderoso argumento se basa en algunos supuestos, uno de los cuales es que el valor del bien
es comprendido fácilmente por todos los participantes del mercado, o en nuestra terminología,
hay información perfecta sobre el valor del bien. Esto es por supuesto un supuesto que se aplica
a un mundo ideal, uno que a menudo se aparta de la realidad. El supuesto de información perfecta
no solo implica el poderoso resultado que los mercados asignará bienes a los agentes que más los
valoran, pero también nos permite obtener lo que se conoce como el Teorema de Coase. Su
creador, Ronald Coase (1960), recibió un premio Nobel en parte por esta importante contribución.
Argumenta que en un mundo con información perfecta y sin fricciones en el mercado (a menudo
denominados costos de transacción), la asignación de derechos de propiedad no afectará la
eficiencia económica. Es decir, incluso si por alguna razón los bienes no se asignan a las personas
que más los valoran, luego con información perfecta y mecanismos de intercambio en buen
funcionamiento estos bienes terminarán en manos de quienes más los valoran.
Es importante entender hasta qué punto estos argumentos se mantienen o caen en la cara de la
información imperfecta, es decir, cuando algunas personas están mejor informadas sobre el valor
de los bienes que otros. Para abordar esta cuestión desarrollaremos un ejemplo simple que sigue
el espíritu de la importante contribución hecha por George Akerlof (1970), una contribución que
introdujo la idea de selección adversa en economía y por la cual el autor ganó un premio Nobel.
Imagine un escenario en donde el jugador 1 es dueño de un campo de naranjas. El rendimiento de
la fruta depende de la calidad del suelo y otras condiciones locales, y asumimos que, a través de
su experiencia, solo el jugador 1 conoce la calidad de la tierra. Estudios geológicos locales
concluyen que la calidad de la tierra puede ser baja, mediocre o alta con igual probabilidad (1/3).
Así podemos pensar acerca del conocimiento del jugador 1 sobre su tierra como su tipo Θ1=
{L,M, H}, en donde cada tipo posee un diferente valor para la tierra. Asuma que el valor que el
jugador 1 le da a poseer una tierra de tipo θ1 está dado por los siguientes valores monetarios.

Ahora imagine que el jugador 2 es un sojero que está considerando la compra de esta tierra. La
experiencia familiar del Jugador 2 en el cultivo de soja ha sido muy rentable, pero esa búsqueda
también depende de la calidad de la tierra. En
particular, los valores monetarios para el jugador
2 son:
El problema, sin embargo es que el jugador 2 sólo conoce que la calidad está distribuida
uniformemente entre las tres opciones debido a los resultados de los estudios geológicos, pero no
conoce cuál de las tres realmente es.
Considere el siguiente juego: el jugador 2 hace una oferta de precio de forma tómalo o déjalo, la
cual el jugador 1 puede aceptar (A) o rechazar ( R) y el juego termina ya sea con la transacción
de la tierra por el precio ofrecido o con ninguna transacción. La estrategia para el jugador 2 es por
lo tanto, una única oferta de precio, P≥0, y una estrategia pura para el jugador 1 es proyectar a
partir del precio ofrecido y su tipo una respuesta s1 : [0,∞) ×Θ1→{A, R}. El juego está descrito
a continuación:

Las suposiciones sobre los pagos de los dos jugadores implican que desde el punto de vista de la
eficiencia el jugador 2 debería poseer la tierra. De hecho, si la calidad de la tierra fuera de
conocimiento común entonces habría muchos precios en los que tanto el jugador 1 como el
jugador 2 estarían felices de intercambiar la propiedad. Por ejemplo, si la calidad fuera conocida
por ser baja entonces, como en el modelo de negociación de un período (el ultimátum) el único
equilibrio perfecto en subjuegos sería que el jugador 2 ofrece al jugador 1 un precio de 10 y
jugador 1 acepta. Del mismo modo, cualquier precio entre 10 y 14 puede ser apoyado por algún
equilibrio de Nash. Ahora veremos qué intercambios son posibles en equilibrio cuando hay
información incompleta como se describió anteriormente.
Consideremos el valor que el jugador 2 deposita sobre la tierra. Él sabe que con igual probabilidad
puede valer uno de los valores v2 ∈ {14, 24, 34}, por ende, en promedio vale 24. Además, sabe
que en promedio vale 20 para el jugador 1. Podría parecer que un candidato natural al equilibrio
sería ofrecer el precio más bajo al cual el jugador 2 piensa que el jugador 1 aceptaría, lo cual sería
P= 20.
Pero ¿cuál sería la mejor respuesta del jugador 1? Recuerde que el jugador 1 conoce la calidad de
la tierra, por lo tanto sólo aceptaría la oferta si su tipo es L o M. Eso implica que el jugador 2
obtendría una parcela de tierra de calidad mediocre o mala, cada una con igual probabilidad y
recibiría un valor esperado de 1/2× 14 + 1/2× 24 = 19. Por lo tanto, el jugador 2 poseería un pago
esperado de la transacción de Ev2 = 19 − 20 < 0, lo que implica que sería mejor no comprar la
tierra.
Note que para cualquier oferta p ∈ [20, 30) el jugador 1 sólo aceptaría si su tipo es L o M, y el
valor esperado del jugador 2 seguiría siendo de 19, con lo cual esa transacción sería imposible en
equilibrio. Por lo tanto, si el jugador 2 debe tener en cuenta la mejor respuesta del jugador 1, él
sabe que conseguirá que todos los tipos de jugador 1 acepten vender solo si el jugador 2 ofrece
30, pero en este caso solo obtendría un valor esperado de 24, lo que no es rentable. Por ende, se
concluye que ninguna transacción podría ocurrir a un precio mayor a 20.
Esto implica que si la transacción tiene lugar, se producirá a un precio inferior a 20, lo que a su
vez, implica que el jugador 1 aceptará tal intercambio solo si su tipo es L. Tomando esto en cuenta,
el jugador 2 debe ofrecer un precio no mayor que p = 14, proporcional con el jugador 1 cambiando
si su tipo es de hecho L. Esta lógica produce el siguiente resultado:
Una transacción puede ocurrir en un Equilibrio de Bayes-Nash sólo si implica el tipo más bajo
del jugador 1. Además, cualquier precio p∗ ∈ [10, 14] puede ser soportado como un Equilibrio
de Bayes-Nash.
La razón por la cual sólo el tipo más bajo va a comerciar en equilibrio se sigue de nuestro
equilibrio. Para ver que cualquier precio p*∈ [10, 14] puede ser soportado como un Equilibrio de
Bayes-Nash considere las siguientes estrategias: el jugador 2 ofrece un precio p* y la estrategia
para el jugador 1 es:

En el caso de p*, las estrategias de los dos jugadores son mejores respuestas simultáneamente y
por ende constituyen un Equilibrio de Bayes-Nash.
La conclusión de este resultado es que el comercio ocurrirá solo si la calidad de la tierra es la más
baja. Esto sucede debido a lo que se llama selección adversa. Cuando el comprador está dispuesto
a pagar un precio igual a su valor promedio, entonces el tipo de vendedor que está dispuesto a
vender a este precio está por debajo del promedio, porque los mejores tipos seleccionan no vender
por un precio promedio, de ahí la selección adversa de vendedores por debajo del promedio. En
el ejemplo, esta desintegración hace que la calidad comercializada caiga a su nivel más bajo,
impidiendo que el mercado llegue a resultados comerciales eficientes.
También vale la pena mencionar que este escenario cae en la categoría de juegos con valores
comunes. En esta categoría de juegos, el tipo de un jugador afecta los pagos de otro jugador. En
este ejemplo, el tipo de jugador 1 afecta los pagos de ambos: jugador 1 y jugador 2. Es
precisamente esta característica del juego la que causa el efecto adverso.
Tenga en cuenta que en esta configuración los jugadores se beneficiarían si de alguna manera el
jugador 1 pudiera revelar al jugador 2 cuál es la verdadera calidad de su tierra. Sin embargo, los
anuncios del tipo "mi suelo es de alta calidad" son inútiles: si el jugador 2 creyera en tal anuncio,
entonces el jugador 1 siempre diría "Mi tierra es de alta calidad". Si de alguna manera el jugador
1 podría revelar su tipo de manera creíble, entonces el resultado sería diferente.

Comité de votación:
Muchas decisiones las toman los comités. Ejemplos incluyen legislaturas, firmas, clubes de
membresía y jurados. Cada miembro del comité tendrá diferente información, o diferentes formas
de interpretar la información, y los objetivos de los miembros del comité pueden ser congruentes
o diversos. Debido a que cada miembro del comité tiene información privada sobre sus propias
preferencias o sobre el valor de diferentes decisiones, los votos de los comités pueden modelarse
como juegos bayesianos.
A manera de ejemplo, considere un jurado formado por dos jugadores (jueces) que deben decidir
colectivamente si absuelven (A) o condenan (C) a un acusado. El proceso consiste en que cada
jugador emite un voto sellado y el acusado es condenado sólo si los dos jueces votan C. El
problema es que existe incertidumbre acerca de si el acusado es culpable (G) o inocente (I). En
principio la probabilidad de que el acusado será culpable está dada por q>1/2 y es de conocimiento
común. Asuma que a cada jugador le importa tomar la decisión correcta, por ende si el acusado
es culpable cada jugador recibe un pago de 1 si lo condenan y de 0 si lo absuelven. Si en cambio
el acusado es inocente, entonces cada jugador recibe un pago de 0 si lo condenan y un pago de 1
si lo absuelven.
Si la única información disponible para los jugadores es la probabilidad q, entonces el juego puede
ser descrito por la siguiente matriz:

Como muestra la matriz, si alguno de los jugadores escoge A el acusado es absuelto y cada jugador
recibe un pago esperado de 1-q. Si los dos escogen C entonces el acusado es condenado y cada
jugador recibe un pago esperado de q. Claramente, debido a que q>1/2 cada jugador tiene una
estrategia débilmente dominante en C.
Ahora imagine que las cosas son un poco más complejas. Cada jugador i tiene una diferente
pericia y cuando observa la evidencia recibe una señal privada θi∈ {θG, θI} que contiene
información valiosa. En particular cuando el acusado es culpable es más probable que el jugador
i reciba una señal θi=θG y cuando es inocente recibe una señal θi=θI . Asuma que las señales son
independientes: la probabilidad de recibir una señal θG cuando el acusado es culpable es igual a
la probabilidad de recibir una señal θI cuando el acusado es inocente, por ende:

Note que la información privada que cada jugador recibe, o su tipo, no se trata de cómo él evalúa
los resultados, en cambio, es información acerca del estado del mundo, llámese la probabilidad
de que el acusado sea culpable. Sin embargo, debido a que el estado del mundo afecta los pagos
que recibe cada jugador por los resultados, esto implica que los tipos son realmente relevantes
para los pagos.
Con esta estructura de información tenemos un juego Bayesiano de información incompleta en
donde cada jugador i elegirá una acción que depende de una señal para maximizar la probabilidad
de que un acusado culpable sea condenado mientras que uno inocente sea absuelto. Debido a que
cada jugador tiene dos tipos, dados por las señales que observa, cada jugador tiene cuatro
estrategias puras si ∈ {AA, AC, CA, CC}, en donde la estrategia xy significa que elige x si su
señal es θG y elige y si su señal es θI. Note que, al igual que el juego de selección adversa visto
anteriormente, este es un juego de valores comunes porque ambos jugadores quieren que se llegue
al veredicto justo.

Naturalmente una primera pregunta sería la siguiente: si cada jugador fuera capaz de condenar o
absolver al jugador por su mismo, ¿cómo la señal determinaría su comportamiento? Considere el
problema de decisión con sólo un jugador. Sin recibir la señal, el jugador sabe que el acusado es
culpable con probabilidad q>1/2, por ende, elegiría condenar al acusado. Después de recibir la
señal, sin embargo, el jugador actualizará sus creencias acerca del acusado como sigue. Si la señal
fuera θG la actualización de creencias sería:

Esto significa que el jugador estará menos seguro de que el acusado es culpable de lo que estaba
antes de la señal, y si esto es suficiente para persuadirlo de absolver al acusado deprende del valor
de p. En particular, elegirá absolver al acusado si y sólo si la última expresión es menor a 1/2, lo
cual se reduce a p>q. En efecto, la razón p debe ser “suficientemente alta”, para que la señal sea
suficientemente informátiva acerca de la verdadera condición del acusado. Si por ejemplo, p=1/2
la señal no contiene información y por eso Pr{G|θi= θI} = q. A medida que p se incrementa por
sobre ½ la señal se convierte en más informativa y Pr{G|θi= θI} disminuye. Una vez que p se
incrementa por sobre el nivel de q la señal es suficientemente fuerte para revertir la condena dada
por q antes de la señal e implica que luego de la señal el jugador creerá que el acusado es más
probable que sea inocente.

La observación de que si p>q entonces cada jugador va a votar de acuerdo con su señal en el
problema de decisión de una persona lleva a la próxima pregunta: ¿es el par de estrategias si: C
A, en donde cada juez vota de acuerdo con su señal un equilibrio de Bayes Nash? Intuitivamente
pareciera que debería ser debido a que la señal que cada jugador recibe es informativa acerca de
la verdadera condición del acusado. Para ver si este es el caso realmente, necesitamos verificar si
CA es una mejor respuesta para CA para cada jugador.

Antes de proceder a contestar esta pregunta es útil calcular las probabilidades de los diferentes
estados de información de las dos señales que los jugadores pueden recibir. Hay cuatro estados
de información relevantes: o los dos reciben la señal θG, o los dos reciben la señal θI, o cada
jugador recibe una señal distinta. Por ejemplo, si el acusado es culpable la probabilidad de que
los dos reciban una señal θG es igual a p^2, mientras que si el acusado es inocente la probabilidad
de que los dos reciban una señal θG es igual a (1-p)^2. Debido a que en principio la probabilidad
de que el acusado sea culpable es q y las señales son condicionales independientes de la condición
del acusado, la probabilidad de que ambos reciban la señal θG es qp2 + (1− q)(1− p)2.
Similarmente la probabilidad de que el jugador 1 reciba una señal θG y el jugador 2 reciba una
señal θI es igual a qp(1− p) + (1− q)(1− p)p = p (1− p). Continuando en este sentido podemos
computar las probabilidades de los cuatro estados, dadas en la siguiente tabla:
Para continuar note que dada la regla que es necesaria unanimidad para condenar al acusado, un
jugador es decisivo únicamente si el otro elige C. La razón es que si un jugador elige A, entonces
será absuelto si o si, independientemente de lo que elija el otro mientras que si elige C la decisión
acerca de si el acusado es condenado o no depende de la elección del otro jugador. Por esta razón,
si el jugador i piensa que el jugador j juega de acuerdo a la estrategia CA, entonces también debe
creer que su propio voto sólo importa si el jugador j observa una señal θj= θG. Por ende,
necesitamos calcular la posterior creencia que el jugador i tiene acerca de si el jugador es culpable,
condicional a su propia señal y en la creencia de que la señal del jugador j es θG.
Si la señal del jugador i es θi= θG, entonces su creencia actualizada acerca de la culpabilidad del
acusado es:

Lo que significa que el jugador está aún más convencido de que el acusado es culpable y por ende
elegirá C para garantizar que el acusado sea condenado cuando ambos reciben la señal de
culpable.
Si la señal fuera θi= θI, entonces la creencia actualizada del jugador i acerca de la culpabilidad
del individuo condicional a su creencia de que el jugador j recibe una señal de culpable es:

Esto significa que cuando el jugador i condiciona el valor de su señal de inocencia al evento en
donde su voto realmente cuenta, es decir cuando el jugador j elige C, entonces su señal θi= θI se
vuelve menos convincente acerca de la inocencia del acusado. Si el jugador i está en la situación
en la que cree que su voto es relevante, entonces observar una señal de inocencia se cancela por
la creencia de que el jugador j recibió una señal de culpabilidad.
Por ende, se concluye que jugar la estrategia CA para ambos jugadores no es un equilibrio de
Bayes-Nash. De hecho, el equilibrio de Bayes-Nash se encuentra en CC para ambos jugadores.
Es decir, en una situación en donde condenan siempre a pesar de la señal que reciban. Esto implica
que cuando ambos jugadores reciben una señal de inocencia, lo cual ocurre con una probabilidad
mayor a cero, a pesar del hecho de que es más probable que el acusado sea inocente igualmente
será condenado.