JUEGO6

Notas de clase de Teoría de Juegos - Marcela Eslava 40
V. JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA
Dos características básicas de estos juegos:
1. (Al menos) algún jugador tiene información incompleta sobre el tipo de (al menos) alguno de sus
contendores.
2. Se juega de forma secuencial: el interés en estos juegos surge si, en al menos algún punto del juego,
la parte desinformada observa acciones pasadas de su contrincante antes de mover.
Estas dos características llevan a la implicación que hace este tipo de juegos interesante, relevante y
realista: antes de tomar acción, la parte desinformada trata de extraer información sobre el tipo del otro jugador,
basada en las acciones previas de este último. Usa esa información para complementar la que tenía al
principio (la distribución incondicional del tipo de su contrincante). Esto, a su vez crea incentivos para
que la parte informada trate de señalizar al otro que es del tipo que más le conviene ser (por ejemplo, en
un duopolio de Cournot, una firma siempre quiere enviar la señal de que es eficiente, para llevar a su
contrincante a producir poco). Es decir, el informado toma sus decisiones teniendo en cuenta como
afectarían las “creencias” futuras de su contrincante.
Note un problema: como, por ejemplo, una firma siempre quiere indicar que es eficiente, así no lo sea en
realidad, las señales pueden carecer de credibilidad. Entonces en estos juegos, el jugador informado sólo
es capaz de señalizar su tipo de manera efectiva si puede acceder a una señal que sea posible para los
"tipos mejores" de un jugador, pero excesivamente costosa para los demás tipos.
Vamos a encontrar que, dependiendo de la disponibilidad de este tipo de señales, hay por lo menos dos
tipos de equilibrio posibles. Los vamos a explicar con un ejemplo
Ejemplo 5.1.
Cournot: Retome el ejemplo 4.1., pero suponga que el juego se juega en forma repetida en dos periodos.
Entonces, la firma i=2 (la informada) querrá usar sus acciones del primer periodo para convencer a su
contrincante de que es muy eficiente. Si logra hacerlo, en el segundo periodo la firma desinformada
producirá una baja cantidad, mejorando las ganancias que la firma i=2 recibirá en ese periodo.
Estudiaremos dos tipos posibles de equilibrio:
Puede haber un equilibrio tal que en la primera etapa: q 2 (c ) < q 2 (c B ) . Entonces en la segunda etapa
* *
1.
si D observa q 2 (c ) sabe que c 2 = c y si observa q 2 (c B ) entonces sabe que c 2 = c B . En el primer
* *
caso escoge su cantidad óptima de tener competidor poco eficiente (q alta, digamos qD ) y en el
segundo su (q) óptima de competidor eficiente qD . Esto es un equilibrio sólo si al tipo poco efectivo
le resulta tan costoso producir mucho que el beneficio de hacerse pasar por altamente productivo no
compensa el costo. Este tipo de equilibrio se conoce como Equilibrio Separador, porque los diferentes
tipos posibles de un jugador escogen acciones diferentes, lo que le permite al otro jugador usar las
acciones pasadas del informado para deducir perfectamente su tipo. Cuando un juego tiene este tipo
de equilibrio, se dice que es un juego de "señalización", porque el jugador informado es
perfectamente capaz de señalizar su tipo al otro jugador.
También puede haber un equilibrio tal que en la primera etapa i=2 produce: q 2 (c ) = q 2 (c B ) = q 2 .
* * *
2.
*
Dado esto, en el segundo periodo el otro jugador observa q 2 y sabe que esto no le da ninguna señal.
Entonces sigue sabiendo tan sólo la distribución incondicional. En la segunda etapa, este jugador
desinformado entonces se sigue comportando como en un juego estático con infromación incompleta
(ya que lo sucedido en periodos anteriores no le enseña nada sobre su contrincante). Este caso es un
ejemplo de Equilibrio Agrupador: los diferentes tipos de i=2 se “agrupan” escogiendo la misma acción.
Cuando un juego tiene un equilibrio de este tipo, se dice que existe la posibilidad de “imitación” (por
ejemplo, el tipo ineficiente que quiere hacerse pasar por eficiente es capaz de hacerlo de forma
efectiva).
5.1. Definiciones, notación y el concepto de equilibrio.
Nos vamos a limitar a la clase más sencilla posible de estos juegos: 2 jugadores, 2 periodos, el informado
mueve en t=1 y el desinformado en t=2, después de observar lo jugado en t=1.
Definiciones:
1. Dos jugadores i = {I, D} (I de “Informado”, D de “desinformado”).
2. I puede ser de dos “tipos” tI= θ o µ . I conoce su tipo, D no conoce el tipo de I. Sólo sabe, antes
de empezar el juego, que Pr (t I = θ ) = p .
*
3. Una estrategia de I es una acción para cada tipo que I puede tomar: SI (tI).
Una estrategia de D es una acción de D para cada posible acción observada de I en el primer
periodo: S D (S I )
*
4. Secuencia: t = 1: cada tipo de I escoge una acción S I (tI).

t = 2 : D observa la acción de I, y usa esa señal para evaluar Pr (t I = θ | S I ) . Luego D escoge su
estrategia óptima dado S I y Pr (t I = θ | S I ) . Es decir, podemos anticipar que en un equilibrio
este jugador escoge la estrategia que soluciona:
( ( ) )
Max S * E U D S I , S D* | S I
D
= Pr (t I = θ | S I )U (S , S , t
D I
*
D I ) (
= θ + [1 − Pr (t I = θ | S I )]U D S I , S D* , t I = µ )
El concepto de equilibrio empleado en este tipo de juegos es “Equilibrio Bayesiano Perfecto” (EBP).
Equilibrio Bayesiano Perfecto:

Una combinación de estrategias y probabilidades S I (t I ), S D S I , Pr t I = θ
* *
( ) *
( )
S I* es un Equilibrio
Bayesiano Perfecto si:
• SI* (t I ) maximiza la utilidad de I cuando es de tipo t I (∀t I ) y D juega SD* (SI* ).
• Luego de observar SI* , el jugador D calcula Pr (t I = θ )
S I* ∀S*I (t I ) siguiendo la regla de
Bayes (“actualización Bayesiana”).
• SD* (SI* ) resuelve:
( (
Max S * E U D S , S | S
D
*
D
*
I ) )
*
I
( ) ( ) [ ( )] (
= Pr t I = θ | S I* U D S D* , S I* , t I = θ + 1 − Pr t I = θ | S I* U D S D* , S I* , t I = µ )
Método de Solución:
1. Proponer una estrategia de equilibrio de I : S I (t I ).
*
2. Inducción hacia atrás:

• t=2:
i. Se obtiene Pr (t I = θ | S I ) para cada posible S I por actualización Bayesiana,
dada la estrategia S I (t I ) propuesta.
*
*
D
( (
ii. Se encuentra S D (S I ) que Max S * E U D S D , S I
*
)) dada Pr(t I = θ | SI ).
•
*
( *
)
t=1: Dada la estrategia SD SI (t I ) encontrada para t=2, se verifica que SI (t I ) maximice
*
la utilidad de I para cada posible tipo de I.
Ejemplo 5.2: Interacción laboral.
Una firma decide si contratar o no a un trabajador. El trabajador puede ser productivo o no, y a la firma
sólo le conviene tenerlo si es productivo.
⎧7 con probabilidad p.
Productividad del trabajador η = ⎨
⎩3 con probabilidad (1 - p )
Si la firma contrata al trabajador, le tiene que pagar el salario del mercado, que es (w). Las ganancias de
la firma están dadas por:
⎧7 − w Si η = 7
∏ F = y(η ) - w = ⎨
⎩3 − w Si η = 3
, donde w es el salario de mercado y asumimos 3<w<7 (que es lo que captura que la firma sólo quiera
contratar al trabajador si es productivo)
Antes de que la firma lo contrate, el trabajador puede decidir educarse o no. La educación no altera su
productividad, pero le puede servir de señal sobre qué tan productivo es, ya que es posible que a los
trabajadores más productivos se les facilite más educarse.
⎧e
Por su parte, el trabajador escoge el nivel de educación e entre dos opciones posibles: e = ⎨ . La
⎩0
utilidad de trabajador está dada por:
⎧w − c(e,η ) si lo contratan
U Trabajdor = ⎨
⎩- c(e,η ) si no
donde c(e,η) es el costo de educarse, y asumimos que c(0,η)=0 (no educarse no tiene costo). Si a los
trabajadores más productivos se les facilitara más educarse, esto sería capturado por c(e,η=7)< c(e,η=3).
Secuencia: t=1: el trabajador escoge entre e = e y e = 0 , en t=2 la firma observa el ‘e’ que decidió el
trabajador y decide si contratarlo o no.
Vamos a estudiar la posibilidad de que la educación sea una señal creíble de que el trabajador es
productivo. El resultado básico que encontraremos es que, para que lo sea, es necesario que educarse sea
suficientemente más costoso para alguien poco productivo que para un individuo productivo.
Solución:
Propondremos, por ejemplo, un equilibrio separador en el que el trabajador se educa si es productivo, y
no se educa si no lo es. Este es un equilibrio en que la educación es señal efectiva de productividad, dado
que alguien del tipo no productivo escoge no educarse. En forma más concisa:
⎧e Si η = 7
S T* (η ) = e(η )⎨
⎩0 Si η = 3
Inducción hacia atrás:

• t=2: Evaluamos la estrategia que maximiza E (∏ F ) si el T estuviera siguiendo la ST* (η)
propuesta arriba. Empezamos por calcular Pr (η = 7 | e ) que sería racional si T está siguiendo
ST* (η) propuesto:
Pr (η = 7 | e = e ) = 1 Pr (η = 3 | e = 0) = 0
Usted puede verificar que estas probabilidades condicionales cumplen con la regla de Bayes.
Dadas estas probabilidades condicionales, debemos ahora evaluar cuál es la mejor respuesta de
la firma (contratar o no contratar) a cada posible escogencia de educación del trabajador.
Comparamos entonces la utilidad esperada de contratar con la de no contratar, dada la
escogencia de educación del trabajador y las probabilidades condicionales encontradas arriba:
Si e = e : E (∏ F (e = e, contrata )) = Pr (η = 7 | e = e )(7 − w) + Pr(η = 3 | e = e)(3 − w) = 7 - w
( (
E ∏ F e = e, no contrata = 0))
Si e = 0 : E (∏ F (e = 0, contrata )) = 3 − w
E (∏ F (e = 0, no contrata )) = 0
Dado el supuesto de 7>w>3, esto implica la siguiente estrategia óptima para la firma dada la del
trabajador:
⎧Contrata si e = e
S F* (e ) = ⎨
⎩ No Contrata si e = 0
• t=1: Dado SF* evaluamos qué es óptimo para el trabajador:
U T (e = e,η ) = w − c(e = e,η )

U T (e = 0,η ) = 0
⇒ Escoge educarse si w > c(e = e,η )
Entonces para que el equilibrio propuesto sea Equilibrio de Bayes-Nash se necesita:

w ≥ c(e = e,η = 7 ) y w ≤ c(e = e,η = 3)
( )
Note por ejemplo, que esto implica que si w=5 y c e = e,η = 7 = 3 , la existencia de este equilibrio
( )
separador requiere que c e = e,η = 3 > 5 . Es decir requerimos no sólo que educarse sea más costoso
para un individuo poco productivo, sino que sea "suficientemente" menos costoso para un individuo
poco productivo.
Ejemplo 5.3. Interacción laboral II – Equilibrio Agrupador.
Note que, dado el método de solución que utilizamos, en nuestro ejemplo anterior simplemente
encontramos una combinación de estrategias que constituye un EBP, pero no podemos descartar la
existencia de otros equilibrios. Por ejemplo, cabe preguntarse bajo qué condiciones la estrategia
agrupadora e(η = 7 ) = e(η = 3) = e es parte de un EBP. Note lo interesante de esta posibilidad: si existe
un EBP con en el que el trabajador escoja estrategia, este sería un equilibrio en el que la educación no
genera beneficios como señal de productividad (ya que ambos tipos escogen la misma acción), y sin
embargo el trabajador asume el costo de educarse. Es decir, este sería un equilibrio no óptimo.
Empezamos entonces por proponer la estrategia agrupadora mencionada y reproducimos el

procedimiento necesario para encontrar las condiciones bajo las cuales en efecto forma árte de un EBP.
Inducción hacia atrás:

( )
(t = 2): Necesitamos saber cómo actúa una firma ante e = e y ante e=0 SF (e) . Necesitamos entonces
*
encontrar P⎛⎜η = 7 ⎞⎟ y P⎛⎜η = 7 ⎞ dado que el trabajador juega de acuerdo con la estrategia
⎝ e = e⎠ ⎝ e = 0 ⎟⎠
propuesta. Como ambos tipos escogen la misma acción en la estrategia propuesta, esta acción no es
reconocida por la firma como una señal informativa, por lo que la probabilidad condicional que asigna a
que el trabajador sea altamente productivo es igual a la probabilidad incondicional:
P⎛⎜η = 7 ⎞⎟ = p, P⎛⎜η = 3 ⎞⎟ = 1 − p
⎝ e = e ⎠ ⎝ e = e ⎠
Ahora note: la estrategia propuesta no dice que el trabajador escoja 0 bajo ninguna circunstancia.
Entonces, no da luces sobre cómo evaluar la probabilidad de que el trabajador sea productivo, si
escogiera no educarse. Necesitamos entonces formular unas “creencias de fuera del equilibrio”: qué
probabilidades condicionales asigna la firma si la acción que observa no forma parte del equilibrio
propuesto. Estas "creencias" son ad-hoc, pero muy potentes para cambiar las decisiones óptimas, por lo
que hay que formularlas de la forma más lógica posible.
Por ejemplo:
P⎛⎜η = 7 ⎞=γ
⎝ e = 0 ⎟⎠
Ahora queremos ver si la Firma contrata o o contrata:

E (U F (contrata, e )) = Pr ⎛⎜η = 7 ⎞⎟(7 − w) + Pr ⎛⎜η = 3 ⎞⎟(3 − w)
⎝ e⎠ ⎝ e⎠
E (U F (no contrata, e )) = 0
Si e = e , la firma contrata si:
p(7 − w) + (1 − p )(3 − w) ≥ 0
w ≤ 3 + p4
Similarmente, si la firma observa e = 0 contrata al trabajador si w ≤ 3 + γ 4
¿Qué se necesita para que un trabajador escoja e sin importar su tipo? (es decir, para que la estrategia
propuesta pueda formar parte de un EBP). Aunque aún no resolvemos el problema de los trabajadores,
podemos ya prever una condición necesaria para que e = e : Que e = 0 implique no contratación (de lo
contrario e = e no tiene beneficios y sí costos). Entonces para que lo propuesto sea equilibrio,
w-3
γ<
necesitamos establecer γ tal que 4 . Por ejemplo, asumamos γ=0.6 Dado esto, la estrategia
óptima de la firma es:
⎧ No Contratar si e = 0
⎪
S (e ) = ⎨ No contratar si e = e y w > 3 + 4 p
*
F
⎪Contratar Si e = e y w ≤ 3 + 4 p
⎩
t = 1: Dado SF (e) trabajador debe escoger si e = e o e = 0 . Si educarse no implica ser contratado, el

*
trabajador no se educará, pues estará asumiendo los costos sin recibir beneficios. Sabemos entonces que
una nueva condición necesaria para permitir el equilibrio agrupador propuesto es w < 3 + 4p .
Supongamos, entonces, que esta condición se cumple. El trabajador compara:
U (e = e,η ) = w − c(e,η )
U (e = 0,η ) = 0
⇒ Escoge e = e si w − c(e,η ) > 0
Entonces, una condición necesaria y suficiente para generar el equilibrio propuesto es
c (e,η = 3) ≤ w ≤ 3 + 4 p (dado que asumimos que educarse es más costoso para un trabajador poco
productivo).
El siguiente conjunto de estrategias es entonces un Equilibrio Bayesiano Perfecto:
S T* (η ) = {e = e ∀ η P⎛⎜η = 7 ⎞⎟ = p
⎝ e = e⎠
⎧Contrata si e = e
S F* (e ) = ⎨ P⎛⎜η = 7 ⎞=0
⎝ e = 0 ⎟⎠
⎩ No Contrata si e = 0
6
Note que esta es una escogencia ad-hoc, para permitir que lo propuesto sea estrategia de equilibrio. Esto es válido
porque lo que estamos haciendo es precisamente buscar bajo qué condiciones la estrategia propuesta sí o no es parte
de un equilibrio. En este punto, ya encontramos que si , entonces la estrategia propuesta no es de equilibrio, y
necesitamos por tanto simplemente proseguir la búsqueda de condiciones que sí permiten un equilibrio de este tipo.

JUEGO6

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

JUEGO6

Cargado por

Copyright:

Formatos disponibles

Notas de clase de Teoría de Juegos - Marcela Eslava 40

V. JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA

Dos características básicas de estos juegos:

5.1. Definiciones, notación y el concepto de equilibrio.

4. Secuencia: t = 1: cada tipo de I escoge una acción S I (tI).

Equilibrio Bayesiano Perfecto:

2. Inducción hacia atrás:

la utilidad de I para cada posible tipo de I.

Ejemplo 5.2: Interacción laboral.

Inducción hacia atrás:

U T (e = e,η ) = w − c(e = e,η )

Entonces para que el equilibrio propuesto sea Equilibrio de Bayes-Nash se necesita:

Ejemplo 5.3. Interacción laboral II – Equilibrio Agrupador.

Empezamos entonces por proponer la estrategia agrupadora mencionada y reproducimos el

Inducción hacia atrás:

Ahora queremos ver si la Firma contrata o o contrata:

Si e = e , la firma contrata si:

t = 1: Dado SF (e) trabajador debe escoger si e = e o e = 0 . Si educarse no implica ser contratado, el

El siguiente conjunto de estrategias es entonces un Equilibrio Bayesiano Perfecto:

También podría gustarte