Está en la página 1de 6

Notas de clase de Teoría de Juegos - Marcela Eslava

40

V. JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA

Dos características básicas de estos juegos:

1. (Al menos) algún jugador tiene información incompleta sobre el tipo de (al menos) alguno de sus contendores.

2. Se juega de forma secuencial: el interés en estos juegos surge si, en al menos algún punto del juego, la parte desinformada observa acciones pasadas de su contrincante antes de mover.

Estas dos características llevan a la implicación que hace este tipo de juegos interesante, relevante y realista: antes de tomar acción, la parte desinformada trata de extraer información sobre el tipo del otro jugador, basada en las acciones previas de este último. Usa esa información para complementar la que tenía al principio (la distribución incondicional del tipo de su contrincante). Esto, a su vez crea incentivos para que la parte informada trate de señalizar al otro que es del tipo que más le conviene ser (por ejemplo, en un duopolio de Cournot, una firma siempre quiere enviar la señal de que es eficiente, para llevar a su contrincante a producir poco). Es decir, el informado toma sus decisiones teniendo en cuenta como afectarían las “creencias” futuras de su contrincante.

Note un problema: como, por ejemplo, una firma siempre quiere indicar que es eficiente, así no lo sea en realidad, las señales pueden carecer de credibilidad. Entonces en estos juegos, el jugador informado sólo es capaz de señalizar su tipo de manera efectiva si puede acceder a una señal que sea posible para los "tipos mejores" de un jugador, pero excesivamente costosa para los demás tipos.

Vamos a encontrar que, dependiendo de la disponibilidad de este tipo de señales, hay por lo menos dos tipos de equilibrio posibles. Los vamos a explicar con un ejemplo

Ejemplo 5.1.

Cournot: Retome el ejemplo 4.1., pero suponga que el juego se juega en forma repetida en dos periodos. Entonces, la firma i=2 (la informada) querrá usar sus acciones del primer periodo para convencer a su contrincante de que es muy eficiente. Si logra hacerlo, en el segundo periodo la firma desinformada producirá una baja cantidad, mejorando las ganancias que la firma i=2 recibirá en ese periodo. Estudiaremos dos tipos posibles de equilibrio:

1. Puede haber un equilibrio tal que en la primera etapa:

*

2

(c

)

sabe que c

2

= c

y si observa

(

*

q c

2

2

B

)

. Entonces en la segunda etapa

si D observa q

caso escoge su cantidad óptima de tener competidor poco eficiente (q alta, digamos q D ) y en el segundo su (q) óptima de competidor eficiente q D . Esto es un equilibrio sólo si al tipo poco efectivo

( )

*

q c

<

*

(

)

q c

2

B

entonces sabe que

c

2

= c

B

. En el primer

le resulta tan costoso producir mucho que el beneficio de hacerse pasar por altamente productivo no compensa el costo. Este tipo de equilibrio se conoce como Equilibrio Separador, porque los diferentes tipos posibles de un jugador escogen acciones diferentes, lo que le permite al otro jugador usar las acciones pasadas del informado para deducir perfectamente su tipo. Cuando un juego tiene este tipo de equilibrio, se dice que es un juego de "señalización", porque el jugador informado es perfectamente capaz de señalizar su tipo al otro jugador.

2.

5.1.

Notas de clase de Teoría de Juegos - Marcela Eslava

41

.

Dado esto, en el segundo periodo el otro jugador observa

Entonces sigue sabiendo tan sólo la distribución incondicional. En la segunda etapa, este jugador desinformado entonces se sigue comportando como en un juego estático con infromación incompleta (ya que lo sucedido en periodos anteriores no le enseña nada sobre su contrincante). Este caso es un ejemplo de Equilibrio Agrupador: los diferentes tipos de i=2 se “agrupan” escogiendo la misma acción. Cuando un juego tiene un equilibrio de este tipo, se dice que existe la posibilidad de “imitación” (por ejemplo, el tipo ineficiente que quiere hacerse pasar por eficiente es capaz de hacerlo de forma efectiva).

También puede haber un equilibrio tal que en la primera etapa i=2 produce:

y sabe que esto no le da ninguna señal.

()

*

q c

2

*

(

)

=

q

*

2

=

q c

2

B

*

q 2

Definiciones, notación y el concepto de equilibrio.

Nos vamos a limitar a la clase más sencilla posible de estos juegos: 2 jugadores, 2 periodos, el informado mueve en t=1 y el desinformado en t=2, después de observar lo jugado en t=1.

Definiciones:

1.

2.

3.

4.

Dos jugadores i = {I, D} (I de “Informado”, D de “desinformado”).

t I =θ o µ. I conoce su tipo, D no conoce el tipo de I. Sólo sabe, antes

de empezar el juego, que

Una estrategia de I es una acción para cada tipo que I puede tomar: S I * (t I ). Una estrategia de D es una acción de D para cada posible acción observada de I en el primer

periodo:

Secuencia: t = 1: cada tipo de I escoge una acción

t = 2 : D observa la acción de I, y usa esa señal para evaluar

. Es decir, podemos anticipar que en un equilibrio

este jugador escoge la estrategia que soluciona:

estrategia óptima dado

. Luego D escoge su

I puede ser de dos “tipos”

Pr

(t

I

)

= θ =

p

.

S S

D

I

*

(

)

S

I

(t I ).

Pr t

(

I

= θ | S

I

)

S y

I

Pr t

(

I

= θ | S

I

)

Max

= Pr

S

*

D

(

t

I

(

E U

=θ

D

|

(

S S

I

,

*

D

)

|

S

I

S

I

)

U

D

(

S S

I

,

)

*

D

,

t

I

=θ)+[

1

Pr

(

t

I

=θ

|

S

I

)]

U

D

(

S S

I

,

*

D

,

t

I

=µ)

El concepto de equilibrio empleado en este tipo de juegos es “Equilibrio Bayesiano Perfecto” (EBP).

Equilibrio Bayesiano Perfecto:

Una combinación de estrategias y probabilidades

Bayesiano Perfecto si:

(

S t

I

I

*

)

,

*

Luego de observar S I * , el jugador D calcula (

S I t I

() maximiza la utilidad de I cuando es de tipo t I

Pr t

I

Bayes (“actualización Bayesiana”).

() resuelve:

S D S I

*

*

(

S S

D

*

*

I

)

,

Pr t =θ S

I

(

*

I

) es un Equilibrio

(

t I

=θ

*

) y D juega S D

S

*

I

)

*

S (

I

t

I

)

()

*

S

I

.

siguiendo la regla de

( = ( =θ )(

Max

Pr

S

*

D

t

I

E U

D

(

S

|

S

*

I

*

D

,

U

S

D

*

I

)

S

)

S

*

I

|

*

D

,

S

*

I

,

t

I

Notas de clase de Teoría de Juegos - Marcela Eslava

=θ)+[( =θ

1

Pr

t

I

|

S

*

I

)]

U

D (

S

*

D

,

S

*

I

,

t

I

=µ)

42

Método de Solución:

1. Proponer una estrategia de equilibrio de I : S I

2. Inducción hacia atrás:

*

()

t

I

.

t=2:

i.

ii.

Se obtiene

(

Pr t

I

= θ | S

I

)

para cada posible S I

dada la estrategia S I

Se encuentra

*

(

S S

D

I

*

)

(

t

I

) propuesta.

que

Max

S

(

D E U

*

D

(

S

*

D

,

S

I

))

por actualización Bayesiana,

dada

(

Pr t

I

= θ | S

I

)

.

*

t=1: Dada la estrategia S D

(

S I * t I

()) encontrada para t=2, se verifica que S I () maximice

*

t I

la utilidad de I para cada posible tipo de I.

Ejemplo 5.2: Interacción laboral.

Una firma decide si contratar o no a un trabajador. El trabajador puede ser productivo o no, y a la firma sólo le conviene tenerlo si es productivo.

Productividad del trabajador η =


7 con probabilidad p.

(

3 con probabilidad 1- p

)

Si la firma contrata al trabajador, le tiene que pagar el salario del mercado, que es (w). Las ganancias de la firma están dadas por:

F

= y

()

η

- w =

7

3

w

w

Si

Si

η

η

= 7

= 3

, donde w es el salario de mercado y asumimos 3<w<7 (que es lo que captura que la firma sólo quiera contratar al trabajador si es productivo)

Antes de que la firma lo contrate, el trabajador puede decidir educarse o no. La educación no altera su productividad, pero le puede servir de señal sobre qué tan productivo es, ya que es posible que a los trabajadores más productivos se les facilite más educarse.

Por su parte, el trabajador escoge el nivel de educación e entre dos opciones posibles:

utilidad de trabajador está dada por:

U Trabajdor

=

(

w c e ,

)

si lo contratan

-

(

c e

η

,

)

η

si no

e =

e

0

.

La

donde c(e,η) es el costo de educarse, y asumimos que c(0,η)=0 (no educarse no tiene costo). Si a los trabajadores más productivos se les facilitara más educarse, esto sería capturado por c(e,η=7)< c(e,η=3).

Secuencia: t=1: el trabajador escoge entre e = e y e = 0, en t=2 la firma observa el ‘e’ que decidió el trabajador y decide si contratarlo o no.

43

Vamos a estudiar la posibilidad de que la educación sea una señal creíble de que el trabajador es productivo. El resultado básico que encontraremos es que, para que lo sea, es necesario que educarse sea suficientemente más costoso para alguien poco productivo que para un individuo productivo.

Notas de clase de Teoría de Juegos - Marcela Eslava

Solución:

Propondremos, por ejemplo, un equilibrio separador en el que el trabajador se educa si es productivo, y no se educa si no lo es. Este es un equilibrio en que la educación es señal efectiva de productividad, dado que alguien del tipo no productivo escoge no educarse. En forma más concisa:

S

*

T

() ()

η

= e

η

e

0

Si

Si

η

η

= 7

= 3

Inducción hacia atrás:

t=2: Evaluamos la estrategia que maximiza E

(

F

) si el T estuviera siguiendo la

*

S T

(η)

propuesta arriba. Empezamos por calcular Pr(η = 7 | e ) que sería racional si T está siguiendo

*

S T

(η) propuesto:

Pr(η = 7 | e = e )= 1

Pr(η = 3 | e = 0) = 0

Usted puede verificar que estas probabilidades condicionales cumplen con la regla de Bayes. Dadas estas probabilidades condicionales, debemos ahora evaluar cuál es la mejor respuesta de la firma (contratar o no contratar) a cada posible escogencia de educación del trabajador. Comparamos entonces la utilidad esperada de contratar con la de no contratar, dada la escogencia de educación del trabajador y las probabilidades condicionales encontradas arriba:

Si e e

=

:

E

(

∏ = e , contrata

F

(e

))

(

= Pr η

= 7 |

e

=

e

)(

7

w

)

+

Pr(η = 3 |

e

=

e

) ( 3

w

)

= 7 - w

E ((e = e, no contrata ))= 0

F

Si e

= 0 :

(

E

(

E

F

F

(

e

=

0,

contrata

))

= 3

w

(

e

=

0,

no contrata

))

= 0

Dado el supuesto de 7>w>3, esto implica la siguiente estrategia óptima para la firma dada la del trabajador:

S

*

F

()

e =

Contrata si e

=

e

No Contrata si e = 0

t=1: Dado S F * evaluamos qué es óptimo para el trabajador:

U

U

T

T

(

(

e

e =

=

)

,

0,

e

η

η

)

=

=

(

w c e

0

=

e

,

η

)

(

Escoge educarse si w c e e

>

=

,

η)

Entonces para que el equilibrio propuesto sea Equilibrio de Bayes-Nash se necesita:

w c (e = e,η= 7) y w c (e = e,η= 3)

Note por ejemplo, que esto implica que si w=5 y c (e = e,η = 7)= 3 , la existencia de este equilibrio

separador requiere que c (e = e,η = 3)> 5 . Es decir requerimos no sólo que educarse sea más costoso

Notas de clase de Teoría de Juegos - Marcela Eslava para un individuo poco productivo, sino que sea "suficientemente" menos costoso para un individuo poco productivo.

44

Ejemplo 5.3. Interacción laboral II – Equilibrio Agrupador.

Note que, dado el método de solución que utilizamos, en nuestro ejemplo anterior simplemente encontramos una combinación de estrategias que constituye un EBP, pero no podemos descartar la existencia de otros equilibrios. Por ejemplo, cabe preguntarse bajo qué condiciones la estrategia

agrupadora e (η = 7) = e (η = 3) = e es parte de un EBP. Note lo interesante de esta posibilidad: si existe un EBP con en el que el trabajador escoja estrategia, este sería un equilibrio en el que la educación no genera beneficios como señal de productividad (ya que ambos tipos escogen la misma acción), y sin embargo el trabajador asume el costo de educarse. Es decir, este sería un equilibrio no óptimo.

Empezamos entonces por proponer la estrategia agrupadora mencionada y reproducimos el procedimiento necesario para encontrar las condiciones bajo las cuales en efecto forma árte de un EBP.

Inducción hacia atrás:

(t = 2): Necesitamos saber cómo actúa una firma ante e = e y ante e=0

(

*

F

S

(e )) . Necesitamos entonces

⎞ ⎟ dado que el trabajador juega de acuerdo con la estrategia

propuesta. Como ambos tipos escogen la misma acción en la estrategia propuesta, esta acción no es reconocida por la firma como una señal informativa, por lo que la probabilidad condicional que asigna a que el trabajador sea altamente productivo es igual a la probabilidad incondicional:

⎛ η = 7 ⎞ encontrar P y ⎜ ⎟ P ⎝ e = e
η
= 7
encontrar
P
y
P
e = e
⎛ η = 7 ⎜ e = 0 ⎝
η
= 7
e = 0

P

⎛ η = 7 ⎞ ⎛ η = 3 ⎞ ⎜ ⎟= p , P
η
= 7
η
= 3
⎟= p , P ⎜
⎟= 1 − p
e
=
e
e
=
e

Ahora note: la estrategia propuesta no dice que el trabajador escoja 0 bajo ninguna circunstancia. Entonces, no da luces sobre cómo evaluar la probabilidad de que el trabajador sea productivo, si escogiera no educarse. Necesitamos entonces formular unas “creencias de fuera del equilibrio”: qué probabilidades condicionales asigna la firma si la acción que observa no forma parte del equilibrio propuesto. Estas "creencias" son ad-hoc, pero muy potentes para cambiar las decisiones óptimas, por lo que hay que formularlas de la forma más lógica posible.

Por ejemplo: ⎛ η = 7 P ⎜ e = 0 ⎝
Por ejemplo:
η
= 7
P
e = 0

⎟=

γ

Ahora queremos ver si la Firma contrata o o contrata:

⎛ η E ( U contrata e = ( , )) Pr ⎜ ( =
η
E
(
U contrata e =
(
,
))
Pr ⎜
(
= 7 ⎞ ⎟ 7
F
e
E
(
U
F (
no contrata e = 0
,
))
Si e = e , la firma contrata si:
p
( 7
w
)
+
(
1
p
)(
3
w
)
0
w
≤ 3 +
p
4

)

w + Pr

⎛ η ⎜ = 3 ⎟ ⎞ 3 − w ( ) e ⎝ ⎠
η
= 3 ⎟ ⎞ 3 − w
(
)
e

Notas de clase de Teoría de Juegos - Marcela Eslava Similarmente, si la firma observa e = 0 contrata al trabajador si w 3 + γ 4

45

¿Qué se necesita para que un trabajador escoja e sin importar su tipo? (es decir, para que la estrategia propuesta pueda formar parte de un EBP). Aunque aún no resolvemos el problema de los trabajadores,

podemos ya prever una condición necesaria para que e = e : Que e = 0 implique no contratación (de lo

contrario

equilibrio,

e = e

no

tiene

beneficios

y

sí costos).

Entonces

para

que

lo

propuesto sea

necesitamos establecer γ tal que óptima de la firma es:

γ

< w

-3

4 . Por ejemplo, asumamos γ=0. 6

S

*

F

No Contratar si e = 0

()

e = No contratar si e

e y wsi e = 0 ⎪ () e = No contratar si e ⎨ ⎪ ⎩ >

> 3 + 4

3 + 4

p

Contratar Si e e y w

=

p

Dado esto, la estrategia

*

t = 1: Dado S F (e) trabajador debe escoger si e = e o e = 0. Si educarse no implica ser contratado, el trabajador no se educará, pues estará asumiendo los costos sin recibir beneficios. Sabemos entonces que una nueva condición necesaria para permitir el equilibrio agrupador propuesto es w < 3 + 4p . Supongamos, entonces, que esta condición se cumple. El trabajador compara:

U

U

=

( e

(

e =

,

η

η

e

0,

)

)

=

=

(

,

w c e

0

η

)

Escoge

e

=

e

⇒ Escoge e = e ) > 0

)

> 0

si

(

w c e ,

si − ( w c e , η

η

Entonces,

una

condición

es

(dado que asumimos que educarse es más costoso para un trabajador poco

necesaria

y

suficiente

para

generar

el

equilibrio

propuesto

c (e,η = 3)w 3 + 4 p

productivo).

El siguiente conjunto de estrategias es entonces un Equilibrio Bayesiano Perfecto:

*

S T

S

*

F

() η { e ⎛ η = 7 ⎞ = = e ∀ η P
() η
{ e
η
= 7
=
=
e
η
P
⎟= p
e = e
⎧ Contrata si e = e
η
= 7
()
e =
P
⎟=
0
e = 0
No Contrata si e = 0

6 Note que esta es una escogencia ad-hoc, para permitir que lo propuesto sea estrategia de equilibrio. Esto es válido porque lo que estamos haciendo es precisamente buscar bajo qué condiciones la estrategia propuesta sí o no es parte de un equilibrio. En este punto, ya encontramos que si , entonces la estrategia propuesta no es de equilibrio, y necesitamos por tanto simplemente proseguir la búsqueda de condiciones que sí permiten un equilibrio de este tipo.