Está en la página 1de 69

Microeconomía II

TEORÍA DE JUEGOS: JUEGOS REPETIDOS

DANIEL ARAYA RÍOS


Juegos Repetidos
•En cada tema abordado en teoría de juegos hemos ajustado los
modelos para acercarnos mejor a la realidad.
•Primero nos restringimos sólo a juegos simultáneos para después
flexibilizar las reglas a juegos secuenciales (incluso mezclar ambo
juegos).
•A continuación nos incluiremos la posibilidad de que un juego se
juegue (valga la redundancia) de forma repetida.
•¿Por qué? Porque en la realidad gran parte de las veces los
jugadores deben someterse una y otra vez al mismo juego.
•Lo que estamos intentando hacer es acercarnos, paso a paso, a
juegos más reales.
Juegos Repetidos
En la vida real, las personas y las empresas suelen interactuar en
forma repetida, por lo que resulta lógico hacernos la siguiente
pregunta:
¿Cómo cambian nuestras decisiones en un ambiente
estratégico con juegos repetidos?
Cuando nos enfrentamos a un juego repetido, las decisiones de
hoy están influenciadas por la forma que se jugaron los juegos
en el pasado.
Por lo tanto, cuando escojamos una estrategia (como no
cooperar), debemos considerar que esa decisión tendrá un
impacto en las acciones del resto de los jugadores en el futuro.
Juegos Repetidos
Gran parte de los juegos analizados anteriormente en la
realidad se presentan como juegos repetidos:
•Guerra de precios
•Juego de la Gallina
•Cuantas vacas mandar a pastar
•Aportar en trabajos grupales
•Donde ir a una cita (batalla de los sexos)
•Desarrollar un nuevo producto o no
•Etc.
Juegos Repetidos
Formalmente, definiremos un juego repetido como un juego
donde los mismos jugadores se enfrentan al mismo juego una y
otra vez. El juego que se repite en cada periodo lo
denominaremos como juego de etapa.
Podemos distinguir entre dos tipos de juegos simultáneos:
•Repetición finita: Tienen una duración determinada (se conoce
el número de repeticiones del juego)
◦ Juegos con 1 Equilibrio de Nash
◦ Juegos con Múltiples Equilibrios de Nash
•Repetición Infinita: Tienen una duración indeterminada
◦ Juegos que se desarrollan a perpetuidad
◦ Juegos donde existe incertidumbre acerca del número de
repeticiones del juego.
Juegos Repetidos Finitos: 1 EN
Suponga el siguiente juego simultáneo de “Guerra de
precios” que estudiamos en juegos simultáneos
Farmacia 2
Precio Alto Precio Bajo
Farmacia

Precio Alto 100 , 100 60 , 105


1

Precio Bajo 105 , 60 75 , 75


Si el juego se desarrolla sólo una vez ¿Cuál es el o los
Equilibrios de Nash?
¿Qué ocurre si el juego se repite dos veces?
Juegos Repetidos Finitos: 1 EN
Periodo 1 Periodo 2
Farmacia 2 Farmacia 2
Precio Alto Precio Bajo Precio Alto Precio Bajo
Farmacia

Farmacia
Precio Alto 100 , 100 60 , 105 Precio Alto 100 , 100 60 , 105
1

1
Precio Bajo 105 , 60 75 , 75 Precio Bajo 105 , 60 75 , 75

•Un juego repetido se puede representar como un juego secuencial done el último
juego de etapa (periodo 2) corresponde a un subjuego del juego principal.
•Por lo tanto, el equilibrio en el último subjuego debe ser el EN en el juego de
etapa.
•¿Por qué? Porque después del último juego de etapa el juego se termina y no
existen incentivos a cooperar.
Juegos Repetidos Finitos: 1 EN
Periodo 1 Periodo 2
Farmacia 2 Farmacia 2
Precio Alto Precio Bajo Precio Alto Precio Bajo
Farmacia

Farmacia
Precio Alto 100 , 100 60 , 105 Precio Alto 100 , 100 60 , 105
1

1
Precio Bajo 105 , 60 75 , 75 Precio Bajo 105 , 60 75 , 75

•La intuición es que, dado que el juego terminará, no hay incentivos a crear reputación
en el último juego de etapa.
•Por lo tanto, en el segundo periodo cada jugador juego el Equilibrio de Nash.
•¿Y en el primer periodo?
•Los jugadores saben que en el segundo periodo se juega el EN del juego de etapa, por
lo tanto no tiene sentido cooperar en el primer periodo. Por lo tanto, en el primer
periodo también jugarán el EN.
Juegos Repetidos Finitos: 1 EN
•El mismo razonamiento es válido para juegos de 3, 4 o más etapas.
• En la etapa anterior al último juego de etapa no conviene cooperar, y en el
previo tampoco y así sucesivamente.

•En conclusión, en un juego repetido de horizonte finito y conocido,


donde existe un único equilibrio de Nash en el juego de etapa, el único
equilibrio perfecto en subjuegos es jugar el equilibrio de Nash del juego
de etapa en cada periodo.
•El resultado anterior se conoce como la paradoja de la cadena de
tiendas (chain store paradox)
• ¿Por qué es paradójico? Porque todos estarían mejor si cooperaran.
• Este resultado fue mostrado por Selten (1978), quien obtuvo el Premio
Nobel en 1994
Juegos Repetidos Finitos: 1 EN
Experimento
Juguemos una versión repetida del juego de la Galiina. Una cadena de
cines posee el monopolio en 10 ciudades y en cada una de estas
ciudades un competidos desea entrar.
En cada ciudad tenemos los siguientes pagos:
Cadena (monopolio)
Ciudad i Bajar precios Mantener precios
Entrante

Entrar -1 , 0 1,1
No entrar 0,1 0,3
¿Cuál es el (los) EN del juego simultáneo?
En la práctica el juego se juega de forma secuencial ¿Cuál es el ENPS del
juego de etapa?
Juegos Repetidos Finitos: 1 EN
Experimento
(-1,-0)

M
(1,1)
E
(0,1)

(0,3)

𝐸𝑁𝑃𝑆 = {𝐸𝑛𝑡𝑟𝑎𝑟; 𝐴𝑐𝑜𝑚𝑜𝑑𝑎𝑟, 𝐴𝑐𝑜𝑚𝑜𝑑𝑎𝑟}


Juegos Repetidos Finitos: 1 EN Ciudad i Cadena de Cines
Experimento Entrante
Entrar
Bajar Precios
-1 , 0
Mantener Precios
1,1
No Entrar 0,1 0,3

Ahora juguemos el juego en 10 ciudades: Ciudad Rival Cadena


◦ 1 Monopolista 1
◦ 10 potenciales competidores
2
¿Qué hará el entrante en la 1era ciudad? 3
¿Cómo responderá el monopolista? 4

¿Qué hará el entrante en la 2da ciudad? 5


6
¿Cómo responderá el monopolista?
7
¿Por qué actuaron de esta manera? 8
¿Qué predice el método de inducción hacia 9
atrás?
10
Juegos Repetidos Finitos: 1 EN
Experimento
Veamos que predice el método de Inducción hacia atrás:
•Firma 10: dado que el cadena no gana nada luchando contra esta última
empresa (le va mejor acomodándose en el juego secuencial) entonces
la empresa 10 elegirán entrar.
•Firma 9: si la cadena se acomoda en 10, tampoco gana nada luchando
contra 9.
•Firma 8: si se acomoda en 9 y 10, tampoco gana nada luchando con 8.
•Por inducción hacia atrás, cada entrante elige ENTRAR y la cadena
siempre elige Mantener Precios (Acomodarse)
•El incumbente no pelea en ningún mercado!!
Juegos Repetidos Finitos: 1 EN
Experimento
Este resultado es “ilógico” y por eso Selten lo denominó como una
paradoja.
◦ Deberíamos esperar que el monopolista quisiera crear una reputación para
desalentar la entrada de competidores.
◦ ¿Cómo podemos conciliar la Teoría con una intuición (relativamente
razonable) de que el monopolista quiera crear una reputación.

Una posible solución es introducir una probabilidad de que el


Monopolista sea irracional (pelee de todas maneras)
◦ Cada entrante tiene una creencia respecto a cual sería esa probabilidad
◦ Las creencias se van adaptando en función de los resultados observados.

Supongamos que el juego ocurre sólo una vez y existe una pequeña
probabilidad de que el Monopolista actúe como “loco” y siempre luchará
(bajará los precios).
Juegos Repetidos Finitos: 1 EN
Experimento

Pelea
M (−1,0)

E (0,1)
M
(0,3)
Naturaleza (0,1)
M
(0,3)
E
(0,1)
M
(0,3)
Juegos Repetidos Finitos: 1 EN
Experimento

•En este caso la decisión dependerá de la utilidad esperada


(supondremos que tiene preferencias VN-M):
𝐸 𝑈𝐸𝑛𝑡𝑟𝑎𝑟 = 0,01 −1 + 0,99 1 = 0,98
𝐸 𝑈𝑁𝑜 𝐸𝑛𝑡𝑟𝑎𝑟 = 0,01 0 + 0,99 0 = 0
•Por lo tanto el desafiante debiese elegir entrar.
•¿Pero que pasa si ahora volvemos a extender el juego a 10
ciudades (periodos)?
Juegos Repetidos Finitos: 1 EN
Experimento
Volvamos a la situación de 10 mercados:
Supongamos que todos los entrantes estiman que existe una probabilidad de
99% de que el Monopolista sea “normal”.
¿Qué decide el primer competidor potencial?
◦ La empresa decide ENTRAR
¿Cómo responde el Monopolista?
◦ ¡Sorpresa!, ¡el Monopolista pelea!
¿Qué ocurrirá en el segundo mercado?
◦ El potencial entrante acaba de ver que el monopolista pelea.
◦ ¿Debería seguir creyendo que existe una probabilidad de 99% de que sea
“normal”?
◦ Probablemente no
Juegos Repetidos Finitos: 1 EN
Experimento
•El cine desafiante de la ciudad 2 piensa:
• “Bueno, tal vez la probabilidad de que esté loco es un poco más. Pongámosle
un 30%.”
•Con un 30% de probabilidad de locura todavía le conviene entrar
𝐸 𝑈𝐸𝑛𝑡𝑟𝑎𝑟 = 0,3 −1 + 0,7 1 = 0,4 > 0
•Entonces, muy confiado, el cine desafiante de la ciudad 2 decide entrar
y…
•¡Sorpresa! (de nuevo), el Monopolista pelea nuevamente.
•Ahora el desafiante de la ciudad 3 lo piensa detenidamente:
• “Si el Monopolista está peleando en todos los mercados, casi con seguridad
está loco… digamos un 90%.”
•En este caso decide no entrar
𝐸 𝑈𝐸𝑛𝑡𝑟𝑎𝑟 = 0,9 −1 + 0,1 1 = −0,8 > 0
Juegos Repetidos Finitos: 1 EN
Experimento
•Lo mismo ocurrirá para todos los cines desafiantes de las ciudades 4 a
las 10.
•Este resultado ocurre porque la pequeña probabilidad de que el
Monopolista esté loco le permite a este construir una reputación que
mantiene a todos los potenciales competidores fuera.
•Sin embargo, esta argumentación tiene implicancias aún mas extremas.
•Supongamos que el Monopolista no está loco, pero sabe que los
desafiantes creen que puede estarlo (por supuestos iniciales).
•¿Qué le conviene hacer al Monopolista en este caso?
•Perfectamente podría actuar como si estuviera loco para hacer creer a
los competidores que está loco y peleará (y obtener mayores pagos).
Juegos Repetidos Finitos: 1 EN
Experimento
Al parecer, con este juego poder inferir lo siguiente:
•Conclusión: Si existe una pequeña posibilidad (p) de que un
jugador esté loco, entonces puede disuadir la entrada
comportándose como si estuviera loco aunque no lo
estuviera (porque nadie quiere enfrentarse a un loco).
•Consecuencia: Incluso si los primeros entrantes saben que
no está loco, no siempre entrarán, porque se dan cuenta
que “actuará como si estuviera loco”.
•Sin embargo, esta argumentación, aunque razonable, no es
exactamente correcta ¿Por qué?
Juegos Repetidos Finitos: 1 EN
Experimento
•Esta situación no puede ser considerada un equilibrio.
•Primer mercado: monopolista pelea
•Segunda mercado: monopolista pelea
•Dado que hay información completa, los desafiantes saben que al
Monopolista le conviene actuar como loco siempre, aunque no lo
esté.
•Por lo tanto lo que observamos en los primeros mercados
debería enseñarnos nada respecto a la probabilidad de que esté
loco.
•Décimo mercado: No hemos aprendido nada por lo que
deberíamos entrar de todas formas.
Juegos Repetidos Finitos: 1 EN
Experimento
•Por lo tanto las conclusiones anteriores no son del todo cierto.
•Bajo esa estrategia del Monopolista, la mejor respuesta de los
desafiantes es que nunca cambien sus creencias respecto a la
sanidad mental del Monopolista.
•Por lo tanto no deberían creer que está loco y todos deberían
entrar.
•Y como nadie le va a creer al monopolista, mejor se acomoda en
lugar de bajar los precios.
•Por lo tanto la estrategia de “siempre actuar como un loco” no es
un equilibrio (mejores respuestas no son iguales).
Juegos Repetidos Finitos: 1 EN
Experimento
•¿Entonces? ¿El único equilibrio es cuando se juega el EN el juego
de etapa?
•No. El equilibrio final de este juego involucra Estrategias Mixtas.
•Esto es, el Monopolista peleará como loco con una probabilidad
determinada. De vez en cuando peleará, pero no siempre.
•Podríamos decir que el equilibrio es cuando está un poco loco
(como la canción de Coco de Pixar).
Juegos Repetidos Finitos: 1 EN
Experimento

Conclusiones de Juegos repetidos finitos con 1 Equilibrio de Nash


(Ahora sí)
•Aún una pequeña probabilidad de que el Monopolista sea “loco”
hace los competidores no operen según el ENPS “ingenuo” (creer
que no está loco).
•La reputación es importante: En este contexto, la reputación está
asociada con comportarte como alguien que (verdaderamente)
no soy.
Juegos Repetidos Finitos: 1 EN
Experimento

Ejemplos de reputación:
Doctores: amigable y “le importan sus pacientes” (sólo a veces)
Universidades: Todas dicen ser de buena calidad (cuando solo lo
son a veces)
Políticos: Todos dicen ser honestos y nadie está comprado (sólo
algunos y nunca son “ellos”)
Profesores: Las pruebas son fáciles (pero no todas).
Caso: Convenio Marco para el
Control del Tabaco
El año 2003 la Organización Mundial de la Salud
creo el Convenio Marco para el Control del
Tabaco.
Al 2017, 121 países han tomado alguna política
para reducir el consumo de tabaco propuesta
en el CMCT.
Eso significa que cada vez que una de estas
leyes está por ser aprobada, la industria realiza
algún tipo de amenaza (además del lobby).

Caso: Convenio Marco para el
Control del Tabaco
La estrategia de jugar para que piensen que
uno esta “loco” es una exageración para
demostrar un punto.
Basta con jugar una estrategia para crear la
reputación de que uno es un jugador
estratégico.
Esto es, que los otros jugadores sepan que uno
sabe que tiene que jugar de forma estratégica.
Que sepan que en algún punto estarían
dispuestos a cerrar una planta de fabricación
(aunque nunca lo han hecho…)
Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
¿Podemos concluir lo mismo si el juego de etapa tiene mas
de un equilibrio de Nash?
No, el resultado anterior se daba porque los jugadores no
tenían dos equilibrios para elegir, por lo tanto su decisión
final era bastante simple.
En tales casos la reputación tiene un papel más importante
que con solo un equilibrio de Nash en el juego de etapa.
Jugador 2
Consideremos el siguiente juego: I C D

Jugador 1 4,3 0,0 1,4


A

B 0,0 2,1 0,0


Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
En el juego de etapa existen dos EN: (A,D) y (B,C)
Si el juego se repite dos veces ¿Es posible llegar a un acuerdo
donde se juegue (A,I)?
Podemos notar que existen algunos equilibrios (ENPS) donde
los jugadores acuerdan no jugar un EN en el primer periodo.
Intuición: La existencia de múltiples
equilibrios permite utilizar alguno Jugador 2
de ellos como castigo a quien se I C D
desvíe del acuerdo (A,I)
Jugador 1 4,3 0,0 1,4
A

B 0,0 2,1 0,0


Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
Consideremos el siguiente acuerdo:
1.Elegir (A,I) en el primer periodo
2.Si el jugador 2 no se desvía de I, elegir (A,D) en el segundo periodo.
3.Si el jugador 2 se desvía jugando C o D en el primer periodo, jugar
(B,C) en el segundo periodo
¿Tiene algún jugador incentivos a desviarse?
El jugador 1 nunca se quiere desviar (es su
mayor pago posible) Jugador 2
En cambio, el jugador dos podría querer I C D

Jugador 1
desviarse para obtener 4 (jugando D)
A 4,3 0,0 1,4
¿Le conviene?
B 0,0 2,1 0,0
Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
•Si cumplen el acuerdo:
• Jugador 1 gana 4 + 1 = 5
• Jugador 2 gana 3 + 4 = 7 Por lo tanto, si bien tiene
•Si se desvían incentivos a desviarse en
el primer juego de etapa,
• Jugador 1 no quiere
sus pagos finales serian
desviarse
peores.
• Jugador 2 gana 4 + 1 = 5 Jugador 2
I C D

Jugador 1 4,3 0,0 1,4


A

B 0,0 2,1 0,0


Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
En juegos repetidos finitamente con múltiples EN en el
juego de etapa, y donde los EN tienen pagos diferentes
ocurre que:
1. Uno de los equilibrios de Nash se juega en el último periodo.
2. Pueden existir equilibrios donde, en periodos anteriores al
último periodo, el resultado del juego de etapa no sea uno de
los equilibrios de Nash.

En tal caso, tenemos un equilibrio reputacional.


Intuición: es posible castigar a un jugador por desviarse en
el penúltimo periodo especificando que si no se desvía
jugarás el EN “bueno”, pero si se desvía jugarás el EN “malo”
para él y “bueno” para ti mismo.
Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash Jugador 2
D E F
A 5,5 9,0 1,1
Jugador 1 B 0,9 7,7 1,1
C 1,1 1,1 2,2

a) Encuentre el o los EN en el juego de Etapa.


b) Si el juego se repite dos periodos y suponiendo que un peso hoy
vale lo mismo que un peso mañana, muestre si es factible cooperar
en alguno de los dos periodos. ¿Cuál sería un acuerdo cooperativo?
Muestre que los jugadores no quieren desviarse de dicho acuerdo. Si
no es posible un acuerdo explique las razones de ello.
c) ¿Puede ocurrir que en ambos periodos cooperen? Explique su
respuesta.
d) Suponga ahora que ambos jugadores tienen un factor de descuento
0<δ<1, ¿que valores de δ permitirían la cooperación?
Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
•Acuerdo:
• Jugar (B,E) en la primera etapa.
• Si el otro jugador cumple el acuerdo de la primera etapa, jugar (C,F)
en la etapa final.
• Si el otro jugador no cumple (se desvía) en la primera etapa, jugar
(A,D) en la etapa final.
•De esta manera, cada jugador compara la siguiente desigualdad:
𝜋𝐶𝑜𝑜𝑝𝑒𝑟𝑎𝑟 > 𝜋𝑁𝑜 𝐶𝑜𝑜𝑝𝑒𝑟𝑎𝑟
7 + 𝑝𝑟𝑒𝑚𝑖𝑜 > 9 + 𝑐𝑎𝑠𝑡𝑖𝑔𝑜
7+5> 9+2
12 > 11
•Por lo tanto si es posible lograr un acuerdo para cooperar el
penúltimo periodo
Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
•¿Puede ocurrir que en ambos periodos cooperen?
• No, dado que el juego es repetido un número finito de veces, en la
última etapa SIEMPRE se debe jugar un EN.
• Como (B;E) no es EN, esto no podría jugarse en la última etapa.
• Sin embargo, si puede ser parte de ENPS en la penúltima etapa.
•Suponga ahora que ambos jugadores tienen un factor de
descuento 0 < 𝛿 < 1 ¿Qué valores de 𝛿 permitirían la
cooperación?
𝜋𝐶𝑜𝑜𝑝𝑒𝑟𝑎𝑟 > 𝜋𝑁𝑜 𝐶𝑜𝑜𝑝𝑒𝑟𝑎𝑟
7 + 5𝛿 > 9 + 2𝛿
5𝛿 − 2𝛿 > 9 − 7
2
𝛿>
3
Juegos Repetidos Finitos: Múltiples
Equilibrios de Nash
2
•¿Qué significa que 𝛿 > para que pueda existir cooperación?
3
•Si recordamos la decisión de las personas a través del tiempo, el
𝛿 representa la paciencia. Esto es, a mayor 𝛿, más paciente es la
persona.
2
•En este caso, si 𝛿 > , los jugadores serían muy pacientes y el
3
castigo futuro los afectaría lo suficiente para querer cooperar
2
•Por otro lado, si 𝛿 < , los jugadores serían más impacientes y el
3
castigo futuro no les importaría tanto como la recompensa de
hoy.
¿Por qué pudieron
cooperar? ¿Cuáles eran
los beneficios? ¿Cuáles
eran los castigos? ¿Qué
era “desviarse”?
Juegos Repetido: Repetición infinita
•Juegos Infinitos: Si bien a primera vista el supuesto de
repetición infinita puede parecer absurdo (nadie vive para
siempre), tiene mucho sentido si consideramos el hecho
que, en muchos casos, no existe certeza acerca de cuantos
periodos durará el juego.
•Ejemplo:
• Empresas (países) tienen incertidumbre de cuando
terminará la guerra de precios.
• Tabacaleras tienen incertidumbre de cuantas veces más
un país querrá implementar leyes para el control del
consumo de tabaco.
Juegos Repetido: Repetición infinita

•Si existe incertidumbre acerca de la fecha de término de un


juego, no podemos usar inducción hacia atrás (¡porque no
hay un final del juego!).

•Sin embargo estos juegos si pueden ser resueltos y


encontraremos que es posible alcanzar equilibrios perfectos
en subjuegos en los que ninguno de los resultados
corresponde a un equilibrio de juegos de etapa.
Nota: Series infinitas y valor presente
Recordemos el valor del dinero en el tiempo de un flujo de pagos
futuros.
𝑁

𝑉𝑃 = ෍ 𝛿 𝑖 = 𝛿 0 + 𝛿 1 + 𝛿 2 + ⋯ + 𝛿 𝑁
𝑖=0

Si es que repetimos al infinito:


𝑉𝑃 = ෍ 𝛿 𝑖 = 𝛿 0 + 𝛿 1 + 𝛿 2 + ⋯
𝑖=0
¿Cómo resolvemos esto?
Nota: Series infinitas y valor presente
Podemos reescribir:
𝑉𝑃 = 𝛿 0 + 𝛿 1 + 𝛿 2 + ⋯

Como
𝑉𝑃 = 1 + 𝛿 1 + 𝛿 2 + ⋯
𝑉𝑃 = 1 + 𝛿 1 + 𝛿 1 + 𝛿 2 + ⋯
𝑉𝑃 = 1 + 𝛿𝑉𝑃
𝑉𝑃 − 𝛿𝑉𝑃 = 1
𝑉𝑃 1 − 𝛿 = 1
1
𝑉𝑃 =
1−𝛿
Nota: Series infinitas y valor presente
Por lo tanto sabemos que unas serie de la forma
𝑉𝑃 = 1 + 𝛿 1 + 𝛿 2 + ⋯

Es igual a
1
𝑉𝑃 = 1 + 𝛿 1 + 𝛿 2 + ⋯ =
1−𝛿

Y por lo tanto, si el monto pagado es X (𝑉𝑃 = 𝑋 + 𝑋𝛿 1 + 𝑋𝛿 2 + ⋯ )


1 2
𝑋
𝑉𝑃 = 𝑋[1 + 𝛿 + 𝛿 + ⋯ ] =
1−𝛿
Juegos Repetido: Repetición infinita
Supongamos que el mismo juego de guerra de precios se juega
infinitamente. Farmacia 2
Farmacia Precio Alto Precio Bajo
1 Precio Alto 100 , 100 60 , 105
Precio Bajo 105 , 60 75 , 75

¿Qué estrategias pueden usar los jugadores para alcanzar un resultado


mejor que el EN de el juego de etapa?
Las estrategias en un juego infinito pueden volverse infinitamente
complicadas, pero nos centraremos en algunos que tienen la siguiente
forma:
• Coopero si tu cooperas
• Si te desvías, te castigo.
Juegos Repetido: Repetición infinita
•Cooperación: Conjunto de estrategias que maximizan la suma de pagos
para ambos jugadores (o entrega pagos mayores que el EN del juego de
etapa).
•Castigo: Acción que lleva al Equilibrio de Nash.
Utilizando estas dos “estrategias base” nos centraremos en dos
estrategias relativamente simples:
•Estrategia Gatillo (trigger): El jugador i coopera mientras el otro jugador
lo haga. Si el otro jugador no coopera (se desvía) en un periodo, el
jugador i jugará el castigo a perpetuidad.
•Estrategia Ojo por Ojo (tit for tat):
• Cooperar si el otro jugador cooperó el periodo anterior.
• No cooperar si el otro jugador no cooperó en el periodo anterior
Juegos Repetido: Repetición infinita
Pagos: Farmacia 2
Precio Alto Precio Bajo
•Cooperación: (100, 100)

Farmacia
Precio Alto 100 , 100 60 , 105
•Castigo: (75, 75)

1
Precio Bajo 105 , 60 75 , 75
En estrategia Gatillo:
•Si coopera:
100
𝑉𝑃𝑐𝑜𝑜𝑝 = 100 + 100𝛿 + 100𝛿 2 +⋯=
1−𝛿
•Si se desvía:
𝑉𝑃𝐷𝑒𝑠𝑣 = 105 + 75𝛿 + 75𝛿 2 + ⋯ = 105 + 75𝛿 1 + 𝛿 + 𝛿 2 + ⋯ =
75𝛿
𝑉𝑃𝐷𝑒𝑠𝑣 = 105 +
1−𝛿
Juegos Repetido: Repetición infinita
Entonces cooperar es mejor respuesta si:
𝑉𝑃𝐶𝑜𝑜𝑝 > 𝑉𝑃𝐷𝑒𝑠𝑣
100 75𝛿
> 105 +
1−𝛿 1−𝛿
100 > 105 1 − 𝛿 + 75𝛿
1
𝛿 > ≈ 0,16
6
•Por lo tanto, el equilibrio cooperativo es sostenible si 𝛿 > 0,16

•La estrategia gatillo puede aplicarse a cualquier dilema del prisionero,


pero el factor de descuento mínimo depende de los pagos del juego de
etapa.
Juegos Repetido: Repetición infinita
Pagos: Farmacia 2
Precio Alto Precio Bajo
•Cooperación: (100, 100)

Farmacia
Precio Alto 100 , 100 60 , 105
•Castigo: (75, 75)

1
Precio Bajo 105 , 60 75 , 75
En estrategia Ojo por ojo:
•Periodo 1: jugador 1 se desvía (jugador 2 coopera)
•Periodo 2: jugador 1 coopera (jugador 2 no coopera)
• (Jugador 2 no coopera porque jugador 1 no cooperó en el primer periodo)

•Periodo 3: jugador 1 coopera (jugador 2 coopera)


• (Jugador 2 coopera ya que jugador 1 cooperó en periodo anterior)
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Repetición infinita


•Si coopera:
100
𝑉𝑃𝑐𝑜𝑜𝑝 = 100 + 100𝛿 + 100𝛿 2 +⋯=
1−𝛿
•Si se desvía:
𝑉𝑃𝐷𝑒𝑠𝑣 = 105 + 60𝛿 + 100𝛿 2 + 100𝛿 3 + ⋯
𝑉𝑃𝐷𝑒𝑠𝑣 = 105 + 60𝛿 + 100𝛿 2 1 + 𝛿 + 𝛿 2 + ⋯
100𝛿 2
𝑉𝑃𝐷𝑒𝑠𝑣 = 105 + 60𝛿 +
1−𝛿
Por lo tanto coopera si:
100 100𝛿 2
> 105 + 60𝛿 +
1−𝛿 1−𝛿
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Repetición infinita


100 100𝛿 2
> 105 + 60𝛿 +
1−𝛿 1−𝛿
100 100𝛿 2
− > 105 + 60𝛿
1−𝛿 1−𝛿
100 1 − 𝛿 2
> 105 + 60𝛿
1−𝛿
100 1 + 𝛿 1 − 𝛿
> 105 + 60𝛿
1−𝛿
100 1 + 𝛿 > 105 + 60𝛿
1
𝛿> = 0,125
8
•Por lo tanto, el equilibrio cooperativo bajo estrategia ojo por ojo, es
sostenible si 𝛿 > 0,125
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Repetición infinita


•Gatillo y Ojo por Ojo son 2 extremos
•Hay 2 objetivos contrapuestos:
•Castigo debe ser lo suficientemente fuerte como para
mantener la cooperación: Gatillo
•Desde la perspectiva de quien castiga, es mejor que el
castigo sea lo menor posible: Quien castiga también es
castigado: Ojo por Ojo
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Repetición infinita


•R. Axelrod organizo un torneo donde un dilema del
prisionero se repite 200 veces.
•Un gran numero de economistas propuso estrategias
•Ganadora: Ojo por Ojo
•La estrategia Ojo por Ojo es:
• Simple (total claridad)
• Bondadosa (nunca ataca primero ni busca el enfrentamiento)
• “Provocable” (nunca deja ofensa sin castigo)
• Indulgente (no es rencorosa, olvida rápido)
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Teorema de Folk


•Los equilibrios con estrategia gatillo u ojo por ojo no son los únicos
equilibrios posibles en este juego
•Otro equilibrio posible es jugar el equilibrio de Nash en cada etapa.
•Enumerar todos los posibles equilibrios es imposible (porque son
prácticamente infinitos), pero podemos encontrar algunas propiedades
interesantes
•Para esto definamos primero el pago promedio por periodo de un flujo
infinito:
𝑉𝑃 = (1 − 𝛿)𝑉𝑃
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Teorema de Folk


Conjunto de pagos promedio posibles
(conjunto convexo)

Folk Theorem (Friedman 1971):


cualquier pago promedio dentro de la
región de pagos promedios posibles que
sea mayor al pago promedio del
equilibrio de Nash del juego de etapa,
puede ser sostenido como un ENPS, en
el juego infinitamente repetido, si es
que los jugadores son lo
suficientemente pacientes (los factores
de descuento son lo suficientemente
cercanos a uno)
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Teorema de Folk


•Por ejemplo, supongamos la estrategia jugar (Precio Alto, Precio Alto) y
(Precio Alto, Precio Bajo) alternadamente de forma infinita. Si uno se
desvía (en específico el jugador 2) se castiga con estrategia gatillo (se
juega el EN a perpetuidad).
•Los pagos del jugador 1 serían:
𝑉𝑃1 = 100 + 105𝛿 + 100𝛿 2 + 105𝛿 3 + ⋯
𝑉𝑃1 = 100 1 + 𝛿 2 + 𝛿 4 + ⋯ + 105𝛿 1 + 𝛿 2 + 𝛿 4 + ⋯
100 105𝛿
𝑉𝑃1 = +
1 − 𝛿2 1 − 𝛿2
100 + 105𝛿 100 + 105𝛿
𝑉𝑃1 = =
1 − 𝛿2 (1 + 𝛿)(1 − 𝛿)
100+105𝛿
Por lo tanto, el pago promedio del jugador 1 es igual a 𝑉𝑃1 =
(1+𝛿)
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Teorema de Folk


•De forma análoga, el pago promedio para el jugador 2 es:
100 + 60𝛿
𝑉𝑃2 =
(1 + 𝛿)

Luego, si el jugador 2 se desvía cuanto toca jugar (Precio Alto, Precio Alto)
jugando (Precio Alto, Precio Bajo), tiene pagos promedios de:
𝑉𝑃′2 = 105 + 75𝛿 + 75𝛿 2 + 75𝛿 3 + ⋯
75𝛿
𝑉𝑃′2 = 105 +
1−𝛿
𝑉𝑃′2 = 105 1 − 𝛿 + 75𝛿
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Teorema de Folk


•Si los jugadores son lo suficientemente pacientes (𝛿 cercano a 1) ¿Es esa
estrategia un ENPS?
100 + 105𝛿
𝑉𝑃1 = = 102,5
(1 + 𝛿)
100 + 60𝛿
𝑉𝑃2 = = 80
(1 + 𝛿)
𝑉𝑃′2 = 105 1 − 𝛿 + 75𝛿 = 75

Para el jugador 2 el pago promedio de cooperar es mayor que el de


desviarse, por lo tanto decide cooperar y esta estrategia es un ENPS.
Farmacia 2
Precio Alto Precio Bajo

Farmacia
Precio Alto 100 , 100 60 , 105

1
Precio Bajo 105 , 60 75 , 75

Juegos Repetido: Teorema de Folk

Podemos notar que el punto con los


pagos promedios (102,5 , 80) está
dentro del conjunto de posibles ENPS
del teorema de Folk. (102,5 , 80)
Juegos Repetidos: Conclusiones
¿Es posible la cooperación?
◦ Juegos Repetidos en forma Finita con un equilibrio de Nash: cooperación no
es posible (utilizando estrategias puras)
◦ Juegos Repetidos en forma Finita con múltiples equilibrios de Nash:
cooperación es posible
◦ Juegos con Repetición Infinita: dependiendo de 𝛿, casi todo es posible

¿Qué factores favorecen la cooperación?


◦ Altos factores de descuento y altas probabilidades de continuación del juego.
◦ Bajas ganancias netas por desviarse de la cooperación.
◦ Altas ganancias individuales cuando todos los jugadores cooperan (o bajas
ganancias individuales cuando todos no cooperan)
Aplicación: Política Comercial
•En el caso de relaciones entre países, las soluciones a los
problemas de cooperación basadas en contratos son
difíciles de llevar a la practica.
•En el caso de los aranceles, si bien un equilibrio con
aranceles bajos es óptimo para un conjunto de países,
existen incentivos individuales a subirlos.
•Aranceles bajos no es siempre un equilibrio de Nash ¿Por
qué? Porque si el otro no me pone aranceles a mi me podría
convenir ponerlos. Es un juego tipo Dilema del prisionero.
•¿Cómo evitar el equilibrio con aranceles altos?
Aplicación: Política Comercial
Organización Mundial de Comercio (OMC): Países asumen
compromisos con respecto a su política arancelaria
◦ Idea clave: Reciprocidad.
◦ Frente a un cambio en la política arancelaria de un país, los países
afectados pueden responder aumentando los aranceles para ese
país: Estrategia de Castigo.
◦ La OMC favorece soluciones del tipo Ojo por Ojo más que el uso de
estrategias tipo Gatillo.

La interacción repetida genera cooperación, aun en


ausencia de un contrato entre las partes (la interacción
repetida es un mecanismo para sustentar la credibilidad).
Juegos Repetidos: Ejercicio
Hay 2 empresas de pulpa de papel (un insumo para producir, por
ejemplo papel higiénico). En cada periodo las empresas pueden invertir
en tecnología que permite reducir la contaminación de sus procesos
productivos (principalmente de la contaminación que vierte en cursos
de agua), lo cual aumenta sus costos. Los beneficios de las empresas en
este juego son los siguientes:
Empresa 2
No Contaminar Contaminar
No Contaminar 200 ; 200 100 ; 280
Empresa 1
Contaminar 220 ; 100 150 ; 150

Ambas empresas tienen un factor de descuento 𝛿1 , 𝛿2 , donde 0 <


1
𝛿1 , 𝛿2 < 1. Donde 𝛿𝑖 = y 𝑟𝑖 es la tasa de costo de oportunidad
1+𝑟𝑖
para la empresa 𝑖.
Empresa 2
No Contaminar Contaminar
No Contaminar 200 ; 200 100 ; 280
Empresa 1
Contaminar 220 ; 100 150 ; 150

Juegos Repetidos: Ejercicio


1.Suponga que este juego se repite infinitamente y que ambas empresas
aplican una estrategia gatillo, determine bajo qué condiciones será
posible que el equilibrio del mercado sea uno donde ambas empresas
invierten en tecnología descontaminante.
2.Suponga que ambas empresas tienen un factor de descuento igual a
0,4. Usando la información de la pregunta anterior indique cual será el
equilibrio si el juego se repite infinitamente.
3.Suponga ahora que la empresa 2 aplica una estrategia ojo por ojo (tit-
for-tat) (la empresa 1 sigue jugando gatillo) determine bajo qué
condiciones será posible que la empresa 1 invierta en tecnología
descontaminante. ¿Cooperarán las dos empresas?
Juegos Repetidos: Ejercicio
Empresa 1 (dado que la otra utiliza gatillo):
𝑉𝑃𝐶𝑜𝑜𝑝 ≥ 𝑉𝑃𝐷𝑒𝑠𝑣
200 + 200𝛿1 + 200𝛿12 + 200𝛿13 + ⋯
≥ 220 + 150𝛿1 + 150𝛿12 + 150𝛿13 + ⋯

200 150𝛿1
≥ 220 +
1−𝛿1 1−𝛿1

𝛿1 ≥ 220−200
220−150
= 0,286
Juegos Repetidos: Ejercicio
Empresa 2 (dado que la otra utiliza gatillo):
𝑉𝑃𝐶𝑜𝑜𝑝 ≥ 𝑉𝑃𝐷𝑒𝑠𝑣
200 + 200𝛿2 + 200𝛿22 + 200𝛿23 + ⋯
≥ 280 + 150𝛿2 + 150𝛿22 + 150𝛿23 + ⋯
200 150𝛿2
≥ 280 +
1 − 𝛿2 1 − 𝛿2
𝛿2 ≥ 280−200
280−150
= 0,615
Juegos Repetidos: Ejercicio
2.Dado que ambos factores de descuento son 0,4 y que para
la cooperación se requiere que:
𝛿1 ≥ 0,286 y 𝛿2 ≥ 0,615

Entonces sólo la empresa 1 coopera por lo que el


equilibrio del mercado será que ambos no cooperan. Esto
porque basta con que 1 decida cooperar una vez para
notar que a 2 no le conviene cooperar. Y además hay
información completa.
Juegos Repetidos: Ejercicio
3.Empresa 1 (dado que la otra utiliza ojo por ojo):
𝑉𝑃𝐶𝑜𝑜𝑝 ≥ 𝑉𝑃𝐷𝑒𝑠𝑣
200 + 200𝛿1 + 200𝛿12 + 200𝛿13 + ⋯
≥ 220 + 100𝛿1 + 200𝛿12 + 200𝛿13 + ⋯
200 200𝛿12
≥ 220 + 100𝛿1 +
1−𝛿1 1−𝛿1

𝛿1 ≥ 220−200
200−100
= 0,2

Ante tal estrategia de la empresa 2, y suponiendo los mismos


factores de descuento de la pregunta anterior, la empresa 1 si
cooperaría.
Empresa 2
No Contaminar Contaminar
No Contaminar 200 ; 200 100 ; 280
Empresa 1
Contaminar 220 ; 100 150 ; 150

Juegos Repetidos: Ejercicio


4.Discuta que cree que sucederá con la posibilidad de cooperación en este
mercado si los consumidores incrementan su valoración porque todas las
empresas del mercado tengan tecnologías más limpias (es decir aumenten los
pagos cuando ambas invierten). Explique su resultado usando los elementos
descritos en este problema.
Juegos Repetidos: Ejercicio
Considere un juego repetido infinitamente con tasa de descuento 𝛿
donde el juego de etapa es el siguiente:
Jugador 2
L C R
U 5 , 5 2 , 7 -5 , 3
Jugador 1

M 7 , 2 3 , 3 -6 , 0
L 3 , -5 0 , -6 -7 , -7
1. Muestre bajo qué condiciones (factor de descuento) existe
cooperación si ambos jugadores están utilizando estrategia gatillo.
2. Muestre bajo qué condiciones (factor de descuento) existe
cooperación si ambos jugadores están utilizando estrategia ojo por
ojo.

También podría gustarte