Está en la página 1de 19

Microeconomía II

CLASE 16-03

Unidad n°1
Juegos estáticos con información completa
Los jugadores forman decisiones simultáneamente, reciben sus ganancias que dependen de la combinación de acciones que
acaban de elegir. Son juegos con información completa, la función de ganancias de cada jugador es conocida por los
jugadores.

LA REPRESENTACIÓN DE LOS JUEGOS EN FORMA NORMAL.


Cada jugador elige de forma simultánea una estrategia, y la combinación de las estrategias elegidas por los jugadores
determina la ganancia de cada jugador.
Un juego en la representación en forma normal tiene 3 componentes:
- Jugadores i ∈ {1, …, I}
- Estrategias si ∈ Si
- Pagos: Son una función de utilidad Ui (Si, S-i) Comentado [CM1]: Todo lo que no es i.

Ejemplo: El dilema de los prisioneros

Conflicto entre lo que es socialmente conveniente e individualmente conveniente. Los pagos del jugador indican su
comportamiento. Socialmente conviene que los dos callen, el comportamiento va en contra de lo social. Cada jugador
cuenta con dos estrategias: confesar o no confesar. Cada uno elige la acción a seguir sin conocer la del otro.

ELIMINACIÓN ITERATIVA DE ESTRATEGIAS ESTRICTAMENTE DOMINADAS


Es una forma de resolver un problema de teoría de juegos.

En el juego en forma normal G = {S1,..., Sn; U1,...,Un}, sean si´; y si´´; posibles estrategias del jugador i (si´ y si´´ son elementos
de Si). La estrategia si´ está estrictamente dominada por la estrategia si´´ si para cada combinación posible de las estrategias
de los restantes jugadores, la ganancia de i por utilizar si´ es estrictamente menor que la ganancia de i por utilizar si´´.

Para un jugador una estrategia es mejor que otra sin importar que haga el otro. Ningún jugador racional usaría una estrategia
estrictamente dominada, porque no importa que haga el otro, esta nunca va a ser óptima.

1
ELIMINACIÓN ITERATIVA DE ESTRATEGIAS (ALGORITMO DE SOLUCIÓN):
Si queremos ser capaces de aplicar el proceso para un número arbitrario de pasos, necesitamos suponer que es información
del dominio público que los jugadores son racionales. Esto es, necesitamos suponer no sólo que todos los jugadores son
racionales, sino también que todos los jugadores saben que todos los jugadores son racionales, y que todos los jugadores
saben que todos los jugadores saben que todos los jugadores son racionales, y así ad infinitum (conocimiento común de la
racionalidad).

Juego Eliminamos
reducido EED.
Si hay
Buscar si hay EED
Mecanismo no
No hay funciona

EQUILIBRIO DE NASH:
 Existe al menos un equilibrio de Nash si el juego es finito y las funciones de pago son continuas.
 Si la teoría de juegos ofrece una solución única a un determinado problema, esta solución debe ser un equilibrio
de Nash. La estrategia predicha de cada jugador, debe ser la mejor respuesta de cada jugador a las estrategias
predichas de los otros jugadores. Tal predicción puede denominarse estratégicamente estable o self-enforcing,
puesto que ningún jugador va a querer desviarse de la estrategia predicha para él.
 En cada circunstancia cada jugador está tomando una decisión óptima, lo que hace cada jugador en el equilibrio
de Nash es óptimo. No hay desviaciones unilaterales beneficiosas, no conviene moverse del equilibrio, no
quieren moverse individualmente.

 Para cada jugador y para cada estrategia posible con la que cuenta cada jugador se determina la mejor
respuesta del otro jugador a esa estrategia. Un par de estrategias satisface la condición (EN) si la estrategia de
cada jugador es la mejor respuesta a la del otro, es decir, si ambas ganancias están subrayadas en la casilla
correspondiente de la matriz binaria.
 No tiene que ver con la eficiencia económica. Pueden ser ineficientes en términos de Pareto, debido a que en
ciertas circunstancias si se puede estar mejor, un equilibrio puede ser mejor que otro.
 Es una convención social estable. Se puede haber producido un acuerdo entre las partes. Si se llega a un acuerdo
sobre cómo comportarse en un juego, las estrategias establecidas en el acuerdo deben ser un equilibrio de
Nash.
 Un juego puede tener múltiples equilibrios de Nash.
 Como un punto fijo. S* es un perfil de estrategias que satisface la siguiente condición: S* ∈ B(S*) donde B(S*)
es la correspondencia mejor respuesta, es decir, es mejor que a cada jugador

2
DUOPOLIO DE COURNOT

Para poder encontrar el equilibrio de Nash en Cournot, primero tenemos que traducir el problema del juego en forma
normal:

 Jugadores: 2 empresas
 Estrategias: Distintas cantidades que pueden producir. Si = [0; ∞), qi ≥ 0. Como P(Q) = 0 para Q ≥ a ninguna
empresa producirá una cantidad mayor a “a”.
 Ganancias: Son los beneficios de la empresa.

Maximizamos el beneficio con las CPO (derivamos) y llegamos a:

Otro modo de hallar el Equilibrio de Nash en Cournot:

3
La repetición de estos argumentos conduce a: qi = (a - c)/3.

Nunca es una respuesta mejor para la empresa i producir más que la cantidad de monopolio qm = (a - c)/2.

Cuando hay más de dos empresas, la eliminación iterativa de las estrategias estrictamente dominadas ofrece sólo la
predicción imprecisa de que la cantidad de cada empresa no excederá a la cantidad de monopolio.

Podemos aplicar
Kuhn-Tucker para
resolver.

4
ESTRATEGIAS MIXTAS:
Ejemplo:

El espacio de estrategias de cada jugador es {Cara; Cruz}. Si cada jugador muestra su


moneda y las caras coinciden, el J2 gana la moneda del J1, si no coinciden al revés.

No hay ni EED ni Equilibrio de Nash. Hay desviación unilateral beneficiosa en cada


celda.

El rasgo distintivo de este juego es que a cada jugador le gustaría adivinar la Jugada
del otro y que el otro no adivinase la suya. La solución del juego incluye necesariamente un elemento de incertidumbre
sobre lo que harán los demás jugadores.

Estrategia mixta: Es una distribución de probabilidad que asigna probabilidades a las estrategias puras.Interpretamos en
términos de la incertidumbre de un jugador respecto a lo que otro jugador hará. Para el jugador i una estrategia mixta es
una distribución de probabilidad sobre (algunas o todas) las estrategias en Si' De aquí en adelante nos referiremos a las
estrategias en Si como estrategias puras del jugador i.

Una estrategia mixta para el jugador “i” es la distribución de probabilidad (q, 1 - q), donde “q” es la probabilidad de elegir
cara, “1 – q” es la probabilidad de elegir cruz, y 0 ≤ q ≤ 1. La estrategia mixta (0,1) es simplemente la estrategia pura cruz;
del mismo modo, la estrategia mixta (1,0) es la estrategia pura cara. Las estrategias puras de un jugador son simplemente
los casos límite de sus estrategias mixtas.

Una estrategia pura puede estar estrictamente dominada por una estrategia mixta.

Equilibrio de Nash:

Es un perfil de estrategias mixtas tal que la estrategia mixta de cada jugador es una mejor respuesta a las estrategias mixtas
de las rivales. Necesitamos simplemente que la estrategia mixta de cada jugador sea una mejor respuesta a las estrategias
mixtas de los otros jugadores.

La forma de hallar la mejor respuesta del jugador i a una estrategia mixta del jugador j se basa en la interpretación de la
estrategia mixta del jugador j como representación de la incertidumbre del Jugador i sobre lo que hará el jugador j.

5
Si q < 1/2, cara es la mejor estrategia de todas (puras o mixtas), y que si q > 1/2, cruz es la mejor estrategia de todas

La naturaleza de la mejor respuesta del jugador 1 a (q, 1-q) cambia cuando q = 1/2.
Como indicamos anteriormente, cuando q= 1/2 el jugador 1 es indiferente entre las
estrategias puras cara y cruz.

Puesto que existe un valor de q tal que r*(q) tiene más de un valor, llamamos a r*(q)
la correspondencia de mejor respuesta del jugador 1. La ganancia esperada del
jugador 1 con la estrategia mixta, es la suma ponderada de las ganancias esperadas
con cada una de las estrategias puras.

Busco la mejor respuesta para el jugador 1 a través de las esperanzas:

𝐸 (𝑢 (𝐴, 𝑞)) = (−1)𝑞 + 1 (1 − 𝑞)

𝐸 𝑢 (𝐵, 𝑞) = (1)𝑞 + (−1)(1 − 𝑞)

Igualo las esperanzas: -q + 1 – q = q – 1 + q

-2q – 2q = -2

q = 1/2

En el juego en forma normal de dos jugadores, las estrategias mixtas (p1*, p2*) forman un equilibrio de Nash si la estrategia
mixta de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador.

6
Mejor respuesta del jugador 2:

𝐸 𝑢 (𝐴, 𝑟) = (1). 𝑟 + (−1). (1 − 𝑟)

𝐸 𝑢 (𝐵, 𝑟) = (−1). 𝑟 + 1 (1 − 𝑟)

Igualo las esperanzas: r – 1 + r = - r + 1 – r

4r=2

r=½

Damos vuelta el gráfico para que los ejes me queden iguales, r en el eje de ordenadas
y q en el de abscisas.

Si r < ½ la mejor respuesta de 2 es cruz.

Si r > 1/2, la mejor respuesta de 2 es cara.

Si r = 1/2, el jugador es indiferente no sólo entre cara y cruz sino también entre todas
las estrategias mixtas (q; 1-q).

La intersección de las correspondencias de mejor respuesta r*(q) y q*(r) nos da


el equilibrio de Nash (en estrategias mixtas). Interpretamos la estrategia mixta
del jugador j como una representación de la incertidumbre del jugador i respecto
a la decisión del jugador j sobre la estrategia (pura) que va a seguir.

Un equilibrio de Nash (que incluya estrategias puras o mixtas) aparece como una
intersección de las correspondencias mejor respuesta de los jugadores.

q = ½ y r = ½ en estas probabilidades, no hay incentivos a desviarse. A los


jugadores les da lo mismo cualquier cosa, en este equilibrio no hay preferencias
estrictas.

Los jugadores se quieren engañar entre sí, el azar siempre emerge de los incentivos de los distintos jugadores por un
resultado endógeno.

Resumen del Equilibrio de Nash en estrategias mixtas:

 Cada una de las estrategias del jugador es la mejor.


 Es un perfil de estrategias mixtas tal que la estrategia mixta de cada jugador es una mejor respuesta a las
estrategias mixtas de las rivales.

Condiciones:

 Toda estrategia pura elegida con probabilidad estrictamente positiva por un jugador genera el mismo pago
esperado.
 El pago esperado de las estrategias que son jugadas con probabilidad cero es menor o igual al pago esperado
de las estrategias puras jugadas con probabilidad estrictamente positiva.

7
Unidad n°2
Decisiones bajo incertidumbre

Los estados del mundo están basados en canastas, la lotería le asigna probabilidades a cada una. Manifestar si me gusta o
no algo pero no basado en la cantidad, sino en la lotería (probabilidad).

Conjunto finito de resultados, posibles resultados de una decisión con incertidumbre (estado del mundo): C = {1,…, c}

Lotería: Es un conjunto de opciones entre las que puede elegir un consumidor. Espacio de loterías entre las que puede elegir
el consumidor. Distribución de probabilidad que asigna probabilidades a los estados del mundo. La P es la probabilidad de
que ocurra el resultado del conjunto c. L = (P1,…, Pc)

≿: Relación de preferencias definida en el espacio de loterías. Dice si una lotería es al menos tan buena como otra. Define
orden sobre el espacio de loterías. Es transitiva (no hay contradicciones), reflexiva y completa (siempre tiene una respuesta).
Suponemos que los individuos cumplen con las propiedades racionarias con respecto a las distintas loterías.

L ≿ L´ significa que L es al menos tan buena como L´. (Axioma de independencia).

TEOREMA DE LA UTILIDAD ESPERADA


Dada la función de preferencias que depende de la lotería, tenemos una función de utilidad u (L) que representa ≿, es
decir describe las preferencias del consumidor. Puede ser escrita como la suma ponderada de las utilidades de cada
resultado. Se puede pensar como la función de utilidad esperada.

𝑢 (𝐿) = 𝑝𝑢

𝑢 : Valor de utilidad que se le asigna al resultado c.

𝑝 : Probabilidad del resultado c.

Suponga que ≿ es racional, continua y satisface el axioma de independencia. Entonces existe una función U(L) que
representa ≿ con valores {𝑢 , … , 𝑢 } : 𝑢 (𝐿) = ∑ ∈ 𝑝 𝑢

UTILIDAD ESPERADA CON LOTERÍAS MONETARIAS

En vez de representar conjuntos de estados mundiales, analizamos solo la dimensión “riquezas”.

Lotería monetaria: Es un número aleatorio X ∼ F(x) → Función acumulada de probabilidad, es la probabilidad de que el
pago sea menor o igual a x.

X ∈ R dónde: X es un resultado y un punto de la recta real y R es la riqueza. El objeto de elección es una lotería en el
espacio monetario F(x).

Utilidad Esperada: Es una función monótona de la función de utilidad, la utilidad de una lotería es la utilidad que se espera
que reporten sus premios. Ésta puede calcularse tomando la utilidad que reportaría cada uno de los resultados,
multiplicándola por la probabilidad de que ocurriera ese resultado y sumando los resultados obtenidos. Asigna valores a
loterías, valora loterías. U(x) es la función de utilidad de Bernoulli, va de cada posible resultado a los R. Especifica valores a
los resultados.

U(F) = E[u(x)] = u(x) dF(x)

8
La “U” mayúscula se usa para definir a la utilidad general basada en loterías
(von- Neuman-Morgensten) y la “u” minúscula que es la función de utilidad
de cantidad de unidades monetarias (función de utilidad Bernoulli)

X*: Equivalente cierta: Dada la lotería f, el equivalente cierto x* ∈ R


satisface: 𝑢(𝑥 ∗) = 𝑢(𝐹) = ∫ u(x) dF(x) , si te dan esa cantidad de dinero
fijo te es indiferente la elección.

A veces las ponderaciones de las probabilidades no son lineales. Todo par


de loterías se va a representar de la misma manera tanto para u(x) como
para 𝑢(𝑥) = 𝑎. 𝑢(𝑥) + 𝑏 . La única transformación monótona para u(x) es 𝑢 (𝑥), la única forma de preservar la utilidad
esperada es solo a través de una transformación linear, el resto cambian todo.

Si ∫ u(x) dF(x) ≥ ∫ u(x) dG(x) → Entonces → ∫ u(x) dF(x) ≥ ∫ u(x) dG(x)

El teorema de utilidad esperada dice que si las preferencias sobre las loterías satisfacen los axiomas de continuidad e
independencia, entonces las preferencias son representables por una función de utilidad con la forma de utilidad
esperada.

AVERSIÓN AL RIESGO
Un tomador de decisiones es adverso al riesgo si para cada lotería F(X), una lotería que contiene la cantidad ∫ u(x) dF(x)
con seguridad, es al menos tan buena como la lotería F(X) (es la cantidad de dinero por la cual el individuo es indiferente
entre la apuesta F (X) y la cantidad cierta u[E(x)/F].

Una relación de preferencias ≿ representada por la función de utilidad esperada satisface la aversión al riesgo si:

U(F) = u(x) dF(x) ≤ u[E(x)/F]

Solo pasa si u(x) es cóncava (desigualdad de Jensen). La aversión al riesgo es


equivalente a la concavidad de la función. Es cóncava porque la utilidad
marginal de las unidades monetarias es decreciente, no vale la pena tomar el
riesgo de ganar un dólar extra teniendo en cuenta la cantidad que podría
perder. El equivalente cierto x ∗ ≤ E(X/F)

( )
Medida de aversion al riesgo: 𝑢(𝑥) = >0
´( )

SEGURO ACTUARIALMENTE JUSTO


La idea de prima justa se asocia al concepto de seguro actuarialmente justo. Un seguro es actuarialmente justo si, y solo si,
el monto que cobra la aseguradora (la prima, P) es igual al producto entre el monto que paga en caso de siniestro (lo que
cobra el individuo, C) y la probabilidad de que ocurra el escenario malo. r = π → Lo que pago por cada unidad es la
probabilidad de que me lo vayan a devolver, hay equivalencia entre lo que pago y lo que me dan. Si sos adverso al riesgo y
el seguro es actuarialmente justo te aseguras por completo. La riqueza esperada no depende de q.

P = (1 − p) ∗ C

W: Nivel inicial de riqueza.


L: Punto de pérdida que ocurre con probabilidad π
Utilidad esperada sin seguro: (1 − 𝜋). 𝑢(𝑊) + 𝜋. 𝑢(𝑊 − 𝐿)
9
r: Precio del seguro, costo de asegurar una unidad monetaria.
q: Cantidad de unidades monetarias aseguradas.
Se debe buscar la cantidad optima de “q”.

Problema: 𝑚á𝑥 (1 − 𝜋). 𝑢(𝑊 − 𝑞𝑟) + 𝜋𝑢(𝑊 − 𝐿 − 𝑞𝑟 + 𝑞)


= (1 − 𝜋). 𝑢´(𝑊 − 𝑞𝑟)(−𝑟) + 𝜋𝑢´ 𝑊 − 𝐿 + 𝑞(−𝑟) (1 − 𝑟) ≤ 0 Utilidad marginal de la riqueza

Suponiendo que el seguro es actuarialmente justo, es decir que es igual al costo esperado por asegurarse (r = π), entonces
lo que pago por cada unidad asegurada es igual a la probabilidad de que me lo vayan a devolver. Hay equivalencia entre lo
que pago y lo que voy a recibir. La riqueza final del individuo siempre va a ser “W – πL”. Esto ocurre para cualquier cantidad
“q”, dado que si el individuo es adverso al riesgo, q*=L es óptimo porque el riesgo desaparece, reemplazo q por L.
𝑊 − 𝑟𝑞 (1 − 𝜋)
𝑊´ =
𝑊 − 𝐿 − 𝑟𝑞 + 𝑞 𝜋

Si se gana el juicio con probabilidad 0,5, el individuo recibe $10.000 (escenario bueno). Luego, la probabilidad de que se
pierda el juicio y que el individuo no reciba nada es también 0,5 (escenario malo). Considerando que la riqueza inicial del
individuo es $5.000, que es el valor de mercado del auto chocado, analizamos su riqueza neta en ambos escenarios si
considera contratar un seguro actuarialmente justo:

La riqueza en el escenario bueno resulta:

Wb = 5,000 + 10,000 − P = 5,000 + 10,000 − 0, 5 ∗ C

Y en el escenario malo:

Wm = 5,000 + C − P = 5,000 + C − 0, 5 ∗ C

El seguro actuarialmente justo permite que el individuo este indiferente entre el escenario bueno y el escenario malo, para
lo cual es necesario que disponga de la misma riqueza en caso de un escenario u otro.

Entonces,

Wb = Wm ⇐⇒ 5,000 + 10,000 − 0, 5 ∗ C = 5,000 + C − 0, 5 ∗ C ⇒ C = $10,000

Luego,

P = (1 − p) ∗ C = 0, 5 ∗ 10,000 ⇒ P = $5,000

Unidad n°3
Juegos dinámicos con información completa
10
De nuevo, limitamos nuestra atención a los juegos con información completa, es decir, juegos en los que las funciones de
ganancias de los jugadores son información de dominio público). El tema central en todo juego dinámico es el de
credibilidad. La simultaneidad de las decisiones significa en este contexto que estos juegos son de información imperfecta.
Definimos el resultado perfecto en subjuegos de tales juegos, que es la extensión natural de la inducción hacia atrás.La
diferencia con los juegos estáticos es que ahora hay distintos tiempos.

INDUCCIÓN HACIA ATRÁS


Consiste en encontrar la acción óptima en cada uno de los nodos de decisión finales del juego. Incorporando esta
información, subir de nivel y encontrar la acción optima en cada nodo hasta llegar al primero.

Las características clave de un juego dinámico con información completa y perfecta son que:

(1) Las decisiones se toman de manera sucesiva.

(2) Todas las decisiones anteriores son conocidas antes de tomar la decisión siguiente.

(3) Las ganancias de los jugadores para cada combinación posible de jugadas son información del dominio público.

Ejemplo:

Representación en forma extensiva:

1
A B

A B
(3) B A (1)
(0) (0)
(1) (3)
(0) (0)

Estrategias: S1 = {A, B} y S2 = {AA, AB, BA, BB} Comentado [CM2]: Si el jugador 1 elige A, el 2 elige A, si el
jugador 1 elige B, el 2 elige A. El primer término es la
Se da en 2 tiempos, el 2 actúa en base al 1. respuesta del J2 cuando el J1 elige A y el segundo la
respuesta cuando el J1 elige B.
Representación en forma normal:

Jugador 2
AA AB BA BB
Jugador
A 3, 1 3, 1 0, 0 0, 0
1 B 0, 0 1, 3 0, 0 1, 3

El jugador 1 elegiría A si el 2 elige A, y elije B si el 2 elige B (xq 3>0 y 1>0). El jugador 1 debería elegir A porque sabe que el
jugador 2 lo va a seguir y 3>1.

Hay 3 equilibrios de Nash: EN = {(A, AA); (A, AB) ; (B, BB)} Promesas no creíbles

Promesas no creíbles: Algunos juegos tienen múltiples equilibrios de Nash pero tienen un equilibrio que destaca como la
solución más llamativa del juego. En este caso, sabemos que cuando el J1 elige B en el primer caso, va a elegir B (3 > 0), y en
el segundo caso, si el 1 elige A, entonces va a elegir A (1 > 0). Las promesas no creíbles son eliminadas a través de imponer
un equilibrio de Nash en un subconjunto del juego.

11
Conjunto informativo: Conjunto de nodos de decisión que el jugador no puede diferenciar en el momento de tomar una
decisión.

Estrategia en un conjunto dinámico: Plan de acción que selecciona un comportamiento para cada conjunto informativo.

Subjuego: Es un subconjunto del juego que:


- Arranca en un nodo de decisión.
- Contiene ramas inferiores.
- No rompe ningún conjunto informativo.

Equilibrio perfecto en subjuego: Perfil de estrategias para cada jugador que cumple distintas propiedades. Define un
Equilibrio de Nash para cada subjuego y puede haber más de uno.

JUEGOS REPETIDOS EN 2 ETAPAS


Los juegos repetidos son un tipo particular de los juegos dinámicos.
Versión repetida 2 veces del dilema del prisionero:
Hay dos participantes en este juego que deciden simultáneamente en dos ocasiones, habiendo observado el resultado de
la primera decisión antes de decidir por segunda vez, y supongamos que las ganancias del juego completo son simplemente
la suma de las ganancias de cada etapa.

Permitimos posibilidad de que el equilibrio de Nash del juego restante en la segunda etapa
dependa del resultado de la primera etapa.

El único equilibrio del juego en la segunda etapa es confesar confesar (I1, I2). Hay que
buscar el EN en cada subjuego.

Solución: En un equilibrio perfecto en subjuegos:

-En t=2 → El J1 y J2 eligen traicionar en cada una de las historias (es lo mismo que
en el juego original).
Ahora en t=1 sabemos que solo hay 4 pagos relevantes (condición de equilibrio perfecto
en subjuegos). Dado el comportamiento de t=2 y comparando los pagos, al J1 le conviene
traicionar.
-En t=1 → El J1 y el J2 traicionan.

Esto es un juego finito con un único equilibrio de Nash, las conductas van a ser exactamente las mismas.

EN UN JUEGO REPETIDO DE UN JUEGO DE ETAPA CON UN ÚNICO EQUILIBRIO DE NASH Y UN NÚMERO FINITO DE REPETICIONES, EXISTE UN ÚNICO Comentado [CM3]: Juego original del cual surgen las
EQUILIBRIO PERFECTO EN SUBJUEGOS EN EL QUE CADA JUGADOR EN CADA POSIBLE DECISIÓN ELIJE EL EQUILIBRIO DE NASH DEL JUEGO DE ETAPA. repeticiones.

S0
1

C T

C T T
C
S1 S2 S4
1 1 S3 1 1 12

C T C T C T C T
2 2 2 2

C T C T C T C T C T C T C T C T

(-2) (-6) (-1) (-4) (-6) (-8) (-1) (-5) (0) (-3) (-4) (-8) (-3) (-6)
(-10) (-5)
(-2) (-1) (-6) (-4) (-1) (0) (-5) (-3) (-6) (-5) (-10) (-8) (-4) (-3) (-8) (-6)
 15 nodos de decisión.
 10 conjuntos de información.
 5 subjuegos (S0, S1, S2, S3, S4).
 32 estrategias para cada jugador.

Los equilibrios de Nash de este juego de una etapa corresponden a los resultados perfectos en subjuegos del juego repetido
original.

Juego repetido finitamente en el que G se juega T veces, habiendo los jugadores observado los resultados de todas las
jugadas anteriores antes de que empiece la siguiente. Las ganancias de G (T) son simplemente la suma de las ganancias de
los T juegos de etapa.

Proposición. Si el juego de etapa G tiene un único equilibrio de Nash, entonces, para cualquier T finito, el juego repetido G
(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega el equilibrio de Nash de G.

Cuando el juego de etapa tiene más de un equilibrio de Nash, es posible que los Jugadores prevean que a resultados
diferentes en la primera etapa les siguen equilibrios diferentes del juego de etapa en la segunda etapa. Los equilibrios de
Nash de este juego de una etapa corresponden a los resultados perfectos en subjuegos del juego repetido original.

Pueden existir resultados perfectos en subjuegos del juego repetido G(T) en los que, para cualquier t < T, el resultado de la
etapa t no es un equilibrio de Nash de G. La conclusión principal que debemos sacar de este ejemplo es que las amenazas o
las promesas creíbles sobre el comportamiento futuro pueden influir en el comportamiento presente.

JUEGOS REPETIDOS INFINITAMENTE

DEFINICIÓN. DADO UN JUEGO DE ETAPA G, DENOMINAMOS G (∞,𝛿) AL JUEGO REPETIDO INFINITAMENTE EN EL QUE G SE REPITE POR SIEMPRE Y
LOS JUGADORES TIENEN EL MISMO FACTOR DE DESCUENTO 𝛿. PARA CADA “T”, LOS RESULTADOS DE LAS “T – 1” JUGADAS ANTERIORES DEL JUEGO
DE ETAPA SON CONOCIDOS ANTES DE QUE EMPIECE LA T-ÉSIMA ETAPA. LA GANANCIA DE CADA JUGADOR EN G (∞,𝛿) ES EL VALOR PRESENTE DE
LAS GANANCIAS QUE EL JUGADOR OBTIENE EN LA SUCESIÓN INFINITA DE JUEGOS DE ETAPA .

Las amenazas o las promesas, creíbles sobre el comportamiento futuro pueden influir en el comportamiento presente.
Incluso si el juego de etapa tiene un único equilibrio de Nash, pueden existir muchos resultados perfectos en subjuegos en
los que ninguno de los resultados en cada etapa sea un equilibrio de Nash de G. G se repite infinitamente, habiendo los
jugadores observado los resultados de todas las rondas anteriores antes de que empiece la etapa siguiente.

13
El factor descuento es el valor actual de una peseta que se vaya a recibir en el periodo siguiente, donde r es el tipo de interés
o tasa de descuento subjetiva por periodo.

𝛿= Es un número entre cero y uno.

Dados un factor de descuento y las ganancias de un jugador obtenido de una sucesión infinita de juegos de etapa,
podemos calcular el valor presente de las ganancias, es decir, la ganancia total que podría ingresarse en un banco ahora
de forma que produjera el mismo saldo al final de la sucesión.

Dado un factor de descuento 𝛿, el valor presente de la sucesión infinita de pagos 𝜋 , 𝜋 , 𝜋 , … es:

𝛿 .𝜋

La función de utilidad es la suma ponderada, según el factor de descuento de los pagos de cada etapa del juego.

𝑢 𝑆 ,𝑆 = 𝛿 . 𝜋(𝑎 , 𝑎 )

Ejemplo del dilema de los prisioneros: (I: callarse; D confesar)

Estrategia tipo gatillo: Supongamos que el jugador “i” empieza el juego repetido infinitamente cooperando y sigue
cooperando en cada juego de etapa siguiente si y sólo si ambos jugadores han cooperado en cada ronda previa. Se llama
estrategia gatillo o “trigger strategy” porque el jugador “i” coopera hasta que alguien deja de Cooperar, lo que desencadena
la decisión de no volver a cooperar nunca más. La estrategia entonces sería:

Jugar Di en la primera etapa. En la t-ésima etapa, si el resultado de todas las t - 1 etapas anteriores ha sido (D1, D2)
entonces jugar Di; en caso contrario, jugar Ii.

En t = 0 → Cooperar.
A
En t > 0 → Cooperar si nadie se desvió hasta ahora.

→ Traicionar en caso contrario. B

Para demostrar que la adopción de la estrategia del disparador por parte de los dos jugadores es un equilibrio de Nash del
juego repetido infinitamente, supondremos que el jugador “i” ha adoptado la estrategia del disparador y demostraremos a
continuación, siempre que 𝛿 esté lo suficientemente cerca de uno, que adoptar esta estrategia es también la mejor
respuesta del jugador j.

Hay que preguntarse si la estrategia tipo gatillo constituye un equilibrio perfecto en subjuego. Hay que ver que conviene en
cada caso sabiendo que mi rival elije esta estrategia.

Hay 2 casos suponiendo que si la elije: ¿En A existe alguna desviación unilateral beneficiosa? ¿Y en B?.

Si las respuestas son negativas, entonces si existe un equilibrio perfecto en subjuegos. En B el rival traiciona siempre, y
traicionar siempre no es una mejor respuesta, por lo tanto no hay desviación unilateral beneficiosa.

En A si no se desvía obtendría el pago: ∑ 𝛿 (−1)

Si se desvía: ∑ 𝛿 (−3) = 𝛿 ∑ 𝛿 (−3) (saco factor común)

14
Como: ∑ 𝛿 =1+𝛿+𝛿 +𝛿 …=

No hay desviación unilateral beneficiosa si:

𝛿 (−1) ≥ 𝛿 (−3)

1 1
(−1). ≥ 𝛿(−3).
1 − 𝛿𝑡 1 − 𝛿𝑡
−(1 − 𝛿) ≥ −3𝛿

4𝛿 ≥ 1

1
𝛿≥
4

En la primera etapa, y en cualquier ronda tal que todos los resultados anteriores hayan sido (D1, D2), la decisión óptima
del jugador j (dado que el jugador i ha adoptado la estrategia del disparador) es Dj si y sólo si 𝛿≥1/4. Combinando esta
observación con el hecho de que la mejor respuesta de j es jugar siempre Ij cuando el resultado de alguna etapa difiera
de (D1, D2), tenemos que el que los dos jugadores jueguen la estrategia del disparador es un equilibrio de Nash si y
sólo si 𝛿 ≥ 1/4.

Fallas de Mercado. Externalidades y Bienes Públicos.


Fallas de mercado: Son situaciones donde algunas suposiciones de los teoremas de bienestar no se sostienen, y como
consecuencia, el equilibrio de mercado no se puede confiar en que produzca resultados óptimos de Pareto. Una externalidad
se presenta cuando el bienestar de un consumidor o las posibilidades de producción de una firma están directamente
afectadas por las acciones de otro agente de la economía.

Hay dos tipos de fallas:

 Externalidades.
 Bienes Públicos.

En la realidad, un consumidor o una firma en algunas circunstancias pueden ser afectados directamente por las acciones de
otros agentes de la economía, es decir, puede haber efectos externos por actividades de otros consumidores o firmas.

Bienes públicos: Mercancías que tienen un carácter inherentemente público, en el sentido de que el consumo de una unidad
del bien por parte de un agente no impide su consumo por parte de otro. La provisión privada de un bien público genera un
tipo especial de externalidad: si un individuo provee una unidad de un bien público, todos los individuos se benefician (Ej.
Un faro).

En el modelo puro, el bienestar que extrae una persona por consumir el producto no depende de que otras personas lo
consuman. En la medida que haya congestión, nos empezamos a alejar del modelo puro porque muchas personas no le
agregan bienestar a otro.

EXTERNALIDAD BILATERAL

 Vamos a considerar 2 consumidores: i = 1, 2 (también aplica para 2 firmas o una firma y un consumidor).

15
 Sus acciones no modifican los precios de los bienes intercambiados en la economía.
 La riqueza de los consumidores es Wi.
 h: Acción tomada por 1 (afecta el bienestar de 2, genera una externalidad)
 Supuesto de que la externalidad y la riqueza son separables. 𝑢 (ℎ, 𝑤 ) = ∅ (ℎ) + 𝑤
 ∅ ´´(. ) < 0 ∀𝑖

En un equilibrio competitivo:

En el punto de equilibrio cada uno de los consumidores maximiza su utilidad limitado únicamente por su riqueza y por los
precios de los bienes. El consumidor 1 elije el nivel de h ≥ 0 para maximizar ∅ (ℎ). El equilibrio de h, h* satisface la condición
necesaria y suficiente de primer orden.

Solución descentralizada: 𝑚á𝑥 ∅ (ℎ) + 𝑤 ∅ (ℎ)


CPO: ∅ ´(ℎ) = 0 (solución interior)

h*

Solución óptima de Pareto

Para mejorar el bienestar de uno, tiene que empeorar el de otro. El nivel óptimo para h es h o y debe maximizar el beneficio
de ambos consumidores.
T: transferencia de 2 a 1.
Buscamos una solución eficiente, una asignación socialmente eficiente:
W1 + T: Riqueza ajustada.
𝑚á𝑥 , ∅ (ℎ) + 𝑤 + 𝑇
𝑢 : Parámetro que puede tomar
𝑠. 𝑎 ∅ (ℎ) + 𝑤 − 𝑇 ≥ 𝑢 cualquier valor. Nivel de bienestar
de 2.
En un óptimo, la restricción se resuelve usándolo como una igualdad: ∅ (ℎ) + 𝑤 − 𝑇 = 𝑢
h: Define el valor de la
Despejando T: 𝑇 = ∅2 (ℎ) + 𝑤2 − 𝑢 externalidad.

Reemplazando: 𝑚á𝑥 , ∅ (ℎ) + 𝑤 + ∅ (ℎ) + 𝑤 − 𝑢 ho: h óptimo.


𝑜
CPO (CNyS): = ∅1 ´ ℎ + ∅2 ´ ℎ𝑜 = 0

∅ ´(ℎ ) = −∅ ´(ℎ )

La asignación óptima requiere que los beneficios se neteen, es decir que uno gane y el otro pierda.

Externalidad Negativa: (∅ ´(. ) < 0)


−∅ ´(. ) Es creciente porque la segunda derivada es negativa, y si lo multiplicamos por -1, entonces es positiva.

∅ ´(ℎ)
−∅ ´(ℎ) ho < h*

16

ho h*
Externalidad Positiva: (∅ ´(. ) > 0)

−∅ ´(. ) Es una función negativa creciente. ho


En ho el 1 se perjudica y el 2 se beneficia. h*
−∅ ´(ℎ)
Los 2 efectos se compensan. Asignación Óptima.
Separación Socialmente Conveniente.

Unidad N°4
Equilibrio General
Tratar de entender muchos mercados al mismo tiempo. Hay distintos tipos de equilibrio general, algunos estáticos, otros
dinámicos, unos con incertidumbre, otros sin, etc.

ECONOMÍA DE ROBINSON CRUSOE

Hay un único agente (agente representativo) que actúa como consumidor y como firma. Valúa 2 bienes: El trabajo y los
bienes producidos por la firma.

Hay 2 mercados: de trabajo y de bienes.

El consumidor tiene preferencias (≿) continuas, convexas y monótonas sobre su consumo de ocio (X 1) y sobre el bien (X2).
Tiene una dotación de 𝐿 (Ej. 24 horas del día).

Problema de LA FIRMA:

La firma usa el trabajo para producir el bien de acuerdo a la función 𝑞 = 𝑓(𝑧) (función de producción cóncava) donde Z es
el insumo de mano de obra (el trabajo). Para producir ganancias, la firma debe contratar al consumidor comprándole una
parte de sus horas de ocio.
P: Precio de venta.

W: Salario

17
Dados los precios (p, w), la demanda óptima de la empresa es:

 Z (p, w) para el trabajo.


 Q (p, w) para la producción.
 Π (p, w) son sus beneficios.

Supuesto de que el consumidor también es el dueño de la firma.

La firma busca encontrar el máximo nivel de beneficio, para eso, se usan las
curvas de isobeneficio: son un par de valores para los cuales el beneficio es
constante.

CI = {(-z; q): pq – wz = π} → De ahí despejo q para encontrar la función de la recta: 𝑞 = − (−𝑧)

-z es el ocio y es el valor de las abscisas. Pendiente

Solución de Tangencia:

𝑓´(𝑧) = (CPO)

El precio es igual a la productividad marginal.

Problema del Consumidor:

Elije entre el ocio (X1) y los bienes de consumo (X2) porque para comprar los bienes necesita riqueza, y para obtenerla
necesita trabajar.

Si el consumidor ofrece una cantidad (𝐿 − 𝑋 ) de trabajo cuando los precios son (p, w), entonces la cantidad total que
puede gastar en comprar un bien es la ganancia del trabajo: 𝑤(𝐿 −
𝑋 ).

(En el grafico no darle bola a la curva cóncava xq nose q es).

Eje horizontal → Horas de Ocio.


u
Eje vertical → Cantidades consumidas.

Curvas de indiferencia

Los niveles de ocio y consumo se miden en el eje de abscisas, definido


como Oc. Está determinado por el largo de [Oc ; Of], que es igual a 𝐿
(que es la dotación de trabajo). Si el consumidor consume 𝐿 unidades
(.) (.)
de ocio, al no vender trabajo, puede comprar unidades de consumo de un bien. 𝑋 = 𝐿 → 𝑋 ≤ .

Para cada unidad de trabajo que vende, recibe W y puede comprar W/P unidades de X2. El presupuesto del consumidor es
la curva de isobeneficio asociada a la solución de la maximización del beneficio de la firma.

Equilibrio Walrasiano (o competitivo):

18
Las cantidades producidas coinciden con las cantidades de bienes demandadas. Lo que quiere hacer la firma es igual a lo
que quieren los consumidores. Compatibilidad entre el mercado de trabajo y el mercado de bienes.

Situación de Equilibrio:

(p*, w*) tal que:

Q (p*, w*) = X2 (p*, w*)

X1 (p, w) + Z (p, w) = L

Hay una combinación de consumo y ocio de equilibrio que se da solamente en el


caso en que se maximice la utilidad del consumidor.

Cualquier equilibrio Walrasiano es un óptimo de Pareto, y la asignación óptima de


Pareto es compatible como un equilibrio Walrasiano.

Situación donde NO hay Equilibrio:

Mercado de bienes: Hay exceso de oferta del bien Q (p*, w*) > X2 (p*, w*) EXCESO DE OFERTA DE BIEN

Mercado de trabajo: Hay exceso de demanda de trabajo X1 (p, w) + Z (p, w) > L EXCESO DE DEMANDA DE TRABAJO

Los empleadores quieren más trabajadores, y los trabajadores quieren


más ocio.

Hay más bienes ofertados, la cantidad que quiere producir la firma es


mayor a la que quiere comprar el consumidor.

(Ver gráfico en el cuaderno).

Teoremas de Bienestar:

- 1ER TEOREMA DE BIENESTAR: Bajo circunstancias de un mercado perfectamente competitivo, cualquier


asignación de equilibrio es un óptimo de Pareto. La única justificación para la intervención en el mercado es
cuadno se da el cumplimiento de objetivos distributivos. Todos los equilibrios del mercado son eficientes en el
sentido de Pareto. Este teorema garantiza que un mercado competitivo obtiene todas las ganancias derivadas
del comercio.

- 2DO TEOREMA DE BIENESTAR: Asumiendo convexidad (no se requiere en el primero), se puede conseguir
cualquier asignación óptima de Pareto al redistribuir apropiadamente la riqueza y luego dejar “trabajar al

19

También podría gustarte