Está en la página 1de 32

LA TEORÍA DE JUEGOS

Y EL ANÁLISIS
ESTRATÉGICO DE
DECISIONES

MICROECONOMÍA II
Teoría de juegos
Juego: Situación en la que los participantes (jugadores) se
rigen bajo ciertas reglas y toman decisiones estratégicas
que consideran las acciones y reacciones de los demás.
Las consecuencias de dichas acciones se expresan en
resultados que se conocen como pagos (los cuáles
pueden ser monetarios, en puntos, menores pérdidas,
etc.).
Un juego es la representación formal de una situación en
que se dan diferentes estrategias.

VÍCTOR R. ZURITA SALDAÑA 2


TEORÍA DE JUEGOS

Juego: Situación en la que los participantes (jugadores) se


rigen bajo ciertas reglas y toman decisiones estratégicas que
consideran las acciones y reacciones de los demás. Las
consecuencias de dichas acciones se expresan en resultados
que se conocen como pagos (los cuáles pueden ser
monetarios, en puntos, menores pérdidas, etc.).
Un juego es la representación formal de una situación en que
se dan diferentes estrategias.

VÍCTOR R. ZURITA SALDAÑA 3


TEORÍA DE JUEGOS

ELEMENTOS DE UN JUEGO

JUGADORES: los agentes que toman decisiones. Por ejemplo dos empresas A y B,
que deben decidir sus niveles de gasto en publicidad

REGLAS: que establecen la forma en qué se tomarán las decisiones. Ejemplo, las
empresas A y B decidirán de manera simultánea

ESTRATEGIAS: es el conjunto de decisiones factibles que disponen los jugadores, y


una de las cuales será implementada. En el caso de las empresas, ellas tienen que
decidir si realizan publicidad o no lo hacen.

RECOMPENSAS: son los costos o beneficios que se conseguirán cuando el juego


se resuelva, es decir, cuándo todas las decisiones se conozcan y los jugadores no
tengan incentivos para cambiar éstas. Las recompensas del juego se muestran en
una matriz de pagos.

VÍCTOR R. ZURITA SALDAÑA 4


TEORÍA DE JUEGOS

CLASIFICACIÓN DE JUEGOS: cooperativos y no cooperativos


Juegos cooperativos: los participantes pueden negociar
contratos vinculantes que les permiten planear estrategias
conjuntas.
Ejemplos:
la negociación entre un comprador y un vendedor sobre el
precio de un bien o un servicio o una inversión conjunta de dos
empresas.

Negociación entre empresas sobre estrategias de precios.

Supuesto: los contratos vinculantes son posibles.


NOTICIA SOBRE ACUERDO DE PRECIOS EN CHILE

VÍCTOR R. ZURITA SALDAÑA 5


TEORÍA DE JUEGOS

Juegos no cooperativos: No es posible negociar y hacer cumplir un contrato


vinculante entre jugadores.

Ejemplo:
dos empresas rivales tienen en cuenta la conducta probable de cada una, cuando
fijan independientemente sus precios y sus estrategias publicitarias para capturar
más cuota de mercado.
Supuesto: los contratos vinculantes no son posibles.

Lluvia de ofertas desata guerra de precios en telefonía celular


http://www.larepublica.pe/19-10-2014/lluvia-de-ofertas-desata-guerra-de-
precios-en-telefonia-celular
Operadoras se disputan 30 millones de líneas activas de telefonía celular en Perú
http://www.larepublica.pe/20-10-2014/operadoras-se-disputan-30-millones-de-
lineas-activas-de-telefonia-celular-en-peru

VÍCTOR R. ZURITA SALDAÑA 6


TEORÍA DE JUEGOS

OTRA CLASIFICACIÓN DE JUEGOS:

Simultáneos: Ambos jugadores toman una decisión al mismo tiempo, los dos
revelan sus estrategias de manera simultánea.
Ejemplos:

VÍCTOR R. ZURITA SALDAÑA 7


TEORÍA DE JUEGOS

Juegos secuenciales: un jugador inicia el juego revelando una primera decisión,


luego el siguiente jugador toma una decisión, y se repite el orden de manera
secuencial.
Ejemplos:

VÍCTOR R. ZURITA SALDAÑA 8


Clasificación
En términos generales hay cuatro tipos de
juegos:
1. Juegos estáticos con información completa
2. Juegos estáticos con información incompleta
3. Juegos dinámicos con información completa
4. Juegos dinámicos con información
incompleta

VÍCTOR R. ZURITA SALDAÑA 9


Formas de representación
Forma normal de un juego

Consiste en identificar los siguientes elementos


de un juego:
• Jugadores: los participantes del juego
• Estrategias: conjunto posible de acciones de
los jugadores
• Pagos: posibles resultados expresados en
valores monetarios, términos físicos, etc. Se
resumen en una matriz de pagos.

VÍCTOR R. ZURITA SALDAÑA 10


Lo anterior se puede resumir en lo siguiente:

VÍCTOR R. ZURITA SALDAÑA 11


Representación en forma extensiva de un juego

(5,1) (3,2) (4,8) (6,3)


Consiste en una
descripción detallada de d1 d2 d1 d2
la estructura secuencial J2 J2
de la toma de decisiones
de los jugadores: árbol I D
J1
del juego
Un juego en forma extensiva

VÍCTOR R. ZURITA SALDAÑA 12


Equilibrio de Nash (EN)
Si se tiene un juego en forma normal,
𝐺 = 𝐽; 𝑆; 𝑈
y se puede identificar una combinación de
estrategias 𝑠Ƹ = 𝑠1Ƹ , 𝑠Ƹ2 , . . . , 𝑠Ƹ𝑛 , esta se considera
un equilibrio de Nash de dicho juego sí y sólo sí:
𝑈𝑖 𝑠Ƹ𝑖 , 𝑠Ƹ−𝑖 ≥ 𝑈𝑖 𝑠𝑖 , 𝑠−𝑖 , ∀𝑠𝑖 ∈ 𝑆𝑖 , ∀𝑖 = 1, … , 𝑛
En otras palabras, en un EN cada jugador ha
elegido la mejor estrategia posible dadas las
mejores estrategias elegidas por los otros.
VÍCTOR R. ZURITA SALDAÑA 13
Dilema del prisionero*
El “problema clásico del dilema
del prisionero” es el siguiente:
“La policía arresta a dos
sospechosos. No hay pruebas
suficientes para condenarlos, y
tras haberles separado, la policía
les visita a cada uno y les ofrece
el mismo trato. Cada uno de
ellos va a ser preguntado sobre
la culpabilidad del otro.”

Tomado de Dilema del Prisionero en la vida real y en las Telecomunicaciones: Punto de vista del ingeniero. En
http://www.it.uc3m.es/jvillena/irc/practicas/10-11/09mem.pdf

VÍCTOR R. ZURITA SALDAÑA 14


Cada uno de los sospechosos se encuentra en una celda, y a ambos se les ofrece
el mismo trato como se acaba de comentar: si uno confiesa y su cómplice
continúa sin hablar, su cómplice será condenado a la pena máxima (10 años) y él
será puesto en libertad. Si el cómplice confiesa, pero él no, recibirá la pena
máxima y su cómplice será liberado. Si ambos permanecen callados, ambos
serán encerrados 6 meses por un cargo menor, mientras que si ambos
confiesan, serán condenados a 6 años. Cada preso puede optar por “Colaborar”
con el otro, asegurando que el compañero se encuentra injustificadamente en la
cárcel, o “Defraudar”, acusándole de haber realizado el delito. La matriz que
representa las opciones de este juego y sus posibles resultados es la siguiente:

VÍCTOR R. ZURITA SALDAÑA 15


Donde decir la verdad equivale a cooperar, a negarlo.
Confesar es una estrategia dominante para ambos jugadores,
ya que, sea cual sea la elección del cómplice, siempre se
reducirá la pena al confesar.
Sin embargo, este resultado no es óptimo, ya que si ambos
confiesan reciben una condena larga. Aquí se encuentra el
punto clave del dilema del prisionero.
Desde el punto de vista del interés óptimo del conjunto de los
dos sospechosos, la elección que lleva al mejor resultado es
que ambos prisioneros cooperen, ya que de esta forma ambos
cumplen la mínima pena posible, es decir, la moraleja de este
tipo de problemas es maximizar el beneficio conjunto.

VÍCTOR R. ZURITA SALDAÑA 16


TEORÍA DE JUEGOS

Aplicación del Dilema del prisionero

EMPRESA B

HACER PUBLICIDAD NO HACER PUBLICIDAD

HACER PUBLICIDAD 10,5 15,0


EMPRESA A

NO HACER PUBLICIDAD 6,8 10,2

VÍCTOR R. ZURITA SALDAÑA 17


TEORÍA DE JUEGOS

Estrategia dominante:

Estrategia que es óptima independientemente de cómo se


comporten los competidores.
Comparar los pagos en cada estrategia para cada jugador
EMPRESA B

HACER PUBLICIDAD NO HACER PUBLICIDAD

HACER PUBLICIDAD 10,5 15,0


EMPRESA A

NO HACER PUBLICIDAD 6,8 10,2

VÍCTOR R. ZURITA SALDAÑA 18


TEORÍA DE JUEGOS

La racionalidad implica suponer que cada jugador escogerá su estrategia


dominante.

EQUILIBRIO DE ESTRATEGIAS DOMINANTES: cada jugador adopta su estrategia


dominante.

(hacer publicidad, hacer publicidad) = (10,5)

VÍCTOR R. ZURITA SALDAÑA 19


TEORÍA DE JUEGOS

Juegos sin estrategias


EMPRESA B
dominantes:
HACER NO HACER
PUBLICIDAD PUBLICIDAD

La mejor decisión de un
jugador que no utiliza HACER
10,5 15,0
estrategia dominante PUBLICIDAD

EMPRESA A
dependerá de lo que el
otro jugador haga. NO HACER
PUBLICIDAD
6,8 20,2

La empresa A debe analizar la decisión de la empresa B, dado que tiene tiene


estrategia dominante, A decidirá “hacer publicidad”.

VÍCTOR R. ZURITA SALDAÑA 20


TEORÍA DE JUEGOS

Hay juegos en donde no hay estrategias dominantes para ningún jugador. En estos
casos es posible tener más de 01 equilibrio de Nash.
Ejemplo:
Dos empresas deciden introducir dos tipos de cereales.
Ninguna puede introducir ambas, pues no tienen suficiente recursos.
No hay posibilidad de acuerdos colusivos.
El equilibrio dependerá de la
EMPRESA B
conjetura que realice cada
CRUJIENTE DULCE
empresa sobre la rival.

Es posible “señalizar”. CRUJIENTE -5,-5 10,10


EMPRESA A

Es posible generar una reputación


si el juego se repite a lo largo del DULCE 10,10 -5,-5

tiempo.

VÍCTOR R. ZURITA SALDAÑA 21


TEORÍA DE JUEGOS

ESTRATEGIAS MAXIMIN JUGADOR 2

IZQUIERDA DERECHA
En el juego de la derecha, el jugador 2
tiene una estrategia dominante: derecha
SUPERIOR 1,0 1,1

JUGADOR 1
Si 1 estuviera seguro que 2 adoptará
“derecha”, entonces escogerá “inferior”: INFERIOR -1000,0 2,1
(inferior, derecha)= (2,1) es un equilibrio
de Nash.

Si este no fuera el caso, entonces al jugador 1 le conviene decidir por la estrategia


“superior”, por que aunque gane 1 en vez de 2, esta maximizando la ganancia
mínima: es una estrategia maximin.

VÍCTOR R. ZURITA SALDAÑA 22


TEORÍA DE JUEGOS

Juegos de estrategias puras: los JUGADOR 2


jugadores toman una decisión,
eligen una acción. CARA CRUZ

Juegos de estrategias mixtas:


los jugadores eligen una
determinada estrategia CARA 1,-1 -1,1
basándose en un conjunto de
probabilidades elegidas.

JUGADOR 1
Asigne probabilidades de ½ a cada
estrategia, y calcule el valor
esperado para cada jugador, en CRUZ -1,1 1,-1

cada estrategia

VÍCTOR R. ZURITA SALDAÑA 23


TEORÍA DE JUEGOS

Valor esperado de la estrategia cara (para el jugador A): 0.5*1 + 0.5 *-1 = 0
Valor esperado de la estrategia cruz (para el jugador A): 0.5*-1 + 0.5*1 = 0
Supongamos que los jugadores A y B eligen elegir CARA con una probabilidad de ¾ y
CRUZ con ¼ de probabilidad

Valor esperado de la estrategia CARA (para el jugador A): 0.75+1 + 0.25*-1= 0.5

Valor esperado de la estrategia CRUZ (para el jugador A :0.75*-1 + 0.25*1 = -0.5

Valor esperado de la estrategia CARA (para el jugador B): 0.75+1 + 0.25*-1= 0.5
Valor esperado de la estrategia CRUZ (para el jugador B): 0.75*-1 + 0.25*1 = -0.5

ESTA ELECCIÓN DE PROBABILIDADES NO


GENERA UN EQUILIBRIO DE NASH

VÍCTOR R. ZURITA SALDAÑA 24


TEORÍA DE JUEGOS

JUEGOS SECUENCIALES

Los jugadores mueven de manera consecutiva


Cada jugador debe considerar las reacciones del otro jugador
Revisar el juego de los cereales
FORMA EXTENSIVA DE UN JUEGO
(-5,-5)
crujiente

crujiente EMPRESA 2
dulce (10,20)
EMPRESA 1
crujiente (20,10)
dulce
EMPRESA 2
dulce (-5,-5)

VÍCTOR R. ZURITA SALDAÑA 25


TEORÍA DE JUEGOS

RAZONAMIENTO HACIA ATRÁS

Ventaja de ser primero

MOVIMIENTO ESTRATÉGICO

Es aquél que influye en la decisión de la otra persona de una manera


favorable a nosotros mismos, modificando sus expectativas sobre
nuestra propia conducta. Restringimos las opciones del otro limitando
nuestra propia conducta.

VÍCTOR R. ZURITA SALDAÑA 26


Arbitraje de oferta final
• Tomado de GIBBONS, R. Un primer curso de teoría de juegos, Antoni
bosch editor, s.a. p23
• Supongamos que las partes en disputa son una empresa y un
sindicato, y que la disputa es acerca de los salarios. Supongamos
que el juego se desarrolla de la siguiente manera: primero, la
empresa y el sindicato realizan simultáneamente ofertas,
denominadas we y ws. En segundo lugar, el árbitro elige una de las
dos ofertas. Supongamos que el árbitro tiene un acuerdo ideal que
le gustaría imponer, que denominamos x. Supongamos además
que, tras observar las ofertas de las partes, we y ws, el árbitro
simplemente elige la oferta más cercana a x: siempre que we < ws el
árbitro elige we si x < (we + ws) / 2 y elige ws si x > (we + ws) / 2. Si x =
(we + ws) / 2 es irrelevante. El valor de x es conocido por el árbitro,
no por las partes. Asuma que x se distribuye según alguna función
de densidad conocida.

VÍCTOR R. ZURITA SALDAÑA 27


Sol.- Definiremos el juego en su forman normal:
a) Jugadores: empresa y sindicato
b) Estrategias: we, ws. Alternativamente se puede expresar wi Є[0,∞[, i = e, s
c) Ganancias recibidas por cada jugador con cada combinación de
estrategias posibles: su función de beneficios.
• Supongamos que el juego se desarrolló así:
𝐴𝑚𝑏𝑜𝑠 𝑟𝑒𝑎𝑙𝑖𝑧𝑎𝑛 𝑠𝑖𝑚𝑢𝑙𝑡á𝑛𝑒𝑎𝑚𝑒𝑛𝑡𝑒 𝑜𝑓𝑒𝑟𝑡𝑎𝑠 𝑠𝑎𝑙𝑎𝑟𝑖𝑎𝑙𝑒𝑠 𝑤𝑒 𝑦 𝑤𝑠
ቋ 𝑇𝑒𝑛𝑒𝑚𝑜𝑠 𝑢𝑛 𝑗𝑢𝑒𝑔𝑜 𝑒𝑠𝑡á𝑡𝑖𝑐𝑜
Á𝑟𝑏𝑖𝑡𝑟𝑜 𝑒𝑙𝑖𝑔𝑒 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑜𝑓𝑒𝑟𝑡𝑎𝑠
• Supongamos también que el árbitro tiene un acuerdo ideal que le gustaría
imponer x. Se sabe que tras observar las ofertas de las partes el árbitro
elige aquella que se encuentre más cerca de este x según:

Ambas partes creen que x se distribuye


según una distribución de probabilidad
F(x) con la correspondiente función de
densidad f(x)[1]

VÍCTOR R. ZURITA SALDAÑA 28


Definamos las probabilidades de que el árbitro elija we o ws de la
siguiente manera:

Entonces el empresario querrá minimizar el valor esperado del salario


teniendo como variable de control a we. Análogamente el sindicato
querrá maximizar dicho valor esperado teniendo como variable de
control a ws
Así, cada uno de estos agentes escogerá su mejor estrategia
asumiendo que el otro asume también su mejor estrategia.
Llamaremos “mejor estrategia” a 𝑤𝑒∗ y 𝑤𝑠∗ . Por lo tanto, si 𝑤𝑒∗ , 𝑤𝑠∗
representan un equilibrio de Nash, estos valores deberán ser solución
de las siguientes optimizaciones:

VÍCTOR R. ZURITA SALDAÑA 29


La variable de control para el empresario es el salario que ofrece asumiendo 𝑤𝑠∗
como dado

La variable de control para el sindicato es el salario que pide asumiendo 𝑤𝑒∗


como dado
• Planteamos las condiciones de primer orden respectivas y tendremos:

VÍCTOR R. ZURITA SALDAÑA 30


VÍCTOR R. ZURITA SALDAÑA 31
𝑤𝑠∗ − 𝑤𝑒∗ = 2𝜋𝜎 2 … 𝛼
• Hasta el momento tenemos que ൝ ∗
𝑤𝑠 + 𝑤𝑒∗ = 2𝜇 … (𝛽)
• Resolviendo estas ecuaciones llegamos a que

𝜋𝜎2 𝜋𝜎2
𝑤𝑠∗ =𝜇+ y 𝑤𝑒∗ =𝜇−
2 2

Los valores hallados representan un equilibrio de Nash puesto que son


las mejores respuestas de un jugador frente al otro. La interpretación
que podemos darle a estos valores es que estos, en una situación
óptima, se encuentran alrededor de la media de la distribución de x.
Esto tiene sentido puesto que, si bien cada uno de ellos se encontrará
mejor si se acepta un salario que se aleje más de la media, las
probabilidades de que sea elegido también disminuyen. Por eso, no
habrá incentivos a alejarse demasiado de la media.

VÍCTOR R. ZURITA SALDAÑA 32

También podría gustarte