Teoria de Juegos 20101

TEORIA DE JUEGOS
Juegos
• Un juego es cualquier situación de decisión
caracterizada por una interdependencia
estratégica, gobernada por reglas y con un
resultado definido.
• El resultado que obtiene una empresa depende

no sólo de la estrategia que elige, sino también
de las estrategias que eligen los competidores
guiados por sus propios intereses.
• La solución de un juego debería indicar a
cada jugador qué resultado esperar y cómo
alcanzarlo.
• Los participantes de un juego intentan

obtener el mejor resultado para sus intereses.
Por lo tanto un juego es un problema de
maximización, uno para cada jugador.
• La teoría de juegos, como cualquier otra

teoría general, provee vinculaciones: muestra
cómo situaciones aparentemente diversas
tienen la misma estructura lógica.
• La interdependencia genera muchas veces
competencia entre los participantes del
juego, pero los jugadores también pueden
tener algunos intereses compartidos.
• Un juego puede ser comparado con la
división de una torta cuyo tamaño puede
aumentar o reducirse como resultado de
acciones de los jugadores.
• Los jugadores tienen un interés común en
agrandar la torta, pero tendrán intereses en
conflicto al momento de acordar la división de
la torta.
Racionalidad estratégica
• En teoría de juegos la racionalidad significa que cada
jugador hace lo mejor que puede dada la información
con que cuenta al momento de tomar la decisión. Ser
racional significa no cometer el mismo error en forma
consistente.
• Dada la interdependencia entre jugadores, una
decisión racional debe basarse en una predicción de
la respuesta de otros jugadores. Al ponerse uno en
los zapatos del otro y predecir entonces la acción
que el otro tomaría, se puede elegir el mejor curso de
acción propio.
Información perfecta e imperfecta
• Un jugador tiene información perfecta si

conoce exactamente lo que ocurre cada vez
que toma una decisión
• Un juego tiene información perfecta si cada

jugador tiene información perfecta
• Si algún jugador no tiene información

perfecta, el juego es de información
imperfecta.
Juegos con información imperfecta
• La información es imperfecta si el jugador, en el momento

de tomar una decisión, no sabe dónde está en el juego.
• Para poder incluír información imperfecta en un juego
necesitamos un mecanismo para representar el azar y
otro que muestre los efectos del azar sobre el juego.
• Un conjunto de información asignado al azar significa que
es el azar el que debe realizar su jugada.
• Las ramas que parten de un nodo de azar representan
probabilidades.
• Cualquier conjunto de información que contiene más de
un nodo refleja que el jugador tiene información
imperfecta.
La teoría de juegos y las decisiones
estratégicas
• Juegos no cooperativos y cooperativos
– Juegos cooperativos:
• Los participantes pueden negociar
contratos vinculantes que les permiten
planear estrategias conjuntas.
– Ejemplo: la negociación entre un
comprador y un vendedor sobre el
precio de un bien o un servicio o una
inversión conjunta de dos empresas (por
ejemplo, Microsoft y Apple).
– Los contratos vinculantes son posibles.
La teoría de juegos y las decisiones
estratégicas
• Juegos no cooperativos y cooperativos
– Juegos no cooperativos:
• No es posible negociar y hacer cumplir un
contrato vinculante entre jugadores.
– Ejemplo: dos empresas rivales tienen en
cuenta la conducta probable de cada una,
cuando fijan independientemente sus
precios y sus estrategias publicitarias para
capturar más cuota de mercado.
– Los contratos vinculantes no son posibles.
Capítulo 13: La teoría de

juegos y la estrategia
competitiva
JUEGOS NO COOPERATIVOS
Las estrategias dominantes

• La estrategia dominante:
– Estrategia que es óptima
independientemente de cómo se
comporten los competidores.
– Un ejemplo:
• Las empresas A y B venden productos rivales.
• Tienen que decidir si emprenden o no una

campaña publicitaria.
La matriz de pagos en el juego de la

publicidad
Empresa B
No hacer
Hacer publicidad publicidad
Hacer publicidad
10, 5 15, 0
Empresa A
No hacer
publicidad 6, 8 10, 2
Las estrategias dominantes
• Estrategias dominantes:
– “Elijo mi mejor estrategia posible,
independientemente de lo que tú hagas”.
– “Eliges tu mejor estrategia posible,
independientemente de lo que yo haga”.
ESTRATEGIAS DEBILMENTE
DOMINADAS
Empresa B
No hacer
Hacer publicidad publicidad
Hacer publicidad
2, -2 2, -2
Empresa A
No hacer
publicidad 1, -1 5, -5
• Juegos sin estrategia dominante:
– La mejor decisión de un jugador que no utiliza
estrategia dominante dependerá de lo que el
otro jugador haga. Hacer No hacer
publicidad publicidad
Hacer publicidad
10, 5 15, 0
Empresa A
No hacer
publicidad 6, 8 20, 2
Juegos no cooperativos con
decisiones simultáneas
• Construir la matriz de pagos
• Si uno tiene una estrategia dominante, usarla
• Si uno no tiene una estrategia dominante pero
el otro jugador sí la tiene, asumir que la va a
emplear y actuar en consecuencia.
• Si nadie tiene una estrategia dominante,
simplificar el problema eliminando las
estrategias dominadas.
• Si no hay estrategias dominantes ni dominadas,
buscar un equilibrio .
Juegos de suma cero y suma variable
• Los juegos en que los intereses de los

jugadores son contrapuestos se llaman
juegos de suma cero
• Los juegos en que los intereses de los
jugadores no se hallan totalmente
contrapuestos se llaman juegos de suma
variable
• La resolución de juegos de suma variable es
más difícil que la resolución de juegos de
suma cero
Juegos de suma cero y suma constante
• En un juego de suma cero, para cada posible

resultado del juego la suma de las utilidades
de los dos jugadores suma cero: lo que un
jugador gana, el otro lo pierde.
u1 + u 2 = 0
• En un juego de suma cero no se crea valor, se
redistribuye valor.
• En un juego de suma constante la suma de las
utilidades de los jugadores es una constante k.
Transformando un juego de suma
constante a suma cero
• Se transforman las utilidades absolutas de cada
jugador en ventajas relativas al otro jugador.
u1 + u2 = k
v1 = u1 -u2
v2= u2- u1
v1 + v2 = 0
v1 = 2 u1 - k
v2 = 2 u2 - k
v1 + v2 = 0
Juegos de suma constante, dos
jugadores
• Una estrategia dominante es al menos tan
buena como cualquier otra estrategia ante
cualquier contingencia y mejor al menos
ante alguna contingencia.
• Si hay una estrategia dominante no

importa lo que haga el adversario: lo mejor
para uno es jugar la estrategia dominante.
Equilibrio de Nash
Borel (1921) y Von Neumann (1959) demostraron en los
años 20 que todo juego de suma cero tiene un equilibrio
minimax en el que cada jugador actúa tratando de
asegurarse el máximo beneficio ante lo peor que le
puede hacer el otro jugador. Aunque útil para analizar
temas de defensa, tiene un campo limitado de
aplicaciones, pues en la mayoría de los juegos, la suma
de los pagos en los nodos terminales no es constante,
como lo veremos en el Dilema del prisionero. En su tesis
de doctorado, John Nash (1950) definió el equilibrio que
lleva su nombre, y demostró su existencia en todos los
juegos no-cooperativos.
• Equilibrio de Nash:
– “Elijo mi mejor estrategia posible, a la vista de
lo que tú haces”.
– “Eliges tu mejor estategia posible, teniendo
en cuenta lo que yo he elegido”.
Equilibrios Eficientes e Ineficientes
• Un equilibrio es eficiente si no hay un
resultado alternativo que deje a algunos
jugadores mejor y a ninguno peor.
• Un equilibrio no es eficiente si hay algún otro
resultado que todos encuentren preferible.
• En un juego puede haber tanto equilibrios
eficientes como equilibrios ineficientes.
• Un equilibrio ineficiente puede
corresponderse con una conducta
perfectamente racional desde el punto de
vista individual.
ESTRATEGIA MAXIMIN
Se llama juego de suma cero aquél en el que lo que
gana un jugador es exactamente igual a lo que
pierde o deja de ganar el otro.
MATRIZ DE PAGOS
Las estrategias
del otro jugador
A B C
A 9|1 1|9 2|8

Mi estrategia B 6|4 5|5 4|6
C 7|3 8|2 3|7
Para descubrir qué estrategia me conviene más vamos a analizar la matriz que
indica mis pagos, la de fondo verde. Ignoro cuál es la estrategia (la tarjeta) que
va a ser elegida por el otro jugador. Una forma de analizar el juego para tomar
mi decisión consiste en mirar cuál es el mínimo resultado que puedo obtener
con cada una de mis cartas. En la siguiente tabla se ha añadido una columna
indicando mis resultados mínimos.
MATRIZ DE MIS PAGOS

La estrategia del otro

jugador
A B C mínimos
A 9 1 2 1
Mi
B 6 5 4 4
estrategia
C 7 8 3 3
De todos esos posibles resultados mínimos, el que prefiero es 4 ya que es el
máximo de los mínimos. La estrategia MAXIMIN consiste en elegir la
tarjeta B ya que esa estrategia me garantiza que, como mínimo, obtendré 4.
¿Podemos prever la
estrategia del otro jugador? MATRIZ DE PAGOS AL OTRO
Supongamos que el otro JUGADOR
jugador quiere elegir también
su estrategia MAXIMIN. La estrategia del
Mostramos ahora sólo los otro jugador
pagos asignados al otro
jugador en los que A B C
destacamos el pago mínimo
A 1 9 8
que puede obtener para cada
una de sus estrategias. B 4 5 6
Mi
Subrayamos el máximo de los C 3 2 7
estrategia
mínimos y su estrategia
mínimo
maximin. 1 2 6
s
Su estrategia MAXIMIN consiste por tanto en jugar la

carta C con lo que se garantiza que, al menos,
obtendrá 6.
Éste es un juego con solución estable. Ninguno de los jugadores
siente la tentación de cambiar de estrategia. Supongamos que se
empieza a repetir el juego una y otra vez. Yo jugaré siempre mi
estrategia maximin (B) y el otro jugará siempre su estrategia
maximin (C). Cada uno sabe lo que jugará el otro la siguiente vez.
Ninguno estará tentado de cambiar su estrategia ya que el que
decida cambiar su estrategia perderá.
MATRIZ DE PAGOS
Las estrategias Se llama
del otro jugador punto de
silla al
resultado en
A B C el que
coinciden las
A 9|1 1|9 2|8 estrategias
maximin de
Mi estrategia B 6|4 5|5 4|6 ambos
jugadores.
C 7|3 8|2 3|7
No todos los juegos tienen un punto de silla, una solución estable. La
estabilidad del juego anterior desaparece simplemente trastocando el
orden de las casillas BB y BC:
MATRIZ DE PAGOS AL
MATRIZ DE MIS PAGOS
OTRO JUGADOR
La estrategia La estrategia
del otro jugador del otro jugador
A B C A B C
Mi A 9 1 2 A 1 9 8
Mi
estrate B 6 4 5 B 4 6 5
estrategia
gia C 7 8 3 C 3 2 7
En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia

maximin del otro jugador sigue siendo la C. Pero la solución ahora ya no
es estable. Si jugamos repetidas veces y yo repito mi estrategia maximín,
B, el otro estará tentado de cambiar su estrategia, pasando de la C a la B
con lo que obtendrá un pago mayor, 6 en vez de 5.
El juego de la localización en una
playa
• Caso práctico:
– Dos competidores, L y C, están planeando
vender bebidas en la playa.
– La playa tiene una longitud de 200 metros.
– Los bañistas están repartidos por igual a lo
largo de toda la playa.
– El precio de L es igual al precio de C.
– El comprador irá a comprar un refresco al
puesto más cercano.
El juego de la localización en una playa
Mar
C
L
0 B Playa A 200 metros
¿Dónde deben situarse los

competidores? ¿Dónde se encuentra el
equilibrio de Nash?
Juegos de suma variable con dos
jugadores
• En un juego de suma variable la suma de las utilidades de
los jugadores es diferente según los resultados.
• Se hace entonces necesario distinguir entre equilibrio y
solución.
• Un resultado ha de ser un equilibrio (condición necesaria)
antes de poder ser candidato a solución: si un resultado no
es un equilibrio, algún jugador puede mejorar su situación
si cambia su estrategia.
• La condición suficiente para lograr una solución es que el
equilibrio provenga de estrategias no dominadas desde el
punto de vista de cada jugador.
• Satisfacer condiciones suficientes no garantiza que haya
una solución única.
El dilema del prisionero,
tal como lo hemos Dilema del prisionero
descrito, es un juego de Matriz de Pagos
suma no nula, (orden de preferencias)
bipersonal, biestratégico Preso Y
y simétrico. lealtad traición
lealtad 2\2 4\1
Preso X
traición 1\4 3 \ 3*
La aplicación de la estrategia maximín conduce en este

juego a un resultado subóptimo. Al no conocer la decisión
del otro preso, la estrategia más segura es traicionar. Si
ambos traicionan, el resultado para ambos es peor que si
ambos hubieran elegido la lealtad. Este resultado es un
punto de equilibrio de Nash y está señalado en la matriz
mediante un asterisco. Pero, no es eficiente(2/2) es mejor.
HALCÓN-PALOMA:
MATRIZ DE PAGOS(preferencias)
Jugador Y

Paloma Halcón
Jugador Paloma 2º,2º 3º,1º*

X Halcón 1º,3º* 4º,4º
Hay aquí dos resultados que son equilibrios de Nash: cuando las
estrategias elegidas por cada jugador son diferentes; en la matriz
aquí representada esas soluciones están marcadas con un
asterisco. Otra notable diferencia de este juego con otros es la
importancia que aquí adquiere el orden en que los jugadores
eligen sus estrategias. Como tantas veces en la vida real, el
primero que juega, gana. El primero elegirá y manifestará la
estrategia Halcón con lo que el segundo en elegir se verá
obligado a elegir la estrategia Paloma, la menos mala.
La guerra de los sexos ELLA
Preferencias Fútbol Discoteca
Fútbol 1\2 3 \ 3*
ÉL
Discoteca 4\4 2\1
Es un juego sin repetición y sin transferencia de utilidad. Sin repetición
significa que sólo se juega una vez por lo que no es posible tomar
decisiones en función de la elección que haya hecho el otro jugador en
juegos anteriores. Sin transferencia de utilidad significa que no hay
comunicación previa por lo que no es posible ponerse de acuerdo,
negociar ni acordar pagos secundarios ("Si vienes al fútbol te pago la
entrada"). El problema que se plantea es simplemente un problema de
coordinación. Se trata de coincidir en la elección. Al no haber
comunicación previa, es posible que el resultado no sea óptimo. Si cada
uno de los jugadores elige su estrategia maximín el pago que recibirán
(3\3) es subóptimo. Esa solución, marcada en la matriz con un asterisco,
no es un punto de equilibrio de Nash ya que los jugadores están tentados
de cambiar su elección: cuando ELLA llegue a la discoteca y observe que
ÉL se ha ido al fútbol, sentirá el deseo de cambiar de estrategia para
obtener un pago mayor.
El modelo que hemos visto es un juego simétrico ya que jugadores
o estrategias son intercambiables sin que los resultados varíen.
Podemos introducir una interesante modificación en el juego
convirtiéndolo en asimétrico a la vez que nos aproximamos más al
mundo real. Supongamos que las posiciones 2ª y 3ª en el orden de
preferencias de ÉL se invierten. ËL prefiere ir solo al Fútbol más que
ir con ELLA a la Discoteca. La matriz de pagos queda como sigue:
ELLA
Fútbol Discoteca
Fútbol 1 \ 2* 2\3
ÉL
Discoteca 4\4 3\1
El resultado, marcado con un asterisco, es un óptimo, un punto de silla,

una solución estable, un punto de equilibrio de Nash. Obsérvese que
esta solución conduce a una situación estable de dominación social del
jugador que podríamos calificar como el más egoísta.
Conflicto y Cooperación
• Los dos aspectos esenciales de cualquier

situación estratégica son el conflicto y la
cooperación.
• Es poco usual que los objetivos de los
participantes sean idénticos. También es
inusual que la situación sea de conflicto
puro (suma cero).
• En general hay algunas posibilidades de
cooperación que generen una ganancia
mutua resultante de la interacción.
• En un juego de suma cero, las acciones
de un jugador afectan la distribución pero
no el tamaño de la torta.
• La mayor parte de los juegos de negocios
no son de suma cero: el tamaño de la torta
queda determinado por las acciones de los
jugadores, por lo que puede pasar que
acciones individuales tendientes a lograr una
porción mayor resulten en un menor tamaño
de la torta.
• El juego de competencia entre empresas con
un resultado ineficiente es bastante común.
• Los jugadores no tienen incentivos para tomar
en cuenta los efectos de sus decisiones sobre
otros jugadores, por lo que se llega con
frecuencia a resultados ineficientes.
• Puede haber oportunidades de mutua ganancia
provenientes de la interacción entre jugadores,
pero la lógica de la situación implica que no se
obtengan esas ganancias.
Juegos con transferencia de utilidad
(Juegos cooperativos)
Los jugadores pueden comunicarse entre sí y negociar un
acuerdo ANTES de los pagos, la problemática que surge
es completamente diferente. Se trata ahora de analizar la
posibilidad de formar una coalición de parte de los
jugadores, de que esa coalición sea estable y de cómo se
deben repartir las ganancias entre los miembros de la
coalición para que ninguno de ellos esté interesado en
romper la coalición.
En los juegos con transferencia de utilidad se llama

solución a una propuesta de coalición y de reparto de los
pagos que garantice estabilidad, es decir, en la que
ninguno de los participantes de una coalición vencedora
pueda estar interesado en romper el acuerdo.
La cooperación oligopolística en la
industria de contadores de agua
• Características del mercado
– Cuatro empresas productoras de contadores:
• Rockwell International (35 por ciento), Badger
Meter, Neptune Water Meter Company, y Hersey
Products (Badger, Neptune, y Hersey
conjuntamente tienen una cuota del orden del 50 ó
55 por ciento).
– Demanda muy inelástica:
• El coste de los contadores representa una parte
muy pequeña del coste total de suministrar agua.

– Demanda estable.
– Larga relación entre consumidores y
proveedores:
• Barrera a la entrada.
– Economías de escala:
• Barrera a la entrada.
– Este es un ejemplo del dilema del prisionero:
• Bajar los precios hasta un nivel más competitivo.
• Cooperar.
– Juego repetido.
• Pregunta:
– ¿Por qué ha prevalecido la cooperación sobre
la bajada de los precios?
Cournot:
Cournot desarrolló en 1838 un equilibrio entre empresas que compiten en
forma simultanea fijando cantidades. Se adelanto en más de un siglo a
Nash. Resolvió su problema de interacción entre dos empresas cuyas
decisiones óptimas de producción dependían de lo que produzca la otra,
encontrando un equilibrio de Nash, sólo que no lo explícito cómo tal.
Supongamos que tenemos dos empresas compitiendo, donde q1 y q2
son las cantidades producidas por cada una. La oferta total será Q = q1 +
q2. Como el precio de mercado dependerá (lo mismo que en un
monopolio) de las cantidades ofrecidas por ambas empresas, cuanto más
produzcan ambas menor será el precio, por lo tanto, cada empresa debe
tener en cuenta cuanto producirá la otra para poder prever el precio, y por
consiguiente los ingresos, que recibirá por sus ventas. Cuando la
empresa busca maximizar su beneficio igualando ingreso marginal y
costo marginal, incorpora en la formulación del ingreso (igual a precio por
cantidad) la cantidad que cree que producirá la otra, de modo de tenerla
en cuenta al resolver su oferta óptima de bienes. Ambas empresas hacen
lo mismo, y así se obtiene un equilibrio colusivo cooperativo de Nash. A
cada empresa le conviene ofrecer más cuanto menos ofrezca la otra, y
viceversa.
Para entender la resolución gráfica, primero debemos entender la
solución matemática. Veamos lo que hace la empresa 1: busca
maximizar su Beneficio = IT – CT donde IT = P.Q y donde a su vez P
es función de Q, por ejemplo si tenemos una función de demanda del
mercado lineal P = a – Q resulta que P = a –q1- q2. Entonces, B1= (a–
q1–q2).q1– Ct(q1) donde nos dice que la formulación del precio no sólo
depende de cuanto produzca la empresa 1, sino también cuanto la
empresa 2. El costo total podemos imaginarlo como una contante c
por cantidad, entonces para las empresas 1 y 2 resulta respectivamente:
B1 = (a – q1 –q2).q1 – c. q1
B2 = (a – q1 –q2).q2 – c. q2
Para obtener el óptimo cada empresa deriva el beneficio respecto a su

cantidad igualando a cero, que es lo mismo que igualar costo marginal e
ingreso marginal, ya que estamos derivando el costo total y el ingreso
total respecto a la cantidad, obteniéndose:
dB1/dq1 = a - 2q1 - q2 – c = 0
dB2/dq2 = a - q1 - 2q2 – c = 0
Luego debemos resolver este sistema de ecuaciones, para obtener las
cantidades óptimas que ofrecerá cada empresa. Ello se puede hacer
fácilmente despejando q1 en la primer ecuación, y reemplazándolo en q1
de la segunda. O sea, primero hacemos lo siguiente:
q1 = (a – c – q2) / 2
q2 = (a – c – q1) / 2
Estas ecuaciones se llaman curvas de reacción, ya que muestra como
cambia la cantidad óptima que ofrecerá cada empresa según lo que
ofrezca la otra. Luego, reemplazando q2 en q1 resulta que:
q1 = ( a–c–(a–c– q1)/2) ) / 2 y despejando q1 obtenemos
q1= (a–c)/3
Análogamente se obtiene para la otra empresa que q2=(a–c)/3, por lo
que en el equilibrio de Nash de Cournot lo óptimo para ambas
empresas es producir lo mismo, entonces q1=q2 y resulta que la
oferta total de ambas empresas sumadas es Q = 2.(a –c)/3.
Esta cantidad es mayor a la que ofrecerían en monopolio, pero menor a la que
ofrecerían en competencia perfecta, por lo que en una colusión los
consumidores están mejor que en monopolio, aunque siga siendo menos
eficiente que en competencia.
Respecto a las empresas, sus beneficios serían mayores en
monopolio, pero menores en competencia, y esto las incentiva a
cooperar y coludir a la Cournot en lugar de intentar fijar cada una un
monopolio y terminar compitiendo, lo que en definitiva reduciría más
sus beneficios. Todo esto se puede demostrar matemáticamente,
remplazando la cantidad en el precio y luego estos dos en el beneficio.
El beneficio en monopolio se obtiene de resolver en Bi=(a–qi).qi–c.q.i donde
i=1,2. Efectuando la derivada respecto a la cantidad, se obtiene que a–2qi-c =
0 de donde resulta que qi = (a-c)/2. Por otra parte, la cantidad ofrecida en
caso de competencia perfecta se obtiene efectuando la igualación del costo
marginal al precio, y reemplazando luego en la función de demanda, o sea, P =
c y entonces Q = a –c, quedando la cantidad de cada una en qi = (a-c)/2. Así,
como resulta que (a-c) > 2.(a-c)/3 > (a-c)/2 entonces la cantidad total ofrecida
es mayor en competencia que en colusión, y mayor en colusión que en
monopolio.
Si graficamos las curvas de reacción de ambas empresas (R1 y R2) en el
espacio q1 y q2, recordando que q1 = (a–c–q2)/2 entonces si q2=0 resulta
q1=(a-c)/2 que es la cantidad de monopolio que ofrece la empresa 1 (punto C).
Si q2=(a-c)/3 entonces q1=(a-c)/3 y cada una produce la cantidad de Cournot,
justo donde se cortan ambas curvas de reacción (punto A), y sí cada empresa
produce la cantidad de competencia perfecta estamos en el punto B.
q2
R1
B
R2
C
0 (a-c)/3 (a-c)/2 (a-c)
q1
Los juegos repetidos
• Las empresas oligopolísticas participan en
un juego repetido.
• Cada vez que se repite el dilema del

prisionero, las empresas pueden
ganarse una reputación sobre su
conducta y estudiar la conducta de sus
competidores.
ESTRATEGIAS REACTIVAS
Cuando un juego se repite varias veces, cada jugador puede adoptar
su estrategia en función de las decisiones que haya adoptado antes
su oponente. Las estrategias reactivas son las que se adoptan en los
juegos con repetición y se definen en función de las decisiones
previas de otros jugadores.
El ejemplo más conocido es la estrategia OJO POR OJO (en inglés
TIT FOR TAT). Supongamos que dos jugadores repiten de forma
indefinida una situación con pagos de forma del Dilema del
Prisionero:
DILEMA DEL PRISIONERO

MATRIZ DE PAGOS
Jugador columna

Cooperar Traicionar
Cooperar 2º,2º 4º,1º
Jugador
fila Traicionar 1º,4º 3º,3º*
El problema de la fijación de los precios
Empresa 2
Precio bajo Precio alto
Precio bajo 10, 10 100, -50
Empresa 1
Precio alto -50, 100 50, 50

El problema de la fijación de los precios
• Juego no
repetido:
Empresa 2
– La estrategia es
bajar el precio 1 y
bajar el precio 2. Precio bajo Precio alto
• Juego repetido: Precio bajo 10, 10 100, -50

– La estrategia del Empresa 1
“ojo por ojo” es
la que da mejores Precio alto -50, 100 50, 50
resultados.
• Conclusión:
– Participación en un juego repetido:
• El dilema del prisionero puede tener un
resultado de cooperación, utilizando la
estrategia del “ojo por ojo”.
• Conclusión:
– Es muy probable que esto ocurra en un
mercado con:
• Pocas empresas.
• Demanda estable.
• Coste estable.
- Es difícil que se produzca una
cooperación total, porque estos
factores pueden variar a largo plazo.
Los juegos secuenciales
• Los jugadores mueven consecutivamente.
• Deben pensar en las acciones y

reacciones de los demás jugadores.
• Ejemplos:
– La reacción de responder a la campaña
publicitaria del competidor.
– Decisión de un posible competidor de entrar
en el mercado.
– Reacciones ante una nueva política
reguladora.
Stackelberg:
Stackelberg desarrollo en 1934 un modelo de duopolio

dinámico (donde las decisiones no se toman en forma
simultanea sino secuencial). Supongamos que tenemos dos
empresas que deciden competir por cantidad. Una juega
primero (decide cuanto producir) y la llamaremos “líder”,
y otra juega segunda (fijando su producción sólo luego
de ver cuanto produce la líder) y la llamaremos
“seguidora”. La demanda total del mercado se repartirá
entre ambos, siendo una la demanda que enfrenta el
seguidor, y el resto (llamado “demanda residual”) la que
abastece el líder. Este tipo de conducta parecen haber
asumido Ford y Chrysler como seguidoras de General Motors
en determinados momentos de la historia en la industria
automovilística norteamericana.
El juego se desarrolla del siguiente modo: la empresa líder
elige la cantidad qL que producirá y la empresa seguidora
luego de observar qL elige la cantidad qs. Supongamos
que la demanda de mercado es (precio) P = a – Q, donde
como sabemos Q = qL + qs. Para obtener el equilibrio del
juego se utiliza backward induction (inducción hacia atrás),
efectuándose primero la maximización del beneficio del
seguidor, para obtener su regla de comportamiento (curva
de reacción), que nos indica cuanto producirá el seguidor
en función de cuanto produzca el líder, es decir, sabiendo
cual es la demanda de mercado y cuanto abastece el líder,
la empresa seguidora sabe cuanto debe producir según la
porción de demanda que queda sin cubrir. Escribamos
entonces Bs = ( a – qL - qs). qs – c.qs donde
nuevamente hemos supuesto que el costo marginal es
constante. Efectuando la derivada respecto a qs,
obtenemos:
dBs/dqs = a - qL – 2qs – c = 0
Despejando qs obtenemos la reacción del seguidor a una
cantidad arbitraria fijada por el líder:
qs = (a – qL –c)/2 *
Esta ecuación de reacción es idéntica a la que apareció
antes en Cournot, pero la diferencia es que ahora es la
reacción del seguidor a lo que produce el líder, mientras que
antes era la mejor respuesta a una cantidad hipotética que
será simultáneamente escogida por la otra empresa. El líder (y
este es un supuesto fuerte) conoce la regla de decisión del
seguidor, y debe tenerla en cuenta cuando decide cuanto
producir, ya que ello impactará sobre la cantidad total a ser
ofrecida al mercado, con la consecuente influencia en el
precio. Entonces, debemos incorporar la curva de reacción del
seguidor en la maximización de beneficios del líder, lo que se
efectúa reemplazando la regla para qs obtenida arriba (*) en la
qs de la función de beneficios del líder:
BL = (a-qL-qs).qL – c.qL = ( a-qL- (a – qL –c)/2 ).qL –c.qL
Luego derivando respecto a qL se obtiene:

dBL/dqL = a – 2qL – a/2 + qL + c/2 –c = a/2 –c/2 –qL = 0
Despejando qL resulta ser qL=(a-c)/2 que es la cantidad óptima que
produce el líder, y reemplazando dicha cantidad en la curva de reacción
del seguidor, obtenemos la cantidad de producción óptima para este, es
decir qs = (a – qL –c)/2 = (a - (a-c)/2 – c) /2 = (a-c)/4
Con lo cual hemos resuelto el equilibrio de Stackelberg por inducción
hacia atrás siendo las cantidades óptimas del líder y el seguidor
respectivamente (a-c)/2 y (a-c)/4. Es importante no confundir la regla
de conducta del seguidor con la cantidad óptima que ofrecerá el
seguidor, la cual sólo puede ser obtenida luego de saber cuanto produce
el líder.
El equilibrio de Counot era un ejemplo de un equilibrio de Nash donde
sólo había un equilibrio posible. Pero en el caso de Stackelberg al ser de
decisiones sucesivas se incorpora la posibilidad de que existan múltiples
equilibrios de Nash, de los que sólo uno coincide con el obtenido por
inducción hacia atrás.
La
La forma
forma extensiva
extensiva de
de un
un juego
juego
• Caso práctico:
– Dos nuevos tipos de cereales (los crujientes y los
dulces).
– El éxito se producirá si cada una de ellas produce
un solo tipo de cereal.
– El cereal dulce se venderá mejor que el crujiente.
– Ambos productos aportan beneficios con un solo
productor.
El problema modificado de la elección de un
producto
Empresa2
Crujiente Dulce
Crujiente
-5, -5 10, 20
Empresa 1
Dulce
20, 10 -5, -5
producto
• Pregunta:
– ¿Cuál es el resultado Empresa 2
más probable si Crujiente Dulce
ambas empresas
toman sus decisiones Crujiente
simultánea e -5, -5 10, 20
independientemente, yEmpresa 1
sin tener información
de las intenciones de Dulce
20, 10 -5, -5
la otra empresa?
producto
La
La forma
forma extensiva
extensiva de
de un
un juego
juego
• Supongamos que la Empresa 1 lanza al

mercado su cereal antes de que lo haga
la Empresa 2 (juego secuencial).
• Pregunta:
– ¿Cuál será el resultado de este juego?
La
La forma
forma extensiva
extensiva de
de un
un juego
juego
• La forma extensiva de un juego

– Representación por medio de un árbol de
decisiones:
• Se comienza por el final para comprobar la
mejor secuencia de movimientos de la
Empresa 1.
El juego de la elección de un producto en su
forma extensiva
Crujiente -5, -5
Crujiente Empresa 2
Dulce 10, 20
Empresa1
Crujiente 20, 10
Dulce Empresa 2
Dulce -5, -5
• La ventaja de ser el primero en

mover:
– En este juego de la elección de un producto,
el que mueve primero tiene una clara ventaja.
Amenazas, compromisos y credibilidad
• Movimientos estratégicos
– ¿Qué medidas puede tomar una empresa
para conseguir una ventaja en el
mercado?
• Disuadir a las posibles competidoras de
que entren en el mercado.
• Inducirlas a subir los precios, reducir el nivel de
producción o abandonar el mercado.
• Llegar a un acuerdo implícito con sus
competidoras que le resulte favorable.
• ¿Cómo realizar el primer movimiento?

– Demostrar la intención de comprometerse.
– La Empresa 1 debe limitar su propia
conducta de tal manera que convenza a la
Empresa 2 de que está comprometida.
• Las amenazas vanas:

– Si una empresa se siente perjudicada al
cobrar un precio bajo, la amenaza del precio
bajo no resulta creíble para sus
competidores.
La fijación de los precios de las computadoras y
los procesadores de textos
Empresa2
Precio alto Precio bajo
Precio alto 100, 80 80, 100
Empresa 1
Precio bajo 20, 0 10, 20

La fijación de los precios de las computadoras y los
procesadores de textos
• Pregunta:
– ¿Puede la Empresa 2
Empresa 1 Precio alto Precio bajo
obligar a la
Empresa 2 a fijar Precio alto 100, 80 80, 100
un precio más
alto mediante la Empresa 1
amenaza de que Precio bajo 20, 0 10, 20
va a bajar sus
precios?
• Caso práctico:
– Race Car Motors, Inc. (RCM) produce
automóviles.
– Far Out Engines (FOE) produce motores
especiales y vende la mayoría a RCM.
– Juego consecutivo en el que RCM es la empresa
líder.
– FOE no tiene el suficiente poder para ser una
amenaza si decide ampliar su mercado, ya que
las decisiones de producción dependen de RCM.
El problema de la elección de un
mercado
Race Car Motors
Auto. pequeños Auto. grandes
Motores pequeños 3, 6 3, 0
Far Out Engines
Motores grandes
1, 1 8, 3

competitiva
• Pregunta:
– ¿Cómo puede inducir Far Out a Race Car a
producir automóviles grandes en lugar de
pequeños?

competitiva
producto
Race Car Motors
Auto. pequeños Auto. grandes
Motores pequeños 0, 6 0, 0
Far Out Engines
Motores grandes
1, 1 8, 3
producto
• Preguntas:
1) ¿Cuál es el riesgo de esta estrategia?
2) ¿Cómo una conducta irracional podría

dar poder a Far Out Engines para
controlar la producción?
Estrategia anticipadora de inversión de las
tiendas Wal-Mart
• Preguntas:
– ¿Cómo consiguió Wal-Mart convertirse en la
mayor cadena de tiendas al por menor en
Estados Unidos mientras otras cadenas
consolidadas fracasaban?
– Pista:
– ¿Cómo consiguió Wal-Mart hacerse con el monopolio?
– Juego anticipador con el equilibrio de Nash.
El juego de anticipación de las tiendas de
bajos precios
Empresa X
Entrar No entrar
Entrar
-10, -10 20, 0
Wal-Mart
No entrar
0, 20 0, 0

competitiva
El juego de anticipación de las tiendas de
bajos precios
• Dos equilibrios
de Nash:
– La esquina Empresa X
inferior izquierda. Entrar No entrar
– La esquina Entrar -10, -10 20, 0

superior derecha.
Wal-Mart
• Anticiparse para No entrar 0, 20 0, 0
ganar.
La disuasión de la entrada
• Para disuadir a otras empresas de entrar
en un mercado, la empresa existente debe
convencerlas de que no es rentable
entrar.
Posibilidades de entrar
Empresa que está considerando la
posibilidad de entrar
Entrar No entrar
Precio alto
(acomodarse) 100, 20 200, 0
Empresa existente
Precio bajo
(guerra de precios) 70, -10 130, 0
• Caso práctico:
– Una empresa monopolista existente (I) y una
empresa que está considerando la posibilidad
de entrar (X).
– X tiene que pagar un coste de 80 millones de
dólares, con el fin de construir una planta.
• Caso práctico:
– Si X no entra en el mercado, I saca un
beneficio de 200 millones de dólares.
– Si X entra en el mercado y mantiene un precio
alto, I obtiene un beneficio de 100 millones de
dólares y X gana 20 millones de dólares.
– Si X entra en el mercado y mantiene un precio
bajo, I obtiene un beneficio de 70 millones de
dólares y X experimenta una pérdida de 10
millones de dólares.
• Pregunta:
– ¿Cómo podría I excluir a X?
• ¿Es creíble la amenaza?
• ¿Cómo podría I excluir a X?
1) Hacer una inversión antes de la

entrada (compromiso irrevocable).
2) Conducta irracional.

Teoria de Juegos 20101

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teoria de Juegos 20101

Cargado por

Copyright:

Formatos disponibles

TEORIA DE JUEGOS

• El resultado que obtiene una empresa depende

• Los participantes de un juego intentan

• La teoría de juegos, como cualquier otra

• Un jugador tiene información perfecta si

• Un juego tiene información perfecta si cada

• Si algún jugador no tiene información

• La información es imperfecta si el jugador, en el momento

Capítulo 13: La teoría de

Las estrategias dominantes

• Tienen que decidir si emprenden o no una

La matriz de pagos en el juego de la

Las estrategias dominantes

• Los juegos en que los intereses de los

• En un juego de suma cero, para cada posible

• Si hay una estrategia dominante no

A 9|1 1|9 2|8

MATRIZ DE MIS PAGOS

Su estrategia MAXIMIN consiste por tanto en jugar la

En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia

0 B Playa A 200 metros

¿Dónde deben situarse los

La aplicación de la estrategia maximín conduce en este

Jugador Paloma 2º,2º 3º,1º*

El resultado, marcado con un asterisco, es un óptimo, un punto de silla,

• Los dos aspectos esenciales de cualquier

En los juegos con transferencia de utilidad se llama

• Características del mercado

Para obtener el óptimo cada empresa deriva el beneficio respecto a su

• Cada vez que se repite el dilema del

DILEMA DEL PRISIONERO

Precio bajo 10, 10 100, -50

Precio alto -50, 100 50, 50

• Juego repetido: Precio bajo 10, 10 100, -50

• Los jugadores mueven consecutivamente.

• Deben pensar en las acciones y

Stackelberg desarrollo en 1934 un modelo de duopolio

Luego derivando respecto a qL se obtiene:

• Supongamos que la Empresa 1 lanza al

• La forma extensiva de un juego

• La ventaja de ser el primero en

• ¿Cómo realizar el primer movimiento?

• Las amenazas vanas:

Precio alto 100, 80 80, 100

Precio bajo 20, 0 10, 20

Auto. pequeños Auto. grandes

Capítulo 13: La teoría de

Capítulo 13: La teoría de

Auto. pequeños Auto. grandes

1) ¿Cuál es el riesgo de esta estrategia?

2) ¿Cómo una conducta irracional podría

Capítulo 13: La teoría de

– La esquina Entrar -10, -10 20, 0

• Anticiparse para No entrar 0, 20 0, 0

1) Hacer una inversión antes de la

También podría gustarte