Está en la página 1de 129

Competencia Imperfecta

ISBN: 978-84-692-4353-4

Iaki Aguirre

06-09

Notas sobre

COMPETENCIA IMPERFECTA

Iaki Aguirre
Departamento de Fundamentos del Anlisis Econmico I
Universidad del Pas Vasco

SARRIKO-ON 6/09

NDICE

Tema 1. El monopolio
Introduccin
1.1. La maximizacin de beneficios de un monopolista.
1.2. Demanda lineal y demanda de elasticidad constante.
1.3. Esttica comparativa.
1.4. Bienestar y produccin.
1.5. La discriminacin de precios.
1.6. La discriminacin de precios de primer grado.
1.7. La discriminacin de precios de segundo grado.
1.8. La discriminacin de precios de tercer grado.

Tema 2. Teora de Juegos No Cooperativos


Introduccin.
2.1. Nociones fundamentales
2.1.1. Juegos en forma extensiva.
2.1.2. Juegos en forma normal
2.2. Conceptos de solucin de juegos no cooperativos.
2.2.1. Criterio de dominacin.
2.2.2. Criterio de induccin retroactiva.
2.2.3. Equilibrio de Nash.
2.2.4. Problemas y refinamientos del equilibrio de Nash.

SARRIKO-ON 6/09

2.3. Juegos repetidos.


2.3.1. Horizonte temporal finito.
2.3.2. Horizonte temporal infinito.
2.4. Conclusiones.

Tema 3. El oligopolio
Introduccin
3.1. El modelo de Cournot.
3.1.1. Duopolio.
3.1.2. Oligopolio (n empresas).
3.1.3. Anlisis de bienestar.
3.2. El modelo de Bertrand.
3.2.1. Producto homogneo.
3.2.2. Producto heterogneo.
3.3. Liderazgo en la eleccin de la cantidad. Modelo de Stackelberg.
3.4. Colusin y estabilidad de los acuerdos.
3.4.1. Colusin a corto plazo.
3.4.2. Estabilidad de los acuerdos. Horizonte temporal finito e infinito.

SARRIKO-ON 6/09

Tema 1. El monopolio

Introduccin

Decimos que una empresa es un monopolio si es el nico vendedor de un bien (o bienes) en


un determinado mercado.
Problemas: dificultad para definir bien y mercado.
Las razones que pueden llevar a una empresa a ser monopolista son por ejemplo:
-

Control de materias primas.

Adquisicin del derecho exclusivo de venta (patente, subasta..).

Mejor acceso al mercado de capitales.

Rendimientos crecientes a escala..etc.

En contraste con una empresa perfectamente competitiva que se enfrenta a una demanda
perfectamente elstica (toma el precio como un dato), un monopolista se enfrenta a la
demanda de mercado. Por tanto, una empresa con poder de monopolio sobre un cierto
mercado ser consciente de que la cantidad de producto que puede vender es una funcin
continua del precio que cobre. Es decir, tendr en cuenta que reducciones en el nivel de
produccin elevarn el precio que puede cobrar. El monopolio tiene, por tanto, poder para
fijar el precio de mercado. Mientras que podemos considerar a una empresa perfectamente
competitiva como precio-aceptante o tomadora de precios, un monopolio es precio-decisor o
fijador de precios.

SARRIKO-ON 6/09

1.1. La maximizacin de beneficios de un monopolista


(i) El problema de maximizacin de beneficios en precios y en cantidades. Condiciones de
primer orden. Condiciones de segundo orden. Interpretacin grfica del problema de
maximizacin.
(ii) Interpretacin del ingreso marginal.
(iii) Condicin ingreso marginal igual al coste marginal.
(iv) Produccin y elasticidad.
(v) ndice de Lerner de poder de monopolio.
(vi) Representacin grfica.
(vii) Condiciones de segundo orden.

(i) El problema de maximizacin de beneficios en precios y en cantidades


Hay dos tipos de restricciones que afectan al comportamiento del monopolista:
a) Restricciones tecnolgicas resumidas en la funcin de costes, C(x).
b) Restricciones de demanda: x(p).
Podemos escribir la funcin de beneficios del monopolista de dos formas alternativas:
- ( p ) = px( p ) C ( x ( p )) utilizando la funcin de demanda.
- ( x ) = p ( x ) x C ( x ) utilizando la funcin inversa de demanda.
La demanda, x(p), y la inversa de demanda, p(x), representan la misma relacin entre precio y
cantidad demandada aunque desde pticas distintas. La funcin de demanda nos dice cul es
la cantidad demandada a cada uno de los precios mientras que la inversa de demanda nos dice
cul es el precio al que se pueden vender x unidades en el mercado.

SARRIKO-ON 6/09

max ( p)

max ( x)
x0

m
x = x( p m )
pm

x
p m = p( x m )
m

Problema de maximizacin de beneficios en funcin del precio

max ( p) max px( p) C ( x( p))


p

' ( p) = x( p) + px ' ( p) C ' ( x( p)) x ' ( p) = 0


2

'' ( p ) = 2 x ' ( p ) + px '' ( p ) C '' ( x ( p )) x ' ( p ) C ' ( x ( p )) x '' ( p ) < 0

Problema de maximizacin de beneficios en funcin de la produccin


max ( x) max p ( x ) x C ( x)
x0

x 0

' (0) = p(0) C ' (0) > 0 p(0) > C ' (0)
' ( x) = p( x) + xp ' ( x) C ' ( x) = 0 ' ( x m ) = 0 Condicin de primer orden.
'' ( x) = 2 p ' ( x) + xp '' ( x) C '' ( x) < 0 Funcin de beneficios estrictamente cncava (caso

regular).

' ( xm ) = 0

( x)

' (0) > 0


xm

SARRIKO-ON 6/09

(ii) Interpretacin del ingreso marginal

El ingreso marginal, r ' ( x) , es:

r ' ( x) = N
p( x) + N
xp ' ( x)

(1)

Ingreso perdido por tener que


vender las unidades ya producidas a
un precio menor.

Ingreso adicional por vender una


unidad adicional.

(iii) Condicin ingreso marginal igual a coste marginal


El nivel de produccin que maximiza beneficios (solucin interior) satisface:
' ( x m ) = r ' ( x m ) C ' ( x m ) = p ( x m ) + xp ' ( x m ) C ' ( x m ) = 0

(2)

En el nivel de produccin ptimo para el monopolista el beneficio marginal se hace cero,


' ( x m ) = 0; es decir, un cambio infinitesimal en el nivel de produccin no altera los

beneficios. Un nivel de produccin tal que ' (.) > 0 no puede maximizar beneficios ya que
un aumento (infinitesimal) en la produccin aumentara los beneficios. Del mismo modo, un
nivel de produccin tal que ' (.) < 0 no puede maximizar beneficios ya que una reduccin
(infinitesimal) en la produccin aumentara los beneficios.

En el nivel de produccin que maximiza beneficios el ingreso marginal se iguala con el


coste marginal, r ' ( x m ) = C ' ( x m ); es decir, un cambio infinitesimal en el nivel de produccin
altera el ingreso total y los costes en la misma medida. (Dicho de otra forma, un aumento
infinitesimal en la produccin eleva el ingreso en la misma cuanta que lo que aumenta el

SARRIKO-ON 6/09

coste de produccin y una reduccin infinitesimal en la produccin reduce el ingreso en la


misma cuanta que lo que se reduce el coste de produccin). Un nivel de produccin tal que
r ' (.) > C ' (.) no podra maximizar beneficios ya que un aumento infinitesimal en la
produccin hara que el aumento en el ingreso total fuera mayor que el aumento en los
costes de produccin (elevando por tanto los beneficios). Similarmente, un nivel de
produccin tal que r ' (.) < C ' (.) no podra maximizar beneficios ya que una reduccin
infinitesimal en la produccin hara que la reduccin en el ingreso total fuera menor que la
reduccin en los costes de produccin (elevando por tanto los beneficios).

(iv) Produccin y elasticidad: ( x) 1


Vamos a comprobar que en el nivel de produccin de monopolio la elasticidad precio de la
demanda en valor absoluto es mayor o igual que 1. Comenzamos definiendo la elasticidad
precio de la demanda en valor absoluto:
- en funcin del precio: ( p ) = x ' ( p)

- en funcin de la cantidad: ( x) =

p
,
x( p)

(3)

1 p( x)
.
p ( x) x
'

(4)

Vamos a representar a continuacin el ingreso marginal en funcin de la elasticidad precio


de la demanda:
r ' ( x) = p( x) + xp ' ( x)

p ' ( x)
r ' ( x) = p ( x) 1 + x

p ( x)

(5)
(6)

SARRIKO-ON 6/09

1
r ' ( x) = p ( x) 1

( x)

(7)

En nivel de produccin de monopolio se igualan ingreso marginal y coste marginal:

1
'
r ' ( x) = p( x) 1
= C ( x). (8)
(
x
)

Dado que el coste marginal siempre es no negativo (mayor o igual que cero) el ingreso
marginal tendr que ser no negativo y esto ocurre cuando la elasticidad en valor absoluto es
mayor o igual que 1. Es decir:

1
C ' ( x) 0 p ( x) 1
( x) 1.
0 p
( x )0
( x)

(v) ndice de Lerner de poder de monopolio


Vamos a obtener el ndice de Lerner de poder de monopolio (o poder de mercado) o lo que
es lo mismo el margen precio- coste marginal relativo. De la condicin (8) obtenemos:
p ( x)

p( x)
= C ' ( x).
( x)

Por tanto obtenemos:

p ( x) C ' ( x)
1
=
.
p( x)
( x)

(9)

Luego cuanto menor sea la elasticidad precio de la demanda en valor absoluto mayor ser el
ndice de Lerner. Si

( x) = 0 el poder de monopolio sera

p ( x) C ' ( x)
= y si
p( x)

SARRIKO-ON 6/09

( x) = (como ocurrira con una empresa perfectamente competitiva el poder de


p ( x) C ' ( x)
monopolio sera nulo,
= 0.
p( x)

(vi) Representacin grfica

C ' ( x)

p
pm

m
r ' ( x)

p( x)

xm

El ingreso marginal, r ' ( x) = p( x) + xp ' ( x), se encuentra por debajo de la inversa de demanda
ya que la funcin inversa de demanda tiene pendiente negativa, p ' ( x) < 0 . Es decir,
r ' ( x) < p ( x) si x > 0, pero ambas funciones tienen la misma ordenada r ' (0) = p(0). El
beneficio del monopolista (si no hay costes fijos) viene dado por:
xm

C ( xm )
= ( x ) = p x C ( x ) = p x C ' ( z )dz = p m m x m
x

0
m

SARRIKO-ON 6/09

(vii) Condiciones de segundo orden


Interpretacin
Para hacer ms sencillo el anlisis supondremos que la funcin de beneficios es
estrictamente cncava. Es decir:
'' ( x) = r '' ( x) C '' ( x) = 2 p ' ( x) + xp '' ( x) C '' ( x) < 0

(10)

La condicin (10) equivale a decir que la pendiente del ingreso marginal tiene que ser menor
que la pendiente del coste marginal:
d (r ' ( x)) d (C ' ( x))
<
dx
dx
Dicho de otra forma el ingreso marginal debe cortar al coste marginal desde arriba.

d (r ' ( x)) d (C ' ( x))


>
dx
dx
d (r ' ( x)) d (C ' ( x))
<
dx
dx

r',C'

C ' ( x)
r ' ( x)
xm

Casos
1. Costes estrictamente convexos o lineales: C '' ( x) 0 (CM creciente o constante)

10

SARRIKO-ON 6/09

a) Demanda estrictamente cncava o lineal: p '' ( x) 0


'' ( x) = 2 N
p ' ( x) + x N
p '' ( x) C '' ( x) < 0


<0

b) Demanda estrictamente convexa: p '' ( x) > 0


r '' ( x) = 2 N
p ' ( x) + x N
p '' ( x). Hay que comprobar que r '' ( x) < C '' ( x).
<0

>0

2. Costes estrictamente cncavos: C '' ( x) < 0 (CM decreciente)


Hay que comprobar en cada caso si r '' ( x) < C '' ( x).

1.2. Demanda lineal, demanda de elasticidad constante y coste marginal constante


(i) Demanda lineal y coste marginal constante
Inversa de demanda: p ( x) = a bx ( a > 0, b > 0 ).
Coste de produccin: C ( x) = cx ( c 0 ). ( a > c )
Ingreso marginal: r ' ( x) = a 2bx .
Pendiente inversa demanda: p ' ( x) = b
Pendiente ingreso marginal:

d (r ' ( x))
= 2b
dx

Funcin de beneficios estrictamente cncava: '' ( x) = r '' ( x) = 2b < 0 .


Beneficio marginal en cero: ' (0) = p(0) C ' (0) = a c > 0.
Maximizacin de beneficios: r ' ( x m ) = C ' ( x m ) a 2bx m = c x m =

Precio de monopolio: p m = p ( x m ) p m = a bx m p m =

11

a+c
2

ac
2b

SARRIKO-ON 6/09

Beneficios de monopolio: m = ( x m ) = [ p( x m ) c]x m = [ p m c]x m =

a c a c (a c) 2
=
2 2b
4b

(ii) Demanda de elasticidad constante y coste marginal constante


Demanda: x( p ) = Ap b ( A > 0, b > 1 ).
Coste de produccin: C ( x) = cx ( c > 0 ).
Elasticidad precio de la demanda: ( p) = x ' ( p)
1
b

p
p
= bAp (b +1)
= b.
x( p)
Ap b

1
b

Inversa de demanda: p ( x) = A x .
(b 1) b1
x .
Ingreso marginal: r ( x) = A
b
1
b

'

Pendiente ingreso marginal: r '' ( x) = A b

(b 1) (1+bb )
x
.
b2

Funcin de beneficios estrictamente cncava:


1

'' ( x) = r '' ( x) = A b

(b 1) (1+bb )
x
< 0 b >1.
b2

Beneficio marginal en cero: ' (0) = > 0.


Maximizacin de beneficios:
1
1

(b 1) m b1
b
m b
b
r ( x ) = C ( x ) r ( x) = A
( x ) = c ( x ) =A
c
b
(b 1)
'

'

'

1
b

m b1
b1 b

b b
c xm = A
(x ) = A
c
(b 1)
(b 1)

Precio de monopolio:

12

SARRIKO-ON 6/09

1
b

m b

p m = p( x m ) p m = A ( x )

b b b
c
= A A
(b 1)

1
b

1
b

pm =

b
c
(b 1)

Beneficios de monopolio:
b

b b
c
bb
A
c
A
c (b 1)
= ( x ) = [ p ( x ) c] x = [ p c] x =
=

(b 1) (b 1)
b 1 (b 1)
m

Resolviendo el problema de maximizacin de beneficios en funcin del precio se obtiene el


ndice de Lerner:
pm c
1
=
m
p
( p)

Con demanda de elasticidad constante la condicin nos queda

pm c 1
=
de donde
pm
b

obtenemos fcilmente el precio de monopolio. Despus obtener la produccin y los


beneficios es directo.

1.3. Esttica comparativa


Vamos a ver cmo cambian el precio y la produccin del monopolista cuando cambian los
costes de produccin. La intuicin econmica nos dice que un aumento en el coste marginal
del monopolista debera conllevar una reduccin en la produccin y un aumento en el
precio. Supondremos para simplificar que el coste marginal es constante (y que no hay
costes fijos). La funcin de costes es C ( x) = cx .
max ( x) max p ( x ) x C ( x)
x0

x0

' (0) = p(0) C ' (0) > 0 p(0) > C ' (0)

13

SARRIKO-ON 6/09

' ( x) = p( x) + xp ' ( x) c = 0

(11) x m (c) produccin de monopolio como funcin

implcita del coste marginal.


'' ( x) = 2 p ' ( x) + xp '' ( x) C '' ( x) < 0 Funcin de beneficios estrictamente cncava (caso
regular).
Hay dos formas equivalentes de analizar cmo cambia la produccin de monopolio cuando
cambia el coste marginal:

(i) Diferenciando completamente la condicin (11) con respecto a x y a c.

2 p ' ( x) + xp '' ( x) dx dc = 0
Despejando:
dx
1
<0
=
'
dc 2 p ( x) + xp '' ( x)


(12)

<0
C2O

Por tanto, un aumento infinitesimal del coste marginal reduce la produccin y una reduccin
infinitesimal del coste marginal eleva la produccin.
(ii) Utilizando el hecho de que x m (c) es una funcin implcita del coste marginal. Por tanto,
por definicin x m (c) satisface la condicin de primer orden; es decir
p ( x m (c)) + x m (c) p ' ( x m (c)) c = 0
Derivando con respecto al coste marginal:
2 p ' ( x m (c)) x m ' (c) + x m (c) p '' ( x m (c)) x m ' (c) = 1
2 p ' ( x m (c)) + x m (c) p '' ( x m (c)) x m ' (c) = 1
Despejando: x m ' (c) =

1
<0
2 p ( x (c)) + x m (c) p '' ( x m (c))
'

14

SARRIKO-ON 6/09

Una vez obtenido el cambio en la produccin al cambiar el coste marginal es directo obtener
el cambio en el precio.
<0
P
'
dp dp dx
p ( x)
>0
=
=
'
dc dx dc 2 p ( x) + xp '' ( x)


(13)

<0
C2O

Ejemplos
(i)

Demanda lineal
pm =

a+c
dp m 1

=
2
dc 2

dp
p ' ( x)
1
= '
=
''
dc 2 p ( x) + x N
p ( x) 2
=0

Con demanda lineal el aumento en el precio es la mitad del aumento en el coste


marginal: dp =
(ii)

1
dc
2

Demanda de elasticidad constante


pm =

p ( x) = A b x

1
b

p ' ( x) = Ab
dp
=
dc

b
dp m
b
c
=
>1
b 1
dc b 1

1
1 (1+bb )
(1 + b) (1+b2b )
x
p '' ( x) = A b
x
b
b2

1
1
1
b
=
=
=
>1
''
1
(1+ 2 b )
(1 + b) b 1
p ( x)
(1 + b) b
b
2

2+ x '
A
x
b
p ( x) 2 + x
b2
1
(1+ b )

1
Ab x b
b

15

SARRIKO-ON 6/09

Con demanda de elasticidad constante el precio de monopolio aumenta en una cuanta


superior al coste marginal: dp > dc.

1.4. Bienestar y produccin


(i) Enfoque del consumidor representativo. Utilidad cuasi-lineal.
(ii) Disposicin mxima a pagar y disposicin marginal a pagar.
(iii) Funcin de demanda independiente de la renta.
(iv) Funcin de bienestar social y nivel de produccin maximizador del bienestar social.
(v) Excedente total, excedente del consumidor y excedente del productor.
(vi) Condiciones de eficiencia en presencia de varios consumidores o mercados.
(vii) Comparacin entre produccin de monopolio y produccin eficiente utilizando el
problema de maximizacin de beneficios.
(viii) Comparacin entre produccin de monopolio y produccin eficiente utilizando el
problema de maximizacin del bienestar social.
(ix) Prdida irrecuperable de eficiencia.

(i) Enfoque del consumidor representativo. Utilidad cuasi-lineal


Para realizar anlisis de bienestar y valorar desde el punto de vista social el comportamiento
del monopolio seguiremos el enfoque del consumidor representativo. Se supone en este
enfoque que la curva de demanda del mercado x(p) se genera maximizando la utilidad
(cuasi-lineal) de un nico consumidor representativo.
Consideremos una economa en la que slo hay dos bienes: x e y. Podemos pensar que el
bien x es el bien producido en el mercado (monopolstico) que nos interesa. Mientras que el

16

SARRIKO-ON 6/09

bien y recoge todo lo dems: cantidad de dinero que le queda al consumidor para adquirir
otros bienes una vez que ha gastado la cantidad ptima en el bien x. Supondremos que el
consumidor representativo tiene una Funcin de Utilidad Cuasi-lineal:
U ( x, y ) = u ( x ) + y

(u (0) = 0; u ' (.) > 0; u '' (.) < 0)

(ii) Disposicin mxima a pagar y disposicin marginal a pagar


Disposicin mxima a pagar, R( x) : lo mximo que estara dispuesto a pagar el

consumidor por x unidades del bien. Estar pagando lo mximo si justo queda indiferente
entre consumir x unidades pagando R( x) y no consumir el bien, dedicando su dotacin de
renta, m, al consumo del resto de los bienes. Es decir:
U ( x, m R( x)) = U (0, m)
Ntese que el consumidor debe quedar indiferente y, por tanto, se debe cumplir con igualdad

i ( x)) > U (0, m) entonces el


la anterior condicin. Si se diera el caso de que U ( x, m R
consumidor

estara

dispuesto

pagar

una

cantidad

mayor

que

i ( x)
R

i ( x)) < U (0, m) entonces R


i ( x) sera mayor que su disposicin mxima a pagar.
U ( x, m R

Como la funcin de utilidad es cuasi-lineal:


U ( x, m R( x)) = U (0, m)

u ( x) + m R( x) = u (0) + m
R ( x) = u ( x)
Por tanto, cuando la funcin de utilidad es cuasi-lineal:
u ( x) Disposicin mxima a pagar

17

si

SARRIKO-ON 6/09

Disposicin marginal a pagar: es el cambio en la disposicin mxima a pagar ante una

variacin infinitesimal en la cantidad consumida.


u ' ( x) Disposicin marginal a pagar

(iii) Funcin de demanda independiente de la renta


max u ( x) + y
x, y

s.a y + px = m

L ( x , y , )



max u ( x) + y + [ m y px ]
x , y ,

= u ' ( x) p = 0
x

'
L
p = u ( x) Funcin inversa de demanda
= 1 = 0
y

L
= m y px = 0

La funcin directa de demanda x(p) es la inversa de esta funcin y por tanto satisface la
condicin de primer orden:
p = u ' ( x( p )) Funcin de demanda

Propiedad de la funcin de utilidad cuasi-lineal: la funcin de demanda es independiente

de la renta.

Derivando con respecto a p obtenemos:


1 = u '' ( x( p)) x ' ( p )
x' ( p) =

1
< 0 pendiente negativa
u ( x( p ))


''

<0

18

SARRIKO-ON 6/09

(iv) Funcin de bienestar social y nivel de produccin maximizador del bienestar social
En esta subseccin justificaremos la utilizacin de W ( x) = u ( x) C ( x) como funcin de
bienestar social.
Vamos a plantear el problema de obtener la asignacin que maximiza la utilidad del
consumidor representativo, con una restriccin de recursos: interpretamos el coste de
produccin del bien x como la cantidad del bien y a la que habra que renunciar para tener el
bien x.
max u ( x) + y
x, y

s.a y = m C ( x)
Sustituyendo y en la funcin objetivo:
max u ( x) + m
u ( x) C ( x)
N C ( x) max
x
x
constante

Luego el problema de maximizar el bienestar social consiste en:


max W ( x) max u ( x) C ( x)
x0

x0

W ' (0) = u ' (0) C ' (0) > 0


W ' ( x) = u ' ( x) C ' ( x) = 0 W ' ( x e ) = 0 (13) Condicin de primer orden.
W '' ( x) = u '' ( x) C '' ( x) < 0 Funcin de bienestar social estrictamente cncava (caso regular).
Por tanto, en el nivel de produccin que maximiza el bienestar social o nivel de produccin
eficiente se cumple W ' ( x e ) = 0 u ' ( x e ) = C ' ( x e ). Como normalmente supondremos que el
coste marginal es constante la condicin de eficiencia queda:
u ' ( x e ) = c,
Es decir, en el nivel de produccin eficiente la disposicin marginal a pagar se iguala con el
coste marginal.

19

SARRIKO-ON 6/09

(v) Excedente total, excedente del consumidor y excedente del productor


La funcin W ( x) = u ( x) C ( x) puede interpretarse tambin como el excedente total; es decir,
la diferencia entre la disposicin mxima a pagar y el coste de produccin. Por definicin se
cumple:
x

u ( x) uN
(0) = u ' ( z )dz
=0

C ( x) C
(0) = C ' ( z )dz
N

= F =0

Por tanto, maximizar u ( x) C ( x) equivale a elegir aquel nivel de produccin que maximice el
rea debajo de la inversa de demanda y encima del coste marginal.

C ' ( x)

C ' ( x)

C ( xe )

u( xe )
p( x)

p( x)

xe

xe

C ' ( x)

W ( xe )
p( x)
xe

x
20

SARRIKO-ON 6/09

Simplemente sumando y restando el gasto en el bien podemos reescribir el excedente total


como:

W ( x) = u ( x) C ( x) = [u ( x) px ] + [ px cx ]



EC ( x )

EP ( x )

El excedente del consumidor, EC(x), mide la diferencia entre la disposicin mxima a pagar
del consumidor y lo que realmente paga. El excedente del productor, EP(x), mide los
beneficios (si no hay costes fijos) de la empresa. Por tanto, el nivel de produccin eficiente
tambin maximiza la suma del excedente del consumidor y del excedente del productor.

C ' ( x)

EC ( x )

EP ( x e )
p( x)
xe

(vi) Condiciones de eficiencia en presencia de varios consumidores o mercados


Consideramos el problema de obtener una asignacin eficiente en el sentido de Pareto
cuando en la economa hay dos consumidores que tienen funciones de utilidad cuasilineal, ui ( xi ) + yi , y una dotacin de renta de mi , i = 1, 2. . Vamos a maximizar la utilidad de
un agente (por ejemplo el consumidor 1) manteniendo constante la utilidad del otro (por

21

SARRIKO-ON 6/09

ejemplo, el 2), dada una restriccin de recursos (suponemos que el coste marginal es
constante e igual a c).
max u1 ( x1 ) + y1

x1 , y1 , x2 , y2

s.a u2 ( x2 ) + y2 = u 2
y1 + y2 = m1 + m2 c.( x1 + x2 )

Despejando y2 de la segunda restriccin y sustituyendo en la primera, despejando entonces


y1 y sustituyendo en la funcin objetivo, el problema queda:
max u1 ( x1 ) + u2 ( x2 ) c.( x1 + x2 ) + m1 + m2 u 2
x1 , x2

Desde las condiciones de primer orden obtenemos:


u1' ( x1e ) c = 0

'
e
'
e
u1 ( x1 ) = u2 ( x2 ) = c Condicin de eficiencia (14)
u2 ' ( x2e ) c = 0

(vii) Comparacin entre produccin de monopolio y produccin eficiente utilizando el


problema de maximizacin de beneficios
max ( x) max p ( x ) x C ( x)
x0

x0

' (0) = p(0) C ' (0) > 0 p(0) > C ' (0)
' ( x) = p ( x) + xp ' ( x) C ' ( x) = 0 ' ( x m ) = 0 Condicin de primer orden.
'' ( x) = 2 p ' ( x) + xp '' ( x) C '' ( x) < 0 Funcin de beneficios estrictamente cncava (caso
regular).

22

SARRIKO-ON 6/09

' ( x m ) = 0
' e

(x ) ?
'' ( x) < 0

p ( x e ) + x e p ' ( x e ) C ' ( x e ) = u ' ( x e ) C ' ( x e ) + x e p ' ( x e ) < 0


' ( xe ) = N


'
e
<0
=u ( x )

=0

Por definicin de
produccin eficiente

' ( x m ) = 0
' e

'
e
'
m
e
m
(x ) < 0 (x ) < (x ) x > x
'' ( x) < 0

'' ( x) < 0

d ' ( x)
< 0 x ' ( x)
dx

' ( xm ) = 0
' ( xe ) < 0
xm

xe

23

SARRIKO-ON 6/09

(vii) Comparacin entre produccin de monopolio y produccin eficiente utilizando el


problema de maximizacin del bienestar social
max W ( x ) max u ( x ) C ( x)
x0

x0

W ' (0) = u ' (0) C ' (0) > 0 p (0) > C ' (0)
W ' ( x) = u ' ( x) C ' ( x) = 0 W ' ( x e ) = 0 Condicin de primer orden.
W '' ( x) = u '' ( x) C '' ( x) < 0 Funcin de bienestar estrictamente cncava.
W ' ( x e ) = 0
' m
W (x ) ?
W '' ( x) < 0

''

u (x )


'
m
'
m
'
m
m
'
W ( x ) = u ( x ) C ( x ) = x p ( xm ) > 0


<0

p ( xm )

Por definicin de
produccin de monopolio.
W ' ( x e ) = 0
' m

'
e
'
m
e
m
W ( x ) > 0 W ( x ) < W ( x ) x > x
W '' ( x) < 0

W '' ( x) < 0

dW ' ( x)
< 0 x W ' ( x)
dx

W ' ( xe ) = 0
W ' ( xm ) > 0

xm

xe

24

SARRIKO-ON 6/09

(vii) Prdida irrecuperable de eficiencia (PIE)


xe

xm

xe

PIE = W ( x e ) W ( x m ) = [u ' ( z ) C ' ( z )]dz [u ' ( z ) C ' ( z )]dz = m [u ' ( z ) C ' ( z )]dz
0

C ' ( x)

EC ( x )

EC ( x )

C ' ( x)

pm

EP ( x e )

EP ( x m )

p( x)

p( x)

xe

xm

C ' ( x)

p
pm

PIE
p( x)
xm

xe

25

SARRIKO-ON 6/09

1.5. La discriminacin de precios


(i) Definicin.
(ii) Incentivo a discriminar precios.
(iii) Condiciones o requisitos.
(iv) Clasificacin o tipos de discriminacin de precios (Pigou, 1920).
(v) Ejemplos.
(vi) Modelo.

(i) Definicin
Existe discriminacin de precios cuando diferentes unidades de un mismo bien son
vendidas a precios distintos, bien al mismo consumidor bien a consumidores diferentes.

Discusin

- Diferencias en calidad: transporte de pasajeros, espectculos culturales y deportivos


- Un nico precio puede ser discriminatorio y precios diferentes no serlo. Diremos que no
existe discriminacin de precios si la diferencia entre el precio pagado por dos consumidores
por una unidad del bien refleja exactamente la diferencia en el coste de servir el bien a esos
consumidores.

(ii) Incentivo a discriminar precios

En el nivel de produccin de monopolio el ingreso marginal se iguala con el coste marginal:

r ' ( x m ) = C ' ( x m ). Es decir:

26

SARRIKO-ON 6/09

p( x m ) + x m p ' ( x m ) = C ' ( x m )
N


Ingreso adicional por vender una


unidad adicional.

(1)

Ingreso perdido por tener que


vender las unidades ya producidas a
un precio menor.

El monopolista estara dispuesto a vender ms unidades si no tuviera que bajar el precio.


Existen incentivos a intentar capturar una mayor proporcin del excedente del
consumidor incentivos a discriminar precios.

C ' ( x)

p
p

Incentivo a discriminar
precios: capturar una mayor
proporcin del excedente
social.

m
r ' ( x)

p( x)

xm

(iii) Condiciones o requisitos


Para que una empresa pueda discriminar precios se tienen que cumplir dos condiciones:
a) la empresa debe ser capaz de clasificar a los consumidores (lo que depende de la
informacin).
b) la empresa debe tener capacidad para impedir la reventa (lo que depende de las
posibilidades de arbitraje y de los costes de transaccin).

27

SARRIKO-ON 6/09

El caso ms sencillo de clasificacin se produce cuando la empresa recibe una seal exgena
(edad, localizacin, ocupacin) que le permite clasificar a los consumidores en diferentes
grupos.

Resulta ms difcil clasificar en funcin de una categora endgena (por ejemplo, la cantidad
comprada o el momento de la compra). En este caso el monopolista debe establecer precios
de modo que sean los propios consumidores los que se auto-clasifiquen en las categoras
correctas.

(iv) Clasificacin o tipos de discriminacin de precios (Pigou, 1920)


1) Discriminacin de precios de primer grado o discriminacin perfecta.
El vendedor cobra un precio diferente por cada unidad del bien igual a la disposicin
mxima a pagar por esa unidad. Requiere informacin plena sobre las preferencias de los
consumidores y no existencia de ningn tipo de arbitraje. El monopolista consigue extraer
todo el excedente del consumidor.

2) Discriminacin de precios de segundo grado (o fijacin no lineal de precios).


Los precios difieren dependiendo del nmero de unidades del bien que se compren pero no
de unos consumidores a otros. Cada uno de los consumidores se enfrenta a la misma lista de
precios pero stos dependen de las cantidades (o de cualquier otra variable; por ejemplo, la
calidad del producto) que se compren. Ejs.: descuentos por comprar grandes cantidades del
producto. Autoseleccin.

28

SARRIKO-ON 6/09

3) Discriminacin de precios de tercer grado.


Se cobran precios distintos a diferentes consumidores pero cada uno de ellos paga una
cantidad constante (el mismo precio) por cada una de las unidades que compra del bien. La
empresa recibe una seal exgena que le permite clasificar a los consumidores en diferentes
grupos. Se suele decir que es el tipo ms frecuente de discriminacin de precios. Ejemplos:
descuentos a estudiantes, precios diferentes dependiendo del da de la semana etc.
Identificacin.

En ocasiones se suelen distinguir dos tipos de discriminacin de precios: discriminacin de


precios directa y discriminacin de precios indirecta. La discriminacin de precios de
segundo grado es un caso de discriminacin indirecta (los consumidores se enfrentan a una
nica lista de precios y con sus elecciones se auto-clasifican) mientras que la discriminacin
de precios de primer grado y la discriminacin de precios de tercer grado seran casos de
discriminacin directa. En el caso de DP3 la empresa establece listas de precios diferentes
para consumidores pertenecientes a diferentes grupos o mercados.

(v) Ejemplos
Resulta ms difcil encontrar ejemplos reales de mercados donde no se practique ningn tipo
de discriminacin de precios que lo contrario. Aunque a veces no es posible distinguir de
una manera ntida cul es el tipo de discriminacin es un ejercicio interesante meditar sobre
qu tipo de discriminacin de precios se practica en los siguientes casos.
- Tarifas en dos partes: telefona, Internet, electricidad, televisin por cable Tarifa plana,
bonos por horas etc.
- Tarifas elctricas diferentes para uso industrial o uso domstico.

29

SARRIKO-ON 6/09

- Descuentos en museos, subscripcin de revistas, acontecimientos deportivos o


culturales,para nios, jvenes o jubilados.
- Tipos de inters preferenciales.
- Bono-metro, bono-bus,descuentos segn cantidad comprada en transportes pblicos.
- Diferente calidad de servicio: precios diferentes dependiendo de la calidad del producto en
espectculos deportivos o culturales (tribuna, preferencia, palco), o en transporte de
pasajeros (clase turista, Business class, primera, segunda).
- Descuentos por compras repetidas.
- Descuentos segn cantidad comprada: 2x1, 3x2 en supermercados
- Servicio a domicilio de comida, tele-tienda

(vi) Modelo
Estudiaremos estos tres tipos de discriminacin de precios por medio de un modelo muy
sencillo. Supongamos que hay dos consumidores potenciales que tienen funciones de
utilidad cuasi-lineal: ui ( xi ) + yi , i = 1, 2.
ui (0) = 0, i = 1, 2.
ui ( xi ) : disposicin mxima a pagar del consumidor i = 1, 2.
ui' ( xi ) : disposicin marginal a pagar del consumidor i = 1, 2.

Diremos que el consumidor 2 es un consumidor de demanda alta y que el consumidor 1 es


un consumidor de demanda baja si se cumple:
u2 ( x) > u1 ( x) x
u2' ( x) > u1' ( x) x

30

SARRIKO-ON 6/09

Es decir, el consumidor 2 es un consumidor de demanda alta y el 1 de demanda baja si tanto


la disposicin mxima a pagar como la disposicin marginal a pagar del consumidor 2 son
mayores que las del consumidor 1 para todo nivel de consumo.

La comparacin de disposicin mxima y disposicin marginal a pagar slo tiene sentido


hacerla para el mismo nivel de consumo. Adems la comparacin hay que hacerla para todo
nivel de consumo.

u2 ( x )
u2' ( x )

u1' ( x )

u2 ( x) > u1 ( x) x
u2' ( x) > u1' ( x) x
u1' ( x)

u1 ( x )

u2' ( x )

Supondremos que el monopolista tiene un coste marginal constante (y no hay costes fijos)
c > 0. De forma equivalente la funcin de coste de produccin es:

C ( x) = c.x = c.( x1 + x2 )

31

SARRIKO-ON 6/09

1.6. La discriminacin de precios de primer grado o discriminacin perfecta


(i) Definicin y contexto.
(ii) Planteamiento y resolucin del problema en el caso de un nico consumidor.
(iii) Observaciones. Es eficiente la cantidad ofrecida por el monopolista?
(iv) Planteamiento y resolucin del problema en el caso de dos consumidores.
(v) Ofrece el monopolista a los consumidores las cantidades eficientes? Demostracin de
que el monopolista ofrece una cantidad mayor al consumidor de demanda alta.
(vi) Qu ocurrira si el monopolista no fuera capaz de identificar al consumidor cuando va a
comprar el bien.

(i) Definicin y contexto


El vendedor cobra un precio diferente por cada unidad del bien igual a la disposicin
mxima a pagar por esa unidad.

Requiere informacin plena sobre las preferencias de los consumidores y no existencia de


ningn tipo de arbitraje. En particular, el monopolista es capaz de identificar al consumidor
cuando va a comprar el bien. (Ejemplo clsico: mdico de pueblo).

(ii) Planteamiento y resolucin del problema en el caso de un nico consumidor


El monopolista desear ofrecer al consumidor una combinacin (lote) precio-produccin
(r * , x* ) que le reporte los mayores beneficios. El monopolista le plantear al consumidor

32

SARRIKO-ON 6/09

una eleccin todo o nada:

( r * , x* )
(0, 0)

. El consumidor o paga r * por x* unidades o se queda

sin el bien. El problema de maximizacin del monopolista es:


max r cx
r,x

s.a u ( x) r

(1)

La restriccin (1) la podemos escribir de manera equivalente como u ( x) r 0 : nos indica


que el consumidor debe derivar un excedente no negativo de su consumo del bien x. Se
denomina este tipo de restricciones como restricciones de participacin o restricciones de
racionalidad individual.

Como el monopolista desea maximizar beneficios elegir la tarifa r lo ms elevada posible


y, por tanto, la restriccin (1) se cumplir con igualdad: r = u ( x ). Por tanto, el problema
consiste en:
( x)



max u ( x) cx
x

d
= u ' ( x ) c = 0 u ' ( x* ) = c
dx
d 2
= u '' ( x) < 0
dx 2
Dado este nivel de produccin la tarifa ser: r * = u ( x* ).

(iii) Observaciones
a) Es eficiente la cantidad ofrecida por el monopolista?
El monopolista produce una cantidad eficiente en el sentido de Pareto, x* = x e , ya que
ofrece una cantidad tal que se iguala la disposicin marginal a pagar con el coste marginal.

33

SARRIKO-ON 6/09

(Repasar el problema de maximizacin del bienestar social y compararlo con el que


acabamos de resolver). Sin embargo, el monopolista se queda con todo el excedente social.

p
m = ( x* ) = u ( x* ) cx* = u ( x e ) cx e = W ( x e )

m
c

C ' ( x)

'

u ( x)
x* = x e

b) El monopolista produce la misma cantidad que producira si se comportara como una


empresa perfectamente competitiva. Si tomara el precio como un dato entonces su decisin
de produccin sera p( x) = c pero como la utilidad es cuasi-lineal p( x) = u ' ( x) y en
consecuencia u ' ( x) = c. Sin embargo, la distribucin de las ganancias del comercio sera la
opuesta.
c) Podramos obtener los mismos resultados mediante una tarifa en dos partes.

T ( x ) = A + px = u ( x* ) cx* + cx


A
*

= T ( x ) cx = u ( x ) cx*
m

m
c

C ' ( x)

u ' ( x)
x* = x e

34

SARRIKO-ON 6/09

d) Obtendramos el mismo resultado si el monopolista vendiera al consumidor cada unidad


de produccin a un precio distinto e igual a su disposicin mxima a pagar por esa unidad.
Supongamos que descomponemos la produccin en n partes iguales de tamao x de modo
que x = nx. La disposicin mxima a pagar por la 1 unidad de consumo viene dada por:
u (0) + m = u (x) + m p1 u (0) = u (x) p1
La disposicin mxima a pagar por la 2 unidad de consumo sera:
u (x) + m p1 = u (2x) + m p1 p2 u (x) = u (2x) p2
Y as sucesivamente. Obtendramos las siguientes ecuaciones:
u (0) = u (x) p1
u (x) = u (2x) p2
u (2x) = u (3x) p3
....................................
u ((n 1)x) = u (nx) pn
Sumando y teniendo en cuenta que u (0) = 0 obtenemos u (nN
x) = i =1 pi . Cuando el
n

tamao de estas unidades x se vuelve infinitesimal, obtenemos que plantear una nica
opcin todo o nada al consumidor equivale a venderle cada una de las unidades
(infinitesimales) del bien a un precio igual a la disposicin marginal a pagar por ella.

x*

'
u ( x ) = uN
( z ) dz
0
*

p(z)

C ' ( x)

u ' ( x)
x*

x
35

SARRIKO-ON 6/09

(iv) Planteamiento y resolucin del problema en el caso de dos consumidores


El monopolista desear ofrecer al consumidor i, i = 1, 2, una combinacin (lote) precioproduccin (ri* , xi* ) que le reporte los mayores beneficios. El monopolista le plantear al
consumidor i, i = 1, 2, una eleccin todo o nada:

(ri* , xi* )
(0, 0)

. El consumidor i, i = 1, 2, o paga

ri* por xi* unidades o se queda sin el bien. El problema de maximizacin del monopolista es:
max r1 + r2 c.( x1 + x2 )

r1 , x1 , r2 , x2

s.a

u1 ( x1 ) - r1 0
u2 ( x2 ) - r2 0

maximizacin de beneficios

r1 = u1 ( x1 )
r2 = u2 ( x2 )

Por tanto, el problema nos queda:


max u1 ( x1 ) + u2 ( x2 ) c.( x1 + x2 )
x1 , x2

= u1' ( x1 ) c = 0
x1

'
*
'
*
u1 ( x1 ) = u2 ( x2 ) = c

= u2' ( x2 ) c = 0
x2

Dados estos niveles de produccin las tarifas sern: r1* = u1 ( x1* ) y r2* = u2 ( x2* ).

(v) Ofrece el monopolista a los consumidores las cantidades eficientes? Demostracin de


que el monopolista ofrece una cantidad mayor al consumidor de demanda alta
El monopolista ofrece las cantidades eficientes: x1* = x1e y x2* = x2e . (Repasar el problema de
obtener una asignacin eficiente y compararlo con el problema resuelto en esta subseccin).

36

SARRIKO-ON 6/09

Vamos a demostrar a continuacin que el monopolista ofrece una cantidad mayor al


consumidor de demanda alta: x2* > x1* .
u1' ( x1* ) = c
' *
'
*
'
*
u2 ( x2 ) = u1 ( x1 ) < u2 ( x1 )
u2' ( x2* ) = c
Consumidor 2 demanda alta:
u2' ( x) > u1' ( x) x
Por tanto, u2' ( x2* ) < u2' ( x1* ) pero como la funcin u2 es estrictamente cncava entonces
d (u2' ( x))
< 0 y por tanto x2* > x1* .
dx

(vi) Qu ocurrira si el monopolista no fuera capaz de identificar al consumidor cuando va


a comprar el bien?
(Esta subseccin servir para introducir la discriminacin de precios de segundo grado).
Supongamos ahora que el monopolista no es capaz de identificar a los consumidores cuando
acuden a comprar el bien. Es decir, no puede realizar ofertas personalizadas y por tanto se
ver restringido a establecer una nica lista de precios. Supongamos que establece una lista
de precios utilizando las tarifas y cantidades ptimas bajo discriminacin perfecta:
(r1* , x1* )
(r2* , x2* )
(0, 0)
donde r1* = u1 ( x1* ) y r2* = u2 ( x2* ). Comprobamos cmo el consumidor de demanda alta tiene
incentivos a comprar el lote diseado para el de demanda baja.

37

SARRIKO-ON 6/09

0 = u2 ( x2* ) r2* < u2 ( x1* ) r1* = u2 ( x1* ) u1 ( x1* )






>0

Incentivo a realizar arbitraje


personal.

Excedente que obtendra el


consumidor 2 si compra el lote
diseado para el consumidor 1.

Excedente que obtendra el


consumidor 2 si compra el lote
diseado para l.

1.7. La discriminacin de precios de segundo grado (o fijacin no lineal de precios)


(Trminos clave: no identificacin, nica lista de precios y autoseleccin).
(i) Definicin y contexto.
(ii) Restricciones de participacin y de autoseleccin. Interpretacin.
(iii) Demostracin de qu restricciones se cumplen con igualdad. Interpretacin.
(iv) Planteamiento y resolucin del problema de maximizacin de beneficios.
(v) Observaciones. Ofrece el monopolista cantidades eficientes? Demostracin de que el
monopolista ofrece una cantidad menor que la eficiente al consumidor de demanda baja.
(vi) Bajo qu condiciones decide el monopolista ofrecer el bien a ambos consumidores?
(vii) Representacin grfica.

(i) Definicin y contexto


Los precios difieren dependiendo del nmero de unidades del bien que se compren pero no
de unos consumidores a otros.

Nos situamos en un contexto en el que el monopolista conoce las preferencias (conoce la


distribucin de preferencias) de los consumidores, pero no es capaz de identificar al

38

SARRIKO-ON 6/09

consumidor cuando va a comprar el bien. Se ve obligado a establecer una nica lista de


precios y dejar que sean los consumidores los que se auto-clasifiquen o auto-seleccionen. En
este sentido se dice que es un tipo de discriminacin indirecta. Los consumidores se enfrenta
a la misma lista de precios pero stos dependen de las cantidades (o de cualquier otra
variable; por ejemplo, la calidad del producto) que se compren.

(ii) Restricciones de participacin y de autoseleccin. Interpretacin


El objetivo ser disear de manera ptima la lista de precios de modo que cada consumidor
elija la combinacin precio-cantidad diseada para l.

(r1 , x1 )

Consumidor 1

(r2 , x2 )
(0, 0)

Consumidor 2

Restricciones del monopolista

- Restricciones de participacin (o racionalidad individual)


u1 ( x1 ) r1 0 (1)
u2 ( x2 ) r2 0 (2)
Estas restricciones garantizan que cada consumidor desea comprar el bien. Cada consumidor
obtiene al menos tanta utilidad consumiendo el bien como no consumiendo. O dicho de otro
modo, cada consumidor obtiene un excedente no negativo comprando el bien.
- Restricciones de autoseleccin (o compatibilidad de incentivos)
u1 ( x1 ) r1 u1 ( x2 ) r2 (3)
u2 ( x2 ) r2 u2 ( x1 ) r1 (4)

39

SARRIKO-ON 6/09

Estas restricciones garantizan que cada consumidor prefiere la combinacin precio-cantidad


diseada para l a la combinacin precio-cantidad diseada para el otro consumidor. Dicho
de otra forma, estas restricciones previenen el arbitraje personal: cada consumidor obtiene
un excedente por lo menos tan alto eligiendo el lote diseado para l como eligiendo el lote
diseado para el otro consumidor.

(iii) Demostracin de qu restricciones se cumplen con igualdad

Vamos a agrupar las restricciones de acuerdo con el consumidor.


r u (x )
(1) y (3) 1 1 1
r1 u1 ( x1 ) u1 ( x2 ) + r2

(1)'
(2)'

r u2 ( x2 )
(2) y (4) 2
r2 u2 ( x2 ) u2 ( x1 ) + r1

(3)'
(4)'

El monopolista desea maximizar beneficios y, por tanto, desea elegir r1 y r2 lo ms alto que
se pueda. Por tanto, slo una de las dos primeras desigualdades y slo una de las dos
segundas sern efectivas (se cumplirn con igualdad). El supuesto de que el consumidor 2 es
el consumidor de demanda alta y el consumidor 1 el consumidor de demanda baja (es decir,
se cumple: u2 ( x) > u1 ( x) x y u2' ( x) > u1' ( x) x ) es suficiente para determinar las
restricciones que son efectivas.

1) Demostracin de que (4) se cumple con igualdad y (3) con desigualdad estricta
Supongamos por el contrario que (3) se cumple con igualdad y por tanto que r2 = u2 ( x2 ).
Entonces (4)' r2 r2 u2 ( x1 ) + r1 r1 u2 ( x1 ). Como el consumidor 2 es el de demanda

40

SARRIKO-ON 6/09

alta u2 ( x) > u1 ( x) x entonces r1 u2 ( x1 ) > u1 ( x1 ). Es decir, r1 > u1 ( x1 ) y por tanto no se


cumplira la restriccin (1) lo que supone una contradiccin. (No es compatible que se
cumpla con igualdad la restriccin de participacin del consumidor de demanda alta con que
el consumidor de demanda baja compre el bien). En conclusin, (3) no es efectiva y (4) si
lo es:
r2 = u2 ( x2 ) u2 ( x1 ) + r1 (5)

2) Demostracin de que (1) se cumple con igualdad y (2) con desigualdad estricta
Supongamos por el contrario que (2) se cumple con igualdad y por tanto que
r1 = u1 ( x1 ) u1 ( x2 ) + r2 . Sustituyendo r2 desde la condicin (5) obtenemos:
r1 = u1 ( x1 ) u1 ( x2 ) + u2 ( x2 ) u2 ( x1 ) + r1


= r2

Esto implica
u2 ( x2 ) u2 ( x1 ) = u1 ( x2 ) u1 ( x1 )

x2

x2

x1

x1

x2

u2' (t )dt = u1' (t )dt


x1

[u2' (t ) u1' (t )]dt = 0

Pero esto viola el supuesto de que el consumidor 2 es el consumidor de demanda


alta, u2' ( x) > u1' ( x) x. Por tanto, (2) no es efectiva y si lo es (1):
r1 = u1 ( x1 ) (6)

41

SARRIKO-ON 6/09

Interpretacin

Al consumidor de demanda baja, ya que no tiene incentivos a realizar arbitraje, se le cobrar


su disposicin mxima a pagar. Al consumidor de demanda alta, que tiene incentivos a
realizar arbitraje personal (y hacerse pasar por un consumidor de demanda baja), se le
cobrar el precio mximo que le induzca a elegir el lote destinado a l (justo la cantidad de
dinero tal que el consumidor de demanda alta queda indiferente entre su lote y el destinado
al consumidor de demanda baja).

Vamos a ver de otra forma por qu al consumidor de demanda alta hay que dejarle con algo
de excedente. Consideremos la restriccin de autoseleccin del consumidor de demanda alta:
u2 ( x2 ) r2 u2 ( x1 ) r1 (4)
Hay que notar que, compatible con que el consumidor de demanda baja compre el bien, el
lado derecho de esta restriccin es positivo. Es decir, si eligiramos el valor mximo para r1
la condicin (4) nos quedara:
u2 ( x2 ) r2 u2 ( x1 ) u1 ( x1 ) > 0
ya que el consumidor 2 es el consumidor de demanda alta. (Lo que implica que la restriccin
de participacin del consumidor 2 no se puede satisfacer con igualdad). Pero dado que le
tiene que dejar con excedente positivo al consumidor de demanda alta, le dejar con el
mnimo excedente posible, dejando al consumidor 2 indiferente entre elegir el lote diseado
para l y el lote diseado para el consumidor 1. Es decir, (reordenando la restriccin (5)):
u2 ( x2 ) r2 = u2 ( x1 ) u1 ( x1 ) > 0

42

SARRIKO-ON 6/09

ya que como el consumidor de demanda baja no tiene incentivos a realizar arbitraje


(obtendra un excedente negativo) el monopolista le cobra su disposicin mxima a pagar
r1 = u1 ( x1 ).

(iv) Planteamiento y resolucin del problema de maximizacin de beneficios


max r1 + r2 c.( x1 + x2 )

max r1 + r2 c.( x1 + x2 )

r1 , x1 , r2 , x2

s.a

u1 ( x1 ) - r1 0 (1)
u2 ( x2 ) - r2 0 (2)

r1 , x1 , r2 , x2

s.a

r1 = u1 ( x1 ) (6)
r2 = u2 ( x2 ) [u2 ( x1 ) r1 ] (5)

u1 ( x1 ) - r1 u1 ( x2 ) - r2 (3)
u2 ( x2 ) - r2 u2 ( x1 ) - r1 (4)

El problema quedara:
( x1 , x2 )

 
max u1 ( x1 ) + u2 ( x2 ) [u2 ( x1 ) u1 ( x1 )] c.( x1 + x2 )

x1 , x2

= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] = 0 (7)


x1

= u2' ( x2 ) c = 0 (8)


x2

Las tarifas vendrn dadas por:


r1 = u1 ( x1 )
r2 = u2 ( x2 ) [u2 ( x1 ) u1 ( x1 )]

(v) Observaciones
1) El monopolista ofrece al consumidor de demanda alta la cantidad eficiente y le deja
con un excedente positivo.

43

SARRIKO-ON 6/09

La condicin (8) implica u2' ( x2 ) = c y, por tanto, el monopolista ofrece al consumidor de
demanda alta la cantidad eficiente x2 = x2e (comprobar condiciones de eficiencia).
Adems le cobra un precio (tarifa) menor que su disposicin mxima a pagar dejndole con
un excedente positivo e igual al que obtendra si se hiciera pasar por un consumidor de
demanda baja y eligiera el lote diseado para consumidor 1. r2 = u2 ( x2 ) [u2 ( x1 ) u1 ( x1 )] y
por tanto su excedente sera: u2 ( x2 ) r2 = [u2 ( x1 ) u1 ( x1 )].

2) El monopolista ofrece al consumidor de demanda baja una cantidad menor que la


eficiente (demostracin) y le deja con un excedente nulo.

= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] = 0 (7)




x1
>0

Como el consumidor 2 es el de demanda alta [u2' ( x1 ) u1' ( x1 )] > 0 y entonces de la condicin
(7) obtenemos u1' ( x1 ) > c. Por definicin la produccin eficiente satisface u1' ( x1e ) = c, por lo
que se cumple u1' ( x1 ) > u1' ( x1e ). Como la disposicin mxima a pagar es una funcin
estrictamente cncava:

u ( x1 ) > u ( x )

e
x1 < x1

d (u1' ( x1 ))
<0
dx1

'
1

'
1

e
1

Veamos cul es la intuicin de este resultado. Para ello vamos a interpretar el beneficio
marginal de x1 y evaluarlo en diferentes niveles de produccin.

44

SARRIKO-ON 6/09

= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )]


x1 
>0
> 0( x1 < x1* ) 

Beneficio marginal desde el


consumidor 1: un cambio en la
cantidad ofrecida a este consumidor
cambia el beneficio que obtiene el
monopolista desde l.

Beneficio marginal desde el


consumidor 2: un cambio en la
cantidad ofrecida al consumidor 1
cambia el excedente que tiene que
dejar al consumidor 2 para que no
haga arbitraje.

( x1* )
= u1' ( x1* ) c [u2' ( x1* ) u1' ( x1* )] < 0


x1
=0

>0

Partiendo de la cantidad x1* una reduccin en la cantidad ofrecida al consumidor 1 eleva el


beneficio ya que se reduce el excedente que tiene que dejar el monopolista al consumidor 2.
Considerando ahora una cantidad de x1 tal que x1 < x1 < x1* se cumple:

( x1 )
= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] < 0


x1
>0

>0

Al monopolista le compensa seguir reduciendo x1 ya que la ganancia en beneficios desde el


consumidor de demanda alta por dejarle con menor excedente compensa la prdida de
beneficios desde el consumidor de demanda baja por ofrecerle una cantidad menor.
( x1 )
= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] = 0


x1
>0

En x1 la ganancia marginal, de una reduccin infinitesimal en x1 , desde el consumidor de


demanda alta por dejarle con menor excedente se iguala con la prdida marginal desde el
consumidor de demanda baja por ofrecerle una cantidad menor.

45

SARRIKO-ON 6/09

Adems le cobra un precio (tarifa) igual que su disposicin mxima a pagar dejndole con
un excedente nulo: r1 = u1 ( x1 ).

(vi) Bajo qu condiciones decide el monopolista ofrecer el bien a ambos consumidores?


El monopolista decidir ofrecer el bien a ambos consumidores siempre que obtenga mayores
beneficios que ofreciendo el bien exclusivamente al consumidor de demanda alta. Es decir,
ofrecer el bien a ambos consumidores si se cumple:

(0, x2* ) ( x1 , x2 )


u2 ( x2* ) cx2* u1 ( x1 ) cx1 + u2 ( x2* ) [u2 ( x1 ) u1 ( x1 )] cx2*
N


r1

r2

[u2 ( x1 ) u1 ( x1 )] u1 ( x1 ) cx1

Si esta condicin no se cumple el monopolista decidira ofrecer el bien exclusivamente al


consumidor de demanda alta. Otra forma de verlo consiste en considerar el beneficio
marginal de x1. Si fuera negativo para todo nivel de x1
( x1 )
= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] < 0 x1


x1
>0

>0

entonces el monopolista decidira no ofrecer nada al consumidor de demanda baja, ya que


para todo nivel de x1 reducir la cantidad ofrecida al consumidor de demanda baja elevara el
beneficio.

46

SARRIKO-ON 6/09

(vi) Anlisis grfico (coste marginal nulo)

u1' ( x1* ) = c = 0

u1' ( x)

u2' ( x2* ) = c = 0

u2' ( x )

A
C

x1*

x2*

Discriminacin perfecta
(ri* , xi* )
(0, 0)

i = 1, 2

u1' ( x1* ) = u2' ( x2* ) = 0N


c

r1* = u1 ( x1* ) A
r2* = u2 ( x2* ) A + B + C
* = u1 ( x1* ) + u2 ( x2* ) N
A+ 
A
+
B +

C
r1*

r2*

No identificacin

Supongamos que el monopolista no conoce la identidad del consumidor y que establece una
nica lista de precios donde mantiene las combinaciones precio-cantidad ptimas bajo
discriminacin perfecta. El consumidor 2 tendra incentivos a realizar arbitraje personal.

47

SARRIKO-ON 6/09

(r1* , x1* )
N

Consumidor 1

A
*
2

0=
A
+
B +

C ( A + B + C) < N
A+ B N
A= B


*
*
*

Consumidor 2

( r , x2* )
N
A+ B + C

u2 ( x2 )

r2*

u2 ( x1 )

r1

(0, 0)

Discriminacin de segundo grado

Las restricciones que se cumplen con igualdad son:


r1 = u1 ( x1 ) A( x1 ) al consumidor 1 se le cobra el rea debajo de la inversa de demanda.
u2 ( x2 ) r2 = u2 ( x1 ) r1 B ( x1 ) al consumidor 2 hay que dejarle con un excedente B ( x1 )
(el mnimo posible) para que no haga arbitraje.

Inicialmente mantenemos las cantidades ofrecidas; slo ajustamos las tarifas.


(r1 , x1* )
N
A

( x1* , x2* ) = 2 A + C

( r2 , x2* )
N
A+ C

(0, 0)
( x1' , x2* ) = A '+ A + B + C B '
( x1' , x2* ) ( x1* , x2* ) ( A A ') + ( B B ') > 0

u2' ( x1' ) u1' ( x1' )


B

u1' ( x1' ) c

u1' ( x)
B
A

u2' ( x )

A
C
*
x1' x1

x2*

x
48

SARRIKO-ON 6/09

(r1 , x1 )
(r2 , x2 )
(0, 0)

( x1 )
= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] = 0


x1
>0

Como estamos suponiendo que el coste marginal es cero:


( x1 )
= u1' ( x1 ) [u2' ( x1 ) u1' ( x1 )] = 0 u1' ( x1 ) = u2' ( x1 ) u1' ( x1 )


x1
>0

p
u ( x1 )
'
2

u2' ( x1 ) u1' ( x1 )


B

u1' ( x1 ) cN

u1' ( x)

=0

u1' ( x1 )

u2' ( x )

A
C

x1

x1*

x2*

( x1 , x2 ) = u1 ( x1 ) cN x1 + u2 ( x2* ) [u2 ( x1 ) u1 ( x1 )] cN x2* A + A + B + C B


N
0
0
x2*

49

SARRIKO-ON 6/09

Slo ofrecer el bien al consumidor de demanda alta

( x1 )
= u1' ( x1 ) c [u2' ( x1 ) u1' ( x1 )] < 0 x1


x1

>0

>0

( r2* , x2* )
N
A+ B +C

'
1

u ( x)

(0, 0)
u2' ( x )

x1*

x2*

1.8. La discriminacin de precios de tercer grado


(i) Definicin y contexto.
(ii) Maximizacin de beneficios. Regla de la inversa de la elasticidad.
(iii) Comparacin de beneficios con el caso de precio uniforme (precio simple de
monopolio).
(iv) Efectos sobre el bienestar social.

(i) Definicin y contexto


Existe discriminacin de precios de tercer grado cuando se cobra a consumidores
pertenecientes a distintos grupos o submercados precios diferentes, pero cada consumidor
paga el mismo precio por cada una de las unidades que adquiere. ste es probablemente el

50

SARRIKO-ON 6/09

tipo ms comn de discriminacin de precios. Ejemplos: descuentos a estudiantes, precios


diferentes dependiendo del da de la semana etc.

El monopolista recibe una seal exgena que le permite distinguir m mercados o


submercados completamente separados:

xi
= 0. ste es un tipo de discriminacin directa:
p j

el monopolista establece listas de precios diferentes para consumidores pertenecientes a


diferentes grupos o mercados. Identificacin: el monopolista clasifica a cada consumidor en
un grupo.

(ii) Maximizacin de beneficios. Regla de la inversa de la elasticidad


Vamos a considerar el caso ms sencillo en el que m = 2 : el monopolista clasifica a los
consumidores en dos grupos o mercados cuyas funciones inversas de demanda son p1 ( x1 ) y
p2 ( x2 ), con pi' ( xi ) < 0, i = 1, 2. El monopolista puede establecer precios diferentes en los dos
mercados pero dentro de cada mercado no puede discriminar. El problema de maximizacin
es:
( x1 , x2 )

 
max p1 ( x1 ) x1 + p2 ( x2 ) x2 c.( x1 + x2 )
x1 , x2

= p1 ( x1 ) + x1 p1' ( x1 ) c = 0 (1)
x1

(i ) IM 1 = IM 2 = c

= p2 ( x2 ) + x2 p2' ( x2 ) c = 0 (2)
x2

(i ) pi ( xi ) + xi pi' ( xi ) = c

51

SARRIKO-ON 6/09

pi ( xi )[1 +

pi ( xi )[1 +

1
]=c
i ( xi )

pi ( xi )[1

1
]=c
i ( xi )

pi ( xi ) =

Por tanto, p1 ( x1 ) > p2 ( x2 ) sii

xi pi' ( xi )
]=c
pi ( xi )

c
1
1
i ( xi )

i = 1, 2.

1 ( x1 ) < 2 ( x2 ) . En consecuencia se cobrar el precio ms

bajo al mercado cuya demanda sea ms elstica; es decir, al mercado ms sensible al precio.

(iii) Comparacin de beneficios con el caso de precio uniforme (precio simple de


monopolio).
El beneficio del monopolista bajo discriminacin de precios de tercer grado es por lo menos
tan alto como el beneficio bajo precio uniforme. La razn es sencilla: bajo discriminacin de
precios de tercer grado siempre podra elegir los precios iguales si eso fuera lo ms rentable.
(iv) Efectos sobre el bienestar social
1) Cul es el problema?
2) Cotas al cambio en el bienestar social.
3) Aplicaciones:
a) Demanda lineal.
b) Apertura de mercados.

52

SARRIKO-ON 6/09

1) Cul es el problema?
El objetivo de esta seccin es comparar desde el punto de vista del bienestar social la
discriminacin de precios de tercer grado con el precio uniforme o precio simple de
monopolio. En general, un movimiento desde precio uniforme a discriminacin de precios de
tercer grado beneficia a algunos agentes y perjudica a otros.

Beneficiados por la DP3: el monopolista y los consumidores del mercado de mayor

elasticidad (ya que el precio baja en ese mercado).


Perjudicados por la DP3: los consumidores del mercado de menor elasticidad (ya que el

precio aumenta).
Luego el efecto sobre el bienestar social queda indeterminado.

2) Cotas al cambio en el bienestar social


Supongamos para simplificar que slo hay dos mercados y partamos de una funcin de
utilidad agregada de la forma: u1 ( x1 ) + u2 ( x2 ) + y1 + y2 , donde x1 y x2 son los consumos del
bien x por parte de los dos grupos e y = y1 + y2 es el dinero que se gasta en otros bienes de
consumo. Las funciones u1 y u2 son estrictamente cncavas. Las funciones inversas de
demanda de los dos submercados son: p1 ( x1 ) = u1' ( x1 ) y p2 ( x2 ) = u2' ( x2 ).
Si C ( x1 , x2 ) es el coste de ofrecer x1 y x2 podemos medir el bienestar social como:
W ( x1 , x2 ) = u1 ( x1 ) + u2 ( x2 ) C ( x1 , x2 )
Consideramos dos configuraciones de la produccin ( x10 , x20 ) y ( x11 , x12 ) cuyos precios son
( p10 , p20 ) y ( p11 , p12 ), respectivamente. Supongamos que el conjunto inicial de precios

53

SARRIKO-ON 6/09

corresponde con el precio uniforme (precio simple de monopolio) p10 = p20 = p 0 y que p11 y p12
son los precios bajo discriminacin de precios de tercer grado. Consideraremos el paso de

x 0 a x1. Debido a la estricta concavidad de u1 y u2 tenemos que (ver Apndice):

x1



P
1
0
'
0
1
0
0
u1 ( x1 ) < u1 ( x1 ) + u1 ( x1 ) ( x1 x1 ) (1) u1 < p1 x1

0
1
p1 x1 > u1 > p1 x1 (3)
u1 ( x10 ) < u1 ( x11 ) + u1' ( x11 ) ( x10 x11 ) (1)' u1 > p11x1
N

x1
p1 ( x11 ) = p11

p1 ( x10 ) = p10

x2




1
0
'
0
1
0
0
u2 ( x2 ) < u2 ( x2 ) + u2 ( x2 ) ( x2 x2 ) (2) u2 < p2 x2

0
1
p2 x2 > u2 > p2 x2 (4)
u2 ( x20 ) < u2 ( x12 ) + u2' ( x12 ) ( x20 x12 ) (2)' u2 > p12 x2



x2
p2 ( x11 ) = p12

p2 ( x10 ) = p20

Sumando (3) y (4)


p10 x1 + p20 x2 > u1 + u2 > p11x1 + p12 x2
donde
u = u1 + u2 ; x1 = x11 x10 ; x2 = x12 x20
p10 = p1 ( x10 ) = u1' ( x10 ); p20 = p2 ( x20 ) = u2' ( x20 );
p11 = p1 ( x11 ) = u1' ( x11 ); p12 = p2 ( x12 ) = u2' ( x12 ).
W = W ( x11 , x12 ) W ( x10 , x20 ) = u1 ( x11 ) u1 ( x10 ) + u2 ( x12 ) u2 ( x20 ) [C ( x11 , x12 ) C ( x10 , x20 )]


u1

u 2

= u1 + u2 C

Por tanto,
p10 x1 + p20 x2 C > W > p11x1 + p12 x2 C
Si el coste marginal es constante:

54

SARRIKO-ON 6/09

C = c( x11 + x12 ) c( x10 + x20 ) = cx1 + cx2


Con lo que las cotas al cambio en el bienestar nos quedan:
( p10 c)x1 + ( p20 c)x2 > W > ( p11 c)x1 + ( p12 c)x2 (5)


Cota superior

Cota inferior

Como p10 = p20 = p 0 las cotas del cambio en el bienestar son:


x


( p c) (x1 + x2 ) > W > ( p11 c)x1 + ( p12 c)x2 (6)


Cota superior

Cota inferior

- Cota superior: implica que una condicin necesaria para que aumente el bienestar social,
W > 0, es que aumente la produccin total. Supongamos por el contrario que
x = x1 + x2 0. Como ( p 0 c) > 0 entonces (4) W < 0.
- Cota inferior: indica que una condicin suficiente para que aumente el bienestar bajo
discriminacin de precios de tercer grado es que sea positiva la suma de las variaciones de la
produccin ponderadas por la diferencia entre el precio bajo discriminacin y el coste
marginal.

Grficamente para el caso de un nico mercado las cotas quedaran:

( p 0 c)x > W > ( p1 c)x

p0
p1
c

x0

x1
55

SARRIKO-ON 6/09

3) Aplicaciones
a) Demanda lineal
Supongamos
xi ( pi ) =

que

las

demandas

de

los

dos

mercados

vienen

por

ai 1
pi , i = 1, 2, y el coste marginal constante es nulo, c = 0. El problema de
bi bi

maximizacin de beneficios bajo discriminacin de precios de tercer grado es:


max p1 x1 ( p1 ) + p2 x2 ( p2 )
p1 , p2

a 1
a
a
1

= x1 ( p1 ) + p1 x1' ( p1 ) = 0 1 p1 p1 = 0 p11 = 1 ; x11 = 1


b1 b1
b1
2
2b1
p1
a
1
1
a
a

= x2 ( p2 ) + p2 x2' ( p2 ) = 0 2 p2 p2 = 0 p12 = 2 ; x12 = 2


2
2b2
p2
b2 b2
b2
La cantidad total vendida es:
x1 = x11 + x12 =

a1
a
a b + a2b1
+ 2 = 1 2
2b1 2b2
2b1b2

Bajo precio uniforme:


max px1 ( p ) + px2 ( p )
p

a 1
a

1
1
1
= x1 ( p ) + x2 ( p ) + px1' ( p) + px2' ( p) 1 p + 2 p p p = 0
p
b1 b1
b2 b2
b1
b2
p0 =

dadas

a1b2 + a2b1
;
2(b1 + b2 )

x10 =

a1 1 a1b2 + a2b1 2a1b1 + 2a1b2 a1b2 a2b1 2a1b1 + a1b2 a2b1

=
=
b1 b1 2(b1 + b2 )
2b1 (b1 + b2 )
2b1 (b1 + b2 )

x10 =

a2 1 a2b1 + a1b2 2a2b2 + 2a2b1 a2b1 a1b2 2a2b2 + a2b1 a1b2

=
=
2b2 (b1 + b2 )
2b2 (b1 + b2 )
b2 b2 2(b1 + b2 )

La cantidad total vendida es:

56

SARRIKO-ON 6/09

x 0 = x10 + x20 =

2a1b1 + a1b2 a2b1 2a2b2 + a2b1 a1b2


+
2b1 (b1 + b2 )
2b2 (b1 + b2 )

2a1b1b2 + a1 (b2 ) 2 a2b1b2 + 2a2b1b2 + a2 (b1 ) 2 a1b1b2


2b1b2 (b1 + b2 )

a1b1b2 + a1 (b2 ) 2 + a2b1b2 + a2 (b1 ) 2 (a1b2 + a2b1 )(b1 + b2 ) a1b2 + a2b1


=
=
2b1b2 (b1 + b2 )
2b1b2 (b1 + b2 )
2b1b2

Por tanto, la produccin es la misma bajo ambas polticas de precios. Es decir,


x = x1 + x2 = 0. Es decir, x1 = x2 . Las cotas quedaran
x


( p c) (x1 + x2 ) > W > ( p11 c)x1 + ( p12 c)x2 (6)


=0

<0

Luego el bienestar disminuye: W < 0 .


Como veremos a continuacin el anterior resultado depende crucialmente de que todos los
mercados sean servidos bajo precio uniforme.

b) Apertura de mercados
Imaginemos que las demandas de los dos mercados son como las que aparecen en el grfico
adjunto.

p 0 = p11
p12

x2 ( p2 )
x12

x11

x1 ( p1 )
x
57

SARRIKO-ON 6/09

Si el monopolista tuviera que vender al mismo precio debera bajar tanto el precio en el
mercado 1 que la reduccin de beneficios en ese mercado no se vera compensada. Por tanto,

( p11 c) (x1 + x2 ) > W > ( p11 c) x1 + ( p12 c) x2 (6)


N
N N
N
N
=0
>0
=0
>0
p0


>0
=0
>0


>0

Por tanto, como la cota inferior es positiva W > 0. Pero no slo aumenta el bienestar; de
hecho la discriminacin de precios domina en el sentido de Pareto al precio uniforme. Al
pasar de precio uniforme a discriminacin de precios de tercer grado aumentan los beneficios
del monopolista, mejoran los consumidores del mercado 2 y los consumidores del mercado
uno estn igual.

Apndice

Si u es una funcin estrictamente cncava para todo x e y se cumple:


u ( x) < u ( y ) + u ' ( y )( x y ).
Las tangentes siempre quedan por encima de la funcin si sta es estrictamente cncava.

u lineal u ' ( y ) =

u ( x)

u ( x) u ( y )
x y

u lineal u ( x) = u ( y ) + ( x y )u ' ( y )

u( y)

u estrictamente cncava u ( x) < u ( y ) + ( x y )u ' ( y )

58

SARRIKO-ON 6/09

Tema 2. Teora de Juegos No Cooperativos

Introduccin

La Teora de los Juegos no Cooperativos estudia y modela situaciones de conflicto entre


agentes econmicos; es decir, estudia situaciones en las que los beneficios (ganancias,
utilidad o pagos) de cada agente econmico dependen no slo de sus propios actos sino
tambin de los actos de los dems agentes.

Supondremos jugadores racionales y, por tanto, cada uno de ellos tratar de maximizar su
funcin de beneficios (utilidad o pagos) dadas sus conjeturas o creencias sobre cmo van a
actuar los otros jugadores. El resultado del juego depender de las acciones de todos los
jugadores.

Una caracterstica fundamental de los juegos no cooperativos es que no se pueden establecer


contratos entre los jugadores que se hagan cumplir por terceros. Es decir, no existe una
institucin externa (p.e. tribunales de justicia) que sea capaz de hacer cumplir los acuerdos.
En este contexto, la cooperacin entre los jugadores slo surgir como equilibrio o propuesta
de solucin si est en el mejor inters de los jugadores actuar as.

Para cada juego trataremos de proponer una solucin que sea una prediccin razonable del
comportamiento racional de los jugadores (OBJETIVO).

Nos interesa la T de los Juegos no Cooperativos porque es de gran utilidad para modelar y
comprender los problemas econmicos multipersonales caracterizados por interdependencia
estratgica. Como ejemplo consideremos la competencia entre las empresas de una industria.
La competencia perfecta y el monopolio puro (en el sentido de no estar amenazado por la
entrada) son casos muy especiales y poco realistas. Lo frecuente es encontrarse en la realidad
industrias en las que existen pocas empresas (o existen muchas pero un nmero pequeo de
ellas produce un porcentaje muy elevado de la produccin total). Cuando hay pocas empresas,

59

SARRIKO-ON 6/09

la competencia entre ellas estar mediatizada por consideraciones estratgicas: cada empresa
toma sus decisiones (precio, produccin, publicidad..) teniendo en cuenta o conjeturando el
comportamiento de las dems. Por tanto, la competencia en un oligopolio, claramente la
podemos ver como un juego no cooperativo donde las empresas son los jugadores. As,
muchas de las predicciones o propuestas de solucin que provienen de la Teora de los Juegos
nos sern de gran utilidad para entender el comportamiento de los agentes econmicos bajo
interaccin estratgica

En la seccin 2, definiremos las principales nociones de la Teora de los juegos. Veremos que
existen dos formas de representar un juego: la forma extensiva y la forma normal o
estratgica. En la seccin 3, analizaremos los principales conceptos de solucin y los
problemas que stos presentan. Estudiaremos el equilibrio de Nash y los refinamientos. La
seccin 4 estudia los juegos repetidos y, por ltimo, en la seccin 5 se presentan algunas
conclusiones.

2.1. Nociones fundamentales

Existen dos formas de representar un juego: la forma extensiva y la forma normal o


estratgica. Vamos a comenzar analizando los principales elementos de un juego en forma
extensiva.

2.2.1. Juegos en forma extensiva (dinmicos o secuenciales)


Un juego en forma extensiva especifica:
1) Los jugadores.
2) El orden del juego.
3) Las elecciones factibles para un jugador cuando le toca el turno (en cada nodo de
decisin).
4) La informacin que tiene cada jugador en cada uno de sus turnos de juego (nodos).

60

SARRIKO-ON 6/09

5) Los pagos para cada jugador como una funcin de los movimientos seleccionados.
6) Distribuciones de probabilidad para movimientos de la naturaleza.

Un juego en forma extensiva se suele describir a travs de un rbol de decisin. Un rbol de


decisin est constituido por ramas y nodos. Hay dos tipos de nodos: nodos de decisin y
nodos terminales. Hay que sealar en cada nodo el agente que tiene que tomar la decisin.
Cuando alcanzamos un nodo de decisin, el agente de ese nodo tiene su turno y elige en qu
direccin ir. Cuando se alcanza un nodo terminal se producen pagos: un vector de pagos en
cada nodo terminal que nos dice lo que gana cada jugador.

EJEMPLO 1: Juego de entrada

Consideremos una industria en la que hay una empresa establecida, A, y un entrante


potencial, E. En la primera etapa del juego el entrante potencial decide si entrar o no en la
industria. Si decide no entrar el juego termina y se producen pagos (A obtiene el beneficio de
monopolio) y si decide entrar entonces le toca el turno a la empresa establecida, A, que tiene
que decidir si acomodarse a la entrada de E (repartirse el mercado) o comenzar una guerra de
precios mutuamente perjudicial. En forma extensiva el juego quedara representado de la
siguiente forma:

(0, 10)

NE

(4, 4)

E
E

Ac.

A
G.P.

(-1, -1)

61

SARRIKO-ON 6/09

Jugadores: E y A.
Acciones: E (entrar), NE (no entrar), Ac. (acomodar), G.P. (guerra de precios).
Nodos de decisin: .
Nodos terminales: .
(x, y): vector de pagos. x: pago para el jugador E; y: pago para el jugador A.

En cada nodo terminal se tienen que especificar los pagos de cada uno de los jugadores
(incluso aunque alguno de ellos no haya llegado fsicamente a jugar).
Supuestos:

(i) Todos los jugadores tienen la misma percepcin de cmo es el juego.


(ii) Informacin completa: cada jugador conoce las caractersticas de los dems jugadores:
preferencias y espacios de estrategias.
(iii) Memoria perfecta: cada agente recuerda todo lo que ha jugado.

Definicin 1: Conjunto de informacin


Es la informacin de la que dispone cada jugador en cada nodo de decisin que le
corresponde.
L
A
I

(., .)

1
D

(., .)

D
2

(., .)
R

(., .)

2
B

(., .)

(., .)

Juego 1

Juego 2

62

(., .)

(., .)

SARRIKO-ON 6/09

En el juego 1 el jugador 2 tiene diferente informacin en cada uno de sus dos nodos. En A, si
le toca jugar sabe que el jugador 1 ha jugado I y en B que ha jugado D. Decimos que estos
conjuntos de informacin constan de un nico nodo de decisin. En el juego 2, el jugador 2
tiene la misma informacin en sus dos nodos de decisin. Es decir, el conjunto de
informacin constara de dos nodos de decisin.

Un juego en el que existen conjuntos de informacin de ms de un nodo se dice que es un


juego de informacin imperfecta: alguno de los jugadores no observa los movimientos del
otro o de los otros jugadores. Abusando del lenguaje se suele llamar conjunto de informacin
al conjunto de nodos en los que un mismo jugador tiene que jugar en ausencia de informacin
sobre el nodo concreto en el que se encuentra.

El hecho de que todos los jugadores sepan el tipo de juego que estn jugando y el supuesto de
memoria perfecta limitan las situaciones en las que podemos tener conjuntos de informacin
con ms de un nodo.
(., .)

(., .)
I
2
1

(., .)
(., .)

(., .)

(., .)

(., .)
D

2
Juego 3

(., .)

(., .)

(., .)

Juego 4

El juego 3 est mal representado ya que no sera un juego de informacin imperfecta. Si el


jugador 2 conoce el juego, cuando le toque jugar y se enfrente a tres alternativas

63

SARRIKO-ON 6/09

automticamente deducir que se encuentra en el nodo superior. Es decir, el juego en forma


extensiva debera ser como el del juego 4. Por tanto, si un conjunto de informacin consta de
dos o ms nodos de decisin, en cada uno de ellos el nmero de opciones (acciones o
movimientos) debe ser el mismo.

(., .)

(., .)

(., .)

(., .)

C
M

b
a

D
2

(., .)

(., .)
1

(., .)

1
2

(., .)
a

D
b

(., .)
(., .)

(., .)

(., .)
Juego 5

Juego 6

El supuesto de memoria perfecta impide situaciones como la del juego 5. El jugador 1 cuando
le toca jugar en su segundo nodo de decisin recuerda perfectamente lo que hizo en el
primero. La forma extensiva debera ser como la del juego 6.

Definicin 2: Subjuego
Lo que queda por jugar a partir de un nodo de decisin, siempre y cuando lo que quede por
jugar no forme parte de un conjunto de informacin de dos o ms nodos. Al formar subjuegos
se miran partes del rbol de decisin que puedan construirse sin romper ningn conjunto de
informacin. Un subjuego comienza en un conjunto de informacin de un nico nodo de
decisin y todos los nodos de decisin de un mismo conjunto de informacin deben
pertenecer al mismo subjuego.

64

SARRIKO-ON 6/09

EJEMPLO 2: El dilema del prisionero

Dos individuos, A y B, son detenidos como sospechosos de haber cometido conjuntamente un


delito. La polica les interroga en habitaciones separadas de forma que no hay comunicacin
entre ellos. Cada uno tiene la posibilidad de confesarse culpable (C) o no confesar (NC). Si
slo confiesa uno ste queda en libertad y las autoridades culpan al otro condenndole a 6
meses. Si ambos niegan su participacin son condenados a 1 mes cada uno y si ambos
confiesan son condenados a 3 meses cada uno.

- Caso simultneo: cada individuo toma su decisin sin saber lo que ha decidido el otro.
C

(1, 1)

NC

(3, 0)

(0, 3)

C
B
A
NC
DP1

NC

(2, 2)

Hay un conjunto de informacin con dos nodos de decisin. Es un juego de informacin


imperfecta. Slo hay un subjuego que coincide con el propio juego.

- Caso secuencial: el segundo observa la eleccin tomada por el primero (y ste lo sabe).
C
C

NC
C

NC
B
DP2

NC

(1, 1)
(3, 0)
(0, 3)
(2, 2)

65

SARRIKO-ON 6/09

El juego DP2 es un juego de informacin perfecta y tiene tres subjuegos. En los juegos de
informacin perfecta hay tantos subjuegos como nodos de decisin.

Definicin 3: Estrategia
Una estrategia de un jugador es una descripcin completa de lo que hara en caso de ser
llamado a jugar en cada uno de sus nodos de decisin. Hay que especificarlo incluso en
aquellos nodos que no fueran alcanzables para l dado el comportamiento actual del otro o de
los otros jugadores. Es un plan de comportamiento o plan de conducta (Ejemplos:
entrenador de baloncesto, demanda del consumidor, oferta de la empresa competitiva). Es
una funcin en la que cada jugador asigna una accin a cada nodo que le corresponde. Una
estrategia de un jugador tiene tantas componentes como conjuntos de informacin tenga el
jugador.

Definicin 4: Accin
Es una eleccin (decisin o movimiento) en un nodo de decisin

Las acciones son fsicas y las estrategias son conjeturales.

Definicin 5: Jugada o combinacin de estrategias


Es una especificacin de una estrategia para cada uno de los jugadores. El resultado (vector
de pagos) de una jugada debe quedar inequvocamente determinado.

66

SARRIKO-ON 6/09

EJEMPLO 1: Juego de entrada

Es un juego de informacin perfecta y dos subjuegos. Cada jugador tiene dos estrategias:
S E = {NE , E} y S A = {Ac.,G.P.}. Combinaciones de estrategias: (NE, Ac.), (NE, G.P.), (E,

Ac.) y (E, G.P.).

EJEMPLO 2: Dilema del prisionero


DP1: Es un juego de informacin imperfecta y tiene un subjuego. Cada jugador tiene dos

estrategias: S A = {C, NC} y SB = {C, NC}. Combinaciones de estrategias: (C, C), (C, NC),
(NC, C) y (NC, NC).
DP2: Es un juego de informacin perfecta y tiene tres subjuegos. El jugador A tiene dos

S A = {C, NC} pero el jugador B tiene cuatro SB = {CC,CNC, NCC, NCNC}.

estrategias

Combinaciones de estrategias: (C, CC), (C, CNC), (C, NCC), (C, NCNC), (NC, CC),
(NC,CNC), (NC, NCC) y (NC, NCNC).

EJEMPLO 3

(10, 0)
R

(4, 4)

I
2

(1, -1)

(8, 10)

S
1

El jugador 1 tiene en su primer nodo de decisin dos posibles acciones, D e I, y en el segundo


nodo tambin dos acciones: s y r. S1 = {Ds, Dr, Is, Ir} y S2 = {R, S}.

67

SARRIKO-ON 6/09

2.1.2. Juegos en forma normal o estratgica (simultneos o estticos)

Un juego en forma normal se describe por:


1) Los jugadores.
2) El conjunto (o espacio) de estrategias de cada jugador.
3) Una funcin de pagos que asigna a cada combinacin de estrategias un vector de pagos.

El elemento clave de esta forma de representar un juego es la descripcin de los pagos del
juego en funcin de las estrategias de los jugadores, sin explicitar las acciones que se van
tomando a lo largo del juego. La representacin grfica, para dos jugadores, es una matriz
(binaria) de pagos que tiene como entradas las posibles estrategias de los dos jugadores.

EJEMPLO 1: Juego de entrada

A
Ac.

(0, 10)

NE

(4, 4)

G.P.

NE

(0, 10)

(0, 10)

(4, 4)

(-1, -1)

Ac.

E
A
G.P.

(-1, -1)

EJEMPLO 2: Dilema del prisionero

B
C

(1, 1)

NC

(3, 0)

(0, 3)

C
B
A
NC
NC

NC

(1, 1)

(3, 0)

NC

(0, 3)

(2, 2)

(2, 2)
68

SARRIKO-ON 6/09

(1, 1)

NC

(3, 0)

(0, 3)

NC
B

NCNC

CC

CNC

(1, 1)

(1, 1)

(3, 0)

(3, 0)

NC

(0, 3)

(2, 2)

(0, 3)

(2, 2)

NCC

(2, 2)

NC
EJEMPLO 3

2
R
D

(10, 0)
R

Ds

(10, 0)

(10, 0)

Dr

(10, 0)

(10, 0)

Is

(4, 4)

(1, -1)

Ir

(4, 4)

(8, 10)

(4, 4)

(1, -1)

s
2

S
1

(8, 10)

Relacin entre juegos en forma normal y juegos en forma extensiva

a) Para todo juego en forma extensiva tenemos de forma inequvoca un juego en forma
normal que le corresponde. Esto es debido a que el juego en forma normal se describe en
funcin de las estrategias de los jugadores.
b) (Problema) Juegos diferentes en forma extensiva pueden tener la misma forma normal.
(Ejemplo: dilema del prisionero, DP1, cambiando el orden del juego).

69

SARRIKO-ON 6/09

2.2. Conceptos (criterios) de solucin de juegos no cooperativos

El objetivo es intentar predecir cmo se van a comportar los jugadores cuando se enfrentan a
un determinado juego. NOTA: Una propuesta de solucin no es un vector de pagos sino una
combinacin de estrategias, una para cada jugador, que conducir a un vector de pagos. Nos
interesa predecir comportamientos, no ganancias.

Notacin

i: Jugador representativo, i = 1,, n


Si : conjunto o espacio de estrategias del jugador i.
si Si : estrategia del jugador i.
si Si : estrategia o combinacin de estrategias del otro jugador (o los otros jugadores).
i (si ,s i ) : beneficio o ganancia del agente i correspondiente a la combinacin de estrategias
s (s1,s2 ,.....,sn ) (si ,s i ).

2.2.1. Criterio de dominacin

Definicin 6: Estrategia dominante


Una estrategia es estrictamente dominante para un jugador si lleva a unos resultados
estrictamente mejores (mayores ganancias) que el resto de sus estrategias ante cualquier
combinacin de estrategias de los dems jugadores.
s iD

es

una

estrategia

dominante

i (siD ,si ) > i (si ,si ),si Si ,si siD ;si

70

del

jugador

si

SARRIKO-ON 6/09

EJEMPLO 2: Dilema del prisionero

En el juego DP1 confesar, C, es una estrategia dominante para cada jugador.


Independientemente de lo que haga el otro jugador lo mejor que puede hacer cada uno es
confesar.
La presencia de estrategias dominantes conduce a una solucin del juego. Cada jugador
utilizar su estrategia dominante. La propuesta de solucin para el juego DP1 ser la
combinacin de estrategias (C, C).

Definicin 7: Dominacin (estricta)


Decimos que una estrategia domina estrictamente a otra para un jugador cuando conduce a
mejores resultados cualesquiera que sean las estrategias seguidas por los dems jugadores.
Si i (sid ,s i ) > i (sidd , si ),si , entonces sid domina estrictamente a sidd .

El criterio de dominacin consiste en la eliminacin iterativa de estrategias estrictamente


dominadas. Obviamente, una estrategia est dominada cuando existe otra que la domina.

EJEMPLO 4

t1

t2

t3

s1

(4, 3)

(2, 7)

(0, 4)

s2

(5, 5)

(5, -1)

(-4, -2)

71

SARRIKO-ON 6/09

En este juego no existen estrategias dominantes. Sin embargo, la presencia de estrategias


dominadas nos va a permitir predecir un resultado. Vamos a aplicar el criterio de dominacin.
Como la estrategia t3 es una estrategia estrictamente dominada por t2 el jugador 1 puede
conjeturar (predecir) que el jugador 2 nunca utilizar esa estrategia. Dada esta conjetura, que
supone racionalidad del jugador 2, para el jugador 1 s2 es mejor que s1 . La estrategia s1 slo
sera utilizada ante la posibilidad de que el jugador 2 juegue t3 . Como el jugador 1 piensa que
el jugador 2 es racional asignar una probabilidad nula a que el jugador 2 juegue t3 . En ese
caso, el jugador 1 debera jugar s2 y si el jugador 2 es racional lo mejor que podra hacer es
jugar t1. La utilizacin del criterio de dominacin sucesiva o repetida (eliminando las
estrategias dominadas y computando los juegos reducidos) permite resolver el juego.

EJEMPLO 5

t1

t2

s1

(10, 0)

(5, 2)

s2

(10, 1)

(2, 0)

En este juego no existen estrategias dominantes ni estrategias dominadas (estrictamente).

Definicin 8: Dominacin dbil


Una estrategia domina dbilmente a otra para un jugador si lleva a resultados por lo menos
tan buenos como la segunda cualesquiera que sean las estrategias seguidas por los dems
jugadores, y estrictamente mejores que la segunda para alguna combinacin de estrategias de
los dems.

72

SARRIKO-ON 6/09

Si i (sidb , si ) i (siddb , si ),si , y si tal que i (sidb , si ) > i (sddb


i , si ), entonces
sidb domina dbilmente a siddb .

En el Ejemplo 5, s1 domina dbilmente a s2 . El jugador 2 podra conjeturar que el jugador 1


jugar s1 y ante esta conjetura lo mejor que podra hacer sera jugar t2 . Siguiendo el criterio
de dominacin dbil nuestra propuesta de solucin sera ( s1 , t2 ).
Sin embargo, la aplicacin sucesiva del criterio de dominacin dbil puede llevar a resultados
problemticos como ocurre en el Ejemplo 6, o a no proponer ninguna solucin como ocurre
en el Ejemplo 7 (al no existir ni estrategias dominantes, ni dominadas, ni dbilmente
dominadas).

EJEMPLO 6

s1

t1

t2

t3

(10, 0)

(5, 1)

(4, -200)

s 2 (10, 100)

(5, 0)

(0, -100)

EJEMPLO 7

t1

t2

t3

s1

(4, 10)

(3, 0)

(1, 3)

s2

(0, 0)

(2, 10)

(10, 3)

73

SARRIKO-ON 6/09

2.2.2. Criterio de induccin retroactiva

Vamos a utilizar el criterio de dominacin para analizar la forma extensiva. Consideremos el


Ejemplo 1.
EJEMPLO 1: Juego de entrada

A
Ac.

(0, 10)

NE

(4, 4)
Ac.

G.P.

NE

(0, 10)

(0, 10)

(4, 4)

(-1, -1)

E
A
G.P.

(-1, -1)

En el juego en forma normal, el jugador A tiene una estrategia dbilmente dominada: G.P.. El
jugador E podra conjeturar esto y jugar E. Sin embargo, el jugador E tambin podra haber
elegido NE para asegurarse el pago ante la posibilidad de que A jugara G.P..
En el juego en forma extensiva, la solucin es ms natural. Se aplica la induccin hacia atrs
o induccin retroactiva. El jugador E como juega primero puede conjeturar, correctamente,
que si juega E seguro que el jugador A elegir Ac.. El jugador E al jugar antes que A puede
anticipar el comportamiento de A. En la forma extensiva tenemos ms informacin ya que
cuando A juega conoce el movimiento de E. El criterio de induccin retroactiva consiste en
aplicar el criterio de dominacin sucesiva de forma retroactiva comenzando desde el ltimo(s)
subjuego(s). En el Ejemplo 1, en forma extensiva, el criterio de induccin retroactiva propone
como solucin (E, Ac.).
Resultado: Si el juego es de informacin perfecta y sin empates, el criterio de induccin

retroactiva nos llevar a una nica propuesta de solucin.

74

SARRIKO-ON 6/09

Problemas

(i) Posibilidad de empates.


(ii) Informacin imperfecta. Existencia de conjuntos de informacin con ms de un nodo.
(iii) El xito de la induccin hacia atrs reside en que todas las conjeturas sobre la
racionalidad de los agentes se verifiquen exactamente con independencia de lo largo que sea
el camino hacia atrs. (Requiere racionalidad ilimitada)

EJEMPLO 8

(0, 0)
(6, 1)

1
I
2

(5, 0)

(5, 2)

S
1

La induccin retroactiva no nos lleva a ninguna propuesta de solucin ya que en el ltimo


subjuego el jugador 1 est indiferente entre s y r. En el subjuego anterior el jugador 2 no
tendra una accin dominada ( ya que no sera capaz de predecir el comportamiento del
jugador1).

EJEMPLO 9

(0, 0)

D
1

(2, 2)

(2, 0)

R
I

1
2

s
S
r

No podemos aplicar el criterio de induccin retroactiva.

75

(0, 1)
(-1, 3)

SARRIKO-ON 6/09

EJEMPLO 10: El ciempis de Rosenthal (1981)

1 D

(1, 1)

(0, 3)

(2, 2)

(1, 4)

(98, 98)

1
B

(100, 100)

(97, 100) (99, 99) (98, 101)

En el resultado de induccin retroactiva los pagos son (1, 1). Es posible otra racionalidad?

2.2.3. Equilibrio de Nash

El jugador i, i = 1,, n, viene caracterizado por:


(i) Su espacio estratgico: Si .
(ii) Una funcin de beneficios o funcin de ganancias, i (si ,si ) donde si Si y si Si .
Cada jugador tratar de maximizar su funcin de beneficios (utilidad o ganancias) eligiendo
una estrategia apropiada con conocimiento de los espacios estratgicos y las funciones de
beneficios de los otros jugadores aunque sin conocer la estrategia concreta utilizada por los
rivales. Por tanto, cada jugador debe conjeturar la estrategia utilizada por los rivales.

Definicin 9: Equilibrio de Nash


Una jugada o combinacin de estrategias s (s1 , ...,s n ) constituye un equilibrio de Nash
*

si el resultado para cada uno de los jugadores es mejor o igual que el resultado que
obtendran, permaneciendo constante la jugada de los dems, jugando otra estrategia. Es
decir, s (s1 , ...,s n ) es un equilibrio de Nash si:
*

i (si*, s*i ) i (si, s*i ) si Si ,i,i = 1,...,n .

76

SARRIKO-ON 6/09

En una situacin de equilibrio se tienen que cumplir dos condiciones:


(i) Las conjeturas de los jugadores sobre cmo van a jugar los rivales deben ser correctas.
(ii) Ningn jugador tiene incentivos a cambiar su estrategia dadas las estrategias de los dems
jugadores. ste es un elemento de racionalidad individual: dado lo que hacen los dems
hacerlo lo mejor posible. O lo que es lo mismo, ningn jugador aumenta sus beneficios
(utilidad o pagos) mediante una desviacin unilateral.

Ser equilibrio de Nash es una condicin necesaria o requisito mnimo para que cualquier
propuesta de solucin de un juego sea una prediccin razonable del comportamiento racional
de los jugadores. Sin embargo, como ya veremos no es una condicin suficiente. Es decir, no
basta con que una combinacin de estrategias sea equilibrio de Nash para que sea nuestra
prediccin de la solucin de un juego.

Definicin 10: Equilibrio de Nash


Una jugada o combinacin de estrategias s (s1 , ...,s n ) constituye un equilibrio de Nash
*

si la estrategia de cada jugador es la mejor respuesta (o al menos una de ellas) ante las
estrategias seguidas por los otros jugadores. Es decir, s (s1 , ...,s n ) es un equilibrio de
*

Nash

*
s*i MRi (si
)i,i = 1,...,n

si:
*

{'

'

donde
'

MRi (s i ) = si Si : i (si ,s i ) i (si ,si ), si Si ,si si .

Una forma sencilla de calcular los equilibrios de Nash consiste en construir los conjuntos de
mejores respuestas de cada jugador ante las estrategias (o combinaciones de estrategias) del

77

SARRIKO-ON 6/09

otro (o los otros jugadores) y buscar aquellas combinaciones de estrategias que sean
mutuamente mejores respuestas.

EJEMPLO 11

h
a

(5, 3)

(9, 11)

2
i
(5, 11)

(2, 8)

s1

(3, 10)

(10, 2)

s2

MR1

(20, 5)

(15, 6)

c
c

MR2

(0, 5)

La combinacin de estrategias (b, h) constituye el nico equilibrio de Nash del juego.

EJEMPLO 7

t1

t2

t3

s1

(4, 10)

(3, 0)

(1, 3)

s2

(0, 0)

(2, 10)

(10, 3)

Ntese que para este juego el criterio de dominacin no nos propona ninguna solucin. Sin
embargo, la combinacin de estrategias (s1, t1) constituye el nico equilibrio de Nash del
juego.

78

SARRIKO-ON 6/09

2.3. Problemas y refinamientos del equilibrio de Nash

2.3.1. Posibilidad de ineficiencia


Es habitual encontrar juegos en los que el equilibrio de Nash no es ptimo de Pareto
(eficiente).
EJEMPLO 2: Dilema del prisionero

(1, 1)

NC

(3, 0)

(0, 3)

B
C

NC

C
B
A
NC

(1, 1)

(3, 0)

NC

(0, 3)

(2, 2)

(2, 2)

NC

(C, C) es un equilibrio de Nash en estrategias dominantes. Sin embargo, encontramos otra


combinacin de estrategias (NC, NC) en la que ambos jugadores obtienen mayores ganancias.

2.3.2. Inexistencia de equilibrio de Nash

EJEMPLO 12

t1

t2

s1

(1, 0)

(0, 1)

s2

(0, 1)

(1, 0)

79

SARRIKO-ON 6/09

En este juego no existe equilibrio de Nash en estrategias puras. Sin embargo, permitiendo la
utilizacin de estrategias mixtas (distribuciones de probabilidad sobre el espacio de
estrategias puras de un jugador) se obtiene el resultado de que siempre existe equilibrio de
Nash en estrategias mixtas (juegos finitos).

2.3.3. Multiplicidad de equilibrios de Nash

Vamos a distinguir dos tipos de juegos.

2.3.3.1. Sin posibilidad de refinamiento o seleccin

EJEMPLO 13: La batalla de los sexos

Una pareja de novios tiene que elegir entre ir al cine o al teatro. El novio prefiere el cine al
teatro, pero prefiere ir al teatro acompaado que ir solo al cine. Similarmente (pero al
contrario) para la novia. El juego en forma normal es:
Na
C

(3, 2)

(1, 1)

(1, 1)

(2, 3)

No

En este juego hay dos equilibrios de Nash: (C, C) y (T, T). Existe un problema de
coordinacin pura.

80

SARRIKO-ON 6/09

2.3.3.2. Con posibilidad de refinamiento o seleccin

a) Criterio de eficiencia
Elegir el equilibrio de Nash que proporcione mayores pagos a los jugadores. No es en general
un buen criterio de seleccin.

b) Criterio de dominacin dbil


El criterio consiste en eliminar aquellos equilibrios de Nash basados en estrategias dbilmente
dominadas. Aunque como concepto de solucin no es bueno, nos permite seleccionar entre
los equilibrios de Nash.

EJEMPLO 14

2
D

(1, 1)

(0, 0)

(0, 0)

(0, 0)

Equilibrios de Nash: (D, D) y (I, I). Jugar I es una estrategia dbilmente dominada para cada
jugador. Jugando D cada jugador se garantiza un pago por lo menos tan alto como jugando I.
Tenderamos a rechazar (I, I) por estar basado en estrategias dbilmente dominadas. Por tanto,
proponemos como solucin la combinacin de estrategias (D, D).

81

SARRIKO-ON 6/09

c) Criterio de induccin retroactiva y equilibrio perfecto en subjuegos


EJEMPLO 15
D

s1

MR2

s2

MR1

Dr

R, S

Ir, Is

Ds

R, S

Dr, Ds

Ir

Is

(1, 1)
R

(2, 2)

(-1, -1)

r
2

S
1

(0, 3)

En este juego hay tres equilibrios de Nash: (Dr, S), (Ds, S) y (Ir, R). Comencemos mirando a
la solucin eficiente: (Ir, R). Este equilibrio de Nash presenta un problema: en su segundo
nodo de decisin el jugador 1, aunque no es alcanzable, est anticipando (amenazando) que
jugara r. Amenazando con r trata de conseguir que el jugador 2 juegue R y as obtener ms
pago. Pero este equilibrio est basado en una amenaza no creble: aunque, dada la estrategia
del jugador 2, el segundo nodo de decisin del jugador 1 no es alcanzable, si lo fuera el
jugador 1 nunca elegira r ya que es una accin dominada (amenaza no creble) por s en el
ltimo subjuego. El refinamiento que vamos a utilizar consiste en la eliminacin de aquellos
equilibrios basados en amenazas no crebles (es decir, acciones dominadas dentro de los
subjuegos). De la utilizacin conjunta de la nocin de equilibrio de Nash y del criterio de
induccin retroactiva surge la nocin de:

Definicin 11: Equilibrio perfecto en subjuegos


Una jugada o combinacin de estrategias s (s1 , ...,s n ) , que sea equilibrio de Nash,
*

constituye un equilibrio perfecto en subjuegos si las partes relevantes de las estrategias de

82

SARRIKO-ON 6/09

equilibrio de cada uno de los jugadores son tambin de equilibrio para cada uno de los
subjuegos.

En el Ejemplo 15 (Dr, S) y (Ir, R) no son equilibrios perfectos en subjuegos. El equilibrio


perfecto en subjuegos se obtiene por induccin retroactiva. Comenzamos por el ltimo
subjuego. En este subjuego r es una accin dominada; por tanto, no puede formar parte de la
estrategia del jugador 1 en un equilibrio perfecto en subjuegos, de modo que la eliminamos y
computamos el juego reducido
D

(1, 1)
R

(2, 2)

I
2

(-1, -1)

(0, 3)

S
1

En la segunda etapa de la induccin retroactiva nos fijamos en el anterior subjuego, el


correspondiente al jugador 2. En este subjuego R es una accin dominada para el jugador 2.
Dado que el jugador 2 anticipa que el jugador 1 no va a jugar r jugar R es una accin
dominada o amenaza no creble. Por tanto, la eliminamos y computamos el juego reducido
D

(1, 1)
R

(2, 2)

I
2

(-1, -1)

(0, 3)

S
1

En su primer nodo de decisin el jugador 1 tiene como accin dominada (en el juego
reducido) I, y por tanto jugar D. Luego el equilibrio perfecto en subjuegos es (Ds, S).

83

SARRIKO-ON 6/09

Podemos interpretar la lgica de la induccin retroactiva de la siguiente forma. Cuando el


jugador 2 tiene que elegir debera conjeturar que si juega S el jugador 1 seguro que jugar s.
El jugador 2 es capaz de predecir el comportamiento racional del jugador 1 ya que este ltimo
observa la accin elegida por l. Si el jugador 1 es igualmente racional debera anticipar el
comportamiento del jugador 2 y jugar D.

(1, 2)

EJEMPLO 16

L
M
A

(1, 1)
(0, 0)

(2, 2)

(2, 0)

O
B

1
2

r
P
s

(0, 1)
(-1, 3)

En este juego hay mltiples equilibrios de Nash y no podemos aplicar la induccin retroactiva
al tener un subjuego de informacin imperfecta. Lo que hacemos es resolver el subjuego
inferior del jugador 2 como si fuera un juego en si mismo. En este subjuego hay un equilibrio
de Nash que es O, r. En el subjuego superior la nica amenaza creble del jugador 2 es L. Por
tanto, el jugador 1 tiene que elegir entre A y B anticipando que si elige A el jugador 2 elegir
L y que si elige B, el jugador 2 y el 1 jugarn O, r. Por tanto, el equilibrio perfecto en
subjuegos es (Br, LO). Hay que notar que las partes relevantes de las estrategias de equilibrio
son tambin de equilibrio en cada uno de los subjuegos.

84

SARRIKO-ON 6/09

2.3. Juegos repetidos


EJEMPLO 2: Dilema del prisionero

(1, 1)

NC

(3, 0)

(0, 3)

B
C

NC

C
B
A
NC
NC

(1, 1)

(3, 0)

NC

(0, 3)

(2, 2)

(2, 2)

Cuando el juego se juega una vez (C, C) es un equilibrio de Nash en estrategias dominantes y
la cooperacin o colusin entre los jugadores no se puede sostener como equilibrio. Aunque
los jugadores obtendran mayores pagos en la combinacin de estrategias (NC, NC) ambos
tendran incentivos a desviarse utilizando su estrategia dominante. En esta seccin vamos a
estudiar las posibilidades de cooperacin entre los jugadores cuando el juego se repite.

2.3.1. Horizonte temporal finito


Supongamos que el juego (el dilema del prisionero) se repite un nmero finito de veces: T
(conocido por ambos jugadores). Conocemos que si T = 1 el nico equilibrio de Nash del
juego es (C, C).
Lo primero que hay que notar es que si el juego se repite durante T periodos, una estrategia de
un jugador en el juego repetido debe indicar lo que hara este jugador en cada etapa del juego
contingente con la historia pasada.
Vamos a utilizar un argumento de induccin retroactiva para mostrar que en el nico
equilibrio perfecto en subjuegos de este juego repetido cada jugador (independientemente de

85

SARRIKO-ON 6/09

la historia pasada) elegir confesar en cada etapa del juego. Consideremos T, t = 1, 2,..,
T, iteraciones del dilema del prisionero.

Comencemos mirando al periodo T: en esta ltima etapa del juego todo lo anterior (la historia
pasada del juego) resulta irrelevante (ya que no existe futuro) y slo queda por jugar una vez
el dilema del prisionero. Por tanto, como cada jugador tiene como estrategia dominante
(cuando el juego se juega slo una vez) confesar, en el ltimo periodo cada jugador decidir
confesar. La nica razn para jugar no confesar en una etapa del juego sera para intentar
mejorar en el futuro ya que esta accin podra ser interpretada como un signo de buena
voluntad por el otro jugador consiguiendo su cooperacin. Pero en la ltima etapa del juego
ya no hay futuro y por tanto (C, C) es inevitable.

Consideremos ahora el periodo T-1. Dado que los jugadores anticipan que en el ltimo
periodo no van a cooperar, lo mejor que pueden hacer en el periodo T-1 es seguir su estrategia
dominante a corto plazo, es decir, confesar. La nica razn para jugar no confesar en esta
etapa del juego sera para intentar mejorar en el futuro, pero en el periodo T los jugadores
elegirn (C, C). El mismo argumento se aplicara a los periodos T-2, T-3,.hasta el periodo
1. Por tanto, el equilibrio perfecto en subjuegos del dilema del prisionero repetido un nmero
finito de veces T, consiste simplemente en T repeticiones del equilibrio de Nash a corto plazo.
Por tanto, si el juego se repitiera un nmero finito (y conocido) de veces, en el nico
equilibrio perfecto en subjuegos cada jugador elegira su estrategia dominante a corto plazo
en cada ronda del juego. Luego la cooperacin entre los jugadores no se puede sostener como
equilibrio cuando el horizonte temporal es finito.

86

SARRIKO-ON 6/09

2.3.2. Horizonte temporal infinito


Hay dos formas de interpretar un horizonte temporal infinito:
(i) Interpretacin literal: el juego se repite infinitos periodos. En este contexto, cuando un
jugador compara una estrategia con otra debera comparar el valor presente descontado de las
respectivas ganancias. Sea

el factor de descuento, 0 <

< 1. Si r es el tipo de inters,

1
.
1+ r

(ii) Interpretacin informacional: no se conoce la duracin del juego. En cada etapa del juego
existe una probabilidad 0 <

< 1 de que el juego contine. En este marco, cada jugador

debera comparar el pago esperado (que tambin se podra descontar) de las diferentes
estrategias.

En este contexto, una estrategia de un jugador especificar su comportamiento en cada


t 1

periodo t como una funcin de la historia pasada del juego. Represente Ht 1 = {s1 , s 2 } =1 ,
donde s i {C, NC} , la historia pasada del juego.

En primer lugar ntese que hay un equilibrio perfecto en subjuegos del juego infinitamente
repetido en el que cada jugador juega C (su estrategia dominante a corto plazo) en cada
periodo. Cada jugador tendra como estrategia confesar en cada periodo con independencia
de la historia pasada del juego.

Vamos a ver si adems del anterior equilibrio, hay algn equilibrio perfecto en subjuegos en
el que los jugadores cooperen. Consideremos la siguiente combinacin de estrategias a largo

plazo. s i {s it (H t 1 )}t =1
c

87

SARRIKO-ON 6/09

donde,
si todos los elementos de H t 1 son iguales a ( NC , NC ) o t = 1
en caso contrario

NC
sit ( H t 1 ) =
C
i =1,2.

Ntese que estas estrategias a largo plazo incorporan amenazas implcitas de castigo en
caso de violacin del acuerdo (implcito) de cooperacin. La amenaza para que sea creble
debe ser equilibrio de Nash.

Para ver si en este contexto se puede sostener como equilibrio la cooperacin, tenemos que
comprobar que los jugadores no tienen incentivos a desviarse; es decir, que la combinacin de
c

estrategias (s1 , s2 ) constituye un equilibrio de Nash del juego repetido. El valor presente
descontado de las ganancias futuras del jugador i de cooperar viene dado por:

i (s ic , s cj ) = 2 + 2 + 2 2 + .... = 2(1 + + 2 + ...) =

2
1

Supongamos que el jugador i se desva y lo hace en el primer periodo del juego. Dado que el
otro jugador si sigue su estrategia le penalizar durante el resto del juego lo mejor que puede
hacer si confiesa en el primer periodo es confesar tambin durante el resto del juego. Sus
ganancias vendran dadas por:

i (s i , s cj ) = 3 + 1 +1 2 + .... = 3 + (1 + + 2 + ...) = 3 +

1
1

La cooperacin ser equilibrio de Nash si ninguno de los jugadores tiene incentivos a


desviarse; es decir, si

i (s ic , s cj ) i (si , s cj ) . Es inmediato comprobar que si

ninguno de los jugadores tiene incentivos a romper el acuerdo de colusin.

88

1
2

SARRIKO-ON 6/09

Vamos a comprobar a continuacin como el equilibrio es perfecto en subjuegos: es decir, que


las amenazas son crebles. Consideremos un subjuego que surge despus de que una
desviacin se ha producido. Las estrategia de cada jugador exige confesar en todo periodo
futuro independientemente del comportamiento de su rival. Este par de estrategias constituye
un equilibrio de un dilema del prisionero infinitamente repetido ya que cada jugador si no se
desva obtendra un pago de (si la desviacin se ha producido en el periodo T-1)

T 1

T 1
(1 + + + ...) =
1
2

mientras que obtendra un pago de 0 cada periodo que se desviase de la estrategia


cooperativa.

El anlisis anterior sirve como ejemplo de un principio general que ocurre en situaciones de
juegos repetidos con horizonte temporal infinito. En estos juegos es posible sostener como
equilibrio comportamientos que no son de equilibrio en el corto plazo. Esto se produce
gracias a la amenaza implcita de castigo de que en caso de incumplimiento del acuerdo se
castiga durante el resto del juego. De modo que el aumento de beneficios (derivado de la
violacin del acuerdo) a corto plazo no compensa la prdida de beneficios durante el resto del
juego.

2.4. Conclusiones
Hemos visto diferentes mtodos de resolucin de juegos, aunque ninguno de ellos est exento
de problemas. El criterio de dominacin (eliminacin de estrategias dominadas) aunque til
para resolver algunos juegos no sirve para otros al no realizar ninguna propuesta de solucin.
La versin dbil de este criterio (eliminacin de estrategias dbilmente dominadas) es de

89

SARRIKO-ON 6/09

gran utilidad para seleccionar entre los equilibrios de Nash especialmente en juegos en forma
normal o estratgica. El criterio de induccin retroactiva permite realizar propuestas de
solucin en juegos en forma extensiva. Tiene la importante propiedad de que para juegos de
informacin perfecta y sin empates conduce a una nica propuesta de solucin. Pero la
posibilidad de empates, la existencia de informacin imperfecta y la racionalidad ilimitada
que puede requerir en algunos juegos son los principales problemas que presenta. Este criterio
de induccin retroactiva resulta de gran utilidad para seleccionar entre los equilibrios de Nash
(en juegos en forma extensiva). De la utilizacin conjunta de este criterio y de la nocin de
equilibrio de Nash surge el concepto de equilibrio perfecto en subjuegos.

Aunque tambin presenta problemas (ineficiencia, inexistencia y multiplicidad) el equilibrio


de Nash es el criterio de solucin ms general y ms ampliamente utilizado para resolver
juegos. Se considera que ser equilibrio de Nash es una condicin necesaria (aunque no
suficiente) para que cualquier propuesta de solucin sea una prediccin razonable del
comportamientos racional de los jugadores. Si para algn juego se propone como solucin
una combinacin de estrategias que no constituye un equilibrio de Nash, esta prediccin sobre
el comportamiento de los jugadores se vera desmentida por el propio desarrollo del juego. Al
menos un jugador tendra incentivos a cambiar su estrategia con respecto a la predicha para l.
En conclusin, aunque presenta problemas, existe cuasiunanimidad sobre que toda propuesta
de solucin debe ser como mnimo equilibrio de Nash.

90

SARRIKO-ON 6/09

Tema 3. El oligopolio

Introduccin

La T de los Juegos no Cooperativos es de gran utilidad para modelar problemas econmicos


con muchos agentes caracterizados por interdependencia estratgica, en particular para
analizar la competencia entre las empresas de una industria. La competencia perfecta y el
monopolio puro (en el sentido de no estar amenazado por la entrada) son estructuras de
mercado poco realista. Lo frecuente son industrias en las que existen pocas empresas o
existen muchas pero un nmero pequeo de ellas produce un porcentaje muy elevado de la
produccin total. Con pocas empresas, la competencia estar caracterizada por
consideraciones estratgicas: cada empresa toma sus decisiones (precio, produccin,
publicidad, gastos en I+D..) teniendo en cuenta o conjeturando el comportamiento de las
dems. La competencia en un oligopolio, la podemos ver por tanto como un juego no
cooperativo donde las empresas son los jugadores. As, adoptaremos una perspectiva de
Teora de los Juegos para analizar los diferentes modelos de oligopolio. Para cada caso nos
preguntaremos cul es el juego que estn jugando las empresas (informacin, orden de juego,
estrategias..) y cul la nocin de equilibrio. Una diferencia importante entre los juegos del
captulo anterior y los que resolveremos en este captulo es que aqullos eran juegos finitos
mientras que stos son juegos infinitos.

91

SARRIKO-ON 6/09

3.1. El modelo de Cournot


3.1.1. Duopolio
(i) Contexto.
(ii) Representacin del juego en forma normal.
(iii) Nocin de equilibrio.
(iv) Funcin de mejor respuesta. Caracterizacin del equilibrio.
(v) Ejemplo. Representacin grfica.

(i) Contexto
El modelo de duopolio de Cournot tiene cuatro caractersticas bsicas:
a) Consideramos un mercado en el que hay 2 empresas.
b) Producto homogneo. Es decir, desde el punto de vista de los consumidores los productos
producidos por las dos empresas son sustitutivos perfectos.
c) Competencia en cantidades. La variable de eleccin de cada empresa es el nivel de
produccin. Sean x1 y x2 los niveles de produccin de las empresas 1 y 2, respectivamente.
d) Eleccin simultnea. Las empresas tienen que elegir simultneamente sus niveles de
produccin. Es decir, cada empresa tendr que elegir su nivel de produccin sin conocimiento
sobre cul ser la eleccin del rival. Eleccin simultnea no significa necesariamente que las
elecciones se realicen en el mismo instante de tiempo. Un contexto equivalente sera uno en el
que una empresa elige primero su nivel de produccin y luego una segunda empresa elige su
produccin pero sin observar la decisin adoptada por la primera. En otros trminos, eleccin
secuencial junto con informacin imperfecta (el jugador que juega en segundo lugar no
observa lo que hace el que juega en primer lugar) equivaldra a eleccin simultnea.

92

SARRIKO-ON 6/09

La funcin inversa de demanda es p( x), siendo p ' ( x) < 0. Como el producto es homogneo,
el precio al que puede vender su produccin cualquiera de las empresas depender de la
produccin agregada: p( x) = p( x1 + x2 ).
El coste de produccin de la empresa i es Ci ( xi ), i=1,2.

(ii) Representacin del juego en forma normal


1) i = 1, 2. (Jugadores)
2) xi 0. Como estrategia para el jugador i nos valdra cualquier cantidad no negativa
(cualquier nmero real no negativo). De manera equivalente podemos representar las
estrategias del jugador i como xi [0, ), i = 1, 2.
3) La ganancia que obtiene cada empresa dada la combinacin de estrategias ( x1 , x2 ) es:
1 ( x1 , x2 ) = p ( x1 + x2 ) x1 C1 ( x1 )

i ( xi , x j ) = p ( xi + x j ) xi Ci ( xi ), i, j = 1, 2, j i.
2 ( x1 , x2 ) = p ( x1 + x2 ) x2 C2 ( x2 )

(iii) Nocin de equilibrio. Equilibrio Cournot-Nash


Es muy sencillo adaptar la definicin de equilibrio de Nash que consideramos en el captulo
anterior al nuevo contexto.

* *
*
s* ( s1* ,.., sn* ) es un equilibrio de Nash si: i (si , si ) i (si, si ) si Si ,i,i = 1,...,n .

En el juego de duopolio de Cournot diremos:

93

SARRIKO-ON 6/09

( x1* , x2* ) es un equilibrio de Cournot-Nash si i ( xi* , x*j ) i ( xi , x*j ) xi 0, i, j = 1, 2, j i .

Resultar ms til la segunda definicin basada en las mejores respuestas.


s* ( s1* ,.., sn* )
*

{'

es un equilibrio de Nash si:


'

si* MRi ( s* i ) i, i = 1,.., n


'

donde

MRi (s i ) = si Si : i (si ,s i ) i (si ,si ), si Si ,si si . .

En el juego de duopolio de Cournot diremos:


( x1* , x2* ) es un equilibrio de Cournot-Nash si xi* = f i ( x*j ), i, j = 1, 2, j i .

Donde fi ( x j ) es la funcin de mejor respuesta de la empresa i ante las producciones de la


empresa j.

(iv) Funcin de mejor respuesta. Caracterizacin del equilibrio


El procedimiento que seguiremos para obtener el equilibrio de Nash ser similar al que
utilizbamos en el captulo anterior. En primer lugar, calcularemos la mejor respuesta de cada
jugador ante las posibles estrategias del rival y posteriormente buscaremos una combinacin
de estrategias que sean mutuamente una la mejor respuesta de la otra.

Dada una estrategia de la empresa j buscaremos aquella estrategia que le d mayores


beneficios a la empresa i. Es decir, dada la estrategia x j 0 la mejor respuesta de la empresa
i consistir en elegir una estrategia xi tal que:

94

SARRIKO-ON 6/09

max i ( xi , x j ) p( xi + x j ) xi Ci ( xi )
xi 0

i
= p ( xi + x j ) + xi p ' ( xi + x j ) Ci' ( xi ) = 0 (1) f i ( x j )
xi
2 i
= 2 p ' ( xi + x j ) + xi p '' ( xi + x j ) Ci'' ( xi ) < 0
xi2
Teniendo en cuenta la restriccin de no negatividad, xi 0, o en trminos de teora de juegos
que la mejor respuesta debe pertenecer al espacio de estrategias del jugador, la funcin de
mejor respuesta ser: fi ( x j ) = max { f i ( x j ), 0} .
El equilibrio de Cournot-Nash es una combinacin de estrategias ( x1* , x2* ) tal que la estrategia
de cada empresa es su mejor respuesta ante la estrategia del rival. Es decir,
x1* = f1 ( x2* ) = max { f1 ( x2* ), 0}

*
*
*
xi = fi ( x j ) = max { f i ( x j ), 0} , i, j = 1, 2, j i.

x2* = f 2 ( x1* ) = max { f 2 ( x1* ), 0}

Vamos a olvidarnos ahora de la restriccin de no negatividad y vamos a suponer que la


funcin de mejor respuesta est plenamente caracterizada por la condicin (1) (solucin
interior). Por definicin la funcin de mejor respuesta debe cumplir la condicin de primer
orden:

i ( f i ( x j ), x j )
xi

= 0 la mejor respuesta de la empresa i ante x j 0 es fi ( x j ). En el

equilibrio de Cournot-Nash se cumple

i ( xi* , x*j )
xi

= 0 ya que xi* = fi ( x*j ), i = 1, 2. Tenemos

una forma sencilla de comprobar si una combinacin de estrategias es un equilibrio de Nash:


calcular el beneficio marginal de cada empresa correspondiente a esa combinacin de
estrategias y si alguno es distinto de cero no se cumplira la condicin de equilibrio.

95

SARRIKO-ON 6/09

i ( xi , x j )
xi
i ( xi , x j )
xi

> 0 f i ( x j ) > xi ( xi , x j ) no es equilibrio de Cournot-Nash.


< 0 f i ( x j ) < xi ( xi , x j ) no es equilibrio de Cournot-Nash.

(v) Ejemplo. Representacin grfica


Vamos a considerar el caso de demanda lineal y coste marginal constante: p ( x) = a bx y
Ci ( xi ) = ci xi , i = 1, 2. Supondremos para simplificar que el coste marginal es igual para
ambas: ci = c > 0, i = 1, 2. ( a > c para que el ejemplo tenga sentido).
Comenzamos obteniendo la funcin de mejor respuesta para la empresa i, i = 1, 2.
max i ( xi , x j ) p( xi + x j ) xi Ci ( xi ) [a b( xi + x j )]xi cxi [a c b( xi + x j )]xi
xi 0

a c bx j
i
= p( xi + x j ) + xi p ' ( xi + x j ) Ci' ( xi ) = a 2bxi bx j c = 0 f i ( x j )
2b
xi
2 i
= 2b < 0
xi2
Luego la funcin de mejor respuesta quedara:
a c bx j
fi ( x j ) = max { fi ( x j ), 0} = max
, 0 .
2b

En el equilibrio de Cournot-Nash se cumple:

a c bx2*
, 0 >
x1* = f1 ( x2* ) = max
N0
2b

ya que a >c
a c bx1*
, 0 >
x2* = f 2 ( x1* ) = max
N0
2b

ya que a >c
Resolviendo el sistema:
x1* = f1 ( x2* ) = f1 ( f 2 ( x1* ))


x2*

96

SARRIKO-ON 6/09

a c bx1* a c + bx*
1
a

2b
a c bx2*
a c + bx1*
ac

*
2
x1 =
=
=
=
x1* =
.
2b
2b
2b
4b
3b
ac
a c b

a c bx
3b = 2(a c) = a c .
x2* =
=
2b
2b
6b
3b
*
1

La produccin total en el equilibrio de Cournot-Nash es: x* = x1* + x2* =


equilibrio p* = p( x1* + x2* ) = a b

2(a c)
y el precio de
3b

2(a c) a + 2c
=
. Por ltimo los beneficios son:
3b
3

a c a c (a c)2
= 1 ( x , x ) = [ p ( x + x ) c ] x =
=
3 3b
9b
*
1

*
1

*
2

*
1

*
2

*
1

*2 = 2 ( x1* , x2* ) = [ p ( x1* + x2* ) c]x2* =

a c a c (a c)2
=
.
3 3b
9b

Representacin grfica

x2

45

xe
f1 ( x2 )

xm

Equilibrio de Cournot-Nash

x2*
f 2 ( x1 )

x1*

xm

xe
97

x1

SARRIKO-ON 6/09

3.1.2. Oligopolio

(i) Representacin del juego en forma normal.


(ii) Nocin de equilibrio. Funcin de mejor respuesta. Equilibrio de Cournot-Nash..
(iii) ndice de Lerner.
(iv) Casos especiales. Coste marginal constante.

(i) Representacin del juego en forma normal


1) i = 1, 2,..., n. (Jugadores)
2) xi 0. De manera equivalente, xi [0, ), i = 1, 2,.., n.
3) La ganancia que obtiene cada empresa dada la combinacin de estrategias ( xi , x i ) es:
i ( xi , x i ) = p( xi + xi ) xi Ci ( xi ), i = 1, 2,..., n.


La forma de representar el juego en forma normal ha variado ligeramente. Dada la


combinacin de estrategias ( x1 , x2 ,..., xn ) lo relevante para la empresa i, i = 1, 2,..., n, es la
cantidad total producida por el resto de las empresas, xi = x j . Por tanto, ( xi , x i ) no es
j i

realmente una combinacin de estrategias y i ( xi , x i ) sera el beneficio asociado a toda


combinacin de estrategias en la que la empresa i est produciendo xi y el resto de empresas
en agregado producen x i (siendo irrelevante para la empresa i cmo se distribuye la
produccin x i entre las n -1 empresas).

(iii) Nocin de equilibrio. Funciones de mejor respuesta. Equilibrio Cournot-Nash


En el juego de oligopolio de Cournot diremos que

98

SARRIKO-ON 6/09

( x1* , x2* ,.., xn* ) ( xi* , x* i ) es un equilibrio de Cournot-Nash si:


i ( xi* , x* i ) i ( xi , x* i ) xi 0, i, i = 1, 2,..., n. .

En trminos de mejores respuestas la definicin es:


( x1* , x2* ,.., xn* ) ( xi* , x* i ) es un equilibrio de Cournot-Nash si xi* = f i ( x* i ), i, i = 1, 2,.., n. .

Donde fi ( xi ) es la funcin de mejor respuesta de la empresa i ante todas aquellas


combinaciones de estrategias cuya produccin total sea x i .

Vamos a obtener la mejor respuesta de la empresa i ante todas aquellas combinaciones de


estrategias cuya produccin total sea x i . La mejor respuesta de la empresa i consistir en
elegir una estrategia xi tal que:
max i ( xi , x i ) p ( xi + x i ) xi Ci ( xi )
xi 0

i
= p ( xi + x i ) + xi p ' ( xi + x i ) Ci' ( xi ) = 0 (1) f i ( x i )
xi
2 i
= 2 p ' ( xi + xi ) + xi p '' ( xi + x i ) Ci'' ( xi ) < 0
xi2
Teniendo en cuenta la restriccin de no negatividad, xi 0, o en trminos de teora de juegos
que la mejor respuesta debe pertenecer al espacio de estrategias del jugador, la funcin de
mejor respuesta ser: fi ( x i ) = max { fi ( xi ), 0} .
El equilibrio de Cournot-Nash es una combinacin de estrategias ( x1* , x2* ,.., xn* ) ( xi* , x* i ) tal
que xi* = f i ( x* i ), i, i = 1, 2,.., n. .

99

SARRIKO-ON 6/09

Vamos a olvidarnos ahora de la restriccin de no negatividad y vamos a suponer que la


funcin de mejor respuesta est plenamente caracterizada por la condicin (1) (solucin
interior). Por definicin la funcin de mejor respuesta debe cumplir la condicin de primer
orden:

i ( fi ( x i ), x i )
= 0 la mejor respuesta de la empresa i ante x i 0 es fi ( x i ). En
xi

i ( xi* , x* i )
el equilibrio de Cournot-Nash se cumple
= 0 ya que xi* = f i ( x* i ), i = 1, 2,..., n.
xi

De nuevo podramos comprobar si una combinacin de estrategias es un equilibrio de Nash


calculando el beneficio marginal de cada empresa correspondiente a esa combinacin de
estrategias y si alguno es distinto de cero no se cumplira la condicin de equilibrio.
i ( xi , x i )
> 0 f i ( x i ) > xi ( xi , xi ) no es equilibrio de Cournot-Nash.
xi
i ( xi , x i )
< 0 fi ( x i ) < xi ( xi , x i ) no es equilibrio de Cournot-Nash.
xi

(iii) ndice de Lerner


Suponiendo que la solucin es interior vamos a transformar la condicin (1) hasta obtener el
ndice de Lerner de poder de mercado.
p ( xi + x i ) + xi p ' ( xi + x i ) Ci' ( xi ) = 0


p ' ( x)
p ( x)[1 + xi
] Ci' ( xi ) = 0
p ( x)

xi xp ' ( x)
] Ci' ( xi ) = 0
p( x)[1 +
x p ( x)


( x)

100

SARRIKO-ON 6/09

Definiendo la cuota de mercado de la empresa i como si =


p ( x)[1

xi
obtenemos:
x

si
] Ci' ( xi ) = 0
( x)

Luego el ndice de Lerner de poder de mercado de la empresa i queda


p( x) Ci' ( xi )
s
= i
p ( x)
( x)
Luego el modelo de Cournot se encuentra entre el caso de monopolio ( si = 1 ) y la
competencia perfecta ( lim

si 0

p C'
= 0 ).
p

(iv) Casos especiales. Coste marginal constante


a) Coste marginal constante: ci > 0, i = 1,.., n.
En equilibrio se tiene que cumplir la condicin de primer orden de cada una de las empresas
(solucin interior):
p ( xi* + x* i ) + xi* p ' ( xi* + x* i ) ci = 0 i = 1, 2.., n.


x*

Sumando las n condiciones de primer orden:


n

np ( x* ) + xi* p ' ( x* ) ci = 0
i =1
i =1
N
x*

Es decir
n

np( x* ) + x* p ' ( x* ) = ci
i =1

101

SARRIKO-ON 6/09

Luego la produccin agregada de la industria en el equilibrio de Cournot-Nash depende


exclusivamente de la suma de los costes marginales (en una solucin interior con las n
empresas produciendo cantidades positivas), no de su distribucin entre las empresas.

b) Coste marginal constante comn: ci = c > 0, i = 1,.., n.


El ndice de Lerner es:
s
p( x) c
= i
p( x)
( x)

Si tenemos en cuenta que si el producto es homogneo y el coste marginal es el mismo el


equilibrio de Cournot-Nash debe ser simtrico entonces:
xi*
x* 1
si = * = * = , i = 1,.., n.
x
nx
n
Si la elasticidad de la demanda fuera constante entonces:
p( x) c
1
=
p( x)
n

Por tanto, segn aumenta el nmero de empresas el margen precio-coste marginal relativo (el
ndice de Lerner) disminuye y en el lmite cuando n entonces p c.

3.1.3. Anlisis de bienestar

Vamos a realizar el anlisis de bienestar para el caso sencillo en que el coste marginal es
constante y comn para todas las empresas.
p ( xi* + x* i ) + xi* p ' ( xi* + x* i ) c = 0 i = 1, 2.., n.


x*

Sumando las n condiciones de primer orden:

102

SARRIKO-ON 6/09

np( x* ) + x* p ' ( x* ) nc = 0
El procedimiento que seguiremos para comparar el nivel de produccin del equilibrio de
Cournot-Nash con el nivel de produccin eficiente es similar al que seguimos en el captulo
de monopolio.
(Repasar la obtencin de la funcin de bienestar social)
max W ( x ) max u ( x ) C ( x)
x0

x0

W ' (0) = u ' (0) C ' (0) > 0 p (0) > C ' (0)
W ' ( x) = u ' ( x) C ' ( x) = 0 W ' ( x e ) = 0 Condicin de primer orden.
W '' ( x) = u '' ( x) C '' ( x) < 0 Funcin de bienestar estrictamente cncava.
W ' ( x e ) = 0
' *
W (x ) ?
W '' ( x) < 0

''

u (x )
P
x* ' *
'
*
'
*
'
*
W ( x ) = uN
p (x ) > 0
(x ) C (x ) = N
n <0
*
p( x )

Por definicin de
produccin de Cournot.
W ' ( x e ) = 0
' *

'
'
*
*
e
e
W ( x ) > 0 W ( x ) < W ( x ) x > x
W '' ( x) < 0

dW ' ( x)
W ( x) < 0
< 0 x W ' ( x)
dx
''

W ' ( xe ) = 0
W ' ( x* ) > 0

x*

xe

103

SARRIKO-ON 6/09

3.2. El modelo de Bertrand


3.2.1. Producto homogneo
(i) Contexto.
(ii) Demanda residual.
(iii) Representacin del juego en forma normal. Nocin de equilibrio.
(iv) Paradoja de Bertrand. Caracterizacin del equilibrio y unicidad.

(i) Contexto
El modelo de Bertrand se caracteriza por los siguientes elementos:
1) Consideramos una industria en la que hay 2 empresas.
2) Las empresas venden un producto homogneo.
3) Competencia en precios.
4) Eleccin simultnea. Cada empresa tiene que elegir el precio para su producto sin conocer
cul es la eleccin de la empresa rival. De nuevo eleccin simultnea no significa que la
eleccin se realice en el mismo instante de tiempo; lo relevante es que aunque una empresa
juegue primero la que juegue despus no observe el comportamiento de la primera.
5) Coste marginal constante y comn para las dos empresas: c1 = c2 = c > 0.

(ii) Demanda residual


Las empresas venden un producto homogneo y compiten en precios. Luego desde el punto
de vista de los consumidores lo nico relevante es la relacin que exista entre los precios de
las dos empresas; as los consumidores comprarn el bien a la empresa que venda ms barato.
Es decir, si una empresa establece un precio inferior al de la otra, la primera se quedara con

104

SARRIKO-ON 6/09

todo el mercado y la segunda no vendera nada. Si ambas establecen el mismo precio


entonces los consumidores estaran indiferentes entre comprar a una empresa o comprar a la
otra. Para simplificar haremos el supuesto de que en caso de igualdad de precios cada
empresa vendera a la mitad del mercado. La demanda residual de la empresa i,
i, j = 1, 2, j i, sera:
pi < p j
D( pi )

1
Di ( pi , p j ) = D( pi ) pi = p j
2
pi > p j
0

pi

Di ( pi , p j )
pj
D( p)

1
D( pi )
2

xi

(iii) Representacin del juego en forma normal. Nocin de equilibrio


El juego en forma normal es:
1) i = 1, 2. (Jugadores)
2) pi 0. Como estrategia para el jugador i nos valdra cualquier precio no negativo
(cualquier nmero real no negativo). De manera equivalente podemos representar las
estrategias del jugador i como pi [0, ), i = 1, 2.
3) La ganancia que obtiene cada empresa dada la combinacin de estrategias ( p1 , p2 ) es:
1 ( p1 , p2 ) = ( p1 c) D1 ( p1 , p2 )

i ( pi , p j ) = ( pi c) Di ( pi , p j ), i, j = 1, 2, j i
2 ( p1 , p2 ) = ( p2 c) D2 ( p1 , p2 )

105

SARRIKO-ON 6/09

Donde la demanda residual de la empresa i, i, j = 1, 2, j i, es:


pi < p j
D( pi )

1
Di ( pi , p j ) = D( pi ) pi = p j .
2
pi > p j
0
En el juego de duopolio de Bertrand diremos que
( p1* , p2* ) es un equilibrio de Bertrand-Nash si:
i ( pi* , p*j ) i ( pi , p*j ) pi 0, i, j = 1, 2, j i .

Para hacer ms sencillo el anlisis, utilizaremos exclusivamente esta definicin ya que como
la demanda residual de cada empresa es una funcin discontinua del precio no podemos
utilizar las tcnicas habituales de optimizacin (de hecho, en vez de obtener funciones de
mejor respuesta obtendramos correspondencias de mejor respuesta y el anlisis sera un poco
ms complejo).

(iv) Paradoja de Bertrand. Caracterizacin del equilibrio y unicidad


Vamos a demostrar que el nico equilibrio de Nash del juego de Bertrand es:
p1* = p2* = c
Este resultado se conoce como la paradoja de Bertrand:
Bastan dos empresas compitiendo en precios para que se alcance un resultado competitivo.
Demostracin

Demostraremos que la combinacin de estrategias p1* = p2* = c :


a) Es equilibrio de Nash.
b) Es el nico equilibrio de Nash.

106

SARRIKO-ON 6/09

a) El beneficio de cada empresa en la combinacin de estrategias

( c, c )

es:

1
i (c, c) = (c c) D(c) = 0, i = 1, 2. Si la empresa i se desva unilateralmente fijando un
2
precio pi > c su beneficio sera nulo ya que no vendera a nadie. Si baja el precio pi < c
vendera a todo el mercado pero obtendra beneficios negativos. Por tanto,
i (c, c) i ( pi , c) pi 0, i, j = 1, 2, j i

b) Vamos a demostrar que ninguna otra combinacin de estrategias puede ser equilibrio de
Nash. En el grfico adjunto aparecen los diferentes tipos de combinaciones de estrategias que
se pueden dar. Seguiremos el siguiente procedimiento para comprobar si una combinacin de
estrategias es equilibrio o no: calculamos el beneficio que obtiene cada jugador en esa
combinacin de estrategias y nos preguntamos si alguno de los jugadores tiene incentivos a
desviarse de manera unilateral. Para descartar una combinacin de estrategias como equilibrio
de Nash basta con comprobar que al menos un jugador puede mejorar desvindose
unilateralmente.

p2 = p1

p2

p2 > p1

pm
p2 < p1
c

pm

107

p1

SARRIKO-ON 6/09

1) Precios iguales: pi = p j

a) pi = p j > c EN? NO. En una combinacin de estrategias como sta la ganancia de cada
1
empresa sera: i ( pi , p j ) = ( pi c) Di ( pi , p j ) = ( pi c) D( pi ). Cualquier empresa tendra
2
incentivos a desviarse unilateralmente. Por ejemplo, podemos elegir pi' = pi (donde es
una cantidad arbitraria positiva y lo suficientemente pequea):
1
( pi' c) D( pi' ) = ( pi' c) Di ( pi' , p j ) = i ( pi' , p j ) > i ( pi , p j ) = ( pi c) Di ( pi , p j ) = ( pi c) D( pi ).
2
De hecho existiran mltiples (infinitas) desviaciones tales que la empresa i mejora con una
desviacin unilateral.

b) pi = p j < c EN? NO. En una combinacin de estrategias como sta la ganancia de cada
empresa sera:

1
i ( pi , p j ) = ( pi c) Di ( pi , p j ) = ( pi c) D( pi ) < 0.


Cualquier empresa

<0

tendra incentivos a desviarse unilateralmente. Por ejemplo, cualquier pi' > pi :


1
0 = ( pi' c) Di ( pi' , p j ) = i ( pi' , p j ) > i ( pi , p j ) = ( pi c) Di ( pi , p j ) = ( pi c) D( pi ).


2
=0

2) Precios diferentes: pi p j

c) pi > p j > c EN? NO. En una combinacin de estrategias como sta la ganancia de la
empresa i sera nula i ( pi , p j ) = ( pi c) Di ( pi , p j ) = 0 y la de la empresa j sera

108

SARRIKO-ON 6/09

j ( pi , p j ) = ( p j c) D j ( pi , p j ) = ( p j c) D( p j ) > 0. Para la empresa i cualquier desviacin


unilateral pi' tal que c < pi' p j eleva beneficios:
( pi' c) D( pi' ) = ( pi' c) Di ( pi' , p j ) = i ( pi' , p j ) > i ( pi , p j ) = ( pi c) Di ( pi , p j ) = ( pi c)0 = 0.
N
si pi' < p j

Aunque hemos demostrado ya que la combinacin de estrategias ( pi , p j ), con pi > p j > c no


puede ser equilibrio podemos comprobar que en muchos casos la empresa j tambin tendra
incentivos a desviarse unilateralmente. (Por ejemplo, si p m pi > p j > c cualquier desviacin
unilateral pi > p 'j > p j eleva los beneficios de la empresa j. Para los casos pi > p j > p m > c
y pi > p m > p j > c es tambin inmediato encontrar desviaciones que elevan el beneficio de la
empresa j. La nica situacin en la que la empresa j no tendra incentivos a desviarse sera
aqulla en la que pi > p m = p j > c ).

d) Otros casos:
- pi > c p j EN? NO. La empresa i no tendra incentivos a desviarse unilateralmente
mientras que para la empresa j cuando pi > c > p j cualquier p 'j > p j eleva beneficios y si
pi > c = p j elevando convenientemente el precio la empresa j eleva beneficios. Por ejemplo,
si p m pi > c = p j

cualquier

pi > p 'j > c eleva los beneficios de la empresa j. Si

pi > p m > c = p j cualquier precio p m > p 'j > c (y otros muchos) eleva los beneficios de la

empresa j.
- c pi > p j EN? NO. La empresa i no tendra incentivos a desviarse unilateralmente
mientras que para la empresa j cualquier p 'j > p j eleva beneficios

109

SARRIKO-ON 6/09

3.2.2. Producto heterogneo (productos diferenciados)


(i) Producto heterogneo. Demanda residual.
(ii) Representacin del juego en forma normal.
(iii) Nocin de equilibrio. Funcin de mejor respuesta. Equilibrio de Bertrand-Nash.

(i) Producto heterogneo. Demanda residual


Vamos a mantener el resto de los supuestos del modelo de Bertrand (dos empresas, eleccin
simultnea, coste marginal constante e idntico, competencia en precios) pero ahora
supondremos que las dos empresas venden productos heterogneos. Es decir, las empresas
venden productos que son sustitutivos cercanos pero imperfectos.
La demanda del producto producido por la empresa i, la demanda residual, viene dada por
Di ( pi , p j ). Supondremos que

Di
Di
Di Di
< 0,
; es decir, la demanda del
>
>0 y
pi
pi
p j
p j

producto i es una funcin decreciente del precio del producto i, los productos son sustitutivos
y tiene ms efecto sobre la cantidad demandada del producto i el cambio en el precio de ese
producto que el cambio en el precio de un producto sustitutivo.

(ii) Representacin del juego en forma normal. Nocin de equilibrio


El juego en forma normal es:
1) i = 1, 2. (Jugadores)
2) pi 0. Como estrategia para el jugador i nos valdra cualquier precio no negativo
(cualquier nmero real no negativo). De manera equivalente podemos representar las
estrategias del jugador i como pi [0, ), i = 1, 2.

110

SARRIKO-ON 6/09

3) La ganancia que obtiene cada empresa dada la combinacin de estrategias ( p1 , p2 ) es:

1 ( p1 , p2 ) = ( p1 c) D1 ( p1 , p2 )

i ( pi , p j ) = ( pi c) Di ( pi , p j ), i, j = 1, 2, j i
2 ( p1 , p2 ) = ( p2 c) D2 ( p1 , p2 )

Ahora la demanda dirigida a cada producto es una funcin continua de su precio.

(iii) Nocin de equilibrio. Funcin de mejor respuesta. Equilibrio de Bertrand-Nash


En trminos de mejores respuestas la definicin de equilibrio de Bertrand-Nash es:
( p1* , p2* ) es un equilibrio de Bertrand-Nash si pi* = gi ( p*j ), i, j = 1, 2, j i. .

Donde gi ( p j ) es la funcin de mejor respuesta de la empresa i ante el precio p j de la


empresa rival.

La mejor respuesta de la empresa i consistir en elegir una estrategia pi tal que:

max i ( pi , p j ) ( pi c) Di ( pi , p j )
pi 0

i
D
= Di ( pi , p j ) + ( pi c) i = 0 (1) gi ( p j )
pi
pi
2 i
Di
2 Di
=
+
p

c
< 0.
2
(
)
i
pi2
pi
pi2

111

SARRIKO-ON 6/09

3.3. Liderazgo en la eleccin de la cantidad. Modelo de Stackelberg


(i) Contexto.
(ii) Juego en dos etapas. Informacin perfecta. Nocin de estrategia.
(iii) Induccin retroactiva. Equilibrio perfecto en subjuegos.
(iv) Ejemplo: demanda lineal y coste marginal constante.
(v) Otros equilibrios de Nash no perfectos en subjuegos.

(i) Contexto
El modelo de duopolio de Stackelberg tiene cuatro caractersticas bsicas:
a) Consideramos un mercado en el que hay 2 empresas.
b) Producto homogneo. Es decir, desde el punto de vista de los consumidores los productos
producidos por las dos empresas son sustitutivos perfectos.
c) Competencia en cantidades. La variable de eleccin de cada empresa es el nivel de
produccin. Sean x1 y x2 los niveles de produccin de las empresas 1 y 2, respectivamente.
d) Eleccin secuencial. Una de las empresas (la lder), la empresa 1, elige primero su nivel de
produccin. A continuacin la otra empresa (la seguidora), la empresa 2, elige su nivel de
produccin despus de observar la produccin elegida por la empresa 1. Desde el punto de
vista de teora de juegos se tratara de un juego de informacin perfecta.

(ii) Juego en dos etapas. Informacin perfecta. Estrategia


Las empresas van a jugar un juego en dos etapas:
Etapa 1: la empresa 1 elige su nivel de produccin x1 0.

112

SARRIKO-ON 6/09

Etapa 2: la empresa 2 elige su nivel de produccin x2 0 despus de observar cul ha sido la


produccin elegida por la empresa 1.
Dado que ambos jugadores deben percibir el juego de la misma forma no slo el jugador 2
observa la eleccin del jugador 1 sino que el jugador 1 cuando toma su decisin sabe que el
jugador 2 observa su eleccin. Es decir, la informacin es perfecta y ambos jugadores tienen
la misma percepcin sobre cmo es el juego.
(Nota: un juego en dos etapas, es decir secuencial, pero donde el que juega en segundo lugar
no observa la produccin elegida por el que juega en primer lugar, es decir de informacin
imperfecta, sera a todos los efectos equivalente a un juego simultneo, como lo es el juego de
Cournot.).
Los espacios de estrategias de los jugadores seran los siguientes:
- x1 0 : como estrategia para el jugador 1 nos valdra cualquier cantidad no negativa
(cualquier nmero real no negativo; de forma equivalente x1 [0, ) ).

x2

x1
113

SARRIKO-ON 6/09

- La descripcin de las estrategias del jugador 2 es ms compleja. Hay que recordar que una
estrategia es una descripcin completa de lo que hara un jugador si es llamado a jugar en
cada uno de sus nodos de decisin, con independencia de que sea alcanzable dado el
comportamiento del otro o de los otros jugadores. En el juego que estamos considerando cada
posible produccin de la empresa 1 genera un nodo de decisin diferente para la empresa 2.
Por tanto, una estrategia de la empresa 2 ser una funcin x2 ( x1 ) que nos diga cunto va a
producir la empresa 2 ante cada posible produccin de la empresa 1.

(iii) Induccin retroactiva. Equilibrio perfecto en subjuegos


Aunque el juego parece muy complejo sabemos que en los juegos informacin perfecta y si
empates la induccin retroactiva propone una nica combinacin de estrategias como
solucin, que coincidir con el equilibrio perfecto en subjuegos. El procedimiento ser similar
al que utilizamos con los juegos finitos del captulo anterior.
Comenzaremos situndonos en los ltimos subjuegos, es decir en la etapa 2.

Etapa 2

Vamos a eliminar en cada subjuego las amenazas no crebles o acciones dominadas. Dada una
produccin de la empresa 1 (un subjuego) x1 la nica amenaza creble consistir en elegir por
parte de la empresa 2 el nivel de produccin que maximice beneficios:
max 2 ( x1 , x2 ) p ( x1 + x2 ) x2 C2 ( x2 )
x2 0

2
= p( x1 + x2 ) + x2 p ' ( x1 + x2 ) C2' ( x2 ) = 0 (1) f 2 ( x1 )
x2
2 2
= 2 p ' ( x1 + x2 ) + x2 p '' ( x1 + x2 ) C2'' ( x2 ) < 0
2
x2

114

SARRIKO-ON 6/09

Teniendo en cuenta la restriccin de no negatividad, x2 0, obtenemos:

f 2 ( x1 ) = max { f 2 ( x1 ), 0} Estrategia de la empresa 2 en el equilibrio perfecto en subjuegos.

En los juegos finitos, el procedimiento continuaba eliminando todas las amenazas increbles y
computando el juego reducido. En el juego que nos ocupa eliminar todas las amenazas
increbles equivale a eliminar todas las estrategias del jugador 1 diferentes a
f 2 ( x1 ) = max { f 2 ( x1 ), 0} .

Etapa 1

El jugador 1 anticipa que la empresa 2 se comportar en cada subjuego de acuerdo con la


estrategia f 2 ( x1 ) = max { f 2 ( x1 ), 0} . La funcin de beneficios en forma reducida para la

empresa 1 es: 1 ( x1 , f 2 ( x1 )) p( x1 + f 2 ( x1 )) x1 C1 ( x1 ). Luego el problema de la empresa 1


ser:
max 1 ( x1 , f 2 ( x1 )) p ( x1 + f 2 ( x1 )) x1 C1 ( x1 ).


x1 0
x

d 1
= p ( x1 + x2 ) + x1[1 + f 2' ( x1 )] p ' ( x1 + x2 ) C1' ( x1 ) = 0 (2) x1L
dx1
d 2 1
<0
dx12
Por tanto, el equilibrio perfecto en subjuegos es la combinacin de estrategias
( x1L , f 2 ( x1 )).

115

SARRIKO-ON 6/09

(iv) Ejemplo: demanda lineal y coste marginal constante


Etapa 2

Vamos a eliminar en cada subjuego las amenazas no crebles o acciones dominadas. Dada una
produccin de la empresa 1 (un subjuego) x1 la nica amenaza creble consistir en elegir por
parte de la empresa 2 el nivel de produccin que maximice beneficios:
max 2 ( x1 , x2 ) p( x1 + x2 ) x2 C2 ( x2 ) [a b( x1 + x2 )]x2 cx2
x2 0

2
a c bx1
= p( x1 + x2 ) + x2 p ' ( x1 + x2 ) C2' ( x2 ) = 0 (1) f 2 ( x1 ) =
x2
2b
2 2
= 2 p ' ( x1 + x2 ) + x2 p '' ( x1 + x2 ) C2'' ( x2 ) = 2b < 0
2
x2
Teniendo en cuenta la restriccin de no negatividad, x2 0, obtenemos:
a c bx1
f 2 ( x1 ) = max { f 2 ( x1 ), 0} = max
, 0 Estrategia de la empresa 2 en el EPS..
2b

Etapa 1

El jugador 1 anticipa que la empresa 2 se comportar en cada subjuego de acuerdo con la


a c bx1
, 0 . La funcin de beneficios en forma
estrategia f 2 ( x1 ) = max { f 2 ( x1 ), 0} = max
2b

reducida para la empresa 1 es: 1 ( x1 , f 2 ( x1 )) p( x1 + f 2 ( x1 )) x1 C1 ( x1 ). Luego el problema de


la empresa 1 ser:
a c bx1
a c bx1
)]x1 [
]x1
x1 0
2b
2
d 1
ac
= p ( x1 + x2 ) + x1[1 + f 2' ( x1 )] p ' ( x1 + x2 ) C1' ( x1 ) = a c 2bx1 = 0 (2) x1L =
dx1
2b

max 1 ( x1 , f 2 ( x1 )) [a c b( x1 + f 2 ( x1 ))]x1 [a c b( x1 +

d 2 1
<0
dx12

116

SARRIKO-ON 6/09

Por tanto, el equilibrio perfecto en subjuegos es la combinacin de estrategias


( x1L , f 2 ( x1 )).

x2

45

xe

xm

EPS: ( x1L , f 2 ( x1 ))

x2*
x2s

f 2 ( x1 )

x1*

x1L
N
x

xe

x1

Para calcular los beneficios que obtiene cada empresa tenemos que jugar el juego:
ac
a c b

a c bx
2b a c

s
L
x2 = f 2 ( x1 ) =
=
=
2b
2b
4b
L
1

x s = x1L + x2s =

a c a c 3(a c)
+
=
2b
4b
4b

p s = p( x s ) = a bx s = a b

3(a c) a + 3c
ac
=
; ps c =
4
4b
4

(a c) (a c) (a c)2
(a c) (a c) (a c)2
s
s
s
= ( p c) x =
=
=; 2 = ( p c) x2 =
=
.
4
2b
8b
4
4b
16b
L
1

L
1

117

SARRIKO-ON 6/09

(v) Otros equilibrios de Nash no perfectos en subjuegos

x2

45

xe

x2 ( x1 ) = { x2* x1}

xm

EN: ( x1* , x2 ( x1 )) NO EPS

x2*
x2s

f 2 ( x1 )

x1* x1L
N

xe

EPS: ( x1L , f 2 ( x1 ))

x1

xm

2.4. Colusin y estabilidad de los acuerdos


2.4.1. Colusin a corto plazo
(i) Modelo de Cournot. El acuerdo de colusin no es equilibrio a corto plazo.
(ii) Modelo de Bertrand. El acuerdo de colusin no es equilibrio a corto plazo.

(i) Modelo de Cournot. El acuerdo de colusin no es equilibrio a corto plazo


Si las empresas fueran a coludir estaran interesadas en maximizar los beneficios agregados.

max 1 ( x1 , x2 ) + 2 ( x1 , x2 ) p ( x1 + x2 ) x1 C1 ( x1 ) + p ( x1 + x2 ) x2 C2 ( x2 )
x1 , x2

118

SARRIKO-ON 6/09

= p( x1m + x2m ) + ( x1m + x2m ) p ' ( x1m + x2m ) C1' ( x1m ) = 0 (1)
x1

'
'
IM I = C1 = C2

= p ( x1m + x2m ) + ( x1m + x2m ) p ' ( x1m + x2m ) C2' ( x2m ) = 0 (2)

x2

Cuando los costes marginales son iguales y constantes las condiciones (1) y (2) son idnticas.
El sistema de dos ecuaciones tendra infinitas soluciones: cualquier par de producciones tal
que x1 + x2 = x m maximizara el beneficio de la industria. En estos casos siempre nos
referiremos al acuerdo de colusin simtrico en el que cada empresa produce la mitad de la
produccin de monopolio: xim =

xm
, i = 1, 2.
2

Vamos a comprobar cmo el acuerdo de colusin no se puede mantener como equilibrio


cuando el juego se juega slo una vez. Es decir, demostraremos que la combinacin de
estrategias ( x1m , x2m ) no es un equilibrio de Nash del juego de Cournot.

Dada la estrategia x j 0 la mejor respuesta de la empresa i consiste en elegir una estrategia


xi tal que:
max i ( xi , x j ) p( xi + x j ) xi Ci ( xi )
xi 0

i
= p ( xi + x j ) + xi p ' ( xi + x j ) Ci' ( xi ) = 0 (1) f i ( x j )
xi
2 i
= 2 p ' ( xi + x j ) + xi p '' ( xi + x j ) Ci'' ( xi ) < 0
xi2

119

SARRIKO-ON 6/09

Teniendo en cuenta la restriccin de no negatividad, xi 0, o en trminos de teora de juegos


que la mejor respuesta debe pertenecer al espacio de estrategias del jugador, la funcin de
mejor respuesta ser: fi ( x j ) = max { f i ( x j ), 0} .

Para comprobar cmo la combinacin de estrategias ( x1m , x2m ) no es un equilibrio de Nash


calculamos el beneficio marginal de cada empresa:
i ( xim , x mj )
xi

= p( xim + x mj ) + xim p ' ( xim + x mj ) Ci' ( xim ) = x mj p ' ( xim + x mj ) >0




<0

Definicin de acuerdo de
colusin.

Luego partiendo del acuerdo de colusin un aumento en la produccin eleva el beneficio de la


empresa i, y por tanto la empresa i tendra incentivos a romper el acuerdo de colusin. Visto
de otra forma, dada la definicin de funcin de mejor respuesta

tanto como

i ( xim , x mj )
xi

i ( fi ( x mj ), x mj )
xi

= 0 y por

>0 entonces fi ( x mj ) > xim .

Dado que conocemos cul sera la desviacin ptima de la empresa i si decidiera romper el
acuerdo de colusin, fi ( x mj ), vamos a llamar i al beneficio que obtendra la empresa i si ella
se desva ptimamente del acuerdo de colusin y la empresa rival lo respeta. Es decir,
i = i ( fi ( x mj ), x mj ).

120

SARRIKO-ON 6/09

Anlisis grfico: demanda lineal y coste marginal constante

x2

45

xe
f1 ( x2 )

Recta de colusin: x1 + x2 = x m

*
2
m
2

x
x

C-N

Acuerdo de colusin
xm
simtrico: xim =
, i = 1, 2
2

f 2 ( x1 )

x1m x1*

xm

xe

x1

Oligopolio

Este resultado lo podemos generalizar inmediatamente al caso de n empresas. La condicin


que define el acuerdo de colusin (la combinacin de estrategias que maximiza el beneficio
agregado) sera:
p ( xim + xmi ) + ( xim + xmi ) p ' ( xim + xmi ) Ci' ( xim ) = 0 i = 1,.., n.

Para comprobar cmo la combinacin de estrategias ( x1m ,.., xnm ) no es un equilibrio de Nash
calculamos el beneficio marginal de cada empresa:
i ( xim , xmi )
= p( xim + xmi ) + xim p ' ( xim + xmi ) Ci' ( xim ) = xmi p ' ( xim + xmi ) >0


xi
<0

Definicin de acuerdo de
colusin.

121

SARRIKO-ON 6/09

Luego partiendo del acuerdo de colusin un aumento en la produccin eleva el beneficio de la


empresa i, y por tanto la empresa i tendra incentivos a romper el acuerdo de colusin. Visto
de otra forma, dada la definicin de funcin de mejor respuesta

tanto como

i ( fi ( xmi ), xmi )
= 0 y por
xi

i ( xim , xmi )
>0 entonces fi ( xmi ) > xim .
xi

Dado que conocemos cul sera la desviacin ptima de la empresa i si decidiera romper el
acuerdo de colusin, fi ( xmi ), vamos a llamar i al beneficio que obtendra la empresa i si ella
se desva ptimamente del acuerdo de colusin y las dems empresas lo respetan. Es decir,
i = i ( f i ( xmi ), xmi ).

(ii) Modelo de Bertrand. El acuerdo de colusin no es equilibrio a corto plazo


Consideramos el modelo de Bertrand con producto homogneo y coste marginal constante e
idntico. La combinacin de estrategias que representa el acuerdo de colusin simtrico es
( p m , p m ) . La ganancia que obtendra cada empresa sera:
1
1
im = i ( p m , p m ) = ( p m c) D( p m ) = m
2
2

Ya vimos cmo una combinacin de estrategias del tipo pi = p j > c no era equilibrio de
Nash. Cualquier empresa tendra incentivos a desviarse unilateralmente. Por ejemplo,
podemos elegir pi' = p m (donde es una cantidad arbitraria positiva y lo suficientemente
pequea). Existen infinidad de desviaciones tales que la empresa i mejora.

122

SARRIKO-ON 6/09

Es ms problemtico encontrar desviacin ptima de la empresa i. Lo mejor es reducir el


precio del rival en una cantidad positiva lo ms pequea posible, > 0, 0 . Aunque no
tenemos bien definida esta desviacin ptima estaremos tan cerca del precio de monopolio
como deseemos. Vamos a llamar i al beneficio que obtendra la empresa i si ella se desva
ptimamente del acuerdo de colusin y la empresa rival lo respeta. Es decir,
m
m
m
i = i ( p m , p m ) = ( p m c) D( p m ) 
N ( p c) D( p ) =

3.4.2. Estabilidad de los acuerdos. Horizonte temporal finito e infinito


Hemos visto que a corto plazo la colusin no se puede mantener como equilibrio tanto si el
juego de referencia es el de Cournot como si es el de Bertrand. En esta seccin vamos a
estudiar las posibilidades de cooperacin o colusin entre las empresas cuando el juego se
repite.

(i) Horizonte temporal finito


Argumento de induccin retroactiva: la cooperacin o colusin no se puede sostener como
equilibrio (en cada etapa las empresas se comportarn como a corto plazo). El razonamiento
es equivalente al del dilema del prisionero.

(ii) Horizonte temporal infinito

Hay dos formas de interpretar un horizonte temporal infinito:


(i) Interpretacin literal: el juego se repite infinitos periodos. En este contexto, cuando un
jugador compara una estrategia con otra debera comparar el valor presente descontado de las

123

SARRIKO-ON 6/09

respectivas ganancias. Sea

el factor de descuento, 0 <

< 1. Si r es el tipo de inters,

1
.
1+ r

(ii) Interpretacin informacional: no se conoce la duracin del juego. En cada etapa del juego
existe una probabilidad 0 <

< 1 de que el juego contine. En este marco, cada jugador

debera comparar el pago esperado (que tambin se podra descontar) de las diferentes
estrategias.

Vamos a ver que la existencia de amenazas implcitas de castigo puede servir para mantener
la colusin como equilibrio del juego repetido.

En primer lugar ntese que hay un equilibrio perfecto en subjuegos del juego infinitamente
repetido en el que cada jugador juega la estrategia de equilibrio de Nash a corto plazo en cada
periodo. En el modelo de Cournot consistira para cada jugador en producir la cantidad de
Cournot en cada perodo con independencia de la historia pasada del juego. En el modelo de
Bertrand consistira para cada jugador en poner un precio igual al coste marginal en cada
perodo con independencia de la historia pasada del juego.

Vamos a ver si adems del anterior equilibrio, hay un equilibrio perfecto en subjuegos en el
que los jugadores cooperen. Consideremos la siguiente combinacin de estrategias a largo
plazo: sic {sitc ( H t 1 )}t=1 , i = 1, 2,
donde,

124

SARRIKO-ON 6/09

coludir
 

"cooperar " si todos los elementos de H son iguales a ("cooperar","cooperar") o t = 1
s ( H t 1 ) =
t 1
"no cooperar "(estrategia de EN a corto plazo)
en caso contrario
c
it

(en Cournot:
xm
sitc ( H t 1 ) = i *
xi

si todos los elementos de H t 1 son iguales a ( xim , xmi ) o t = 1


)
en caso contrario

(en Bertrand:
pm
sitc ( H t 1 ) =
c

si todos los elementos de H t 1 son iguales a ( p m , p m ) o t = 1


)
en caso contrario

Ntese que estas estrategias a largo plazo incorporan amenazas implcitas de castigo en
caso de violacin del acuerdo (implcito) de cooperacin. La amenaza para que sea creble
debe ser equilibrio de Nash.

Para ver si en este contexto se puede sostener como equilibrio la cooperacin, tenemos que
comprobar que los jugadores no tienen incentivos a desviarse; es decir, que la combinacin de
c

estrategias (s1 , s2 ) constituye un equilibrio de Nash del juego repetido.

Notacin

im beneficio bajo colusin de la empresa i en cada etapa del juego.


*i beneficio en la solucin a corto plazo de la empresa i en cada etapa del juego.
i beneficio de la empresa i si las dems cooperan y ella se desva.
i > im > *i

125

SARRIKO-ON 6/09

El valor presente descontado de las ganancias futuras del jugador i de cooperar viene dado
por:

i ( sic , s cj ) = im + im + 2 im + .... = im (1 + + 2 + ...) =

im
1

Si el jugador i se desva en el primer periodo, sus ganancias vendran dadas por:

i ( si , s cj ) = i + *i + 2 *i + .... = i + (1 + + 2 + ...) *i = i +

*i
1

La cooperacin ser equilibrio de Nash si ninguno de los jugadores tiene incentivos a


desviarse; es decir, si i ( sic , s cj ) i ( si , s cj ) . Es inmediato comprobar que si ninguno
de los jugadores tiene incentivos a romper el acuerdo de colusin, donde

i im
.
i *i

126

SARRIKO-ON 6/09

Bibliografa Bsica

Varian, H. R., 1992, Anlisis Microeconmico, tercera edicin, Barcelona: Antoni Bosch
editor. Cap. 13, secciones 13.6, 13.7, 13.9 y 13.10. Cap. 14, secciones: introduccin, 14.1,
14.2, 14.3, 14.5, 14.6, 14.7 y 14.8. Cap. 16, secciones: 16.1, 16.3, 16.4, 16.5, 16.6, 16.10 y
16.11.

Bibliografa Complementaria

Kreps, D. M., 1994, Curso de Teora Microeconmica, McGraw-Hill.

Tirole, J., 1990, La Teora de la Organizacin Industrial, Ariel Economa.

Varian, H. R., 1998, Microeconoma Intermedia: Un Enfoque Moderno, cuarta edicin,


Barcelona: Antoni Bosch editor.

127

También podría gustarte