Está en la página 1de 6

Notas de clase de Teoría de Juegos - Marcela Eslava 13

2.2. Conceptos de solución 2: Equilibrio de Nash.

¿Qué es un equilibrio? En situaciones competitivas, la decisión de un agente es de equilibrio si maximiza


su utilidad dadas las condiciones del ambiente (capturadas por las restricciones). Por tanto, un equilibro es
un punto en el cual no quiere cambiar su decisión. En juegos, el concepto es similar; un equilibrio es un
"punto" (es decir un conjunto de estrategias, una para cada jugador) tal que ningún jugador quiere
cambiar su decisión, dadas las condiciones del ambiente. La diferencia con una situación competitiva, es
que en un juego esas condiciones están dadas por las jugadas de los demás jugadores. Entonces, un
equilibrio se define como un conjunto de estrategias tal que ningún jugador quiere desviarse dadas las
estrategias de los demás. Es decir, cada jugador juega su "mejor respuesta" a lo que los demás están
jugando. Formalicemos ahora estos conceptos:

• Mejor Respuesta:
a. En un juego de dos jugadores, la estrategia s j ' del jugador j es una “mejor respuesta” a
la estrategia s - j * del otro jugador (a quién llamamos el jugador -j) si le da mayor o igual
utilidad a j que cualquier otra estrategia de su espacio de estrategias, dado que -j juega
s - j * . En símbolos: s j '∈ S j es mejor respuesta de j a s - j * ∈ S- j si
U j (s j ' , s - j *) ≥ U j (s j , s - j *) ∀ s j ∈ S j (Nota: ∀ significa “para todo”).
b. En un juego de más jugadores defina S- j como el espacio de estrategias de todos los
jugadores diferentes a j ( S - j = {S1 , S 2 ,..., S j-1 , S j+1 ,..., S N } ) Suponga que s - j * es un
elemento cualquiera de ese espacio. s j '∈ S j es una “mejor respuesta” de j a
s - j * = (s1 *,..., s j-1 *, s j+1 *,..., s N *)∈ S- j si U j (s j ' , s - j *) ≥ U j (s j , s - j *) ∀ s j ∈ S j .

Ejemplo 2.4.
En el juego de las cerveceras del ejemplo 2.2:
Bavaria Alto Medio Bajo
Leona
Medio ( 10,0 ) ( 5,5 ) ( 0,10 )
Bajo ( 10,0 ) ( 10,0 ) ( 5,5 )

Si Leona juega un precio "Medio", la mejor respuesta de Bavaria es escoger como precio "Bajo",
puesto que esta estrategia le da mayor utilidad (sería suficiente que fuera "mayor o igual") que
cualquier otra estrategia del espacio de estrategias de Bavaria, dado que Leona está jugando
"Medio".

Una solución en la que cada jugador juega su mejor respuesta a las estrategias de los demás es conocido
como un "Equilibrio de Nash"

Equilibrio de Nash:
Un equilibrio de Nash (de ahora en adelante EN), es una combinación de estrategias, una para cada
jugador, tal que cada estrategia es la mejor respuesta a las estrategias de los demás.
Notas de clase de Teoría de Juegos - Marcela Eslava 14
Es decir: (s1*, s2 *,..., s N *) es EN si U i (s1 *, s 2 *,..., si *,..., s N *) ≥ U i (s1 *, s 2 *,..., si ,..., s N *) ,
∀ si ∈ S i , ∀ i ∈ {1, ... N }

Hay dos definiciones alternativas de un Equilibrio de Nash:


1. Un conjunto de estrategias que son mejores respuestas mutuas.
2. Un conjunto de estrategias tal que ningún jugador tiene incentivos para desviarse de manera
unilateral.

Ejemplo 2.5.
En la batalla de los sexos:
ELLA T F
EL
T (1,2) (0,0)
F (0,0) (2,1)
Considere como una posible solución (T,F) (donde la primera componente es la estrategia de "El" y la
segunda es la de "Ella". ¿es este un equilibrio de Nash? No, porque dado que "Ella" está jugando F "El"
tendría incentivos para desviarse a F, y así aumentar su utilidad de 0 a 2.
Ahora considere (T,T): T es la mejor respuesta de "Ella" cuando "El" juega T, y viceversa, así que (T,T) es
un EN.

Procedimiento para encontrar un Equilibrio de Nash:

Definición:
Una función de reacción para el jugador j especifica la mejor respuesta de j a cada posible combinación de
estrategias de los demás.

Para hallar un Equilibrio de Nash:


1. Encuentre la función de reacción de cada jugador.
2. Encuentre el punto donde todas las Funciones de reacción se cumplen a la vez. Es decir, donde
cada jugador está jugando su mejor respuesta a las estrategias de los demás.

Ejemplo
En el dilema del prisionero, la función de reacción de S Trinidad esta dada por jugar C si R Granda juega
C y de jugar C si R Granda Juega N.

⎧C Si C R .Granda ⎫
FRS.Trinidad = ⎨ ⎬
⎩C Si N R .Granda ⎭

La función de reacción de R. Granda esta dada por jugar (C) si S. Trinidad juega C y de jugar C si S.
Trinidad Juega N.

⎧C Si CS.Trinidad ⎫
FRR .Granda = ⎨ ⎬
⎩C Si N S.Trinidad ⎭

Ambas funciones de reacción se cumplen al tiempo sólo en (C, C).

Cuando tengamos juegos representados en forma matricial, denotaremos la función de reacción


subrayando el pago de la mejor respuesta de cada jugador a cada posible estrategia del otro. Por
Notas de clase de Teoría de Juegos - Marcela Eslava 15
ejemplo, en la columna en la que RG juega N, subrayamos -1 para S.Trinidad, pues éste es el mejor
pago que puede obtener cuando RG juega N. Hacemos esto para cada posible estrategia del oponente.
(C,C), donde la primera componente es la estrategia de Simón Trinidad y la otra la de RG, es un EN
puesto que ambos están jugando su mejor respuesta (ambos pagos están subrayados)

R. GRANDA Confesar No Confesar


S. TRINIDAD

Confesar (-6,-6) (-1,-10)


No Confesar (-10,-1) (-3,-3)

Ejemplo 2.6: Duopolio de Cournot.

Este método también nos sirve para encontrar equilibrios de Nash en juegos en los que los espacios de
estrategias son continuos. Tome por ejemplo un duopolio de Cournot: dos firmas compiten en un
mercado, escogiendo las cantidades que cada una producirá. Considere dos firmas (i =1, 2) que producen
el mismo bien y lo venden en el mismo mercado (entonces ambas enfrentan el mismo precio). La curva
de demanda en ese mercado esta dada por:
Q = a − P, Q = q1 + q 2

Objetivo de la firma i (i=1,2): Max Π i = Pq i − cqi = ( a − q i − q j ) q i − cqi


qi
donde c es el costo marginal, que asumimos constante e idéntico para ambas firmas. Para encontrar el
equilibrio de Nash:

1. Hallar la función de reacción para cada firma.

Para la firma i, qi debe ser la mejor respuesta para q j : qi (q j ) . Esta se puede encontrar con la
condición de primer orden del problema de la firma i, dada una cantidad genérica qj de la otra firma:
∂Π i
= a − 2q i − q j − c = 0
∂qi
y una condición similar para la otra firma. Entonces las curvas de reacción son:
a − q2 − c a − q1 − c
q1 (q 2 ) = , q2 (q1 ) =
2 2

2. Cruzar las curvas de reacción.

Este paso consiste en encontrar la intersección: q1, q2 tal que ambas funciones de reacción se cumplen
al tiempo. Por cuanto hay que resolver el siguiente sistema de dos ecuaciones y dos incógnitas:
⎧ a − q2 − c ⎫
⎪⎪q1 = 2
,⎪

⎨ ⎬
⎪ q = a − q1 − c ⎪
⎪⎩ 2 2 ⎪⎭
Si se soluciona de manera correcta dicho sistema de ecuaciones, se obtiene que el equilibrio de Nash es el
siguiente conjunto de estrategias:
Notas de clase de Teoría de Juegos - Marcela Eslava 16
⎛ a−c a−c⎞
EN = ⎜ q1 = , q2 = ⎟
⎝ 3 3 ⎠

En este caso vemos que hay un único equilibrio de Nash. El resultado que este EN implica es:
a−c
• Ambas firmas escogen qi =
3
a + 2c
• El precio es P =
3
⎛a−c⎞
2

• Ambas firmas tienen obtienen Πi = ⎜ ⎟


⎝ 3 ⎠
Este equilibrio de Nash no es un óptimo social, pues los beneficios que se obtienen son inferiores a
los que las firmas obtendrían si estuvieran en colusión, con cada firma produciendo la mitad de la
cantidad de monopolio.

Una discusión de las características del Equilibrio de Nash:

• El concepto de Equilibrio de Nash es un concepto de estabilidad: una vez estoy allí no me quiero
mover. Sin embargo, el EN no necesariamente indica lo que efectivamente se va a jugar. Tome por
ejemplo la batalla de los sexos.

Ejemplo 2.7. La batalla de los sexos:

ELLA T F
EL
T (1,2) (0,0)

F (0,0) (2,1)

Tanto (T,T) como (F,F) son equilibrios de Nash (seguimos la notación propuesta arriba: la primera
componente del par ordenado es la estrategia de El) .¿Qué quiere esto decir sobre cómo un jugador
individual debe jugar o va a jugar, antes de saber lo que el otro hace? Nada, según este resultado es
tan plausible que un jugador juegue T como F. De hecho, en experimento el resultado más frecuente
es que se llegue a (F,T), donde él va a fútbol y ella a teatro. Note que cada uno juega una estrategia
que podría ser parte de un equilibrio, pero pueden no llegar a ninguno de los EN.

Esta falta de predicción es una limitante de la teoría de juegos para estudiar juegos estáticos.
Recuerde, sin embargo, que no es exclusiva de la teoría de juegos; en la teoría de precios
competitivos, tampoco podemos argumentar que los mercados lleguen realmente y de forma
inmediata al precio de equilibrio.

• Note también que el EN no es necesariamente un óptimo social (social = suma de todos los
participantes). Por ejemplo, el dilema del prisionero es “dilema” porque el equilibrio de Nash no es
la mejor opción social. Si se coordinan en (N,N) mejoran ambos. El concepto de Equilibrio de Nash es
simplemente de incentivos individuales. En el ejemplo del dilema del prisionero si ambos están en
(N,N), cada uno querría hacerle trampa al otro y confesar para disminuir sus años de cárcel a 1 año.
Notas de clase de Teoría de Juegos - Marcela Eslava 17

• Multiplicidad de equilibrios: ¿Hay siempre un único Equilibrio de Nash? No, por ejemplo en el
juego “la batalla de los sexos” que vimos arriba.
• Existencia de Equilibrios: En estrategias puras, puede no existir equilibrio de Nash (todos los juegos
vistos hasta el momento son de estrategias puras). Por ejemplo, en el siguiente juego no hay EN con
estrategias puras:
C S
C (-1,1) (1,-1)
S (1,-1) (-1,1)

2.2. Relación entre la solución por Equilibrio de Nash y la solución por estrategias dominadas.

Proposición 1: Todo equilibrio de Nash sobrevive a la eliminación iterativa de estrategias estrictamente dominadas.

Prueba (Por contradicción): Suponga que (si*,s-i*) es un Equilibrio de Nash2, pero fue “borrado” en el
proceso de eliminación de estrategias estrictamente dominadas. Sin pérdida de generalidad, suponga que
ese EN se "borró" en una ronda en la cual s*i resultó estrictamente dominada por s'i ∈ Si. Entonces
( )
u i si* , s −" i < u i ( si' , s −'' i ) ∀ s '-'i que haya sobrevivido hasta ese punto. En particular3 se cumple para s-i’’=s*-
i. ( *
Entonces u i s i , s −i
*
) < u (s , s
i
'
i
*
−i ) . Contradicción: (si*,s-i*) no podría entonces ser un Equilibrio de Nash.

Note que la misma prueba no funciona si el concepto de eliminación incluye estrategas débilmente
dominadas, pues u i s i , s −i ( * *
) = u (s , s
i
'
i
*
−i ) no impide que (si*,s-i*) sea EN, y tampoco impide que s*i sea
eliminada (como débilmente dominada) por s'i.. En efecto, un puede encontrar ejemplos en los que la
eliminación de estrategias débilmente dominadas elimina equilibros de Nash. Por ejemplo, note en el
juego del prisionero ampliado de la sección 2.1., ejemplo 2.3., que la eliminación de estrategias
débilmente dominadas borra (N,P), que es un equilibrio de Nash.

Proposición 2: Si el proceso de eliminación de estrategias estrictamente dominadas llega a una solución única, esa
solución es un Equilibrio de Nash y es único.

La proposición tiene dos partes:


A) Una solución única a EEED es un Equilibrio de Nash
B) Ese equilibrio de Nash es único.

Vamos a probar (A) para el caso de dos estrategias y dos jugadores, pero la demostración para el caso
más general es muy similar4:

Suponga S i = {si' , s i'' } S j = {s ºj , s ºjº }

Se demostrará por contradicción. Suponga que la solución única del proceso de eliminación es (si’,sjº)
pero no es Equilibrio de Nash. Como no es EN, existe si’’∈Si tal que: u i s i , s j ( '' º
) > u (s , s
i
'
i
º
j ) (es decir, hay

2
s-i es un conjunto de estrategias de todos los jugadores distintos a i, como se definió en la sección 2.1
3
Note que estamos suponiendo que el equilibrio mencionado fue "borrado" cuando s*i fue eliminado por s'i, de tal
manera que en esa ronda todavía s*-i sobrevivía (de no ser así el equilibrio se habría eliminado en alguna ronda
anterior).
4
Ver Gibbons (1992)
Notas de clase de Teoría de Juegos - Marcela Eslava 18
una desviación unilateral rentable para i). Pero entonces si’’ no pudo haber sido eliminado por si’ en el
proceso de eliminación. Entonces tenemos una contradicción.

Si (Si) tuviera más de dos elementos, diríamos (si’’) solo pudo ser eliminado por estrategias diferentes a
(
(si’) digamos como ejemplo (si’’’). Pero entonces volvemos a decir: u s i , s j
''' º
) > u(s , s
''
i
º
j ) > u (si' , s ºj )
entonces de nuevo se vería que (si’’’) no pudo haber sido eliminada por (si’) y así sucesivamente.

Prueba de (B):

La Proposición 1 probó que cualquier otro equilibrio de Nash habrá sobrevivido. Por lo tanto no puede
haber otro Equilibrio de Nash ya que solo (si’, sjº) sobrevivió.

De nuevo, tratemos de extender este análisis para estrategias débilmente dominadas. Note que la prueba
de la parte A sigue siendo correcta si el concepto de eliminación es el de dominación débil. La parte B, en
cambio, no se cumple pues la Proposición 1 no se satisface con estrategias débilmente dominadas.
Entonces, si hay una única solución que sobrevive al proceso de eliminación de estrategias débilmente
dominadas, esa solución es un Equilibro de Nash, pero puede no ser único. Como ejemplo, tome de
nuevo la EEDD en el dilema de prisioneros ampliado del ejemplo 2.3: en este caso sobrevive únicamente
(C,P) que es un EN, aunque no es el único EN.