Está en la página 1de 101

EQUILIBRIO

NASH
Cap. 2: An Introduction to Game Theory, Osborne Martin J., Oxford University Press, 2003
FACULTAD DE ECONOMÍA UANL
Dr. Luciano Ayala Cantú
JUEGOS ESTRATÉGICOS
• Un juego estratégico (también llamado juego simultaneo, normal, o
matricial) tendrá:
• Un conjunto de jugadores.
• Empresas, personas, gobiernos, empleados…
• Para cada jugador, un conjunto de acciones (o estrategias).
• Ofertar en una subasta, terminar una huelga, vender una acción, cómo
votar…
• Para cada jugador, preferencias sobre el conjunto de acciones.
• Podemos asignarlas con una función de utilidad.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 2
s, 2003
JUEGOS ESTRATÉGICOS
• Analizamos este tipo de juegos como si las acciones fueran tomadas
por todos los jugadores al mismo tiempo.
• Juegos en forma extensiva (los veremos después):
• Los jugadores se mueven de manera secuencial, se representan con
“árboles”.
• Ajedrez: juego extensivo con información perfecta… las negras ven lo
que hacen las blancas y reaccionan.
• Toma en cuenta lo que cada jugador sabe al momento de tomar su
decisión.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 3
s, 2003
EL DILEMA DEL PRISIONERO
• Dos ladrones son interrogados por la policía en lugares distintos.
• La policía tiene suficiente evidencia para sentenciar a ambos por un
delito menor, pero necesita que confiesen para juzgarlos por un
delito grave.
• Para motivar a los ladrones a inculparse entre sí, les ofrecen una
reducción de su condena a cambio de delatar al otro.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 4
s, 2003
EL DILEMA DEL PRISIONERO
• Si ninguno de los ladrones delata a su compañero, ambos pasan
solo dos años en la cárcel.
• Si el ladrón 1 (Mateo) delata a ladrón 2 (Juan),y ladrón 2 no lo
delata, el ladrón 1 pasa un año en la cárcel y ladrón 2 pasa 10 años
en la cárcel.
• Si se delatan mutuamente, ambos pasan 6 años en la cárcel.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 5
s, 2003
EL DILEMA DEL PRISIONERO
• Podemos modelar esta situación como sigue:
• Jugadores: 2 sospechosos
• Acciones: el conjunto de acciones de cada jugador es { No
Delatar, Delatar }
• Preferencias: Para Mateo (jugador 1), en orden de mejor a menor,
es {Delatar, No Delatar}, es decir, que él delata y Juan No delata,
{No Delatar, No Delatar}, {Delatar, Delatar}, {No Delatar,
Delatar}.
• Para Juan (jugador 2), el orden es: {No Delatar, Delatar}, {No Delatar, No
Delatar}, {Delatar, Delatar}, {Delatar, No Delatar}
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 6
s, 2003
EL DILEMA DEL PRISIONERO
• Podemos representar este juego de forma matricial (una tabla).
• Usemos números negativos para representar la utilidad de los años
de cárcel.
Juan (J2)
No Delatar Delatar
Mateo (J1) No Delatar -2,-2 -10,-1
Delatar -1,-10 -6,-6

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 7
s, 2003
EL DILEMA DEL PRISIONERO
• Supongamos que Mateo sabe que Juan no va a delatar, ¿qué debe
hacer?

Juan (J2)
No Delatar
No Delatar -2,-2
Mateo (J1)
Delatar -1,-10

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 8
s, 2003
EL DILEMA DEL PRISIONERO
• Ahora supongamos que Mateo sabe que Juan va a delatarlo, ¿qué
debe hacer?

Juan (J2)
No Delatar Delatar
Mateo (J1) No Delatar -2,-2 -10,-1
Delatar -1,-10 -6,-6

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 9
s, 2003
EL DILEMA DEL PRISIONERO
• De manera similar, podemos encontrar la estrategia de Juan.
• Si sabe que Mateo no delata, ¿qué hace?... Si sabe que lo va a delatar,
¿qué debe hacer?

Juan (J2)
No Delatar Delatar
Mateo (J1) No Delatar -2,-2 -10,-1
Delatar -1,-10 -6,-6

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 10
s, 2003
EL DILEMA DEL PRISIONERO
• El dilema del prisionero modela una situación en la que dos
jugadores se podrían beneficiar de la cooperación (cada jugador
está mejor si ninguno delata).
• Sin embargo, ambos jugadores tienen un incentivo a
“aprovecharse” de la situación, sin importar lo que haga su
oponente.
• Esto se le llama estrategia dominante (lo veremos después).

• El juego es interesante porque tiene un resultado sub-óptimo


(ambos podrían mejorar) y tiene diversas aplicaciones.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 11
s, 2003
EL DILEMA DEL PRISIONERO
Ejemplo: trabajo en equipo
• Estas trabajando con una compañera en un proyecto final.
• Cada una puede “echarle ganas” o “mensear”.
• Si tu compañera le echa ganas, tú prefieres mensear.
• El proyecto sería mejor si tú también le echas ganas, pero no
consideras que el incremento en la calificación compense el esfuerzo
extra.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 12
s, 2003
EL DILEMA DEL PRISIONERO
Ejemplo: trabajo en equipo
• Prefieres el resultado donde ambas trabajan bien en vez de mensear
(reprueban el trabajo si las dos mensean).
• El peor resultado es donde tú le echas ganas y tu compañera
mensea.
• Si tu compañera tiene las mismas preferencias, ¿cómo te imaginas
que puede ser modelado este juego?

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 13
s, 2003
EL DILEMA DEL PRISIONERO
Ejemplo: trabajo en equipo

Esforzarse No Esforzarse

Esforzarse 2,2 0, 3

No Esforzarse 3,0 1,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 14
s, 2003
EL DILEMA DEL PRISIONERO
Ejemplo: duopolio
• Un modelo simple de duopolio, dos empresas producen el mismo
producto y deciden si cobrar un precio alto o bajo.
• Cada empresa quiere obtener la mayor ganancia posible.
• Si ambas ponen precio alto, ambas ganan $1000
• Si una pone precio alto y la otra bajo, la que puso el precio alto pierde
$200 y la de precio bajo gana $1200
• Si ambas ponen precios bajos ganan $600
• A cada empresa le importa solo su ganancia.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 15
s, 2003
EL DILEMA DEL PRISIONERO
Ejemplo: duopolio

Precio alto Precio bajo

Precio alto 1000,1000 -200, 1200

Precio bajo 1200,-200 600,600

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 16
s, 2003
EL DILEMA DEL PRISIONERO
• En los ejemplos anteriores, no sugerimos que los trabajos en
equipo, o las decisiones de las empresas deban de ser modeladas
con el dilema del prisionero.
• Es posible que si tu compañera mensea tu trabajes más para no
dañar tus calificaciones.
• Diferentes resultados en ganancias de las empresas pueden generar
juegos distintos.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 17
s, 2003
BATALLA DE LOS SEXOS
• En el dilema del prisionero el principal problema es si los agentes
van a cooperar (no delatarse).
• En este problema, los agentes están de acuerdo que cooperar es
mejor que no cooperar, solo difieren en cual es el mejor resultado.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 18
s, 2003
BATALLA DE LOS SEXOS
• Una pareja decide entre ir al ballet o al fútbol.
• Ambos quieren hacer la actividad juntos; pero el hombre prefiere el
ballet, y la mujer el fútbol.
• Dado que quieren estar juntos, ir a lugares distintos les ocasiona
una utilidad de cero.
• Ir la ballet con su pareja es lo mejor para el hombre, mientras que ir
al fútbol con su pareja es lo mejor para la mujer.
• ¿Cuál es el resultado de este juego?

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 19
s, 2003
BATALLA DE LOS SEXOS

Mujer
Ballet Fútbol

Ballet 2,1 0,0


Hombre
Fútbol 0,0 1,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 20
s, 2003
COINCIDENCIA DE CENTAVOS
• En los dos juegos anteriores tenemos aspectos de cooperación y
conflicto.
• Este juego (matching pennies) es completamente conflictivo.
• Dos personas escogen de manera simultánea mostrar la “cara” o el
“sol” de una moneda:
• Si son iguales, el jugador 2 le paga $1 a jugador 1.
• Si son distintas, el jugador 1 le paga $1 a jugador 2.
• A estos juegos les llamamos “estrictamente competitivos” o “suma-
cero”.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 21
s, 2003
COINCIDENCIA DE CENTAVOS

Cara Sol

Cara 1,-1 -1,1

Sol -1,1 1,-1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 22
s, 2003
LA CAZA DEL CIERVO
• Cada miembro de un grupo de cazadores tiene 2 opciones:
esforzarse por atrapar al ciervo, o cazar a la liebre.
• Si todos los cazadores persiguen al ciervo, lo atrapan y lo dividen
en partes iguales.
• Si algún cazador se desvía y atrapa a una liebre, el ciervo escapa, y
la liebre la obtiene el cazador que desertó.
• Todos los jugadores prefieren una parte del ciervo a una liebre
completa.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 23
s, 2003
LA CAZA DEL CIERVO
• El juego en su versión de dos jugadores puede ser modelado como:
• Jugadores: 2 cazadores
• Acciones: el conjunto de acciones de cada jugador es {Ciervo, Liebre}
• Preferencias: para cada jugador el resultado preferido es que ambos
cacen el ciervo, seguido por cazar la liebre, y por último cazar el
ciervo y que el otro jugador cace la liebre (se lleva nada)

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 24
s, 2003
LA CAZA DEL CIERVO

Ciervo Liebre

Ciervo 2,2 0,1

Liebre 1,0 1,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 25
s, 2003
EQUILIBRIO NASH
• En un juego, la mejor acción a tomar por cualquier jugador
depende, en general, de las acciones de los otros jugadores.
• Entonces, cuando un jugador tome una decisión deberá tomar en
cuenta las acciones de los demás.
• Es decir, debe formarse una creencia de las acciones de los demás.
• ¿Cómo formara el jugador dicha creencia o expectativa?

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 26
s, 2003
EQUILIBRIO NASH
• Suponemos que las creencias de los jugadores provienen de su
experiencia jugando el juego.
• Esta experiencia es suficiente para que ella sepa como se comportaran
los demás jugadores.
• Suponemos que cada juego se lleva a cabo de manera aislada.
• No hay componente temporal (aún): no aprende del comportamiento
de jugadores específicos, y sus acciones no alteran el comportamiento
futuro de los demás.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 27
s, 2003
EQUILIBRIO NASH
• Quizá sea útil pensarlo de la siguiente manera:
• Imagine que para cada jugador, hay un universo de posibles tomadores
de decisiones.
• Cada vez que se juega, se toman de manera aleatoria jugadores de ese
universo.
• Cada jugador forma entonces expectativas con base al jugador
“típico”.
• Por ejemplo, la interacción repetida entre compradores y
vendedores puede ser considerada aleatoria, y a veces anónima (si
el vendedor es muy grande).
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 28
s, 2003
EQUILIBRIO NASH
• En resumen, la solución teórica tiene dos componentes:
• Primero, cada jugador escoge su estrategia con base en el modelo de
elección racional, dada sus expectativas de las acciones de los otros
jugadores.
• Segundo, cada creencia de los jugadores sobre los demás es correcta.
• Esto nos lleva a la siguiente definición:
• Un equilibrio Nash es un perfil de acción tal que ningún jugador i
puede mejorar escogiendo algo distinto a , dado que los demás
jugadores –i se adhieren a

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 29
s, 2003
EQUILIBRIO NASH
• En la versión idealizada donde los jugadores son seleccionados
aleatoriamente, un equilibrio Nash representa un estado
estacionario.
• Si cada que se juega el juego el perfil de acciones es el mismo
equilibrio Nash , nadie tiene incentivos para escoger algo distinto a su
respectivo componente de .
• Expresado de otra forma, el equilibrio Nash es una “norma social”
estable: si todos se adhieren, nadie quiere desviarse de ella.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 30
s, 2003
EQUILIBRIO NASH
Definición: Equilibrio Nash en juegos estratégicos con preferencias ordinales
El perfil de acción en un juego estratégico con preferencias ordinales es un equilibrio Nash si,
por cada jugador i y cada acción del jugador i, es al menos tan bueno como el perfil de acción
en el cual el jugador i escoge mientras que los demás jugadores –i escogen . Igualmente, para
cada jugador i,

donde es la función de utilidad del jugador i.

• La definición no implica que todos los juegos tengan equilibrios Nash,


o que solo exista uno en cada juego.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 31
s, 2003
EQUILIBRIO NASH: EJEMPLOS
El dilema del prisionero
• Al examinar los 4 posibles pares de acciones observamos que el
único equilibrio Nash es (Delatar, Delatar).
• Esto porque 1) dado que el J2 escoge Delatar, J1 esta mejor delatando
que no delatando; y 2) si J1 escoge Delatar, J2 esta mejor delatando
que no delatando.
No Delatar Delatar
No Delatar 2,2 0,3
Delatar 3,0 1,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 32
s, 2003
EQUILIBRIO NASH: EJEMPLOS
El dilema del prisionero
• Ningún otro perfil de acciones es un equilibrio Nash:
• (ND,ND) no satisface la condición (2.1) porque si J1 no delata, el J2 puede
tener más utilidad delatando. De igual manera, si J2 no delata, el J1 obtiene
mayor utilidad delatando.
• Con que un solo jugador desee desviarse comprobamos que no es un
equilibrio Nash.
No Delatar Delatar
No Delatar 2,2 0,3
Delatar 3,0 1,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 33
s, 2003
EQUILIBRIO NASH: EJEMPLOS
El dilema del prisionero
• Ningún otro perfil de acciones es un equilibrio Nash:
• (D,ND) tampoco satisface (2.1) porque si J1 delata, J2 obtiene una mayor
utilidad delatando (1 en vez de 0).
• (ND,D) tampoco satisface (2.1) porque si J2 delata, J1 obtiene una mayor
utilidad delatando (1 en vez de 0).

No Delatar Delatar
No Delatar 2,2 0,3
Delatar 3,0 1,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 34
s, 2003
EQUILIBRIO NASH: EJEMPLOS
El dilema del prisionero
• En resumen, el único equilibrio Nash en este juego es donde ambos
jugadores se delatan entre sí.
• El incentivo a aprovecharse elimina la posibilidad del resultado
mutuamente deseable de (No delatar, No delatar).
• El resultado es similar en los otros dos ejemplos del dilema del
prisionero:
• Las dos compañeras mensean en el proyecto final.
• Ambas empresas cobran precios bajos en el duopolio.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 35
s, 2003
EQUILIBRIO NASH: EJEMPLOS
El dilema del prisionero
• En este juego, delatar es la mejor opción no solo si tu compañera
también te delata.
• De hecho, el jugador esta mejor delatando sin importar si la otra
persona delata o no.
• Esto se le llama estrategia dominante (después con más detalle).
• En muchos otros juegos esto no pasa: la acción es óptima si y solo
si el rival escoge su acción de equilibrio Nash.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 36
EQUILIBRIO NASH: EJEMPLOS
Batalla de los sexos
• Examinemos ahora cada par de acciones en el juego BdS:
• (B,B): si J1 cambia a Fútbol, su utilidad se reduce de 2 a 0; si J2
cambia a Fútbol su utilidad se reduce de 1 a 0.
• Para ambos desviarse reduce su utilidad, por lo que es un equilibrio
Nash.
Ballet Fútbol
Ballet 2,1 0,0
Fútbol 0,0 1,2
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 37
EQUILIBRIO NASH: EJEMPLOS
Batalla de los sexos
• Examinemos ahora cada par de acciones en el juego BdS:
• (B,F): si J1 cambia a Fútbol aumenta su utilidad de 0 a 1. Por tanto no
es un equilibrio Nash.
• (F,B): si J1 cambia a Ballet aumenta su utilidad de 0 a 2. No es un
equilibrio Nash.
Ballet Fútbol
Ballet 2,1 0,0
Fútbol 0,0 1,2
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 38
EQUILIBRIO NASH: EJEMPLOS
Batalla de los sexos
• Examinemos ahora cada par de acciones en el juego BdS:
• (F,F): si J1 cambia a Ballet, su utilidad decrece de 1 a 0; si J2 cambia a
Ballet su utilidad decrece de 2 a 0.
• Para ambos desviarse reduce su utilidad, por lo que es un equilibrio
Nash.
Ballet Fútbol
Ballet 2,1 0,0
Fútbol 0,0 1,2
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 39
EQUILIBRIO NASH: EJEMPLOS
Batalla de los sexos
• Concluimos entonces que BdS tiene dos equilibrios Nash: (Ballet,
Ballet) y (Fútbol, Fútbol).
• Es decir, ambos resultados son estados estacionarios; normas
sociales bien establecidas.
• Si, en un encuentro dado, ambos están en el ballet, ninguno tiene
incentivos a desviarse. Igualmente, si ambos están en el Fútbol,
ninguno tiene incentivos para cambiar.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 40
EQUILIBRIO NASH: EJEMPLOS
Coincidencia de centavos
• Este juego no tiene equilibrio Nash.
• A cualquier acción de J1, al J2 le conviene desviarse.
• Más adelante veremos una variante del equilibrio Nash que nos ayuda
a entender el resultado más probable.

Cara Sol
Cara 1,-1 -1,1
Sol -1,1 1,-1
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 41
EQUILIBRIO NASH: EJEMPLOS
La caza del ciervo
• Este juego tiene dos equilibrios Nash.
• A diferencia de BdS, uno de los equilibrios es preferido por ambos
jugadores.
• Esto no importa en la definición del equilibrio Nash (Liebre, Liebre).
• La condición (2.1) indica que un jugador no puede ganar desviándose, dado el
comportamiento del otro jugador.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 42
EQUILIBRIO NASH: EJEMPLOS
Un juego de coordinación
• En este juego de BdS la pareja tiene gustos similares: ambos
prefieren el Ballet al Fútbol.
• Este juego tiene 2 equilibrios Nash: (B,B) y (F,F).

Ballet Fútbol
Ballet 2,2 0,0
Fútbol 0,0 1,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 43
EQUILIBRIO NASH: EJEMPLOS
Un juego de coordinación
• En este juego de BdS la pareja tiene gustos similares: ambos
prefieren el Ballet al Fútbol.
• Este juego tiene 2 equilibrios Nash: (B,B) y (F,F).
• ¿Es posible que ambos escojan fútbol, a pesar de ser su actividad
menos preferida?
Ballet Fútbol
Ballet 2,2 0,0
Fútbol 0,0 1,1
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 44
EQUILIBRIO NASH: EJEMPLOS
Un juego de coordinación
• ¿Es posible que ambos escojan fútbol, a pesar de ser su actividad
menos preferida?
• Si, es posible que opciones menos deseables sean estados estacionarios
(p. ej. Dvorak vs Qwerty).

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 45
EQUILIBRIO NASH: EJEMPLOS
Un juego de coordinación
• Cuando un equilibrio es mejor para al menos un jugador (e
indiferente para los demás) se dice que ese equilibrio lo domina en
el sentido de Pareto.
• No obstante, la dominancia Pareto no garantiza cooperación cuando
hay varios equilibrios.
• La teoría de Nash es neutral respecto a cual equilibrio sucede en juegos
con múltiples equilibrios.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 46
EQUILIBRIO NASH: EJEMPLOS
Equilibrio estricto y no estricto
• En los juegos analizados hasta ahora, una desviación del equilibrio
resulta en algo peor para el jugador.
• Sin embargo, la definición de equilibrio Nash únicamente requiere
que el resultado de desviarse no sea peor para el jugador que el
resultado en equilibrio.
• Algunos juegos tienen equilibrios donde algún jugador esta indiferente
entre el equilibrio y alguna otra acción, dadas las acciones del otro
jugador.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 47
EQUILIBRIO NASH: EJEMPLOS
Equilibrio estricto y no estricto
• Considere el siguiente juego:
• Tiene un solo equilibrio Nash (T,L); para cualquier otro par de acciones,
algún jugador esta mejor moviéndose.
• Cuando J2 escoge L (su acción en el equilibrio), J1 es indiferente entre T o
B. Decimos que este no es un equilibrio estricto.
L M R
T 1,1 1,0 0,1
B 1,0 0,1 1,0
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 48
EQUILIBRIO NASH: EJEMPLOS
Equilibrio estricto y no estricto
Definición: Equilibrio estricto Nash en juegos estratégicos con preferencias ordinales
El perfil de acción en un juego estratégico con preferencias ordinales es un equilibrio Nash
estricto si, por cada jugador i tenemos,

donde es la función de utilidad del jugador i.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 49
FUNCIONES MEJOR
RESPUESTA
• En juegos con pocas posibles acciones, podemos examinar cada
perfil de acción para verificar si satisface las condiciones de
equilibrio.
• En juegos más complicados, a veces es mejor trabajar con las
funciones mejor respuesta de los jugadores.
• En BdS, por ejemplo, Ballet es la mejor acción para J1 cuando J2
escoge Ballet; y Fútbol es la mejor acción para J1 cuando J2 escoge
Fútbol.
• El J1 tiene una mejor acción para cada acción de J2.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 50
s, 2003
FUNCIONES MEJOR
RESPUESTA
• Definimos el conjunto de mejores acciones de i, cuando las
acciones de los demás son como .
• En BdS tenemos

• En este juego T y B son mejores acciones para J1 cuando J2 escoge


L:

L M R
T 1,1 1,0 0,1
B 1,0 0,1 1,0
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 51
s, 2003
FUNCIONES MEJOR
RESPUESTA
Definición: Función Mejor Respuesta
De manera precisa, definimos como:

• Cualquier acción en es al menos tan buena para jugador i como cualquier otra acción
disponible, cuando las acciones de los demás están dadas por .
• Cada miembro de es una mejor respuesta de jugador i a : si cada uno de los demás
jugadores se adhiere a , entonces el jugador i no puede mejorar escogiendo fuera de .
• En BdS, el conjunto contiene una sola acción para cada acción ; en otros juegos, como el
anterior, tiene más de una acción.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 52
s, 2003
FUNCIONES MEJOR
RESPUESTA
Funciones B para definir equilibrio Nash
• Un equilibrio Nash es un perfil de acción con la propiedad de que
ningún jugador puede mejorar escogiendo algo distinto, dadas las
acciones de los demás.
• Usando este concepto, podemos además definir el equilibrio Nash
como un perfil de acción en el cual cada acción de cada jugadores
es una mejor respuesta a las acciones de los demás.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 53
FUNCIONES MEJOR
RESPUESTA
Funciones B para definir equilibrio Nash
Proposición: Equilibrio Nash con Funciones Mejor Respuesta
El perfil de acción es un equilibrio Nash si y solo si las acciones de cada jugador son una mejor
respuesta a las acciones de los demás jugadores:

Si cada jugador i tiene una sola mejor respuesta para cada lista de las acciones de los jugadores,
podemos escribir (2.4) con ecuaciones. Para cada i y , define el único miembro de como . Por
tanto, (2.4) equivale a:

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 54
FUNCIONES MEJOR
RESPUESTA
Funciones B para definir equilibrio Nash
• Por ejemplo, en un juego con dos jugadores estas ecuaciones son:

• En un juego con 2 jugadores donde cada uno tiene una sola mejor
respuesta a cada acción de su rival, es un equilibrio Nash si y solo si:
es la mejor respuesta de J1 a del J2; y es la mejor respuesta a del J1.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 55
FUNCIONES MEJOR
RESPUESTA
Funciones B para encontrar equilibrio Nash
• Podemos encontrar el equilibrio Nash:
• Encontrando la función B de cada jugador.
• Encontrando el perfil de acciones que satisface (2.4)
• Puede ser 2.5 en el caso de que cada jugador tenga una sola mejor
respuesta para la lista de las acciones de los demás jugadores.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 56
FUNCIONES MEJOR
RESPUESTA
Funciones B para encontrar equilibrio Nash

L C R
T 1,2 2,1 1,0
M 2,1 0,1 0,0
B 0,1 0,0 1,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 57
FUNCIONES MEJOR
RESPUESTA
Funciones B para encontrar equilibrio Nash

L C R
T 1,2* 2*,1 1*,0
M 2*,1* 0,1* 0,0
B 0,1 0,0 1*,2*

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 58
FUNCIONES MEJOR
RESPUESTA
Funciones B para encontrar equilibrio Nash
• Una notación distinta: BR1 son círculos, BR2 son puntos.
J2
L C R
T 1,2* 2*,1 1*,0
J1 M 2*,1* 0,1* 0,0
B 0,1 0,0 1*,2*

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 59
FUNCIONES MEJOR
RESPUESTA
Ejercicio 37.1: Funciones B para encontrar equilibrio
Nash
a. Escriba las mejores respuestas del juego usando la notación de circulo y
puntos.
L C R
T 2,2 1,3 0,1
M 3,1 0,0 0,0
B 1,0 0,0 0,0

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 60
FUNCIONES MEJOR
RESPUESTA
Ejercicio 37.1: Funciones B para encontrar equilibrio
Nash

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 61
FUNCIONES MEJOR
RESPUESTA
Ejemplo 39.1: Una relación sinérgica
• Dos individuos están envueltos en una relación sinérgica.
• Si ambos ponen más esfuerzo a la relación, los dos están mejor.
• Para un nivel dado de esfuerzo del jugador j, el retorno del esfuerzo
del jugador i primero aumenta y después disminuye.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 62
FUNCIONES MEJOR
RESPUESTA
Ejemplo 39.1: Una relación sinérgica
• Específicamente, el esfuerzo es un número no negativo, y las
preferencias del individuo i (para i=1, 2) son representadas por la
función de utilidad:

• Donde es el esfuerzo del jugador i, el esfuerzo del otro jugador, y c>0


es una constante.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 63
FUNCIONES MEJOR
RESPUESTA
Ejemplo 39.1: Una relación sinérgica
• Podemos modelar el juego de la siguiente manera:
• Jugadores: dos individuos.
• Acciones: cada jugador escoge un nivel de esfuerzo no negativo.
• Preferencias: están representadas por la función de utilidad , para i=1,
2.
• Cada jugador tiene un número infinito de acciones.
• Por tanto, no podemos representar este juego de forma matricial
(como los anteriores).
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 64
FUNCIONES MEJOR
RESPUESTA
Ejemplo 39.1: Una relación sinérgica
• Para encontrar el equilibrio Nash podemos usar las funciones mejor
respuesta.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 65
Ejemplo 39.1: Una relación
FUNCIONES
sinérgica
MEJOR
RESPUESTA
•La función para es:

•El punto donde:

•Es un equilibrio Nash


(donde se intersectan las
gráficas).

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 66
Ejemplo 39.1: Una relación
FUNCIONES
sinérgica
MEJOR
RESPUESTA
•Resolvemos el sistema de
ecuaciones:

•El equilibrio Nash es:

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 67
FUNCIONES
MEJOR
RESPUESTA
•El área sombreada dice que J1
tiene un rango de mejores
respuestas, dadas las acciones
entre de J2.
•Los equilibrios Nash en este
juego son:

•Y todos los perfiles de


acción de la función BR de
J2 entre y

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 68
FUNCIONES
MEJOR
RESPUESTA
•Nótese que la función B de J1
no es continua.
•Cuando J2 escoge algo un
poco mayor de , el J1 reduce a
de manera significativa.
•Varios ejemplos que veremos
más adelante tienen esa
característica.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 69
ACCIONES DOMINADAS
Dominancia estricta

 ¿Debería Grace saltar del


avión para celebrar su
cumpleaños 91?

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University
Press, 2003 70
ACCIONES DOMINADAS
Dominancia estricta
• En cualquier juego, la acción de un jugador “domina estrictamente”
otra acción si es superior, sin importar lo que hagan los demás
jugadores.
Definición: Dominancia Estricta
En un juego estratégico con preferencias ordinales, la acción domina estrictamente si:

decimos que la acción es estrictamente dominada.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 71
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• En el dilema del prisionero, Delatar domina estrictamente a No
Delatar.
• Sin importar lo que haga el otro jugador, el resultado de Delatar
siempre es preferible.
• En BdS ninguna acción domina a la otra.
• Ballet es mejor que Fútbol si el otro jugador escoge Ballet; Fútbol es
mejor que Ballet si el otro escoge Fútbol.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 72
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• Una estrategia dominada jamás será una mejor respuesta.
• Por lo tanto, tampoco formara parte de un equilibrio Nash.
• Podemos removerla del juego.
• Es incompatible con un estado estacionario, e incluso con el
comportamiento racional de un jugador (aunque sea la primera vez
que juega el juego).

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 73
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• El hecho de que domine L R
estrictamente no implica que
domine todas las acciones. T 1 0
• (Solo se muestran los pagos
del jugador 1). M 2 1

B 1 3

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 74
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• El hecho de que domine L R
estrictamente no implica que
domine todas las acciones. T 1 0
• M domina estrictamente a T,
pero B es mejor que M si J2 M 2 1
escoge R.
• T no puede ser parte de un B 1 3
equilibrio Nash, M es posible
pero no necesariamente.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 75
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• En este otro juego M domina L R
estrictamente a T, pero M es
dominada por B. T 1 0
• Cualquier equilibrio Nash
M 2 1
debe incluir solo B: la única
acción que no es dominada B 3 2
estrictamente.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 76
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• Podemos remover los perfiles
L C R
de acciones con estrategias
dominadas. T 3,0 2,1 0,0
• A esto se le llama eliminación M 1,1 1,1 5,0
iterada de estrategias
B 0,1 4,2 0,1
estrictamente dominadas.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 77
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• R es estrictamente dominada
L C R
por C.
T 3,0 2,1 0,0

M 1,1 1,1 5,0

B 0,1 4,2 0,1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 78
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
L C
T 3,0 2,1
M 1,1 1,1
B 0,1 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 79
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• M es estrictamente dominada
L C
por T
T 3,0 2,1
M 1,1 1,1
B 0,1 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 80
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• M es estrictamente dominada
L C
por T
T 3,0 2,1
B 0,1 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 81
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
L C
T 3,0 2,1
B 0,1 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 82
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• L es estrictamente dominada
L C
por C.
T 3,0 2,1
B 0,1 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 83
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
C
T 2,1
B 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 84
s, 2003
ACCIONES DOMINADAS
Dominancia estricta
• T es estrictamente dominada
C
por B.
T 2,1
• Un solo equilibrio Nash:
(B,C). B 4,2

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 85
s, 2003
ACCIONES DOMINADAS
Dominancia débil
• En cualquier juego, la acción de un jugador “domina débilmente”
otra acción si es al menos tan buena como la primera acción, sin
importar lo que hagan los demás jugadores, y es mejor que la
segunda acción para algunas acciones de los demás.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 86
s, 2003
ACCIONES DOMINADAS
Dominancia débil
Definición: Dominancia Débil
En un juego estratégico con preferencias ordinales, la acción domina débilmente si:

Decimos que la acción es débilmente dominadas.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 87
s, 2003
ACCIONES DOMINADAS
Dominancia débil
• En este juego: L R
• M domina débilmente a T.
• B domina débilmente a M. T 1 0
• B domina estrictamente a T.
M 2 0

B 2 1

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 88
s, 2003
ACCIONES DOMINADAS
Dominancia débil: Batalla de Bismack
• Japón transporta tropas a través del mar de Bismack y EEUU quiere
bombardearlas.
• Dos posibles rutas para Japón: Corta o Larga.
• EEUU tiene que decidir a donde enviar sus aviones.
• Quiere hacer el mayor daño posible.
• Si las manda por la ruta equivocada, puede corregir y comoquiera
bombardear las tropas. Sin embargo el daño será menor.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 89
s, 2003
ACCIONES DOMINADAS
Dominancia débil:
Batalla de Bismack Japón

• Para Japón, la ruta larga es Corta Larga


una estrategia débilmente Corta 2,-2 2,-2
dominada. EEUU
• Incluso si EEUU manda sus Larga 1,-1 3,-3
aviones a la ruta corta, el daño a
Japón es el mismo por el mayor
tramo de ruta.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 90
s, 2003
ACCIONES DOMINADAS
Dominancia débil:
Batalla de Bismack Japón

• Eliminamos la opción Larga Corta Larga


para Japón. Corta 2,-2 2,-2
EEUU
• EEUU escoge Corta.
Larga 1,-1 3,-3
• Equilibrio {Corta,Corta}
sucedió en la realidad.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 91
s, 2003
ACCIONES DOMINADAS
Dominancia débil
• En un equilibrio Nash estricto, ninguna acción es débilmente
dominada:
• Para cada jugador, el pago fuera del equilibrio es menos que en el
equilibrio.
• ¿Puede una acción débilmente dominada ser parte de un equilibrio
Nash no estricto?

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 92
s, 2003
ACCIONES DOMINADAS
Dominancia débil
• Si.
• En este juego B es dominada B C
débilmente por C para ambos
jugadores. B 1,1 0,0
• Pero (C,C) es un equilibrio
C 0,0 0,0
Nash.
• En el equilibrio (B,B) ninguna
acción es dominada.
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 93
s, 2003
ACCIONES DOMINADAS
Dominancia débil
• Eliminar estrategias débilmente dominadas de forma iterada puede
ser problemático.
• Puede haber más de un equilibrio.
• El orden en que las elimines importa.
• Podrías eliminar algo que es parte del equilibrio.

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 94
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una aplicación
 Experimento de B.A. Baldwin and G.B. Meese (1979) “Social
Behavior in Pigs Studied by Means of Operant
Conditioning,”Animal Behavior, Vol 27, pp 947-957.
 Dos cerdos en una jaula (uno es más grande)
 Necesitan presionar una palanca para obtener comida
 Palanca y comida están en lados opuestos de la jaula

 Si uno presiona palanca el otro llega primero a la comida

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 95
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una aplicación
 Los pagos: 10 unidades de comida
 Si el grande llega primero obtienen 1,9 (1 para el pequeño, 9 para el grande)
 Si el pequeño llega primero obtienen (4,6)
 Si ambos llegan a la comida al mismo tiempo (3,7)

 Presionar la palanca consume 2 unidades de comida en energía

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 96
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una
aplicación
 Si el grande llega primero
obtienen 1,9 (1 para el pequeño, Pequeño/Grande Presionar Esperar
9 para el grande) Presionar 1,5 -1 , 9
 Si el pequeño llega primero Esperar 4,4 0,0
obtienen (4,6)
 Si ambos llegan a la comida al
mismo tiempo (3,7)
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 97
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una
aplicación
 ¿Quién tiene una estrategia
dominada? Pequeño/Grande Presionar Esperar
Presionar 1,5 -1 , 9
Esperar 4,4 0,0

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 98
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una
aplicación
 ¿Quién tiene una estrategia
dominada? Pequeño/Grande Presionar Esperar
 El cerdo grande prefiere Esperar Presionar 1,5 -1 , 9
si el pequeño Presiona y Esperar 4,4 0,0
Presionar si pequeño espera
 El cerdo pequeño nunca le
conviene presionar (estrategia
estrictamente dominada)
Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 99
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una
aplicación
 ¿Cómo se comportan?
 Número de veces que presionan Solos Juntos
palanca cada 15 minutos, Cerdo Grande 75 105
después de 10 pruebas Cerdo Pequeño 70 5
(aprendizaje)

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 100
s, 2003
ACCIONES DOMINADAS
Dominancia estricta: una aplicación
 ¿Los cerdos son racionales? ¿Saben teoría de juegos?
 Si parecen responder a incentivos
 Aprenden a no jugar estrategias dominadas
 Aprendizaje, evolución y supervivencia del más apto son
herramientas importantes en la teoría de juegos

Elaboración propia con base en Osborne, Martin J., An introduction to Game Theory, Oxford University Pres 101
s, 2003

También podría gustarte