Está en la página 1de 7

El esquema de arbitraje de Nash y las soluciones cooperativas

En nuestro análisis de los juegos de suma no cero hasta este punto, los jugadores han jugado de
manera no cooperativa. Cada uno ha tratado de hacer lo mejor posible por sí mismo al elegir
estrategias o al hacer compromisos estratégicos, amenazas o promesas. En este capítulo
consideraremos un enfoque diferente. Imagine a los jugadores sentados juntos para decidir cuál
es un resultado razonable o justo para el juego, y luego acordar implementar ese resultado.
Alternativamente, imagine que los jugadores llaman a un árbitro externo imparcial para
determinar un resultado razonable y justo, y aceptan cumplir con su decisión. ¿Qué principios
deberían guiar a los jugadores o al árbitro externo en este contexto? ¿Podemos determinar un
resultado razonable y justo para un juego? Como ejemplo, considere

¿Cómo recomendarías a los jugadores que resuelvan este juego de manera justa? El consejo más
obvio podría ser que Rose y Colin elijan el resultado con el mayor pago total y luego lo dividan en
partes iguales. En este juego jugarían a Rose A-Colin B por un total de 15, y dividirían el pago para
obtener 7.5 cada uno. Llamemos a esto la propuesta igualitaria. A pesar de su atractivo
democrático, la propuesta igualitaria está viciada de dos maneras diferentes que ilustran
importantes sutilezas en nuestro problema. El primer defecto es que las ganancias en el juego se
supone que son utilidades. Como sabemos por el Capítulo 9 que las entidades de diferentes
jugadores no se pueden agregar de manera significativa, no podemos calcular la utilidad total "de
cada uno de nosotros, para elegir el total más grande. Dado que las utilidades de los diferentes
jugadores no se pueden comparar o transferir, no podemos dividirnos por igual. La propuesta
simplemente no tiene sentido. La segunda falla es que la propuesta igualitaria, incluso si
pudiéramos encontrar una manera de darle sentido, descuida las asimetrías de la posición
estratégica en el juego. En este juego, Colin tiene una posición estratégica fuerte. ya que Colin A
dona a Colin B y el resultado natural del juego es que Rose B Colin A. le da a Colin su mejor
resultado. Colin podría razonablemente argumentar que es injusto ignorar la realidad de su
posición estratégica superior para determinar un resultado justo para el juego

Por lo tanto, nuestro desafío es encontrar un método de arbitraje de juegos que implique una
manipulación ilegítima de las utilidades, que tenga en cuenta las desigualdades estratégicas y que
tenga un efecto de desmayo. La primera buena idea en este sentido se remonta a von Neumann y
Morgenstern 944]. Argumentaron que cualquier solución arbitrada razonable para un juego de
suma no nula debería ser

i) Pareto opimal. No debería haber otro resultado mejor para ambos jugadores, o mejor
para uno e igualmente bueno para el otro
ii) En o por encima el nivel de seguridad para ambos jugadores. Ninguno de los
jugadores debe ser obligado a aceptar menos de lo que podría garantizarse a sí mismo
mediante un juego no cooperativo. El conjunto de resultados (puros y mixtos) que
satisfacen estas dos condiciones se denomina conjunto de negociación del juego. En el
Juego 16.1 puede verificar que los niveles de seguridad son 10/3 para Rose, 6 para
Colin. Mirando el polígono de pagos Figura 16.1, vemos que los resultados óptimos de
Pareto son aquellos en el segmento de línea que une (4, 8) a (10.5). Por lo tanto, el
conjunto de negociación consiste en resultados en el segmento de línea trom (4, 8) a
(8,6). Éstas corresponden a las mezclas Rose y Colin plaving de BA y AB, y BA se juega
al menos la mayoría del tiempo. Tenga en cuenta que esta receta no implica agregar o
comparar servicios, y tiene en cuenta, a través de los niveles de seguridad, al menos
algo de Colin. ventaja estratégica en el juego. Por supuesto, solo especificamos una
serie de resultados razonables. ¿Podríamos elegir, dentro de ese rango, un solo
resultado como el más justo?

John Nash propuso una hermosa idea de cómo hacer esto [19501b Se conoce como el
esquema de arbitraje de Nash. Nash consideraba un problema más general. Supongamos que
dos partes negociadoras, Rose y Colin, tienen disponible una colección de resultados que.
cuando están representados en un plano de coordenadas por sus utilidades a Rose y Colin,
dan un polígono convexo. Las partes intentan ponerse de acuerdo sobre algún tema de este
conjunto. Si no están de acuerdo, obtendrán algo de "default"

Resultado en el polígono, llamado punto status quo. ¿Cómo podrían elegir un punto justo para
acordar? Un método general para resolver este problema debe tomar cualquier polígono
convexo en el planc, con un punto SQ de status quo en ese polígono, y producir un punto en el
polígono como solución. Un método que hace esto se llamará esquema de arbitraje. Nash
comenzó escribiendo cuatro axiomas (compárese con el Capítulo 10) que él creía que un
esquema de arbitraje razonable debería satisfacer AXIOM 1: RACIONALIDAD. El punto de
solución debe estar en el conjunto de negociación. AXIOM 2: INVARIANZA LINEAL. Si las
utilidades de Rose o de Colin se transforman mediante una función lineal positiva, el punto de
solución debe transformarse mediante la misma función. AXIOM 3: SIMETRÍA. Si el polígono
resulta ser simétrico con respecto a la línea de pendiente +1 a SQ. entonces el punto de
solución debería estar en esta línea. AXIOM 4: INDEPENDENCIA DE ALTERNATIVAS
IRRELEVANTES. Supongamos que N es el punto de solución para un polígono P con punto quo
status SQ. Supongamos que Q es otro polígono que contiene SQ y N, y está totalmente
contenido en P. Entonces, N también debería ser el punto de solución para Q con SQ de status
quo. Vea la Figura 16.2 para imágenes de los axiomas. Los tres primeros axiomas parecen
bastante sencillos. En particular, Axiom 3 encarna la idea de equidad como simetría o no
discriminación, en el caso especial de circunstancias completamente simétricas. Axioma 4. por
otro lado, es más complicado. Nash defendió

Axioma 4 de la siguiente manera. Supongamos que en la situación donde P es el conjunto de


alternativas disponibles y SQ es el status quo, Rose y Colin están de acuerdo en que N es el
resultado más justo posible. Ahora suponga que se descubre que algunos de los resultados en
P no están disponibles después de todo, el conjunto de resultados disponibles se reduce a.
Entonces, N, que fue juzgado más justo que todos los demás resultados en P, aún debería ser
más justo que todos los demás resultados en 2 Me parece convincente el argumento de Nash,
pero debemos ser claros sobre el tipo de cosas que excluye el Axioma 4. En la figura 16.3.
Supongamos que N es la solución al problema de arbitraje (EAC, SQ). Luego, por Axiom 4,
también debe ser la solución al problema (EAB, SQ). Pero si pensáramos que N era justo
porque parecía ser un compromiso razonable entre el punto C preferido de Rose y el punto A
preferido de Colin, ¿no sería más justo un punto como M si resulta que C no está disponible y
es lo mejor que puede Rose? esperanza para es B? Nash argumenta que si N era más justo que
M con Cavailable, aún es más justo si Cis no está disponible. El desvanecimiento no debe verse
afectado por la disponibilidad o indisponibilidad de alternativas poco realistas de pastel en el
cielo. No todos los que han considerado el problema están de acuerdo. Vea el Ejercicio 7 para
un enfoque diferente.

Si aceptamos aceptar los cuatro axiomas de Nash como condiciones que un esquema de arbitraje
debe cumplir. entonces el esquema de arbitraje que deberíamos usar está completamente
determinado, ya que Nash demostró el siguiente teorema notable:

TEOREMA [NASH, 1950B]. Hay un único esquema de arbitraje que satisface los axiomas 1 al 4. Es
este: Si SQ = (x_0, y_0), entonces el punto N de solución arbitrada es el punto (x, y) en el polígono
con x> = x_0 y y> = y_0 que maximiza el producto (x-x_0) (y-y_0).

(Si el valor máximo de este producto es positivo, el punto (x, y) se determina de forma única. Si el
máximo del producto es cero, debe ser porque y-y_0 o x-x_0 nunca son positivos. Si y- y_0 nunca
es positivo, el punto de solución se define como (x, y_0) donde x es el valor más grande, de modo
que este punto está en el polígono, y de manera similar, si x-x_0 nunca es positivo.)

El teorema es sorprendente en primer lugar debido a la declaración de unicidad: este esquema de


arbitraje es el único que satisfará los axiomas de Nash. En segundo lugar, es sorprendente porque
nos obliga a maximizar el producto de las ganancias de utilidad de los jugadores desde el punto del
status quo. Eso parece misterioso, pero note que encaja bien con el axioma 2. Si multiplicamos
todos los valores de x, digamos, por una constante positiva, el producto (x-x_0) (y-y_0) se
multiplicaría por esa constante, y el resultado que maximizó el producto antes todavía lo
maximizaría después. De hecho, es bastante fácil comprobar que este esquema de arbitraje
satisface los cuatro axiomas de Nash. Es un poco más difícil demostrar que es el único esquema
que lo hace, pero la prueba es bastante instructiva y vale la pena seguirla de cerca. PRUEBA.
Comenzamos con cualquier polígono 2, con el punto del status quo (x_0, y_0). Indica con N el
punto en Q con x≥x_0, y≥y_0 que maximiza el producto (x-x_0) (y- y_0). Debemos demostrar que
cualquier esquema de arbitraje que satisfaga los Axiomas 1-4 debe elegir N como el punto de
solución para esta situación. Usando Axioma 2, primero restamos x_0 de todas las utilidades x y de
y_0 de todas las utilidades y, de modo que el punto de status quo esté en (0,0). Luego,
multiplicamos las utilidades x y y por las constantes positivas, de modo que el punto N esté en
(1,1). Luego, por la propiedad de maximización del producto de N, todo el polígono Q debe estar
sobre o debajo de

(Si el punto de solución tiene x = x_0 o y = y_0 o ambos, se necesita un argumento diferente, pero
se lo dejo a usted)

la rama positiva de la hipérbola xy = 1 (ver Figura 16.4). De hecho, como la hipérbola es cóncava
hacia arriba y Q es convexa, Q debe estar sobre o debajo de la línea tangente a la hipérbola en
(1,1), que es la línea x + y = 2. Por lo tanto, podemos encerrar a Q en una el polígono P más grande
que tiene esta línea tangente como su límite noreste, y es simétrico con respecto a la línea x = y.
La relación se ilustra en la Figura 16.4. Ahora, por los axiomas 1 y 3, la solución al problema de
arbitraje (P, (0,0)) debe ser N. Luego, por el axioma 4, la solución al problema de arbitraje (Q, (0,0))
también debe ser N , y hemos terminado! Observe cómo cada uno de los axiomas entra en juego
en este argumento, y en particular el poderoso papel del Axioma 4 al final. Además de la elegancia
teórica de su prueba, la solución de Nash al problema del arbitraje tiene la ventaja de ser fácil de
calcular. Consideraremos dos ejemplos. EJEMPLO 1. Suponga que Rose y Colin deben estar de
acuerdo con uno de los resultados A = (0,0), B = (2,0), C = (4,2), D = (1,5), o alguna probabilidad
Mezcla de estos resultados. Los números para cada resultado son, por supuesto, las utilidades de
Rose y Colin para ese resultado. Si no pueden ponerse de acuerdo, el resultado será SQ = (2,1).
Como árbitro de Nash, ¿qué propugnaría por una solución justa? La situación se ilustra en la figura
16,5a. El punto de Nash debe estar en el conjunto de negociación, que es el segmento de línea de
(2, 4) a (4,2). Es el punto en este segmento de línea que maximiza el producto (x- 2) (y -1). Como la
ecuación del segmento de línea es y = 6- x (2≤ x ≤4), la expresión que debemos maximizar es (x - 2)
(6-x-1) = - x ^ 2 + 7x - 10 Para el expresión cuadrática general -ax ^ 2 + bx + c (a≥0) puede usar el
cálculo si lo sabe, o completar el cuadrado si no lo hace, para encontrar que el máximo ocurre en x
= b / 2a. Por lo tanto, para nuestro problema, el máximo es x = 7/2. y y = 6-7 / 2 = 5/2. Esto es 5 /
6C + 1 / 6D, que es lo que debe recomendar como solución. Este problema tiene la propiedad
especial de que el límite óptimo de Pareto es un segmento de pendiente -1. Cuando eso es cierto,
hay una forma geométrica fácil de encontrar el punto de solución de Nash: comience en SQ y viaje
al noreste hasta que llegue al límite, y ese punto será el punto de Nash (consulte la Figura 16.5a).
En los ejercicios se le pide que explique por qué esto es cierto y que averigüe qué sucede cuando
el conjunto de negociación se encuentra en una línea de pendiente distinta de -1. EJEMPLO 2.
Supongamos que las alternativas son A = (1, 😎, B = (6,7), C = (8,6), D = (9,5), E = (10,3), F = (11, -1),
G = (- 1, -1) y el status quo es SQ = (2, 1). ¿Cuál es el punto de solución de Nash? La situación se
ilustra en la Figura 16.5b. El conjunto de negociación es una colección de segmentos de línea. Para
tener una idea de dónde puede estar el punto de solución, calculamos

(x-2) (y-1) para los puntos de esquina del conjunto de negociación:


Como C tiene el producto más grande, el punto de solución estará en uno de los dos segmentos de
línea BC o CD. La línea que contiene BC tiene la ecuación y = 10- 1 / 2x, por lo que debemos
maximizar

El máximo se produce en x = 10, que está más allá del extremo C del segmento de línea BC. Por lo
tanto, el máximo en este segmento de línea se encuentra en el punto final C. De manera similar,
puede verificar (Ejercicio 3) que el máximo de (x-2) (y-1) en el CD del segmento de línea se
produce en el punto final C. Por lo tanto, C es El punto de solución de Nash. Con la solución de
Nash al problema de arbitraje general en la mano, podemos considerar nuestro problema original
de encontrar una solución arbitrada justa para un juego de suma no nula. El polígono de pagos del
juego nos da el polígono para un problema de arbitraje. Para encontrar el punto del status quo,
tenemos que preguntar qué sucederá si el arbitraje falla. Una posibilidad es admitir que no
sabemos qué sucederá, excepto que cada jugador puede garantizar al menos su nivel de
seguridad. Por lo tanto, podríamos tomar como el status quo el punto cuyas coordenadas son los
niveles de seguridad de Rose y Colin. Para el Juego 16.1 tomaríamos SQ = (3 1 / 3,6). La solución
arbitrada de Nash resulta ser (5 2/3, 7 1/6), o 13/18 BA + 5 / 18AB (Ejercicio 1). Recomendaríamos
a los jugadores que acepten jugar BA con probabilidad 13/18, AB con probabilidad 5/18. Si
estuvieran jugando el juego muchas veces, podrían jugar BA 13/18 del tiempo, AB 5/18 del tiempo

También podría gustarte