Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La forma más fácil de escribir estrategias es armar las etiquetas correspondientes a las
acciones a elegir en cada conjunto de información. Por ejemplo, para el juego que se muestra
en la figura 2.7(a), una estrategia para el jugador 2 es seleccionar el precio alto (H) en el
conjunto de información superior y el precio bajo (Lÿ) en el conjunto de información inferior;
esta estrategia se puede escribir HLÿ. Tenga en cuenta que hay cuatro estrategias para el
jugador 2 en este juego: HHÿ, HLÿ, LHÿ y LLÿ. También tenga en cuenta que escribir
estrategias de esta manera sería difícil si no usáramos diferentes etiquetas para los diversos
conjuntos de información de un jugador. Por ejemplo, si escribiera H y L en lugar de Hÿ
y Lÿen el conjunto de información inferior del jugador 2, “HL” sería ambiguo (¿es H en el
conjunto de información superior y L en el inferior, o viceversa?).
22
Machine Translated by Google
Ahora es el momento de familiarizarse con alguna notación estándar. Si necesita ayuda para
comprender los conceptos y símbolos matemáticos básicos que se utilizan aquí, consulte el
Apéndice A. Debemos ser formales y precisos en el futuro.
Dado un juego, hacemos que Si denote el espacio de estrategia (también llamado conjunto
de estrategia) del jugador i. Es decir, Si es un conjunto que comprende cada una de las posibles
estrategias del jugador i en el juego. Para el juego que se muestra en la figura 2.7(a), el espacio
de estrategia del jugador 1 es S1 = {H, L}, y el espacio de estrategia del jugador 2 es S2 = {HHÿ,
HLÿ, LHÿ, LLÿ}. Usamos letras minúsculas para denotar estrategias únicas (miembros genéricos
de estos conjuntos). Así, si ÿ Si es una estrategia para el jugador i en el juego. Así podríamos
tener s1 = L y s2 = LHÿ, por ejemplo.
Un perfil de estrategia es un vector de estrategias, una para cada jugador. En otras palabras,
un perfil de estrategia describe estrategias para todos los jugadores del juego.
Por ejemplo, supongamos que estamos estudiando un juego con n jugadores. Entonces, un perfil
de estrategia típico es un vector s = (s1, s2, c, sn), donde si es la estrategia del jugador i, para i
= 1, 2, c, n. Sea S el conjunto
S2 × c ×de
Sn.perfiles
Tengade enestrategia.
cuenta queMatemáticamente, escribimos
el símbolo “×” denota S = S1 ×
el producto
cartesiano.1
Dado un solo jugador i, a menudo necesitamos hablar de las estrategias elegidas por todos
los otros jugadores en el juego. Como cuestión de notación, será conveniente usar el término ÿi
para referirnos a estos jugadores. Por lo tanto, sÿi es un perfil de estrategia para todos excepto
para el jugador i:
Considere los ejemplos ilustrados en las Figuras 3.1 y 3.2. El juego de la figura 3.1(a)
modela un escenario en el que una empresa puede o no salir de una industria competitiva. La
empresa 1 decide si ser agresiva en el mercado (A), ser pasiva en el mercado (P) o abandonar
el mercado (O). Si la empresa 1 se va, la empresa 2 disfruta de un monopolio. De lo contrario,
las empresas compiten y la empresa 2 elige si asume o no una postura agresiva. Además,
cuando la empresa 2 toma su decisión,
1
Por ejemplo, si S1 = {A, B} y S2 = {X, Y}, entonces S = S1 × S2 = {(A, X), (A, Y), (B, X), (B, Y )}.
2
Tenga en cuenta que expresiones como s = (s2, sÿ2) pueden crear cierta ambigüedad porque reordenan los componentes
individuales de los jugadores; la ambigüedad generalmente se puede evitar con comentarios aclaratorios.
Machine Translated by Google
O PAGS 2, 2
0, 4
1 yo 2 yo 1 A
(b) 4, 2
O O B
2, 2 1, 3 3, 4
S1 = {OA, OB, IA, IB}
S2 = {O, yo}
solo sabe si la empresa 1 está dentro o fuera del mercado; la empresa 2 no observa la
postura competitiva de la empresa l antes de tomar su acción. En este juego, hay un
conjunto de información para la empresa 1 (el nodo inicial) y otro para la empresa 2. Los
conjuntos de estrategias son S1 = {A, P, O} y S2 = {A, P}.
En el juego de la Figura 3.1(b), el jugador 1 decide entre “fuera” (O) y “dentro”
(YO). Si elige O, entonces el juego termina con un vector de pago de (2, 2). Si selecciona I,
entonces el jugador 2 se enfrenta a las mismas dos opciones. Si el jugador 2 elige O, el
juego termina con el vector de pago (1, 3). Si elige I, entonces el jugador 1 tiene otra
elección entre A y B (terminando el juego con pagos (4, 2) y (3, 4), respectivamente). El
jugador 1 tiene dos conjuntos de información y el jugador 2 tiene un conjunto de información.
Tenga en cuenta que en este juego, la estrategia del jugador 1 debe especificar qué hará al
comienzo del juego (O o I) y qué acción tomaría en su segundo conjunto de información (A
o B). Hay cuatro combinaciones de las dos acciones en cada conjunto de información, por
lo que hay cuatro estrategias diferentes para el jugador 1: OA, OB, IA e IB.
En este punto, puede ver que el "plan contingente completo" significa más que solo un
"plan" sobre cómo jugar el juego. De hecho, podría preguntarse por qué el jugador 1 en el
juego que se muestra en la figura 3.1(b) necesita un plan para su segundo conjunto de
información si selecciona O en el primero. ¿No podemos simplemente decir que el jugador
1 tiene tres estrategias diferentes, O, IA e IB? De hecho, no. La definición de una estrategia
(un plan contingente completo) requiere una especificación de la elección del jugador 1 en
su segundo conjunto de información incluso en la situación en la que planea seleccionar O en su
Machine Translated by Google
Figura 3.2 R
3 9, 2, 5
Algunos juegos en forma extensiva II.
A
2 T 2, 4, 4
PAGS
0, 5, 4
EN
B 3
1 q 3, 0, 0
PAGS
2, 2, 2
C
D
2 q 1, 2, 2
Y S1 = {U, D}
6, 3, 2
S2 = {AC, AE, BC, BE}
(a) S3 = {PR, RQ, TP, TQ}
X 2, 5
2
A Y 5, 2
X 5, 2
1 B S1 = {AW, BW, CW, AZ, BZ, CZ}
S2 = {X, Y}
Y 2, 5
C en 2, 2
1
(b) DE 3, 3
Otra razón por la que es importante especificar un plan contingente completo es que los
jugadores pueden cometer errores en el transcurso del juego. Por ejemplo, suponga que usted
es el jugador 1 en el juego que se muestra en la Figura 3.1(b). Además, suponga que le estoy
instruyendo sobre cómo jugar este juego. Podría escribir instrucciones en un papel, entregarte el
papel y luego irme de la ciudad antes de que comience el juego. Podría escribir "seleccione O",
pero, aunque esa instrucción parece ser suficiente información por adelantado, no le brinda
suficiente orientación. Puede cometer un error y seleccionar I en lugar de O al comienzo del juego.
¿Qué pasa si el jugador 2 elige a I? Ahí estás, con la cara roja e indignada, gritando al cielo:
"¿Ahora qué se supone que debo hacer?"
Examine los otros ejemplos en la Figura 3.2 para solidificar su comprensión de la estrategia.
Tenga en cuenta que, según sea necesario, he usado diferentes etiquetas para describir las
acciones que se pueden tomar en diferentes conjuntos de información.
Para otro ejemplo que lo ayude a comprender la noción de plan contingente completo,
considere un entorno en el que dos jugadores tienen que decidir cuánto contribuir a un proyecto
de caridad. Suponga que se sabe que el proyecto tendrá éxito si y sólo si la suma de las
contribuciones de los jugadores es de al menos $900.
Además, los jugadores saben que cada uno tiene $600 disponibles para contribuir. Los jugadores
hacen contribuciones secuencialmente. En la primera etapa, el jugador 1 selecciona su
contribución x ÿ [0, 600] y el jugador 2 observa esta elección. Luego, en la segunda etapa, el
jugador 2 selecciona su contribución y ÿ [0, 600]. Si el proyecto tiene éxito, el pago del jugador 1
es 800 ÿ x y el pago del jugador 2 es 800 ÿ y. Aquí, 800 es el beneficio que cada jugador obtiene
del proyecto exitoso. Si el proyecto no tiene éxito, el jugador 1 obtiene ÿx y el jugador 2 obtiene
ÿy.
Tenga en cuenta cuántos conjuntos de información tiene cada jugador en este juego de contribución.
El jugador 1 tiene solo un conjunto de información (el nodo inicial), y la estrategia de este jugador
es simplemente un número entre 0 y 600. Por lo tanto, S1 = [0, 600]. El jugador 2, por otro lado,
tiene un número infinito de conjuntos de información, cada uno asociado con un valor diferente
de x seleccionado por el jugador 1. En cada uno de estos conjuntos de información (cada uno un
nodo único), el jugador 2 debe elegir un nivel de contribución .
Por ejemplo, la estrategia del jugador 2 debe describir la cantidad que contribuiría con la
condición de que el jugador 1 elija x = 500, la cantidad con la que contribuiría con la condición de
que x = 400, y así sucesivamente, para cada valor de x entre 0 y 600.
Hay una manera matemática simple de expresar la estrategia del jugador 2. Es una función s2:
[0, 600] S [0, 600], tal que, para cualquier x dada, el jugador 2 selecciona y = s2(x).
La forma normal
La forma extensiva es una forma sencilla de representar un juego. Otra forma de describir
formalmente los juegos se basa en la idea de estrategias. Se denomina a la forma normal (o
forma estratégica) de representación de un juego. esta alternativa
Machine Translated by Google
La forma normal 27
Para cada jugador i, podemos definir una función ui : S S R (una función cuyo dominio es
el conjunto de perfiles de estrategia y cuyo rango son los números reales) de modo que, para
cada perfil de estrategia s ÿ S que los jugadores podrían elegir, ui(s) es el pago del jugador i en
el juego. Esta función ui se llama función de pago del jugador i . Como ejemplo, tome el juego
representado en la Figura 3.1(b). El conjunto de perfiles de estrategia en este juego es
S = {(OA, O), (OA, I), (OB, O), (OB, I), (IA, O), (IA, I), (IB, O), (IB, I) }.
Las funciones de pago de los jugadores se definen sobre S. Para determinar ui(s) para cualquier
perfil de estrategia s, simplemente comience en el nodo inicial y rastree el árbol de acuerdo con
las acciones especificadas por este perfil de estrategia. Por ejemplo, u1(OA, O) = 2, u1(IA, I) =
4, u2(IA, O) = 3, y así sucesivamente.3
Una forma conveniente de describir los espacios de estrategia de los jugadores y sus
funciones de pago para juegos de dos jugadores en los que cada jugador tiene un número finito
de estrategias es dibujar una matriz. Cada fila de la matriz corresponde a una estrategia del
jugador 1, y cada columna corresponde a una estrategia del jugador 2. Así, cada celda de la
matriz (que designa una única fila y columna) corresponde a un perfil de estrategia. Dentro de
una celda dada, escribimos el vector de pago asociado con el perfil de la estrategia. Por ejemplo,
el juego que se muestra en la figura 3.1(b) se describe mediante la matriz de la figura 3.3. En la
representación matricial, mantenemos la práctica de poner primero el pago del jugador l.
3
Debido a que usamos convenciones de notación como s = (s1, s2), es más apropiado escribir ui(s) = ui((s1, s2))
que escribir ui(s) = ui(s1, s2). Sin embargo, esto último es completamente estándar en el discurso matemático, por lo que me
abstengo de usar los paréntesis dobles excepto cuando ayuda a evitar confusiones. Verá su uso unas cuantas veces en el libro
de texto.
4
De hecho, a menudo es más fácil analizar un juego sin tener que considerar una estructura de árbol.
Machine Translated by Google
Figura 3.3 2
1 yo O
Un juego en forma normal.
OH 2, 2 2, 2
transmisión exterior
2, 2 2, 2
IA 4, 2 1, 3
BI 3, 4 1, 3
5
jugadores, S1, S2 , c, Sn, y funciones de pago para los jugadores, u1 , u2, c, un. Como
Como se señaló anteriormente, los juegos de forma normal para dos jugadores con espacios de estrategia
finitos se pueden describir mediante matrices. Por lo tanto, estos juegos a veces se denominan "juegos de matriz".6
En la figura 3.4 se representan algunos juegos clásicos en forma normal. En el juego de emparejar centavos,
dos jugadores seleccionan simultáneamente e independientemente "cara" o "cruz" al descubrir cada uno un
centavo en su mano. Si sus selecciones coinciden, entonces el jugador 2 debe darle su centavo al jugador 1;
de lo contrario, el jugador 1 le da su centavo al jugador 2.
El dilema de los prisioneros es un ejemplo bien conocido y está motivado por la siguiente historia. Las
autoridades han capturado a dos delincuentes que saben que son culpables de un determinado delito. Sin
embargo, las autoridades solo tienen pruebas suficientes para condenarlos por un delito menor. Si ninguno de
los delincuentes admite el delito, ambos serán acusados del delito menor y pagarán una multa moderada. Las
autoridades han colocado a los presos en habitaciones separadas, donde se le pide a cada preso que se burle
del otro. Chillar corresponde a la estrategia D (defecto), y no chillar corresponde a la estrategia C (cooperar con
el otro prisionero).
5
La forma normal fue definida por primera vez por J. von Neumann y O. Morgenstern, Theory of Games and Economic Behavior
(Princeton, NJ: Princeton University Press, 1944). Por cierto, también se pueden ver juegos con un número infinito de jugadores, en
cuyo caso los jugadores están en algún conjunto general N.
6
Los juegos con un número infinito de estrategias son difíciles de representar con un diagrama, incluso en forma extensa. Una
recomendación aparece en el Capítulo 14.
7
Se dice que el resultado (A, A) “domina en el sentido de Pareto” (B, B). Este criterio se define en el Capítulo 6.
Machine Translated by Google
2 2 2
1 H T 1 C D 1 Película
Ópera
H 1, -1 -1, 1 C 2, 2 0, 3 Ópera 2, 1 0, 0
T -1, 1 1, -1 D 3, 0 1, 1 Película 0, 0 1, 2
2 2
1 H D 1 A B
H 0, 0 3, 1 A 1, 1 0, 0
D 1, 3 2, 2 B 0, 0 1, 1
Halcón-Paloma/Pollo Coordinación
2 S
1 D
A B PAGS D
A 2, 2 0, 0 PAGS 4, 2 2, 3
B 0, 0 1, 1 D 6, -1 0, 0
8
Quienes describieron por primera vez este juego lo llamaron el "dilema del prisionero". Prefiero la forma plural para
resaltar que es una situación estratégica. Para un relato temprano de este juego y la batalla de los sexos, véase RD Luce
y H. Raiffa, Games and Decisions (Nueva York: Wiley, 1957).
Machine Translated by Google
El juego de los cerdos se refiere a una situación en la que un cerdo dominante y otro
sumiso comparten un corral. En un lado del corral hay un botón grande que, si se presiona,
libera comida en un plato en el otro lado del corral. Cada cerdo tiene la opción de presionar
el botón (P) o no (D). Si ninguno empuja, los cerdos pasan hambre. Si el cerdo sumiso
presiona el botón y el dominante no lo hace, el cerdo dominante se come toda la comida
liberada porque llega primero a la comida. (Aquí, el cerdo sumiso está aún peor que si
ninguno de los dos jugara P, porque hizo el esfuerzo de presionar el botón pero no recibió
comida). Si el cerdo dominante presiona el botón, entonces el cerdo sumiso puede disfrutar
algo de la comida antes que el cerdo. el dominante llega al plato.10
Una forma de ver la forma normal es que modela una situación en la que los jugadores
seleccionan planes contingentes completos de manera simultánea e independiente para un
juego de forma extensiva. Los teóricos a veces ven la selección de estrategias de esta
manera como equivalente al juego en tiempo real de la forma extensiva, pero hay algunas
sutilezas a considerar, que haremos en la tercera parte de este libro. En un nivel más
tangible, debido a que ha visto cómo convertir un juego de forma extensiva a la forma normal,
puede preguntar si existe un procedimiento para convertir juegos de forma normal a la forma
extensiva. Para ver por qué esta conversión no es tan sencilla, considere la forma normal y
las formas extensivas contenidas en la figura 3.5. Ambas formas extensivas producen la
misma forma normal (un hecho que usted
9
En Rebelde sin causa, los jugadores en realidad conducen hacia un acantilado. Mi descripción del juego del pollo describe
con mayor precisión la escena del pollo en la película Footloose de Kevin Bacon de 1984.
10El juego de los cerdos está inspirado en BA Baldwin y GB Meese, “Social Behavior in Pigs Studyed by Means of Operant
Conditioning,” Animal Behavior 27(1979):947–957.
Machine Translated by Google
Ejercicio Guiado 31
A 1, 2
2
1 1 C D
C 3, 1
B 2
A 1, 2 1, 2
D 2, 4
B 3, 1 2, 4
C 1, 2
2
A
1 D 1, 2
C 3, 1
B
D 2, 4
debe comprobar). Esto demuestra que, aunque puede haber una sola forma de pasar de la forma
extensiva a la forma normal, la inversa no es cierta.
Además, las formas extensivas de la figura 3.5 tienen diferentes estructuras informativas. En uno,
el jugador 2 sabe que el jugador 1 no seleccionó A cuando el jugador 2 tiene que decidir entre C
y D. En el otro, el jugador 2 no tiene esa información.
Los teóricos de los juegos han debatido si la forma normal contiene todos los
información relevante sobre escenarios estratégicos. Sin revisar los argumentos, debe darse
cuenta de que no hay discrepancia entre las formas normal y extensiva en escenarios en los que
los jugadores toman todas sus decisiones antes de observar lo que hacen otros jugadores, como
es el caso de los movimientos simultáneos e independientes. Dichos juegos se denominan juegos
de "una sola vez" o "estáticos" y obviamente están bien modelados en la forma normal.
Ejercicio Guiado
Solución: Recuerde que una estrategia para el jugador i debe describir la acción a realizar en
cada uno de los conjuntos de información del jugador i. Al examinar la figura 2.6, que muestra la
forma extensiva del juego Katzenberg-Eisner, vemos que Katzenberg (el jugador K) tiene tres
conjuntos de información. En su primer conjunto de información (el nodo inicial), el jugador K
selecciona entre las acciones L y S. En su segundo conjunto de información,
Machine Translated by Google
elige entre P y N. En su tercer conjunto de información, elige entre R y Nÿ. Así, una estrategia para el
jugador K es una combinación de tres acciones, una para cada uno de sus conjuntos de información.
Un ejemplo de una estrategia es LNR, que es una estrategia útil a considerar porque ilustra que
incluso si el jugador K selecciona N en su segundo conjunto de información (lo que impide que se
alcance su tercer conjunto de información), su estrategia aún debe describir qué haría en su tercer
conjunto de información. Debido a que el jugador K tiene dos alternativas en cada uno de los tres
conjuntos de información, hay 2 # 2 # 2 = 8 combinaciones diferentes, por lo tanto, ocho estrategias
diferentes. El espacio de estrategia del jugador K es
EE = {P, N}.
Para dibujar la matriz de forma normal, primero debe tener en cuenta que debe tener ocho filas
(para las ocho estrategias diferentes del jugador K) y dos columnas (para las dos estrategias del
jugador E). Mirando cada perfil de estrategia individual, puede rastrear a través del formulario extenso
para encontrar el vector de pago asociado. Por ejemplo, considere el perfil de estrategia (LNNÿ, P).
Con este perfil de estrategia, el juego procede del nodo inicial al nodo b, luego al nodo c (ver Figura
2.5), y termina en el nodo terminal con el vector de pago (0, 140). La matriz en forma normal completa
es
Y
k PAGS norte
ARCO 0, 140 0, 0
LNNÿ 0, 140 0, 0