Cap 3 Watson

Machine Translated by Google
3 estrategias y la forma normal
El concepto más importante

La definición en la teoría de juegos es la noción de estrategia.
formal es simple:
Una estrategia es un plan contingente completo para un jugador en el juego.
La parte "completamente contingente" de esta definición es lo que la hace poderosa y, para

algunas personas, un poco confusa. Por plan contingente completo me refiero a una
especificación completa del comportamiento de un jugador, que describe las acciones que el
jugador tomaría en cada uno de sus posibles puntos de decisión. Dado que los conjuntos de
información representan lugares del juego en los que los jugadores toman decisiones, la
estrategia de un jugador describe lo que hará en cada uno de sus conjuntos de información.
Considere el juego Katzenberg-Eisner representado en la figura 2.5 y póngase en el
lugar de Katzenberg. Su estrategia debe incluir qué hacer en el conjunto de información
proporcionado por el nodo a, qué, acción
sería su
elegiría
elección
en en
el conjunto
el conjunto
de de
información
información
c–dproporcionado
y cuál
por el nodo e. Su estrategia debe especificar todas estas cosas incluso si planea seleccionar
"Permanecer" en el nodo a. (Este punto se desarrolla más adelante en este capítulo). Como
otro ejemplo, en el juego representado en la Figura 2.7(a), la estrategia del jugador 2 nos dice
qué hará este jugador en su nodo superior (un conjunto de información) y en su nodo inferior.
(otro conjunto de información). En palabras, en este juego, una estrategia para el jugador 2
especifica qué precio elegir en respuesta a H seleccionado por el jugador 1, así como qué
precio elegir en respuesta a la selección de L por parte del jugador 1.
La forma más fácil de escribir estrategias es armar las etiquetas correspondientes a las
acciones a elegir en cada conjunto de información. Por ejemplo, para el juego que se muestra
en la figura 2.7(a), una estrategia para el jugador 2 es seleccionar el precio alto (H) en el
conjunto de información superior y el precio bajo (Lÿ) en el conjunto de información inferior;
esta estrategia se puede escribir HLÿ. Tenga en cuenta que hay cuatro estrategias para el
jugador 2 en este juego: HHÿ, HLÿ, LHÿ y LLÿ. También tenga en cuenta que escribir
estrategias de esta manera sería difícil si no usáramos diferentes etiquetas para los diversos
conjuntos de información de un jugador. Por ejemplo, si escribiera H y L en lugar de Hÿ
y Lÿen el conjunto de información inferior del jugador 2, “HL” sería ambiguo (¿es H en el
conjunto de información superior y L en el inferior, o viceversa?).
22
Terminología y notación para estrategias 23
Terminología y notación para estrategias
Ahora es el momento de familiarizarse con alguna notación estándar. Si necesita ayuda para
comprender los conceptos y símbolos matemáticos básicos que se utilizan aquí, consulte el
Apéndice A. Debemos ser formales y precisos en el futuro.
Dado un juego, hacemos que Si denote el espacio de estrategia (también llamado conjunto
de estrategia) del jugador i. Es decir, Si es un conjunto que comprende cada una de las posibles
estrategias del jugador i en el juego. Para el juego que se muestra en la figura 2.7(a), el espacio
de estrategia del jugador 1 es S1 = {H, L}, y el espacio de estrategia del jugador 2 es S2 = {HHÿ,
HLÿ, LHÿ, LLÿ}. Usamos letras minúsculas para denotar estrategias únicas (miembros genéricos
de estos conjuntos). Así, si ÿ Si es una estrategia para el jugador i en el juego. Así podríamos
tener s1 = L y s2 = LHÿ, por ejemplo.
Un perfil de estrategia es un vector de estrategias, una para cada jugador. En otras palabras,
un perfil de estrategia describe estrategias para todos los jugadores del juego.
Por ejemplo, supongamos que estamos estudiando un juego con n jugadores. Entonces, un perfil
de estrategia típico es un vector s = (s1, s2, c, sn), donde si es la estrategia del jugador i, para i
= 1, 2, c, n. Sea S el conjunto
S2 × c ×de
Sn.perfiles
Tengade enestrategia.
cuenta queMatemáticamente, escribimos
el símbolo “×” denota S = S1 ×
el producto
cartesiano.1
Dado un solo jugador i, a menudo necesitamos hablar de las estrategias elegidas por todos
los otros jugadores en el juego. Como cuestión de notación, será conveniente usar el término ÿi
para referirnos a estos jugadores. Por lo tanto, sÿi es un perfil de estrategia para todos excepto
para el jugador i:
sÿi = (s1, s2, c, siÿ1, si+1, c, sn).

Separando un perfil de estrategia s en la estrategia del jugador i y las estrategias de los otros
jugadores, escribimos s = (si , sÿi). Por ejemplo, en un juego de tres jugadores con el perfil de
2
estrategia s = (B, X, Y), tenemos sÿ2 = (B, Y). Por cierto, a
veces me refiero a los jugadores “ÿi”que
como
estalos oponentes
expresión no del jugador i, pero
es literalmente tenga enpara
descriptiva cuenta
todas
las situaciones estratégicas porque muchos juegos tienen elementos cooperativos.
Considere los ejemplos ilustrados en las Figuras 3.1 y 3.2. El juego de la figura 3.1(a)
modela un escenario en el que una empresa puede o no salir de una industria competitiva. La
empresa 1 decide si ser agresiva en el mercado (A), ser pasiva en el mercado (P) o abandonar
el mercado (O). Si la empresa 1 se va, la empresa 2 disfruta de un monopolio. De lo contrario,
las empresas compiten y la empresa 2 elige si asume o no una postura agresiva. Además,
cuando la empresa 2 toma su decisión,
1
Por ejemplo, si S1 = {A, B} y S2 = {X, Y}, entonces S = S1 × S2 = {(A, X), (A, Y), (B, X), (B, Y )}.
2
Tenga en cuenta que expresiones como s = (s2, sÿ2) pueden crear cierta ambigüedad porque reordenan los componentes
individuales de los jugadores; la ambigüedad generalmente se puede evitar con comentarios aclaratorios.
24 3: Estrategias y la Forma Normal
Figura 3.1 Algunos A

2 3, 3
Juegos en forma extensiva I.
A
1 PAGS 4, 2
(a)
A 2, 4
PAGS
O PAGS 2, 2
0, 4
1 yo 2 yo 1 A
(b) 4, 2
O O B
2, 2 1, 3 3, 4
S1 = {OA, OB, IA, IB}
S2 = {O, yo}
solo sabe si la empresa 1 está dentro o fuera del mercado; la empresa 2 no observa la
postura competitiva de la empresa l antes de tomar su acción. En este juego, hay un
conjunto de información para la empresa 1 (el nodo inicial) y otro para la empresa 2. Los
conjuntos de estrategias son S1 = {A, P, O} y S2 = {A, P}.
En el juego de la Figura 3.1(b), el jugador 1 decide entre “fuera” (O) y “dentro”
(YO). Si elige O, entonces el juego termina con un vector de pago de (2, 2). Si selecciona I,
entonces el jugador 2 se enfrenta a las mismas dos opciones. Si el jugador 2 elige O, el
juego termina con el vector de pago (1, 3). Si elige I, entonces el jugador 1 tiene otra
elección entre A y B (terminando el juego con pagos (4, 2) y (3, 4), respectivamente). El
jugador 1 tiene dos conjuntos de información y el jugador 2 tiene un conjunto de información.
Tenga en cuenta que en este juego, la estrategia del jugador 1 debe especificar qué hará al
comienzo del juego (O o I) y qué acción tomaría en su segundo conjunto de información (A
o B). Hay cuatro combinaciones de las dos acciones en cada conjunto de información, por
lo que hay cuatro estrategias diferentes para el jugador 1: OA, OB, IA e IB.
En este punto, puede ver que el "plan contingente completo" significa más que solo un
"plan" sobre cómo jugar el juego. De hecho, podría preguntarse por qué el jugador 1 en el
juego que se muestra en la figura 3.1(b) necesita un plan para su segundo conjunto de
información si selecciona O en el primero. ¿No podemos simplemente decir que el jugador
1 tiene tres estrategias diferentes, O, IA e IB? De hecho, no. La definición de una estrategia
(un plan contingente completo) requiere una especificación de la elección del jugador 1 en
su segundo conjunto de información incluso en la situación en la que planea seleccionar O en su
Terminología y notación para estrategias 25
Figura 3.2 R
3 9, 2, 5
Algunos juegos en forma extensiva II.
A
2 T 2, 4, 4
PAGS
0, 5, 4
EN
B 3
1 q 3, 0, 0
PAGS
2, 2, 2
C
D
2 q 1, 2, 2
Y S1 = {U, D}
6, 3, 2
S2 = {AC, AE, BC, BE}
(a) S3 = {PR, RQ, TP, TQ}
X 2, 5
2
A Y 5, 2
X 5, 2
1 B S1 = {AW, BW, CW, AZ, BZ, CZ}
S2 = {X, Y}
Y 2, 5
C en 2, 2
1
(b) DE 3, 3
primer conjunto de información. Además, realmente necesitaremos realizar un seguimiento del

comportamiento en todos los conjuntos de información, incluso aquellos que no se alcanzarían si los
jugadores siguieran sus estrategias, para analizar completamente cualquier juego. Es decir, afirmar que
el plan del jugador 1 es "O" no proporciona suficiente información para que podamos realizar un análisis exhaustivo.
Una razón para esto es que nuestro estudio de la racionalidad requerirá explícitamente la
evaluación de los movimientos óptimos de los jugadores a partir de puntos arbitrarios en un juego.
Esta evaluación está conectada con las creencias que los jugadores tienen unos de otros.
Por ejemplo, en el juego representado en la figura 3.1(b), la elección óptima del jugador 1 en su primer
conjunto de información depende de lo que cree que haría el jugador 2 si se le pusiera en movimiento.
Además, para seleccionar el mejor curso de acción, el perspicaz jugador 2 debe considerar qué haría el
jugador 1 en su segundo conjunto de información. Por lo tanto, el jugador 2 debe formarse una creencia
sobre la acción del jugador 1 en el tercer nodo. Una creencia es una conjetura sobre qué estrategia está
usando el otro jugador; por lo tanto, la estrategia del jugador 1 debe incluir una prescripción para su
segundo conjunto de información, independientemente de lo que prescriba esta estrategia para su
primer conjunto de información.
Otra razón por la que es importante especificar un plan contingente completo es que los
jugadores pueden cometer errores en el transcurso del juego. Por ejemplo, suponga que usted
es el jugador 1 en el juego que se muestra en la Figura 3.1(b). Además, suponga que le estoy
instruyendo sobre cómo jugar este juego. Podría escribir instrucciones en un papel, entregarte el
papel y luego irme de la ciudad antes de que comience el juego. Podría escribir "seleccione O",
pero, aunque esa instrucción parece ser suficiente información por adelantado, no le brinda
suficiente orientación. Puede cometer un error y seleccionar I en lugar de O al comienzo del juego.
¿Qué pasa si el jugador 2 elige a I? Ahí estás, con la cara roja e indignada, gritando al cielo:
"¿Ahora qué se supone que debo hacer?"
Examine los otros ejemplos en la Figura 3.2 para solidificar su comprensión de la estrategia.
Tenga en cuenta que, según sea necesario, he usado diferentes etiquetas para describir las
acciones que se pueden tomar en diferentes conjuntos de información.
Para otro ejemplo que lo ayude a comprender la noción de plan contingente completo,
considere un entorno en el que dos jugadores tienen que decidir cuánto contribuir a un proyecto
de caridad. Suponga que se sabe que el proyecto tendrá éxito si y sólo si la suma de las
contribuciones de los jugadores es de al menos $900.
Además, los jugadores saben que cada uno tiene $600 disponibles para contribuir. Los jugadores
hacen contribuciones secuencialmente. En la primera etapa, el jugador 1 selecciona su
contribución x ÿ [0, 600] y el jugador 2 observa esta elección. Luego, en la segunda etapa, el
jugador 2 selecciona su contribución y ÿ [0, 600]. Si el proyecto tiene éxito, el pago del jugador 1
es 800 ÿ x y el pago del jugador 2 es 800 ÿ y. Aquí, 800 es el beneficio que cada jugador obtiene
del proyecto exitoso. Si el proyecto no tiene éxito, el jugador 1 obtiene ÿx y el jugador 2 obtiene
ÿy.
Tenga en cuenta cuántos conjuntos de información tiene cada jugador en este juego de contribución.
El jugador 1 tiene solo un conjunto de información (el nodo inicial), y la estrategia de este jugador
es simplemente un número entre 0 y 600. Por lo tanto, S1 = [0, 600]. El jugador 2, por otro lado,
tiene un número infinito de conjuntos de información, cada uno asociado con un valor diferente
de x seleccionado por el jugador 1. En cada uno de estos conjuntos de información (cada uno un
nodo único), el jugador 2 debe elegir un nivel de contribución .
Por ejemplo, la estrategia del jugador 2 debe describir la cantidad que contribuiría con la
condición de que el jugador 1 elija x = 500, la cantidad con la que contribuiría con la condición de
que x = 400, y así sucesivamente, para cada valor de x entre 0 y 600.
Hay una manera matemática simple de expresar la estrategia del jugador 2. Es una función s2:
[0, 600] S [0, 600], tal que, para cualquier x dada, el jugador 2 selecciona y = s2(x).
La forma normal
La forma extensiva es una forma sencilla de representar un juego. Otra forma de describir
formalmente los juegos se basa en la idea de estrategias. Se denomina a la forma normal (o
forma estratégica) de representación de un juego. esta alternativa
La forma normal 27
la representación es más compacta que la forma extensiva en algunos escenarios. A medida

que desarrollemos conceptos de racionalidad para juegos, notará las diferencias sutiles entre
las dos representaciones.
Para cualquier juego en forma extensiva, podemos describir los espacios de estrategia de
los jugadores. Además, observe que cada perfil de estrategia describe completamente cómo se
juega el juego. Es decir, un perfil de estrategia nos dice exactamente qué camino a través del
árbol se sigue y, de manera equivalente, a qué nodo terminal se llega para finalizar el juego.
Asociado con cada nodo terminal (que podemos llamar un resultado) hay un vector de pago
para los jugadores. Por lo tanto, cada perfil de estrategia implica un vector de pago específico.
Para cada jugador i, podemos definir una función ui : S S R (una función cuyo dominio es
el conjunto de perfiles de estrategia y cuyo rango son los números reales) de modo que, para
cada perfil de estrategia s ÿ S que los jugadores podrían elegir, ui(s) es el pago del jugador i en
el juego. Esta función ui se llama función de pago del jugador i . Como ejemplo, tome el juego
representado en la Figura 3.1(b). El conjunto de perfiles de estrategia en este juego es
S = {(OA, O), (OA, I), (OB, O), (OB, I), (IA, O), (IA, I), (IB, O), (IB, I) }.
Las funciones de pago de los jugadores se definen sobre S. Para determinar ui(s) para cualquier
perfil de estrategia s, simplemente comience en el nodo inicial y rastree el árbol de acuerdo con
las acciones especificadas por este perfil de estrategia. Por ejemplo, u1(OA, O) = 2, u1(IA, I) =
4, u2(IA, O) = 3, y así sucesivamente.3
Una forma conveniente de describir los espacios de estrategia de los jugadores y sus
funciones de pago para juegos de dos jugadores en los que cada jugador tiene un número finito
de estrategias es dibujar una matriz. Cada fila de la matriz corresponde a una estrategia del
jugador 1, y cada columna corresponde a una estrategia del jugador 2. Así, cada celda de la
matriz (que designa una única fila y columna) corresponde a un perfil de estrategia. Dentro de
una celda dada, escribimos el vector de pago asociado con el perfil de la estrategia. Por ejemplo,
el juego que se muestra en la figura 3.1(b) se describe mediante la matriz de la figura 3.3. En la
representación matricial, mantenemos la práctica de poner primero el pago del jugador l.
Los conjuntos de estrategias y las funciones de pago de los jugadores describen

completamente una situación estratégica, sin referencia a una forma extensiva. En otras
palabras, las estrategias y los pagos pueden tomarse como una representación fundamental de
un juego.4 Aquí está la definición formal de esta representación: Un juego en forma normal
(también llamada forma estratégica) consiste en un conjunto de jugadores, {1, 2 , c, n}, espacios de estrategia
3
Debido a que usamos convenciones de notación como s = (s1, s2), es más apropiado escribir ui(s) = ui((s1, s2))
que escribir ui(s) = ui(s1, s2). Sin embargo, esto último es completamente estándar en el discurso matemático, por lo que me
abstengo de usar los paréntesis dobles excepto cuando ayuda a evitar confusiones. Verá su uso unas cuantas veces en el libro
de texto.
4
De hecho, a menudo es más fácil analizar un juego sin tener que considerar una estructura de árbol.
Figura 3.3 2
1 yo O
Un juego en forma normal.
OH 2, 2 2, 2
transmisión exterior
2, 2 2, 2
IA 4, 2 1, 3
BI 3, 4 1, 3
5
jugadores, S1, S2 , c, Sn, y funciones de pago para los jugadores, u1 , u2, c, un. Como
Como se señaló anteriormente, los juegos de forma normal para dos jugadores con espacios de estrategia
finitos se pueden describir mediante matrices. Por lo tanto, estos juegos a veces se denominan "juegos de matriz".6
Juegos clásicos de forma normal
En la figura 3.4 se representan algunos juegos clásicos en forma normal. En el juego de emparejar centavos,
dos jugadores seleccionan simultáneamente e independientemente "cara" o "cruz" al descubrir cada uno un
centavo en su mano. Si sus selecciones coinciden, entonces el jugador 2 debe darle su centavo al jugador 1;
de lo contrario, el jugador 1 le da su centavo al jugador 2.
En el juego de coordinación, ambos jugadores obtienen un pago positivo si seleccionan la misma

estrategia; de lo contrario, no reciben nada. El juego de “coordinación de Pareto” tiene la característica adicional
de que ambos jugadores prefieren coordinarse en la estrategia A en lugar de la estrategia B.7
El dilema de los prisioneros es un ejemplo bien conocido y está motivado por la siguiente historia. Las
autoridades han capturado a dos delincuentes que saben que son culpables de un determinado delito. Sin
embargo, las autoridades solo tienen pruebas suficientes para condenarlos por un delito menor. Si ninguno de
los delincuentes admite el delito, ambos serán acusados del delito menor y pagarán una multa moderada. Las
autoridades han colocado a los presos en habitaciones separadas, donde se le pide a cada preso que se burle
del otro. Chillar corresponde a la estrategia D (defecto), y no chillar corresponde a la estrategia C (cooperar con
el otro prisionero).
5
La forma normal fue definida por primera vez por J. von Neumann y O. Morgenstern, Theory of Games and Economic Behavior
(Princeton, NJ: Princeton University Press, 1944). Por cierto, también se pueden ver juegos con un número infinito de jugadores, en
cuyo caso los jugadores están en algún conjunto general N.
6
Los juegos con un número infinito de estrategias son difíciles de representar con un diagrama, incluso en forma extensa. Una
recomendación aparece en el Capítulo 14.
7
Se dice que el resultado (A, A) “domina en el sentido de Pareto” (B, B). Este criterio se define en el Capítulo 6.
Juegos clásicos de forma normal 29
Figura 3.4 Juegos clásicos en forma normal.
2 2 2
1 H T 1 C D 1 Película
Ópera
H 1, -1 -1, 1 C 2, 2 0, 3 Ópera 2, 1 0, 0
T -1, 1 1, -1 D 3, 0 1, 1 Película 0, 0 1, 2
Centavos a juego El dilema del prisionero Batalla de los sexos
2 2
1 H D 1 A B
H 0, 0 3, 1 A 1, 1 0, 0
D 1, 3 2, 2 B 0, 0 1, 1
Halcón-Paloma/Pollo Coordinación
2 S
1 D
A B PAGS D
A 2, 2 0, 0 PAGS 4, 2 2, 3
B 0, 0 1, 1 D 6, -1 0, 0
Coordinación de Pareto cerdos
A cada uno se le dice que si chilla y el otro preso no lo hace, se le concederá

inmunidad y será puesto en libertad; su testimonio, sin embargo, se utilizará
para condenar al otro preso por el crimen. Si cada uno se queja del otro, ambos
son enviados a la cárcel, pero su condena se reduce debido a su cooperación.
El mejor resultado para un prisionero es desertar mientras el otro coopera (pago
3); el siguiente mejor resultado ocurre cuando ninguno falla (pago 2); luego
viene el resultado en el que ambos desertan (pago 1); el peor resultado para un
preso es cuando coopera mientras el otro deserta.8
La mal llamada “batalla de los sexos” es un juego en el que dos amigos
tienen que decidir si ver una película o ir a la ópera. lamentablemente funcionan
8
Quienes describieron por primera vez este juego lo llamaron el "dilema del prisionero". Prefiero la forma plural para
resaltar que es una situación estratégica. Para un relato temprano de este juego y la batalla de los sexos, véase RD Luce
y H. Raiffa, Games and Decisions (Nueva York: Wiley, 1957).
en diferentes puntos de la ciudad y, debido a un corte masivo del sistema telefónico, se

encuentran incomunicados. Deben seleccionar de forma simultánea e independiente un
evento al que asistir. Solo hay una sala de cine y un solo lugar de ópera, por lo que los
amigos se encontrarán si logran coordinar sus decisiones. Ambos prefieren estar juntos,
independientemente del evento al que asistan. Sin embargo, el jugador 1 prefiere la ópera y
el jugador 2 prefiere la película.
Reconocerás el juego de la gallina de varias películas, en particular de la película
Rebelde sin causa de James Dean de 1955. Dos jugadores conducen automóviles uno hacia
el otro a máxima velocidad. Justo antes de que se alcancen, cada uno elige entre mantener
el rumbo (H) o desviarse (D). Si ambos se desvían, ambos salvan la cara y están satisfechos.
Si solo uno se desvía, se demuestra que es un cobarde, mientras que el otro es elogiado
como un tipo duro con nervios de acero. Si ambos mantienen el rumbo, chocan y quedan
terriblemente desfigurados (y, por supuesto, sus novias los dejan).9
El juego de los cerdos se refiere a una situación en la que un cerdo dominante y otro
sumiso comparten un corral. En un lado del corral hay un botón grande que, si se presiona,
libera comida en un plato en el otro lado del corral. Cada cerdo tiene la opción de presionar
el botón (P) o no (D). Si ninguno empuja, los cerdos pasan hambre. Si el cerdo sumiso
presiona el botón y el dominante no lo hace, el cerdo dominante se come toda la comida
liberada porque llega primero a la comida. (Aquí, el cerdo sumiso está aún peor que si
ninguno de los dos jugara P, porque hizo el esfuerzo de presionar el botón pero no recibió
comida). Si el cerdo dominante presiona el botón, entonces el cerdo sumiso puede disfrutar
algo de la comida antes que el cerdo. el dominante llega al plato.10
Interpretación de la Forma Normal
Una forma de ver la forma normal es que modela una situación en la que los jugadores
seleccionan planes contingentes completos de manera simultánea e independiente para un
juego de forma extensiva. Los teóricos a veces ven la selección de estrategias de esta
manera como equivalente al juego en tiempo real de la forma extensiva, pero hay algunas
sutilezas a considerar, que haremos en la tercera parte de este libro. En un nivel más
tangible, debido a que ha visto cómo convertir un juego de forma extensiva a la forma normal,
puede preguntar si existe un procedimiento para convertir juegos de forma normal a la forma
extensiva. Para ver por qué esta conversión no es tan sencilla, considere la forma normal y
las formas extensivas contenidas en la figura 3.5. Ambas formas extensivas producen la
misma forma normal (un hecho que usted
9
En Rebelde sin causa, los jugadores en realidad conducen hacia un acantilado. Mi descripción del juego del pollo describe
con mayor precisión la escena del pollo en la película Footloose de Kevin Bacon de 1984.
10El juego de los cerdos está inspirado en BA Baldwin y GB Meese, “Social Behavior in Pigs Studyed by Means of Operant
Conditioning,” Animal Behavior 27(1979):947–957.
Ejercicio Guiado 31
Figura 3.5 Formas extensiva y normal correspondientes.
A 1, 2
2
1 1 C D
C 3, 1
B 2
A 1, 2 1, 2
D 2, 4
B 3, 1 2, 4
C 1, 2
2
A
1 D 1, 2
C 3, 1
B
D 2, 4
debe comprobar). Esto demuestra que, aunque puede haber una sola forma de pasar de la forma
extensiva a la forma normal, la inversa no es cierta.
Además, las formas extensivas de la figura 3.5 tienen diferentes estructuras informativas. En uno,
el jugador 2 sabe que el jugador 1 no seleccionó A cuando el jugador 2 tiene que decidir entre C
y D. En el otro, el jugador 2 no tiene esa información.
Los teóricos de los juegos han debatido si la forma normal contiene todos los
información relevante sobre escenarios estratégicos. Sin revisar los argumentos, debe darse
cuenta de que no hay discrepancia entre las formas normal y extensiva en escenarios en los que
los jugadores toman todas sus decisiones antes de observar lo que hacen otros jugadores, como
es el caso de los movimientos simultáneos e independientes. Dichos juegos se denominan juegos
de "una sola vez" o "estáticos" y obviamente están bien modelados en la forma normal.
Ejercicio Guiado
Problema: Describa los espacios de estrategia para el juego de Katzenberg-Eisner discutido en

el Capítulo 2. También dibuje la representación en forma normal.
Solución: Recuerde que una estrategia para el jugador i debe describir la acción a realizar en
cada uno de los conjuntos de información del jugador i. Al examinar la figura 2.6, que muestra la
forma extensiva del juego Katzenberg-Eisner, vemos que Katzenberg (el jugador K) tiene tres
conjuntos de información. En su primer conjunto de información (el nodo inicial), el jugador K
selecciona entre las acciones L y S. En su segundo conjunto de información,
elige entre P y N. En su tercer conjunto de información, elige entre R y Nÿ. Así, una estrategia para el
jugador K es una combinación de tres acciones, una para cada uno de sus conjuntos de información.
Un ejemplo de una estrategia es LNR, que es una estrategia útil a considerar porque ilustra que
incluso si el jugador K selecciona N en su segundo conjunto de información (lo que impide que se
alcance su tercer conjunto de información), su estrategia aún debe describir qué haría en su tercer
conjunto de información. Debido a que el jugador K tiene dos alternativas en cada uno de los tres
conjuntos de información, hay 2 # 2 # 2 = 8 combinaciones diferentes, por lo tanto, ocho estrategias
diferentes. El espacio de estrategia del jugador K es
SK = {LPR, LPNÿ, LNR, LNNÿ, SPR, SPNÿ, SNR, SNNÿ}.
Observe que el jugador E tiene solo un conjunto de información. Su espacio de estrategia es
EE = {P, N}.
Para dibujar la matriz de forma normal, primero debe tener en cuenta que debe tener ocho filas
(para las ocho estrategias diferentes del jugador K) y dos columnas (para las dos estrategias del
jugador E). Mirando cada perfil de estrategia individual, puede rastrear a través del formulario extenso
para encontrar el vector de pago asociado. Por ejemplo, considere el perfil de estrategia (LNNÿ, P).
Con este perfil de estrategia, el juego procede del nodo inicial al nodo b, luego al nodo c (ver Figura
2.5), y termina en el nodo terminal con el vector de pago (0, 140). La matriz en forma normal completa
es
Y
k PAGS norte
LPR 40, 110 80, 0
LPNÿ 13, 120 80, 0
ARCO 0, 140 0, 0
LNNÿ 0, 140 0, 0
SPR 35, 100 35, 100
SPNÿ 35, 100 35, 100
SNR 35, 100 35, 100
SNNÿ 35, 100 35, 100

Cap 3 Watson

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cap 3 Watson

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

3 estrategias y la forma normal

El concepto más importante

Una estrategia es un plan contingente completo para un jugador en el juego.

La parte "completamente contingente" de esta definición es lo que la hace poderosa y, para

Terminología y notación para estrategias 23

Terminología y notación para estrategias

sÿi = (s1, s2, c, siÿ1, si+1, c, sn).

24 3: Estrategias y la Forma Normal

Figura 3.1 Algunos A

Terminología y notación para estrategias 25

primer conjunto de información. Además, realmente necesitaremos realizar un seguimiento del

26 3: Estrategias y la Forma Normal

la representación es más compacta que la forma extensiva en algunos escenarios. A medida

Los conjuntos de estrategias y las funciones de pago de los jugadores describen

28 3: Estrategias y la Forma Normal

Juegos clásicos de forma normal

En el juego de coordinación, ambos jugadores obtienen un pago positivo si seleccionan la misma

Juegos clásicos de forma normal 29

Figura 3.4 Juegos clásicos en forma normal.

Centavos a juego El dilema del prisionero Batalla de los sexos

Coordinación de Pareto cerdos

A cada uno se le dice que si chilla y el otro preso no lo hace, se le concederá

30 3: Estrategias y la Forma Normal

en diferentes puntos de la ciudad y, debido a un corte masivo del sistema telefónico, se

Interpretación de la Forma Normal

Figura 3.5 Formas extensiva y normal correspondientes.

Problema: Describa los espacios de estrategia para el juego de Katzenberg-Eisner discutido en

32 3: Estrategias y la Forma Normal

SK = {LPR, LPNÿ, LNR, LNNÿ, SPR, SPNÿ, SNR, SNNÿ}.

Observe que el jugador E tiene solo un conjunto de información. Su espacio de estrategia es

LPR 40, 110 80, 0

LPNÿ 13, 120 80, 0

SPR 35, 100 35, 100

SPNÿ 35, 100 35, 100

SNR 35, 100 35, 100

SNNÿ 35, 100 35, 100

También podría gustarte