Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los juegos en forma extensiva (JFE) son juegos que tienen una dimensin temporal (en oposicin
al modelo de juego estratgico o en forma normal). En estas situaciones, el concepto de equilibrio
de Nash es insatisfactorio pues ignora la estructura secuencial del juego. Esto motiva la definicin
de un nuevo concepto: el Equilibrio Perfecto en Subjuegos.
Un juego en forma extensiva especifica el orden en que juegan los jugadores, las elecciones po-
sibles, la informacin disponible para cada jugador al momento que le toca jugar, el resultado del
juego (que es consecuencia de las decisiones de los jugadores) y los pagos para cada jugador en cada
resultado posible.
En este curso veremos el modelo de JFE que consiste de lo que llamamos el rbol del juego; que
es una descripcin grfica de una situacin de interaccin estratgica que ocurre en el tiempo.
1. Modelo
Definicin 1 (Juego en forma extensiva).
Un Juego en Forma Extensiva consiste de:
1. Un nodo inicial: en el que acta el primer jugador que debe tomar una decisin en el juego.
El nodo se etiqueta con el nombre de ese jugador.
2. Nodos de decisin: puntos en los que a algn jugador le toca mover. Cada nodo de decisin
se etiqueta con el nombre del jugador al que le corresponde tomar una decisin en ese nodo.
3. Ramas. Cada rama emana de un nodo de decisin y representa una accin disponible para
el jugador que toma la decisin en ese nodo. Cada rama se etiqueta con la accin a la que
representa.
4. Nodos terminales y Pagos. Los nodos terminales indican que ya nadie mueve. En los nodos
terminales se entregan los pagos que representan la utilidad que obtiene cada jugador en cada
nodo terminal.
1
Salvo donde se diga explcitamente, las referencias a ejemplos y figuras son a Church y Ware (2000)
1
Ejemplo 1.
Un ejemplo de juego en forma extensiva se ilustra en la Figura 1. En este juego elige primero el
jugador 1 entre las opciones u y d. Despus de que el jugador 1 elige, el jugador 2, conociendo lo
que ha elegido 1, elige entre U y D. Entonces el juego acaba y se obtienen los pagos.
(5, 2)
U
2
u D
(1, 0)
1
d
(4, 4)
U
2
D
(6, 0)
Historias: Secuencias de nodos y ramas que parten en el nodo inicial y terminan en algn nodo
de decisin o terminal (si termina en un nodo terminal la llamamos historia terminal ).
Ejemplo 2. Para el juego del Ejemplo 1, tenemos que el conjunto de historias posibles es:
Conjuntos de informacin: son conjuntos de nodos de decisin de los jugadores. Para un ju-
gador al que le toca mover, el conjunto de informacin es el conjunto de nodos de decisin que el
jugador no puede distinguir. La lista de conjuntos de informacin de un jugador es la lista de todos
los posibles eventos, en los que le toca jugar, que el jugador puede distinguir.
Notemos que los conjuntos de acciones disponibles para un jugador en dos nodos de decisin
que pertenecen al mismo conjunto de informacin, deben ser iguales. Si no fuese as, el jugador
podra distinguir en cul nodo se encuentra (equivalentemente, qu historia ha ocurrido) mirando
2
las acciones disponibles.
Ejemplo 3.
La forma extensiva del dilema del prisionero se ilustra en la Figura 2. En este ejemplo, el prisionero
1 elige primero entre confesar y no confesar. Luego, sin conocer la eleccin del prisionero 1, el
prisionero 2 toma a su vez su decisin. La lnea punteada que une los dos nodos de decisin en que
juega 2, representa que este jugador no conoce la eleccin del jugador 1. En la forma extensiva del
juego, el jugador 2 no puede distinguir la historia C de la historia N C. Ambos jugadores tienen
un nico conjunto de informacin. El conjunto de informacin del jugador 1 tiene un elemento,
mientras que el conjunto de informacin del jugador 2 tiene dos elementos. Al momento de tomar
su decisin, ninguno de los dos jugadores conoce la decisin tomada por el otro.
(1, 1)
C
2
C NC
(5, 0)
1
NC
(0, 5)
C
2
NC
(3, 3)
3
a (2, 0)
2
r (0, 0)
(2, 0)
(1, 1) a (1, 1)
1 2
r (0, 0)
(0, 2)
a (0, 2)
2
r (0, 0)
(2, 1)
A
I
E F
(0, 0)
D
NE
(1, 2)
4
reduzca sus costos de produccin; o no prepararse (N P ). El desafiante decide si entrar (E) o no
entrar (N E). Al momento de decidir, el desafiante no sabe si el incumbente se prepar o no para
recibirlo. Finalmente, si el desafiante decide entrar, el incumbente puede decidir acomodarse a la
entrada (A) o pelear (F ). Si el incumbente se prepara, entonces incurre en un costo. En este caso,
peleando, queda tan bien como si el desafiante no hubiese entrado.
(2, 0,5)
A
I
E
F
(1, 2)
D
P NE
(1, 1,5)
(2, 1)
A
I
I
NP
F
E (0, 0)
NE
(1, 2)
2. Estrategias y Equilibrio
Una Estrategia si de un jugador i N en un JFE especifica la accin que toma ese jugador en
cada uno de sus nodos de decisin. Es un plan completo de accin. Una estrategia debe especificar
lo que hace el jugador cada vez que le toca jugar, incluso en nodos que son incompatibles con las
decisiones dictadas por la estrategia misma. Esto quedar ms claro con los ejemplos descritos ms
adelante.
Al igual que en el modelo de juegos estratgicos, denotamos al conjunto de estrategias del juga-
dor i mediante Si y al conjunto de perfiles de estrategias, mediante S.
5
Ejemplo 7.
En el juego ilustrado en la Figura 1, el conjunto de estrategias para el jugador 1 es simplemente
S1 = {u, d}
y una estrategia es una accin si {u, d}. Como una estrategia en un JFE es un plan completo de
accin, la estrategia del jugador 2 debe especificar qu ste en cada contingencia. En este caso, debe
especificar qu hace 2 cuando 1 juega u y qu hace 2 cuando 1 juega d. Por ejemplo, una estrategia
para el jugador 2 puede ser elegir U si 1 juega u y D si 1 juega d. El espacio de estrategias factible
para el jugador 2 es entonces
donde la primera componente de cada par es lo que hace 2 cuando 1 juega u y la segunda componente
especifica qu hace 2 cuando 1 juega d.
SD = {E, N E} .
Como en los JFE una estrategia es un plan completo, debemos especificar para el jugador I ,qu
hace cada vez que le toca jugar. En este caso, el jugador I tiene un slo nodo de decisin, por lo que
el espacio de estrategias factibles para I es el conjunto
SI = {A, F } .
Dado un perfil de estrategias s S, llamamos O(s) a la historia terminal inducida por el perfil
de estrategias s. Esta historia se genera siguiendo el plan de accin dictado por el perfil s. Para
cada jugador i N , el pago del juego asociado a un perfil de estrategias s S, ui (s) se obtiene
evaluando el pago en el nodo terminal asociado a la historia O(s).
Ejemplo 9.
Podemos describir el juego del Ejemplo 1 en su forma estratgica especificando:
6
D
(U, U ) (U, D) (D, U ) (D, D)
u 5, 2 5, 2 1, 0 1, 0
d 4, 4 6, 0 4, 4 6, 0
Observemos que para este juego los equilibrios de Nash son los perfiles de estrategias (u, (U, U )) y
(d, (D, U )) (Verificar que para todo el resto de perfiles de estrategias factibles hay desvos aprove-
chables para los jugadores).
Observacin 1. En el equilibrio (d, (D, U )) de este ltimo ejemplo, el jugador 1 no juega u porque de
acuerdo a la estrategia del jugador 2, ste jugara D. Sin embargo, parece poco creble, de acuerdo
al supuesto de racionalidad, que si el jugador 2 se viese enfrentado a tomar la decisin de jugar D
U luego de que el jugador 1 haya jugado u, decida jugar D. Una creencia razonable del jugador 1
sobre lo que el jugador 2 hara si es que l eligiese jugar u es que el jugador 2 elija U . La amenaza
del jugador 2 de jugar D si es que el jugador 1 juega u no es creble.
I
A F
E 2, 1 0, 0
D
NE 1, 2 1, 2
En este ejemplo tambin tenemos dos Equilibrios de Nash: (E, A) y (N E, F ). Notemos que si el
desafiante entra, lo mejor que puede hacer el incumbente es acomodarse. Por lo cual, una creencia
razonable para el desafiante es que si entra, el incumbente se acomodar. El equilibrio (N E, F ) es
poco razonable entonces, ya que involucra una amenaza poco creble.
7
El equilibrio de Nash es un concepto demasiado dbil para capturar el efecto de amenazas no
crebles sobre las decisiones de los rivales. Esto motiva la introduccin de un concepto ms fuerte:
el Equilibrio Perfecto en Subjuegos.
Subjuego: Es cualquier parte del juego que comienza en un conjunto de informacin con un slo
elemento. El subjuego que comienza en un nodo de decisin incluye todos los movimientos posibles
a partir de ese nodo.
Ejemplo 11.
En el juego del Ejemplo 1 hay 3 subjuegos: el subjuego que ocurre tras la historia u, el subjuego
que ocurre tras la historia d y, finalmente, el subjuego que ocurre tras la historia (el juego
original).
En la forma extensiva del Dilema del prisionero (Figura 2), hay un nico subjuego: el juego
completo. Como el jugador 2 no puede distinguir si est en la historia C o la N C, el conjunto
de informacin para este jugador tiene dos elementos y por tanto no podemos encontrar otros
subjuegos.
Un JFE puede ser de horizonte finito, sin ser finito (que algn jugador tenga un nmero infinito de
acciones disponibles en alguno de sus nodos de decisin). Todo juego finito, es de horizonte finito.
8
Induccin inversa: resolver el juego a partir de ltimos nodos de decisin del rbol del juego y
luego ir resolviendo hacia arriba hasta llegar al nodo inicial. Llamamos largo del JFE al largo de
la historia ms larga en el juego .
Induccin inversa Sea un JFE con horizonte finito, sea L el largo de y llamemos h a las
historias de .
Para cada subjuego (h) tal que el largo de (h) es 1, encontrar las acciones ptimas del
jugador que juega al principio de (h) (es el jugador que juega despus de la historia h en
el juego original). Llamamos Sh (1) al conjunto de acciones ptimas del jugador que juega
despus de la historia h (si ste jugador tiene una sola accin ptima, entonces Sh (1) es un
singleton).
Para cada combinacin de acciones consistiendo de una en cada conjunto Sh (1) (una por cada
historia no terminal h tal que el largo de (h) es 1) encontrar, para cada historia no terminal h
tal que el largo de (h) es 2, el conjunto de acciones ptimas del jugador que juega al principio
de (h). El resultado es un conjunto de perfiles de estrategias para cada subjuego de largo 2.
Denotamos por Sh (2) a ese conjunto de perfiles de estrategias en el subjuego (h).
Subjuegos de largo 1: En este juego hay tres subjuegos de largo 1. Consideremos primero el
subjuego que sigue a la historia (d, U ). Observemos que en este subjuego para el jugador 3 es mejor
elegir D0 que U 0 , puesto que de esta forma obtiene 3 en lugar de 1. En el subjuego que sigue a la
historia (d, D) tenemos que 3 prefiere jugar U 0 a D0 , puesto que de esta manera obtiene 6 en lugar
9
U (2, 1, 2)
2
u D (1, 3, 4)
1 U0 (3, 0, 1)
3
U
d D0 (4, 3, 3)
2
U0 (1, 2, 6)
D
3
D0 (2, 6, 0)
(1, 3, 4)
u
1
d
(4, 3, 3)
U
2
D
(1, 2, 6)
Subjuego de largo 2: En el nodo de decisin que sigue a la historia d, el jugador 2 elige U pues
obtiene pago 3 en lugar de 2.
Ahora resolvemos los subjuegos de largo 3, que es equivalente a resolver el juego ilustrado en la
Figura 10.
Subjuego de largo 3: En este juego, el jugador 1, preferir jugar d pues gana 4, lo cual es mejor
que 1.
10
(1, 3, 4)
u
d
(4, 3, 3)
Observacin 3. Si en alguna etapa del mtodo se encuentra dos o ms acciones ptimas al principio
de algn subjuego (h), entonces se puede encontrar una multiplicidad de perfiles de EPSJ.
El atractivo del EPSJ es que tiene la habilidad de descartar cualquier equilibrio de Nash que
involucre una amenaza no creble. Sin embargo, este concepto de solucin tambin lleva a algunos
resultados paradjicos. El EPSJ exige que cada jugador continue siguiendo la estrategia de EPSJ
aunque otro jugador se haya desviado de esa estrategia, es decir, exige que cada jugador siga jugando
las estrategias del EPSJ aunque el juego est avanzando en alguna direccin imprevista. Un ejemplo
de esta paradoja puede observarse en el siguiente ejemplo.
11
Ejemplo 14 (Juego del ciempis). Hay dos jugadores, cada uno pone una moneda en un fondo.
El jugador 1 elige si continuar el juego (C) o terminarlo (S), si 1 elige terminar el juego entonces
cada jugador se queda con su moneda, si elige continuar, entonces se agrega una moneda al fondo
y el jugador 2 debe elegir si continuar el juego o terminarlo. Si 2 elige terminar, entonces se queda
con las tres monedas y si elige seguir, se vuelve a agregar una moneda al pozo y el jugador 1 debe
elegir si continuar el juego o terminarlo. Este juego continua as hasta que que quedan 8 monedas
en el fondo y en caso de no haber terminado el juego antes, el fondo se reparte en partes iguales. El
juego est ilustrado en la Figura 11.
C C C C C C
1 2 1 2 1 2 (4, 4)
S S S S S S
Observemos el ltimo nodo de decisin. En ste, el jugador 2 prefiere elegir S pues as obtiene 5
monedas en lugar de cuatro. En el nodo anterior, el jugador 1, sabiendo que 2 elegir S al final,
prefiere elegir tambin S, y as hasta el nodo inicial. El nico EPSJ de este juego consiste en que
cada jugador decide terminar el juego apenas tenga oportunidad de hacerlo. Bajo este equilibrio el
juego termina en la primera etapa y cada jugador obtiene un pago de una moneda. Sin embargo, si
cooperaran, obtendran cada uno un pago de 4 monedas.
Este equilibrio es contra intuitivo y no razonable por la siguiente razn: consideremos el primer
nodo de decisin en el cual le toca jugar a 2, dado a que en el EPSJ a 2 nunca le debera tocar jugar,
el hecho de que 2 deba elegir, quiere decir que 1 en el pasado no se comport en forma racional.
Entonces, si esto sucede es razonable suponer que dado que 1 no se comport racionalmente en el
pasado, si lo har en el futuro? En esta situacin el jugador 2 podra estar tentado a jugar C con
la esperanza de que 1 se volviera a comportar irracionalmente. Este razonamiento se exacerba si
pensamos en que el juego tuviera muchas ms etapas, digamos 1000, y estemos mirando la decisin
de un jugador en una etapa muy posterior, digamos la 800. Si est en esa situacin, quiere decir
que en todo el pasado ambos jugadores han tomado decisiones no ptimas y por lo tanto no parece
razonable pensar que en el futuro cambiarn su manera de actuar. He ah la paradoja.
McKelvey y Palfrey (1992) testearon experimentalmente una variante del juego del ciempis.
En el experimento, encontraron que en slo 37 de sus 662 observaciones el primer jugador decida
terminar inmediatamente el juego. En la mayora de los casos, los jugadores lograban obtener pagos
significativamente superiores que los que predice el EPSJ y haba espacio para la cooperacin.
Volveremos sobre el tema de la cooperacin cuando estudiemos juegos repetidos.
Referencias
Church, J., y Ware, R. (2000). Industrial organisation. a strategic approach. McGraw-Hill Interna-
tional Editions.
12
McKelvey, R., y Palfrey, T. (1992). An experimental study of the centipede game. Econometrica,
60 , 803836.
Osborne, M. J. (2003). An introduction to game theory. Oxford University Press.
13