Está en la página 1de 23

Unidad 3

1 //Escenario
Escenario26
Lectura fundamental
Fundamental

Juegos de
Etapas secuenciales
un plan de comunicación
estratégica

Contenido

1 Aplicaciones de la teoría de juegos en el derecho penal

2 Juegos secuenciales

3 Juegos secuenciales y simultáneos

4 Modelo de Cournot

5 Modelo de Stackelberg

Palabras clave: juegos en estrategias mixtas, juegos secuenciales, Cournot, Stackelberg.


1. Aplicaciones de la teoría de juegos en derecho penal
Para mostrar todos los ámbitos de aplicación que tiene la teoría de juegos, se pretende mostrar un
análisis matemático de los delitos y las penas que se imponen a estos. No es exagerado afirmar que
todos alguna vez hemos cometido algún tipo de delito o hemos infringido alguna regla o norma.
Cuando se hace referencia a delitos no necesariamente estamos hablando de asesinatos o robos de
bancos, pero el simple hecho de cometer una infracción de tránsito, tirar una goma de mascar por la
ventanilla en una autopista, ya lo podemos considerar un delito.

Uno de los primeros economistas que examinaron la conducta delictiva desde un punto de vista
económico fue Gary Becker, profesor de economía y sociología de la Universidad de Chicago y Premio
Nobel de Economía en 1992. Siguiendo a Becker, el delito tiene motivaciones económicas; cuando
un agente decide cometer algún tipo de delito (desde el más simple hasta el más grave) siempre hace
un balance costo-beneficio para evaluar los beneficios de cometerlo y los costos que está dispuesto
a asumir por dicha acción. Es decir, utilizamos la economía para analizar la elección de las actividades
delictivas y para estructurar los incentivos, con el objetivo de desestimular dicha acción.

Siendo más específicos, si abordamos el caso de los robos, el beneficio que obtiene un ladrón es
la utilidad que le generen los artículos, la contrapartida es el costo que debe asumir debido a la
posibilidad de ser detenido y el posible encarcelamiento o multa que acarrea el hecho de comer algún
tipo de robo.

En este punto debemos tener en cuenta el sistema jurídico-penal de cada país, ya que este es el que
determina la forma y magnitud de los costos que se le impone a un delincuente, ya que esto puede
disuadir al delincuente o al ladrón.

Lo anterior implica que, por naturaleza, las actividades delictivas no suelen ser observables
directamente, ya que no todos los delincuentes son detenidos y están condicionados a una cierta
probabilidad de que no lo sean y se les imponga el castigo correspondiente. Por otro lado, el sistema
jurídico-penal es efectivo dependiendo de los recursos disponibles que se dediquen a perseguir o
evitar los delitos.

Supongamos lo siguiente, sea d una multa en pesos asociada al castigo correspondiente, en caso
de que las autoridades observen que algún agente cometió un delito, denotemos como v el grado
de vigilancia o inspección por parte de las autoridades (o el número de policías por cada 1000
habitantes), por tanto, la probabilidad de que las autoridades detecten un delito depende del grado de
vigilancia o control por parte de las autoridades, la cual la denotamos como P(v).

POLITÉCNICO GRANCOLOMBIANO 2
Teniendo en cuenta lo anterior, podemos formular el problema de optimización del delincuente, si
asumimos que x es la cantidad de delito o crimen que elige un agente, el problema del delincuente se
formula de la siguiente manera:

Estamos diciendo que el estado elige el grado de supervisión, control o la penalización representada
por una multa en pesos, teniendo en cuenta que el nivel de delitos es influenciado por el grado de
vigilancia y de las multas que elijan las autoridades. Con lo anterior lo que se quiere plantear es que
el delincuente se puede enfrentar a diferentes niveles de castigos o penalizaciones dependiendo
del grado del delito; entre más grave sea, esperamos que el agente tenga que afrontar una mayor
penalización, deseamos que el castigo o penalización sea acorde con el nivel del delito.

En la función de maximización vemos que el delincuente elegirá una que maximice sus beneficios,
sin embargo, un punto interesante de política económica es que si el sistema jurídico-penal es muy
eficiente, es decir, si la probabilidad de captura cuando alguien comete un delito es muy alta, el agente
decidirá no cometerlo, ya que el costo es muy alto y esto deprimiría sus beneficios.

Ahora debemos analizar el problema dual, supongamos que el gobierno busca minimizar el nivel
de delitos y para esto debe elegir un P(v)* y una multa o penalización d(x)* óptimas, que puedan
disuadir al delincuente de cometer un delito, ya que este al elegir un nivel x causa un daño o
perjuicio a otros agentes. Si modelamos de forma cuantitativa el nivel de daños causados por los
delincuentes, definamos Z(x) como la cantidad de daños tanto a nivel social como privado, por otro
lado, si queremos aumentar el nivel de vigilancia y control por parte del estado, esto tiene un costo
el cual lo denotamos como C(v), que recoge el gasto total para supervisar, vigilar y controlar el nivel
de delincuencia. Asumamos que el estado puede financiar el nivel de daño social causado por los
delincuentes con las multas y sanciones que este impone en caso de detectar un delito; por tanto, el
problema del gobierno es:

POLITÉCNICO GRANCOLOMBIANO 3
Mediante este sencillo planteamiento vemos que entre mayor sea el grado de control, vigilancia y
supervisión del estado; y entre mayores sean las multas, el costo de cometer un delito es más alto,
reduciendo el nivel de actividad delictiva.

Por otro lado, si examinamos detalladamente el problema del estado, aumentar el grado de vigilancia
y control (por ejemplo, aumentar el número de policías) es muy costoso, sin embargo, incrementar el
nivel de multas o penalizaciones no implica mayores costos. El estado puede beneficiarse con esto, así
financia el costo de vigilancia y supervisión.

Al revisar la lógica de los argumentos anteriores, lo óptimo para el estado es imponer un nivel de
multas o penalización muy alto y fijar un nivel bajo de vigilancia, pero que garantice que la probabilidad
de captura sea creíble, pues si analizamos la estructura racional del delincuente, a este solo le interesa
el costo esperado de ser detectado; costo que depende de dos factores: 1) la probabilidad de captura;
2) el costo de la multa o penalización. Debido a que es costoso para el estado aumentar el nivel de
vigilancia y control (aumentar el número de policías), en contraste vemos que es muy beneficioso
aumentar el valor de las multas y penalizaciones; la decisión óptima del estado es imponer mayores y
elevadas multas con una baja probabilidad de vigilancia, de esta manera se disminuyen los gastos, ya
que aumentar el nivel de las multas o sanciones no implica necesariamente un mayor costo.

Con este argumento tenemos que, al imponer una elevadísima multa o penalización, podemos
disuadir al delincuente, así distingue una disyuntiva entre la probabilidad de ser capturado y la
magnitud de la multa o penalización.

Luego de entablar una interesante discusión entre economía y delito, muchas hipótesis argumentan
que la delincuencia es una salida a la problemática del desempleo, sin embargo, debemos cuestionar
dichos planteamientos y determinar si tiene algún sentido desde el punto de vista de la racionalidad
argumentar que el desempleo causa delincuencia.

Ahora supongamos un caso hipotético, muchos economistas sugieren que una fuente de la
criminalidad es el desempleo. Supongamos la conducta de un desempleado, este puede ser
delincuente (D) o no serlo (ND); los costos de no ser delincuente (debido a que no incurre en
actividades delictivas, este debe buscar su propia subsistencia en otras fuentes diferentes al delito)
los denotamos como g, sin embargo, el beneficio para el estado y para la sociedad de tener menos
delincuentes (un aumento del bienestar social se puede ver como mayor seguridad) lo denotamos
como V, siguiendo la argumentación anterior, el estado puede vigilar (V) o no vigilar (NV), si decide
vigilar acarrea un costo de h, ya que la forma de aumentar la vigilancia es con un mayor número
de policías o militares, y esto necesariamente requiere un mayor costo, aunque la vigilancia le da
información al estado sobre si el desempleado comete o no un delito.

POLITÉCNICO GRANCOLOMBIANO 4
Asumamos que una política del estado para combatir el desempleo es otorgar un subsidio w a los
desempleados, a menos que se detecte que estos han cometido algún tipo de delito, en este caso no
reciben subsidio. Adicionalmente, asumamos g>h>0 y w>g, por transitividad esto implica que w>h.

Gobierno
V (q) NV (1-q)
w-g,
D (1-p) w-g, v-w
Desempleado v-h-w
ND (p) 0, -h w, -w

Con la matriz anterior estamos analizando el impacto de no poner multas a la delincuencia y solo
tener vigilancia, es decir aumentar el número de policías. Luego de plantear la bimatriz, vamos a
encontrar las correspondencias de mejor respuesta, denotemos como P la probabilidad que un
desempleado no sea delincuente y denotemos como q la probabilidad de que el gobierno tome
una posición de vigilar, supervisar y controlar a la delincuencia. Evidentemente estamos acogiendo
equilibrios en estrategias mixtas, en este juego cada jugador (desempleado y gobierno) adopta una
estrategia asignándole una cierta probabilidad a cada una de las estrategias puras de los demás
jugadores.

La estrategia mixta de von Neumann es una distribución de probabilidad sobre un conjunto de


estrategias puras, denotemos como a la probabilidad que se le asigna a la estrategia pura de cada
jugador. Con este procedimiento cada jugador (desempleado y gobierno) escogerá la probabilidad
con la que juega cada una de sus estrategias puras, de tal forma que el otro jugador sea indiferente al
momento de elegir entre cualquiera de sus estrategias.

Para encontrar la solución, como primer paso vamos a hallar las utilidades esperadas de cada uno de
los jugadores para cada estrategia, si el gobierno (jugador 1) cree que el desempleado (jugador 2) va a
jugar su estrategia pura delincuente (D), con una probabilidad 1-p y no ser delincuente (ND) con una
probabilidad p, sus pagos esperados son, respectivamente:

POLITÉCNICO GRANCOLOMBIANO 5
Resolviendo algebraicamente obtenemos lo siguiente:

Ahora podemos analizar la correspondencia de mejor respuesta del jugador 1 (desempleado):

Veamos la correspondencia de mejor respuesta del jugador 2 (gobierno):

Intuitivamente, con las correspondencias de mejor respuesta estamos definiendo el conjunto de


acciones que le maximizan la utilidad esperada al gobierno y al desempleado, esta recopilación de
acciones es lo que se denomina correspondencia de mejor respuesta.

POLITÉCNICO GRANCOLOMBIANO 6
De acuerdo con los resultados anteriores, para valores de q mayores a g/w, el gobierno maximiza
su utilidad esperada cuando p toma un valor de 0; para valores menores a g/w, maximiza su utilidad
esperada cuando p es igual a 1; cuando q vale g/w, es indiferente entre todos los valores posibles de
p. De igual forma, para valores de p superiores a h/w , el desempleado maximiza su utilidad esperada
cuando q toma un valor de 1. Para valores de p menores a h/w , el desempleado maximiza su utilidad
esperada haciendo q igual a cero, y cuando p es h/w , el desempleado es indiferente entre todos los
valores de q.

Recordemos que estas probabilidades se eligen de tal forma que el otro jugador sea indiferente entre
todas sus estrategias puras a las que les asigna alguna probabilidad, de esta forma la solución del
juego indica que el jugador 1 elige ser delincuente con una probabilidad de (1-p)=1-h/w y juega ser no
delincuente con una probabilidad de h/w. El jugador 2 (gobierno) elige vigilar e inspeccionar con una
probabilidad de q=g/w y juega no vigilar con una probabilidad de 1-g/w.

El equilibrio de Nash en estrategias mixtas σ*=(σ1*,σ2*) es:

Lo interesante de este resultado es que en estas estrategias conjuntas donde las correspondencias de
mejor respuesta del gobierno y el desempleado coinciden, es un equilibrio de Nash del juego.

Desde el trabajo original de Becker, la captura o vigilancia de los infractores requiere un costo
elevado; en contraste fijar, imponer, recolectar y cobrar multas es una acción menos costosa, por
esta razón una recomendación de política es fijar como único límite para la multa el máximo. Una
implicación de lo anterior es que las penas o multas deben estar graduadas para que siempre exista
una amenaza creíble para el delincuente y el grado de la pena esté acorde con la magnitud del crimen.

Son largas las discusiones y discrepancias entre la economía y el derecho penal sobre las ventajas y
desventajas de prevenir o sancionar como métodos de castigo; si bien el estado debe ser soberano
para imponer castigos, por otro lado, es fundamental la legitimidad que tiene para hacer cumplir las
sanciones del balance de la pena, es decir, que no sea una sanción excesiva, o como se menciona
anteriormente, que sea acorde a la magnitud del crimen. Se considera viable la “persuasión” por
parte del poder soberano: aumentar al máximo las multas y sanciones con una probabilidad creíble de
captura, de esta forma los incentivos a cometer delitos serán muy bajos.

POLITÉCNICO GRANCOLOMBIANO 7
Al analizar los resultados del juego planteado, vemos que en las correspondencias de mejor respuesta
hay cosas muy interesantes, la probabilidad de cometer un delito es menor entre mayor sea el
subsidio por parte del estado al desempleado, ya que entre mayor sea el costo de supervivencia para
un desempleado, mayores incentivos tendrá para cometer un delito.

2. Juegos secuenciales
Un juego secuencial ilustra una situación estratégica en la cual los jugadores relacionados (generalmente
empresas) toman sus decisiones y deben asumir y elegir sus acciones de forma sucesiva.

En estos casos donde existe una interdependencia estratégica, cada jugador debe tomar una decisión,
pero además debe tener presente si su movimiento puede afectar las decisiones y etapas posteriores
del juego, y cómo el dinamismo de estas elecciones posteriores eventualmente podría modificar sus
acciones. El concepto de solución utilizado en los juegos secuenciales se basa en resolverlos “de atrás
hacia adelante”.

Una vez que se determina la decisión que tomará el agente al que jugó en el último turno, el próximo
paso es entender quién se deberá mover y qué decisión tomará en respuesta, suponiendo que dicha
decisión se realizará en forma óptima y racional.

Esta secuencia es continua y dinámica, además se mantiene el patrón de atrás hacia adelante hasta
llegar al primer nodo de decisión, siendo este en donde se deberá determinar el último movimiento de
quién se mueve primero. La lógica se encuentra asociada para que una decisión sea óptima, teniendo
en cuenta los efectos de las decisiones y sus movimientos posteriores.

2.1. Ejemplo 1

Para analizar los conceptos de un juego secuencial, asumamos un potencial pleito entre D1 y Justo y
Bueno. La segunda empresa tiene un potencial interés en obtener un ingreso entrando a un mercado
el cual se encuentra en la actualidad monopolizado por la empresa D1.

Justo y Bueno asume que D1 podría reaccionar de una de dos maneras posibles en caso de que
opte por entrar en su mercado. La primera opción es que D1 se acomode a la entrada de su nuevo
competir dejando una cuota de mercado a esta nueva empresa entrante, sin afrontar una guerra de
precios o publicidad. La otra situación es que D1 reaccione de forma agresiva a la entrada de este
nuevo competidor al iniciar un conflicto de precios y publicidad.

POLITÉCNICO GRANCOLOMBIANO 8
Vamos a denominar la primera opción posible como “acomodarse” y la segunda situación como
“guerra”. Considere además que la información de mercado disponible sugiere lo siguiente: si Justo
y Bueno no entra en el mercado, obtiene una utilidad de $0 millones, mientras que D1 obtiene una
utilidad de $12 millones. En caso de que Justo y Bueno decida entrar, obtiene una utilidad de $6
millones, en caso de que D1 se acomode a la nueva situación, pero si decide afrontar una guerra de
precios, Justo y Bueno obtendría una pérdida de $9 millones. Finalmente, D1 obtendría una utilidad
de $10 millones si se acomoda a la entrada de Justo y Bueno y de $3 millones si decide iniciar una
guerra de precios.

De acuerdo con la información mencionada se procede a generar una figura que ilustre esta situación,
conocido como árboles de decisión, y para efectos de presentación, dentro de cada nodo de decisión
se incluye la empresa o jugador, además indica que es el jugador responsable de tomar la decisión en
cada etapa de análisis.

Justo

Entrar no entrar

0
D1
12
Acomodarse Pelear

6 Utilidad Justo y Bueno -9


10 Utilidad D1 3

Figura 1. Árbol de decisión ejemplo 1


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 9
En la figura las utilidades para D1 se están presentando debajo de las utilidades de Justo y Bueno; se
observa que en el último nodo le corresponde tomar la decisión final a D1 que tiene a su disposición dos
opciones: acomodarse o guerra. En esta situación la opción que le da más utilidad a D1 es acomodarse,
se asume que, en caso de llegar a tomar dicha decisión, esta sería la opción que debería realizar.

En el nodo anterior, observamos que el jugador que inicia el juego y por ende tiene la responsabilidad
de la primera decisión es Justo y Bueno, que tiene dos alternativas: entrar o no entrar. Si decide
entrar sabe que a D1 le conviene tomar la decisión de acomodarse y su utilidad final será de $6,
mientras que en caso de no entrar obtiene una utilidad de $0.

Con base en las dos alternativas disponibles, Justo y Bueno optará por entrar al mercado, esta
estrategia asigna un mayor beneficio con respecto a la alternativa de no entrar. El resultado final del
juego sería que Justo y Bueno entre en el mercado y que D1 se acomode a esta situación.

Este tipo de gráficos son relevantes, en caso de no ilustrar dicha situación como un juego y de no
haber utilizado el árbol de decisión como concepto de solución, puede suceder que Justo y Bueno
asigne probabilidades a los eventos de acomode o guerra; en este caso se hubiese podido asignar
una probabilidad de 50 % a cada uno de esos eventos, su decisión final sería no entrar, situación que
cambiaría todo el desenlace del juego.

3. Juegos secuenciales y simultáneos


En algunas ocasiones se deben tomar decisiones estratégicas que tienen de forma conjunta
decisiones simultaneas y secuenciales. Extendiendo el ejemplo anterior, pero incluyendo una eventual
práctica de depredación de precios, entendiéndola como una reducción de precios que incluso puede
ser hasta por debajo de sus costos, con el objetivo de eliminar competidores del mercado.

Asumamos que se tiene un potencial entrante: Justo y Bueno, que analiza ingresar en un mercado
monopolizado por una empresa que llamamos D1. Si Justo y Bueno decide entrar, ambas empresas
deben tomar una decisión de forma simultánea, las cuales se muestran a continuación: (a) ambas
empresas se pueden acomodar, repartiendo una cuota de mercado y no realizar una guerra de
precios, (b) ambas empresas pueden iniciar una guerra de precios donde cada una intente apoderarse
de una participación mayor en el mercado, pero disminuyendo la participación del otro. La decisión de
acomodarse o iniciar la guerra de precios se asume de manera simultánea por ambas empresas.

POLITÉCNICO GRANCOLOMBIANO 10
A diferencia del ejemplo 1, representaremos con un óvalo ubicado en la parte inferior del árbol de
decisión para representar que en esta etapa del juego ambas empresas deben tomar la decisión en
forma simultánea.

Justo
No entrar Entrar

Utilidad Justo y Bueno 0


Utilidad D1 4 Justo

Acomoda Guerra

D1
Acomoda Guerra
Acomoda Guerra

Utilidad Justo y Bueno 4 6 -1 3


Utilidad D1 6 1 9 4

Figura 2. Árbol de decisión juegos secuenciales y simultáneos


Fuente: elaboración propia

De forma análoga a cualquier juego que tiene un componente de secuencialidad, el análisis final parte
de la última etapa del juego, toda vez que esta estructura de juego se resuelve por inducción hacia
atrás, que en esta situación corresponde al juego de forma simultánea. Podemos representar esta
última etapa del juego en forma matricial, en donde el único equilibrio de Nash en estrategias puras
corresponde al par de estrategias de acomodarse (acomoda, acomoda).

POLITÉCNICO GRANCOLOMBIANO 11
Justo y Bueno
Acomodarse Guerra
Acomodarse 6, 4 9, -1
D1
Guerra 1, 6 4, 3

Este resultado indica que, si Justo y Bueno opta por entrar en la primera etapa, el resultado de
equilibrio de la segunda etapa del juego es simultánea, y de acuerdo con la matriz de pagos tenemos
que tanto D1 como Justo y Bueno van a elegir la opción de acomodarse.

En el caso de los juegos secuenciales, es muy importante tener presente que la solución se obtiene
aplicando el principio de inducción hacia atrás, el cual tiene como supuesto que cada empresa debe
elegir su acción considerando cada movimiento que realiza cada jugador.

4. Modelo de Cournot
Retomando el tema de modelos de competencia imperfecta, las hipótesis del modelo de Cournot son
las siguientes:

a. La variable de decisión de cada empresa es la cantidad de producto que está dispuesta a


ofrecer. Al determinar su nivel de producción, la empresa asume que es constante el nivel
de producción de su competidora. Por lo anterior, el nivel de producción elegido por cada
empresa se considera como la mejor respuesta con respecto a la producción de la otra.

b. El precio de mercado resulta de la interacción de la suma de ofertas individuales de cada


empresa y de la demanda de este producto, en este sentido, el precio es la variable de
mercado que elimina los excesos de oferta o demanda.

c. Las empresas deben decidir de forma simultánea cuál será la cantidad de producción.

d. Eventualmente se tienen barreras de entrada al mercado.

Se asume que existen dos empresas idénticas que producen un producto homogéneo y que podemos
representar la demanda de mercado con la siguiente ecuación: P=100-Q, adicionalmente asumimos
que los costos unitarios por producción son de $10.

POLITÉCNICO GRANCOLOMBIANO 12
El precio del producto depende de la cantidad de producción, por lo cual el principal interés es encontrar
el valor de las cantidades de producción de cada empresa. Si denotamos como q₁ y q₂ como las
cantidades producidas por la empresa 1 y 2 de forma respectiva y denotamos como la cantidad total
ofrecida, las utilidades para las empresas 1 y 2 se encuentran determinadas por las siguientes ecuaciones:

U1=P*q1-CT=(100-Q) q1-10q1
U1=[100-(q1+q2)] q1-10q1
Es decir:

U1=[100-(q1+q2)-10] q1
De forma análoga, para el caso de la empresa 2 tenemos que la utilidad está determinada por:

U2=[100-(q1+q2)-10] q2
Las ecuaciones de utilidad nos están mostrando que esta depende de la cantidad total ofrecida, la cual
se calcula como la suma de ambas producciones multiplicada por la diferencia entre el precio y su
costo de producción.

Al tener una interdependencia en las cantidades producidas las cuales afectan las utilidades de ambas
empresas, se requiere de la teoría de juegos para entender las relaciones estratégicas entre ambas
empresas.

Asumiendo que cada empresa desea maximizar sus utilidades, se debe optimizar la función de utilidad
con respecto a la cantidad de producción y luego igualar este resultado a cero.

De manera análoga, la empresa 2 maximiza sus utilidades cuando produce:

POLITÉCNICO GRANCOLOMBIANO 13
Los resultados anteriores se conocen como funciones de mejor respuesta, dado que indican lo mejor
que puede hacer cada empresa como respuesta a lo que produzca la otra. En la medida que se tiene
una mayor producción total se implica una disminución en el precio, pues la función de demanda tiene
una pendiente negativa, así mismo la función de mejor respuesta sugiere que lo óptimo para cada
empresa es producir una cantidad menor cuando cree que la producción de la otra es mayor.

Para ilustrar esta situación consideremos el caso en el cual la mejor respuesta para la empresa 1 es
producir 20 unidades si cree que la empresa 2 va a producir 50 unidades, o en caso de que estime
que la empresa 2 va a producir 30 unidades, entonces su mejor respuesta es también producir 30
unidades. Al resolver el sistema de ecuaciones obtenemos que:

Luego la cantidad óptima en el equilibrio para la empresa 1 sería:

q1*=30
La correspondencia de mejor respuesta para la empresa 2 sería:

q2*=30
El precio del producto es:

P=100-Q=100-(q1+q2 )=100-60=40
Las utilidades estarían dadas por:

U1=[100-(60)-10]30=900
U2=[100-(60)-10]30=900

POLITÉCNICO GRANCOLOMBIANO 14
Este resultado nos corrobora el concepto de equilibrio de Nash, que estableció que existe equilibrio
cuando cada jugador no tiene incentivos de modificar su estrategia, teniendo en cuenta la estrategia
que considera que deberá adoptar el otro jugador. Si se tiene una producción de 30 unidades por
cada empresa, tenemos un equilibrio de Nash debido a los siguientes argumentos:

a. Al optimizar la función de mejor respuesta encontramos que al producir 30 unidades es


una estrategia óptima para cada empresa; si cada una considera que la otra también está
dispuesta a producir 30 unidades.

b. Cada empresa se encuentra en una situación de dependencia, por lo cual decide producir la
cantidad óptima según la cantidad producida por la otra empresa.

Este resultado también puede ser contradictorio y sería algo similar a lo que pasa en el caso del dilema
del prisionero; si ambas empresas coordinan y actúan como una sola y no por separado, pueden
mejorar su situación de la siguiente manera:

UTotal=P*Q-CT=(100-Q)Q-10Q=(100-Q-10)Q

Al maximizar la función de utilidad total, asumiendo que ambas empresas coordinan y producen una
cantidad única obtendríamos lo siguiente:

La cantidad total óptima para ambas empresas asumiendo que están colaborando sería la siguiente:

Q=45
Como son 2 empresas y la producción total bajo el escenario de cooperación es de 45 unidades,
decimos que cada empresa produciría 22;5 cantidades. El precio del producto sería:

P=100-45=55

POLITÉCNICO GRANCOLOMBIANO 15
Las utilidades de la empresa estarían dadas por lo siguiente:

U1=[100-(45)-10]22.5=1012.5
U2=[100-(45)-10]22.5=1012.5
El escenario en cooperación es mucho más saludable para ambas empresas y para el consumidor final,
pues este ya no pagaría un precio de $60 por el producto sino de $55. Si una empresa decide no
cooperar, pero sabe que la otra sí está dispuesta a hacerlo al producir 22,5 unidades, la empresa que
decida no cooperar produciría:

El precio quedaría determinado por lo siguiente:

P=100-Q=100-(22.5+33.75)=43.75
Las utilidades estarían dadas por lo siguiente:

UNo Coopera=[100-(22.5+33.75)-10]33.75=1139.06
UCoopera=[100-(22.5+33.75)-10]22.5=759.375

Con base en este desarrollo, ahora podemos plantear la matriz de pagos:

Empresa 2
Cooperar No cooperar
Cooperar 1012, 1012 759, 1139
Empresa 1
No cooperar 1139, 759 900, 900

Tenemos una situación indeseable, el equilibrio de Nash resultante es que ambas empresas deciden no
cooperar, este equilibrio se obtiene a pesar de que ambas empresas saben que se encuentran mejor
en términos de utilidades si ambas cooperan. Este ejercicio muestra que el equilibrio resultante es del
tipo de dilema del prisionero.

POLITÉCNICO GRANCOLOMBIANO 16
Este análisis de competencia entre empresas que tienen la responsabilidad de tomar decisiones de
producción de manera simultánea es interesante en la teoría de juegos, y es válido en situaciones
donde el criterio de decisión es la cantidad total que debe producirse.

En la vida real encontramos situaciones de este estilo en el caso de personas que deben asumir
decisiones de sembrar un determinado producto en cierta zona geográfica, donde el productor
debe decidir el número de hectáreas adecuadas para sembrar dicho producto en una época del año;
sin embargo, la incertidumbre aparece dado que no se puede saber de forma exacta el número de
hectáreas que están sembrando los demás competidores en esa zona, y por ende el precio final que
se va a formar está asociado a la cosecha total, la cual es inherente al número de hectáreas utilizadas
en esa zona geográfica. En la actualidad la OPEP debe tomar decisiones de este tipo en términos de
producción de petróleo.

Figura 3. Correspondencia de mejor respuesta


Fuente: elaboración propia

Como se observa en la figura, las funciones de reacción tienen una pendiente negativa; en caso
de que una empresa se encuentre interesada en aumentar el nivel de producción, la otra tiene que
disminuirla.

Así mismo, en la medida que es menor la producción de la firma 2, obtenemos que mayor será el
precio que va a recibir la empresa 1 por su producto.

POLITÉCNICO GRANCOLOMBIANO 17
5. Modelo de Stackelberg
Muchas decisiones se deben tomar de forma secuencial, lo que implica que en términos de
organización industrial las empresas deben decidir cuál es su respuesta después de haber observado
la decisión de otra. Por ejemplo, una empresa líder del mercado que se ha instalado y tiene la mayor
cuota de mercado antes de la llegada de otra firma. Este tipo de estrategias permite tomar decisiones
con alguna antelación.

Dando continuidad al ejemplo desarrollado en Cournot, asuma que se tienen dos empresas, la firma
1 decide la cantidad de producción antes que la firma 2, esta última debe decidir cuál será su nivel de
producción, pues ya conoce la decisión de producción que eligió la firma 1. La empresa 1 asume que la
empresa 2 optará por la decisión más favorable, teniendo en cuenta la decisión que eligió la empresa 1
en el nodo anterior.

De esta manera, se puede suponer que la mejor acción que puede tomar la firma 1 es asumir que
la decisión que tomará la firma 2 cuando asuma la responsabilidad es tomar la decisión que más le
genere utilidad, tomando en cuenta lo que hizo la firma 1 en la etapa anterior. La firma 1 tiene como
supuesto que la firma 2 deberá moverse con base en la función de reacción. Cuando consideramos
estos supuestos tenemos que entender que el modelo de análisis es el de Stackelberg.

El principal elemento del modelo de Stackelberg es que hace referencia a una interacción entre
un líder y un seguidor. Se tiene que el jugador que interactúa como líder conoce de manera previa
la decisión que tomará el seguidor ante cambios en la producción. Al retomar el ejemplo anterior
tenemos que la función de demanda es P=100-Q , y se asume que los costos unitarios por
producción son de $10; denotamos y como las cantidades producidas por las empresas 1 y 2 de
forma respectiva. La función de reacción del seguidor la denotamos como:

POLITÉCNICO GRANCOLOMBIANO 18
La firma 1 maximiza su utilidad, pero se encuentra sujeta a la decisión que tome la firma 2; el problema
de la firma 1 es maximizar esta función:

Al resolver esta función maximizando con respecto a tenemos lo siguiente:

La empresa 2 debe producir:

El precio del producto sería:

P=100-Q=100-(q1+q2 )=100-(45+22.5)=32.5

POLITÉCNICO GRANCOLOMBIANO 19
Las utilidades de las empresas 1 y 2 estarían determinadas por:

U1=[100-(q1+q2 )-10] q1=[100-(45+22.5)-10]*45=1012.5


De forma análoga, para el caso de la empresa 2 tenemos que la utilidad está determinada por:

U2=[100-(q1+q2 )-10] q2=[100-(45+22.5)-10]*22.5=506.25

Los resultados del análisis de interacción entre líder y seguidor por medio del modelo de Stackelberg
son interesantes, pues si bien ambas firmas ganan, la empresa que es líder obtiene una utilidad mucho
mayor que la empresa seguidora; adicionalmente, la sociedad obtiene un beneficio, pues el precio de
mercado es mucho menor.

Este resultado se obtiene asumiendo que la empresa seguidora deberá tomar su decisión teniendo en
cuenta la producción de la empresa líder. Se requiere que la firma que tome la primera decisión no
modifique su producción.

POLITÉCNICO GRANCOLOMBIANO 20
Referencias
Barron, E. (s. f.). Game Theory an Introduction. Loyola University Chicago.

Blázquez, M. y Gámez, C. V. (2006). Teoría de juegos y aplicaciones: el dilema del prisionero. Madrid:
Universidad Carlos III de Madrid, Departamento de Ingeniería Telemática.

Ferreira, J. L. (2009). La teoría de los juegos, la historia más lúdica jamás contada (parte 2). Recuperado
de http://todoloqueseaverdad.blogspot.com/2009/09/la-teoria-de-los-juegos-la-historia-mas_16.
html

Lemaire, J. (s. f.). An Application of Game Theory: Cost Allocation. Universite Libre de Bruxelles.

Martínez, M. A. y Martínez, M. M. (2011). Teoría de juegos. Autores científico-técnicos y académicos.


Recuperado de https://dialnet.unirioja.es/servlet/articulo?codigo=5724682

POLITÉCNICO GRANCOLOMBIANO 21
Referencias de imágenes
Barretto, M. (2007). Características de la cultura. Tenerife, [Diagrama]. España: Colección Pasos.
Recuperado de http://www.gestionturistica.cl/archivos/Libros/Barreto.pdf

Noguer, E. y Saez, Á. (2016). Elementos del turismo como producto cultural. [Diagrama]. Revista
Iberoamericana de Turismo- RITUR, Penedo, 6(2), 157-165, 2016.

Referencias de tablas
Smith, M. (2003). Tabla Clasificación del turismo cultural. Nueva York, USA: Routledge.

POLITÉCNICO GRANCOLOMBIANO 22
INFORMACIÓN TÉCNICA

Módulo: Teoría de Juegos


Unidad 3: Correspondencia de mejor respuesta y juegos
secuenciales
Escenario 6: Juegos secuenciales

Autor: Juan Pablo Roa

Asesor Pedagógico: Jessica Katherin Pinzón Arias


Diseñador Gráfico: Katherinne Pineda Rodriguez
Asistente: Julieth Ortiz

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 23

También podría gustarte