Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEORIA DE JUEGOS
Empecemos por el principio: la teoría de los juegos es una rama de la economía aplicada también a otros
muchos ámbitos (como la estrategia empresarial, la política, la biología o incluso el póquer y el blackjack), que
consiste en tomar decisiones no solo con base ena partir de nuestro punto de vista, sino pensando en cómo
actuará la parte contraria según la decisión que tomemos nosotros.
Esta teoría se basa en el equilibrio de Nash (sí, John Forbes Nash, ese matemático premio Nobel de Economía
tan bien interpretado por Russell Crowe en Una mente maravillosa), que consiste en una situación donde hay
dos o más jugadores y ninguno de ellos quiere cambiar la situación de equilibrio, pues supondría empeorar su
propia situación. A partir de este concepto numerosos economistas, entre los que destaca John von Neumann,
fueron desarrollando esta teoría.
Para entender mejor el concepto del equilibrio de Nash y en qué consiste la teoría de los juegos, se suele
utilizar como ejemplo el llamado dilema del prisionero.
Supongamos una situación en la que somos detenidos junto con otra persona por un delito de robo. La pena por
este delito es de dos años de cárcel. La policía sabe que también ha habido un herido por arma de fuego, pero
no sabe cuál de los dos detenidos ha sido el culpable; la pena por este otro delito es de cinco años de prisión.
Ambos ladrones estamos totalmente incomunicados entre nosotros, y en el interrogatorio la policía nos
propone a cada uno el siguiente trato: si delatamos a nuestro compañero como autor del disparo, estaremos
solamente un año en la cárcel, mientras que nuestro compañero estará diez.
Para poder ver más claramente la situación, lo primero que hacemos es una matriz de decisión (también llamada
normal), que tendrá el siguiente aspecto:
Dado que no sabemos lo que hará nuestro compinche, la mejor situación es delatarle independientemente de lo
que haga él, ya que si nos delata, iremos cinco años en vez de diez, y si no nos delata, iremos uno en vez de dos.
La situación mejor para ambos, como conjunto, sería que ambos no nos delatáramos y estuviéramos dos años
cada uno, pero dado que al final lo más probable es que el compañero piense como nosotros lo hemos hecho, al
final cada uno pasaremos cinco años en prisión. Esta situación alcanzada es el llamado equilibrio de Nash,
porque ambas partes no pueden cambiar sin empeorar su propia situación.
Juegos secuenciales
Pero en muchas ocasiones la decisión no se tomará de forma simultánea y, por tanto, la matriz anterior no nos
será de utilidad. En este caso el apoyo gráfico vendrá de la mano de un árbol de decisión, cuyas ramas llevarán
asociadas una probabilidad de suceso, y escogeremos el camino óptimo basándonos en las probabilidades
asociadas.
En este artículo me centraré exclusivamente en los juegos simultáneos, dejando de lado los secuenciales debido
a que su análisis y aplicaciones prácticas deben ser estudiados por separado.
Como casi todo en esta vida, la aplicación de la teoría de los juegos y el equilibrio de Nash tiene un doble punto
de vista: desde el punto de vista empresarial buscaremos alcanzar ese equilibrio para maximizar beneficios y
minimizar riesgos, mientras que desde las instituciones que evitan la creación de monopolios y oligopolios el
objetivo será crear leyes para evitar que ese equilibrio se produzca, con el fin de favorecer el libre comercio y la
competencia. Este artículo toma como referencia el prisma empresarial.
Desde esta vertiente las aplicaciones son infinitas y abarcan todo tipo de empresas: desde un pequeño puesto
de helados que está pensando en bajar los precios de sus productos y debe pensar cómo actuará el del puesto
de enfrente a una gran multinacional del automóvil que está pensando invertir cientos de millones de euros
para crear un vehículo eléctrico y necesita saber cuál será el retorno de su inversión y el riesgo asociado al
proyecto según lo que puede hacer su competencia.
Muchas veces estas decisiones, sobre todo cuando estamos en el ámbito de una pequeña empresa (pensemos
en el ejemplo del heladero), las hacemos basándonos en la intuición y la experiencia, confiando en que nuestra
decisión será la mejor. Pero las decisiones siempre serán más acertadas y fiables si las hacemos basándonos en
la estadística y otros conceptos matemáticos, como ya hemos podido ver en el dilema del prisionero. Por lo
menos, si finalmente sale mal, sabremos que teníamos de nuestro lado las probabilidades y hemos actuado de
forma correcta, siendo otros factores exógenos los que han malogrado nuestra estrategia.
En las grandes empresas, que disponen de departamentos enteros de análisis de riesgo, este tipo de decisiones
nunca son aleatorias y se basan en análisis de la competencia, estudios de mercado y análisis de riesgo. Pero
también podemos extrapolar este tipo de estrategias a pequeñas y medianas empresas, de acuerdo con
nuestras posibilidades económicas y medios disponibles.
Estrategias de estandarización
Una casuística concreta de la aplicación estratégica de la teoría de los juegos es la de la creación de estándares.
Cuando creamos un estándar, lo que buscamos es ser los primeros en hacerlo, para poder alcanzar la mayor
cuota de mercado posible, y así reforzar nuestra imagen de marca a la vez que nos situamos en una posición
privilegiada que, con una correcta estrategia, tendría que mantenerse en el futuro, pues tenemos la ventaja de
haber partido inicialmente en primera posición.
Cuando lanzamos un nuevo producto o servicio, es muy posible que la competencia también decida hacerlo y
esto afectará a nuestra estrategia. En este caso nos encontramos tres posibles situaciones:
Por ejemplo, las empresas que desarrollan aplicaciones móviles para iOS y Android.
Estándares indistinguibles: ambos estándares son parecidos y, por tanto, el óptimo es una batalla
abierta, ya que no hacerlo implicaría aumentar los beneficios de la empresa rival y reducir los nuestros.
Cada empresa desarrolla su estándar y el mercado es capaz de aceptar la coexistencia de ambos. La
matriz normal sería la siguiente:
Pensemos como ejemplo en dos empresas que, para poder cumplir las leyes medioambientales, se ven
obligadas a desarrollar el producto que menos beneficios les aporta, por ser el menos contaminante con el
medio ambiente.
Todas estas casuísticas no solo son aplicables a la introducción de nuevos estándares en el mercado; pensemos,
por ejemplo, en las similitudes con la creación de un nuevo producto o un servicio innovador.
Conclusión
Las matemáticas están presentes en muchas más situaciones de las que solemos pensar, no solo en el ámbito
económico o estratégico, sino también en nuestro día a día. Y es una ventaja para nosotros conocer esa
vinculación para poder aplicarla maximizando con ello nuestros beneficios. La teoría de los juegos es solo un
ejemplo más de cómo las matemáticas y la ciencia económica nos ayudan en nuestras decisiones rutinarias.
De modo que la próxima vez que veamos que el bar de debajo de casa ha bajado el precio del menú del día y el
bar contiguo a él no lo ha hecho, ya no pensaremos que es fruto de la casualidad, sino que debemos creer que la
decisión la han tomado basándose en una estrategia ligada a la estadística y las matemáticas, para intentar
maximizar el beneficio de ambos, o al menos así tendría que haber sido.
Por supuesto que detrás de este tipo de decisiones hay otros muchos factores, destacando otro concepto de
vital importancia: la imagen de marca, pues el restaurante de lujo nunca bajará el precio de su menú a 9 euros,
pero ese es otro concepto por cuya importancia merece tratarse aparte.
NOMBRE: Atahuichi Arcani Lizeth Carmen
Considere el problema siguiente: la compañía K, el fabricante de un cereal para el desayuno, tiene un 25% del
mercado actualmente. Datos del año anterior indican que el 88% de los clientes de K permanecían fieles ese
año, pero un 12% cambiaron a la competencia. Además, el 85% de los clientes de la competencia le
permanecían fieles a ella, pero 15% de los clientes de la competencia cambiaron a K. Asumiendo que estas
tendencias continúen determine ¿cual es la parte que K aprovecha del mercado?:
a. en 2 años; y
b. en el largo plazo.
Esta situación es un ejemplo de un problema de cambio de marcas que sucede muy a menudo que se presenta
en la venta de bienes de consumo.
Para resolver este problema hacemos uso de cadenas de Markov o procesos de Markov (qué es un tipo especial
de proceso estocástico). El procedimiento se da enseguida.
Procedimiento de solución
Observe que, cada año, un cliente puede estar comprando cereal de K o de la competencia. Podemos construir
un diagrama como el mostrado abajo donde los dos círculos representan a los dos estados en que un cliente
puede estar y los arcos representan la probabilidad de que un cliente haga una cambio cada año entre los
estados. Note que los arcos curvos indican una "transición" de un estado al mismo estado. Este diagrama es
conocido como el diagrama de estado de transición (notar que todos los arcos en ese diagrama son arcos
dirigidos).
Dado ese diagrama nosotros podemos construir la matriz de la transición (normalmente denotada por el símbolo
P) la qué nos dice la probabilidad de hacer una transición de un estado a otro estado. Sea:
Para estado 1 2
2 | 0.15 0.85 |
Note aquí que la suma de los elementos en cada fila de la matriz de la transición es uno.
Por datos de este año sabemos que actualmente K tiene un 25% del mercado. Tenemos que la fila de la matriz
que representa el estado inicial del sistema dada por:
Estado
12
[0.25, 0.75]
Normalmente denotamos esta fila de la matriz por s1 indicando el estado del sistema en el primer periodo (años
en este ejemplo en particular). Ahora la teoría de Markov nos dice que, en periodo (año) t, el estado del sistema
está dado por el st de la fila de la matriz, donde:
Tenemos que tener cuidado aquí al hacer la multiplicación de la matriz ya que el orden de cálculo es importante
(i.e. st-1(P) no es igual a (P)st-1 en general). Para encontrar st nosotros podríamos intentar hallar P directamente
para la potencia t-1 pero, en la práctica, es mucho más fácil de calcular el estado del sistema en cada sucesivo
año 1,2,3 ,..., t.
Nosotros ya sabemos el estado del sistema en el año 1 (s1) tal que el estado del sistema en el año dos (s2) está
dado por:
s2 = s1P
= [0.25,0.75] |0.88 0.12 |
........|0.15 0.85 |
= [0.3325, 0.6675]
Note que este resultado tiene sentido intuitivo, e.g. del 25% comprando actualmente al cereal de K, 88%
continúan haciendolo, aunque del 75% comprando el cereal del competidor 15% cambia a comprar cereal de K -
dando un (fracción) total de (0.25)(0.88) + (0.75)(0.15) = 0.3325 comprando cereal de K.
De lo anterior, en el año dos 33.25% de las personas están en estado 1 - esto es, está comprando cereal de K.
Note aquí que, como un chequeo numérico, los elementos de st deben sumar siempre uno.
s3 = s2P
= [0.392725, 0.607275]
Por lo tanto en el año tres 39.2725% de las personas están comprando al cereal de K.
Recalcar que está pendiente la cuestión hecha sobre la porción que K comparte del mercado en el largo plazo.
Esto implica que necesitamos calcular st cuando t se hace muy grande (se acerca al infinito).
La idea de la largo plazo es basada en la suposición de que, en el futuro, el sistema alcance un "equilibrio" (a
menudo llamado el "estado sustentable") en el sentido de que el st = st-1. Ésto no quiere decir que las
transiciones entre estados no tengan lugar, suceden, pero ellos tienden "al equilibrio global" tal que el número en
cada estado permanece el mismo.
Computational: - encontrar el estado sustentable calculando st para t=1,2,3,... y se detiene cuando st-1 y st son
aproximadamente el mismo. Esto es obviamente muy fácil para una computadora y este es el enfoque usado por
un paquete computacional.
Algebraico: - para evitar cálculos aritméticos largos necesarios para calcular st para t=1,2,3,... tenemos un atajo
algebraico que puede usarse. Recalcar que en el estado sustentable st = st-1 (= [x1,x2] para el ejemplo
considerado anteriormente). Entonces como st = st-1P tenemos eso
(y también notar que x1 + x2 = 1). De esto tenemos tres ecuaciones que podemos resolver.
Note aquí que hemos usado la palabra suposición anteriormente. Esto es porque no todos los sistemas alcanzan
un equilibrio, esto es, no cualquier sistema tiene matriz de transición
|01|
|1 0 |
Adoptando el enfoque algebraico anteriormente para el ejemplo del cereal K tenemos las tres ecuaciones
siguientes:
x1 = 0.88x1 + 0.15x2
x2 = 0.12x1 + 0.85x2
x1 + x2 = 1
0.12x1 - 0.15x2 = 0
0.12x1 - 0.15x2 = 0
x1 + x2 = 1
Note que la ecuación x1 + x2 = 1 es esencial. Sin élla no podríamos obtener una única solución para x1 y x2.
Resolviendo conseguimos x1 = 0.5556 y x2 = 0.4444
Por lo tanto, en la largo plazo, K comercializa una porción del mercado del 55.56%.
Un chequeo numérico útil (particularmente para problemas más grandes) es sustituir el examen final calculando
los valores en las ecuaciones originales para verificar que ellos son consistentes con esas ecuaciones.
1: 0.2500 2: 0.7500
.......De ...........A
1 1: 0.8800 2: 0.1200
2 1: 0.1500 2: 0.8500
El rendimiento se muestra debajo. Aunque el paquete puede usarse para calcular y desplegar st (para cualquier
valor de t) no hemos querido mostrar esto.
las probabilidades de estado sustentables (se necesitaron 38 iteraciones antes de que st-1 y st fueran
aproximadamente el mismo). Estas figuras son como se calcularon antes.
periodo recurrente para cada estado - éstos son el número esperado de periodos que pasarán para que una
persona en un estado esté de nuevo en ese estado (esto es, esperaríamos que hubieran 1.80 periodos (en
promedio) entre que una persona que compra el cereal de K y su próxima compra de cereal de K).
1: 0.5556 2: 0.4444
1: 1.80 2: 2.25
Datos
Note aquí que los datos que pueden necesitarse para deducir las probabilidades de transicióna, pueden a
menudo fácilmente encontrarse, hoy en día . Por ejemplo se colectar tales datos por marca del consumidor que
cambia, inspeccionando a los clientes individualmente. Sin embargo hoy día, muchos supermercados tienen sus
propias "tarjetas de lealtad" qué son registradas a través de inspecciones al mismo tiempo que un cliente hace
sus compras en la caja. Éstos proporcionan una masa de información detallada sobre el cambio de marca, así
como también otra información - por ejemplo el efecto de campañas promocionales.
Debe estar claro que las probabilidades de transición no necesitan se consideradas como números fijos - más
bien ellas son a menudo números que podemos influenciar/cambiar.
También note que la disponibilidad de tales datos permite modelos más detallados, al ser construidos. Por
ejemplo en el caso del cereal, la competencia fue representado por sólo un estado. Con datos más detallados
ese estado pudiera ser desagregado en varios estados diferentes - quizá uno para cada marca competidora del
cereal. También podríamos tener modelos diferentes para segmentos diferentes del mercado - quizá el cambio
de marca es diferente en áreas rurales del cambio de marca en áreas urbanas, por ejemplo. Las familias con
niños constituirían otro segmento importante del mercado obviamente.
Comentarios
Cualquier problema para el que puede obtenerse un diagrama de transición de estado y que usa el enfoque dado
puede analizarse.
ALGORITMO DE VENTSEL
Si el juego contiene jugadas de azar, además de las personales, entonces la
ganancia que producen las dos estrategias A1, Bj es una magnitud aleatoria que
depende de los términos de todas las jugadas de azar. En este caso el valor
natural de la ganancia esperada es su valor medio (la esperanza matemática).
Emplearemos el mismo signo aij para la ganancia misma (en los juegos sin
jugadas de azar) y para su valor medio (en los juegos con jugadas de azar).
A\B B1 B2 … Bn
A1 a11 a12 … a1n
A2 a21 a22 … a2n
… … … … …
Am am1 am2 … amn
Designaremos abreviadamente esta matriz del juego por ||aij||. Veamos algunos
ejemplos elementales de juegos.
A1 que es elegir la cara y A2, elegir la cruz. El adversario tiene también las
mismas dos estrategias: B1 (cara), B2 (cruz). Así que éste es un juego de 2 x
2. Consideraremos que la ganancia de una moneda se expresa con + 1. La
matriz del juego se representa aquí.
A\B B1 B2
A1 1 -1
A2 -1 1
Comencemos suponiendo que este juego se hace una sola vez. Entonces es
evidente que no tiene sentido hablar de tales o cuales "estrategias" de unos
jugadores más razonables que otros. Cada jugador puede elegir cualquier solución
con el mismo motivo. Sin embargo, al continuar el juego la cosa cambia.