Está en la página 1de 12

NOMBRE: Atahuichi Arcani Lizeth Carmen

C.I. 8437664 L.P. FECHA: 10/12 /2019

ASIGNATURA: Investigaciones operativas TIPO DE DOCUMENTO: Tarea

TEORIA DE JUEGOS
Empecemos por el principio: la teoría de los juegos es una rama de la economía aplicada también a otros
muchos ámbitos (como la estrategia empresarial, la política, la biología o incluso el póquer y el blackjack), que
consiste en tomar decisiones no solo con base ena partir de nuestro punto de vista, sino pensando en cómo
actuará la parte contraria según la decisión que tomemos nosotros.

Esta teoría se basa en el equilibrio de Nash (sí, John Forbes Nash, ese matemático premio Nobel de Economía
tan bien interpretado por Russell Crowe en Una mente maravillosa), que consiste en una situación donde hay
dos o más jugadores y ninguno de ellos quiere cambiar la situación de equilibrio, pues supondría empeorar su
propia situación. A partir de este concepto numerosos economistas, entre los que destaca John von Neumann,
fueron desarrollando esta teoría.

El dilema del prisionero

Para entender mejor el concepto del equilibrio de Nash y en qué consiste la teoría de los juegos, se suele
utilizar como ejemplo el llamado dilema del prisionero.

Supongamos una situación en la que somos detenidos junto con otra persona por un delito de robo. La pena por
este delito es de dos años de cárcel. La policía sabe que también ha habido un herido por arma de fuego, pero
no sabe cuál de los dos detenidos ha sido el culpable; la pena por este otro delito es de cinco años de prisión.

Ambos ladrones estamos totalmente incomunicados entre nosotros, y en el interrogatorio la policía nos
propone a cada uno el siguiente trato: si delatamos a nuestro compañero como autor del disparo, estaremos
solamente un año en la cárcel, mientras que nuestro compañero estará diez.

Para poder ver más claramente la situación, lo primero que hacemos es una matriz de decisión (también llamada
normal), que tendrá el siguiente aspecto:
Dado que no sabemos lo que hará nuestro compinche, la mejor situación es delatarle independientemente de lo
que haga él, ya que si nos delata, iremos cinco años en vez de diez, y si no nos delata, iremos uno en vez de dos.

La situación mejor para ambos, como conjunto, sería que ambos no nos delatáramos y estuviéramos dos años
cada uno, pero dado que al final lo más probable es que el compañero piense como nosotros lo hemos hecho, al
final cada uno pasaremos cinco años en prisión. Esta situación alcanzada es el llamado equilibrio de Nash,
porque ambas partes no pueden cambiar sin empeorar su propia situación.

Juegos secuenciales

La situación vista hasta ahora parte de tres premisas fundamentales:

 Hay dos o más jugadores.

 Ninguno conoce la decisión del resto.

 Las decisiones se toman de forma simultánea.

Pero en muchas ocasiones la decisión no se tomará de forma simultánea y, por tanto, la matriz anterior no nos
será de utilidad. En este caso el apoyo gráfico vendrá de la mano de un árbol de decisión, cuyas ramas llevarán
asociadas una probabilidad de suceso, y escogeremos el camino óptimo basándonos en las probabilidades
asociadas.

En este artículo me centraré exclusivamente en los juegos simultáneos, dejando de lado los secuenciales debido
a que su análisis y aplicaciones prácticas deben ser estudiados por separado.

Aplicaciones empresariales de la teoría de los juegos

Como casi todo en esta vida, la aplicación de la teoría de los juegos y el equilibrio de Nash tiene un doble punto
de vista: desde el punto de vista empresarial buscaremos alcanzar ese equilibrio para maximizar beneficios y
minimizar riesgos, mientras que desde las instituciones que evitan la creación de monopolios y oligopolios el
objetivo será crear leyes para evitar que ese equilibrio se produzca, con el fin de favorecer el libre comercio y la
competencia. Este artículo toma como referencia el prisma empresarial.

Desde esta vertiente las aplicaciones son infinitas y abarcan todo tipo de empresas: desde un pequeño puesto
de helados que está pensando en bajar los precios de sus productos y debe pensar cómo actuará el del puesto
de enfrente a una gran multinacional del automóvil que está pensando invertir cientos de millones de euros
para crear un vehículo eléctrico y necesita saber cuál será el retorno de su inversión y el riesgo asociado al
proyecto según lo que puede hacer su competencia.

Muchas veces estas decisiones, sobre todo cuando estamos en el ámbito de una pequeña empresa (pensemos
en el ejemplo del heladero), las hacemos basándonos en la intuición y la experiencia, confiando en que nuestra
decisión será la mejor. Pero las decisiones siempre serán más acertadas y fiables si las hacemos basándonos en
la estadística y otros conceptos matemáticos, como ya hemos podido ver en el dilema del prisionero. Por lo
menos, si finalmente sale mal, sabremos que teníamos de nuestro lado las probabilidades y hemos actuado de
forma correcta, siendo otros factores exógenos los que han malogrado nuestra estrategia.
En las grandes empresas, que disponen de departamentos enteros de análisis de riesgo, este tipo de decisiones
nunca son aleatorias y se basan en análisis de la competencia, estudios de mercado y análisis de riesgo. Pero
también podemos extrapolar este tipo de estrategias a pequeñas y medianas empresas, de acuerdo con
nuestras posibilidades económicas y medios disponibles.

Estrategias de estandarización

Una casuística concreta de la aplicación estratégica de la teoría de los juegos es la de la creación de estándares.
Cuando creamos un estándar, lo que buscamos es ser los primeros en hacerlo, para poder alcanzar la mayor
cuota de mercado posible, y así reforzar nuestra imagen de marca a la vez que nos situamos en una posición
privilegiada que, con una correcta estrategia, tendría que mantenerse en el futuro, pues tenemos la ventaja de
haber partido inicialmente en primera posición.

Cuando lanzamos un nuevo producto o servicio, es muy posible que la competencia también decida hacerlo y
esto afectará a nuestra estrategia. En este caso nos encontramos tres posibles situaciones:

Por ejemplo, las empresas que desarrollan aplicaciones móviles para iOS y Android.

 Estándares indistinguibles: ambos estándares son parecidos y, por tanto, el óptimo es una batalla
abierta, ya que no hacerlo implicaría aumentar los beneficios de la empresa rival y reducir los nuestros.
Cada empresa desarrolla su estándar y el mercado es capaz de aceptar la coexistencia de ambos. La
matriz normal sería la siguiente:

Por ejemplo, la coexistencia de DVD de tipo +R y de tipo -R.


 Pequeño hermano molesto: ambas empresas se ven obligadas a desarrollar el mismo estándar, pues la
batalla abierta implicaría un excesivo riesgo para ambas, y se ven obligadas a reducir el beneficio
potencial para minorar el riesgo. Además se ven obligadas a desarrollar el estándar que menos beneficio
les reporta a ambas (esto suele venir derivado de una ley restrictiva o una decisión política).

Pensemos como ejemplo en dos empresas que, para poder cumplir las leyes medioambientales, se ven
obligadas a desarrollar el producto que menos beneficios les aporta, por ser el menos contaminante con el
medio ambiente.

Todas estas casuísticas no solo son aplicables a la introducción de nuevos estándares en el mercado; pensemos,
por ejemplo, en las similitudes con la creación de un nuevo producto o un servicio innovador.

Conclusión

Las matemáticas están presentes en muchas más situaciones de las que solemos pensar, no solo en el ámbito
económico o estratégico, sino también en nuestro día a día. Y es una ventaja para nosotros conocer esa
vinculación para poder aplicarla maximizando con ello nuestros beneficios. La teoría de los juegos es solo un
ejemplo más de cómo las matemáticas y la ciencia económica nos ayudan en nuestras decisiones rutinarias.

De modo que la próxima vez que veamos que el bar de debajo de casa ha bajado el precio del menú del día y el
bar contiguo a él no lo ha hecho, ya no pensaremos que es fruto de la casualidad, sino que debemos creer que la
decisión la han tomado basándose en una estrategia ligada a la estadística y las matemáticas, para intentar
maximizar el beneficio de ambos, o al menos así tendría que haber sido.

Por supuesto que detrás de este tipo de decisiones hay otros muchos factores, destacando otro concepto de
vital importancia: la imagen de marca, pues el restaurante de lujo nunca bajará el precio de su menú a 9 euros,
pero ese es otro concepto por cuya importancia merece tratarse aparte.
NOMBRE: Atahuichi Arcani Lizeth Carmen

C.I. 8437664 L.P. FECHA: 10/12/2019

ASIGNATURA: Investigaciones operativas TIPO DE DOCUMENTO: Tarea

CADENAS O PROCESOS DE MARKOV


Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que ocurra un evento depende del
evento inmediato anterior. En efecto, las cadenas de este tipo tienen memoria, "Recuerdan" el último evento y
esto condiciona las posibilidades de los eventos futuros. Esta dependencia del evento anterior distingue a las
cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. En los
negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra,los deudores morosos,
para planear las necesidades de personal y para analizar el reemplazo de equipo. El análisis de Markov, llamado
así en honor de un matemático ruso que desarrollo el método en 1907, permite encontrar la probabilidad de que
un sistema se encuentre en un estado en particular en un momento dado. Algo más importante aún, es que
permite encontrar el promedio a la larga o las probabilidades de estado estable para cada estado. Con esta
información se puede predecir el comportamiento del sistema a través del tiempo. La tarea más difícil es
reconocer cuándo puede aplicarse. La caracteristica más importante que hay que buscar en la memoria de un
evento a otro.

Considere el problema siguiente: la compañía K, el fabricante de un cereal para el desayuno, tiene un 25% del
mercado actualmente. Datos del año anterior indican que el 88% de los clientes de K permanecían fieles ese
año, pero un 12% cambiaron a la competencia. Además, el 85% de los clientes de la competencia le
permanecían fieles a ella, pero 15% de los clientes de la competencia cambiaron a K. Asumiendo que estas
tendencias continúen determine ¿cual es la parte que K aprovecha del mercado?:

a. en 2 años; y
b. en el largo plazo.

Esta situación es un ejemplo de un problema de cambio de marcas que sucede muy a menudo que se presenta
en la venta de bienes de consumo.

Para resolver este problema hacemos uso de cadenas de Markov o procesos de Markov (qué es un tipo especial
de proceso estocástico). El procedimiento se da enseguida.

Procedimiento de solución
Observe que, cada año, un cliente puede estar comprando cereal de K o de la competencia. Podemos construir
un diagrama como el mostrado abajo donde los dos círculos representan a los dos estados en que un cliente
puede estar y los arcos representan la probabilidad de que un cliente haga una cambio cada año entre los
estados. Note que los arcos curvos indican una "transición" de un estado al mismo estado. Este diagrama es
conocido como el diagrama de estado de transición (notar que todos los arcos en ese diagrama son arcos
dirigidos).
Dado ese diagrama nosotros podemos construir la matriz de la transición (normalmente denotada por el símbolo
P) la qué nos dice la probabilidad de hacer una transición de un estado a otro estado. Sea:

estado 1 = cliente que compra cereal de K y

estado 2 = cliente que compra cereal de la competencia

tenemos así la matriz de transición P para este problema, dada por

Para estado 1 2

Del estado 1 | 0.88 0.12 |

2 | 0.15 0.85 |

Note aquí que la suma de los elementos en cada fila de la matriz de la transición es uno.

Por datos de este año sabemos que actualmente K tiene un 25% del mercado. Tenemos que la fila de la matriz
que representa el estado inicial del sistema dada por:

Estado

12

[0.25, 0.75]

Normalmente denotamos esta fila de la matriz por s1 indicando el estado del sistema en el primer periodo (años
en este ejemplo en particular). Ahora la teoría de Markov nos dice que, en periodo (año) t, el estado del sistema
está dado por el st de la fila de la matriz, donde:

st = st-1(P) =st-2(P)(P) = ... = s1(P)t-1

Tenemos que tener cuidado aquí al hacer la multiplicación de la matriz ya que el orden de cálculo es importante
(i.e. st-1(P) no es igual a (P)st-1 en general). Para encontrar st nosotros podríamos intentar hallar P directamente
para la potencia t-1 pero, en la práctica, es mucho más fácil de calcular el estado del sistema en cada sucesivo
año 1,2,3 ,..., t.

Nosotros ya sabemos el estado del sistema en el año 1 (s1) tal que el estado del sistema en el año dos (s2) está
dado por:

s2 = s1P
= [0.25,0.75] |0.88 0.12 |

........|0.15 0.85 |

= [(0.25)(0.88) + (0.75)(0.15), (0.25)(0.12) + (0.75)(0.85)]

= [0.3325, 0.6675]

Note que este resultado tiene sentido intuitivo, e.g. del 25% comprando actualmente al cereal de K, 88%
continúan haciendolo, aunque del 75% comprando el cereal del competidor 15% cambia a comprar cereal de K -
dando un (fracción) total de (0.25)(0.88) + (0.75)(0.15) = 0.3325 comprando cereal de K.

De lo anterior, en el año dos 33.25% de las personas están en estado 1 - esto es, está comprando cereal de K.
Note aquí que, como un chequeo numérico, los elementos de st deben sumar siempre uno.

En el año tres el estado del sistema se da por:

s3 = s2P

= [0.3325, 0.6675] |0.88 0.12 |

............... |0.15 0.85 |

= [0.392725, 0.607275]

Por lo tanto en el año tres 39.2725% de las personas están comprando al cereal de K.

Recalcar que está pendiente la cuestión hecha sobre la porción que K comparte del mercado en el largo plazo.
Esto implica que necesitamos calcular st cuando t se hace muy grande (se acerca al infinito).

La idea de la largo plazo es basada en la suposición de que, en el futuro, el sistema alcance un "equilibrio" (a
menudo llamado el "estado sustentable") en el sentido de que el st = st-1. Ésto no quiere decir que las
transiciones entre estados no tengan lugar, suceden, pero ellos tienden "al equilibrio global" tal que el número en
cada estado permanece el mismo.

Hay dos enfoques básicos para calcular el estado sustentable:

Computational: - encontrar el estado sustentable calculando st para t=1,2,3,... y se detiene cuando st-1 y st son
aproximadamente el mismo. Esto es obviamente muy fácil para una computadora y este es el enfoque usado por
un paquete computacional.

Algebraico: - para evitar cálculos aritméticos largos necesarios para calcular st para t=1,2,3,... tenemos un atajo
algebraico que puede usarse. Recalcar que en el estado sustentable st = st-1 (= [x1,x2] para el ejemplo
considerado anteriormente). Entonces como st = st-1P tenemos eso

[x1,x2] = [x1,x2] | 0.88 0.12 |

.............| 0.15 0.85 |

(y también notar que x1 + x2 = 1). De esto tenemos tres ecuaciones que podemos resolver.
Note aquí que hemos usado la palabra suposición anteriormente. Esto es porque no todos los sistemas alcanzan
un equilibrio, esto es, no cualquier sistema tiene matriz de transición

|01|

|1 0 |

nunca alcanza un estado sustentable.

Adoptando el enfoque algebraico anteriormente para el ejemplo del cereal K tenemos las tres ecuaciones
siguientes:

x1 = 0.88x1 + 0.15x2

x2 = 0.12x1 + 0.85x2

x1 + x2 = 1

0.12x1 - 0.15x2 = 0

0.12x1 - 0.15x2 = 0

x1 + x2 = 1

Note que la ecuación x1 + x2 = 1 es esencial. Sin élla no podríamos obtener una única solución para x1 y x2.
Resolviendo conseguimos x1 = 0.5556 y x2 = 0.4444

Por lo tanto, en la largo plazo, K comercializa una porción del mercado del 55.56%.

Un chequeo numérico útil (particularmente para problemas más grandes) es sustituir el examen final calculando
los valores en las ecuaciones originales para verificar que ellos son consistentes con esas ecuaciones.

Paquete de Computo para la solución


El problema anterior se resolvió usando un paquete, la entrada se muestra abajo.

Datos de entrada del Problema del cereal de K (Iniciales Probabilidades de Estado)

1: 0.2500 2: 0.7500

Datos de entrada del Problema del cereal de K (Matriz de Probabilidades de Transición) Pg 1

.......De ...........A

1 1: 0.8800 2: 0.1200

2 1: 0.1500 2: 0.8500
El rendimiento se muestra debajo. Aunque el paquete puede usarse para calcular y desplegar st (para cualquier
valor de t) no hemos querido mostrar esto.

En el rendimiento mostrado abajo de la nota:

las probabilidades de estado sustentables (se necesitaron 38 iteraciones antes de que st-1 y st fueran
aproximadamente el mismo). Estas figuras son como se calcularon antes.

periodo recurrente para cada estado - éstos son el número esperado de periodos que pasarán para que una
persona en un estado esté de nuevo en ese estado (esto es, esperaríamos que hubieran 1.80 periodos (en
promedio) entre que una persona que compra el cereal de K y su próxima compra de cereal de K).

Iteración final--las Iteraciones Totales = 38

1: 0.5556 2: 0.4444

Periodo recurrente para Cada Estado

1: 1.80 2: 2.25

Datos

Note aquí que los datos que pueden necesitarse para deducir las probabilidades de transicióna, pueden a
menudo fácilmente encontrarse, hoy en día . Por ejemplo se colectar tales datos por marca del consumidor que
cambia, inspeccionando a los clientes individualmente. Sin embargo hoy día, muchos supermercados tienen sus
propias "tarjetas de lealtad" qué son registradas a través de inspecciones al mismo tiempo que un cliente hace
sus compras en la caja. Éstos proporcionan una masa de información detallada sobre el cambio de marca, así
como también otra información - por ejemplo el efecto de campañas promocionales.

Debe estar claro que las probabilidades de transición no necesitan se consideradas como números fijos - más
bien ellas son a menudo números que podemos influenciar/cambiar.

También note que la disponibilidad de tales datos permite modelos más detallados, al ser construidos. Por
ejemplo en el caso del cereal, la competencia fue representado por sólo un estado. Con datos más detallados
ese estado pudiera ser desagregado en varios estados diferentes - quizá uno para cada marca competidora del
cereal. También podríamos tener modelos diferentes para segmentos diferentes del mercado - quizá el cambio
de marca es diferente en áreas rurales del cambio de marca en áreas urbanas, por ejemplo. Las familias con
niños constituirían otro segmento importante del mercado obviamente.

Comentarios
Cualquier problema para el que puede obtenerse un diagrama de transición de estado y que usa el enfoque dado
puede analizarse.

Las ventajas y desventajas de usar teoría de Markov incluyen:

 Teoría de Markov es simple de aplicar y entender.


 Cálculos de sensibilidad ( contestar las preguntas "qué-si") se llevan a cabo fácilmente.
 La teoría de Markov nos da con el tiempo una visión de los cambios en el sistema.
 P puede ser dependiente del estado actual del sistema. Si P es dependiente tanto del tiempo y del
estado actual del sistema i.e., P es una función de t y st, entonces la ecuación de Markov básica se
vuelve st=st-1P(t-1,st-1).
. NOMBRE: Atahuichi Arcani Lizeth Carmen

C.I. 8437664 L.P. FECHA: 10/11/2019

ASIGNATURA: Investigaciones operativas TIPO DE DOCUMENTO: Tarea

ALGORITMO DE VENTSEL
Si el juego contiene jugadas de azar, además de las personales, entonces la
ganancia que producen las dos estrategias A1, Bj es una magnitud aleatoria que
depende de los términos de todas las jugadas de azar. En este caso el valor
natural de la ganancia esperada es su valor medio (la esperanza matemática).
Emplearemos el mismo signo aij para la ganancia misma (en los juegos sin
jugadas de azar) y para su valor medio (en los juegos con jugadas de azar).

Supongamos que conocemos el valor tu de la ganancia (o de la ganancia media)


en cada par de estrategias. Se pueden expresar los valores aij en forma de una
tabla (matriz) en la que las líneas corresponden a nuestras estrategias (A,) y las
columnas, a las estrategias del adversario (Bn). Esta tabla se denomina matriz de
pago o simplemente matriz del juego.

La matriz del juego de m x a tiene la forma siguiente:

A\B B1 B2 … Bn
A1 a11 a12 … a1n
A2 a21 a22 … a2n
… … … … …
Am am1 am2 … amn

Designaremos abreviadamente esta matriz del juego por ||aij||. Veamos algunos
ejemplos elementales de juegos.

Ejemplo 1. Dos jugadores, A y B. sin mirarse el uno al otro colocan en la


mesa una moneda cada uno en posición de cara arriba o de cruz arriba,
según su propio parecer. Si eligieron la misma posición (los dos pusieron
cara o los dos cruz) entonces el jugador A se queda con las dos monedas, en
caso contrario el jugador B se queda con ellas. Se debe analizar el juego y
componer su matriz.
Resolución. El juego consta sólo de dos jugadas: la nuestra y la del
adversario. Las dos son personales. Este juego no pertenece a los juegos
con información perfecta puesto que en el momento en el cual se hace la
jugada el jugador no sabe lo que ha hecho el otro.

Como cada jugador tiene sólo una jugada personal, su estrategia es la


elección en esta única jugada personal.

Nosotros tenemos dos estrategias:

A1 que es elegir la cara y A2, elegir la cruz. El adversario tiene también las
mismas dos estrategias: B1 (cara), B2 (cruz). Así que éste es un juego de 2 x
2. Consideraremos que la ganancia de una moneda se expresa con + 1. La
matriz del juego se representa aquí.

A\B B1 B2
A1 1 -1
A2 -1 1

En el ejemplo de este juego, a pesar de ser tan elemental, es posible aclarar


ciertas ideas esenciales de la teoría de los juegos.

Comencemos suponiendo que este juego se hace una sola vez. Entonces es
evidente que no tiene sentido hablar de tales o cuales "estrategias" de unos
jugadores más razonables que otros. Cada jugador puede elegir cualquier solución
con el mismo motivo. Sin embargo, al continuar el juego la cosa cambia.

Realmente, supongamos que nosotros (el jugador A) elegimos cierta estrategia


(digamos la A1) y nos atenemos a ella. Entonces ya por los resultados de las
primeras jugadas el adversario adivinará nuestra estrategia y responderá de la
manera menos ventajosa para nosotros o sea escogiendo la cruz. Estará claro que
sería para nosotros desfavorable emplear siempre una misma estrategia: para no
quedar con pérdidas tenemos que elegir unas veces cara y otras cruz. No
obstante, si vamos a alternar la cara y la cruz con alguna sucesión determinada
(por ejemplo una jugada sí y otra no) el adversario también puede observarlo y
responder a esta estrategia de la peor manera para nosotros. Evidentemente, el
procedimiento de más seguridad que garantiza que el adversario no conozca
nuestra estrategia es una organización de la elección en cada jugada en la que
nosotros mismos no conozcamos de antemano la solución (eso se puede asegurar,
por ejemplo, lanzando una moneda al aire). Así, con razonamientos intuitivos
llegamos a una de las nociones esenciales de la teoría de los juegos, a la noción de
la "estrategia mixta", o sea aquella en la que las estrategias "puras" (en nuestro
caso A1 y A2) se alternen aleatoriamente con determinadas frecuencias. En el
ejemplo dado, partiendo del razonamiento de la simetría, está claro
anticipadamente que las estrategias A1 y A2 deben alternar con igual frecuencia;
en juegos más complicados la resolución puede estar lejos de ser trivial.

También podría gustarte