Está en la página 1de 32

TEORÍA DE JUEGOS

OLINDA GALVAN HERNANDEZ


LISBETH CECILIA DE LAS SALAS TOLOZA
RAFAEL DAVID BERRIO VERGARA
JOSE ALBERTO DE HOYOS DOMINGUEZ

MÉTODOS ESTOCÁSTICOS

ENTREGADO A:
ING. JAIRO DANIEL OCHOA GUERRA

UNIVERSIDAD DE CÓRDOBA
FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA DE SISTEMAS Y TELECOMUNICACIONES
INGENIERÍA DE SISTEMAS
MONTERÍA
2022
TABLA DE CONTENIDO

1. INTRODUCCIÓN 3

2. OBJETIVOS 4
2.1 OBJETIVO GENERAL 4
2.2 OBJETIVOS ESPECÍFICOS 4

3. INTRODUCCIÓN A LA TEORÍA DE JUEGOS 5

4. IDENTIFICACIÓN DE UNA ESTRATEGIA PURA 6

5. JUEGOS DE ESTRATEGIA MIXTA 7

6. RESOLVER LOS JUEGOS DE SUMA CERO PARA DOS PERSONAS 11

7. TIPO DE JUEGOS Y EJEMPLOS 11

8. EJERCICIOS PROPUESTOS 16

9. CONCLUSIÓN 17

BIBLIOGRAFÍA 18
1. INTRODUCCIÓN

La Teoría de Juegos es una teoría matemática que estudia las características generales de las
situaciones competitivas de manera formal y abstracta. Es útil para tomar decisiones en casos donde
dos o más personas que deciden se enfrentan en un conflicto de intereses. Así, estudia la toma de
decisiones en interacción (ejemplos: el juego de ajedrez, la negociación política, las estrategias
militares).
2. OBJETIVOS

2.1 OBJETIVO GENERAL

Conocer las diferentes teorías de juegos que se exponen en este trabajo, los elementos que
la conforman y el papel que desempeñan cada uno para el logro de un objetivo final el cual
favorecerá a uno solo de los componentes.

2.2 OBJETIVOS ESPECÍFICOS

● Identificar los elementos principales que intervienen en el modelo de la teoría de juegos.

● Exponer mediante ejemplos sencillos y cortos el desarrollo de cada teoría expuesta.

● Relacionar de acuerdo a cualquier situación experimentada que teoría se está ejerciendo según
los modelos explicados.
3. INTRODUCCIÓN A LA TEORÍA DE JUEGOS

El juego es un concepto arraigado a todo ser social, ya que nos relacionamos con este desde
temprana edad, facilita los procesos educativos y el intercambio de emociones que
desarrollamos para enfrentar el mundo real. Podemos decir entonces que el juego es una
situación en la que compiten dos o más jugadores que usan ciertas herramientas o
conocimientos y tiene un determinado número de reglas con el fin proporcionar
entretenimiento, diversión o cumplir algún objetivo, tomando en cuenta que se puede ganar
como se puede perder. Dentro de un juego, se supone que todos los participantes son
racionales.

Como es de esperarse, cada jugador intentará maximizar su ganancia, pero hay que tomar en
cuenta que el resultado no sólo dependerá de lo que un solo jugador elija, sino que también,
dependerá de las estrategias que utilicen los demás jugadores.

La teoría de Juegos ha demostrado una gran versatilidad para la resolución de problemas


actuales. En el desarrollo de este trabajo se verá el concepto de las teorías de juegos y los
diferentes tipos juegos una pregunta que podemos responder es ¿Dónde podemos aplicar esta
teoría?

la Teoría de Juegos tiene bastantes aplicaciones, por ejemplo: en la Economía, ayuda a la


distribución de recursos entre oferentes y demandantes para que exista una competencia
perfecta;

en la política, se puede ver reflejada en las campañas que utilizan los diferentes partidos
políticos para llegar al poder en las elecciones; en la Biología, se ha utilizado para
comprender y predecir algunos resultados evolutivos;

En Sociología, se utiliza para estudiar el comportamiento de grupos delincuentes y


ejemplificar el modo en el que pueden llegar a operar, etc. Todas las aplicaciones
mencionadas anteriormente tienen algo en común, el resultado de estas situaciones dependerá
de las decisiones que tomen los jugadores.
4. IDENTIFICACIÓN DE UNA ESTRATEGIA PURA

Una estrategia pura es un término empleado para designar un tipo de estrategias en teoría de juegos.
Cada jugador tiene a su disposición un conjunto de estrategias. Si un jugador elige una acción con
probabilidad 1 entonces está jugando una estrategia pura. Esto la diferencia de la estrategia mixta,
donde jugadores individuales eligen una distribución de probabilidad sobre muchas acciones.

Debido a ser un caso particular de las estrategias mixtas, solamente las estrategias puras fueron
estudiadas en un principio. Uno de los primeros en hacerlo fue Antoine Augustin Cournot en su
trabajo sobre oligopolios, donde en un modelo de competencia de empresas encuentra los equilibrios
de Nash en estrategias puras.

Relación con las estrategias mixtas

Intuitivamente una estrategia mixta consiste en asignarle cierta probabilidad a cada una de las
estrategias puras (para una definición formal ver estrategia mixta). Estas probabilidades no tienen por
qué ser estrictamente mayores que cero, de manera que si a una de las estrategias le asignamos la
probabilidad 1 y probabilidad 0 a todas las demás, entonces el resultado es una estrategia pura. De
este modo las estrategias puras resultan ser un caso particular de las estrategias mixtas.

Ejemplos

Piedra papel o tijeras


Para este juego el conjunto de jugadores es 𝑁 = {1, 2} y las estrategias son
𝐷1 = {𝑝𝑖𝑒𝑑𝑟𝑎, 𝑝𝑎𝑝𝑒𝑙, 𝑡𝑖𝑗𝑒𝑟𝑎𝑠} = 𝐷2 . De aquí que existan tres estrategias puras para cada jugador
y los perfiles de estrategias puras resulten ser: (piedra,piedra), (piedra,papel), (piedra,tijeras),
(papel,piedra), (papel,papel), (papel,tijeras), (tijeras,piedra), (tijeras,papel), (tijeras, tijeras), donde la
primera coordenada es la estrategia pura del jugador 1 y la segunda coordenada es la estrategia pura
del jugador 2.

Dilema del prisionero


En el famoso dilema del prisionero, cada jugador tiene dos estrategias puras: Confesar o No Confesar.
Al ser dos estrategias puras para cada jugador existirán 2x2=4 perfiles de estrategias puras.
Formalmente en el dilema del prisionero tenemos un juego rectangular con 𝑁 = {1, 2} y estrategias
puras 𝐷1 = {𝑐𝑜𝑛𝑓𝑒𝑠𝑎𝑟, 𝑛𝑜 𝑐𝑜𝑛𝑓𝑒𝑠𝑎𝑟} = 𝐷2.
5. JUEGOS DE ESTRATEGIA MIXTA

Anterior a este apartado se hablaba de las estrategias puras, que si son jugadas implican que los pagos
a todos los actores son determinísticos. Si las elecciones son aleatorias debemos incluir elecciones
randomizadas (aleatoriamente). Estipulamos que la randomización realizada por cada jugador es
independiente de las de los demás. Cuando un jugador i ∈ I elige una estrategia randomizada, todo
otro jugador j ∈ I╲{i} debe estar en la incertidumbre sobre qué estrategia pura si ∈ Si está eligiendo
el jugador i-ésimo. Si abandonamos este concepto, ello nos conduce a la noción de estrategias
correlacionadas.

i = Jugador 1.

j = Jugador 2.

si = Estrategia pura.

σi = Estrategia mixta.

Una estrategia mixta especifica un valor dentro del rango [0,1] (probabilidad) para cada si ∈ Si.
Cada jugador elige una y sólo una estrategia si ∈ Si pura en cada jugada del juego. Luego cualquier
estrategia mixta σi ∈ ∆(Si) debe ser tal que la suma de las probabilidades con que son jugadas las
estrategias puras sea uno, es decir ∑si ∈ Si entonces σi(Si)=1. Esta propiedad se satisface si σi(Si) es
una distribución de probabilidad sobre Si. Ésta es la justificación de utilizar una distribución de
probabilidad para representar a una estrategia mixta.

Siguiendo una idea equivalente a como se definió un perfil de estrategias puras se puede definir un
perfil de estrategias mixtas σ; el espacio de estrategias mixtas Σ; y al espacio soporte de la estrategia
mixta sop(σi) como el conjunto de estrategias puras a las que se asigna una probabilidad positiva.

En otras palabras, una estrategia mixta es la solución en la cual el jugador selecciona al azar la
estrategia para jugar entre varias estrategias con probabilidades positivas. La solución para el juego de
estrategia mixta identifica las probabilidades que cada jugador debe utilizar para seleccionar al azar la
estrategia a jugar.

Puntos de equilibrio en estrategias mixtas

En el cuadro siguiente, supóngase que el jugador 1 selecciona la estrategia (si ∈ Si )1 y el jugador 2


selecciona la estrategia (sj ∈ Sj )2 , y por consiguiente el rendimiento de 1 es (uij ≡ ∏ij )1 y
análogamente el rendimiento de 2 es (uij ≡ ∏ij )2. Suponiendo que pi1 es la probabilidad del jugador 1
de seleccionar la estrategia pura si, (si ∈ Si )1 la estrategia mixta para el jugador 1 será expresada
como:
P1 = (p11 ,p12 , ...,pm1) con p1 1’=1, p1 ≥0.

En forma análoga, si pj2 es la probabilidad del jugador 2 de seleccionar la estrategia pura sj, (sj ∈ Sj
)2 la estrategia mixta para el jugador 2 viene dada por

P2 = (p12,p22, ...,pn2 ) con p2 1’=1, p2 ≥0.

Un punto de equilibrio en estrategias mixtas es entonces el par de vectores p1* y p2* cada uno de los
cuales es una estrategia óptima, en el sentido de maximizar el rendimiento esperado, suponiendo que
el otro jugador emplea su estrategia mixta (óptima). Se tiene, por lo tanto:

Para todo juego finito bipersonal existe un par de vectores de estrategias mixtas como las anteriores,
que definen un equilibrio, pero este par no tiene por qué ser único, ni tampoco tiene por qué dar pagos
únicos (esperados). En términos generales, existe un equilibrio de estrategias mixtas para todo juego
de n personas con un número finito de estrategias. El equilibrio es un conjunto de estrategias mixtas
para los jugadores tal que ninguno de los jugadores puede mejorar su situación mediante un cambio
unilateral de sus estrategias mixtas.

Ejemplo básico de estrategias mixta

Las estrategias mixtas son analizadas en la teoría de juegos cuando hay muchos equilibrios posibles,
lo cual es especialmente el caso en los juegos de coordinación. La guerra de los sexos es un ejemplo
común de un juego de coordinación en el que hay dos equilibrios de Nash (subrayados en rojo abajo),
lo que significa que ningún equilibrio real puede ser alcanzado. Recordemos que…

El equilibrio de Nash es un “concepto de solución” para juegos con dos o más jugadores,​ el cual
asume que:

● · Cada jugador conoce y ha adoptado su mejor estrategia, y


● · Todos conocen las estrategias de los otros.

Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros
mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" posible teniendo en
cuenta los movimientos de los demás jugadores.

En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en
práctica, y saben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de
los otros. Consecuentemente, ningún jugador tiene ningún incentivo para modificar individualmente
su estrategia.

Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado
conjunto para los participantes, sino solo el mejor resultado para cada uno de ellos considerados
individualmente. Es perfectamente posible que el resultado fuera mejor para todos si, de alguna
manera, los jugadores coordinaran su acción.
Ahora continuando con el ejemplo en la guerra de los sexos, una pareja discute sobre qué hacer el fin
de semana. Ambos saben que quieren pasar el fin de semana juntos, pero no se ponen de acuerdo
sobre qué hacer. El hombre prefiere ir a ver un juego de fútbol, mientras que la mujer quiere ir al cine.
Por tanto, la matriz de juego es como sigue:

MUJER

HOMBRE Cine Fútbol

Cine 2,1 0,0

Fútbol 0,0 1,2

En este caso, conocer la estrategia del rival no ayudará a decidir la estrategia a seguir, y existe la
posibilidad de que no se pueda alcanzar un equilibrio. La manera de resolver este dilema es a través
del uso de estrategias mixtas, en las que nos fijamos en la probabilidad de que nuestro oponente elija
una u otra estrategia y valorar nuestros pagos dada esa probabilidad.

Vamos a suponer que la mujer puede que elija el fútbol con probabilidad q, e ir al cine con
probabilidad (1-q). Del mismo modo, él puede que elija el fútbol con una probabilidad de r, e ir al cine
con probabilidad (1-r). En este caso, nuestros resultados son los siguientes:

● · Fútbol-fútbol: qr
● · Cine- fútbol: (1-r) q
● · Fútbol-cine: r (1-q)
● · Cine-cine: (1-q) (1-r)
MUJER

HOMBRE Cine Fútbol

Cine 2,1 0,0 r.

Fútbol 0,0 1,2 1-r

q. 1-q

Las posibilidades del hombre de ir al partido de fútbol (su utilidad esperada) serán 2r (pago
multiplicado por la probabilidad) y, de ir al cine, 1-r (porque la utilidad derivada de ir al cine es 1),
por lo tanto r = 1/3.

Análogamente, para la mujer, q = 2/3. Ahora ella debe analizar a qué equivalen (las posibilidades de
que el hombre valore de su propia felicidad sobre la de ella). Si r> 1/3, irán al juego de fútbol. Si r =
1/3, cualquiera podría suceder, y si r <1/3, irán al cine. Tanto la mujer como el hombre deben analizar
esto con cuidado ya que, si se equivocan en la valoración de la probabilidad, puesto que esto sigue
siendo un juego simultáneo y no hay segundas oportunidades, podrían terminar pasando el fin de
semana en diferentes sitios, lo que significaría menos utilidad para ambos.
6. RESOLVER LOS JUEGOS DE SUMA CERO PARA DOS PERSONAS

En teoría de juegos no cooperativos, un juego de suma cero describe una situación en la que la
ganancia o pérdida de un participante se equilibra con exactitud con las pérdidas o ganancias de los
otros participantes.

Se llama así porque si se suma el total de las ganancias de los participantes y se resta las pérdidas
totales el resultado es cero. El go, el Pokémon y el juego del oso son ejemplos de juegos de suma
cero. La suma cero es un caso especial del caso más general de suma constante donde los beneficios y
las pérdidas de todos los jugadores suman el mismo valor, porque se gana exactamente la cantidad que
pierde el oponente. Cortar una tarta es de suma constante o cero porque llevarte un trozo más grande
reduce la cantidad de tarta que les queda a los demás. Situaciones donde los participantes pueden
beneficiarse o perder al mismo tiempo, como el intercambio de productos entre una nación que
produce un exceso de naranjas y otra que produce un exceso de manzanas, en la que ambas se
benefician de la transacción, se denominan «de suma no nula».

El concepto fue desarrollado en la Teoría de juegos, por lo que a menudo a las situaciones de suma
cero se les llama «juegos de suma cero». Esto no implica que el concepto, o la teoría de juegos misma,
se aplique únicamente a lo que normalmente se conoce como juegos. Las estrategias óptimas para
juegos de suma cero de dos jugadores suelen emplear estrategias minimax.

En 1944 John von Neumann y Oskar Morgenstern probaron que cualquier juego de suma cero que
involucre a n jugadores es de hecho una forma generalizada de un juego de suma cero para dos
personas, y que cualquier juego de suma no cero para n jugadores puede reducirse a un juego de suma
cero para n + 1 jugadores, donde el jugador (n + 1) representa la ganancia o pérdida total (puede
pensarse en la banca de ciertos juegos). Esto sugiere que los juegos de suma cero para dos jugadores
forman el núcleo esencial de la teoría de juegos.1​

Tratar a una situación de suma no nula como una situación de suma cero, o creer que todas las
situaciones son de suma cero, se denomina falacia de suma cero.

En juegos cooperativos, existe un tipo de juegos íntimamente relacionados con estos, más
comúnmente llamados juegos decisivos o auto-duales.

La matriz de recompensas de un juego es una forma de representación conveniente. Considérese el


ejemplo del juego de suma cero mostrado a la derecha.

El orden de juego es el siguiente: el primer jugador elige en secreto una de las dos acciones 1 o 2; el
segundo jugador, sin conocer la elección del primero, elige en secreto una de las tres acciones A, B o
C. Entonces se revelan las elecciones de cada jugador y el total de puntos se ve afectado de acuerdo a
la recompensa por tales elecciones.

Ejemplo: el primer jugador elige 2 y el segundo elige B. Cuando se asignan las recompensas, el
primer jugador gana 20 puntos y el segundo pierde 20 puntos.

En este ejemplo, los dos jugadores conocen la matriz de recompensas y tratan de maximizar sus
puntos; ¿qué deben hacer?
El jugador 1 puede razonar de la siguiente forma: «con la acción 2, puedo perder 20 puntos y ganar
solo 20, mientras que con la 1 puedo perder solo 10 pero puedo ganar 30, así que 1 parece mucho
mejor». Con un razonamiento similar, 2 elegirá C. Si los dos jugadores toman esas elecciones, el
primer jugador ganará 20 puntos. ¿Pero qué pasa si el jugador 2 anticipa el razonamiento de 1, y elige
B, para ganar 10 puntos, o si el primer jugador anticipa este truco y elige 2, para ganar 20 puntos?

John von Neumann tuvo la idea fundamental y sorprendente de que la probabilidad proporciona una
forma de salir de este enredo. En lugar de decidirse por una acción definitiva, los dos jugadores
asignan probabilidades a sus acciones, y entonces usan un dispositivo que, de acuerdo con dichas
probabilidades, elige una acción por ellos. Cada jugador calcula las probabilidades para minimizar el
máximo valor esperado de las pérdidas independientemente de la estrategia del oponente; esto lleva a
un problema de álgebra lineal con una solución única para cada jugador. Este método minimax puede
calcular estrategias óptimas para todos los juegos de dos jugadores y suma cero.

Para el ejemplo de arriba, resulta que el primer jugador debe de elegir 1 con probabilidad 57%, y la
acción 2 con probabilidad 43%, mientras que el segundo debería asignar las probabilidades 0%, 57%
y 43% a las tres opciones A, B y C.

El jugador 1 ganará entonces 2,85 puntos de media por juego.

7. TIPO DE JUEGOS Y EJEMPLOS

La teoría clasifica los juegos en muchas categorías que determinan qué métodos particulares se
pueden aplicar para resolverlos (y, de hecho, también cómo se define "resolución" en una categoría
particular). Las categorías comunes incluyen:

Juegos simétricos y asimétricos

Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular
dependen solo de las estrategias que empleen los otros jugadores y no de quien las juegue. Si las
identidades de los jugadores pueden cambiarse sin que cambien las recompensas de las estrategias,
entonces el juego es simétrico. Muchos de los juegos 2×2 más estudiados son simétricos. Las
representaciones estándar del juego del gallina, el dilema del prisionero y la caza del ciervo son
juegos simétricos.

Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias idénticas
para ambos jugadores. Por ejemplo, el juego del ultimátum y el juego del dictador tienen diferentes
estrategias para cada jugador; no obstante, puede haber juegos asimétricos con estrategias idénticas
para cada jugador. Por ejemplo, el juego mostrado a la derecha es asimétrico a pesar de tener
conjuntos de estrategias idénticos para ambos jugadores.
Juegos de suma cero y de suma distinta de cero

En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación
de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia solamente a expensas de
otros). El go, el ajedrez, el póker y el juego del oso son ejemplos de juegos de suma cero, porque se
gana exactamente la cantidad que pierde el oponente. Como curiosidad, el fútbol dejó hace unos años
de ser de suma cero, pues las victorias reportaban 2 puntos y el empate 1 (considérese que ambos
equipos parten inicialmente con 1 punto), mientras que en la actualidad las victorias reportan 3 puntos
y el empate 1.

La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son
juegos de suma distinta de cero, porque algunos desenlaces tienen resultados netos mayores o
menores que cero. Es decir, la ganancia de un jugador no necesariamente se corresponde con la
pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un desenlace de suma
positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera dado
la negociación.

Se puede analizar más fácilmente un juego de suma distinta de cero, y cualquier juego se puede
transformar en un juego de suma cero añadiendo un jugador "ficticio" adicional ("el tablero" o "la
banca"), cuyas pérdidas compensen las ganancias netas de los jugadores.

La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un juego de
suma cero de dos jugadores con la matriz que se muestra a la derecha.

Criterios «maximin» y «minimax»

Los criterios «maximin» y «minimax» establecen que cada jugador debe minimizar su pérdida
máxima:

● Criterio «maximin»: el jugador A, elige que su cobro mínimo posible sea el mayor.
● Criterio «minimax»: el jugador B elige que el pago máximo a A sea el menor posible.

Equilibrio de Nash
Los equilibrios de las estrategias dominantes están muy bien cuando aparecen en los juegos, pero
desafortunadamente, eso no ocurre con frecuencia.

Un par de estrategias es un equilibrio de Nash si la elección del jugador A es óptima, dada elección de
B, y la de B es óptima, dada la de A.
El equilibrio de Nash puede interpretarse como un par de expectativas sobre la elección de cada
persona tal que, cuando la otra revela su elección, ninguna de las dos quiere cambiar de conducta.

Cada jugador conoce y ha adoptado su mejor estrategia, y todos conocen las estrategias de los otros.
Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros
mantengan las suyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los
movimientos de los demás jugadores.

Juegos cooperativos

Un juego cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los
juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está
muy relacionada con la estabilidad.

Dos jugadores negocian tanto quieren invertir en un contrato. La teoría de la negociación axiomática
nos muestra cuánta inversión es conveniente para nosotros. Por ejemplo, la solución de Nash para la
negociación demanda que la inversión sea justa y eficiente.

De cualquier forma, podríamos no estar interesados en la justicia y exigir más. De hecho, existe un
juego no cooperativo creado por Ariel Rubinstein consistente en alternar ofertas, que apoya la
solución de Nash considerándola la mejor, mediante el llamado equilibrio de Nash. El juego
cooperativo en la hora de Matemática

En este sentido, proponemos analizar secuencias didácticas para que nuestros alumnos “hagan
matemática”, es decir, exploren, establezcan relaciones, confronten sus producciones con las de otros,
discutan con sus pares, tomen decisiones, argumenten, validen proposiciones, produzcan
conocimiento. Para que este trabajo sea posible, es necesario plantear problemas que impliquen un
cierto nivel de desafío; un contexto fértil para el planteo de esos desafíos es el de los juegos.

Simultáneos y secuenciales
Los juegos simultáneos son juegos en los que los jugadores se mueven simultáneamente o en los que
éstos desconocen los movimientos anteriores de otros jugadores. Los juegos secuenciales (o
dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las acciones
previas. Este conocimiento no necesariamente tiene que ser perfecto; solo debe consistir en algo de
información. Por ejemplo, un jugador 1 puede conocer que un jugador 2 no realizó una acción
determinada, pero no saber cuál de las otras acciones disponibles eligió.

La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones discutidas


previamente. La forma normal se usa para representar juegos simultáneos, y la extensiva para
representar juegos secuenciales.

Juegos de información perfecta

Un juego de información imperfecta (las líneas punteadas representan la ignorancia de la parte del
jugador 2).
Un subconjunto importante de los juegos secuenciales es el conjunto de los juegos de información
perfecta. Un juego es de información perfecta si todos los jugadores conocen los movimientos que han
efectuado previamente todos los otros jugadores; así que solo los juegos secuenciales pueden ser
juegos de información perfecta, pues en los juegos simultáneos no todos los jugadores (a menudo
ninguno) conocen las acciones del resto. La mayoría de los juegos estudiados en la teoría de juegos
son juegos de información imperfecta, aunque algunos juegos interesantes son de información
perfecta, incluyendo el juego del ultimátum y el juego del ciempiés. También muchos juegos
populares son de información perfecta, incluyendo el ajedrez y el go.

La información perfecta se confunde a menudo con la información completa, que es un concepto


similar. La información completa requiere que cada jugador conozca las estrategias y recompensas del
resto pero no necesariamente las acciones.

En los juegos de información completa cada jugador tiene la misma "información relevante al juego"
que los demás jugadores. El ajedrez y el dilema del prisionero ejemplifican juegos de información
completa. Los juegos de información completa ocurren raramente en el mundo real, y los teóricos de
los juegos, usualmente los ven solo como aproximaciones al juego realmente jugado.

El matemático inglés, y catedrático emérito de la Universidad de Princeton, John Conway, desarrolló


una notación para algunos juegos de información completa y definió varias operaciones en esos
juegos, originalmente para estudiar los finales de go, aunque buena parte de este análisis se enfocó en
nim. Esto devino en la teoría de juegos combinatoria.

Conway descubrió que existe una subclase de esos juegos que pueden ser usados como números,
como describió en su libro On Numbers and Games (1976), llegando a la clase muy general de los
números surreales.

Juegos de longitud infinita

Por razones obvias, los juegos estudiados por los economistas y los juegos del mundo real finalizan
generalmente tras un número finito de movimientos. Los juegos matemáticos puros no tienen estas
restricciones y la teoría de conjuntos estudia juegos de infinitos movimientos, donde el ganador no se
conoce hasta que todos los movimientos se conozcan.

El interés en dicha situación no suele ser decidir cuál es la mejor manera de jugar a un juego, sino
simplemente qué jugador tiene una estrategia ganadora (Se puede probar, usando el axioma de
elección, que hay juegos —incluso de información perfecta, y donde las únicas recompensas son
"perder" y "ganar"— para los que ningún jugador tiene una estrategia ganadora.) La existencia de
tales estrategias tiene consecuencias importantes en la teoría descriptiva de conjuntos.

Juegos combinatorios

Los juegos en los que la dificultad de encontrar una estrategia óptima proviene de la multiplicidad de
movimientos posibles se denominan juegos combinatorios. Algunos ejemplos de estos juegos pueden
ser ajedrez y go. Los juegos que implican información imperfecta o incompleta también pueden tener
un fuerte carácter combinatorio, por ejemplo el backgammon. No hay una teoría unificada que se
ocupa de los elementos combinatorios en los juegos. Hay, sin embargo, herramientas matemáticas que
pueden resolver problemas particulares y responder a preguntas generales.

Se han estudiado juegos de información perfecta en la teoría combinatoria de juegos, que ha


desarrollado nuevas representaciones, como por ejemplo los números surreales, así como métodos de
prueba combinatorios y algebraicos (y a veces no constructivos) para resolver juegos de ciertos tipos,
incluyendo juegos "loopy" que pueden dar lugar a secuencias de movimientos infinitamente largas.
Estos métodos se dirigen a juegos con mayor complejidad combinatoria que los normalmente
considerados en la teoría de juegos tradicional (o "económica"). Un juego típico que se ha resuelto de
esta manera es hexadecimal. Un campo relacionado de estudio, basado en la teoría de la complejidad
computacional, es la complejidad del juego, que se ocupa de estimar la dificultad computacional de
encontrar estrategias óptimas.

La investigación en inteligencia artificial ha abordado juegos de información perfectos e imperfectos


(o incompletos) que tienen estructuras combinatorias muy complejas (como ajedrez, go o
backgammon) para los cuales no se han encontrado estrategias óptimas comprobables. Las soluciones
prácticas implican la heurística computacional, como la poda alfa-beta o el uso de redes neuronales
artificiales entrenadas por el aprendizaje de refuerzo, que hacen que los juegos sean más manejables
en la práctica de la computación.

Juego continuo
Gran parte de la teoría de juegos se refiere a juegos finitos y discretos, que tienen un número finito de
jugadores, movimientos, eventos, resultados, etc. Sin embargo, muchos conceptos pueden extenderse.
Los juegos continuos permiten a los jugadores elegir una estrategia a partir de un conjunto de
estrategias continuas. Por ejemplo, la competición de Cournot se modela típicamente con las
estrategias de los jugadores cualesquiera cantidades no negativas, incluyendo cantidades fraccionarias.

Juegos diferenciales
Los juegos diferenciales como el juego de búsqueda continua y evasión son juegos continuos donde la
evolución de las variables de estado de los jugadores se rige por ecuaciones diferenciales. El problema
de encontrar una estrategia óptima en un juego diferencial está estrechamente relacionado con la
teoría del control óptimo. En particular, existen dos tipos de estrategias: las estrategias de bucle
abierto utilizan el principio de Pontryagin máximo, mientras que las estrategias de bucle cerrado
utilizan el método de programación dinámica de Bellman.

Un caso particular de juegos diferenciales son los juegos con un horizonte temporal aleatorio. En estos
juegos, el tiempo terminal es una variable aleatoria con una función de distribución de probabilidad
dada. Por lo tanto, los jugadores maximizan la expectativa matemática de la función de costo. Se
demostró que el problema de optimización modificado se puede reformular como un juego diferencial
con descuento en un intervalo de tiempo infinito.

Juegos de muchos jugadores y poblaciones


Los juegos con un número arbitrario, pero finito, de jugadores a menudo se denominan juegos de la
n-persona. La teoría evolutiva de los juegos considera los juegos que involucran a una población de
tomadores de decisiones, donde la frecuencia con la que se toma una decisión particular puede
cambiar con el tiempo en respuesta a las decisiones tomadas por todos los individuos de la población.
En biología, esto se utiliza para modelar la evolución (biológica), donde los organismos programados
genéticamente pasan a lo largo algo de su programación de la estrategia a su descendencia. En
economía, la misma teoría está destinada a captar los cambios de población porque las personas
juegan el juego muchas veces dentro de su vida, y conscientemente (y quizás racionalmente) cambiar
las estrategias.

Resultados estocásticos (y relación con otros campos)


Los problemas individuales de decisión con resultados estocásticos a veces se consideran "juegos de
un solo jugador". Estas situaciones no se consideran teóricas de juego por parte de algunos autores.
Pueden ser modeladas utilizando herramientas similares dentro de las disciplinas relacionadas de la
teoría de la decisión, la investigación de operaciones y áreas de inteligencia artificial, particularmente,
la planificación de IA (con incertidumbre) y sistemas multi-agentes. Aunque estos campos pueden
tener motivadores diferentes, las matemáticas implicadas son sustancialmente las mismas, por
ejemplo, usando procesos de decisión de Markov (MDP). Los resultados estocásticos también pueden
ser modelados en términos de la teoría de juegos agregando a un jugador de acción aleatoria que hace
"movimientos de la casualidad" ("movimientos por naturaleza").Este jugador no suele ser considerado
un tercer jugador en lo que de otro modo es un juego de dos jugadores, sino que simplemente sirve
para proporcionar un rol de dado cuando sea requerido por el juego.

Para algunos problemas, los diferentes enfoques para modelar resultados estocásticos pueden conducir
a soluciones diferentes. Por ejemplo, la diferencia en el enfoque entre MDPs y la solución minimax es
que este último considera el peor caso sobre un conjunto de movimientos adversarios, en lugar de
razonar en la expectativa sobre estos movimientos dados una distribución de probabilidad fija. El
enfoque minimax puede ser ventajoso cuando no se dispone de modelos estocásticos de
incertidumbre, pero también puede estar sobreestimando eventos extremadamente improbables (pero
costosos), cambiando dramáticamente la estrategia en tales escenarios si se supone que un adversario
puede forzar que suceda tal evento. También se han estudiado modelos generales que incluyen todos
los elementos de resultados estocásticos, adversarios y observabilidad parcial o ruidosa (de
movimientos de otros jugadores). Se considera que el "patrón oro" es un juego estocástico
parcialmente observable (POSG), pero pocos problemas realistas son computacionalmente factibles
en la representación POSG.

Metagames
Estos son juegos en los que se trata de desarrollar las reglas para otro juego, el objetivo o el jugador.
Los metagames buscan maximizar el valor de utilidad del conjunto de reglas desarrollado. La teoría
de los metagames está relacionada con la teoría del diseño de mecanismos.

El término análisis metagame también se utiliza para referirse a un enfoque práctico desarrollado por
Nigel Howard. Por lo que una situación se enmarca como un juego estratégico en el que las partes
interesadas tratan de realizar sus objetivos por medio de las opciones disponibles. Los
acontecimientos posteriores han llevado a la formulación del análisis de la confrontación.
8. EJERCICIOS PROPUESTOS

Ejercicio 1
Ejercicio 1. El siguiente juego tiene sólo dos estrategias (una para cada jugador) que sobreviven la
eliminación iterada de estrategias estrictamente dominadas, ¿cuáles son? Razone su respuesta y
mencione, al eliminar cada estrategia, qué hipótesis hay que hacer sobre la racionalidad de los
jugadores (o sobre lo que saben los jugadores) para poder eliminarla.

Solución: observamos primero de todo que C4 está estrictamente dominada por C3 (pues 104 > 3; 15
> 4; 10 > 5; 7 > 6). Si columna es racional, nunca elegirá C4. Si Fila sabe anticipar todo lo anterior ‒lo
cual requiere saber que Columna es racional‒, entenderá que los únicos resultados posibles son:

Pero en esta nueva sub-matriz la estrategia F4 está dominada por la F3, pues 20 > 14; 8 > 2; 11 > 10.
Fila no jugará por tanto F4. Suponiendo ahora que Columna anticipa todo lo anterior ‒ lo cual
requiere saber que Fila sabe que Columna es racional‒, Columna inferirá que los únicos resultados
posibles son:

En este caso, C2 está dominada por C3, con lo cual Columna no jugará C2. Anticipando esto y
suponiendo por resumir que la racionalidad es de conocimiento público, Fila no debería jugar F2 pues
está dominada tanto por F1 como por F3. Bajo el mismo supuesto, se sigue que Columna no debería
elegir C1, dominada por C3. Y previendo todo lo anterior, Fila no elegirá F3. Por eliminación,
concluimos que Fila elegirá F1 y Columna C3.
Ejercicio 2. Aplicando el concepto de estrategias estrictamente dominadas al siguiente juego, ¿qué
estrategias podemos estar seguros de que nunca se jugarán? En cada eliminación, explicite qué
supuesto necesita hacer acerca del jugador correspondiente. Nota: El pago izquierdo es siempre el del
jugador fila.

Solución: C3 es una mala opción para Columna, pues está estrictamente dominada tanto por C1 como
por C2. Si Columna es racional, por tanto, nunca jugará C3. Y si Fila sabe que Columna es racional
sabrá anticipar lo anterior y por tanto prever que sólo puede ocurrir lo siguiente:

Ejercicio 3. ¿Cuáles son los equilibrios de Nash respectivos de los siguientes 2 juegos en forma
estratégica? Mencione sólo los equilibrios en estrategias puras. Razone su respuesta.

Solución:
Halle los equilibrios de Nash en estrategias puras y mixtas. ¿Cuál es la interpretación intuitiva del
equilibrio en mixtas? ¿Debemos entenderlo al pie de la letra, como que los jugadores eligen de un
modo totalmente aleatorio? Solución: Sea (r,1-r) la estrategia del jugador Fila y (s,1-s) la del jugador
columna:

:
ejercico

ejercicio 5 suma cero


Ejercicio de Juegos Cooperativos

Una finca rústica está valorada por su actual propietario en 350.000 euros. Un empresario le ofrece
acondicionarla para su utilización como polígono industrial, con lo que su valor de mercado
alcanzaría los 700.000 euros. Una empresa constructora le ofrece urbanizar la finca para su posible
subdivisión en parcelas destinadas a viviendas unifamiliares. Con esta urbanización el valor de la
finca sería de 775.000 euros.

Representamos la situación de un juego cooperativo de utilidad transferible. Sea J = {1,2,3} donde el


jugador 1 es el empresario que ofrece acondicionar la finca como polígono industrial, la jugadora 2 es
la empresa constructora y el jugador 3 es el propietario actual de la finca.

Función característica para este juego cooperativo:


Tanto el jugador 1 como la jugadora 2 necesitan el acuerdo del jugador 3 (el propietario) para poder
utilizar la finca. Sin la participación del jugador 3 no se puede hacer nada, no se puede obtener ningún
beneficio. Por consiguiente, se obtiene que:

Si el jugador 3 no coopera con ninguno de los otros dos jugadores mantiene la situación actual, es
decir, mantiene la finca tal y como está, a la cual valora en 350.000 euros. Si llega a un acuerdo solo
con el jugador 1 para obtener el mayor valor posible, obtendrán entre los dos 700.000 euros. Si llega a
un acuerdo exclusivamente con la jugadora 2 para obtener el mayor valor posible obtendrán entre los
dos 775.000 euros. Finalmente si cooperan los 3 jugadores y deciden llevar conjuntamente adelante el
proyecto que dé mayor valor al mercado, obtendrán entre los tres, 775.000 euros. Es decir,

En donde los valores de la función característica vienen expresados en miles de euros. Por tanto, la
representación del juego en forma coalicional es (j,v) en donde:

En donde los valores de la función característica vienen expresados en miles de euros. Se trata de un
juego de beneficios superaditivo pero no convexo.
Juego continuo

Cuando un juego se repite varias veces, cada jugador puede adoptar su estrategia en función
de las decisiones que haya adoptado antes su oponente. Las estrategias reactivas son las que
se adoptan en los juegos con repetición y se definen en función de las decisiones previas de
otros jugadores.

El ejemplo más conocido es la estrategia OJO POR OJO (en inglés TIT FOR TAT).
Supongamos que dos jugadores repiten de forma indefinida una situación con pagos de forma
del Dilema del Prisionero:

En esta situación la estrategia OJO POR OJO puede quedar definida de la forma siguiente:
"En la primera jugada elegiré la estrategia COOPERAR. En las jugadas siguientes elegiré la
misma estrategia que haya elegido mi oponente en la jugada anterior". En otras palabras, si el
otro coopera, yo cooperaré con él. Si el otro es un traidor, yo seré un traidor".

Otra posible estrategia reactiva es la TORITO (también llamada "GALLITO" en inglés


"BULLY"). Esta estrategia consiste en hacer lo contrario que haga el oponente: "Si el otro
jugador es leal en una jugada, yo le traicionaré en la siguiente; si el otro jugador me ha
traicionado, yo le seré leal a la siguiente oportunidad".
En el ambiente del Dilema del Prisionero, la estrategia OJO POR OJO ofrece muy buenos
resultados mientras que la estrategia TORITO proporciona pagos medios muy bajos. En
cambio, en el ambiente del juego Halcón-Paloma sucede precisamente lo contrario: TORITO
obtiene buenos resultados mientras que OJO POR OJO proporciona pagos medios inferiores.

En el primer caso son los comportamientos descritos por la Ley del Talión. En el despacho
de un abogado, negociador profesional, había un letrero que decía "Por las buenas soy muy
bueno, por las malas soy aún mejor". Al fin y al cabo, todos los humanos en alguna ocasión
nos hemos comprometido con nosotros mismos a mantener esta estrategia en una situación
difícil en la que un oponente podía elegir entre hacernos daño o respetarnos, y preveíamos
oportunidades para "devolverle la jugada".

El segundo caso también es muy frecuente. Se trata de ese tipo de personas o


comportamientos que en Latinoamérica llaman "ser un torito" y en España "ser un gallito"; es
decir, alguien que se muestra muy agresivo pero al que "se le bajan los humos" si se le
responde también con agresividad.

Juegos diferenciales

En la teoría de juegos , el problema del chofer homicida es un problema matemático de


persecución que enfrenta a un corredor hipotético, que solo puede moverse lentamente, pero
es muy maniobrable, contra el conductor de un vehículo motorizado, que es mucho más
rápido pero mucho menos maniobrable, que está intentando para atropellarlo. Se supone que
tanto el corredor como el conductor nunca se cansan. La pregunta a resolver es: ¿en qué
circunstancias y con qué estrategia el conductor del automóvil puede garantizar que siempre
podrá atrapar al peatón, o el peatón garantizar que podrá eludir indefinidamente el automóvil?

El problema se utiliza a menudo como un proxy no clasificado para la defensa antimisiles y


otros objetivos militares, lo que permite a los científicos publicar sobre él sin implicaciones
de seguridad.

El problema fue propuesto por Rufus Isaacs en un informe de 1951 para la Corporación
RAND , y en el libro Differential Games .

El problema del chófer homicida es un ejemplo clásico de un juego diferencial jugado en


tiempo continuo en un espacio de estado continuo . El cálculo de variaciones y los métodos
de conjuntos de niveles se pueden utilizar como marco matemático para investigar las
soluciones del problema. Aunque el problema se plantea como un problema recreativo, es un
problema modelo importante para las matemáticas utilizadas en una serie de aplicaciones del
mundo real.
Martin Gardner describió una versión discreta del problema (en su libro Mathematical
Carnival , capítulo 16), donde un coche patrulla de velocidad 2 persigue a un coche patrulla
de velocidad 1 en una cuadrícula rectangular, donde el coche patrulla pero no el ladrón está
restringido. no hacer giros a la izquierda o en U.

En el siguiente link hay una pequeña experiencia del juego


https://demonstrations.wolfram.com/TheHomicidalChauffeurProblem/

Juegos de muchos jugadores y poblaciones - n personas

Juego Del Perfumista Nuevo

Daniel Parra inventó un perfumista nuevo pero no lo puede fabricar sólo. Puede vender la
fórmula a la empresa 2 o a la empresa 3. la empresa afortunada compartiría la ganancia de un
millón de dólares con Daniel Parra

Función característica

V({}) = v({1}) = v({2}) = v({3}) = v({2,3}) = 0

V({1,2}) = v({1,3}) = v({1,2,3}) = 1000000

SERÁ UNA IMPUTACIÓN SI SOLO SI

X1 >= 0

X2 >= 0

X3 >= 0

X1 + X2 + X3 = 1000000

Y CUMPLIR LAS SIGUIENTES DESIGUALDADES

X1 + X2 >= 1000000

X1 + X3 >= 1000000

X2 + X3 >= 0

X1 + X2 + X3 >= 1000000
Metagames

MetaGame de Pokemon, este encierra dentro de él todo lo que son los IVs y EVs, en el caso
de las Tiers aquí solo hay una para combates oficiales de pokémon, que se llama VGC, dicha
Tier fue creada por pokemon y se va renovando anualmente si no me acuerdo mal, aquí
veremos los equipos más competitivos junto con los pokemones mas competitivos valga la
aclaración, pero lo que pasa con el MetaGame así como con el VGC es que está en constante
cambio, lo malo o lo bueno es que por lo general cambia mensualmente, así que los
pokemones que te estuvieron dando la lata un temporada puede que ya no te sigan
molestando y que ahora sean otros pokemones que están para hacer de counters de los
anteriores, así funciona el MetaGame está en constante cambio.Este es un ejemplo fácil para
que lo terminen de comprender.

Este es el equipo de Paul Ruíz, lo utilizo para el VGC del año 2018 y es actualmente el
campeón mundial, que les quiero enseñar con esto, bueno el equipo ahora está muy visto y
hay pokemones entrenados solo para contraatacar este equipo,si lo utilizas hoy en día podrían
llegar parar este equipo, claro está que si sabes utilizar muy bien el equipo y juegan de
maravilla por muy visto que este siempre será un equipo Meta.
Gracias a estudios que realizan los equipos y personas por internet donde se tienen en cuenta
cada dato (daño, utilidad, beneficio, riesgo, etc.), se sabe qué es más ventajoso en cada juego
y, por ello, se convierte en lo más utilizado. El meta-game afecta a cualquier juego que
ofrezca un nivel competitivo debido a los parches o actualizaciones que reciben
constantemente y lo cambian. Podría ser el caso de los campeones o ítems en League of
Legends, los héroes en Heroes of the Storm, Overwatch, las cartas en Hearthstone, etc.

9. CONCLUSIÓN

A través de la teoría de los juegos se puede estudiar el comportamiento de los participantes o


jugadores.

En el mundo real, tanto en las relaciones políticas como sociales, son muy frecuentes las
situaciones en las que, al igual que en los juegos, su resultado depende de la conjunción de
decisiones de diferentes jugadores. Podemos referirnos a un comportamiento estratégico
cuando se adopta teniendo en cuenta la influencia conjunta sobre el resultado propio y ajeno
de las decisiones propias y ajenas. La Teoría de Juegos ha alcanzado un alto grado de
sofisticación matemática y ha mostrado una gran versatilidad en la resolución de problemas.
Muchos campos como la Economía, la Sociología, la política, la biología y la sicología se han
visto beneficiados por las aportaciones de este método de análisis. Existen también
aplicaciones jurídicas: asignación de responsabilidades, adopción de decisiones de pleitear o
conciliación, etc. En el medio siglo transcurrido desde su primera formulación el número de
científicos dedicados a su desarrollo no ha cesado de crecer.
10. BIBLIOGRAFÍA

https://policonomics.com/es/lp-teoria-juegos2-estrategia-mixta/
https://es.wikipedia.org/wiki/Juego_de_suma_cero
https://prezi.com/y1xpykdeghhw/juego-de-2-personas-y-suma-cero/
https://es.wikipedia.org/wiki/Teor%C3%ADa_de_juegos
https://es.wikipedia.org/wiki/Estrategia_pura#:~:text=Una%20estrategia%20pura%20es%20un,est%C
3%A1%20jugando%20una%20estrategia%20pura.
http://recursos.tomascipriano.edu.co:8983/wikipedia_es_all_novid_2018-04/A/Estrategia_pura.html

También podría gustarte