Está en la página 1de 30

Minimax: ia en

juegos de mesa
Por Pablo Darío Moreno Barba
01.
Introducción
El origen de todo

Teoría de juegos
- Área de las matemáticas aplicadas, usa
modelos para estudiar estructuras (juegos).
- Herramienta de gran utilidad en economía.
- Gran crecimiento con John von Neumann
durante la guerra fría: destrucción mutua
garantizada.
- Se ha expandido a más campos: política,
psicología, filosofía, biología, etc.
John Von Neumann

Matemático, padre de la computación actual.


Grandes avances en la ciencias de la computación, análisis funcional, estadísitica…
Probó el teorema de minimax, demostró que para juegos de suma cero con información perfecta
entre 2 jugadores solo existe una única solución.
Citando a Neumann

“Un juego es una situación conflictiva en la que uno debe tomar una
decisión sabiendo que los demás también toman decisiones, y que el
resultado del conflicto se determina, de algún modo, a partir de todas
las decisiones realizadas.”

- John Von Neumann, reflexionando un domingo por la mañana.


MIN
02. MAX

Minimax
¿Qué es minimax?

Es un algoritmo de decisión, se encarga de


minimizar la pérdida máxima aplicada en juegos
entre dos contrincantes.

Elige el mejor movimiento para cada jugador,


suponiendo que el adversario escogerá el peor.

Se deben cumplir 4 condiciones:


- Para dos jugadores.
- Información completa: cada jugador tiene
información de todo lo que pasa en la partida.
- Debe jugarse por turnos.
- Suma cero.
Min y max

Cada situación de la partida se puede medir dentro de un rango de números.

MIN MAX
0

Se busca una jugada óptima entre todas las posibles en un turno concreto de la partida.

Cada jugador tratará de acercar ese valor a su lado, es decir, jugador Min querrá el menor valor posible y
jugador Max el mayor valor posible.

Es un procedimiento recursivo, cuya condición de salida estaría en que:


- Un jugador gane la partida.
- Se ha explorado el número de capas establecido para recorrer.
- Se ha llegado a una situación sin cambios posibles.

Triángulo de Sierpinski
Algorítmo Minimax
03
Negamax
¿Qué es Negamax?

Variable del algoritmo Minimax donde cada


valor para Min y Max usa el valor máximo.

Valores de nodos Max se cambian de signo.

En lugar. de tomar máximos y mínimos toma


siempre máximos pero con valores cambiados.

Se basa en la siguiente igualdad matemática:


max(x, y)=-min(-x,-y)
Ejemplos negamax y poda

Ejemplo Negamax

Negamax con poda


04.
Heurística
¿Qué significa?

Heurística viene de una antigua palabra griega que significa “hallar, inventar”. Se puede usar de dos
formas:
- Al usarse como sustantivo, se refiere a la disciplina o ciencia del descubrimiento.
- Al usarse como adjetivo, se refiere a las estrategias, reglas y conclusiones.

El matemático Claude Shannon en su texto “Programming a Computer for Playing Chess” propuso
limitar la profundidad de la búsqueda en el árbol de decisiones y hallar su valor mediante una función
heurística.

Esta función define diferentes variables, por ejemplo en ajedrez se tendrá en cuenta el valor de cada
pieza, el número de piezas, la posición de estas, la posibilidad de ataque, etc.

Dato bonus: el pretérito perfecto de esta palabra es “eureka”.


05.
Poda
Alpha - Beta
PROBLEMA y SOLUción

El número de estados que se van a


Problema explorar es exponencial al número
de posibles movimientos.

Al igual que en la realidad, se trata


de “podar” ramas del árbol. Se usa
para optimizar el recorrido por este, “Solución”
eliminando ramas innecesarias.
¿Cómo funciona?
Consiste en evitar un cálculo innecesario para ramas cuya evaluación final no superará los valores ya
obtenidos.

Muy utilizado en juegos entre adversarios como ajedrez, tres en raya o Go.

Se parten de dos valores, alpha y beta:

- α: valor de la mejor opción hasta ese turno a lo largo del camino para el jugador Max, es la elección
del valor más alto.
- β: valor de la mejor opción hasta ese turno a lo largo del camino para el jugador Min, es la elección del
valor más bajo.
Ejemplo poda alpha-beta
Bibliografía
- https://devcode.la/tutoriales/algoritmo-minimax/
- https://en.wikipedia.org/wiki/Minimax
- https://es.wikipedia.org/wiki/John_von_Neumann
- http://www.itnuevolaredo.edu.mx/takeyas/apuntes/Inteligencia%20Artificial/Apuntes
/IA/Minimax.pdf
- https://es.wikipedia.org/wiki/Teor%C3%ADa_de_juegos
- https://www.youtube.com/watch?v=QJjM7EKDRuc&t=111s&ab_channel=BitBoss
- https://youtu.be/I0y-TGehf-4
- https://hmong.es/wiki/Negamax
- http://ia20142578035.blogspot.com/2017/05/minimax-negamax-y-alfabeta.html
- http://hairdesiresalon.com/Zen-Master-Go/design.html
- https://www.youtube.com/watch?v=v_M6dljJLTs&ab_channel=sigoaprendiendo
- https://www.youtube.com/watch?v=NkLHkJEmNn8&ab_channel=ThinkTwiceShow
- https://en.wikipedia.org/wiki/Perfect_information
- https://es.wikipedia.org/wiki/Equilibrio_de_Nash
Gracias por vuestra
atención
cONTINUARÁ…
¡AHORA!
03
Información
perfecta
Perfecta vs. completa

- Información completa: en teoría de juegos y


economía, es el conocimiento de la estructura del
“La teoría de juegos nos enseña sobre
juego/mercado por todos los participantes.
las estrategias que toman las personas
cuanto tienen la posibilidad de elegir. - Información perfecta: ocurre en juegos donde en
Ilustran las posibilidades que tenemos el turno de un jugador, este tiene toda la información
para elegir.” sobre lo que ha ocurrido desde el inicio hasta ese
momento de la partida.
- Pablo Boullosa, el tipo majo de
aquel video de YouTube. Ajedrez
Información perfecta e información completa.
Dilema del prisionero
Información completa pero información imperfecta.
06.
SUMA CERO
El ejemplo perfecto

Repartimos porciones de pizza entre un tal Antonio, Javigor, Juan y Darío


Antonio tiene bastante hambre y está cansado de cervezas.
Antonio coge el último trozo de pizza, que pertenecía a Javigor.
Para que Antonio tenga una tercera porción, Javigor pierde uno de los suyos.
Antonio es malvado, no seas como Antonio.
¿Qué son los juegos de suma cero?

● Juegos estrictamente competitivos.


● A este tipo de juego pertenecen la mayoría de deportes.
● Toda acción que beneficie a un jugador, perjudicará a su
adversario → Cuando uno gana, el otro pierde.
¿Empate?
DILEMA DEL PRISIONERO
AHORA SÍ
Gracias por vuestra
atención

También podría gustarte