Está en la página 1de 6

Nombres:

Laura Daniela Montoya Losada / 2019117740


Juan Diego Carvajal Vivas / 20191176865

Teorema MINIMAX

Biografía John Von Neumann

John Von Neumann nació el 28 de diciembre de 1903 en Budapest (Hungría) y falleció el 8


de febrero de 1957 en Washington. Originario de una familia de banqueros judíos. Desde su
niñez, manifestó cualidades únicas frente a los niños del común. Fue una persona que se
caracterizó por poseer una memoria increíble y esto lo hacía evidenciar tanto en sus aportes
insignias como en sus reuniones familiares; de modo que lo hacía sobresalir en campos
diversos de la ciencia, artes y humanidades. De igual forma, se destacó por sus notables
contribuciones científicas en disciplinas como matemáticas, mecánica cuántica, economía y
política. Cabe señalar que Neumann fue el protagonista en la elaboración de diversos
proyectos, tales como la arquitectura de las computadoras capaz de solucionar la dificultad
para la reconfiguración de los computadores antiguos (esta estructura aún la poseen los
ordenadores actuales), aportó al desenvolvimiento del diseño de programación, planteó dos
modelos de máquinas auto reproductoras, entre otras colaboraciones.

Definición Teorema

El algoritmo de MINIMAX radica en la elección de la mejor alternativa para el ordenador,


deduciendo que el oponente optara por una opción que lo perjudique.
Para la ejecución de mencionado proceso, el algoritmo se encarga de elaborar un árbol de
búsqueda, donde en él residen todos los posibles movimientos. Seguidamente, recorre toda
la estructura planteada a partir de una orden dada; es decir, según las casillas que ya han
sido completadas. De este modo, la finalidad del algoritmo reside en maximizar el valor de la
función sobre todas las posibles jugadas que se pueden ejecutar desde el posicionamiento
actual del juego.
Sin embargo, este proceso posee su utilidad y sus inconvenientes. Como ventajas tenemos
que el algoritmo tiene la facultad de memorizar los movimientos efectuados de acuerdo a una
base de datos; es decir, conoce del oponente y tiende a no equivocarse. Por otra parte, este
algoritmo se desvirtúa en cuanto a su complejidad para el desarrollo del mismo, debido a que
este se encarga de elaborar un esquema de aprendizaje óptimo, permitiendo confrontar al
oponente solo una vez. Además, este es de aprendizaje tardío, ya que por cada jugada
realizada debe aplicar cálculos de comparación, búsqueda, entre otros.
A fin del desarrollo del algoritmo MINIMAX, se debe de:
1. “Generación del árbol de juego. Se generarán todos los nodos (Representa una
situación del juego) hasta llegar a un estado terminal”. (Ing. Bruno López Takeyas,
(s.f)).
2. “Cálculo de los valores de la función de utilidad para cada nodo terminal”. (Ing. Bruno
López Takeyas, (s.f)).
3. “Calcular el valor de los nodos superiores a partir del valor de los inferiores.
Alternativamente se elegirán los valores mínimos y máximos representando los

1
movimientos del jugador y del oponente, de ahí el nombre de Minimax”. (Ing. Bruno
López Takeyas, (s.f)).
4. “Elegir la jugada valorando los valores que han llegado al nivel superior. El algoritmo
explorará los nodos del árbol asignándoles un valor numérico mediante una función
de utilidad, empezando por los nodos terminales y subiendo hacia la raíz”. (Ing. Bruno
López Takeyas, (s.f)).
5. “Colocar 0 ó 1 en los nodos terminales dependiendo si gana MIN o MAX. La función
de utilidad definirá lo buena que es la posición para un jugador cuando la alcanza. Un
valor positivo indica la ventaja de un jugador y uno negativo la ventaja del otro”. (Ing.
Bruno López Takeyas, (s.f)).
6. “El jugador que espera valores positivos se conoce como maximizador. El
maximizador busca movimientos que lo conduzcan al mayor número positivo”. (Ing.
Bruno López Takeyas, (s.f)).
7. “El jugador que espera valores negativos se conoce como minimizador. El minimizador
busca movimientos que lo conduzcan al menor número negativo”. (Ing. Bruno López
Takeyas, (s.f)).

Demostración algebraica

En un juego bipersonal de suma cero se modelan situaciones que suceden entre dos
jugadores en los cuales un jugador gana exactamente lo que su oponente pierde. En este
tipo de juego, la función de beneficio del Jugador II es la negativa de la función de beneficio
del Jugador I, pero este caso se centrará en la función de beneficio del jugador I. La forma
normal o estratégica de un juego de dos personas de suma cero está dada por el conjunto
de estrategias del Jugador I, el conjunto de estrategias del Jugador II y la función de pagos
del juego. Fernández (2016)
Sea S y T dos conjuntos y u: S × T → ℝ2 una función. El conjunto (S, T, u) se le llama juego
bipersonal con conjunto de estrategias de S y T. S corresponde al conjunto de estrategias del
Jugador I y T el conjunto de estrategias del Jugador II.
Se dice que un juego es de suma cero si la suma de las ganancias es cero, es decir:

𝑢1 (𝑠, 𝑡) + 𝑢2 (𝑠, 𝑡) = 0,
Donde 𝑢(𝑠, 𝑡) = (𝑢1 (𝑠, 𝑡), 𝑢2 (𝑠, 𝑡))

El juego es finito si los conjuntos S y T son finitos. Si el juego es de suma cero y finito toda la
información del juego está contenida en la llamada matriz de pagos definida por:

𝑎11 ⋯ 𝑎1𝑛
A=( ⋮ ⋱ ⋮ )
𝑎𝑚1 ⋯ 𝑎𝑚𝑛

Donde S = {𝑠1, 𝑠2,..., 𝑠𝑚 } y T = {𝑡1 , 𝑡2 ,..., 𝑡𝑛 } son los conjuntos de estrategias y 𝑎𝑖𝑗 =
𝑢1 (𝑠𝑖 , 𝑡𝑗 ) = −𝑢2 (𝑠𝑖 , 𝑡𝑗 )
Podemos, por tanto, identificar la estrategia 𝑠𝑖 del Jugador I con la fila i-esima de A y la
estrategia 𝑡𝑗 del Jugador II con la columna j-esima de A.
La matriz de pagos muestra la ganancia para el Jugador I o la perdida para el Jugador II que
resulta con cada combinación de estrategias para los dos jugadores.

2
Se supone que, el Jugador I elige una fila y el Jugador II elige una columna simultáneamente.
Por tanto, el problema del Jugador I es
𝑚𝑎𝑥𝑢1 (𝑠, 𝑡)
𝑠 ∈𝑆

Y el problema del Jugador II es


𝑚𝑖𝑛𝑢1 (𝑠, 𝑡)
𝑡 ∈𝑇

Ejemplo:

Tabla 1.

Tabla 1. López, B. (2005). Inteligencia artificial. Obtenido de:


http://www.itnuevolaredo.edu.mx/takeyas/Apuntes/Inteligencia%20Artificial/Apuntes/tareas_alumnos/Minimax/Minimax(2005-II-
A).pdf

Von Neumann nos dice que cada jugador debe maximizar el valor del peor resultado posible.
En este orden de ideas, López (2005) plantea las siguientes hipótesis:
● Si R escoge R1, el peor resultado es -2, que ocurre cuando C juega con C1.
● Si escoge R2, el peor resultado es -1 cuando C escoge C1.
● El peor resultado para R si escoge R3 es –a5 cuando C opta por C3.
Con base en lo anterior, el mejor resultado de R es -1 que se obtiene cuando juega con R1.
Esto es llamado la estrategia maximin de E, es decir, R maximiza su mínimo. Debido a esto,
la estrategia maximin de R es dada por R1 con un resultado de -1.
Por otro lado, la estrategia C1 como su maximin con un resultado de +1. Es importante
resaltar que la suma de los valores maximin es igual cero y por tanto se habla juegos de suma
cero, tal como se explica en la demostración algebraica.

Algoritmo Alpha

El algoritmo alpha o también conocido como algoritmo Alfa - beta es una mejora de lo que
concierne con el algoritmo de minimax, ya que en este se reducen los puntos de intersección
(nodos). Para ello, se establece un intervalo donde se contiene las mejores jugadas, en la
cual se emplean dos criterios que trabajan sobre los valores de minimax; es decir, para MAX
le corresponde los valores de 𝛼 mientras que para MIN le compete las estimaciones de 𝛽.
Como características principales tenemos que este algoritmo no tiene incidencia sobre el
resultado final, permite realizar búsquedas más profundas en comparación con el algoritmo
de MINIMAX. Dicho procedimiento exalta la colocación y no se enfoca en las estimaciones

3
exactas. Cabe mencionar, que el algoritmo renueva los valores a medida en que se va
desenvolviendo, transitando por el árbol.

Ejemplo:

Imagen 1. Gómez, C. (2016). Tutor de algoritmos de juegos. Obtenido de:


https://riuma.uma.es/xmlui/bitstream/handle/10630/12713/CristinaGomezGomezMemoriaTFG.pdf?sequence=1&i
sAllowed=y.

a) “A partir del nodo B, se genera su primer hijo, que es terminal y su función de utilidad nos
da el valor 3. Por tanto, como B es un nodo MIN, sabremos que su valor final será menor o
igual a 3, es decir, estará en el rango [-∞, 3]. Por ello, β = 3”. Gómez (2016).

Imagen 2. Gómez, C. (2016). Tutor de algoritmos de juegos. Obtenido de:


https://riuma.uma.es/xmlui/bitstream/handle/10630/12713/CristinaGomezGomezMemoriaTFG.pdf?sequence=1&i
sAllowed=y.

e) “Pasamos a generar los hijos del nodo D, tercer hijo del nodo raíz. Su valor es 14, por tanto,
como C es un nodo MIN, sabremos que su valor definitivo será menor o igual que 14, es decir,
está en el rango [-∞,14]. Por ello, β = 14. Como el valor de D será menor de 14, el valor de A,
como mucho podrá valer 14, por tanto, estará en el rango [3,14]”. Gómez (2016).

¿Por qué es importante el estudio de teoría de juegos?

En el campo de la economía, la temática de teoría de juegos ha cobrado importancia en el


transcurso de los años, con base en los aportes que ilustres contribuyeron en esta ciencia
social. Con base en esto, el agente económico se enfrenta a una toma de decisiones que lo
ponen en una disyuntiva debido a las múltiples alternativa que puede escoger, con el fin de
maximizar su utilidad. Por otro lado, el estudio de lo mencionado se parte de la intuición

4
siguiendo una estrategia para determinar la mejor posible. De esta manera, se puede
evidenciar la aplicación de ello, en los juegos de mesa e incluso en las empresas cuando
deben tomar una determinación con aras de encontrar el éxito.

Conclusiones

En consecuencia, podemos evidenciar el gran recorrido que tuvo el ingenio de John Von
Neuman y sus aportes tan significativos que permitieron en gran parte el desarrollo de lo que
hoy en día concebimos como sociedad, y con base en ello, el desenvolvimiento de nuevos
cuestionamientos que hacen permear las mentes ajenas, originando nuevas teorías que
partieron de los cimientos arcaicos. De esta manera, llegamos a lo que comprende el
algoritmo de MINIMAX, como proceso elemental en la selección de aquella alternativa óptima
que busca obtener el bienestar máximo. De la misma manera, se encuentra el algoritmo Alpha
- Beta, que es la modernización de la explicación de lo que concierne al algoritmo de
MINIMAX, siendo este más sintetizado en su proceder, permitiendo así la facilidad en la
comprensión de su funcionalidad, indagando por el resultado anhelado.
Finalmente, John Von Neumann afirmada que un jugador racional no jugaría por debajo de
lo que estuviese permitido para obtener el resultado Maximin, por el contrario, los dos
adversarios están conscientes de evitar dicho resultado.

Bibliografía

● Gómez, C (2016). Tutor de algoritmos de juegos. Obtenido de:


https://riuma.uma.es/xmlui/bitstream/handle/10630/12713/CristinaGomezGomezMemori
aTFG.pdf?sequence=1&isAllowed=y.
● Ing. Bruno López Takeyas. (s.f). Algoritmo MINIMAX. URL:
http://www.itnuevolaredo.edu.mx/takeyas/apuntes/Inteligencia%20Artificial/Apuntes/IA/M
inimax.pdf.
● Fernández, I. Juegos de suma cero. Teoremas de Von Neumann, Sion y Kneser-Fan.
Universidad de Valladolid. Obtenido de: https://core.ac.uk/download/pdf/211102567.pdf
● López, B. (2005). Inteligencia artificial. Obtenido de:
http://www.itnuevolaredo.edu.mx/takeyas/Apuntes/Inteligencia%20Artificial/Apuntes/tare
as_alumnos/Minimax/Minimax(2005-II-A).pdf
● Moranchel, E. (2017). “ESTUDIO Y APLICACIÓN DE LA TEORÍA DE JUEGOS PARA
LA ASIGNACIÓN DE COSTOS”. Benemérita universidad autónoma de Puebla.
Obtenido de:
https://www.fcfm.buap.mx/assets/docs/docencia/tesis/actuaria/EvelynMoranchelGarcia.p
df
● Von Neumann, J. (1988). John von Neumann. American Mathematical Soc.

5
Anexos

Tabla 1. López, B. (2005). Inteligencia artificial. Obtenido de:


http://www.itnuevolaredo.edu.mx/takeyas/Apuntes/Inteligencia%20Artificial/Apuntes/tareas_alumnos/Minimax/Minimax(2005-II-
A).pdf

Imagen 1. Gómez, C. (2016). Tutor de algoritmos de juegos. Obtenido de:


https://riuma.uma.es/xmlui/bitstream/handle/10630/12713/CristinaGomezGomezMemoriaTFG.pdf?sequence=1&i
sAllowed=y.

Imagen 2. Gómez, C. (2016). Tutor de algoritmos de juegos. Obtenido de:


https://riuma.uma.es/xmlui/bitstream/handle/10630/12713/CristinaGomezGomezMemoriaTFG.pdf?sequence=1&i
sAllowed=y.

También podría gustarte