Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teorema MINIMAX
Definición Teorema
1
movimientos del jugador y del oponente, de ahí el nombre de Minimax”. (Ing. Bruno
López Takeyas, (s.f)).
4. “Elegir la jugada valorando los valores que han llegado al nivel superior. El algoritmo
explorará los nodos del árbol asignándoles un valor numérico mediante una función
de utilidad, empezando por los nodos terminales y subiendo hacia la raíz”. (Ing. Bruno
López Takeyas, (s.f)).
5. “Colocar 0 ó 1 en los nodos terminales dependiendo si gana MIN o MAX. La función
de utilidad definirá lo buena que es la posición para un jugador cuando la alcanza. Un
valor positivo indica la ventaja de un jugador y uno negativo la ventaja del otro”. (Ing.
Bruno López Takeyas, (s.f)).
6. “El jugador que espera valores positivos se conoce como maximizador. El
maximizador busca movimientos que lo conduzcan al mayor número positivo”. (Ing.
Bruno López Takeyas, (s.f)).
7. “El jugador que espera valores negativos se conoce como minimizador. El minimizador
busca movimientos que lo conduzcan al menor número negativo”. (Ing. Bruno López
Takeyas, (s.f)).
Demostración algebraica
En un juego bipersonal de suma cero se modelan situaciones que suceden entre dos
jugadores en los cuales un jugador gana exactamente lo que su oponente pierde. En este
tipo de juego, la función de beneficio del Jugador II es la negativa de la función de beneficio
del Jugador I, pero este caso se centrará en la función de beneficio del jugador I. La forma
normal o estratégica de un juego de dos personas de suma cero está dada por el conjunto
de estrategias del Jugador I, el conjunto de estrategias del Jugador II y la función de pagos
del juego. Fernández (2016)
Sea S y T dos conjuntos y u: S × T → ℝ2 una función. El conjunto (S, T, u) se le llama juego
bipersonal con conjunto de estrategias de S y T. S corresponde al conjunto de estrategias del
Jugador I y T el conjunto de estrategias del Jugador II.
Se dice que un juego es de suma cero si la suma de las ganancias es cero, es decir:
𝑢1 (𝑠, 𝑡) + 𝑢2 (𝑠, 𝑡) = 0,
Donde 𝑢(𝑠, 𝑡) = (𝑢1 (𝑠, 𝑡), 𝑢2 (𝑠, 𝑡))
El juego es finito si los conjuntos S y T son finitos. Si el juego es de suma cero y finito toda la
información del juego está contenida en la llamada matriz de pagos definida por:
𝑎11 ⋯ 𝑎1𝑛
A=( ⋮ ⋱ ⋮ )
𝑎𝑚1 ⋯ 𝑎𝑚𝑛
Donde S = {𝑠1, 𝑠2,..., 𝑠𝑚 } y T = {𝑡1 , 𝑡2 ,..., 𝑡𝑛 } son los conjuntos de estrategias y 𝑎𝑖𝑗 =
𝑢1 (𝑠𝑖 , 𝑡𝑗 ) = −𝑢2 (𝑠𝑖 , 𝑡𝑗 )
Podemos, por tanto, identificar la estrategia 𝑠𝑖 del Jugador I con la fila i-esima de A y la
estrategia 𝑡𝑗 del Jugador II con la columna j-esima de A.
La matriz de pagos muestra la ganancia para el Jugador I o la perdida para el Jugador II que
resulta con cada combinación de estrategias para los dos jugadores.
2
Se supone que, el Jugador I elige una fila y el Jugador II elige una columna simultáneamente.
Por tanto, el problema del Jugador I es
𝑚𝑎𝑥𝑢1 (𝑠, 𝑡)
𝑠 ∈𝑆
Ejemplo:
Tabla 1.
Von Neumann nos dice que cada jugador debe maximizar el valor del peor resultado posible.
En este orden de ideas, López (2005) plantea las siguientes hipótesis:
● Si R escoge R1, el peor resultado es -2, que ocurre cuando C juega con C1.
● Si escoge R2, el peor resultado es -1 cuando C escoge C1.
● El peor resultado para R si escoge R3 es –a5 cuando C opta por C3.
Con base en lo anterior, el mejor resultado de R es -1 que se obtiene cuando juega con R1.
Esto es llamado la estrategia maximin de E, es decir, R maximiza su mínimo. Debido a esto,
la estrategia maximin de R es dada por R1 con un resultado de -1.
Por otro lado, la estrategia C1 como su maximin con un resultado de +1. Es importante
resaltar que la suma de los valores maximin es igual cero y por tanto se habla juegos de suma
cero, tal como se explica en la demostración algebraica.
Algoritmo Alpha
El algoritmo alpha o también conocido como algoritmo Alfa - beta es una mejora de lo que
concierne con el algoritmo de minimax, ya que en este se reducen los puntos de intersección
(nodos). Para ello, se establece un intervalo donde se contiene las mejores jugadas, en la
cual se emplean dos criterios que trabajan sobre los valores de minimax; es decir, para MAX
le corresponde los valores de 𝛼 mientras que para MIN le compete las estimaciones de 𝛽.
Como características principales tenemos que este algoritmo no tiene incidencia sobre el
resultado final, permite realizar búsquedas más profundas en comparación con el algoritmo
de MINIMAX. Dicho procedimiento exalta la colocación y no se enfoca en las estimaciones
3
exactas. Cabe mencionar, que el algoritmo renueva los valores a medida en que se va
desenvolviendo, transitando por el árbol.
Ejemplo:
a) “A partir del nodo B, se genera su primer hijo, que es terminal y su función de utilidad nos
da el valor 3. Por tanto, como B es un nodo MIN, sabremos que su valor final será menor o
igual a 3, es decir, estará en el rango [-∞, 3]. Por ello, β = 3”. Gómez (2016).
e) “Pasamos a generar los hijos del nodo D, tercer hijo del nodo raíz. Su valor es 14, por tanto,
como C es un nodo MIN, sabremos que su valor definitivo será menor o igual que 14, es decir,
está en el rango [-∞,14]. Por ello, β = 14. Como el valor de D será menor de 14, el valor de A,
como mucho podrá valer 14, por tanto, estará en el rango [3,14]”. Gómez (2016).
4
siguiendo una estrategia para determinar la mejor posible. De esta manera, se puede
evidenciar la aplicación de ello, en los juegos de mesa e incluso en las empresas cuando
deben tomar una determinación con aras de encontrar el éxito.
Conclusiones
En consecuencia, podemos evidenciar el gran recorrido que tuvo el ingenio de John Von
Neuman y sus aportes tan significativos que permitieron en gran parte el desarrollo de lo que
hoy en día concebimos como sociedad, y con base en ello, el desenvolvimiento de nuevos
cuestionamientos que hacen permear las mentes ajenas, originando nuevas teorías que
partieron de los cimientos arcaicos. De esta manera, llegamos a lo que comprende el
algoritmo de MINIMAX, como proceso elemental en la selección de aquella alternativa óptima
que busca obtener el bienestar máximo. De la misma manera, se encuentra el algoritmo Alpha
- Beta, que es la modernización de la explicación de lo que concierne al algoritmo de
MINIMAX, siendo este más sintetizado en su proceder, permitiendo así la facilidad en la
comprensión de su funcionalidad, indagando por el resultado anhelado.
Finalmente, John Von Neumann afirmada que un jugador racional no jugaría por debajo de
lo que estuviese permitido para obtener el resultado Maximin, por el contrario, los dos
adversarios están conscientes de evitar dicho resultado.
Bibliografía
5
Anexos