Está en la página 1de 11

Teora de juegos

Evaluacin aproximada al horizonte finito (Zue,


1945; Wiener, 1948; Shannon, 1950)

Primer programa de ajedrez (Turing, 1951)

Aprendizaje automtico para mejorar precisin de
evaluaciones (Samuel, 1952-57)

Poda para permitir bsquedas ms profundas
(McCarthy, 1956)
Poda alfa-beta


Mejora en promedio un 30% los resultados del
algoritmo minimax, (depende de la distribucin de
los nodos y la funcin objetivo)

No se puede quitar el exponente del la complejidad
de tiempo, pero se puede reducir a la mitad (puede
conseguir la decisin minimax sin revisar cada nodo)

Usando poda para evitar examinar partes del rbol
que no aportan ms informacin
Elimina ramas que no pueden influenciar la decisin final
Poda alfa-beta
Considerar un nodo n en algn lugar del rbol, tal que un
jugador tiene la opcin de moverse a ese nodo.
Si el jugador tiene una mejor opcin m al nivel del padre
del nodo n o en cualquier punto arriba, entonces n nunca
ser alcanzado en el juego.
Cuando se tiene suficiente informacin de n (al examinar
algunos de sus descendientes) se puede podar su rama.
Siendo una bsqueda en profundidad primero, slo se
deben considerar los nodos de una sola ruta en el rbol.
Poda alfa-beta

Recibe su nombre de los dos parmetros que describen limites a


los valores que son pasados hacia arriba en cualquier punto de la
ruta:

Alfa: el valor de la mejor opcin encontrada hasta el momento
para cualquier opcin de la ruta para MAX (por ejemplo: el
valor ms alto)

Beta: el valor de la mejor opcin encontrada hasta el momento
para cualquier opcin de la ruta MIN (por ejemplo: el valor
ms pequeo)
Algoritmo Poda alfa-beta
Minimax
Ejemplo Poda alfa-beta
Ejemplo minimax

MAX

MIN

MAX

MIN
Idea general
Propiedades poda alfa-beta

También podría gustarte