Está en la página 1de 8
INTRODUCCION A LA INTELIGENCIA ARTIFICIAL, ‘Cédigos: INFORMATICA DE SISTEMAS. Céaligo carrera: 40 Cédigo asignatura: 209 Junio 2000-2001, 2" Semana, DURACION: 2 HORAS, ‘Material permitido: NINGUNO. Importante: Ponga el nombre en todas las hojas. No sdlo se valorard que el resultado sea correcto, sino también la latdad en la exposicin de los pasos que se han seguido en la resolucin, que el examen asté compensado y que no ncluya erores conceptual importantes. 1, (Valoracién: 2 puntos) ‘bn que se asemejan y en qué se diferencian el método MINIMAX y el Método de poda alfa-beta? Deseriba en detalle un ejemplo en el que dichas diferencias queden reflejadas. -SOLUCION: Los métodes MINIMAX y de poda alfa-beta se utilizan en problemas de bisqueda con dos adversarios cuyo objetivo es ganar una partida en Ia que realizan movimientos alternativos. Normalmente, en cualquiera de estos dos métodos se genera un drbol de busqueda con una profuundidad limitada a partir de la situacién inicial de la partida. Cada nivel de este arbol esta asociado a un tumo de movimiento para uno de los dos jugadores; légicamente, se supone que cada jugador elegira siempre aquel movimiento que mas ventaja le dé en la partida, A los nodos hja del érbol de busqueda se les asocia el valor de una funcién de evaluacién heuristica (fev) que ces una estimacién del tipo de juego que cuelga de ese nodo hoje. El método MINIMAX explora exhaustivamente el drbol de busqueda mediante un método de biisqueda en profundidad. Considérese el siguiente ejemplo, donde se representa ‘mediante eirculos el turno del jugador que tiene que mover en la situacién actual de la partida y mediante rectingulos el turno de su contrincante. Debajo de cada nodo hoja aparece un ndimero que indica lo prometedora que es esa situacidn de la partida para que gane el jugador que tiene que mover en la situacién actual (nodo raiz del érbol de biisqueda). Al lado de cada arco se especifica el valor de la jugada aleanzado si la misma se desarrolla por ese camino y, encerrado en un circulo, el ciclo del algoritmo de bisqueda en profundidad en que se devolveria dicho valor. 6 10 5 3 Finalmente, la mejor jugada es la de la izquierda, que conduce a un valor 6, frente a Ta jugada de la derecha, que conduce a un valor 3. En el rbol de bisqueda anterior, en el ciclo 3 el jugador que tiene que mover sabe que por la izquierda puede llegar a una jugada de valor 6. En el ciclo 4, sin haber explorado todavia el nodo Introduccién a la LA. (curso 2000-2001, segunda semana) 2 hoja etiquetado con 3, sabe que por la derecha pod Hegar a una jugada de valor So menor que 5. Por tanto, siempre elegiré la jugada de la izquierda, sea cual sea el valor de la fev asociado al nodo hoja situado més a Ta derecha. Por tanto, la exploracién que el método MINIMAX realiza del nodo hoja etiquetado con 3 es innecesaria, El método de poda alfa-beta permite corregir situaciones como la anterior en las que el método MINIMAX tealiza exploraciones innecesarias de ciertos subarboles del drbol de bisqueda. Para ello, a Ta vez que se realiza una exploracién en profundidad del arbol de biisqueda, existe la posibitidad de realizar podas en el mismo. Una poda alfa se realiza en un nodo desde el que se intente acceder a situaciones de la partida con valores altos de la fev y una poda beta desde el tipo ccontrario de nodos. En cada llamada recursiva desde un nodo a uno de sus nodos hijo, se pasan dos pardmetros: alfa y beta. El valor recibido como consecuencia de la llamada recursiva permite actualizar (incrementar o dejar igual) el valor de alfa sila Hamada se hizo desde un nodio desde el ‘que se imtente acceder a situaciones de la partida con valores altos de la fev; el valor actualizado €s beta (se decrementa 0 se deja igual) si la Hamada se hizo desde el tipo contrario de nodos. El valor que se devuelve al nodo padre después de realizada una llamada recursiva a cada nodo hijo ¢s el iltimo valor actualizado de alfa o beta, sein corresponda. Al principio, en la primera Tlamada recursiva desde el nodo raiz, alfa =e y beta=te. Se realiza una poda desde un nodo tan pronto como los valores que gestiona de alfa y beta cumplan la siguiente relacién: alfa 2 beta. EL cjemplo anterior quedaria ahora de la siguiente forma, donde el orden de realizacién de cada llamada recursiva se representa mediante un niimero encerrado en un rectdngulo: Poda beta <3) En Ia Hamada recursiva 2 se actualiza el valor de beta de co a 6. Después de la Hamada recursiva 3 se devuelve hacia arriba el ultimo valor de beta actualizado: 6, En la llamada recursiva I se actualiza el valor de alfa de —=» a 6, En la lamada recursiva 5 se actualiza el valor de beta de co a 5, En este momento se realiza una poda beta y el nodo etiquetado con “3” queda sin visitar. Como la tltima vez que se aetualiza el valor de alfa en el nodo raiz es por el camino 4e Ia izquierda, ésta sera la mejor jugada posible para esa situacién actual de la partida. 2. (Valoracién: 5 puntos) Suponga que en un mundo de objetos se parte de la existencia de los siguientes objetos: una mesa plegable, mesal, de color marrén; un cubo de color verde, al que llamaremos cubol, con una densidad de 5 y con una longitud, altura y anchura todas ellas iguales @ 10; un segundo cubo de color azul, eubo?, con un peso de 4 que se encuentra inicialmente encima del cubol demas se parte de los siguientes datos. Un objeto tiene como especializacién un objeto fisico que puede tener los siguientes atributos: volumen, peso, densidad, encima, debajo, frégil, menos pesado, apilar-encima, color. Todos estos INTRODUCCION A LA INTELIGENCIA ARTIFICIAL Cédigos: INFORMATICA DE SISTEMAS Cédigo carrera: 40 Cédigo asignatura: 209 septiembre 2000-2001, Original, DURACION:2 HORAS, __ Material permitido: NINGUNO Importante: Ponga el nombre en todas las hojas. No solo se valoraré que el resutado sea correcta, sino también la Caridad en la exposicidn de los pasos que se han seguido en la resolucién, que el examen esté ‘compensado y que no incluya erroes conceptuales importantes. 1. (Valoracién: 5 puntos) Considere el juego de Tres En Linea: en el estado inicial MAX puede elegir nueve jugadas posibles. El juego alterna entre las “X” que pone MAX y las “O” que pone MIN, hasta legar a estados donde un jugador gana y logra poner 3 marcas en linea, 0 cuando se llenan todos los cuadros. Se utilizaré una funeién de evaluacién heuristica def X\-30:40)), donde X, es el nimero de filas, columnas y diagonales con i ‘0, y O.es el nimero de filas, columnas y diagonales con iO" y ninguna “ 1. Aproximadamente, geudntos juegos posibles de Tres en Linea hay? 2. Muestre la totalidad del arbol de juego que vaya desde un tablero vacfo hasta una profuundidad de 2 (es decir, una “X” y una “O” en el tablero), teniendo en cuenta la simettia Deberd obtener 3 posiciones en el nivel | y 12 posiciones en el nivel 2. 3. Marque en el arbol obtenido las evaluaciones correspondientes a todas las posiciones del nivel 2, 4, Marque en el drbol obtenido, utilizando el algoritmo MINIMAX, los valores asociados a los estados de los niveles 0 y 1. {Cuil es la mejor jugada de inicio y por qué? 5. Suponiendo que los nodos de! nivel 2 se generan siguiendo un orden creciente de ta funcién de evaluacién heuristica, gqué nodos de este nivel no serdn visitados siguiendo el Método de poda alfa-beta? ,Cual es ahora la mejor jugada de inicio y por qué? Repetir este mismo apartado suponiendo que los nodos del nivel 2 se generan siguiendo un orden decreciente de la funcién de evaluacién heuristica, 2. (Valoracién: 5 puntos ious tirmalinio done ins nici nn capacidad de inferencia (lo que se puede inferir)?. a) reglas b) grafos de Sowa ©) logica de predicados 4) grafos de dependencia conceptual Para responder a esta cuestion debe especificar claramente y con ejemplos las capacidades de inferencia de cada uno de los métodos asociados a los formalismos mencionados. Introduceién a la L.A. (curso 2000-01, septiembre original) 2 SOLUCION 1) Suponiendo que se Henaran todas las casillas y teniendo en cuenta las casillas a las que puede mover cada jugador en cada movimiento: 9-8-7-6.5-54-3-2-1 MAX MIN MAX MIN MAX MIN MAX MIN MAX, 9 2),3)y4) MAX +1 Mejor jugada Fx] Ix] MIN =i 22 x] 1 iy KOR IX x] hx I) a MAX ‘| io) xi || x 120 Ti 5) Orden ereciente: MAX MIN No ][ No ][ No ][ No visi- |] visi |] vist |} visi- tado | tado }[ tado [| tado 1 oo 0) 6) Orden decreciente: Introduceién a la L.A. (curso 2000-01, septiembre original) MAX MIN MAX No || No tado |] tado 2. (Valoracién: 5 puntos) Considere el juego de las 3 en raya, que consiste en colocar 3 fichas en linea en un tablero de a) Defina una funcién heuristica que permita tomar una decisién en el caso de no poder explorar el arbol completo de biisqueda (Justifique la respuesta). Una posible fincién heuristica, en la que se valoran las posibilidades de ganar una pa funcién de ta distribucién de las fichas segin el jugador X, podria ser la siguiente: FEV = 10.X; + 3X2 + X;— 10 Oy -30;— Oy Donde: X, esel mlimero de filas, columnas o diagonales con 3 Xy ningin O. Xz es el niimero de filas, columnas 0 diagonales con 2 X'y ningin O. X_ esel mimero de filas, columnas o diagonales con 1X y ningin O, 05 es el niimero de filas, columnas o diagonales con 3 O'y ningtin X. 0; es el nlimero de filas, columnas 0 diagonales con 2 Oy ningun X. 0, esel nlimero de filas, columnas o diagonales con 1 Oy ningiin X. En esta funcién heuristica se ha dado més peso a las alternativas en las que ya existen dos fichas del jugador en fa misma linea (filas, columnas o diagonales). Estas combinaciones se han ponderado con un factor de 3, de forma que tienen prioridad sobre cualquier otra decisién. En el caso de que ino existan lineas con dos fichas entraran en juego las lineas que tienen una sola ficha del jugador correspondiente y ninguna del rival. Las lineas que tienen fichas del propio jugador y dl rival son neutras y, por tanto, no se valorardn en la funcién heuristica porque no conducen ni a la victoria, ni a la derrota Por tiltimo, se ha incluido en la funcién de evaluacién las combinaciones de 3 fichas en la misma linea, de forma que la propia funcién de evaluacién sirve para estimar si un estado es meta y quien es el ganador: si FEV esté cercano a. 10 ganador X, si es FEV esta cercano a -10 el ganador es 0. b) En Ia figura 1 se muestra un arbol de biisqueda simplificado con algunas de las opciones posibles desde un estado inicial. Suponga que estas son todas las opciones posibles y aplique la funcidn heuristica al arbol de busqueda para evaluar los estados si el limite de profundidad de exploracién es 2. Utilice el método MINIMAX para decidir el estado elegido por el jugador en el estado inicial. bg EI ba Bg RK K 3] Bo | [9] 1O} {a IS} Px a od oa a ra iS OX i] i] iD a 6k CR) d Figura 1 Teniendo en cuenta que el primer movimiento lo realiza el jugador de las fichas X, si aplicamos la funcién de evaluacién heuristica al primer estado del segundo nivel de profundidad de la figura 1 nos queda la siguiente asignacién: 13 lobo} 9) 37 FEV =3-3+1+1=2 do este mismo proceder, obtenemos Ia evaluacién de todo el segundo 1 I xx clo} fol} XI jolx| lalolx| 9] xg] i} 2 -6 1 Teniendo en cuenta que la FEV representa lo prometedora que es una jugada para MAX (en este caso el jugador de X), la evaluacién de los nodos del segundo nivel coincide con la funcién de evaluacién. La propagacién de la evaluacién a los nodos superiores y el camino que justifica la decision del jugador MAX son los siguientes: is si 3 -l -6 RI lob 1 an lol} ‘ PEI I jolx| = Iebal El resultado es que el jugador de X toma el estado de en medio del nivel 1, que segiin la fun evaluacion heuristica es el mas prometedor. b) {Qué ocurriré si el limite de profundidad de exploraci6n es 3? ,Qué decision tomard el jugador en el estado inicial? Realizando el mismo proceso, pero ahora desde el nivel 3, tenemos lo siguiente: 6 MAX Eg oe AE min nea Bo oe Mu 3 Frel-6 = MAX Hg}12 ERB Hag 3 min FEV:12 -6 6 I1 3 3 -6 El resultado es que el jugador de X toma de nuevo el mismo estado que en el apartado anterior, pero en este caso el valor de Ia FEV le permite saber que va a ganar. ©) Comente las diferen s entre los métodos MINIMAX y de Poda a-B. La diferencia principal entre los métodos de biisqueda con adversarios MINIMAX y de Poda a- es que el método MINIMAX es un procedimiento que utiliza busqueda en profundidad realizando una exploracién exhaustiva del drbol de biisqueda, frente al método de Poda o- B que realiza una bisqueda, también en profundidad, pero en la que se tienen en cuenta los valores encontrados en las ramas analizadas con anterioridad, de manera que, sino merece Ja pena seguir explorando el arbol porque la decisién en un nivel superior ya est tomada (no va.a depender del resto de las ramas que quedan por analizar a ese nivel), se abandona Ja bisqueda en ese punto (se pods el arbol), es decir, éste método se aprovecha de informacién obtenida con anterioridad en otras ramas para reducir el arbol de exploraci6n.

También podría gustarte