Está en la página 1de 21

El mundo de Wumpus:

El mundo de Wumpus:

Brisa POZO Hedor Oro

Salida

March 28, 2006

2.1

Descripcin PAGE del agente cazador o


Percepciones (restringidas a la casilla que ocupa): El agente percibe si en su casilla se encuentra el wumpus En los cuadros adyacentes al wumpus, percibe su hedor En los cuadros adyacentes a un pozo, percibe la brisa Donde est el oro, percibe su brillo a Si avanza hasta un muro, percibe el choque Cuando mata al wumpus, percibe un grito La percepcin es representable por cinco s o mbolos (hedor,brisa,brillo,choque,grito)

March 28, 2006

2.2

Descripcin PAGE del agente cazador o


Acciones:
Avanzar, Girar 90o grados a izq. o der., Lanzar una echa (la echa llega hasta el wumpus o a la pared), y salir (si se encuentra en la casilla de salida)

El agente muere si entra en un pozo, u ocupa una casilla en la que est un wumpus vivo a Objetivo: encontrar el oro y volver a la salida lo ms a rpidamente posible (vivo, claro) a

March 28, 2006

2.3

Ejecucin o
Supongamos que el agente ha visitado ya las casillas (1,1), (1,2) y (2,1), encontrndose en esta ultima: a

? ?

? ?

? ? ?

? ? ? ?

Salida

March 28, 2006

2.4

Representacin y funcionamiento o
La sucesin de percepciones ha sido (con respecto a o (hedor,brisa,brillo,choque,grito)): (0, 0, 0, 0, 0), (0, 1, 0, 0, 0), (1, 0, 0, 0, 0) Si el agente cazador es un agente basado en conocimiento, su comportamiento estar determinado por la base de a conocimiento de que dispone. La base de conocimiento contendr un conocimiento inicial, a pero su contenido ir variando con el funcionamiento del a agente. El bucle de funcionamiento bsico ser: a a 1. Percibir y aadir la informacin obtenida a la base de n o conocimiento. 2. Deducir qu accin llevar a cabo, de acuerdo con el e o conocimiento disponible. 3. Llevar a cabo la accin seleccionada y aadir esta o n informacin en la base de conocimiento. o
March 28, 2006 2.5

Representacin y funcionamiento (II) o


Tras visitar las casillas (1,1), (1,2) y (2,1) en la base de conocimiento tiene (entre otras) la siguientes frmulas: o
H11 H21 H12 H11 W11 W12 W21 H21 W11 W21 W22 W31 H12 W11 W12 W22 W13 H12 W13 W12 W22 W11 Conocimiento bsico a

B11 B21 B12

Percepciones

Puede deducir el agente que Wumpus est en W13 ? a

March 28, 2006

2.6

Conocimiento y modelos posibles


Dada una base de conocimiento K , hay que considerar tres clases de modelos: 1. Los modelos lgicos de K . o 2. Los modelos que representan entornos reales. 3. El modelo que representa al entorno en el que est el agente. a
Modelos Modelos de entornos reales

Entorno actual

A
Nuevo Conocimiento

Refinamiento

March 28, 2006

2.7

Percepcin nueva = renamiento de la clase o de modelos


Cada nuevo conocimiento percibido rena el conjunto de modelos. Si los modelos del tipo (2) se reducen a uno, entonces tenemos conocimiento perfecto. Este proceso se puede localizar para una propiedad concreta:
Si con respecto a una propiedad concreta, slo hay un modelo o de tipo (2), entonces est determinada. a

March 28, 2006

2.8

Modelos posibles para K despus del segundo e movimiento


El agente no sabe en cul de estos mundos est: a a
? ? ? ? ? ? ? ? ? ? ?
Salida Salida

? ?

? ?

? ? ?

? ? ? ?

? ?

? ?

? ? ?

? ? ? ?

Salida

March 28, 2006

2.9

Renamiento
Razonamiento: renar el conjunto de mundos posibles. Ahora sabe que en (2,2) no hay pozo: Los modelos de esta propiedad son:
? ? ? ? ? ? ? ? ? ? ?
Salida Salida

? ?

? ?

? ? ?

? ? ? ?

? ?

? ?

? ? ?

? ? ? ?

? ?

? ?

? ? ?

? ? ? ?

Salida

Salida

Rena su conocimiento: est en el mundo: a


? ? ? ? ? ? ? ? ? ? ?
Salida

March 28, 2006

2.10

Esquemas de razonamiento
Esquema de razonamiento deductivo (algunas ideas):
Si demuestra que una casilla esta libre de peligro, entonces puede visitarla para percibir. Si demuestra que Wi,j , entonces dispara. Si demuestra que tiene un pozo la evita.

Pero, Qu hace si no demuestra que una casilla es segura? e


Opcin cauta: elegir las casillas demostrablemente seguras. o Problema: puede quedarse bloqueado. Opcin atrevida: elegir, si es necesario, entre las casillas que o no son demostrablemente peligrosas. Problema: puede morir.

Problema: Cmo planicar la bsqueda? o u


Cundo aplicar una opcin atrevida o cauta? a o

March 28, 2006

2.11

Ejemplo
Supongamos que un robot est navegando por un parque, y debe a llegar a la salida de ste. e Percepciones: Su entorno. Acciones: Deplazarse (paso a paso). Objetivo: Alcanzar la salida. Entorno: Esttico, discreto, determinista, episdico. a o
Entorno absoluto: Guarda en memoria el mapa completo del lugar (accesible). Entorno local: Guarda la informacin slo de su entorno f o o sico ms prximo (efectivamente accesible). a o

Obstculos: R rboles. a o, a

March 28, 2006

2.12

Grco a
RIO

Salida

=Arbol

March 28, 2006

2.13

Representacin del ejemplo o


RIO

Salida

March 28, 2006

2.14

Representando el ejemplo (I)


Variables: Aij = En la casilla (i, j) hay un rbol. a Rij = Por la casilla (i, j) pasa el r o. Dt = En el momento t es posible desplazarse i casillas i,j horizontales, j verticales (i, j {1, 0, 1}). Et = El robot se encuentra el la casilla (i, j) en el momento t. ij Base de conocimiento:
1 Hechos: {E44 } {A11 , . . . , A41 , . . . , R21 , . . . }

Posicin o Distribucin de obstculos o a Condiciones: Para cada (i, j) y cada (k, h) = (i, j): (Et Et ) ij kh

March 28, 2006

2.15

Representando el ejemplo (II)


Componente pensante: Acciones (reglas E-C-A): Et (R35 A35 ) Dt 34 01 Restricciones: (A11 Et ) 11 Prohibiciones: Et Dt 11 1,1 Deniciones: La casilla (i,j) est libre (Lij ) a Lt (Rij Et Aij ) ij ij Creencia: por ejemplo, Et Lt (falsa?) 11 12

March 28, 2006

2.16

Representando el ejemplo (III)


Resultado de la accin (mandato a los sensores; movimiento): o
Dt Et Et+1 (No es disparable!). 32 10 22 Et Dt Et+1 35 34 01

Estado: {Et } (entorno representado localmente). ij Estado: {Et , A21 , . . . } (entorno global). ij La componente reactiva est formada por reglas E-C-A. a

March 28, 2006

2.17

Representando el ejemplo (IV)


Componente racional: Objetivo: E8 71 Planicacin: Obtener un conjunto adecuado de reglas del o tipo: Et Dt ij kh para ejecutarlas ordenadamente. Componente pro-activa: Si Et entonces Objetivo : Et+1 34 44 Ejercicio: Elegir una base de conocimiento K relativamente pequea y natural de tal modo que K |= E8 . n 71 Se puede extraer de la prueba por tableros el camino que debe seguir el robot?

March 28, 2006

2.18

Limitaciones de la lgica proposicional para el o problema


Grado de autonom a: Se puede disear un conjunto de reglas para alcanzar la salida, n si se puede, para ese parque, independientemente del sitio donde se encuentra el robot. Si se cambia a otro parque, ya no sirve el sistema. Expresividad deciente. En el ejemplo anterior, el tamao de la base de conocimiento n es O(n) (siendo n el nmero de casillas), pues el entorno es u accesible en su totalidad (con respecto al conocimiento del agente).

March 28, 2006

2.19

Ventajas y Limitaciones
La lgica proposicional es muy util si no es importante el o contenido de cada proposicin, slo es importante la o o estructura de la informacin o En estos casos, muy manejable. Los problemas fundamentales son decidibles. Es una lgica Bivalente, pero se puede alterar la semntica o a para obtener lgicas multivaloradas. o En algunos casos no es importante que sean deducibles todas las tautolog as.

March 28, 2006

2.20

Bibliograf a
M. Ben-Ari: Mathematical Logic for Computer Science. 2 ed. (2001), Cap tulos 1 y 2. Russell & Norvig: Inteligencia Articial: Un enfoque moderno. Cap tulo 7. Disponible en la web: http://aima.cs.berkeley.edu/newchap07.pdf

March 28, 2006

2.21

También podría gustarte