Está en la página 1de 25

INTELIGENCIA

ARTIFICICIAL
TEMA: Agentes inteligentes

Ing. Iván A. Calle Flores


1
In which we discuss the nature of agents,
perfect or otherwise, the diversity of
environments, and the resulting menagerie of
agent types
● Agentes racionales
● Tipos de entornos ‘environments’

● Estructuras básicas de diversos agentes ‘racionales’

2
1. AGENTES Y ENTORNOS
● Un agente es aquello que puede percibir
su entorno a través de sensores y actuar
en el mismo usando su actuadores
Los humanos tienen ojos, oídos, piernas, etc.

● El termino ‘percept’ se refiere a aquello


que es medido por los sensores en
cualquier instante

● ‘percept sequence’ es la completa historia


de las medidas

Las acciones del agente pueden depender de toda la data disponible


‘percept sequence’, pero no de aquello que no ha visto

3
● El comportamiento del agente esta dado por la función del agente
‘agent function’ que especifica la acción para cualquier secuencia de
medidas

● Esta función cuando se implementa en una computadora recibe el


nombre de ‘programa’

● ¿Es buena idea tabular para cada posible combinación de medidas la


acción ’racional’ a tomar?
4
Ejem. The vacuum-cleaner world
● El agente tiene sensores de
 Posición

 Presencia de basura

● El agente tiene acciones de


 Movimiento (left, right, do nothing)

 Succionar la basura

● Una posible tabulación de


la ‘función’ del agente
¿Cuál es la forma correcta de
llenar la tabla?
5
2. El CONCEPTO DE RACIONALIDAD
● Un agente es racional si hace acciones ‘correctas’
Su tabla esta llenada correctamente

● Las acciones correctas son aquellas


que llevan al agente y su entorno a
una secuencia de estados ‘deseables’

● Matemáticamente, esta noción se modela


usando una medida de performance que
evalúa esta secuencia.

● Existen diversos posibles criterios


de performance.
P1: Cantidad de basura limpiada por hora
P2: Cantidad de casilleros limpios por hora
6
Racionalidad
● Para definir la racionalidad se requieren 4 cosas
 La medida de performance que define el criterio de éxito

 El conocimiento del entorno por parte del agente

 Las acciones disponibles del agente

 La secuencia de mediciones

Definición de un agente racional

Para cada posible secuencia de


mediciones, el agente racional debe
seleccionar la acción que maximice su
medida de desempeño, dado el
conocimiento que tiene el agente de su 7
● Es el siguiente robot racional?

 Performance: 1 punto por cada posición limpia en cada instante de tiempo

 Conocimiento: Hay 2 casilleros, los casilleros limpios permanecen limpios, y


el aspirado limpia la basura

 Acciones: Izquierda, Derecha, Succionar

 Mediciones: El agente percibe correctamente su ubicación, y la presencia de


basura en la misma
Bajo estas condiciones el agente es racional

● Si la medida de performance incluye un termino de penalidad por


cada movimiento, el robot seguirá siendo racional? 8
3. LA NATURALEZA DE LOS
ENTORNOS
● Existen diversos tipos de entornos en los que puede operar
un agente

● El tipo de entorno, define el tipo ‘diseño’ del agente a usar

9
3.1. Definiendo un problema
● Para el diseño de un agente racional se tiene que definir
Performance, Entorno, Actuadores, Sensores (PEAS)

Eje. Diseño de un taxi autónomo

 Performance: Seguro, rápido, confortable,


maximice las ganancias, etc.

 Entorno: Carreteras, otros carros,


transeúntes, clientes, etc.

 Actuadores: Timón, acelerador,


freno, etc.

 Sensores: Cámaras, encoders, GPS,


acelerómetros, láser, etc.

10
PEAS para diversos tipos de agentes

11
3.2. Propiedades del entorno

● Completamente observable vs. Parcialmente observable

Si los sensores del agente pueden medir el estado completo del


entorno, la tarea es observable.

Este entorno es conveniente porque el agente no necesita mantener un


modelo ‘interno’ del mundo

Si los sensores son ruidosos o imprecisos, o solo pueden medir una


parte del estado, el entorno es parcialmente observable

Es el entorno del robot aspirador


completamente observable?

Si el agente no tiene sensores, el entorno no es observable.


12
● Agente simple vs. Múltiples agentes

Los entornos ‘competitivos’ son aquellos en donde los agentes tratan de


maximizar su performance (que minimizan el performance del otro agente)

Los entornos ‘cooperativos’ son aquellos


en donde las acciones de los agentes no
entran en conflicto

13
● Determinísticos vs. Estocásticos

Si el siguiente estado del entorno es completamente


determinado por el estado actual y la acción ejecutada
por el agente, el entorno es determinístico

Si la presencia de basura es aleatoria, el


entorno es determinístico?

Si el proceso de aspirado es impreciso, el


entorno es determinístico?

Un entorno es impreciso ‘uncertain’ si no es completamente observable o


determinístico

14
● Episódico vs. secuencial
Si la acción actual no depende de
acciones previas, el entorno es
episódico

Clasificación de partes
defectuosas

Si la acción actual afecta las


acciones futuras, el entorno es
secuencial

Ajedrez, damas, etc.

● Estático vs. dinámico


Si el entorno cambia, independiente de las acciones del agente, el
entorno es dinámico.

15
● Discreto vs. continuo

La distinción de discreto/continuo se aplica al estado, las mediciones y


las acciones

16
17
4. TIPOS DE AGENTES
● El objetivo de A. I es el diseño del
‘programa’ del agente (medidas ->
acciones)

Agente =
arquitectura +
programa ● El método mas general es la
construcción de la tabla que
especifica la ‘función’ del agente

● El desafío de la I.A es el diseño de algoritmos que produzca el


mismo comportamiento que el de la tabla

18
4.1. Agentes de simple reflejo

● Es el tipo de agente mas


simple

● Las acciones dependen


solamente de las medidas
‘actuales’ de los sensores

● Se implementa usando
reglas de condiciones

19
Sensores: Locación, Presencia de basura

function action = REFLEX_VACUUM_AGENT(location, status)

if status == 'dirty'
action = 'suck';
elseif location == 'A'
action = 'right';
elseif location == 'B'
action = 'left';
end

● Los humanos tienen estos tipos de comportamiento.


● Solo producen una inteligencia ‘limitada’
● Se requiere que el entorno sea ‘completamente observable’
20
4.2. Agentes de reflejo basado en modelos

● En entornos ‘parcialmente
observable’, el agente debe
tener un estado ‘interno’
del entorno

 Se debe tener un modelo de


como cambia el mundo
independientemente del agente

 Se debe tener un modelo de


como las acciones del agente
cambian el mundo

21
Ejem. Sensorless vacuum-cleaner

● El robot tiene
una creencia
‘belief’ sobre el
entorno

● Este ‘belief’ se
actualiza
conforme las
acciones que toma
robot

22
4.3. Agentes basados en metas

● La acción correcta no solo


depende del estado, sino de
la ‘meta’ donde el agente
quiere llegar

● A veces la acción a tomar es


directa(cuando la meta se
alcanza tomando una acción)

● La mayor parte de las veces el agente


tiene que considerar diversas acciones
con el fin de llegar a la meta
23
4.4. Agentes basados en utilidades

● Muchas veces las metas no


son suficientes para producir
acciones de calidad

● La función de ‘utilidad’ es
una internalización de la
medida de performance

● Se escogen las acciones que maximicen


la función de utilidad

24
4.5. Agentes que aprenden

25

También podría gustarte