Agentes Inteligentes

INTELIGENCIA
ARTIFICICIAL
TEMA: Agentes inteligentes
Ing. Iván A. Calle Flores

1
In which we discuss the nature of agents,
perfect or otherwise, the diversity of
environments, and the resulting menagerie of
agent types
● Agentes racionales
● Tipos de entornos ‘environments’
● Estructuras básicas de diversos agentes ‘racionales’
2
1. AGENTES Y ENTORNOS
● Un agente es aquello que puede percibir
su entorno a través de sensores y actuar
en el mismo usando su actuadores
Los humanos tienen ojos, oídos, piernas, etc.
● El termino ‘percept’ se refiere a aquello

que es medido por los sensores en
cualquier instante
● ‘percept sequence’ es la completa historia

de las medidas
Las acciones del agente pueden depender de toda la data disponible

‘percept sequence’, pero no de aquello que no ha visto
3
● El comportamiento del agente esta dado por la función del agente
‘agent function’ que especifica la acción para cualquier secuencia de
medidas
● Esta función cuando se implementa en una computadora recibe el

nombre de ‘programa’
● ¿Es buena idea tabular para cada posible combinación de medidas la

acción ’racional’ a tomar?
4
Ejem. The vacuum-cleaner world
● El agente tiene sensores de
 Posición
 Presencia de basura
● El agente tiene acciones de

 Movimiento (left, right, do nothing)
 Succionar la basura
● Una posible tabulación de

la ‘función’ del agente
¿Cuál es la forma correcta de
llenar la tabla?
5
2. El CONCEPTO DE RACIONALIDAD
● Un agente es racional si hace acciones ‘correctas’
Su tabla esta llenada correctamente
● Las acciones correctas son aquellas

que llevan al agente y su entorno a
una secuencia de estados ‘deseables’
● Matemáticamente, esta noción se modela

usando una medida de performance que
evalúa esta secuencia.
● Existen diversos posibles criterios

de performance.
P1: Cantidad de basura limpiada por hora
P2: Cantidad de casilleros limpios por hora
6
Racionalidad
● Para definir la racionalidad se requieren 4 cosas
 La medida de performance que define el criterio de éxito
 El conocimiento del entorno por parte del agente
 Las acciones disponibles del agente
 La secuencia de mediciones
Definición de un agente racional
Para cada posible secuencia de

mediciones, el agente racional debe
seleccionar la acción que maximice su
medida de desempeño, dado el
conocimiento que tiene el agente de su 7
● Es el siguiente robot racional?
 Performance: 1 punto por cada posición limpia en cada instante de tiempo
 Conocimiento: Hay 2 casilleros, los casilleros limpios permanecen limpios, y

el aspirado limpia la basura
 Acciones: Izquierda, Derecha, Succionar
 Mediciones: El agente percibe correctamente su ubicación, y la presencia de

basura en la misma
Bajo estas condiciones el agente es racional
● Si la medida de performance incluye un termino de penalidad por

cada movimiento, el robot seguirá siendo racional? 8
3. LA NATURALEZA DE LOS
ENTORNOS
● Existen diversos tipos de entornos en los que puede operar
un agente
● El tipo de entorno, define el tipo ‘diseño’ del agente a usar
9
3.1. Definiendo un problema
● Para el diseño de un agente racional se tiene que definir
Performance, Entorno, Actuadores, Sensores (PEAS)
Eje. Diseño de un taxi autónomo
 Performance: Seguro, rápido, confortable,

maximice las ganancias, etc.
 Entorno: Carreteras, otros carros,

transeúntes, clientes, etc.
 Actuadores: Timón, acelerador,

freno, etc.
 Sensores: Cámaras, encoders, GPS,

acelerómetros, láser, etc.
10
PEAS para diversos tipos de agentes
11
3.2. Propiedades del entorno
● Completamente observable vs. Parcialmente observable
Si los sensores del agente pueden medir el estado completo del

entorno, la tarea es observable.
Este entorno es conveniente porque el agente no necesita mantener un

modelo ‘interno’ del mundo
Si los sensores son ruidosos o imprecisos, o solo pueden medir una

parte del estado, el entorno es parcialmente observable
Es el entorno del robot aspirador

completamente observable?
Si el agente no tiene sensores, el entorno no es observable.

12
● Agente simple vs. Múltiples agentes
Los entornos ‘competitivos’ son aquellos en donde los agentes tratan de

maximizar su performance (que minimizan el performance del otro agente)
Los entornos ‘cooperativos’ son aquellos

en donde las acciones de los agentes no
entran en conflicto
13
● Determinísticos vs. Estocásticos
Si el siguiente estado del entorno es completamente

determinado por el estado actual y la acción ejecutada
por el agente, el entorno es determinístico
Si la presencia de basura es aleatoria, el

entorno es determinístico?
Si el proceso de aspirado es impreciso, el

entorno es determinístico?
Un entorno es impreciso ‘uncertain’ si no es completamente observable o

determinístico
14
● Episódico vs. secuencial
Si la acción actual no depende de
acciones previas, el entorno es
episódico
Clasificación de partes
defectuosas
Si la acción actual afecta las

acciones futuras, el entorno es
secuencial
Ajedrez, damas, etc.
● Estático vs. dinámico

Si el entorno cambia, independiente de las acciones del agente, el
entorno es dinámico.
15
● Discreto vs. continuo
La distinción de discreto/continuo se aplica al estado, las mediciones y

las acciones
16
17
4. TIPOS DE AGENTES
● El objetivo de A. I es el diseño del
‘programa’ del agente (medidas ->
acciones)
Agente =
arquitectura +
programa ● El método mas general es la
construcción de la tabla que
especifica la ‘función’ del agente
● El desafío de la I.A es el diseño de algoritmos que produzca el

mismo comportamiento que el de la tabla
18
4.1. Agentes de simple reflejo
● Es el tipo de agente mas

simple
● Las acciones dependen

solamente de las medidas
‘actuales’ de los sensores
● Se implementa usando
reglas de condiciones
19
Sensores: Locación, Presencia de basura
function action = REFLEX_VACUUM_AGENT(location, status)
if status == 'dirty'
action = 'suck';
elseif location == 'A'
action = 'right';
elseif location == 'B'
action = 'left';
end
● Los humanos tienen estos tipos de comportamiento.

● Solo producen una inteligencia ‘limitada’
● Se requiere que el entorno sea ‘completamente observable’
20
4.2. Agentes de reflejo basado en modelos
● En entornos ‘parcialmente
observable’, el agente debe
tener un estado ‘interno’
del entorno
 Se debe tener un modelo de

como cambia el mundo
independientemente del agente
 Se debe tener un modelo de

como las acciones del agente
cambian el mundo
21
Ejem. Sensorless vacuum-cleaner
● El robot tiene
una creencia
‘belief’ sobre el
entorno
● Este ‘belief’ se
actualiza
conforme las
acciones que toma
robot
22
4.3. Agentes basados en metas
● La acción correcta no solo

depende del estado, sino de
la ‘meta’ donde el agente
quiere llegar
● A veces la acción a tomar es

directa(cuando la meta se
alcanza tomando una acción)
● La mayor parte de las veces el agente

tiene que considerar diversas acciones
con el fin de llegar a la meta
23
4.4. Agentes basados en utilidades
● Muchas veces las metas no

son suficientes para producir
acciones de calidad
● La función de ‘utilidad’ es
una internalización de la
medida de performance
● Se escogen las acciones que maximicen

la función de utilidad
24
4.5. Agentes que aprenden
25

Agentes Inteligentes

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Agentes Inteligentes

Cargado por

Copyright:

Formatos disponibles

INTELIGENCIA

Ing. Iván A. Calle Flores

● Estructuras básicas de diversos agentes ‘racionales’

● El termino ‘percept’ se refiere a aquello

● ‘percept sequence’ es la completa historia

Las acciones del agente pueden depender de toda la data disponible

● Esta función cuando se implementa en una computadora recibe el

● ¿Es buena idea tabular para cada posible combinación de medidas la

● El agente tiene acciones de

● Una posible tabulación de

● Las acciones correctas son aquellas

● Matemáticamente, esta noción se modela

● Existen diversos posibles criterios

 El conocimiento del entorno por parte del agente

 Las acciones disponibles del agente

Definición de un agente racional

Para cada posible secuencia de

 Performance: 1 punto por cada posición limpia en cada instante de tiempo

 Conocimiento: Hay 2 casilleros, los casilleros limpios permanecen limpios, y

 Acciones: Izquierda, Derecha, Succionar

 Mediciones: El agente percibe correctamente su ubicación, y la presencia de

● Si la medida de performance incluye un termino de penalidad por

● El tipo de entorno, define el tipo ‘diseño’ del agente a usar

Eje. Diseño de un taxi autónomo

 Performance: Seguro, rápido, confortable,

 Entorno: Carreteras, otros carros,

 Actuadores: Timón, acelerador,

 Sensores: Cámaras, encoders, GPS,

● Completamente observable vs. Parcialmente observable

Si los sensores del agente pueden medir el estado completo del

Este entorno es conveniente porque el agente no necesita mantener un

Si los sensores son ruidosos o imprecisos, o solo pueden medir una

Es el entorno del robot aspirador

Si el agente no tiene sensores, el entorno no es observable.

Los entornos ‘competitivos’ son aquellos en donde los agentes tratan de

Los entornos ‘cooperativos’ son aquellos

Si el siguiente estado del entorno es completamente

Si la presencia de basura es aleatoria, el

Si el proceso de aspirado es impreciso, el

Un entorno es impreciso ‘uncertain’ si no es completamente observable o

Si la acción actual afecta las

Ajedrez, damas, etc.

● Estático vs. dinámico

La distinción de discreto/continuo se aplica al estado, las mediciones y

● El desafío de la I.A es el diseño de algoritmos que produzca el

● Es el tipo de agente mas

● Las acciones dependen

function action = REFLEX_VACUUM_AGENT(location, status)

● Los humanos tienen estos tipos de comportamiento.

 Se debe tener un modelo de

 Se debe tener un modelo de

● La acción correcta no solo

● A veces la acción a tomar es

● La mayor parte de las veces el agente

● Muchas veces las metas no

● Se escogen las acciones que maximicen

También podría gustarte