Está en la página 1de 35

CESARIO RAMIREZ TORRES

RODRIGO CASTELAN ZALETA


SEBASTIAN DE LA CRUZ BAUTISTA

Determinar la forma de medir el xito.

Descripcin del entorno.

Descripcin de sensores.

Descripcin de actuadores del agente.

Son criterios que determinan el xito del


comportamiento del agente.
Genera una secuencia de acciones de acuerdo con las
percepciones que recibe, sta secuencia de acciones
hace que su hbitat pase por una secuencia de
estados.
Si la secuencia es deseada el agente habr actuado
correctamente.

La medida de rendimiento que define el


criterio de xito.

El conocimiento del medio en el que habita.

Las acciones que el agente puede llevar a cabo.

La secuencia de percepciones del agente hasta


ese momento.

Debe emprender aquella accin que


supuestamente maximice su medida de
rendimiento, basndose en las evidencias
aportadas por la secuencia de percepciones y
en el conocimiento que el agente mantiene
almacenado.

Un agente omnisciente conoce el resultado de su


accin y acta de acuerdo con l, sin embargo la
omnisciencia realmente no es posible.
La racionalidad no es lo mismo que la perfeccin.
La racionalidad maximiza el rendimiento
esperado y la perfeccin maximiza el resultado
real.

Son los problemas para los cuales los agentes


racionales son las soluciones:
1.Se

especifica el entorno de trabajo, ilustrando


el trabajo con varios ejemplos.
2.Se

evidencia que el entorno de trabajo ofrece


diferentes posibilidades que influyen en el diseo
del programa del agente.

El primer paso siempre debe ser especificar


un entorno de trabajo de la manera mas
completa posible.
Tipo de agente

Taxista

Medidas
de
rendimiento
Seguro, rpido,
legal, viaje
confortable,
maximizacin
del beneficio.

Entorno

Carreteras,
trafico,
peatones,
clientes.

Actuadores

Direccin,
acelerador,
freno, seal,
bocina,
visualizador.

Sensores
Cmaras, sonar,
velocmetro,
GPS,
tacmetro,
visualizador de
aceleracin,
sensores del
motor, teclado.

No importa entre un medio real y artificial


sino la complejidad de la relacin entre:

Integran medios y funciones de gran


complejidad, que en gran medida estn
orientados a operar en tiempo real, que
deben elegir entre un gran espectro de
posibilidades de operacin la que mas se
ajuste a la solucin del problema.

Los entornos de trabajo en los cuales se


implementa la IA es muy amplio, en donde se
pueden identificar cierto numero de
dimensiones, donde se categorizan los
entornos, que hasta cierto punto determinan
el diseo mas adecuado para el agente y las
principales tcnicas de implementacin.

Totalmente observables: cuando los sensores


del agente detectan todos los aspectos
relevantes del entorno en la toma de decisiones,
dependientes de las medidas de rendimiento.
Parcialmente
observables:
cuando
hay
existencia de sensores poco exactos o porque
no reciben informacin por parte del sistema.

Determinista: es cuando el siguiente estado del


medio esta condicionado por el estado actual y
la accin ejecutada por el agente.
Estocstico: si el medio es parcialmente
observable; cuando se hace difcil mantener
constancia de todos los aspectos observados.
Estratgico: si el medio es determinista
excepto para las acciones de otros agentes.

Episdico: consiste en la percepcin del


agente y la realizacin de una nica accin
posterior que no depende de un episodio
previo, ni afecta a un episodio futuro.
Secuencial: la decisin presente afecta las
decisiones futuras. Son mas complejos que
los episdicos porque hay que pensar con
ciertos limites de tiempo

Esttico: cuando los medios son constantes no


cambiantes son mas fciles de tratar porque el
agente no necesita contemplar en todo momento
el mundo mientras decide, ni el paso del tiempo.
Dinmico: el entorno es cambiante cuando el
agente esta deliberando, en donde se esta
indagando constantemente sobre el Qu
hacer?
Semi-dinmico: cuando el entorno no cambia,
mas si el rendimiento.

Discreto: cuando existe un numero finito de estados,


acciones y percepciones.
Continuo: cuando no existe un numero finito de
estados, acciones y percepciones.
Individual: cuando los estados, acciones y
percepciones de un entorno estn dados por un solo
agente.
Multi-agente: cuando los estados, acciones y
percepciones de un entorno estn dados por dos o
mas agentes. Pueden ser competitivos y cooperativos.

Cuando todas las reglas o normativas de un


entorno no estn explicitas, se reduce la
posibilidad de determinar que tan observable
es.
Las dimensiones del entorno de trabajo, se
definen netamente

Se hace una simulacin de la realidad para


generar o proponer agentes que solventen los
problemas
presentados
en
diversos
escenarios y el generador de entornos
selecciona hbitats particulares.

El trabajo de la IA es disear el programa del


agente que implemente la funcin del agente
que proyecta las percepciones en las acciones.
Se asume que este programa se ejecutara en
algn tipo de computador lo cual se conoce
como arquitectura.
Agente = arquitectura + programa

Los programas de los agentes se describen


con la ayuda de un sencillo lenguaje de
pseudocdigo.
Funcin AGENTE-DIRIGIDO-MEDIANTE-TABLA(percepcin) devuelve una accin
variables estticas: percepciones, una secuencia, vaca inicialmente
tabla, una tabla de acciones, indexada por las secuencias de
percepciones, totalmente definida inicialmente.
aadir la percepcin al final de las percepciones
accin CONSULTA( percepciones, tabla)
devolver accin
El programa AGENTE-DIRIGIDO-MEDIANTE-TABLA se invoca con cada nueva
percepcin y devuelve una accin en cada momento. Almacena la secuencia de
percepciones utilizando su propia estructura de datos privada.

Para construir un agente racional de esta forma,


los diseadores debe realizar una tabla que
contenga las acciones apropiadas para cada
secuencia posible.
Por esto se puede observa que esta propuesta
esta condenada al fracaso porque:
a)

No hay agente que tenga espacio suficiente para


almacenar la tabla.

b)

El diseador no tendr tiempo de crear la tabla.

c)

Ningn agente podr aprender todas las entradas de


la tabla a partir de su experiencia.

Es el tipo de agente mas sencillo. Basa sus


acciones en las percepciones actuales,
ignorando el resto de las percepciones
histricas.
Tiene la admirable propiedad de ser simples,
pero posee una inteligencia muy limitada.

Reglas de condicin-accin

Cmo es el mundo
ahora
Actuadores

Qu accin debo
tomar ahora

Actuadores

Medio ambiente

Agente

Sensores

Debe mantener algn tipo de estado interno que


dependa de la historia percibida.
La actualizacin del estado interno requiere
codificar 2 tipos de conocimiento:
1.

Se necesita alguna informacin acerca de cmo


evoluciona el mundo.

2.

Se necesita informacin sobre como afecta al mundo


las acciones del agente.

El conocimiento acerca de cmo funciona el


mundo se denomina modelo del mundo.
Un agente que utilice estos modelos es un
agente basado en modelos.
Este modelo nos muestra como la percepcin
actual se combina con el estado interno
antiguo para generar la descripcin
actualizada del estado actual.

Estado

Qu efectos causan mis acciones

Reglas de condicin-accin

Agente

Cmo es el mundo
ahora
Actuadores

Qu accin debo
tomar ahora

Actuadores

Medio ambiente

Cmo evoluciona el mundo

Sensores

El agente necesita algn tipo de informacin sobre


su meta que describa las situaciones que son
deseables.
La seleccin de acciones basadas en objetivos es
directa, cuando alcanzar los objetivos es el
resultado inmediato de una accin individual.
En otras ocasiones, puede ser mas complicado,
cuando el agente tiene que considerar secuencias
complejas.

Estado

Qu efectos causan mis acciones

Objetivos

Agente

Cmo es el mundo
ahora

Qu
pasar si
Actuadores
realizo la accin A

Qu accin debo
llevar a cabo
ahora

Actuadores

Medio ambiente

Cmo evoluciona el mundo

Sensores

Una funcin de utilidad proyecta un estado(o


secuencia de estados) en un numero real, que
representa un nivel de felicidad.
Permite tomar decisiones racionales en dos tipos
de casos en los que las metas son inadecuadas:
1.

Cuando haya objetivos conflictivos.

2.

Cuando haya varios objetivos por los que se pueda


guiar el agente.

Estado

Qu efectos causan mis acciones

Utilidad

Cmo es el mundo
ahora
Qu
pasar si
Actuadores
realizo la accin A
Estar contento
con este estado
Qu accin debo
llevar a cabo
ahora

Agente

Actuadores

Medio ambiente

Cmo evoluciona el mundo

Sensores

Se propone construir maquinas que aprendan


y despus ensearlas.
El aprendizaje permite que el agente opere
en medios inicialmente desconocidos y que
sea mas competente que si slo utilizara un
conocimiento inicial.

Se puede dividir en cuatro componentes


conceptuales:
1.

Elemento de aprendizaje, esta responsabilizado de hacer


mejoras.

2.

Elemento de actuacin, esta responsabilizado de la


seleccin de acciones externas.

3.

Crticas, realimenta el elemento de aprendizaje y


determina como se debe modificar el elemento de
actuacin para proporcionar mejores resultados en el
futuro.

4.

Generador de problemas, responsable de sugerir acciones


que lo guiaran hacia experiencias nuevas e informativas.

Nivel de actuacin

Sensores

Crtica

Cambios

Actuadores
Elemento de
actuacin

Elemento de
aprendizaje
Conocimiento

Objetivos a
aprender
Generador de
problemas

Agente

Actuadores

Medio ambiente

Retroalimentacin

En conclusin podemos decir que:

Los agentes reactivos simples responden directamente a


las percepciones.
Los agentes reactivos basados en modelos mantienen un
estado interno que les permite seguir el rastro de
aspectos del mundo que no son evidentes.
Los agentes basados en objetivos actan con la intencin
de alcanzar una meta.
Los agentes basados en utilidad intenta maximizar su
felicidad deseada.
Todos los agentes pueden mejorar su eficacia con la
ayuda de mecanismos de aprendizaje.