Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I.A es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura fsica
producen acciones o resultados que maximizan una medida de rendimiento determinada, basndose en la secuencia
de entradas percibidas y en el conocimiento almacenado en tal arquitectura.
Existen distintos tipos de conocimiento y medios de representacin del conocimiento, el cual puede ser cargado en
el agente por su diseador o puede ser aprendido por el mismo agente utilizando tcnicas de aprendizaje.
Tambin se distinguen varios tipos de procesos vlidos para obtener resultados racionales, que determinan el tipo
de agente inteligente. De ms simples a ms complejos, los cinco principales tipos de procesos son:
Ejecucin de una respuesta predeterminada por cada entrada (anlogas a actos reflejos en seres vivos).
Bsqueda del estado requerido en el conjunto de los estados producidos por las acciones posibles.
Algoritmos genticos (anlogo al proceso de evolucin de las cadenas de ADN).
Redes neuronales artificiales (anlogo al funcionamiento fsico del cerebro de animales y humanos).
Razonamiento mediante una lgica formal (anlogo al pensamiento abstracto humano).
Tambin existen distintos tipos de percepciones y acciones, pueden ser obtenidas y producidas, respectivamente
por sensores fsicos y sensores mecnicos en mquinas, pulsos elctricos u pticos en computadoras, tanto como
por entradas y salidas de bits de un software y su entorno software.
Varios ejemplos se encuentran en el rea de control de sistemas, planificacin automtica, la habilidad de
responder a diagnsticos y a consultas de los consumidores, reconocimiento de escritura, reconocimiento del
habla y reconocimiento de patrones. Los sistemas de IA actualmente son parte de la rutina en campos
como economa, medicina, ingeniera y la milicia, y se ha usado en gran variedad de aplicaciones de software, juegos
de estrategia como ajedrez de computador y otros videojuegos.
Categoras de la Inteligencia Artificial
Sistemas que piensan como humanos.- Estos sistemas tratan de emular el pensamiento humano; por
ejemplo las redes neuronales artificiales. La automatizacin de actividades que vinculamos con procesos
de pensamiento humano, actividades como la Toma de decisiones, resolucin de
problemas, aprendizaje.
Sistemas que actan como humanos.- Estos sistemas tratan de actuar como humanos; es decir, imitan el
comportamiento humano; por ejemplo la robtica. El estudio de cmo lograr que los computadores
realicen tareas que, por el momento, los humanos hacen mejor.
Sistemas que piensan racionalmente.- Es decir, con lgica (idealmente), tratan de imitar o emular el
pensamiento lgico racional del ser humano; por ejemplo los sistemas expertos. El estudio de
los clculos que hacen posible percibir, razonar y actuar.
Sistemas que actan racionalmente (idealmente). Tratan de emular en forma racional el
comportamiento humano; por ejemplo los agentes inteligentes .Est relacionado con conductas
inteligentes en artefactos.
John Searle Alan Turing
John searle distingue la I.A entre dbil y fuerte:
I.A dbil: simular estados mentales y no tiene conciencia.
I.A fuerte: computadora con conciencia. Este concepto est asociado con Alan turing.
Leyes de la robtica
El termino robot fue introducido por el checo Karel Capek en 1921, y viene de la combinacin de las palabras checas
robota que significa trabajo obligatorio y robotnik que significa siervo.
La palabra robtica fue utilizada por primera vez por el cientfico y escritor de ciencia ficcin Isacc Asimov en 1942.
El propuso las llamadas leyes de la robtica:
Estas leyes surgen como medida de proteccin para los seres humanos. Segn Isacc Asimov, la concepcin de las
leyes de la robtica busca contrarrestar un supuesto temor que el ser humano desarrollara frente a unas mquinas
que hipotticamente pudieran rebelarse y levantarse contra sus creadores.
Las tres leyes de la robtica representan el cdigo moral del robot.
2) Sistemas Expertos (tambin conocidos como Sistemas basados en el conocimiento Facilitar la toma de decisin)
Conocimiento: una comprensin terica o prctica de un dominio de inters. Tambin la suma de lo que conocemos
Experto: individuo que tiene conocimiento especializado sobre el problema a resolver.
Definicin de S.E: Es un SW que imita el comportamiento de un experto humano en la solucion de un problema.
Puede almacenar conocimientos de expertos para un campo determinado y solucionar un problema mediante
deduccin lgica de conclusiones.
Caractersticas
Dado un conjunto de Hechos, elegir una regla cuyo Antecedente sea verdadero; disparar la regla; el Consecuente de
la regla es un nuevo hecho; Continuar (recursivamente) con un nuevo conjunto de datos; Parar cuando no se pueda
disparar ninguna regla.
-Encadenamiento hacia atrs (Backward): o inferencia descendente. Orientado por objetivos. Partiendo de un
objetivo, usar reglas para buscar soporte del objetivo.
Dado un conjunto de Hechos, elegir una regla cuyo Antecedente sea verdadero; disparar la regla; el Consecuente de
la regla es un nuevo hecho; Continuar (recursivamente) con un nuevo conjunto de datos; Parar cuando no se pueda
disparar ninguna regla.
-Encadenamiento mixto.
Consejos de cuando conviene utilizar los encadenamientos
Si un experto necesita tener informacin primero y luego trata de inferir de ella lo que se pueda, se
utiliza encadenamiento hacia adelante. (trabaja con varios hechos, de lo contrario, resulta ineficiente)
Si un experto comienza con una solucion hipottica y luego trata de encontrar hechos que la sustenten,
la eleccin es encadenamiento hacia atrs.
Cuando 2 reglas se disparan al mismo tiempo, existen 2 mtodos de solucion: disparar la regla con la
mayor prioridad o disparar la regla mas especifica (estrategia de mxima equiparacin)
d) Modulo de justificacin: Una caracterstica de los sistemas expertos es su habilidad para explicar su
razonamiento. Usando el mdulo del subsistema de explicacin, un sistema experto puede proporcionar una
explicacin al usuario de por qu est haciendo una pregunta y cmo ha llegado a una conclusin. Este mdulo
proporciona beneficios tanto al diseador del sistema como al usuario. El diseador puede usarlo para detectar
errores y el usuario se beneficia de la transparencia del sistema.
e) Interfaz de usuario: La interaccin entre un sistema experto y un usuario se realiza en lenguaje natural.
3) Sistemas difusos
Lgica Difusa
Es una metodologa que proporciona una manera simple de obtener una conclusin a partir de informacin de
entrada vaga, imprecisa, distorsionada o incompleta.
La lgica fuzzy est basada en la idea de que todas las cosas admiten grados (temperatura, velocidad, altura,
belleza). Todos los valores de sus objetos aparecen sobre una escala graduada: Carlos es un hombre alto, Luisa es
una linda chica.
Surgi como una herramienta importante para el control de sistemas y procesos industriales complejos, as como
tambin para la electrnica de entretenimiento y hogar, sistemas de diagnostico y otros sistemas expertos.
Logia difusa vs. Lgica tradicional o convencional
En la lgica clsica (binaria o booleana) se tiene solo dos estados posibles: verdadero o falso (1 o 0). En la lgica
difusa se asigna valores intermedios dentro de una escala a fin de cuantificar una incertidumbre (conjuntos).
La lgica difusa en comparacin con la lgica convencional permite trabajar con informacin que no es exacta para
poder definir evaluaciones convencionales, contrario con la lgica tradicional que permite trabajar con informacin
definida y precisa.
En qu situaciones es til aplicar la lgica difusa?
Cuando se necesite usar el conocimiento de un experto que utiliza conceptos ambiguos o imprecisos.
Cuando ciertas partes de un sistema a controlar son desconocidas y no pueden medirse de forma
confiable.
U es el universo de discurso.
Cuando mas este la pertenencia del conjunto A al valor de 1, mayor ser la pertenencia de la variable x al conjunto
A.
Variable lingstica: es una variable fuzzy. Por ejemplo, la sentencia Pablo es alto implica que la variable
lingstica Pablo toma el valor alto.
Operaciones en conjuntos difusos:
Complemento: el complemento de un conjunto es el opuesto a dicho conjunto. uA(x) = 1 - uA(x)
Contencin: un conjunto puede contener a otros conjuntos. El conjunto contenido se denomina subconjunto.
Interseccin: La interseccin fuzzy est dada por el menor grado de pertenencia en ambos conjuntos para cada
elemento.
Unin: en la unin de dos conjuntos fuzzy estamos interesados en el mayor valor de pertenencia a ambos
conjuntos.
Not A
Funcin Triangular
Definida mediante el lmite inferior a, el superior b y el valor modal m, tal que a<m<b. La funcin no tiene porqu
ser simtrica.
B
A
A
A
Complement
La funcin caracterstica del conjunto de los elementos que verifican un predicado clsico est perfectamente
determinada. No ocurre lo mismo cuando se intenta obtener la funcin de pertenencia de un conjunto formado por
los elementos que verifican un predicado borroso. Dicha funcin depender del contexto (o universo) en el que se
trabaje, del experto, del usuario, de la aplicacin a construir, etc.
A la hora de determinar una funcin de pertenencia, normalmente se eligen funciones sencillas, para que los
clculos no sean complicados. En particular, en aplicaciones en distintos entornos, son muy utilizadas las
triangulares y las trapezoidales:
Intersection
Containment
A
A
Funcin Trapezoidal
Definida por sus lmites inferior a, superior d, y los lmites de soporte inferior b y superior c, tal que a<b<c<d.
En este caso, si los valores de b y c son iguales, se obtiene una funcin triangular.
Union
Funcin Gamma
Funcin Sigmoidal
Funcin Gaussiana
En los sistemas difusos tipo Sugeno, los valores que arrojan los consecuentes de las diferentes reglas que se han
activado en un momento determinado ya son valores numricos por lo que no se necesita una etapa de
Defusificacin.
Definicin de reglas usando la matriz
Variables de entrada: Temperatura y humedad
Variable de salida: velocidad de un ventilador
La temperatura tendr 3 Term set (alta, media, baja)
La humedad tendr 2 Term set (alta, baja)
La velocidad del ventilador 3 Term set (rpido, medio, lento)
Temperatura\Humedad alta
baja
Fusificacin
La entrada de un sistema de lgica difusa tipo Mamdani normalmente es un valor numrico proveniente, por
ejemplo, de un sensor; para que este valor pueda ser procesado por el sistema difuso se hace necesario convertirlo
a un "lenguaje" que el mecanismos de infererencia pueda procesar. Esta es la funcin del fuzzificador, que toma los
valores numricos provenientes del exterior y los convierte en valores "difusos" que pueden ser procesados por el
mecanismo de inferencia. Estos valores difusos son los niveles de pertenencia de los valores de entrada a los
diferentes conjuntos difusos en los cuales se ha dividido el universo de discurso de las diferentes variables de
entrada al sistema.
Base de conocimiento o base de reglas
La base de reglas son la manera que tiene el sistema difuso de guardar el conocimiento lingstico que le permiten
resolver el problema para el cual ha sido diseado. Estas reglas son del tipo IF-THEN.
Una regla de la base de reglas o base de conocimiento tiene dos partes, el antecedente y el consecuente.
Inferencia
Teniendo los diferentes niveles de pertenencia arrojados por el fusificador, los mismos deben ser procesados para
generar una salida difusa. La tarea del sistema de inferencia es tomar los niveles de pertenencia y apoyado en la
base de reglas o base de conocimiento genera la salida del sistema difuso.
Defusificacin
La salida que genera el mecanismo de inferencia es una salida difusa, lo cual significa que no puede ser interpretada
por un elemento externo (por ejemplo un controlador) que solo manipule informacin numrica. Para lograr que la
salida del sistema difuso pueda ser interpretada por elementos que solo procesen informacin numrica, hay que
convertir la salida difusa del mecanismos de inferencia; este proceso lo realiza el defusificador.
b) Los sistemas difusos tipo Sugeno incluyen:
Baja
Lento
Lento
Media
Rpido
Medio
alta
Rpido
Rpido
Valores de la funcin de
pertenencia de entrada temp.
Valores de la funcin de
pertenencia de entrada
humed.
Valores de la funcin
de pertenencia de
salida
VelocidadVentilador.
Para calcular la cantidad de reglas a utilizar se debe multiplicar la cantidad de term set que tenga cada entrada. En
este caso 3 de temp. X 2 de humed. = 6 reglas.
Los valores de la funcin de pertenencia de salida no indican la cantidad de reglas, estos pueden repetirse. (mirar
color rosa)
4) Algoritmos Genticos
Algoritmos Genticos (permite optimizar la solucin, trabaja con tcnicas heursticas)
Algoritmos genticos: intentan emular la capacidad que tiene la naturaleza de evolucionar hacia individuos cada vez
ms aptos. Usan una analoga directa con el comportamiento natural. Trabajan con una poblacin de individuos,
cada uno representa una solucin factible a un problema dado. Cuanto mayor sea la adaptacin del individuo al
problema, mayor ser la posibilidad de que el mismo sea seleccionado para reproducirse, cruzando su material
gentico con otro individuo seleccionado de igual forma. Esta cruza producir nuevos individuos (descendientes de
los anteriores) los cuales compartirn algunas de las caractersticas de sus padres.
Seleccin Natural o Supervivencia del ms Apto: es un mecanismo de la naturaleza sobre todo los individuos de una
especie, por el cual el ms apto tiene ms posibilidades de sobrevivir y de propagar las cualidades genticas a sus
descendientes.
Seleccin por Rango: a cada individuo de la poblacin se le asigna un rango numrico basado en su
aptitud, y la seleccin se basa en este ranking, en lugar de las diferencias absolutas en aptitud.
De esta manera se produce una nueva poblacin de posibles soluciones, la cual reemplazar a la anterior y verifica
una interesante prioridad: contiene una mayor proporcin de buenas caractersticas en comparacin con la
poblacin anterior.
Cromosoma: es la representacin codificada de una posible solucin. Generalmente se usa la representacin como
cadenas de bits. Tambin se pueden usar punto flotante, cdigos alfabticos.
Gen: a cada posicin de la cadena se denomina gen y al valor dentro de esta posicin se le llama alelo.
Evaluacin de Adaptabilidad (fitness): a cada solucin (cromosoma) se le asigna un valor de adaptabilidad
dependiendo de qu tan bueno es el cromosoma solucionando el problema.
Operadores Genticos: Para efectuar los cambios pertinentes en la poblacin, se emplean los Operadores
Genticos:
Funcin Objetivo: Llamamos as a la funcin que evala la adaptacin al medio de los individuos de la poblacin, y es
la que nos delimita el criterio a la hora de reproducir y seleccionar unos individuos de la poblacin en lugar de otros.
Seleccin Natural: Es el proceso que se lleva a cabo al final de cada generacin, y consiste en escoger un conjunto de
individuos de tamao N (igual al nmero de individuos de la poblacin inicial), que sern los individuos que
sobrevivan y pasen a la siguiente generacin.
Mecanismos para la Seleccin de Padres:
Seleccin de la Ruleta: se debe pensar en una ruleta, cada organismo tendr un segmento de la ruleta, su
tamao depender de su adaptacin. La ruleta gira y al detenerse sealar un organismo.
La primera es la probabilidad de aplicar el operador de cruce sobre parejas de cadenas de "ADN" obtenidas en la
reproduccin; la segunda es la probabilidad de aplicar el operador de mutacin sobre los caracteres de la cadena.
Seudocdigo de un Algoritmo Gentico
Procedimiento Algoritmo Gentico
Inicializar poblacin P(0)
Evaluar poblacin inicial
Mientras no se cumpla la condicin de parada, para cada generacin t, hacer:
Seleccionar la poblacin P(t) desde P(t-1)
Recombinar P(t)
Evaluar P(t)
Fin Mientras
Fin Procedimiento
Criterios de Terminacin del Algoritmo: es el encargado de definir el momento en el cual debe detenerse el ciclo de
evolucin y adoptar el cromosoma ms apto como la solucin encontrada.
5) Redes Neuronales
Las redes neuronales son una forma de emular ciertas caractersticas propias de los humanos, como la capacidad de
memorizar y de asociar hechos.
Es un modelo artificial y simplificado del cerebro humano, sistema que es capaz de adquirir conocimiento a travs
de la experiencia. Una red neuronal es un nuevo sistema para el tratamiento de la informacin, cuya unidad bsica
de procesamiento est inspirada en la clula fundamental del sistema nervioso humano: la neurona.
Mas definiciones de red neuronal:
1) Una nueva forma de computacin, inspirada en modelos biolgicos.
2) Un modelo matemtico compuesto por un gran nmero de elementos procesales organizados en niveles.
3) Un sistema de computacin compuesto por un gran nmero de elementos simples, elementos de procesos muy
interconectados, los cuales procesan informacin por medio de su estado dinmico como respuesta a entradas
externas.
4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples
(usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos del mundo
real del mismo modo que lo hace el sistema nervioso biolgico.
Aprendizaje significa que aquellos problemas que inicialmente no pueden resolverse, pueden ser resueltos despus
de obtener ms informacin acerca del problema.
Por lo tanto, las Redes Neuronales:
Consisten de unidades de procesamiento que intercambian datos o informacin.
Se utilizan para reconocer patrones, incluyendo imgenes, manuscritos y secuencias de tiempo,
tendencias financieras.
Tienen capacidad de aprender y mejorar su funcionamiento.
Las RNA presentan un gran nmero de caractersticas semejantes a las del cerebro. Por ejemplo, son capaces de
aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer caractersticas esenciales
a partir de entradas que representan informacin irrelevante, etc. Esto hace que ofrezcan numerosas ventajas:
Aprendizaje Adaptativo: capacidad de aprender a realizar tareas basadas en un entrenamiento o en una
experiencia inicial.
Auto-organizacin: una red neuronal puede crear su propia organizacin o representacin de la
informacin que recibe mediante una etapa de aprendizaje.
Tolerancia a fallos: la destruccin parcial de una red conduce a una degradacin de su estructura; sin
embargo, algunas capacidades de la red se pueden retener, incluso sufriendo un gran dao.
Operacin en tiempo real: los cmputos neuronales pueden ser realizados en paralelo; para esto se
disean y fabrican mquinas con hardware especial para obtener esta capacidad.
Fcil insercin dentro de la tecnologa existente: se pueden obtener chips especializados para redes
neuronales que mejoran su capacidad en ciertas tareas. Ello facilitar la integracin modular en los
sistemas existentes.
El conocimiento es adquirido por la red a travs de un proceso que se denomina aprendizaje.
El conocimiento se almacena mediante la modificacin de la fuerza o peso sinptico de las distintas uniones entre
neuronas.(la informacin se guarda en los pesos)
Estructura histolgica
Las dendritas (entradas), son la va de entrada de las seales que se combinan en el cuerpo de la neurona. De
alguna manera la neurona elabora una seal de salida a partir de ellas.
El axn (salidas), es el camino de salida de la seal generada por la neurona. Una neurona enva su salida a otras
por su axn.
Las sinapsis (pesos), conexin entre una neurona y otra (Interaccin). En las terminaciones de las sinapsis se
encuentran unas vescula que contienen unas sustancias qumicas llamadas neurotransmisores, que ayudan a la
propagacin de las seales electroqumicas de una neurona a otra.
Capa de entrada: las neuronas reciben estmulos externos relacionados con el aparato sensorial, que
tomarn la informacin de entrada.
Capa oculta: Dicha informacin se transmite a ciertos elementos internos que se ocupan de su
procesamiento. Es en las sinapsis y neuronas correspondientes a esta capa donde se genera cualquier
tipo de representacin interna de informacin. Como no tienen relacin directa con la informacin de
entrada ni con la salida, estos elementos se denominan unidades ocultas.
Capa de salida: Una vez finalizado el perodo de procesado, la informacin llega a las unidades de salida,
cuya misin es dar la respuesta al sistema.
Lo que bsicamente ocurre en una neurona biolgica es lo siguiente: la neurona es estimulada o excitada a travs
de sus entradas (inputs) y cuando se alcanza un cierto umbral, la neurona se dispara o activa, pasando una seal
hacia el axn. La neurona recoge las seales por su sinapsis sumando todas las influencias excitadoras e inhibidoras.
Si las influencias excitadoras positivas dominan, entonces la neurona da una seal positiva y manda este mensaje a
otras neuronas por sus sinapsis de salida.
Capa: conjunto de neuronas cuyas entradas provienen de la misma fuente, y cuyas salidas se dirigen a un mismo
destino.
Los datos ingresan por medio de la capa de entrada, pasan a travs de la capa oculta y salen por la capa de
salida. Cabe mencionar que la capa oculta puede estar constituida por varias capas.
En una red neuronal cada neurona recibe una serie de entradas a travs de interconexiones y emite una salida. Esta
salida viene dada por tres funciones:
1. Una funcin de propagacin (tambin funcin de red) tambin conocida como funcin de excitacin que
por lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su interconexin o
sinapsis. Si el peso es positivo, la conexin se denomina excitatoria; si es negativo, se denomina
inhibitoria.
2. Una funcin de activacin, que modifica a la anterior y es el valor que la neurona recibe para activarse.
Puede no existir, siendo en este caso la salida la misma funcin de propagacin.
3. Una funcin de transferencia, que se aplica al valor devuelto por la funcin de activacin. Se utiliza para
acotar la salida de la neurona y generalmente viene dada por la interpretacin que queramos darle a
dichas salidas. Algunas de las ms utilizadas son la funcin sigmoidea (para obtener valores en el
intervalo [0,1]) y la tangente hiperblica (para obtener valores en el intervalo [-1,1]). Existen cuatro
funciones de transferencia tpicas que determinan distintos tipos de neuronas:
o
Funcin escaln
o
Funcin lineal y mixta
o
Sigmoidal
o
Funcin gaussiana
Tipos de capas
Los tipos de conexiones entre neuronas que consideraremos pueden clasificarse en:
o
o
o
o
Conexiones feedforward (propagacin hacia adelante): conectan neuronas de una capa con
neuronas de capas ms alejadas de la capa de entrada.
Conexiones feedback(propagacin hacia atras): inversas a las definidas previamente.
Conexiones laterales: conectan neuronas de una misma capa.
Conexiones autoenlazadas: conectan una neurona consigo mismo.
RN monocapa y multicapa
En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.
Las redes con dicho aprendizaje no requieren de influencia externa para ajustar los pesos de las conexiones entre
sus neuronas. La red no recibe ninguna informacin por parte del entorno que le indique si la salida generada en
respuesta de una entrada es o no correcta. Suele decirse que estas redes son capaces de auto organizarse.
Suelen considerarse dos algoritmos de aprendizaje no supervisado:
a) Aprendizaje hebbiano
b) Aprendizaje competitivo y cooperativo: las neuronas compiten (y cooperan) unas con otras con el fin de
llevar a cabo una tarea dada.
Redes Neuronales de Kohonen
Modelo de red neuronal con capacidad para formar mapas de caractersticas de manera similar a como ocurre en el
cerebro.
a)
b)
Monocapa: En las redes monocapa se establecen conexiones laterales entre las neuronas que
pertenecen a la nica capa de la red. Adems pueden existir conexiones auto recurrente.
Las redes monocapa se utilizan tpicamente en tareas relacionadas con lo que se conoce como auto
asociacin, por ejemplo para regenerar informaciones de entrada que se presentan distorsionadas o
incompletas.
Multicapas: Son aquellas que disponen las neuronas agrupadas en varias capas. Una las forma para
distinguir la capa a la que pertenece una neurona, consistira en fijarse en el origen de las seales que
recibe a la entrada y el destino de la seal de salida.
Este modelo tiene dos variantes, denominadas LVQ (Learning Vector Quantization) y TPM (Topology-Preserving
Map) o SOM (Self-Organizating Map). Ambas se basan en el principio de formacin de mapas topolgicos para
establecer caractersticas comunes entre las informaciones (vectores) de entrada a la red, aunque difieren en las
dimensiones de stos, siendo de una sola dimensin en el caso de LVQ, y bidimensional, e incluso tridimensional,
en la red TPM.
Caractersticas
Pertenece a la categora de las redes competitivas o mapas de auto-organizacin (SOM), es decir, con aprendizaje
no supervisado de tipo competitivo, funciones de activacin lineales y flujo de informacin unidireccional (son redes
en cascada).
No existe ningn maestro externo que indique si la red neuronal est operando correcta o incorrectamente.
Arquitectura
Poseen una arquitectura de dos capas (una de entrada, una de salida) y una sola capa de conexiones.
En la versin LVQ no existen conexiones hacia atrs. Existen N neuronas de entrada y M neuronas de salida.
Cada una de las N neuronas de entradas se conecta hacia las M neuronas de salidas a travs de conexiones hacia
adelante (feedfoward).
Entre las neuronas de la capa de salida, puede decirse que existen conexiones laterales de inhibicin (peso negativo)
implcitas, pues aunque no estn conectadas, cada una de las neuronas va a tener cierta influencia sobre sus
vecinas. El valor que se asigne a los pesos de las conexiones hacia adelante entre las capas de entrada y salida (Wji)
durante el proceso de aprendizaje de la red va a depender precisamente de esta interaccin lateral.
La influencia que una neurona ejerce sobre las dems es funcin de la distancia entre ellas, siendo muy pequeas
cuando estn muy alejadas.
Por otra parte, la versin del modelo denominado TPM (Topology Preserving Map) trata de establecer una
correspondencia entre los datos de entrada y un espacio bidimensional de salida, creando mapas topolgicos de
dos dimensiones, de tal forma que ante datos de entrada con caractersticas comunes se deben activar neuronas
situadas en prximas zonas de la capa de salida.
Aprendizaje
El aprendizaje en el modelo de Kohonen es de tipo Off-line, por lo que se distingue una etapa de aprendizaje y otra
de funcionamiento. En la etapa de aprendizaje se fijan los valores de las conexiones (feedforward) entre la capa de
entrada y la salida. Esta red utiliza un aprendizaje no supervisado de tipo competitivo, las neuronas de la capa de
salida compiten por activarse y slo una de ellas permanece activa ante una determinada informacin de entrada a
la red, los pesos de las conexiones se ajustan en funcin de la neurona que haya resultado vencedora.
Durante la etapa de entrenamiento, se presenta a la red un conjunto de informaciones de entrada (vectores de
entrenamiento) para que sta establezca en funcin de la semejanza entre los datos las diferentes categoras (una
por neurona de salida), que serviran durante la fase de funcionamiento para realizar clasificaciones de nuevos
datos que se presenten a la red. Los valores finales de los pesos de las conexiones entre cada neurona de la capa de
salida con las de entrada se correspondern con los valores de los componentes del vector de aprendizaje que
consigue activar la neurona correspondiente. En el caso de existir ms patrones de entrenamiento que neuronas de
salida, ms de uno deber asociarse con la misma neurona, es decir pertenecern a la misma clase.
En este modelo el aprendizaje no concluye despus de presentarle una vez todos los patrones de entrada, sino que
habr que repetir el proceso varas veces para refinar el mapa topolgico de salida, de tal forma que cuantas ms
veces se presenten los datos, tanto ms se reducirn las zonas de neuronas que se deben activar ante entradas
parecidas, consiguiendo que la red pueda realizar una clasificacin mas selectiva.
Un concepto muy importante en la red de Kohonen es la zona de vecindad, o vecindario alrededor de la neurona
vencedorai*, los pesos de las neuronas que se encuentren en esta zona a la que se le dar el nombre de X(q), sern
actualizados junto con el peso de la neurona ganadora, en un ejemplo de aprendizaje cooperativo.
El algoritmo de aprendizaje utilizado para establecer los valores de los pesos de las conexiones entre las N neuronas
de entrada y las M de salida es el siguiente:
1. En primer lugar se inicializan los pesos (wij) con valores aleatorios pequeos y se fija la zona inicial de
vecindad entre las neuronas de salida.
2. A continuacin se presenta a la red una informacin de entrada (la que debe aprender) en forma de
vector p = (p1, p2, ..., pn), cuyas componentes pisern valores continuos.
3. Puesto que se trata de un aprendizaje competitivo, se determina la neurona vencedora de la capa de
salida, esta ser aquella cuyo vector de pesos wi(vector cuyas componentes son los valores de los pesos
de las conexiones entre esa neurona y cada una de las neuronas de la capa de entrada) sea el ms
parecido a la informacin de entrada p(patrn o vector de entrada). Para ello se calculan las distancias o
diferencias entre ambos vectores, considerando una por una todas las neuronas de salida, suele
utilizarse la distancia eucldea o la siguiente expresin que es similar a aquella, pero eliminando la raz
cuadrada:
El tamao deX(q)se puede reducir en cada iteracin del proceso de ajuste de los pesos, con lo que el conjunto de
neuronas que pueden considerarse vecinas cada vez es menor como se observa en la figura 2.5.2, sin embargo en la
prctica es habitual considerar una zona fija en todo el proceso de entrenamiento de la red.
El trmino a(q)es el coeficiente de aprendizaje o parmetro de ganancia, con un valor entre 0 y 1 el cual decrece con
el nmero de iteraciones(q) del proceso de entrenamiento, de tal forma que cuando se ha presentado un gran
nmero de veces todo el juego de patrones de aprendizaje su valor es prcticamente nulo, con lo que la
modificacin de los pesos es insignificante.
Para hallar
Siendo a1 un valor de 0.1 0.2 y a2 un valor prximo al nmero total de iteraciones del aprendizaje, que por lo
general se toma como 10000 para esta red.
5. El proceso debe repetirse, volviendo a presentar todo el juego de patrones de aprendizaje p1,
p2..,pn hasta obtener la salida deseada.
REDES BACKPROPAGATION
El mtodo de back-propagation (o entrenamiento hacia atrs) es un sistema automtico de entrenamiento de redes
neuronales con capas ocultas.
En una red Backpropagation existe una capa de entrada con n neuronas y una capa de salida con m neuronas y al
menos una capa oculta de neuronas internas. Cada neurona de una capa (excepto las de entrada) recibe entradas
de todas las neuronas de la capa anterior y enva su salida a todas las neuronas de la capa posterior (excepto las de
salida). No hay conexiones hacia atrs feedback ni laterales entre las neuronas de la misma capa.
Consiste en un aprendizaje de un conjunto predefinido de pares de entradas-salidas dado como ejemplo,
empleando un ciclo de propagacin-adaptacin de dos fases.
4.
Una vez localizada la neurona vencedora (i*), se actualizan los pesos de las conexiones entre las
neuronas de entrada y dicha neurona, as como los de las conexiones entre las de entrada y las neuronas
vecinas de la vencedora, en realidad lo que se consigue con esto es asociar la informacin de entrada con
una cierta zona de la capa de salida. Esto se realiza mediante la siguiente ecuacin
Fases
Primero (hacia adelante): se aplica un patrn de entrada como estmulo para la primera capa de las neuronas de la
red, se va propagando a travs de todas las capas superiores hasta generar una salida. Despus se compara el
resultado obteniendo en las neuronas de salida que se desea obtener y se calcula un valor del error para cada
neurona de salida.
Segundo (hacia atrs): estos errores se transmiten hacia atrs, partiendo de la capa de salida, hacia todas las
neuronas de la capa intermedia que contribuyan directamente a la salida, recibiendo el porcentaje de error
aproximado a la particin de la neurona intermedia en la salida original. Se pasa a la capa anterior con una
retropopagacin del error, ajustando los pesos y continuando con este proceso hasta llegar a la primera capa.
Importancia
La importancia de este algoritmo consiste en su capacidad de auto adaptar los pesos de las neuronas de las capas
intermedias para aprender la relacin que existe entre un conjunto de patrones dados como ejemplo y sus salidas
correspondientes.
Generalizacin
Ya entrenada la red se podr aplicar esa misma relacin (terminado el entrenamiento), a nuevos vectores de
entrada con ruido o incompletos, dando una salida activa si la nueva entrada es parecida a las presentadas durante
el aprendizaje.
Regla Delta de Generalizada
Se usa en redes con capas intermedias con conexiones hacia adelante y cuyas clulas tienen funciones de activacin
continuas. Estas funciones continuas son no decrecientes y derivables (la funcin sigmoidal pertenece a este tipo de
funciones).
Superficie de Error
El algoritmo utiliza una superficie de error asociada a la red, buscando el estado de mnimo error a travs del
camino descendiente de la superficie del error.
En este tipo de redes, el problema a la hora de entrenarlas estriba en que slo conocemos la salida de la red y
la entrada, de forma que no se pueden ajustar los pesos sinpticos asociados a las neuronas de las capas ocultas, ya
que no podemos inferir a partir del estado de la capa de salida como tiene que ser el estado de las capas ocultas.
El sistema de entrenamiento mediante back-propagation consiste en:
Dejar que la red genere un vector de datos de salida (propagacin hacia delante).
El error se propaga hacia atrs (back-propagation), hacia la capa de neuronas anterior, y se usa para
ajustar los pesos sinpticos en esta capa.
Se continua propagando el error hacia atrs y ajustando los pesos hasta que se alcance la capa de
entradas.
Introducir unos datos de entrada (en la capa de entradas) elegidos al azar entre los datos de entrada que
se van a usar para el entrenamiento.
Comparar la salida generada por la red con la salida deseada.
La diferencia obtenida entre la salida generada y la deseada (denominada error) se usa para ajustar los
pesos sinpticos de las neuronas de la capa de salidas.
La velocidad de aprendizaje se controla mediante . Normalmente, debe ser un nmero entre 0.05 y
0.25.
Velocidad de Convergencia
Aadir un momento (sumar una fraccin del ajuste de peso anterior al ajuste actual).
Si una red deja de aprender:
10
Es difcil encontrar el mejor conjunto de pesos sinpticos para la red de manera que la eficiencia sea mxima.
Esto se debe a que la funcin que mide la eficiencia de las redes con capas ocultas, en la mayora de los casos, es
una funcin compleja que presenta muchos mnimos locales. Y el mejor conjunto de pesos sinpticos es aquel que
hace que la funcin alcance un mnimo global.
Visto en Clases: (cada neurona de una capa se conecta con todas las neuronas de la capa siguiente conexin
feedforward)
Sistemas Expertos
Definicin: Software que intenta trabajar como si fuera un experto en alguna clase particular de conocimiento y
utilizar el tipo de reglas que el experto humano usara para resolver el problema
Caractersticas de los sistemas expertos:
La informacin queda guardada en los pesos ; en la etapa inicial se los elige aleatoriamente entre 0<1 y luego
se propaga la variacin de los pesos.
Cada componete va a tener un error
Para la capa oculta:
Donde
Entonces:
b)
Calcular para la capa oculta se calcula 2 veces por esta capa tiene 2 neuronas:
c)
c)
11
b)
c)
Base de Conocimientos: Conjunto de reglas que el experto humano puede dar sobre un rea un
particular.
Base de Hechos: Guarda las variables necesarias para contener los valores con los que trabaja el sistema.
Motor de Inferencia: Determina cmo se van a usar las reglas de la base de conocimientos accediendo y
ejecutndolas.
Interfaz Experto: Interfaz por la cual el experto carga las reglas en la base de conocimientos.
Interfaz Usuario: Interfaz que interacta con el usuario del sistema.
Utilidad
Usabilidad
Educatividad
Responsivos
Explicativo
Aprendizaje
Fcil de Modificar
El orden es importante, pero tal vez se deba regresar a etapas anteriores si se descubren fallas en algn paso.
Diapositivas de clases
Inferencia: Es la capacidad del sistema para deducir por si solo y obtener el valor de una variable sin haber
preguntado explcitamente al usuario. Es el proceso por el cual el sistema experto reconoce qu regla aplicar.
Los procesos mentales humanos son internos y muy complejos para representarse mediante algoritmos. A pesar de
ello, la mayora de los expertos son capaces de expresar sus conocimientos en la forma de reglas de tipo IF-THEN
Metodologas de Inferencia
THEN
IF
La luz de trfico est en verde
THEN
la accin es cruzar
IF
La luz de trfico est en rojo
la accin es detenerse
El trmino regla en AI, el tipo de representacin mas utilizada para representar el conocimiento, puede
definirse como una estructura de tipo IF-THEN que relaciona informacin o hechos conocidos en su parte IF con
acciones en la parte THEN. Un conjunto de reglas provee descripcin acerca de cmo solucionar un problema. Las
reglas son relativamente simples de crear y comprender.
Toda regla est conformada por dos partes: la parte IF denominada antecedente o condicin y la parte THEN
nombrada como consecuente, conclusin o accin.
Una regla puede tener antecedentes mltiples unidos por nexos lgicos tales como AND (conjuncin) o OR
(disyuncin) o combinaciones de ambas.
IF <antecedente> THEN <consecuente>
IF a AND b AND z THEN <consecuente>
IF a OR b OR z THEN <consecuente>
El antecedente de una regla incorpora dos partes: un objeto (objeto lingstico) y su valor. El objeto y su valor
esta relacionado mediante un operador. Este operador identifica al objeto y le asigna un valor. Los operadores
tpicos IS, ARE, IS NOT, ARE NOT se utilizan para asignar valores simblicos a un objeto lingstico.
Los Sistemas Expertos tambin pueden utilizar operadores matemticos para definir un objeto como numrico
y asignar un valor tambin numrico.
12
El experto en el dominio es una persona con los conocimientos y la experiencia suficiente para permitirle
resolver problemas en un rea especfica. Esta experiencia debe capturarse en el Sistema Experto a
desarrollar. Entonces este experto debe tener la habilidad de comunicar su conocimiento, estar
dispuesto a participar en el desarrollo del proyecto del Sistema Experto y entregar una cantidad
sustancial de tiempo al mismo. El experto en el dominio es la persona mas importante en el equipo de
desarrollo del proyecto.
El Ingeniero de Conocimiento (Knowledge Engineer) es una persona capacitada para disear construir y
comprobar un Sistema Experto. Se encarga de entrevistar al experto en el dominio para delimitar el
problema a resolver. El Ingeniero de Conocimiento establece los mtodos de razonamiento que el
experto utiliza para resolver un problema, usando hechos y reglas y decidiendo como representarlos en
un sistema experto. Despus es su tarea elegir un software apropiado para el desarrollo o un shell de
sistema experto o un lenguaje de programacin apropiado para codificar el conocimiento. Finalmente, es
responsable de las comprobaciones, revisiones y la integracin del sistema experto a un sistema
productivo.
El gerente del proyecto (project manager) es el lder del Grupo de Desarrollo del Sistema Experto.
Responsable de hacer funcionar todo. Debe preocuparse del cumplimiento de metas, interactuar con el
experto y dems participantes del grupo de desarrollo, poniendo especial cuidado con el usuario final.
El usuario final (end-user) , o usuario,, es la persona que utilizar el Sistema Experto desarrollado, no solo
debe confiar en su capacidad de resolver problemas, sino que debe sentirse confortable en su uso.
Resulta as que el diseo de una interfase amigable y sencilla de aprender sea vital para el xito del
proyecto: la contribucin del usuario es crucial en este punto.
Recomendacin
IF estamos en otoo AND el cielo est nublado AND el
THEN
el consejo es llevar paraguas
pronstico es lloviznas
Directiva
IF el auto no anda AND el tanque de combustible est vaco
THEN
la accin es cargar combustible
Estrategia
IF
el auto no anda
THEN
la accin es revisar el nivel de combustible;
PASO 1: cumplido
IF
PASO 1 cumplido AND hay combustible en el tanque
THEN
la accin es comprobar la batera;
PASO 2: cumplido
Heuristica
IF
el derrame es lquido AND el derrame tiene un PH < 6 AND el derrame huele a vinagre
THEN
el derrame es cido actico
Integrantes principales en un equipo de desarrollo
A comienzos de los 70, Newell y Simon de la Carnegie-Mellon University propusieron un modelo para sistemas de
produccin, cimentando los Sistemas Expertos modernos basados en reglas.
Este modelo est basado en la idea que los humanos resuelven sus problemas aplicando sus conocimientos
(expresados como reglas de produccin) sobre un determinado problema representado por informacin especfica
del problema.
Las reglas de produccin estn almacenadas en una memoria de largo-plazo y la informacin especfica del
problema o hechos yacen en la memoria de corto- plazo.
Long-term Memory
Short-term Memory
Project Manager
Production Rule
Fact
REASONING
Domain Expert
Knowledge Engineer
Programmer
Conclusion
Expert System
End-user
La Base de Conocimientos (Knowledge Base: KB) contiene el conocimiento til del dominio para resolver
problemas. En un Sistema Experto Basado en Reglas, el conocimiento se representa mediante reglas. Cada
regla especifica una relacin, recomendacin, directiva, estrategia o heurstica. Compuesta por dos
estructuras: IF (condicin) y THEN (accin). Cuando se satisface la <condicin>, decimos que la regla se dispara
y se ejecuta la <accin>
La Base de Datos (Data Base: DB) incluye un conjunto de hechos utilizados en la parte de <condicin> de la KB.
El Motor de Inferencia (Inference Engine) se encarga del razonamiento mediante el que el experto alcanza una
solucin. Realiza el enlace de las reglas en la KB con los hechos provistos por la DB.
13
Las facilidades de explicacin (explanation facilities) permiten al usuario que realice preguntas al Sistema
Experto en cuanto a como lleg a una conclusin determinada y por qu es necesario un determinado hecho.
Un Sistema Experto debe ser capaz de explicar sus decisiones y justificar sus aconsejamiento, anlisis o
conclusiones.
La interfase de usuario (user interface) es el medio mediante el cual se comunica un usuario en procura de una
solucin para un problema con el Sistema Experto.
Un Sistema Experto (Expert System: ES) se construye para que se comporte a nivel humano experto en un
dominio estrecho, especializado. De modo que la caracterstica mas importante de un ES yace en su
performance de alta calidad. No importando cuan rpido el sistema puede resolver un problema, el usuario no
estar conforme frente a resultados errneos.
Por otra parte, la velocidad de alcanzar una solucin es muy importante. Aun la mas ajustada y correcta de las
decisiones o diagnostico pueden no resultar utilizables si las obtenemos demasiado tarde para aplicarlas, por
ejemplo, en una emergencia con la posibilidad de muerte de una persona o explosin de una Planta Nuclear.
El encadenamiento hacia atrs es una tcnica de razonamiento manejada por meta. En ella, un ES tiene
una meta (una solucin hipottica) y el motor de inferencia trata de encontrar la evidencia necesaria para probarla.
Lo primero es revisar la KB buscando reglas que puedan tener la solucin adecuada. Tales reglas deben tener la
meta en su <consecuente>, y si encontramos alguna con esta condicin, buscamos si su parte de <antecedente>
satisface la DB, caso en que la regla se dispara y la meta es comprobada.
En el caso general, el motor de inferencia separa la regla sobre la que est trabajando, colocndola en un
esquema de stack. Esto crea sub-metas correspondiente a la evaluacin y satisfaccin de <antecedentes>. Luego, la
KB es revisada nuevamente para encontrar reglas que puedan satisfacer sub-metas. El motor de inferencia repite
este proceso hasta que no encuentra reglas que puedan satisfacer la sub-meta actual.
Como elegimos entre FC y BC
Si un experto necesita obtener informacin primero, y luego trata de inferir de ella lo que se pueda, la eleccin
es encadenamiento hacia adelante para el motor de inferencia.
Mientras que si un experto comienza con una solucin hipottica y luego trata de encontrar hechos que la
sustentes, la eleccin es encadenamiento hacia atrs para el motor de inferencia.
Resolucin de Conflictos
Los ES aplican heursticas para guiar sus razonamientos, reduciendo el rea de bsqueda en procura de
una solucin. Una caracterstica nica de los ES es su capacidad para explicar su comportamiento. Esto
permite que revean su propio razonamiento y expliquen sus decisiones. Los ES emplean razonamiento
simblico cuando resuelven un problema. Se utilizan smbolos para representar diferentes tipos de
conocimientos tales como hechos, conceptos y reglas.
En los ES, el conocimiento est separado de su procesamiento (la Base de Conocimientos y el Motor de
Inferencia son partes separadas). En un programa convencional encontramos una mezcla de conocimiento y
estructura de control que procesa este conocimiento. Esta mezcla lleva a dificultades en la comprensin y
revisin del cdigo del programa, ya que cualquier cambio en el cdigo afecta tanto al conocimiento como a
su proceso.
Cuando se utiliza una cscara experta (expert shell), un Ingeniero de Conocimiento o un experto
simplemente ingresan reglas en la KB, adicionando con cada regla nuevo conocimiento, haciendo de esta
manera al sistema experto mas inteligente.
En un sistema experto basado en reglas, el dominio de conocimiento est representado por un conjunto
de reglas de produccin del tipo IF-THEN y los datos son representados por un conjunto de hechos acerca de la
situacin actual. El motor de inferencia compara cada regla almacenada en la KB con hechos contenidos en la
DB. Cuando se satisface el <antecedente> con los valores almacenados como hechos, entonces decimos que la
regla se dispara, ejecutando la <accin>. Este proceso de disparo produce una cadena inferencial. Esta cadena
indica como un sistema experto aplica las reglas para alcanzar una conclusin.
14
Tenemos dos reglas: Rule 2 y Rule 3, con el mismo <antecedente>. Entonces las dos pueden dispararse cuando se
satisface el hecho luz roja, representando una situacin de conflicto. Es tarea del motor de inferencia determinar
cual regla disparar a partir de este conjunto conflictivo. Un mtodo utilizado en elegir la regla a disparar en un ciclo
se denomina resolucin de conflicto.
En encadenamiento para adelante, AMBAS reglas se disparan. Rule 2 se dispara primero ya que est en el tope con
respecto a Rule 3, y como resultado se ejecuta su parte THEN y el objeto lingstico accin obtiene el valor stop. No
obstante, la Rule 3 tambin se dispara debido a que si <antecedente> equipara el hecho traffic light is red, que
aun est en la DB. Como consecuencia, el objeto accin toma el nuevo valor go.
Mtodos usados para resolucin de Conflictos
Disparar la regla con la mayor prioridad. En aplicaciones simples, la prioridad se establece colocando las
reglas en un orden apropiado en la KB. Usualmente esto funciona bien para SE con no mas de 100 reglas.
Disparar la regla ms especfica. Este mtodo tambin se conoce como estrategia de mxima
equiparacin, y est basada en la presuncin que una regla especfica procesa mas informacin que una
general.
Disparar la regla que utiliza datos ingresados ms recientemente en la DB. Este mtodo se basa en las
estampillas de tiempo (time tags) agregadas a cada hecho en la DB. A partir del conjunto conflictivo, el
sistema experto dispara primero la regla cuyo antecedente usa el dato mas reciente en la DB.
Metaknowledge
Representacin del conocimiento de forma natural. Usualmente un experto explica los procedimientos
que utiliza para resolver problemas mediante expresiones del tipo en tales y tales circunstancias, hago
esto y esto. Estas expresiones se pueden representar de manera bastante natural como reglas de
produccin de tipo IF-THEN.
Estructura uniforme. Las reglas de produccin tienen la estructura uniforme de tipo IF-THEN. Cada regla
es una pieza de conocimiento independiente, y la sintaxis con las que se escriben les permite ser autodocumentadas.
Separacin del conocimiento de su procesamiento. La estructura de un sistema experto basado en reglas
provee una separacin efectiva de la base de conocimientos y el motor de inferencia. Esto hace posible
desarrollar diferentes aplicaciones utilizando la misma cascara de ES (expert system shell).
Permite tratar con conocimiento incompleto e incierto. La mayora de los sistemas expertos basados en
reglas son capaces de representar y razonar con conocimiento incompleto e incierto.
Relaciones opacas entre reglas. A pesar que las reglas de produccin individuales son relativamente
simples y auto-documentadas, su interaccin lgica dentro del gran conjunto de reglas puede no ser tan
sencillo de entender. Los sistemas basados en reglas hacen difcil observar como las reglas
individualmente sirven a una estrategia global.
Estrategia de bsqueda ineficiente. El motor de inferencia aplica una bsqueda exhaustiva sobre todas
las reglas de la KB cada ciclo, y si esta KB es de grandes dimensiones (miles de reglas) torna al proceso
lento. Esta situacin puede ser determinante en sistemas de tiempo real.
Baja Capacidad para aprender. En general, los sistemas expertos basados en reglas no poseen ninguna
capacidad para aprender a partir de su experiencia. A diferencia de los seres humanos, que sabe cuando
saltarse las reglas, un sistema experto no puede modeficar de manera automtica su KB, o ajustar
reglas existentes o adicionar reglas nuevas. El Ingeniero de Conocimiento es aun insustituible y
responsable de revisar y mantener el sistema.
1) El modelo de tipo biolgico. Este comprende las redes que tratan de simular los sistemas neuronales biolgicos,
as como las funciones auditivas o algunas funciones bsicas de la visin.
2) El modelo dirigido a aplicacin. Este modelo no tiene por qu guardar similitud con los sistemas biolgicos. Su
arquitectura est fuertemente ligada a las necesidades de las aplicaciones para la que es diseada.
Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples
(usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos
del mundo real del mismo modo que lo hace el sistema nervioso biolgico
Debido a su constitucin y a sus fundamentos, las redes neuronales artificiales presentan un gran nmero de
caractersticas semejantes a las del cerebro. Por ejemplo, son capaces de aprender de la experiencia, de generalizar
de casos anteriores a nuevos casos, de abstraer caractersticas esenciales a partir de entradas que representan
informacin irrelevante, etc.
Aprendizaje: la etapa de aprendizaje consiste en proporcionar a la Red Neuronal datos como entrada a su vez que
se le indica cul es la salida (respuesta) esperada.
Auto organizacin: Una Red Neuronal crea su propia representacin de la informacin en su interior, descargando
al usuario de esto.
Tolerancia a fallos: Debido a que una Red Neuronal almacena la informacin de forma redundante, sta puede
seguir respondiendo de manera aceptable aun si se daa parcialmente.
Flexibilidad: Una Red Neuronal puede manejar cambios no importantes en la informacin de entrada, como seales
con ruido u otros cambios en la entrada (ej. si la informacin de entrada es la imagen de un objeto, la respuesta
correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente)
Tiempo real: La estructura de una Red Neuronal es paralela, por lo cul se pueden obtener respuestas en tiempo
real.
Redes Neuronales
Consisten de unidades de procesamiento que intercambian datos o informacin, se utilizan para
reconocer patrones, incluyendo imgenes, manuscritos y secuencias de tiempo, tendencias financieras. Tienen
capacidad de aprender y mejorar su funcionamiento.
Una primera clasificacin de los modelos de redes neuronales podra ser, atendiendo a su similitud con la realidad
biolgica:
15
En cualquier sistema que se est modelando, es til caracterizar tres tipos de unidades: entradas, salidas y ocultas.
Las unidades de entrada reciben seales del entorno, stas pueden ser provenientes de censores o de otros
sectores del sistema. Las unidades de salida envan la seal fuera del sistema; stas pueden controlar directamente
potencias u otros sistemas. Las unidades ocultas son aquellas cuyas entradas y salidas se encuentran dentro del
sistema; es decir no tienen contacto con el exterior.
Se conoce como nivel o capa a un conjunto de neuronas cuyas entradas provienen de la misma fuente, y cuyas
salidas se dirigen a un mismo destino.
De Entrada: es la capa que recibe directamente la informacin proveniente de las fuentes externas de la
red.
Ocultas: son internas a la red, no tiene contacto directo con el exterior. El nmero de niveles ocultos
puede ser de cero a un nmero elevado. Las neuronas de las capas ocultas pueden estar interconectadas de
distintas maneras, lo que determina junto a su nmero, las distintas topologas.
De Salida: transfieren informacin de la red hacia el exterior.
Se dice que una red es totalmente conectada si todas las salidas desde un nivel llegan a todos y cada uno de los
nodos del mismo nivel siguiente.
Funcin escaln
Sigmoidal
Funcin gaussiana
La conectividad entre los nodos de una red neuronal est relacionada con la forma en que las salidas de las
neuronas estn canalizadas para convertirse en entradas de otras neuronas. La seal de salida de un nodo puede ser
una entrada de otro elemento de proceso, o incluso de s mismo (conexin auto-recurrente).
Cuando ninguna salida de las neuronas es entrada de neuronas del mismo nivel o de niveles precedentes, la red se
describe como propagacin hacia delante. Cuando las salidas pueden estar conectadas como entradas de neuronas
de niveles previos o del mismo nivel, incluyndose ellas mismas, la red es de propagacin hacia atrs. Las redes de
propagacin hacia atrs que tiene lazos cerrados son sistemas recurrentes.
La funcin escaln nicamente se utiliza cuando las salidas de la red son binarias. La salida de una neurona se activa
slo cuando el estado de activacin es mayor o igual a cierto valor umbral. La funcin lineal o identidad equivale a
no aplicar funcin de salida. Las funciones mixtas y sigmoidal son las ms apropiadas cuando queremos como salida
informacin analgica.
Regla de aprendizaje
Existen muchas definiciones del concepto aprendizaje, una de ellas podra ser: La modificacin del
comportamiento inducido por la interaccin con el entorno y como resultado de experiencias conducente al
establecimiento de nuevos modelos de respuesta a estmulos externos.
16
b) Conexiones laterales.
Arquitectura no-supervisada.
Consiste de un nmero de neuronas organizadas en una red n-dimensional.
Cada neurona es conectada a todas las otras neuronas, pero es localmente conectada solo a sus vecinas.
Cada neurona tiene un vector de pesos W de entrada asociado y la neurona con el vector de peso ms
cercano a la entrada P se activar.
En cada vector se presenta la siguiente secuencia de pasos:
Encontrar el nodo k cuyo vector de peso est ms prximo al vector de entrada actual.
Entrenar el nodo k y todos los nodos ms prximos a este.
cuando se presenta un patrn de entrenamiento, se debe identificar la neurona de salida vencedora, esto es, la
neurona cuyo vector de pesos sea el ms parecido al patrn presentado. De acuerdo con este criterio, dos vectores
sern ms similares cuanto menor sea su distancia.
aprendizaje supervisado
aprendizaje no supervisado.
La diferencia fundamental entre ambos tipos es la existencia o no de un agente externo (supervisor) que controle el
proceso de aprendizaje.
Otro criterio para diferenciar las reglas de aprendizaje se basan en considerar si la red puede aprender durante su
funcionamiento habitual (aprendizaje ON LINE),o si el aprendizaje supone una desconexin de la red; es decir su
inhabilitacin hasta que el proceso termine (aprendizaje OFF LINE).
Ventajas que ofrecen las redes neuronales
Una medida de similitud alternativa ms simple que la euclidiana, es la correlacin o producto escalar: segn la cual,
dos vectores sern ms similares cuanto mayor sea su correlacin.
ALGORITMO
Decrementarsuavemente la razn de aprendizaje.
Despus de M ciclos, decrementarel tamao de la vecindad.
Entrenamiento
Se inicializan los pesos de forma aleatoria.
Se presenta un vector de entrenamiento.
La neurona mas cercana al vector es la nica que se activa
Solo se modifican los pesos de la neurona activa y de sus vecinas
Lgica difusa (fuzzy)
Fuzzy Logic tiene sus races en la teora de conjuntos difusos desarrollada por Zadeh en la dcada de los
60, la que propone que un elemento siempre pertenece en un cierto grado a un conjunto y nunca pertenece del
todo al mismo, esto permite establecer una manera eficiente para trabajar con incertezas, as como para
acondicionar el conocimiento en forma de reglas hacia un plano cuantitativo, factible de ser procesado por
computadores.
Toda lgica consiste en formalizar el pensamiento humano, desde este punto de vista,
17
Lgica Clsica: Establece que cualquier enunciado o proposicin puede tener un valor lgico verdadero o
falso, en definitiva 1 y 0. De esta forma es posible desarrollar toda una lgica basada en leyes de este tipo.
Logica Difusa: En vez de trabajar con el clsico concepto de inclusin o exclusin, introduce una funcin
que expresa el grado de pertenencia de una variable hacia un atributo o variable lingstica tomando valores en
el rango de 0 a 1.
Conjunto Difuso: Par Variable lingstica funcin de pertenencia
A = {x / A(x) x X}
Ejemplo: Descripcin del estado de una puerta
Lgica Clsica: De acuerdo a la lgica clsica existen dos estados posibles para una puerta.
Una puerta est abierta (1)
Una puerta est cerrada (0)
Lgica Difusa: establece que una puerta no tiene por que estar necesariamente abierta o cerrada, existen adems
otros estados.
Puerta abierta (1)
Puerta bastante abierta (0.8)
Puerta abierta a medias (0.5)
Puerta casi cerrada (0.1)
Una puerta est cerrada (0)
Las variables lingsticas son representativas de situaciones como: Positivo, alrededor de, alto,
medio, etc.
El primer paso consiste en tomar las entradas y determinar el grado al que ellos pertenecen a
cada uno de los conjuntos fuzzy apropiados.
Trapezoidales y Triangulares: Son funciones lineales por tramos, pero representan una discontinuidad
en la primera derivada que hereda la accin de control.
Polinmicas: Son funciones sencillas de calcular y tienen una forma similar a la de las funciones de
densidad normal.
18
Operadores difusos
Tambin se usa el criterio mximo, que escoge el punto donde la funcin inferida tiene su
mximo o el criterio de la media de los mximos.
Controlador Difuso
En un controlador a partir del valor de referencia (setpoint) y del valor de entrada del
proceso, se calcula el error (E) y el cambio del error (CE).
El controlador difuso toma como variables de partida E y CE y tiene como variable de salida el
cambio en la accin de control a aplicar (CU), o bien una accin de control absoluta (U).
INTERACCIN: Corresponde al peso propio que tiene una regla entre las restantes, para esto se debe analizar el
efecto de las reglas en la accin de control.
ROBUSTEZ: Es una medida de la reaccin del controlador frente a perturbaciones en las entradas.
Algoritmos genticos
Definicin Formal: Los Algoritmos Genticos (AG) son procedimientos adaptativos para la bsqueda de soluciones
en espacios complejos inspirados en la evolucin biolgica, con patrones de operaciones basados en el principio
darwiniano de reproduccin y supervivencia de los individuos que mejor se adaptan al entorno en el que viven.
Representacin
Los algoritmos genticos requieren que el conjunto se codifique en un cromosoma. Cada cromosoma
tiene varios genes, que corresponden a los respectivos parmetros del problema. Para poder trabajar con estos
genes en el ordenador, es necesario codificarlos en una cadena, es decir, una cadena de smbolos (nmeros o letras)
que generalmente va a estar compuesta de ceros y unos.
Mtodos de codificacin de variables
Cadenas binarias: Secuencias de unos y ceros donde el dgito de cada posicin representa el valor de
algn aspecto de la solucin.
Cadenas de enteros o nmeros decimales: Cada posicin representa algn aspecto particular de la
solucin. Este mtodo permite una mayor precisin y complejidad que el mtodo comparativamente
restringido de utilizar slo nmeros binarios, y a menudo est intuitivamente ms cerca del espacio de
problemas.
19
La poblacin inicial es la principal fuente de material gentico para el algoritmo gentico. La poblacin inicial debe
contener cromosomas que estn bien dispersos por el espacio de soluciones. Habitualmente la poblacin inicial se
escoge generando cadenas al azar, pudiendo contener cada gen uno de los posibles valores del alfabeto con
probabilidad uniforme.
Funcin objetivo: La regla, general para construir una buena funcin objetivo es que sta debe reflejar el valor del
individuo de una manera real, pero en muchos problemas de optimizacin combinatoria, donde existen gran
cantidad de restricciones, buena parte de los puntos del espacio de bsqueda representan individuos no vlidos.
Para este planteamiento en el que los individuos estn sometidos a restricciones, se han propuesto varias
soluciones. La absolutista, con el uso del operador reparador, la penalizacin de la funcin objetivo, o la evaluacin
aproximada de la funcin objetivo.
Un problema habitual en las ejecuciones de los Algoritmos Genticos surge debido a la velocidad con la que el
algoritmo converge. En algunos casos la convergencia es muy rpida, lo que suele denominarse convergencia
prematura, en la cual el algoritmo converge hacia ptimos locales, mientras que en otros casos el problema es justo
el contrario, es decir se produce una convergencia lenta del algoritmo.
Seleccin: La seleccin consiste en decodificar el gen del individuo y usar sus componentes como parmetros para
el problema, cuyo resultado ser ponderado luego por una funcin de fitness, que mide la adaptabilidad del
individuo al problema.
Mtodos de Seleccin
Seleccin por rueda de ruleta: una forma de seleccin proporcional a la aptitud en la que la probabilidad
de que un individuo sea seleccionado es proporcional a la diferencia entre su aptitud y la de sus
competidores.
Seleccin por torneo: se eligen dos integrantes de la poblacin, se los compara y se determina un
ganador, que regresa a la poblacin de la que puede ser elegido nuevamente. El perdedor pasa a una
pila. Se repite hasta que no haya ms individuos en la poblacin y se elige al que est en el tope de la pila
como el ganador del torneo.
Seleccin por rango: a cada individuo de la poblacin se le asigna un rango numrico basado en su
aptitud, y la seleccin se basa en este ranking, en lugar de las diferencias absolutas en aptitud.
Cruzamiento
Una vez seleccionados los individuos cuyos genes pasarn a la siguiente generacin, se procede a la
formacin de sta. Para ello primero se realizarn un nmero aleatorio de cruces (como mximo poblacin/2). Los
individuos que se vayan a cruzar tambin se debern elegir aleatoriamente, teniendo en cuenta que un mismo
individuo no puede cruzarse ms de una vez.
El objetivo de los operadores de cruce es, partiendo de dos cromosomas padres, generar uno o ms cromosomas
hijos que hereden caractersticas de ambos padres. Se dice que en el hijo se recombinan las caractersticas de los
padres.
Tcnicas de cruce
Cruce bsico: Se selecciona un punto al azar de la cadena. La parte anterior del punto es copiada del
genoma del padre y la posterior del de la madre. Es decir, la tcnica consiste en separar a los padres en
dos partes para formar dos hijos intercambiando las partes de cada padre.
Cruce multipunto: Igual que el cruce bsico, slo que estableciendo ms de un punto de cruce. Se eligen
M puntos de corte al azar, y las secciones de cada padre se pasan a los hijos en forma alternada.
Cruce segmentado: Existe una probabilidad de que un cromosoma sea punto de un cruce. Conforme se
va formando la nueva cadena del descendiente, para cada gen, se verifica si ah se va producir un cruce.
Cruce uniforme: Para cada gen de la cadena del descendiente existe una probabilidad de que el gen
pertenezca al padre, y otra de que pertenezca a la madre. Esta tcnica permite el intercambio de los
bloques en una manera que es independiente del orden que la codificacin impuso a cada uno dentro
del cromosoma.
Mutacin
Mutar un individuo consiste en alterarlo de alguna manera, y es un proceso que se realiza con muy poca
probabilidad con respecto al cruce (se utilizan probabilidades del 1% del 0,1% o incluso, menores). En general, se
implementa modificando al azar alguno o algunos de los genes del individuo al que se la aplica. Esto se hace para
forzar la evolucin al alterar los genes de los individuos. Dicha alteracin puede otorgar ms o menos adaptacin en
los mejores casos.
Mtodos de mutacin
Criterio de convergencia de identidad: Este criterio consiste en detener al algoritmo gentico cuando un
determinado porcentaje de los cromosomas de la poblacin representan a la misma solucin.
20