Está en la página 1de 20

INTELIGENCIA ARTIFICIAL

1) Introduccin a Inteligencia Artificial


2) Sistemas Expertos
3) Sistemas Difusos
4) Algoritmos Genticos
5) Redes Neuronales
1) Introduccin a I.A
La inteligencia es la capacidad de entender, asimilar, elaborar informacin y utilizarla para resolver problemas. La
inteligencia parece estar ligada a otras funciones mentales como la percepcin, o capacidad de recibir informacin,
y la memoria, o capacidad de almacenarla.
Inteligencias mltiples
Howard Gardner, psiclogo norteamericano de la Universidad de Harvard, escribi en 1983 Las estructuras de la
mente, un trabajo en el que consideraba el concepto de inteligencia como un potencial que cada ser humano
posee en mayor o menor grado, planteando que sta no poda ser medida por instrumentos normalizados en test
de CI y ofreci criterios, no para medirla, sino para observarla y desarrollarla.
Segn Howard Gardner, creador de la Teora de las inteligencias mltiples, la inteligencia es la capacidad para
resolver problemas o elaborar productos que puedan ser valorados en una determinada cultura. Propuso varios
tipos de inteligencia, igual de importantes:
Inteligencia lingstica: capacidad de usar las palabras de manera adecuada.
Caracteriza a escritores y poetas. Implica la utilizacin de ambos hemisferios cerebrales.
Inteligencia lgica-matemtica: capacidad que permite resolver problemas de lgica y matemtica.
Es fundamental en cientficos y filsofos. Al utilizar este tipo de inteligencia se hace uso del hemisferio lgico.
Era la predominante en la antigua concepcin unitaria de "inteligencia".
Inteligencia musical: capacidad relacionada con las artes musicales.
Es el talento de los msicos, cantantes y bailarines. Es conocida comnmente como "buen odo".
Inteligencia espacial: la capacidad de distinguir aspectos como: color, lnea, forma, figura, espacio, y sus
relaciones en tres dimensiones.
Esta inteligencia atae a campos tan diversos como el diseo, la arquitectura, la ingeniera, la escultura, la ciruga o
la marina.
Inteligencia corporal-cenestsica: capacidad de controlar y coordinar los movimientos del cuerpo y
expresar sentimientos con l.
Es el talento de los actores, mimos, o bailarines. Implica a deportistas o cirujanos.
Inteligencia intra personal: est relacionada con las emociones, y permite entenderse a s mismo.
Relacionada con las ciencias psicolgicas.
Inteligencia interpersonal o social: capacidad para entender a las dems personas con empata; est
relacionada con las emociones.
Es tpica de los buenos vendedores, polticos, profesores o terapeutas.
Posteriormente aadi:
Inteligencia naturalista: la utilizamos al observar y estudiar la naturaleza para organizar y clasificar.
Los bilogos y naturalistas son quienes ms la desarrollan.
Inteligencia existencial o filosfica: la capacidad para situarse a s mismo con respecto al cosmos y
autosugestionarse.
Requiere de un estudio ms profundo para ser caracterizada como inteligencia.
La crtica ms comn es que la inteligencia musical y la cenestsica no muestran inteligencia, sino talento.
Introduccin a Inteligencia Artificial
En ciencias de la computacin se denomina inteligencia artificial (IA) a las inteligencias no naturales en agentes
racionales no vivos. Segn John McCarthy "Es la ciencia e ingeniera de hacer mquinas inteligentes,
especialmente programas de cmputo inteligentes."
Un Agente inteligente, permite pensar, evaluar y actuar conforme a ciertos principios
de optimizacin y consistencia, para satisfacer algn objetivo o finalidad.

I.A es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura fsica
producen acciones o resultados que maximizan una medida de rendimiento determinada, basndose en la secuencia
de entradas percibidas y en el conocimiento almacenado en tal arquitectura.
Existen distintos tipos de conocimiento y medios de representacin del conocimiento, el cual puede ser cargado en
el agente por su diseador o puede ser aprendido por el mismo agente utilizando tcnicas de aprendizaje.
Tambin se distinguen varios tipos de procesos vlidos para obtener resultados racionales, que determinan el tipo
de agente inteligente. De ms simples a ms complejos, los cinco principales tipos de procesos son:
Ejecucin de una respuesta predeterminada por cada entrada (anlogas a actos reflejos en seres vivos).
Bsqueda del estado requerido en el conjunto de los estados producidos por las acciones posibles.
Algoritmos genticos (anlogo al proceso de evolucin de las cadenas de ADN).
Redes neuronales artificiales (anlogo al funcionamiento fsico del cerebro de animales y humanos).
Razonamiento mediante una lgica formal (anlogo al pensamiento abstracto humano).
Tambin existen distintos tipos de percepciones y acciones, pueden ser obtenidas y producidas, respectivamente
por sensores fsicos y sensores mecnicos en mquinas, pulsos elctricos u pticos en computadoras, tanto como
por entradas y salidas de bits de un software y su entorno software.
Varios ejemplos se encuentran en el rea de control de sistemas, planificacin automtica, la habilidad de
responder a diagnsticos y a consultas de los consumidores, reconocimiento de escritura, reconocimiento del
habla y reconocimiento de patrones. Los sistemas de IA actualmente son parte de la rutina en campos
como economa, medicina, ingeniera y la milicia, y se ha usado en gran variedad de aplicaciones de software, juegos
de estrategia como ajedrez de computador y otros videojuegos.
Categoras de la Inteligencia Artificial
Sistemas que piensan como humanos.- Estos sistemas tratan de emular el pensamiento humano; por
ejemplo las redes neuronales artificiales. La automatizacin de actividades que vinculamos con procesos
de pensamiento humano, actividades como la Toma de decisiones, resolucin de
problemas, aprendizaje.
Sistemas que actan como humanos.- Estos sistemas tratan de actuar como humanos; es decir, imitan el
comportamiento humano; por ejemplo la robtica. El estudio de cmo lograr que los computadores
realicen tareas que, por el momento, los humanos hacen mejor.
Sistemas que piensan racionalmente.- Es decir, con lgica (idealmente), tratan de imitar o emular el
pensamiento lgico racional del ser humano; por ejemplo los sistemas expertos. El estudio de
los clculos que hacen posible percibir, razonar y actuar.
Sistemas que actan racionalmente (idealmente). Tratan de emular en forma racional el
comportamiento humano; por ejemplo los agentes inteligentes .Est relacionado con conductas
inteligentes en artefactos.
John Searle Alan Turing
John searle distingue la I.A entre dbil y fuerte:
I.A dbil: simular estados mentales y no tiene conciencia.
I.A fuerte: computadora con conciencia. Este concepto est asociado con Alan turing.
Leyes de la robtica
El termino robot fue introducido por el checo Karel Capek en 1921, y viene de la combinacin de las palabras checas
robota que significa trabajo obligatorio y robotnik que significa siervo.
La palabra robtica fue utilizada por primera vez por el cientfico y escritor de ciencia ficcin Isacc Asimov en 1942.
El propuso las llamadas leyes de la robtica:

Estas leyes surgen como medida de proteccin para los seres humanos. Segn Isacc Asimov, la concepcin de las
leyes de la robtica busca contrarrestar un supuesto temor que el ser humano desarrollara frente a unas mquinas
que hipotticamente pudieran rebelarse y levantarse contra sus creadores.
Las tres leyes de la robtica representan el cdigo moral del robot.
2) Sistemas Expertos (tambin conocidos como Sistemas basados en el conocimiento Facilitar la toma de decisin)
Conocimiento: una comprensin terica o prctica de un dominio de inters. Tambin la suma de lo que conocemos
Experto: individuo que tiene conocimiento especializado sobre el problema a resolver.
Definicin de S.E: Es un SW que imita el comportamiento de un experto humano en la solucion de un problema.
Puede almacenar conocimientos de expertos para un campo determinado y solucionar un problema mediante
deduccin lgica de conclusiones.
Caractersticas

Se basan principalmente en procesos heursticos antes que algortmicos.

Pueden tomar decisiones aunque el conocimiento sea incierto, impreciso o incompleto.


Arquitectura o estructura bsica de un S.E
a) Base de conocimiento
b) Base de hechos o base de datos (memoria de trabajo)
c)
Motor de inferencia
d) Mdulo de justificacin o sub-sistema de explicaciones
e) Interfaz de usuario
a) Base de conocimiento: parte del S.E que contiene el conocimiento del domino representado a travs de reglas.
Modos de representar el conocimiento
1)Reglas Heursticas, 2) Triplos OAV, 3) Redes Semnticas, 4) Marcos (FRAMES), 5) Frmulas
Lgicas, 6) Redes Neuronales
Una regla es una estructura condicional que relaciona lgicamente la informacin contenida en la parte
del antecedente con otra informacin contenida en la parte del consecuente.
[If antecedente Then Consecuente1 - Else Consecuente2]
El antecedente incorpora 3 partes: Objeto Atributo Valor
Ejemplo: Si el ratn es marrn entonces es malo
Forma general de la regla
If condicion1 (AND/OR) Condicion2 Then Conclusin1 (AND/OR) Conclusion2
Un hecho es un caso particular de la regla. Entonces podemos considerar un hecho como informacin y
una regla como conocimiento.
b) Base de hechos (memoria de trabajo): incluye un conjunto de hechos utilizados en la parte de <condicin> de la
base de conocimiento.
c) Motor de inferencia: trabaja con la informacin contenida en la base de conocimientos y la base de hechos para
deducir nuevos hechos. Contrasta los hechos particulares de la base de hechos con el conocimiento contenido en la
base de conocimientos para obtener conclusiones acerca del problema.
Encadenamiento de reglas: Cuando se dispara una regla se produce una cadena inferencial, la cual indica como un
S.E aplica las reglas para alcanzar una conclusin:
-Encadenamiento hacia adelante (Forward): o inferencia ascendente. Orientado por hechos. Partiendo de un
conjunto de hechos, usar reglas para deducir nuevos hechos.

Dado un conjunto de Hechos, elegir una regla cuyo Antecedente sea verdadero; disparar la regla; el Consecuente de
la regla es un nuevo hecho; Continuar (recursivamente) con un nuevo conjunto de datos; Parar cuando no se pueda
disparar ninguna regla.
-Encadenamiento hacia atrs (Backward): o inferencia descendente. Orientado por objetivos. Partiendo de un
objetivo, usar reglas para buscar soporte del objetivo.
Dado un conjunto de Hechos, elegir una regla cuyo Antecedente sea verdadero; disparar la regla; el Consecuente de
la regla es un nuevo hecho; Continuar (recursivamente) con un nuevo conjunto de datos; Parar cuando no se pueda
disparar ninguna regla.
-Encadenamiento mixto.
Consejos de cuando conviene utilizar los encadenamientos
Si un experto necesita tener informacin primero y luego trata de inferir de ella lo que se pueda, se
utiliza encadenamiento hacia adelante. (trabaja con varios hechos, de lo contrario, resulta ineficiente)
Si un experto comienza con una solucion hipottica y luego trata de encontrar hechos que la sustenten,
la eleccin es encadenamiento hacia atrs.
Cuando 2 reglas se disparan al mismo tiempo, existen 2 mtodos de solucion: disparar la regla con la
mayor prioridad o disparar la regla mas especifica (estrategia de mxima equiparacin)
d) Modulo de justificacin: Una caracterstica de los sistemas expertos es su habilidad para explicar su
razonamiento. Usando el mdulo del subsistema de explicacin, un sistema experto puede proporcionar una
explicacin al usuario de por qu est haciendo una pregunta y cmo ha llegado a una conclusin. Este mdulo
proporciona beneficios tanto al diseador del sistema como al usuario. El diseador puede usarlo para detectar
errores y el usuario se beneficia de la transparencia del sistema.
e) Interfaz de usuario: La interaccin entre un sistema experto y un usuario se realiza en lenguaje natural.
3) Sistemas difusos
Lgica Difusa
Es una metodologa que proporciona una manera simple de obtener una conclusin a partir de informacin de
entrada vaga, imprecisa, distorsionada o incompleta.
La lgica fuzzy est basada en la idea de que todas las cosas admiten grados (temperatura, velocidad, altura,
belleza). Todos los valores de sus objetos aparecen sobre una escala graduada: Carlos es un hombre alto, Luisa es
una linda chica.
Surgi como una herramienta importante para el control de sistemas y procesos industriales complejos, as como
tambin para la electrnica de entretenimiento y hogar, sistemas de diagnostico y otros sistemas expertos.
Logia difusa vs. Lgica tradicional o convencional
En la lgica clsica (binaria o booleana) se tiene solo dos estados posibles: verdadero o falso (1 o 0). En la lgica
difusa se asigna valores intermedios dentro de una escala a fin de cuantificar una incertidumbre (conjuntos).
La lgica difusa en comparacin con la lgica convencional permite trabajar con informacin que no es exacta para
poder definir evaluaciones convencionales, contrario con la lgica tradicional que permite trabajar con informacin
definida y precisa.
En qu situaciones es til aplicar la lgica difusa?

En procesos demasiados complejos

Cuando no existe un modelo de solucion simple o un modelo matemtico preciso.

Cuando se necesite usar el conocimiento de un experto que utiliza conceptos ambiguos o imprecisos.

Cuando ciertas partes de un sistema a controlar son desconocidas y no pueden medirse de forma
confiable.

Cuando el ajuste de una variable puede producir el desajuste de otras.


No es recomendable utilizar la lgica difusa cuando algn modelo matemtico ya soluciona eficientemente el
problema, cuando los problemas son lineales o cuando no tienen solucion.
Conjuntos difusos
La necesidad de trabajar con conjuntos difusos surge del hecho que existen conceptos que no tienen lmites claros.
Un conjunto difuso se encuentra asociado por un valor lingstico que est definido por una palabra, etiqueta
lingstica o adjetivo. En los conjuntos difusos la funcin de pertenencia puede tomar valores del intervalo entre 0 y
1, y la transicin del valor entre cero y uno es gradual y no cambia de manera instantnea como pasa con los
conjuntos clsicos. Un conjunto difuso en un universo de discurso puede definirse como:
A= {(x, uA (x))/x E U}
Donde:

uA (x) es la funcin de pertenencia de la variable x.


U es el universo de discurso.
Cuando mas este la pertenencia del conjunto A al valor de 1, mayor ser la pertenencia de la variable x al conjunto
A.

Variable lingstica: es una variable fuzzy. Por ejemplo, la sentencia Pablo es alto implica que la variable
lingstica Pablo toma el valor alto.
Operaciones en conjuntos difusos:
Complemento: el complemento de un conjunto es el opuesto a dicho conjunto. uA(x) = 1 - uA(x)
Contencin: un conjunto puede contener a otros conjuntos. El conjunto contenido se denomina subconjunto.
Interseccin: La interseccin fuzzy est dada por el menor grado de pertenencia en ambos conjuntos para cada
elemento.
Unin: en la unin de dos conjuntos fuzzy estamos interesados en el mayor valor de pertenencia a ambos
conjuntos.
Not A

Funcin Triangular
Definida mediante el lmite inferior a, el superior b y el valor modal m, tal que a<m<b. La funcin no tiene porqu
ser simtrica.

B
A

A
A

Complement

La funcin caracterstica del conjunto de los elementos que verifican un predicado clsico est perfectamente
determinada. No ocurre lo mismo cuando se intenta obtener la funcin de pertenencia de un conjunto formado por
los elementos que verifican un predicado borroso. Dicha funcin depender del contexto (o universo) en el que se
trabaje, del experto, del usuario, de la aplicacin a construir, etc.
A la hora de determinar una funcin de pertenencia, normalmente se eligen funciones sencillas, para que los
clculos no sean complicados. En particular, en aplicaciones en distintos entornos, son muy utilizadas las
triangulares y las trapezoidales:

Intersection

Containment

A
A

Funcin Trapezoidal
Definida por sus lmites inferior a, superior d, y los lmites de soporte inferior b y superior c, tal que a<b<c<d.
En este caso, si los valores de b y c son iguales, se obtiene una funcin triangular.

Union

Funciones de pertenencia (tambin denominada de membresia, transferencia)


La funcin de pertenencia de un conjunto nos indica el grado en que cada elemento de un universo dado, pertenece
a dicho conjunto. Es decir, la funcin de pertenencia de un conjunto A sobre un universo X ser de la forma:
A:X [0,1], donde A (x) = r ; r es el grado en que x pertenece a A.
Si el conjunto es ntido, su funcin de pertenencia (funcin caracterstica) tomar los valores en {0,1}, mientras que
si es borroso, los tomar en el intervalo [0,1]. Si A(x) = 0 el elemento no pertenece al conjunto, si A(x) = 1 el
elemento s pertenece totalmente al conjunto.
Las funciones de pertenencia son una forma de representar grficamente un conjunto borroso sobre un universo.
Adems de las funciones de tipo lineal anteriormente expuestas, tambin se usan las siguientes:

Funcin Gamma

Funcin Sigmoidal

Funcin Gaussiana

Funcin pseudo exponencial

Controlador difuso o sistema difuso


La lgica difusa se aplica principalmente en sistemas de control difuso que utilizan expresiones ambiguas para
formular reglas que controlen el sistema. Un sistema de control difuso trabaja de manera muy diferente a los
sistemas de control convencionales. Estos usan el conocimiento experto para generar una base de conocimientos
que dar al sistema la capacidad de tomar decisiones sobre ciertas acciones que se presentan en su funcionamiento.
Los sistemas de control difuso permiten describir un conjunto de reglas que utilizara una persona para controlar un
proceso y a partir de estas reglas generar acciones de control. El control difuso puede aplicarse tanto en sistemas
muy sencillos como en sistemas cuyos modelos matemticos sean muy complejos.
Los mas populares sistemas de lgica difusa que se encuentran son:
a) Sistemas difusos tipo Mamdani (con fuzzificador y defuzzificador).
b) Sistemas difusos tipo Takagi-Sugeno.
a) La estructura de un sistema difuso Mandani es la siguiente:

Fusificador (igual funcin que los de Mandani).


Inferencia (igual funcin que los de tipo mandani).
Base de reglas o base de conocimiento
Las reglas de la base de conocimiento de un sistema Sugeno es diferente a las de los sistemas Mamdani, el
consecuente de estas reglas ya no es una una etiqueta lingustica sino que es una funcin de la entrada que tiene el
sistema en un momento dado, esto se ilustra a continuacin:

En los sistemas difusos tipo Sugeno, los valores que arrojan los consecuentes de las diferentes reglas que se han
activado en un momento determinado ya son valores numricos por lo que no se necesita una etapa de
Defusificacin.
Definicin de reglas usando la matriz
Variables de entrada: Temperatura y humedad
Variable de salida: velocidad de un ventilador
La temperatura tendr 3 Term set (alta, media, baja)
La humedad tendr 2 Term set (alta, baja)
La velocidad del ventilador 3 Term set (rpido, medio, lento)
Temperatura\Humedad alta
baja

Fusificacin
La entrada de un sistema de lgica difusa tipo Mamdani normalmente es un valor numrico proveniente, por
ejemplo, de un sensor; para que este valor pueda ser procesado por el sistema difuso se hace necesario convertirlo
a un "lenguaje" que el mecanismos de infererencia pueda procesar. Esta es la funcin del fuzzificador, que toma los
valores numricos provenientes del exterior y los convierte en valores "difusos" que pueden ser procesados por el
mecanismo de inferencia. Estos valores difusos son los niveles de pertenencia de los valores de entrada a los
diferentes conjuntos difusos en los cuales se ha dividido el universo de discurso de las diferentes variables de
entrada al sistema.
Base de conocimiento o base de reglas
La base de reglas son la manera que tiene el sistema difuso de guardar el conocimiento lingstico que le permiten
resolver el problema para el cual ha sido diseado. Estas reglas son del tipo IF-THEN.
Una regla de la base de reglas o base de conocimiento tiene dos partes, el antecedente y el consecuente.

Inferencia
Teniendo los diferentes niveles de pertenencia arrojados por el fusificador, los mismos deben ser procesados para
generar una salida difusa. La tarea del sistema de inferencia es tomar los niveles de pertenencia y apoyado en la
base de reglas o base de conocimiento genera la salida del sistema difuso.
Defusificacin
La salida que genera el mecanismo de inferencia es una salida difusa, lo cual significa que no puede ser interpretada
por un elemento externo (por ejemplo un controlador) que solo manipule informacin numrica. Para lograr que la
salida del sistema difuso pueda ser interpretada por elementos que solo procesen informacin numrica, hay que
convertir la salida difusa del mecanismos de inferencia; este proceso lo realiza el defusificador.
b) Los sistemas difusos tipo Sugeno incluyen:

Baja

Lento

Lento

Media

Rpido

Medio

alta

Rpido

Rpido

Valores de la funcin de
pertenencia de entrada temp.

Valores de la funcin de
pertenencia de entrada
humed.

Valores de la funcin
de pertenencia de
salida
VelocidadVentilador.

Para calcular la cantidad de reglas a utilizar se debe multiplicar la cantidad de term set que tenga cada entrada. En
este caso 3 de temp. X 2 de humed. = 6 reglas.
Los valores de la funcin de pertenencia de salida no indican la cantidad de reglas, estos pueden repetirse. (mirar
color rosa)
4) Algoritmos Genticos
Algoritmos Genticos (permite optimizar la solucin, trabaja con tcnicas heursticas)
Algoritmos genticos: intentan emular la capacidad que tiene la naturaleza de evolucionar hacia individuos cada vez
ms aptos. Usan una analoga directa con el comportamiento natural. Trabajan con una poblacin de individuos,
cada uno representa una solucin factible a un problema dado. Cuanto mayor sea la adaptacin del individuo al
problema, mayor ser la posibilidad de que el mismo sea seleccionado para reproducirse, cruzando su material
gentico con otro individuo seleccionado de igual forma. Esta cruza producir nuevos individuos (descendientes de
los anteriores) los cuales compartirn algunas de las caractersticas de sus padres.

Seleccin de torneo: se eligen dos integrantes de la poblacin, se los compara y se determina un


ganador, que regresa a la poblacin de la que puede ser elegido nuevamente. El perdedor pasa a una
pila. Se repite hasta que no haya ms individuos en la poblacin y se elige al que est en el tope de la
pila como el ganador del torneo.

Seleccin Natural o Supervivencia del ms Apto: es un mecanismo de la naturaleza sobre todo los individuos de una
especie, por el cual el ms apto tiene ms posibilidades de sobrevivir y de propagar las cualidades genticas a sus
descendientes.

Seleccin Escalada: al incrementarse la aptitud media de la poblacin, la fuerza de la presin selectiva


tambin aumenta y la funcin de aptitud se hace ms discriminadora.

Conceptos Bsicos de Algoritmos Genticos

Seleccin por Rango: a cada individuo de la poblacin se le asigna un rango numrico basado en su
aptitud, y la seleccin se basa en este ranking, en lugar de las diferencias absolutas en aptitud.

De esta manera se produce una nueva poblacin de posibles soluciones, la cual reemplazar a la anterior y verifica
una interesante prioridad: contiene una mayor proporcin de buenas caractersticas en comparacin con la
poblacin anterior.

Cromosoma: es la representacin codificada de una posible solucin. Generalmente se usa la representacin como
cadenas de bits. Tambin se pueden usar punto flotante, cdigos alfabticos.
Gen: a cada posicin de la cadena se denomina gen y al valor dentro de esta posicin se le llama alelo.
Evaluacin de Adaptabilidad (fitness): a cada solucin (cromosoma) se le asigna un valor de adaptabilidad
dependiendo de qu tan bueno es el cromosoma solucionando el problema.

Operadores Genticos: Para efectuar los cambios pertinentes en la poblacin, se emplean los Operadores
Genticos:

Genotipo: conjunto de cromosomas.


Fenotipo:
Conceptos de Poblacin
Tamao de Poblacin: es el tamao idneo de la poblacin. En poblaciones pequeas se corre el riesgo de no cubrir
adecuadamente el espacio de bsqueda, mientras que en poblaciones de gran tamao puede acarrear problemas
relacionados con el excesivo costo computacional. El tamao optimo de la poblacin para cadenas de longitud m;
con codificacin binaria, crece exponencialmente con el tamao de la cadena. En evidencia empirica sugiere que el
tamao de la poblacin comprendida entre 1 y 21 es suficiente para atacar con xito los problemas con el
considerado.
Poblacin Inicial: debe contener cromosomas que estn bien dispersos por el espacio de soluciones. La poblacin
inicial se escoge generando cadenas al azar, pudiendo contener cada gen uno de los posibles valores del alfabeto
con probabilidad uniforme. En pocos casos la inicializacin se hace en forma no aleatoria, esto puede llegar a
acelerar la convergencia del algoritmo gentico; y esto pude llevar a una desventaja que la convergencia hacia
ptimos locales.

Funcin Objetivo: Llamamos as a la funcin que evala la adaptacin al medio de los individuos de la poblacin, y es
la que nos delimita el criterio a la hora de reproducir y seleccionar unos individuos de la poblacin en lugar de otros.
Seleccin Natural: Es el proceso que se lleva a cabo al final de cada generacin, y consiste en escoger un conjunto de
individuos de tamao N (igual al nmero de individuos de la poblacin inicial), que sern los individuos que
sobrevivan y pasen a la siguiente generacin.
Mecanismos para la Seleccin de Padres:

Elitismo: se toman los organismos con los valores ms altos de adaptacin.

De Estado Estable: desecha los menos adaptados.

Seleccin de la Ruleta: se debe pensar en una ruleta, cada organismo tendr un segmento de la ruleta, su
tamao depender de su adaptacin. La ruleta gira y al detenerse sealar un organismo.

Reproduccin: Se trata de simular la reproduccin de dos individuos de la poblacin, obteniendo como


resultado un nuevo individuo intermedio entre sus dos progenitores.
Cruce: Se trata de generar un nuevo individuo como resultado del cruce de dos individuos originales,
dividiendo en un cierto punto el cdigo gentico de stos y siendo el nuevo individuo el resultado de
concatenar la primera parte del cdigo gentico del primer original con la segunda parte del cdigo del
segundo original.
Punto Sencillo (Cruce Bsico): se selecciona una posicin al azar en el cromosoma. Se toma el
primer padre de los genes que van desde el inicio a la posicin y se colocan en el hijo, luego se
toman los genes que van desde la posicin hasta el final del cromosoma del segundo padre y
se colocan en el hijo, de esta forma el hijo tiene informacin gentica de ambos padres.
Dos Puntos: se seleccionan dos puntos al azar dentro del cromosoma. El padre 1 pone sus
genes desde el inicio del cromosoma hasta la primera posicin y desde la segunda posicin
hasta el fin del cromosoma el segundo padre coloca sus cromosomas entre las dos posiciones.
Mltiples Puntos (Cruce Multipunto): se selecciona al azar cual es el padre que aporta
informacin gentica para un gen en particular.
Cruce Segmentado: existe una probabilidad de que un cromosoma sea un punto de cruce.
Conforme se va formando la nueva cadena, para cada gen, se verifica si ah se va a producir el
cruce.
Cruce Uniforme: para cada gen de la cadena del descendiente existe una probabilidad de que
el gen pertenezca al padre, y la otra de que pertenezca a la madre. Esta tcnica permite un
intercambio de los bloques en una manera que es independiente del orden que la
codificacin impuso a cada uno dentro del cromosoma.
Mutacin: Se trata de producir una leve modificacin en el cdigo gentico de un individuo, con vistas a
diversificar la poblacin, y a la salida de un eventual estado estable en el cul la similitud de todos los
individuos corten en gran medida la evolucin hacia individuos con mayor funcin objetivo. Se
recomienda un porcentaje del 2%.
De un Punto: se muta un solo gen por vez.
Multipunto: se mutan varios genes a la vez.
Global: mutan todos los genes del individuo.
Reemplazo: la reinsercin de hijos consiste en incorporar los nuevos cromosomas en la poblacin. Los
mtodos de reemplazo son:
Se generan tantos cromosomas como elementos en la poblacin: (reinsercin pura)
consiste en generar mediante la reproduccin tantos hijos como elementos existen en la
poblacin, reemplazar todos los cromosomas de la generacin anterior por los nuevos. Cada
cromosoma vive exactamente una generacin. Un inconveniente es que se puede reemplazar
buenas soluciones por soluciones de menor calidad.
Se generan ms cromosomas que elementos en la poblacin: se eligen los mejores
cromosomas entre los generados, y se eliminan los cromosomas sobrantes. Luego se
reemplaza la poblacin completa por la nueva generacin.

Se generan menos cromosomas que elementos en la poblacin: selecciona entre los


cromosomas de la poblacin aquellos que se eliminaran.
Insercin Uniforme: los cromosomas a ser reemplazados se eligen al azar entre los
miembros de la poblacin.
Insercin Elitista: se eligen los cromosomas menos aptos para ser reemplazados.
Insercin por Torneo: se utiliza en combinacin con el mtodo de seleccin por
torneo.

Asociadas a los operadores genticos de cruce y mutacin existen:

La probabilidad de cruce: Pc.


La probabilidad de mutacin: Pm (2%)

La primera es la probabilidad de aplicar el operador de cruce sobre parejas de cadenas de "ADN" obtenidas en la
reproduccin; la segunda es la probabilidad de aplicar el operador de mutacin sobre los caracteres de la cadena.
Seudocdigo de un Algoritmo Gentico
Procedimiento Algoritmo Gentico
Inicializar poblacin P(0)
Evaluar poblacin inicial
Mientras no se cumpla la condicin de parada, para cada generacin t, hacer:
Seleccionar la poblacin P(t) desde P(t-1)
Recombinar P(t)
Evaluar P(t)
Fin Mientras
Fin Procedimiento
Criterios de Terminacin del Algoritmo: es el encargado de definir el momento en el cual debe detenerse el ciclo de
evolucin y adoptar el cromosoma ms apto como la solucin encontrada.

Criterio de Convergencia de Identidad: consiste en detener al algoritmo gentico cuando un determinado


porcentaje de los cromosomas representan a la misma solucin.
Criterio de Convergencia de Aptitud: puede suceder que existan soluciones equivalentes o cuasi
equivalentes a un problema, que obtenga valores de aptitud similares. Este criterio finaliza la ejecucin
cuando los valores de aptitud de un determinado porcentaje de las soluciones son iguales, o difieren en u
pequeo porcentaje.
Criterio de Cantidad de Generaciones: consiste en finalizar la ejecucin una vez que ha transcurrido un
nmero determinado de generaciones. Este mtodo permite determinar con precisin los tiempos de
ejecucin del algoritmo a costa de detener la evolucin sin la certeza de que las soluciones no seguirn
mejorando.

5) Redes Neuronales
Las redes neuronales son una forma de emular ciertas caractersticas propias de los humanos, como la capacidad de
memorizar y de asociar hechos.

Es un modelo artificial y simplificado del cerebro humano, sistema que es capaz de adquirir conocimiento a travs
de la experiencia. Una red neuronal es un nuevo sistema para el tratamiento de la informacin, cuya unidad bsica
de procesamiento est inspirada en la clula fundamental del sistema nervioso humano: la neurona.
Mas definiciones de red neuronal:
1) Una nueva forma de computacin, inspirada en modelos biolgicos.
2) Un modelo matemtico compuesto por un gran nmero de elementos procesales organizados en niveles.
3) Un sistema de computacin compuesto por un gran nmero de elementos simples, elementos de procesos muy
interconectados, los cuales procesan informacin por medio de su estado dinmico como respuesta a entradas
externas.
4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples
(usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos del mundo
real del mismo modo que lo hace el sistema nervioso biolgico.
Aprendizaje significa que aquellos problemas que inicialmente no pueden resolverse, pueden ser resueltos despus
de obtener ms informacin acerca del problema.
Por lo tanto, las Redes Neuronales:
Consisten de unidades de procesamiento que intercambian datos o informacin.
Se utilizan para reconocer patrones, incluyendo imgenes, manuscritos y secuencias de tiempo,
tendencias financieras.
Tienen capacidad de aprender y mejorar su funcionamiento.
Las RNA presentan un gran nmero de caractersticas semejantes a las del cerebro. Por ejemplo, son capaces de
aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer caractersticas esenciales
a partir de entradas que representan informacin irrelevante, etc. Esto hace que ofrezcan numerosas ventajas:
Aprendizaje Adaptativo: capacidad de aprender a realizar tareas basadas en un entrenamiento o en una
experiencia inicial.
Auto-organizacin: una red neuronal puede crear su propia organizacin o representacin de la
informacin que recibe mediante una etapa de aprendizaje.
Tolerancia a fallos: la destruccin parcial de una red conduce a una degradacin de su estructura; sin
embargo, algunas capacidades de la red se pueden retener, incluso sufriendo un gran dao.
Operacin en tiempo real: los cmputos neuronales pueden ser realizados en paralelo; para esto se
disean y fabrican mquinas con hardware especial para obtener esta capacidad.
Fcil insercin dentro de la tecnologa existente: se pueden obtener chips especializados para redes
neuronales que mejoran su capacidad en ciertas tareas. Ello facilitar la integracin modular en los
sistemas existentes.
El conocimiento es adquirido por la red a travs de un proceso que se denomina aprendizaje.
El conocimiento se almacena mediante la modificacin de la fuerza o peso sinptico de las distintas uniones entre
neuronas.(la informacin se guarda en los pesos)
Estructura histolgica
Las dendritas (entradas), son la va de entrada de las seales que se combinan en el cuerpo de la neurona. De
alguna manera la neurona elabora una seal de salida a partir de ellas.
El axn (salidas), es el camino de salida de la seal generada por la neurona. Una neurona enva su salida a otras
por su axn.
Las sinapsis (pesos), conexin entre una neurona y otra (Interaccin). En las terminaciones de las sinapsis se
encuentran unas vescula que contienen unas sustancias qumicas llamadas neurotransmisores, que ayudan a la
propagacin de las seales electroqumicas de una neurona a otra.

Capa de entrada: las neuronas reciben estmulos externos relacionados con el aparato sensorial, que
tomarn la informacin de entrada.
Capa oculta: Dicha informacin se transmite a ciertos elementos internos que se ocupan de su
procesamiento. Es en las sinapsis y neuronas correspondientes a esta capa donde se genera cualquier
tipo de representacin interna de informacin. Como no tienen relacin directa con la informacin de
entrada ni con la salida, estos elementos se denominan unidades ocultas.
Capa de salida: Una vez finalizado el perodo de procesado, la informacin llega a las unidades de salida,
cuya misin es dar la respuesta al sistema.

Lo que bsicamente ocurre en una neurona biolgica es lo siguiente: la neurona es estimulada o excitada a travs
de sus entradas (inputs) y cuando se alcanza un cierto umbral, la neurona se dispara o activa, pasando una seal
hacia el axn. La neurona recoge las seales por su sinapsis sumando todas las influencias excitadoras e inhibidoras.
Si las influencias excitadoras positivas dominan, entonces la neurona da una seal positiva y manda este mensaje a
otras neuronas por sus sinapsis de salida.
Capa: conjunto de neuronas cuyas entradas provienen de la misma fuente, y cuyas salidas se dirigen a un mismo
destino.
Los datos ingresan por medio de la capa de entrada, pasan a travs de la capa oculta y salen por la capa de
salida. Cabe mencionar que la capa oculta puede estar constituida por varias capas.
En una red neuronal cada neurona recibe una serie de entradas a travs de interconexiones y emite una salida. Esta
salida viene dada por tres funciones:
1. Una funcin de propagacin (tambin funcin de red) tambin conocida como funcin de excitacin que
por lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su interconexin o
sinapsis. Si el peso es positivo, la conexin se denomina excitatoria; si es negativo, se denomina
inhibitoria.
2. Una funcin de activacin, que modifica a la anterior y es el valor que la neurona recibe para activarse.
Puede no existir, siendo en este caso la salida la misma funcin de propagacin.
3. Una funcin de transferencia, que se aplica al valor devuelto por la funcin de activacin. Se utiliza para
acotar la salida de la neurona y generalmente viene dada por la interpretacin que queramos darle a
dichas salidas. Algunas de las ms utilizadas son la funcin sigmoidea (para obtener valores en el
intervalo [0,1]) y la tangente hiperblica (para obtener valores en el intervalo [-1,1]). Existen cuatro
funciones de transferencia tpicas que determinan distintos tipos de neuronas:
o
Funcin escaln
o
Funcin lineal y mixta
o
Sigmoidal
o
Funcin gaussiana

Clasificacin de las redes neuronales

Tipos de capas

Clasificacin segn su topologa o arquitectura de la red, podemos distinguir como caracterstica de


una red, el nmero de capas (monocapa o multicapa), el tipo de las capas, (ocultas o visibles, de
entrada o de salida) y la direccionalidad de las conexiones de las neuronas.
Clasificacin segn su algoritmo de aprendizaje, como la red aprende los patrones, (supervisada, no
supervisada, competitiva o por refuerzo).

Formas de Conexin entre neuronas

Los tipos de conexiones entre neuronas que consideraremos pueden clasificarse en:

o
o
o
o

Conexiones feedforward (propagacin hacia adelante): conectan neuronas de una capa con
neuronas de capas ms alejadas de la capa de entrada.
Conexiones feedback(propagacin hacia atras): inversas a las definidas previamente.
Conexiones laterales: conectan neuronas de una misma capa.
Conexiones autoenlazadas: conectan una neurona consigo mismo.

Caractersticas de las Redes Neuronales


Existen cuatro elementos que caracterizan una red neuronal: su topologa, el mecanismo de aprendizaje, tipo de
asociacin realizada ente la informacin de entrada y salida y la forma de representacin de estas informaciones.
En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.

RN monocapa y multicapa

Redes con aprendizaje no supervisado

En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.

Las redes con dicho aprendizaje no requieren de influencia externa para ajustar los pesos de las conexiones entre
sus neuronas. La red no recibe ninguna informacin por parte del entorno que le indique si la salida generada en
respuesta de una entrada es o no correcta. Suele decirse que estas redes son capaces de auto organizarse.
Suelen considerarse dos algoritmos de aprendizaje no supervisado:
a) Aprendizaje hebbiano
b) Aprendizaje competitivo y cooperativo: las neuronas compiten (y cooperan) unas con otras con el fin de
llevar a cabo una tarea dada.
Redes Neuronales de Kohonen
Modelo de red neuronal con capacidad para formar mapas de caractersticas de manera similar a como ocurre en el
cerebro.

a)

b)

Monocapa: En las redes monocapa se establecen conexiones laterales entre las neuronas que
pertenecen a la nica capa de la red. Adems pueden existir conexiones auto recurrente.
Las redes monocapa se utilizan tpicamente en tareas relacionadas con lo que se conoce como auto
asociacin, por ejemplo para regenerar informaciones de entrada que se presentan distorsionadas o
incompletas.
Multicapas: Son aquellas que disponen las neuronas agrupadas en varias capas. Una las forma para
distinguir la capa a la que pertenece una neurona, consistira en fijarse en el origen de las seales que
recibe a la entrada y el destino de la seal de salida.

Mecanismo de aprendizaje (supervisado y no supervisado)

Redes con aprendizaje supervisado


El proceso de aprendizaje se realiza mediante un entrenamiento controlado por un agente externo (supervisor o
maestro) que determina la respuesta que debera generar la red a partir de una entrada determinada. El supervisor
comprueba la salida de la red y en caso de que sta no coincida con la deseada, se proceder a modificar los pesos
de las conexiones, con el fin de que la salida obtenida se aproxime a la deseada.
Se suelen considerar tres formas de llevar a cabo el aprendizaje:
a) Aprendizaje por correccin de error
b) Aprendizaje por refuerzo
c)
Aprendizaje estocstico.

Este modelo tiene dos variantes, denominadas LVQ (Learning Vector Quantization) y TPM (Topology-Preserving
Map) o SOM (Self-Organizating Map). Ambas se basan en el principio de formacin de mapas topolgicos para
establecer caractersticas comunes entre las informaciones (vectores) de entrada a la red, aunque difieren en las
dimensiones de stos, siendo de una sola dimensin en el caso de LVQ, y bidimensional, e incluso tridimensional,
en la red TPM.
Caractersticas
Pertenece a la categora de las redes competitivas o mapas de auto-organizacin (SOM), es decir, con aprendizaje
no supervisado de tipo competitivo, funciones de activacin lineales y flujo de informacin unidireccional (son redes
en cascada).
No existe ningn maestro externo que indique si la red neuronal est operando correcta o incorrectamente.
Arquitectura
Poseen una arquitectura de dos capas (una de entrada, una de salida) y una sola capa de conexiones.

a) Aprendizaje por correccin de error


Consiste en ajustar los pesos de las conexiones de la red en funcin de la diferencia entre los valores deseados y los
obtenidos en la salida de la red; es decir, en funcin del error cometido en la salida.
Una regla o algoritmo simple podra ser el siguiente:

b) Aprendizaje por refuerzo


Es un aprendizaje ms lento que el anterior, que se basa en la idea de no disponer de un ejemplo completo del
comportamiento deseado; es decir, de no indicar durante el entrenamiento exactamente la salida que se desea que
proporcione la red ante una determinada entrada.
En el aprendizaje por refuerzo la funcin del supervisor se reduce a indicar mediante una seal de refuerzo si la
salida obtenida en la red se ajusta a la deseada (xito = +1 o fracaso = -1), y en funcin de ello se ajustan los pesos
basndose en un mecanismo de probabilidades.
c) Aprendizaje estocstico
Este tipo de aprendizaje consiste bsicamente en realizar cambios aleatorios en los valores de los pesos de las
conexiones de la red y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidad.

En la versin LVQ no existen conexiones hacia atrs. Existen N neuronas de entrada y M neuronas de salida.
Cada una de las N neuronas de entradas se conecta hacia las M neuronas de salidas a travs de conexiones hacia
adelante (feedfoward).
Entre las neuronas de la capa de salida, puede decirse que existen conexiones laterales de inhibicin (peso negativo)
implcitas, pues aunque no estn conectadas, cada una de las neuronas va a tener cierta influencia sobre sus
vecinas. El valor que se asigne a los pesos de las conexiones hacia adelante entre las capas de entrada y salida (Wji)
durante el proceso de aprendizaje de la red va a depender precisamente de esta interaccin lateral.
La influencia que una neurona ejerce sobre las dems es funcin de la distancia entre ellas, siendo muy pequeas
cuando estn muy alejadas.
Por otra parte, la versin del modelo denominado TPM (Topology Preserving Map) trata de establecer una
correspondencia entre los datos de entrada y un espacio bidimensional de salida, creando mapas topolgicos de
dos dimensiones, de tal forma que ante datos de entrada con caractersticas comunes se deben activar neuronas
situadas en prximas zonas de la capa de salida.

Aprendizaje
El aprendizaje en el modelo de Kohonen es de tipo Off-line, por lo que se distingue una etapa de aprendizaje y otra
de funcionamiento. En la etapa de aprendizaje se fijan los valores de las conexiones (feedforward) entre la capa de
entrada y la salida. Esta red utiliza un aprendizaje no supervisado de tipo competitivo, las neuronas de la capa de
salida compiten por activarse y slo una de ellas permanece activa ante una determinada informacin de entrada a
la red, los pesos de las conexiones se ajustan en funcin de la neurona que haya resultado vencedora.
Durante la etapa de entrenamiento, se presenta a la red un conjunto de informaciones de entrada (vectores de
entrenamiento) para que sta establezca en funcin de la semejanza entre los datos las diferentes categoras (una
por neurona de salida), que serviran durante la fase de funcionamiento para realizar clasificaciones de nuevos
datos que se presenten a la red. Los valores finales de los pesos de las conexiones entre cada neurona de la capa de
salida con las de entrada se correspondern con los valores de los componentes del vector de aprendizaje que
consigue activar la neurona correspondiente. En el caso de existir ms patrones de entrenamiento que neuronas de
salida, ms de uno deber asociarse con la misma neurona, es decir pertenecern a la misma clase.
En este modelo el aprendizaje no concluye despus de presentarle una vez todos los patrones de entrada, sino que
habr que repetir el proceso varas veces para refinar el mapa topolgico de salida, de tal forma que cuantas ms
veces se presenten los datos, tanto ms se reducirn las zonas de neuronas que se deben activar ante entradas
parecidas, consiguiendo que la red pueda realizar una clasificacin mas selectiva.
Un concepto muy importante en la red de Kohonen es la zona de vecindad, o vecindario alrededor de la neurona
vencedorai*, los pesos de las neuronas que se encuentren en esta zona a la que se le dar el nombre de X(q), sern
actualizados junto con el peso de la neurona ganadora, en un ejemplo de aprendizaje cooperativo.
El algoritmo de aprendizaje utilizado para establecer los valores de los pesos de las conexiones entre las N neuronas
de entrada y las M de salida es el siguiente:
1. En primer lugar se inicializan los pesos (wij) con valores aleatorios pequeos y se fija la zona inicial de
vecindad entre las neuronas de salida.
2. A continuacin se presenta a la red una informacin de entrada (la que debe aprender) en forma de
vector p = (p1, p2, ..., pn), cuyas componentes pisern valores continuos.
3. Puesto que se trata de un aprendizaje competitivo, se determina la neurona vencedora de la capa de
salida, esta ser aquella cuyo vector de pesos wi(vector cuyas componentes son los valores de los pesos
de las conexiones entre esa neurona y cada una de las neuronas de la capa de entrada) sea el ms
parecido a la informacin de entrada p(patrn o vector de entrada). Para ello se calculan las distancias o
diferencias entre ambos vectores, considerando una por una todas las neuronas de salida, suele
utilizarse la distancia eucldea o la siguiente expresin que es similar a aquella, pero eliminando la raz
cuadrada:

El tamao deX(q)se puede reducir en cada iteracin del proceso de ajuste de los pesos, con lo que el conjunto de
neuronas que pueden considerarse vecinas cada vez es menor como se observa en la figura 2.5.2, sin embargo en la
prctica es habitual considerar una zona fija en todo el proceso de entrenamiento de la red.
El trmino a(q)es el coeficiente de aprendizaje o parmetro de ganancia, con un valor entre 0 y 1 el cual decrece con
el nmero de iteraciones(q) del proceso de entrenamiento, de tal forma que cuando se ha presentado un gran
nmero de veces todo el juego de patrones de aprendizaje su valor es prcticamente nulo, con lo que la
modificacin de los pesos es insignificante.
Para hallar

suele utilizarse una de las siguientes expresiones [20]:

Siendo a1 un valor de 0.1 0.2 y a2 un valor prximo al nmero total de iteraciones del aprendizaje, que por lo
general se toma como 10000 para esta red.
5. El proceso debe repetirse, volviendo a presentar todo el juego de patrones de aprendizaje p1,
p2..,pn hasta obtener la salida deseada.
REDES BACKPROPAGATION
El mtodo de back-propagation (o entrenamiento hacia atrs) es un sistema automtico de entrenamiento de redes
neuronales con capas ocultas.
En una red Backpropagation existe una capa de entrada con n neuronas y una capa de salida con m neuronas y al
menos una capa oculta de neuronas internas. Cada neurona de una capa (excepto las de entrada) recibe entradas
de todas las neuronas de la capa anterior y enva su salida a todas las neuronas de la capa posterior (excepto las de
salida). No hay conexiones hacia atrs feedback ni laterales entre las neuronas de la misma capa.
Consiste en un aprendizaje de un conjunto predefinido de pares de entradas-salidas dado como ejemplo,
empleando un ciclo de propagacin-adaptacin de dos fases.

pj: Componente i-simo del vector de entrada


wij: Peso de la conexin entre la neurona j de la capa de entrada y la neurona i de la capa de salida.

4.

Una vez localizada la neurona vencedora (i*), se actualizan los pesos de las conexiones entre las
neuronas de entrada y dicha neurona, as como los de las conexiones entre las de entrada y las neuronas
vecinas de la vencedora, en realidad lo que se consigue con esto es asociar la informacin de entrada con
una cierta zona de la capa de salida. Esto se realiza mediante la siguiente ecuacin

Fases
Primero (hacia adelante): se aplica un patrn de entrada como estmulo para la primera capa de las neuronas de la
red, se va propagando a travs de todas las capas superiores hasta generar una salida. Despus se compara el
resultado obteniendo en las neuronas de salida que se desea obtener y se calcula un valor del error para cada
neurona de salida.
Segundo (hacia atrs): estos errores se transmiten hacia atrs, partiendo de la capa de salida, hacia todas las
neuronas de la capa intermedia que contribuyan directamente a la salida, recibiendo el porcentaje de error
aproximado a la particin de la neurona intermedia en la salida original. Se pasa a la capa anterior con una
retropopagacin del error, ajustando los pesos y continuando con este proceso hasta llegar a la primera capa.
Importancia

La importancia de este algoritmo consiste en su capacidad de auto adaptar los pesos de las neuronas de las capas
intermedias para aprender la relacin que existe entre un conjunto de patrones dados como ejemplo y sus salidas
correspondientes.

Realizar un cambio en el nmero de neuronas ocultas.

Volver a empezar con un conjunto distinto de pesos.


El algoritmo en general funciona de esta manera:

Generalizacin
Ya entrenada la red se podr aplicar esa misma relacin (terminado el entrenamiento), a nuevos vectores de
entrada con ruido o incompletos, dando una salida activa si la nueva entrada es parecida a las presentadas durante
el aprendizaje.
Regla Delta de Generalizada
Se usa en redes con capas intermedias con conexiones hacia adelante y cuyas clulas tienen funciones de activacin
continuas. Estas funciones continuas son no decrecientes y derivables (la funcin sigmoidal pertenece a este tipo de
funciones).
Superficie de Error
El algoritmo utiliza una superficie de error asociada a la red, buscando el estado de mnimo error a travs del
camino descendiente de la superficie del error.
En este tipo de redes, el problema a la hora de entrenarlas estriba en que slo conocemos la salida de la red y
la entrada, de forma que no se pueden ajustar los pesos sinpticos asociados a las neuronas de las capas ocultas, ya
que no podemos inferir a partir del estado de la capa de salida como tiene que ser el estado de las capas ocultas.
El sistema de entrenamiento mediante back-propagation consiste en:

Empezar con unos pesos sinpticos cualquiera (generalmente elegidos al azar).

Dejar que la red genere un vector de datos de salida (propagacin hacia delante).

El error se propaga hacia atrs (back-propagation), hacia la capa de neuronas anterior, y se usa para
ajustar los pesos sinpticos en esta capa.

Se continua propagando el error hacia atrs y ajustando los pesos hasta que se alcance la capa de
entradas.

Introducir unos datos de entrada (en la capa de entradas) elegidos al azar entre los datos de entrada que
se van a usar para el entrenamiento.
Comparar la salida generada por la red con la salida deseada.
La diferencia obtenida entre la salida generada y la deseada (denominada error) se usa para ajustar los
pesos sinpticos de las neuronas de la capa de salidas.

Este proceso se repetir con los diferentes datos de entrenamiento.


Estructura y Aprendizaje
1) capa de entrada con n neuronas.
2) Capa de salida con m neuronas.
3) Al menos una capa oculta de neuronas.
Cada neurona de una capa recibe entradas de todas las neuronas de la capa anterior y enva su salida a todas las
neuronas de la capa posterior. No hay conexiones hacia atrs ni laterales entre neuronas de la misma capa.
Control de Convergencia

La velocidad de aprendizaje se controla mediante . Normalmente, debe ser un nmero entre 0.05 y
0.25.
Velocidad de Convergencia

El valor de se aumenta a medida que disminuye el error.

Aadir un momento (sumar una fraccin del ajuste de peso anterior al ajuste actual).
Si una red deja de aprender:

10

Es difcil encontrar el mejor conjunto de pesos sinpticos para la red de manera que la eficiencia sea mxima.
Esto se debe a que la funcin que mide la eficiencia de las redes con capas ocultas, en la mayora de los casos, es
una funcin compleja que presenta muchos mnimos locales. Y el mejor conjunto de pesos sinpticos es aquel que
hace que la funcin alcance un mnimo global.

Visto en Clases: (cada neurona de una capa se conecta con todas las neuronas de la capa siguiente conexin
feedforward)

Paso 6 Repetir hasta que el error entre en el rango deseado.


Sus inconvenientes son:
-El algoritmo de entrenamiento: lentitud, mnimos locales,...
-No sabemos por qu hace lo que hace
-Encontrar la red ptima es un trabajo de prueba y error

Sistemas Expertos
Definicin: Software que intenta trabajar como si fuera un experto en alguna clase particular de conocimiento y
utilizar el tipo de reglas que el experto humano usara para resolver el problema
Caractersticas de los sistemas expertos:

La informacin queda guardada en los pesos ; en la etapa inicial se los elige aleatoriamente entre 0<1 y luego
se propaga la variacin de los pesos.
Cada componete va a tener un error
Para la capa oculta:
Donde
Entonces:

Consiste en representar el conocimiento humano en un rea en particular


Sirve para personas que no tienen un experto cerca y tambin a ste de apoyo.
Realizan algn tipo procesamiento sobre el saber para llegar al resultado deseado.
Poseen conocimientos declarativos y procesales

Partes de los Sistemas Expertos

Paso 1 Inicializar los pesos de la red con valores pequeos aleatorios.


Paso 2 Presentar un patrn de entrada y especificar la salida deseada que debe generar la red.
Paso 3 Calcular la funcin de activacin en todas las capas.
a) Calcular para la capa de entrada (Input): se calcula 4 veces, una vez por cada neurona

b)

Calcular para la capa oculta se calcula 2 veces por esta capa tiene 2 neuronas:

c)

Calcular para la capa de salida se calcula 8 veces:

Paso 4 Calcular los errores


a) Calcular los errores en la capa de salida:
Definicin de las Partes
b)

Calcular los errores para la capa oculta:

c)

Calcular los errores para la capa Input (entrada):

Paso 5 Calcular los nuevos pesos


a) Para la capa de salida:

11

b)

Para la capa oculta:

c)

Para la capa Input:

Base de Conocimientos: Conjunto de reglas que el experto humano puede dar sobre un rea un
particular.
Base de Hechos: Guarda las variables necesarias para contener los valores con los que trabaja el sistema.
Motor de Inferencia: Determina cmo se van a usar las reglas de la base de conocimientos accediendo y
ejecutndolas.
Interfaz Experto: Interfaz por la cual el experto carga las reglas en la base de conocimientos.
Interfaz Usuario: Interfaz que interacta con el usuario del sistema.

Pasos para Crear un Sistema Experto


Caracterticas de los Sistemas Expertos segn Bruce G. Buchaman y Edgard H. Shortlife

Utilidad
Usabilidad
Educatividad
Responsivos
Explicativo
Aprendizaje
Fcil de Modificar

El orden es importante, pero tal vez se deba regresar a etapas anteriores si se descubren fallas en algn paso.
Diapositivas de clases

Inferencia: Es la capacidad del sistema para deducir por si solo y obtener el valor de una variable sin haber
preguntado explcitamente al usuario. Es el proceso por el cual el sistema experto reconoce qu regla aplicar.

Los procesos mentales humanos son internos y muy complejos para representarse mediante algoritmos. A pesar de
ello, la mayora de los expertos son capaces de expresar sus conocimientos en la forma de reglas de tipo IF-THEN

Metodologas de Inferencia

THEN

Se conoce el objetivo, y se deben seleccionar las reglas que, al dispararse, lleven a l.

IF
La luz de trfico est en verde
THEN
la accin es cruzar
IF
La luz de trfico est en rojo
la accin es detenerse

El trmino regla en AI, el tipo de representacin mas utilizada para representar el conocimiento, puede
definirse como una estructura de tipo IF-THEN que relaciona informacin o hechos conocidos en su parte IF con
acciones en la parte THEN. Un conjunto de reglas provee descripcin acerca de cmo solucionar un problema. Las
reglas son relativamente simples de crear y comprender.
Toda regla est conformada por dos partes: la parte IF denominada antecedente o condicin y la parte THEN
nombrada como consecuente, conclusin o accin.
Una regla puede tener antecedentes mltiples unidos por nexos lgicos tales como AND (conjuncin) o OR
(disyuncin) o combinaciones de ambas.
IF <antecedente> THEN <consecuente>
IF a AND b AND z THEN <consecuente>
IF a OR b OR z THEN <consecuente>
El antecedente de una regla incorpora dos partes: un objeto (objeto lingstico) y su valor. El objeto y su valor
esta relacionado mediante un operador. Este operador identifica al objeto y le asigna un valor. Los operadores
tpicos IS, ARE, IS NOT, ARE NOT se utilizan para asignar valores simblicos a un objeto lingstico.
Los Sistemas Expertos tambin pueden utilizar operadores matemticos para definir un objeto como numrico
y asignar un valor tambin numrico.

12

IF edad del consumidor < 18


AND
retiro de dinero > 1000
THEN
se requiere la firma de uno de los padres

El experto en el dominio es una persona con los conocimientos y la experiencia suficiente para permitirle
resolver problemas en un rea especfica. Esta experiencia debe capturarse en el Sistema Experto a
desarrollar. Entonces este experto debe tener la habilidad de comunicar su conocimiento, estar
dispuesto a participar en el desarrollo del proyecto del Sistema Experto y entregar una cantidad
sustancial de tiempo al mismo. El experto en el dominio es la persona mas importante en el equipo de
desarrollo del proyecto.

El Ingeniero de Conocimiento (Knowledge Engineer) es una persona capacitada para disear construir y
comprobar un Sistema Experto. Se encarga de entrevistar al experto en el dominio para delimitar el
problema a resolver. El Ingeniero de Conocimiento establece los mtodos de razonamiento que el
experto utiliza para resolver un problema, usando hechos y reglas y decidiendo como representarlos en
un sistema experto. Despus es su tarea elegir un software apropiado para el desarrollo o un shell de
sistema experto o un lenguaje de programacin apropiado para codificar el conocimiento. Finalmente, es
responsable de las comprobaciones, revisiones y la integracin del sistema experto a un sistema
productivo.

El programador es la persona responsable de la codificacin eficiente que describa el dominio de


conocimiento en trminos computacionales. Debe tener experiencia en programacin simblica en
lenguajes propios de la AI como LISP, Prolog o OPS5 y tambin conocimientos suficientes en la aplicacin
de cascaras de Sistemas Expertos (quizs CLIPS). En adicin, el programador debe tener conocimientos
de programacin convencional en lenguajes como Java, C, C++ o Basic.

El gerente del proyecto (project manager) es el lder del Grupo de Desarrollo del Sistema Experto.
Responsable de hacer funcionar todo. Debe preocuparse del cumplimiento de metas, interactuar con el
experto y dems participantes del grupo de desarrollo, poniendo especial cuidado con el usuario final.
El usuario final (end-user) , o usuario,, es la persona que utilizar el Sistema Experto desarrollado, no solo
debe confiar en su capacidad de resolver problemas, sino que debe sentirse confortable en su uso.
Resulta as que el diseo de una interfase amigable y sencilla de aprender sea vital para el xito del
proyecto: la contribucin del usuario es crucial en este punto.

Las reglas pueden representar relaciones, recomendaciones, directivas, estrategias y heursticas:


Relacin
IF
THEN

el tanque de combustible est vaco


el auto no funciona

Recomendacin
IF estamos en otoo AND el cielo est nublado AND el
THEN
el consejo es llevar paraguas

pronstico es lloviznas

Directiva
IF el auto no anda AND el tanque de combustible est vaco
THEN
la accin es cargar combustible
Estrategia
IF
el auto no anda
THEN
la accin es revisar el nivel de combustible;
PASO 1: cumplido
IF
PASO 1 cumplido AND hay combustible en el tanque
THEN
la accin es comprobar la batera;
PASO 2: cumplido

Heuristica
IF
el derrame es lquido AND el derrame tiene un PH < 6 AND el derrame huele a vinagre
THEN
el derrame es cido actico
Integrantes principales en un equipo de desarrollo

Existen cinco miembros en un equipo de desarrollo de un sistema experto: el experto en el dominio, el


ingeniero de conocimiento, el programador, el gerente del proyecto y el usuario final.
El xito del sistema experto desarrollado depende completamente en la coordinacin de esfuerzos y del
tiempo dedicado.
Expert System
Development Team

A comienzos de los 70, Newell y Simon de la Carnegie-Mellon University propusieron un modelo para sistemas de
produccin, cimentando los Sistemas Expertos modernos basados en reglas.
Este modelo est basado en la idea que los humanos resuelven sus problemas aplicando sus conocimientos
(expresados como reglas de produccin) sobre un determinado problema representado por informacin especfica
del problema.
Las reglas de produccin estn almacenadas en una memoria de largo-plazo y la informacin especfica del
problema o hechos yacen en la memoria de corto- plazo.
Long-term Memory

Short-term Memory

Project Manager
Production Rule

Fact

REASONING

Domain Expert

Knowledge Engineer

Programmer
Conclusion

Expert System

End-user

La Base de Conocimientos (Knowledge Base: KB) contiene el conocimiento til del dominio para resolver
problemas. En un Sistema Experto Basado en Reglas, el conocimiento se representa mediante reglas. Cada
regla especifica una relacin, recomendacin, directiva, estrategia o heurstica. Compuesta por dos
estructuras: IF (condicin) y THEN (accin). Cuando se satisface la <condicin>, decimos que la regla se dispara
y se ejecuta la <accin>
La Base de Datos (Data Base: DB) incluye un conjunto de hechos utilizados en la parte de <condicin> de la KB.
El Motor de Inferencia (Inference Engine) se encarga del razonamiento mediante el que el experto alcanza una
solucin. Realiza el enlace de las reglas en la KB con los hechos provistos por la DB.

13

Las facilidades de explicacin (explanation facilities) permiten al usuario que realice preguntas al Sistema
Experto en cuanto a como lleg a una conclusin determinada y por qu es necesario un determinado hecho.
Un Sistema Experto debe ser capaz de explicar sus decisiones y justificar sus aconsejamiento, anlisis o
conclusiones.
La interfase de usuario (user interface) es el medio mediante el cual se comunica un usuario en procura de una
solucin para un problema con el Sistema Experto.
Un Sistema Experto (Expert System: ES) se construye para que se comporte a nivel humano experto en un
dominio estrecho, especializado. De modo que la caracterstica mas importante de un ES yace en su
performance de alta calidad. No importando cuan rpido el sistema puede resolver un problema, el usuario no
estar conforme frente a resultados errneos.
Por otra parte, la velocidad de alcanzar una solucin es muy importante. Aun la mas ajustada y correcta de las
decisiones o diagnostico pueden no resultar utilizables si las obtenemos demasiado tarde para aplicarlas, por
ejemplo, en una emergencia con la posibilidad de muerte de una persona o explosin de una Planta Nuclear.

El encadenamiento hacia atrs es una tcnica de razonamiento manejada por meta. En ella, un ES tiene
una meta (una solucin hipottica) y el motor de inferencia trata de encontrar la evidencia necesaria para probarla.
Lo primero es revisar la KB buscando reglas que puedan tener la solucin adecuada. Tales reglas deben tener la
meta en su <consecuente>, y si encontramos alguna con esta condicin, buscamos si su parte de <antecedente>
satisface la DB, caso en que la regla se dispara y la meta es comprobada.
En el caso general, el motor de inferencia separa la regla sobre la que est trabajando, colocndola en un
esquema de stack. Esto crea sub-metas correspondiente a la evaluacin y satisfaccin de <antecedentes>. Luego, la
KB es revisada nuevamente para encontrar reglas que puedan satisfacer sub-metas. El motor de inferencia repite
este proceso hasta que no encuentra reglas que puedan satisfacer la sub-meta actual.
Como elegimos entre FC y BC
Si un experto necesita obtener informacin primero, y luego trata de inferir de ella lo que se pueda, la eleccin
es encadenamiento hacia adelante para el motor de inferencia.
Mientras que si un experto comienza con una solucin hipottica y luego trata de encontrar hechos que la
sustentes, la eleccin es encadenamiento hacia atrs para el motor de inferencia.
Resolucin de Conflictos

Los ES aplican heursticas para guiar sus razonamientos, reduciendo el rea de bsqueda en procura de
una solucin. Una caracterstica nica de los ES es su capacidad para explicar su comportamiento. Esto
permite que revean su propio razonamiento y expliquen sus decisiones. Los ES emplean razonamiento
simblico cuando resuelven un problema. Se utilizan smbolos para representar diferentes tipos de
conocimientos tales como hechos, conceptos y reglas.
En los ES, el conocimiento est separado de su procesamiento (la Base de Conocimientos y el Motor de
Inferencia son partes separadas). En un programa convencional encontramos una mezcla de conocimiento y
estructura de control que procesa este conocimiento. Esta mezcla lleva a dificultades en la comprensin y
revisin del cdigo del programa, ya que cualquier cambio en el cdigo afecta tanto al conocimiento como a
su proceso.
Cuando se utiliza una cscara experta (expert shell), un Ingeniero de Conocimiento o un experto
simplemente ingresan reglas en la KB, adicionando con cada regla nuevo conocimiento, haciendo de esta
manera al sistema experto mas inteligente.
En un sistema experto basado en reglas, el dominio de conocimiento est representado por un conjunto
de reglas de produccin del tipo IF-THEN y los datos son representados por un conjunto de hechos acerca de la
situacin actual. El motor de inferencia compara cada regla almacenada en la KB con hechos contenidos en la
DB. Cuando se satisface el <antecedente> con los valores almacenados como hechos, entonces decimos que la
regla se dispara, ejecutando la <accin>. Este proceso de disparo produce una cadena inferencial. Esta cadena
indica como un sistema experto aplica las reglas para alcanzar una conclusin.

Encadenamiento hacia adelante (Forward chaining)


Un encadenamiento para adelante nos lleva a un razonamiento manejado por los datos. El razonamiento
comienza a partir de los hechos conocidos y contina hacia adelante validando nuevos datos. Cada unidad de
tiempo de proceso solo se ejecuta la regla en el tope de la lista. Cuando se dispara, la regla adiciona un nuevo dato
en DB. Cada regla solo puede dispararse una sola vez, y el ciclo se detiene cuando ya no se puede disparar ninguna
regla mas.
El encadenamiento hacia adelante es una tcnica de recoleccin de informacin y luego inferir lo que pueda ser
inferido. Sin embargo, en encadenamiento hacia adelante, pueden ejecutarse muchas reglas que no tienen nada
que ver con la meta procurada. Entonces, si nuestra meta es inferir solo un hecho en particular, la tcnica de
encadenamiento hacia adelante no resulta eficiente.
Encadenamiento hacia Atrs (Backward Chaining)

14

Tenemos dos reglas: Rule 2 y Rule 3, con el mismo <antecedente>. Entonces las dos pueden dispararse cuando se
satisface el hecho luz roja, representando una situacin de conflicto. Es tarea del motor de inferencia determinar
cual regla disparar a partir de este conjunto conflictivo. Un mtodo utilizado en elegir la regla a disparar en un ciclo
se denomina resolucin de conflicto.
En encadenamiento para adelante, AMBAS reglas se disparan. Rule 2 se dispara primero ya que est en el tope con
respecto a Rule 3, y como resultado se ejecuta su parte THEN y el objeto lingstico accin obtiene el valor stop. No
obstante, la Rule 3 tambin se dispara debido a que si <antecedente> equipara el hecho traffic light is red, que
aun est en la DB. Como consecuencia, el objeto accin toma el nuevo valor go.
Mtodos usados para resolucin de Conflictos

Disparar la regla con la mayor prioridad. En aplicaciones simples, la prioridad se establece colocando las
reglas en un orden apropiado en la KB. Usualmente esto funciona bien para SE con no mas de 100 reglas.
Disparar la regla ms especfica. Este mtodo tambin se conoce como estrategia de mxima
equiparacin, y est basada en la presuncin que una regla especfica procesa mas informacin que una
general.
Disparar la regla que utiliza datos ingresados ms recientemente en la DB. Este mtodo se basa en las
estampillas de tiempo (time tags) agregadas a cada hecho en la DB. A partir del conjunto conflictivo, el
sistema experto dispara primero la regla cuyo antecedente usa el dato mas reciente en la DB.

Metaknowledge

El metaconocimiento puede definirse simplemente como conocimiento acerca del conocimiento. El


metaconocimiento es conocimiento acerca del uso y control del dominio de conocimiento de un sistema
experto.
En sistemas expertos basados en reglas, el metaconocimiento est representado por metareglas. Una
metaregla determina la estrategia de la utilizacin de reglas para tareas especficas en el sistema
experto.

Ventajas de los Sistemas Expertos basados en reglas

Representacin del conocimiento de forma natural. Usualmente un experto explica los procedimientos
que utiliza para resolver problemas mediante expresiones del tipo en tales y tales circunstancias, hago

esto y esto. Estas expresiones se pueden representar de manera bastante natural como reglas de
produccin de tipo IF-THEN.
Estructura uniforme. Las reglas de produccin tienen la estructura uniforme de tipo IF-THEN. Cada regla
es una pieza de conocimiento independiente, y la sintaxis con las que se escriben les permite ser autodocumentadas.
Separacin del conocimiento de su procesamiento. La estructura de un sistema experto basado en reglas
provee una separacin efectiva de la base de conocimientos y el motor de inferencia. Esto hace posible
desarrollar diferentes aplicaciones utilizando la misma cascara de ES (expert system shell).
Permite tratar con conocimiento incompleto e incierto. La mayora de los sistemas expertos basados en
reglas son capaces de representar y razonar con conocimiento incompleto e incierto.

Desventajas de los Sistemas Expertos basados en reglas

Relaciones opacas entre reglas. A pesar que las reglas de produccin individuales son relativamente
simples y auto-documentadas, su interaccin lgica dentro del gran conjunto de reglas puede no ser tan
sencillo de entender. Los sistemas basados en reglas hacen difcil observar como las reglas
individualmente sirven a una estrategia global.
Estrategia de bsqueda ineficiente. El motor de inferencia aplica una bsqueda exhaustiva sobre todas
las reglas de la KB cada ciclo, y si esta KB es de grandes dimensiones (miles de reglas) torna al proceso
lento. Esta situacin puede ser determinante en sistemas de tiempo real.
Baja Capacidad para aprender. En general, los sistemas expertos basados en reglas no poseen ninguna
capacidad para aprender a partir de su experiencia. A diferencia de los seres humanos, que sabe cuando
saltarse las reglas, un sistema experto no puede modeficar de manera automtica su KB, o ajustar
reglas existentes o adicionar reglas nuevas. El Ingeniero de Conocimiento es aun insustituible y
responsable de revisar y mantener el sistema.

Ventajas de las redes neuronales

1) El modelo de tipo biolgico. Este comprende las redes que tratan de simular los sistemas neuronales biolgicos,
as como las funciones auditivas o algunas funciones bsicas de la visin.
2) El modelo dirigido a aplicacin. Este modelo no tiene por qu guardar similitud con los sistemas biolgicos. Su
arquitectura est fuertemente ligada a las necesidades de las aplicaciones para la que es diseada.

Definiciones de una red neuronal


Existen numerosas formas de definir a las redes neuronales; desde las definiciones cortas y genricas
hasta las que intentan explicar ms detalladamente qu son las redes neuronales. Por ejemplo:

Una nueva forma de computacin, inspirada en modelos biolgicos

Un modelo matemtico compuesto por un gran nmero de elementos


procesales organizados en niveles

Un sistema de computacin compuesto por un gran nmero de elementos simples, elementos de


procesos muy interconectados, los cuales procesan informacin por medio de su estado dinmico como
respuesta a entradas externas

Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples
(usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos
del mundo real del mismo modo que lo hace el sistema nervioso biolgico

Debido a su constitucin y a sus fundamentos, las redes neuronales artificiales presentan un gran nmero de
caractersticas semejantes a las del cerebro. Por ejemplo, son capaces de aprender de la experiencia, de generalizar
de casos anteriores a nuevos casos, de abstraer caractersticas esenciales a partir de entradas que representan
informacin irrelevante, etc.

Aprendizaje: la etapa de aprendizaje consiste en proporcionar a la Red Neuronal datos como entrada a su vez que
se le indica cul es la salida (respuesta) esperada.
Auto organizacin: Una Red Neuronal crea su propia representacin de la informacin en su interior, descargando
al usuario de esto.
Tolerancia a fallos: Debido a que una Red Neuronal almacena la informacin de forma redundante, sta puede
seguir respondiendo de manera aceptable aun si se daa parcialmente.
Flexibilidad: Una Red Neuronal puede manejar cambios no importantes en la informacin de entrada, como seales
con ruido u otros cambios en la entrada (ej. si la informacin de entrada es la imagen de un objeto, la respuesta
correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente)
Tiempo real: La estructura de una Red Neuronal es paralela, por lo cul se pueden obtener respuestas en tiempo
real.
Redes Neuronales
Consisten de unidades de procesamiento que intercambian datos o informacin, se utilizan para
reconocer patrones, incluyendo imgenes, manuscritos y secuencias de tiempo, tendencias financieras. Tienen
capacidad de aprender y mejorar su funcionamiento.
Una primera clasificacin de los modelos de redes neuronales podra ser, atendiendo a su similitud con la realidad
biolgica:

15

En cualquier sistema que se est modelando, es til caracterizar tres tipos de unidades: entradas, salidas y ocultas.
Las unidades de entrada reciben seales del entorno, stas pueden ser provenientes de censores o de otros
sectores del sistema. Las unidades de salida envan la seal fuera del sistema; stas pueden controlar directamente
potencias u otros sistemas. Las unidades ocultas son aquellas cuyas entradas y salidas se encuentran dentro del
sistema; es decir no tienen contacto con el exterior.

Se conoce como nivel o capa a un conjunto de neuronas cuyas entradas provienen de la misma fuente, y cuyas
salidas se dirigen a un mismo destino.

De Entrada: es la capa que recibe directamente la informacin proveniente de las fuentes externas de la
red.
Ocultas: son internas a la red, no tiene contacto directo con el exterior. El nmero de niveles ocultos
puede ser de cero a un nmero elevado. Las neuronas de las capas ocultas pueden estar interconectadas de
distintas maneras, lo que determina junto a su nmero, las distintas topologas.
De Salida: transfieren informacin de la red hacia el exterior.

Se dice que una red es totalmente conectada si todas las salidas desde un nivel llegan a todos y cada uno de los
nodos del mismo nivel siguiente.

Formas de Conexin entre neuronas


Estado de Activacin
Todas las neuronas que componen la red se hallan en cierto estado. Podemos decir que hay dos posibles estados,
reposo y excitado, a los que denominaremos estados de activacin y a cada uno de los cuales se le asigna un valor.
Los valores de activacin pueden ser continuos o discretos. Adems pueden ser limitados o ilimitados.
Funcin de salida o transferencia
Existen cuatro funciones de transferencia tpicas que determinan distintos tipos de neuronas:

Funcin escaln

Funcin lineal y mixta

Sigmoidal

Funcin gaussiana

La conectividad entre los nodos de una red neuronal est relacionada con la forma en que las salidas de las
neuronas estn canalizadas para convertirse en entradas de otras neuronas. La seal de salida de un nodo puede ser
una entrada de otro elemento de proceso, o incluso de s mismo (conexin auto-recurrente).
Cuando ninguna salida de las neuronas es entrada de neuronas del mismo nivel o de niveles precedentes, la red se
describe como propagacin hacia delante. Cuando las salidas pueden estar conectadas como entradas de neuronas
de niveles previos o del mismo nivel, incluyndose ellas mismas, la red es de propagacin hacia atrs. Las redes de
propagacin hacia atrs que tiene lazos cerrados son sistemas recurrentes.

La funcin escaln nicamente se utiliza cuando las salidas de la red son binarias. La salida de una neurona se activa
slo cuando el estado de activacin es mayor o igual a cierto valor umbral. La funcin lineal o identidad equivale a
no aplicar funcin de salida. Las funciones mixtas y sigmoidal son las ms apropiadas cuando queremos como salida
informacin analgica.

Regla de aprendizaje
Existen muchas definiciones del concepto aprendizaje, una de ellas podra ser: La modificacin del
comportamiento inducido por la interaccin con el entorno y como resultado de experiencias conducente al
establecimiento de nuevos modelos de respuesta a estmulos externos.

Niveles o capas de neuronas


La distribucin de neuronas dentro de la red se realiza formando niveles o capas de un nmero
determinado cada una. Se pueden distinguir tres tipos de capas:

16

Conexiones hacia delante.

b) Conexiones laterales.

Son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de


abstraer caractersticas esenciales a partir de entradas que representan informacin irrelevante, etc.
Aprendizaje adaptativo: capacidad de aprender a realizar tareas basadas en un entrenamiento o en una experiencia
inicial.
Auto-organizacin: una red neuronal puede crear su propia organizacin o representacin de la informacin que
recibe mediante una etapa de aprendizaje.
Tolerancia a fallos: la destruccin parcial de una red conduce a una degradacin de su estructura; sin embargo,
algunas capacidades de la red se pueden retener, incluso sufriendo un gran dao.
Operacin en tiempo real: los cmputos neuronales pueden ser realizados en paralelo; para esto se disean y
fabrican mquinas con hardware especial para obtener esta capacidad.
Fcil insercin dentro de la tecnologa existente: se pueden obtener chips especializados para redes neuronales
que mejoran su capacidad en ciertas tareas. Ello facilitar la integracin modular en los sistemas existentes.
Redes Neuronales de Kohonen

c) Conexiones hacia atrs (o recurrentes).

Arquitectura no-supervisada.
Consiste de un nmero de neuronas organizadas en una red n-dimensional.
Cada neurona es conectada a todas las otras neuronas, pero es localmente conectada solo a sus vecinas.
Cada neurona tiene un vector de pesos W de entrada asociado y la neurona con el vector de peso ms
cercano a la entrada P se activar.
En cada vector se presenta la siguiente secuencia de pasos:
Encontrar el nodo k cuyo vector de peso est ms prximo al vector de entrada actual.
Entrenar el nodo k y todos los nodos ms prximos a este.
cuando se presenta un patrn de entrenamiento, se debe identificar la neurona de salida vencedora, esto es, la
neurona cuyo vector de pesos sea el ms parecido al patrn presentado. De acuerdo con este criterio, dos vectores
sern ms similares cuanto menor sea su distancia.

Caractersticas de las Redes Neuronales


Existen cuatro elementos que caracterizan una red neuronal: su topologa, el mecanismo de aprendizaje, tipo de
asociacin realizada ente la informacin de entrada y salida y la forma de representacin de estas informaciones.

Topologa de las Redes Neuronales


Consiste en la organizacin de las neuronas en la red formando capas o agrupaciones de neuronas ms o menos
alejadas de la entrada y salida de la red. Los parmetros fundamentales de la red son: el nmero de capas, el
nmero de neuronas por capa, el grado de conectividad y el tipo de conexiones ente neuronas.
En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.
Redes con conexiones hacia adelante y hacia atrs (feedforward/feedback)
En ste tipo de redes circula informacin tanto hacia delante como hacia atrs durante el funcionamiento de la red.
Para que eso sea posible existen conexiones feedforward y feedback entre las neuronas.
En general, suelen ser bicapas, existiendo por lo tanto dos conjuntos de pesos: los correspondientes a las
conexiones feedforward de la primera capa ( capa de entrada) hacia la segunda (capa de salida) y los de las
conexiones feedback de la segunda a la primera. Los valores de los pesos de estos tipos de conexiones no tienen
porqu coincidir, siendo diferentes en la mayor parte de los casos.
Se suelen considerar dos tipos de reglas de aprendizaje:

aprendizaje supervisado

aprendizaje no supervisado.
La diferencia fundamental entre ambos tipos es la existencia o no de un agente externo (supervisor) que controle el
proceso de aprendizaje.
Otro criterio para diferenciar las reglas de aprendizaje se basan en considerar si la red puede aprender durante su
funcionamiento habitual (aprendizaje ON LINE),o si el aprendizaje supone una desconexin de la red; es decir su
inhabilitacin hasta que el proceso termine (aprendizaje OFF LINE).
Ventajas que ofrecen las redes neuronales

Una medida de similitud alternativa ms simple que la euclidiana, es la correlacin o producto escalar: segn la cual,
dos vectores sern ms similares cuanto mayor sea su correlacin.

ALGORITMO
Decrementarsuavemente la razn de aprendizaje.
Despus de M ciclos, decrementarel tamao de la vecindad.
Entrenamiento
Se inicializan los pesos de forma aleatoria.
Se presenta un vector de entrenamiento.
La neurona mas cercana al vector es la nica que se activa
Solo se modifican los pesos de la neurona activa y de sus vecinas
Lgica difusa (fuzzy)
Fuzzy Logic tiene sus races en la teora de conjuntos difusos desarrollada por Zadeh en la dcada de los
60, la que propone que un elemento siempre pertenece en un cierto grado a un conjunto y nunca pertenece del
todo al mismo, esto permite establecer una manera eficiente para trabajar con incertezas, as como para
acondicionar el conocimiento en forma de reglas hacia un plano cuantitativo, factible de ser procesado por
computadores.
Toda lgica consiste en formalizar el pensamiento humano, desde este punto de vista,

17

Lgica Clsica: Establece que cualquier enunciado o proposicin puede tener un valor lgico verdadero o
falso, en definitiva 1 y 0. De esta forma es posible desarrollar toda una lgica basada en leyes de este tipo.
Logica Difusa: En vez de trabajar con el clsico concepto de inclusin o exclusin, introduce una funcin
que expresa el grado de pertenencia de una variable hacia un atributo o variable lingstica tomando valores en
el rango de 0 a 1.
Conjunto Difuso: Par Variable lingstica funcin de pertenencia
A = {x / A(x) x X}
Ejemplo: Descripcin del estado de una puerta
Lgica Clsica: De acuerdo a la lgica clsica existen dos estados posibles para una puerta.
Una puerta est abierta (1)
Una puerta est cerrada (0)
Lgica Difusa: establece que una puerta no tiene por que estar necesariamente abierta o cerrada, existen adems
otros estados.
Puerta abierta (1)
Puerta bastante abierta (0.8)
Puerta abierta a medias (0.5)
Puerta casi cerrada (0.1)
Una puerta est cerrada (0)

Ventajas de lgica Difusa


La principal ventaja de utilizar trminos lingsticos como: a medias, bastante, casi, un poco, mucho,
algo, etc, est en que permite plantear el problema en los mismos trminos en los que lo hara un experto humano.
El xito de esta tcnica radica en que El mundo es Fuzzy. En otras palabras, no tiene sentido buscar la
solucin a un problema no perfectamente definido por medio de un planteamiento matemtico muy exacto,
cuando es el ser humano el primero que razona empleando la inexactitud.
1. Proceso de Fuzzificacin

El proceso de fuzzificacin consiste en convertir una variable real en un grado de pertenencia


que cuantifica el grado de posesin hacia su correspondiente variable lingstica.

Las variables lingsticas son representativas de situaciones como: Positivo, alrededor de, alto,
medio, etc.

El primer paso consiste en tomar las entradas y determinar el grado al que ellos pertenecen a
cada uno de los conjuntos fuzzy apropiados.

La entrada siempre es un valor numrico limitado al universo del discurso de la variable de


entrada (0-10).
Funciones de pertenencia
Las funciones de pertenencia representan las coordenadas difusas del atributo. Son funciones continuas, que
pueden ser bsicamente de los tipos:

Trapezoidales y Triangulares: Son funciones lineales por tramos, pero representan una discontinuidad
en la primera derivada que hereda la accin de control.

Exponenciales: (distribucin normal), muestran un comportamiento muy adecuado y no representan


discontinuidad en la derivada.

Polinmicas: Son funciones sencillas de calcular y tienen una forma similar a la de las funciones de
densidad normal.

18

Operadores difusos

Los operadores ms comunes son:


Operacin Max(): asigna la correspondiente al valor mximo
Operacin Min(): asigna la correspondiente al valor mnimo
que son equivalentes a las sentencias or y and de la lgica booleana.
2. Definicin de las reglas:
ENUNCIADOS DE REGLAS:
1. Si (servicio es pobre) o (comida es mala) entonces (restaurant es barato)
2. Si (servicio es bueno) entonces ( restaurant es promedio)
3. Si (servicio es excelente) o (comida es rica) entonces (restaurant es caro)
MTODO DE AGREGACIN DE REGLAS:
La agregacin es cuando se unifican las salidas de cada regla en forma paralela.
Posteriormente se realiza la defuzzificacin del resultado.
3. Defuzzificacin
El proceso inverso llamado defuzzificacin transforma un conjunto difuso, es decir un conjunto de
variables lingsticas con sus respectivos grados de pertenencia, en un nmero real.

El mtodo ms comn es asimilarlo al centro de gravedad de la combinacin de cada una de


las reglas inferidas.

Tambin se usa el criterio mximo, que escoge el punto donde la funcin inferida tiene su
mximo o el criterio de la media de los mximos.
Controlador Difuso

En un controlador a partir del valor de referencia (setpoint) y del valor de entrada del
proceso, se calcula el error (E) y el cambio del error (CE).

El controlador difuso toma como variables de partida E y CE y tiene como variable de salida el
cambio en la accin de control a aplicar (CU), o bien una accin de control absoluta (U).

El controlador difuso se compone internamente de reglas lingsticas, que tienen como


condiciones los valores posibles de las variables de entrada, y que concluyen la variacin a
efectuar en la accin de control, en trminos tambin lingsticos. Posteriormente se
transforma en un valor determinista.
La tabla de reglas est determinada por las caractersticas del proceso y debe ser configurada por el experto.
Adems debe cumplir algunas normas elementales:
COMPLETITUD: Las reglas han de cumplir todas las combinaciones posibles de entradas al controlador, con el fin
de que no queden fisuras en las cuales no se tome una accin.
CONSISTENCIA: No pueden coexistir dos acciones de control para la misma situacin, lo que producira una
contradiccin.

INTERACCIN: Corresponde al peso propio que tiene una regla entre las restantes, para esto se debe analizar el
efecto de las reglas en la accin de control.
ROBUSTEZ: Es una medida de la reaccin del controlador frente a perturbaciones en las entradas.
Algoritmos genticos
Definicin Formal: Los Algoritmos Genticos (AG) son procedimientos adaptativos para la bsqueda de soluciones
en espacios complejos inspirados en la evolucin biolgica, con patrones de operaciones basados en el principio
darwiniano de reproduccin y supervivencia de los individuos que mejor se adaptan al entorno en el que viven.

Conceptos de Algoritmos Genticos


Cromosoma: Es la representacin codificada de una posible solucin. Generalmente se usa la representacin como
cadenas de bits. Tambin se pueden usar punto flotante, cdigos alfabticos.

La representacin tradicional es la cadena binaria del tipo.


Gen: A cada posicin de la cadena se le denomina "gen" y al valor dentro de esta posicin se le llama "alelo".
Evaluacin de la adaptabilidad (fitness): A cada solucin (cromosoma) se le asigna un valor de adaptabilidad
dependiendo de qu tan bueno es el cromosoma solucionando el problema.
Fenotipo y Genotipo

Representacin
Los algoritmos genticos requieren que el conjunto se codifique en un cromosoma. Cada cromosoma
tiene varios genes, que corresponden a los respectivos parmetros del problema. Para poder trabajar con estos
genes en el ordenador, es necesario codificarlos en una cadena, es decir, una cadena de smbolos (nmeros o letras)
que generalmente va a estar compuesta de ceros y unos.
Mtodos de codificacin de variables

Cadenas binarias: Secuencias de unos y ceros donde el dgito de cada posicin representa el valor de
algn aspecto de la solucin.

Cadenas de enteros o nmeros decimales: Cada posicin representa algn aspecto particular de la
solucin. Este mtodo permite una mayor precisin y complejidad que el mtodo comparativamente
restringido de utilizar slo nmeros binarios, y a menudo est intuitivamente ms cerca del espacio de
problemas.

Cadenas de letras: Cada letra representa un aspecto especfico de la solucin.


Poblacin
Tamao de la poblacin: Goldberg efectu un estudio terico, obteniendo como conclusin que el tamao ptimo
de la poblacin para cadenas de longitud m, con codificacin binaria, crece exponencialmente con el tamao de la
cadena.

19

La poblacin inicial es la principal fuente de material gentico para el algoritmo gentico. La poblacin inicial debe
contener cromosomas que estn bien dispersos por el espacio de soluciones. Habitualmente la poblacin inicial se
escoge generando cadenas al azar, pudiendo contener cada gen uno de los posibles valores del alfabeto con
probabilidad uniforme.
Funcin objetivo: La regla, general para construir una buena funcin objetivo es que sta debe reflejar el valor del
individuo de una manera real, pero en muchos problemas de optimizacin combinatoria, donde existen gran
cantidad de restricciones, buena parte de los puntos del espacio de bsqueda representan individuos no vlidos.
Para este planteamiento en el que los individuos estn sometidos a restricciones, se han propuesto varias
soluciones. La absolutista, con el uso del operador reparador, la penalizacin de la funcin objetivo, o la evaluacin
aproximada de la funcin objetivo.
Un problema habitual en las ejecuciones de los Algoritmos Genticos surge debido a la velocidad con la que el
algoritmo converge. En algunos casos la convergencia es muy rpida, lo que suele denominarse convergencia
prematura, en la cual el algoritmo converge hacia ptimos locales, mientras que en otros casos el problema es justo
el contrario, es decir se produce una convergencia lenta del algoritmo.
Seleccin: La seleccin consiste en decodificar el gen del individuo y usar sus componentes como parmetros para
el problema, cuyo resultado ser ponderado luego por una funcin de fitness, que mide la adaptabilidad del
individuo al problema.
Mtodos de Seleccin

Seleccin elitista: se garantiza la seleccin de los miembros ms aptos de cada generacin.

Seleccin proporcional a la aptitud: los individuos ms aptos tienen ms probabilidad de ser


seleccionados, pero no la certeza.

Seleccin por rueda de ruleta: una forma de seleccin proporcional a la aptitud en la que la probabilidad
de que un individuo sea seleccionado es proporcional a la diferencia entre su aptitud y la de sus
competidores.

Seleccin escalada: al incrementarse la aptitud media de la poblacin, la fuerza de la presin selectiva


tambin aumenta y la funcin de aptitud se hace ms discriminadora.

Seleccin por torneo: se eligen dos integrantes de la poblacin, se los compara y se determina un
ganador, que regresa a la poblacin de la que puede ser elegido nuevamente. El perdedor pasa a una
pila. Se repite hasta que no haya ms individuos en la poblacin y se elige al que est en el tope de la pila
como el ganador del torneo.

Seleccin por rango: a cada individuo de la poblacin se le asigna un rango numrico basado en su
aptitud, y la seleccin se basa en este ranking, en lugar de las diferencias absolutas en aptitud.
Cruzamiento
Una vez seleccionados los individuos cuyos genes pasarn a la siguiente generacin, se procede a la
formacin de sta. Para ello primero se realizarn un nmero aleatorio de cruces (como mximo poblacin/2). Los
individuos que se vayan a cruzar tambin se debern elegir aleatoriamente, teniendo en cuenta que un mismo
individuo no puede cruzarse ms de una vez.
El objetivo de los operadores de cruce es, partiendo de dos cromosomas padres, generar uno o ms cromosomas
hijos que hereden caractersticas de ambos padres. Se dice que en el hijo se recombinan las caractersticas de los
padres.
Tcnicas de cruce

Cruce bsico: Se selecciona un punto al azar de la cadena. La parte anterior del punto es copiada del
genoma del padre y la posterior del de la madre. Es decir, la tcnica consiste en separar a los padres en
dos partes para formar dos hijos intercambiando las partes de cada padre.

Cruce multipunto: Igual que el cruce bsico, slo que estableciendo ms de un punto de cruce. Se eligen
M puntos de corte al azar, y las secciones de cada padre se pasan a los hijos en forma alternada.
Cruce segmentado: Existe una probabilidad de que un cromosoma sea punto de un cruce. Conforme se
va formando la nueva cadena del descendiente, para cada gen, se verifica si ah se va producir un cruce.

Cruce uniforme: Para cada gen de la cadena del descendiente existe una probabilidad de que el gen
pertenezca al padre, y otra de que pertenezca a la madre. Esta tcnica permite el intercambio de los
bloques en una manera que es independiente del orden que la codificacin impuso a cada uno dentro
del cromosoma.

Mutacin
Mutar un individuo consiste en alterarlo de alguna manera, y es un proceso que se realiza con muy poca
probabilidad con respecto al cruce (se utilizan probabilidades del 1% del 0,1% o incluso, menores). En general, se
implementa modificando al azar alguno o algunos de los genes del individuo al que se la aplica. Esto se hace para
forzar la evolucin al alterar los genes de los individuos. Dicha alteracin puede otorgar ms o menos adaptacin en
los mejores casos.
Mtodos de mutacin

De un punto: se muta un solo gen por vez.

Multipunto: se mutan varios genes a la vez.

Global: mutan todos los genes del individuo.


Reemplazo
La reinsercin de hijos consiste en incorporar los nuevos cromosomas en la poblacin. Los mtodos de
reemplazo son diferentes segn la cantidad de cromosomas generados sea menor, igual o mayor que la cantidad de
elementos existentes en la poblacin.
Se generan tantos cromosomas como elementos en la poblacin
El esquema ms simple, denominado reinsercin pura, consiste en generar mediante la reproduccin tantos hijos
como elementos existen en la poblacin, y reemplazar todos los cromosomas de la generacin anterior por los
nuevos.
Se generan ms cromosomas que elementos en la poblacin, este esquema es similar al de reinsercin pura. Se
eligen los mejores cromosomas entre los que se generaron, y se eliminan los cromosomas sobrantes. Luego, se
reemplaza la poblacin completa por la nueva generacin.
Se generan menos cromosomas que elementos en la poblacin, este esquema exige seleccionar entre los
cromosomas de la poblacin aquellos que se eliminarn.
Tcnicas de Reemplazo
Insercin uniforme: Los cromosomas a ser reemplazados se eligen al azar entre los miembros de la
poblacin. Se corre el riesgo de eliminar buenas soluciones, ya que no se tiene en cuenta la aptitud de los
cromosomas.
Insercin elitista: Se eligen los cromosomas menos aptos para ser reemplazados. Este mtodo asegura
que los mejores cromosomas pasarn siempre a la siguiente generacin, pero puede restringir la amplitud de la
bsqueda que realiza el algoritmo gentico.
Insercin por torneo invertido: Se utiliza en combinacin con el mtodo de seleccin por torneo. Funciona
exactamente igual que el mtodo de seleccin por torneo pero seleccionando con probabilidad p al peor
cromosoma del torneo para ser reemplazado, y tiene las mismas propiedades que ste, permitiendo regular la
presin selectiva sin el uso de funciones de escala.
Criterios de terminacin del algoritmo gentico

Criterio de convergencia de identidad: Este criterio consiste en detener al algoritmo gentico cuando un
determinado porcentaje de los cromosomas de la poblacin representan a la misma solucin.

Criterio de convergencia de aptitud: Este criterio no espera a que la poblacin se componga


mayoritariamente de una sola solucin, sino que finaliza la ejecucin del algoritmo cuando los valores de
aptitud de un determinado porcentaje de las soluciones son iguales, o difieren en un pequeo
porcentaje.

Criterio de cantidad de generaciones: El criterio de terminacin por cantidad de generaciones consiste


simplemente en finalizar la ejecucin una vez que ha transcurrido un nmero determinado de
generaciones.
Preguntas tomadas de clase
Sistemas Expertos

20

----------------1- Dependiente o independiente del contexto es el criterio de seleccion de regla escogido?.


hay 2 tipos de criterio de seleccion de reglas del motor de inferencia:
* El contexto va a decir que reglas disparar y le da por ejm un porcentje (ponderacion), es decir
dependiendo del contexto
*Independiente del conexto.
2- Cdo un SE es necesario? cdo el experto es caro, es escaso; es decir es experto sobre algo.
****************************
Algorit GENECTICO
----------------1- que es un individuo? es una solucin
2- el Alg Genet para q se utiliza? se utiliza para resolver problemas eursticos, para optimizar
la solucin.
3- Los individuos son iguales? individuos = soluciones= combinacion de genes. mmm..., para mi se
refiere a que cada tiene su composicon genetica, la cual puede o no ser iguales
4- Ctos individuos creamos? los que queramos, el cual puede ser un n finito aunq tb puede ser infinito.
5-cual es la cdad de poblacion que se necesita tner? la que el diseador o programador se
disponga. Decidir si trabajar con n finitos o infinitos.
6- Como creo mi poblacion inicial? al AZAR.. o bien respetar las dos priemras composiciones
genticas. Por ejemplo: todos los humanos dbmos tner 2 brazos y 2 piernas pero distinto color
de piel.
7- que es la Fcion de FITNES? es la fcion que nos calcula la solucin de acuerdo al individuo. Por
ejemplo: la suma de los resultados que nos d la menor distancia(TSP).
8- Ctos de los mejores individuos seleciono para generar una nueva poblacion?Los que yo
quiera, porque me la banco y soy groso. JAJAJAJ, si tu lo dices... jajaja
9- Mtodos de Selecion
9.1- Ruleta:(porcentaje), aqu doy una chance a todos los individuos aunque tengan el
minimo porcentaje posible
10- que significa que un Individuo sea un hijo?que tiene los genes de sus padres(individuos).
11- La Variedad beneficia el algoritmo gentico? MMM no se che,est preg me cag.
yo si tengo la respuesta: si beneficia la variedad al algoritmo genetico, xq sin son mmelizos no sivre. =)
12- si un individuo que nace en una nueva generacion no es parte de la representacion de la
solucion, que hago? Debo eliminarlo,matarlo..Hay que validar los individuos de la nueva
generacion.
13- Como determinamos los PUNTOS DE CORTE en un ALg Genet? a) hasta que no se mejore la
poblacion b) cdo se repite el = resultado una X cantidad de veces C)por aproximacion a un
resultado.
14- que es MUTACION? es la alteracion de un GEN
15- Cual es el porcentaje de mutacion recomendado? el porcentaje es del 2%

También podría gustarte