Cap 1

Capítulo 1.
Conceptos y Teoría de
Funcionamiento de las Redes
Neuronales Artificiales RNA
Profesor:
Dr. Ing. Juan Cevallos
Agosto 2010
Las RNA
• Son Modelos Matemáticos inspirados en
el funcionamientos de las Redes
Neuronales biológicas
• Compuestas por varias unidades de
procesamiento (neuronas)
– interligadas por conexiones (sinapsis)
• Eficientes donde los métodos de cálculo
tradicionales son considerados
inadecuados.
ESTRUCTURA DE UNA RNA
Modelo de RNA
Neuronas intermedias
Neuronas de Neuronas de
Entrada salída
Conexiones
Aplicaciones de las RNA
Empresa:
• Explotación de bases de datos.
• Optimización.
• Reconocimiento de caracteres escritos.
Finanzas:
• Valoración de riesgo de los créditos.
• Identificación de firmas.
• Previsión de la evolución de los precios.
Aplicaciones…
Manufactura:
• Automatización y Sistemas de control (con sensores).
• Control de producción.
• Inspección de la calidad.
Medicina.
• Diagnóstico a partir de síntomas.
• Predicción de reacciones a medicinas.
• Lectores de Rayos X.
Militares:
• Clasificación de sañales de radar;
• armas inteligentes,
• optimización del uso de recursos.
Precisando el Concepto
• Una RNA es un grafo consistente de un conjunto
de nodos, más un conjunto de conexiones
establecidas entre ellos.
• A cada nodo i se asocia una variable de estado
x i.
• A cada conexión (i,j) de los nodos i y j se asocia
un peso wij.
• A cada nodo i se asocia un umbral өi.
• Para cada nodo i se define una función de
transferencia fi.
• Las RNA aprenden de los datos (se entrenan),
se graba lo aprendido y se aplican para
solucionar problemas o ser aplicadas.
Tipos de Aprendizaje de las RNA:
1. Supervisado
2. No Supervisado.
Aprendizaje Supervisado
 Se logra comparando la salida de la red con la
respuesta correcta ya conocida por el
MAESTRO.
 La diferencia de esta comparación permite
ajustar los pesos de las conexiones entre sus
neuronas, para buscar una salida mas
aproximada a la correcta.
 El aprendizaje se da a través de un proceso
iterativo de ajuste aplicado a sus pesos
sinápticos
Aprendizaje No Supervisado
• No requiere influencia externa para
ajustar sus pesos de las conexiones entre
sus neuronas.
• No recibe ninguna información del entorno

que le indique si la salida generada
respecto a una determinada entrada es o
no correcta.
• Por ello se dice que estas RN son capaces

de Autoorganizarce.
ENTRENAMIENTO DE
REDES NEURONALES
• ¿PARA QUE Y COMO ENTRENAR?

• ENTRENAMIENTO DE UN PERCEPTRON
• FUNCION DE ERROR
• GRADIENTE DESCENDENTE
• EL ALGORITMO DE RETROPROPAGACION
¿PARA QUE Y COMO ENTRENAR? (I)
¿PARA QUE?
• Para calcular los pesos correctos para los ejemplos
de entrenamiento.
• Una vez calculados los pesos podemos preveer cual
debe de ser el resultado para cualquier entrada.
• La red es lenta para entrenar, pero una vez
entrenada, nos ofrece salida de una manera bastante
rápida.
¿PARA QUE Y COMO ENTRENAR? (II)
¿COMO?
• Mediante algoritmos de entrenamiento.
• El algoritmo de Retropropagación es el más importante.
•¿Cuando paro?
•¿Lo he hecho bien?
¿PARA QUE Y COMO ENTRENAR? (III)
• Condición de parada:
• Establecer un número máximo de iteraciones.
• Establecer la cota máxima de error.
• Obtener un error nulo
¿PARA QUE Y COMO ENTRENAR? (IV)
COMPROBACIONES FINALES:
• Comprobar que la red funciona correctamente:
• Obtener resultados para ejemplos no utilizados

en el entrenamiento
• Calcular el error cometido
• Repetir el entrenamiento si los resultados no son
buenos
II. EJEMPLO DE RECONOCIMIENTO DE
FIRMAS.
Problema de gran importancia.
 Mundo real:
- Falsificación de firmas.
(Ej. Asistencia a clases)
Descripción y sistema propuesto:
El sistema propuesto consta de varias etapas
• Extracción de envolventes y extracción de parámetros

estadísticos de la firma digitalizada.
• Entrenamiento en paralelo de cinco redes neuronales tipo
propagación hacia atrás (BACKPROPAGATION), cada una de
las cuales se entrenarán con los valores obtenidos de las
envolventes superior, inferior, derecha e izquierda de la firma, y
la quinta red se entrenará con los valores obtenidos de los
parámetros estadísticos;
• Para finalizar se utilizarán los valores extraídos de las redes
para saber a quién pertenece la firma.
Sistema propuesto para el reconocimiento de firmas
.
Extracción de envolventes:
Definición de envolvente:

Se denomina envolvente convexa o polígono convexo de un
conjunto de puntos, al conjunto de aristas que forma un
polígono cerrado que contiene a todos los puntos de dicho
conjunto, con la particularidad de que ampliando
cualquiera de sus aristas, no divide al polígono.

• Una vez que las firmas han sido digitalizadas se procede
a la extracción de envolventes; cada envolvente se divide
en 12 partes, a cada una de ellas se le asigna un valor
entero que representa la forma de la parte.
• El valor entero es asignado teniendo en cuenta el

siguiente criterio:
0  No había píxeles en la submatriz.

1  Había píxeles pero la información no formaba
ningún valle ni ningún pico.
2  Se encontraba información en forma de pico.
3  Se encontraba información en forma de valle.
A partir de la firma digitalizada:
Se obtienen las envolventes divididas cada una de ellas

en 12 partes:
Envolvente 1 Envolvente 2 Envolvente 3

Envolvente 4
Parámetro estadísticos:
Los parámetros estadísticos a los que nos referimos son
los valores de kurtosis, de Skewness (Sesgo); valor
relativo entre ambos, y valor relativo entre proyección
vertical y proyección horizontal de la firma bajo análisis.
Valor de kurtosis: Es una medida estadística que
describe el apuntamiento o achatamiento de una cierta
distribución con respecto a una distribución normal.
Valor de Skewness ó Sesgo: Medida estadística que

describe la simetría de la distribución alrededor de un
promedio. Si el sesgo es igual a cero, la distribución es
simétrica; si el sesgo es positivo la distribución una tendrá
una cola asimétrica extendida hacia los valores positivos.
Un sesgo negativo indica una distribución con una cola
asimétrica extendida hacia los valores negativos.
Resultados obtenidos:
Según la documentación consultada, para evaluar el
sistema propuesto, se generó una base de datos de 135
firmas.90 firmas fueron usadas para entrenar las cinco
redes separadamente. 45 firmas son usadas para
evaluación del funcionamiento del sistema propuesto.
 Los resultados mostraron que aproximadamente

el 100% de las firmas se reconocen correctamente.
Los parámetros de mayor importancia fueron las

envolvente superior, derecha y parámetros
estadísticos; ya que contienen mayor información
que los restantes.
Modelo de Neurona y
Arquitectura de Redes
NEURONA CON UNA ENTRADA SIMPLE
FUNCIÓN DE TRANSFERENCIA
HARD LIMIT – hardlim (Escalón)
LINEAL - purelin
Log-Sigmoid - lossig
NEURONA CON ENTRADAS
MÚLTIPLES
NEURONA CON R ENTRADAS,
NOTACIÓN ABREVIADA
CAPA CON S NEURONAS
CAPA CON S NEURONAS,
NOTACIÓN ABREVIADA
RED CON 3 CAPAS
RED CON 3 CAPAS, NOTACIÓN
ABREVIADA
BLOCK DE RETARDO
BLOCK INTEGRADOR
RED RECURRENTE
EJEMPLO ILUSTRATIVO
Perceptrón:
Perceptrón de Una Capa
Perceptrón de una Neurona y dos
Inputs
Ejemplo:Reconocimiento de Patrones
Fin

Cap 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cap 1

Cargado por

Copyright:

Formatos disponibles

Capítulo 1.

• No recibe ninguna información del entorno

• Por ello se dice que estas RN son capaces

• ¿PARA QUE Y COMO ENTRENAR?

• Comprobar que la red funciona correctamente:

• Obtener resultados para ejemplos no utilizados

• Extracción de envolventes y extracción de parámetros

• El valor entero es asignado teniendo en cuenta el

0  No había píxeles en la submatriz.

Se obtienen las envolventes divididas cada una de ellas

Envolvente 1 Envolvente 2 Envolvente 3

Valor de Skewness ó Sesgo: Medida estadística que

 Los resultados mostraron que aproximadamente

Los parámetros de mayor importancia fueron las

También podría gustarte