Redes Neuronales

REDES NEURONALES ARTIFICIALES
Mara Jess de la Fuente

Dpto. Ingeniera de Sistemas y Automtica
Universidad de Valladolid
NDICE
Introduccin
Clasificacin de redes neuronales:
Estructura
Entrenamiento
Aplicacin de las redes neuronales a la identificacin de
sistemas
Las redes neuronales en el control
REDES NEURONALES
Neurona: base del funcionamiento del cerebro.
Sistema de procesamiento cerebral de la informacin:
Complejo, No lineal y Paralelo.
Elementos de que consta: sinapsis, axn, dentritas y soma

o cuerpo
NEURONA ARTIFICIAL
Neurona artificial: unidad de procesamiento de la informacin, es
un dispositivo simple de clculo que ante un vector de entradas
proporciona una nica salida.
Elementos:
Conjunto de entradas, xj
Pesos sinpticos, wi
Funcin de activacin:
w1x1+ w2x2 + ... + wnxn = a
Funcin de transferencia:
y = F (w1x1+ w2x2 + ... + wnxn )
Bias o polarizacin: entrada constate de magnitud 1, y peso b

que se introduce en el sumador
NEURONA ARTIFICIAL
Principales funciones de transferencia:
Lineal: y=ka
Escaln: y = 0 si a<0; y=1 si a>=0
Sigmoide
Gaussiana.
RNA de una capa

Una neurona aislada dispone de poca potencia de clculo.
Los nodos se conectan mediante la sinapsis
Las neuronas se agrupan formando una estructura llamada
capa.
Los pesos pasan a ser matrices W (n x m)
La salida de la red es un vector: Y=(y1, y2, ... , yn)T
Y=F(WX+b)
a1
y1
a2
y2
an
yn
RNA Multicapa
Redes multicapa: capas en cascada.
Tipos de capas:
Entrada
Salida
Oculta
No hay realimentacin => red
feedforward
Salida depende de entradas y pesos.
Si hay realimentacin => red recurrente
Efecto memoria
Salida depende tambin de la historia
pasada.
Una RNA es un aproximador general

de funciones no lineales.
Entrenamiento I
Entrenamiento: proceso de aprendizaje de la red.
Objetivo: tener un comportamiento deseado.
Mtodo:
Uso de un algoritmo para el ajuste de los parmetros libres
de la red: los pesos y las bias.
Convergencia: salidas de la red = salidas deseadas.
Tipos de entrenamiento:
Supervisado.
Pares de entrenamiento: entrada - salida deseada.
Error por cada par que se utiliza para ajustar parmetros
No-supervisado.
Solamente conjunto de entradas.
Salidas: la agrupacin o clasificacin por clases
Reforzado.
Perceptrones
McCulloch y Pitts, en 1943, publicaron el primer estudio sobre RNA.
El elemento central: perceptrn.
a
y
Solo permite discriminar entre dos clases

linealmente separables: XOR.
0.5= a = w1x1 + w2x2
No hay combinacin de x1 y x2 que resuelva

este
problema.
Solucin: ms capas o funciones de transferencia no lineales.
Aprendizaje del Perceptrn.

Algoritmo supervisado:
Aplicar patrn de entrada y calcular salida de la red
Si salida correcta, volver a 1
Si salida incorrecta
0 sumar a cada peso su entrada
1 restar a cada peso su entrada
Volver a 1
Proceso iterativo, si el problema es linealmente separable
este algoritmo converge en un tiempo finito.
Nos da los pesos y las bias de la red que resuelve el
problema.
Regla delta
Generalizacin del algoritmo del perceptrn para sistemas con
entradas y salidas continuas.
Se define: =T-A=
(salidas deseadas - salidas de la red).
Minimiza una funcin de coste basada en ese vector de error:
i = lr xi
Wi (n+1) = Wi (n) +
Razn de aprendizaje lr
Si las neuronas son

lineales=> un nico
mnimo
Redes Neuronales Lineales.

Funcin de transferencia lineal.
Algoritmo de entrenamiento de Widrow-Hoff o Delta, tiene en
cuenta la magnitud del error.
Entrenamiento:
Suma de los cuadrados de los errores sea mnima.
Superficie de error con mnimo nico.
Algoritmo tipo gradiente.
Aproximan funciones lineales.
Backpropagation
Clave en el resurgimiento de las redes neuronales.
Primera descripcin del algoritmo fue dada por Werbos en
1974
Generalizacin del algoritmo de Widrow-Hoff para redes
multicapa con funciones de transferencia no-lineales y
diferenciables.
1989 Hornik, Stinchcombe y White
Una red neuronal con una capa de sigmoides es capaz de
aproximar cualquier funcin con un nmero finito de
discontinuidades
Propiedad de la generalizacin.
La funcin de transferencia es no-lineal, la superficie de error
tiene varios mnimos locales.
Red Perceptron Multicapa (MLP)

a
y
Funcin acotada, montona creciente y diferenciable.

Red de tipo feedforward.
Suficiente con dos capas.
Algoritmo backpropagation I
Adelante
Descripcin:
Tras inicializar los pesos de forma aleatoria y con valores
pequeos, seleccionamos el primer par de entrenamiento.
Calculamos la salida de la red
Calculamos la diferencia entre la salida real de la red y la
salida deseada, con lo que obtenemos el vector de error
Atrs
Ajustamos los pesos de la red de forma que se minimice el

error
Repetimos los tres pasos anteriores para cada par de
entrenamiento hasta que el error para todos los conjuntos de
entrenamiento sea aceptable.
Descenso por la superficie del error

Clculo de derivadas del error respecto de los pesos y de las
bias.
Algoritmo backpropagation II
Detalles:
SSE: E=Ep= (ypk-opk)2
wij=- wij
Pasos:
Inicializacin:
Construccin de la red.
Inicializacin aleatoria de pesos y umbrales (-0.5, 0.5)
Criterio de terminacin (nmero mximo de iteraciones,).
Contador de iteraciones n=0.
Fase hacia delante:
Calcular la salida de la red para cada patrn de entrada.
Calcular el error total cometido (SSE)
Si la condicin de terminacin se satisface, parar
Fase hacia atrs:
Algoritmo backpropagation III
Fase hacia atrs:

Incrementar el contador n=n+1.
Paca cada neurona de salida calcualr: k=(okyk)f(netk) donde netj=iwijxi+bj
Para cada unidad oculta, calcular j=f(netj)kkwjk
Actualizar pesos: wij(n+1)=joi+wij(n)
Volver a la fase hacia delante.
Inconvenientes del algoritmo backpropagation:

Tiempo de entrenamiento no acotado.
Dependiente de las condiciones iniciales:
Parlisis de la red.
Mnimos locales.
Algoritmo Backpropagation IV
Underfitting.
Memorizacin o Sobreaprendizaje.
Caracterizacin de la red. Cuantas capas, cuantas
neuronas en cada capa,?
Redes Neuronales no supervisadas I

Autoorganizativas: durante el proceso de aprendizaje la red
debe descubrir por si misma regularidades o categoras => la
red debe autoorganizarse en funcin de las seales
procedentes del entorno.
Mapa de Rasgos Autoorganizados, SOM (Kohonen, 80)
Caractersticas:
Red competitiva
Arquitectura unidireccional de dos capas:
Capa de entrada: m neuronas una por cada vector de
entrada.
Capa segunda se realiza el procesamiento, formando el
mapa de rasgos. Tiene nx X ny neuronas operando en
paralelo.
Todas las neuronas de entrada estn conectadas a las
neuronas de la segunda capa, a travs de los pesos wij
Redes Neuronales No-Supervisadas II

Cada neurona (i,j) calcula la similitud entre el vector de
entradas y su vector de pesos
Vence la neurona cuyo vector de pesos es ms similar al
vector de entrada.
Cada neurona sirva para detectar alguna caracterstica del
vector de entrada.
Funcin de vecindad:
relacin entre neuronas
prximas en el mapa.
RNA no supervisadas III

Aprendizaje:
Inicializacin de los pesos wij
Presentacin de las entradas x(t)
Cada neurona calcula, la similitud entre su vector de pesos wij y
el vector de entrada x, usando la distancia Eucldea
Determinacin de la neurona ganadora:

Actualizacin de los pesos de la neurona ganadora y sus vecinas
Las dems neuronas no actualizan su peso

Si se ha alcanzado el nmero de iteraciones parar, si no volver
al paso 2.
VENTAJAS
Ventajas de las RNA:
Aprendizaje adaptativo: lo necesario es aplicar un buen

algoritmo y disponer de patrones (pares) de
entrenamiento.
Auto-organizacin => conduce a la generalizacin
Tolerancia a fallos: las redes pueden aprender patrones
que contienen ruido, distorsin o que estn
incompletos.
Operacin en tiempo real: procesan gran cantidad de
datos en poco tiempo.
Facilidad de insercin en tecnologa ya existente.
APLICACIONES
Deteccin de patrones.
Filtrado de seales
Segmentacin de datos
Control
Identificacin.
Redes Neuronales en
identificacin de sistemas
Identificacin de sistemas
La identificacin consiste en calcular un modelo del sistema
en base a datos experimentales.
Entrada: u(t)
Sistema
Salida: y(t)
Pasos:
Seleccionar una clase de modelos (CARIMA, Box-Jenkis,...)
Obtener un conjunto de datos experimentales
Seleccionar un modelo de la clase elegida
Estimar los parmetros (mtodo de Identificacin:
LS,RLS,IV,...)
Validacin (exactitud, adecuacin de uso)
RNA que representan el tiempo

Representacin del tiempo.
Tratamiento de seales.
Identificacin de modelos dinmicos
Control de sistemas.
Redes dinmicas:
Respuesta a:
Las entradas actuales
La historia pasada del sistema.
Dotar de memoria a la red:
Introduciendo directamente en la red tanto la seal
actual como los valores pasados.
Mediante conexiones recurrentes.
Red PML con ventana temporal

Ventanas de datos pasadas de las entradas y de las salidas.
Ventajas:
Algoritmo simple es suficiente
No problemas de realimentacin
Desventajas
Informacin til debe caber en la ventana temporal
Muchas entradas Sobreparametrizacin
u(t)
u(t-1)
u(t-2)
u(t-m)
y(t-1)
y(t-2)
ym (t)
Redes neuronales recurrentes

Redes neuronales
parcialmente recurrentes:
Conexiones recurrentes con
valores fijos
Algoritmo de aprendizaje
ve una red perceptrn
multicapa
Ejemplos:
Jordan
Elman
Redes neuronales recurrentes:
Todas las neuronas
interconectadas
Computacionalmente costoso
Estructuras neuronales para la

identificacin
Determinacin o eleccin de la estructura del modelo.
Es necesario un modelo neuronal?
Nos basamos en modelos establecidos en el caso lineal
Diseo:
Variables que forman parte del regresor (t)
Funcin no-lineal g(,) desde el espacio de regresiones al
espacio de salida NO en modelos lineales
y(t)=g((t))+e(t)
Estructura de caja negra: modelo de entrada- salida.
Elementos del regresor:
Entradas pasadas u(t-k)
Salidas pasadas medidas: y(t-k)
Salidas pasadas calculadas por el modelo:
u(t-k|)
Residuos pasados calculados: u(t-k)=y(t-k)-u(t-k|)
Modelo NARX
Ventajas:
Puede aproximar cualquier sistema no-lineal
arbitrariamente bien
No recurrente.
Desventajas:
Vector de regresin puede ser grande
No se modela el ruido
yt
g
y (t )
yt
ut
(t)=[y(t-1) ... y(t-n) u(t-k) ... u(t-m-k+1)]T
y (t ) g ( , (t )),
Modelo NOE
Corresponde a una red recurrente, ya que parte de las
entradas constituye la salida de la propia red.
Comprobacin difcil para modelo de prediccin estable
Entrenamiento laborioso por clculo correcto de gradientes
y t
yt
y (t )
yt
ut
(t ) [ y (t 1 | ) ... y (t n | ) u (t k ) ... u (t m k 1)]T
y (t | ) g ( (t ), )
Validacin
Validacin: es el proceso de comprobacin de la utilidad de
modelo obtenido:
Si el modelo concuerda con los datos observados
Si servir al propsito para el que fue creado
Si describe el sistema real
Enfoque neuronal:
Conjunto de datos de entrenamiento
Conjunto de datos de test.
Conjunto de datos de validacin.
Enfoque basado en correlaciones:
Test de blancura de los residuos

Ejemplo I
Fl, Ca0, Tl0

Reactor
Fr, Tr0
Camisa
Ca, Cb, Tl
Transforma un producto A en otro B

Reaccin qumica exotrmica
Se controla la temperatura
mediante
una
camisa por la que circula un
refrigerante
Salidas:
Ca
Cb Tl
Tr
Tr
Entradas:
Manipulables: Fl Fr
Perturbaciones medibles:
Ca0 Tl0 Tr0
Ejemplo II
El periodo de muestreo es T = 0.2 horas
Las entradas han de ser tales que provoquen todas las
salidas de inters
Ejemplo III
Se normalizan los datos de entrada y salida
Se entrenan cuatro redes, cada una modela una salida
Se usa el algoritmo backpropagation
Fl
Fr
R.N.A. Elman
Ca
R.N.A. Elman
Cb
R.N.A. Elman
Tl
R.N.A. Elman
Tr
Ca0
Tl0
Tr0
Ejemplo IV
Validacin del modelo.
De forma neuronal: test son saltos en Fr
Ejemplo V
Correlaciones: blancura de los residuos

Redes Neuronales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Redes Neuronales

Cargado por

Copyright:

Formatos disponibles

REDES NEURONALES ARTIFICIALES

Mara Jess de la Fuente

Elementos de que consta: sinapsis, axn, dentritas y soma

Bias o polarizacin: entrada constate de magnitud 1, y peso b

RNA de una capa

Una RNA es un aproximador general

Solo permite discriminar entre dos clases

0.5= a = w1x1 + w2x2

No hay combinacin de x1 y x2 que resuelva

Aprendizaje del Perceptrn.

Si las neuronas son

Redes Neuronales Lineales.

Aproximan funciones lineales.

Red Perceptron Multicapa (MLP)

Funcin acotada, montona creciente y diferenciable.

Ajustamos los pesos de la red de forma que se minimice el

Descenso por la superficie del error

Algoritmo backpropagation III

Fase hacia atrs:

Inconvenientes del algoritmo backpropagation:

Redes Neuronales no supervisadas I

Redes Neuronales No-Supervisadas II

RNA no supervisadas III

Determinacin de la neurona ganadora:

Las dems neuronas no actualizan su peso

Aprendizaje adaptativo: lo necesario es aplicar un buen

RNA que representan el tiempo

Red PML con ventana temporal

Redes neuronales recurrentes

Estructuras neuronales para la

Residuos pasados calculados: u(t-k)=y(t-k)-u(t-k|)

(t)=[y(t-1) ... y(t-n) u(t-k) ... u(t-m-k+1)]T

(t ) [ y (t 1 | ) ... y (t n | ) u (t k ) ... u (t m k 1)]T

Fl, Ca0, Tl0

Transforma un producto A en otro B

Correlaciones: blancura de los residuos

También podría gustarte