Está en la página 1de 145

Procesamiento Digital de Seales aplicado a Redes Neuronales

PROCESAMIENTO DIGITAL DE
SEALES Y REDES NEURONALES

Juan Carlos Morales Ramos


Arturo Rocha Miranda

Mayo 2004
1

Procesamiento Digital de Seales aplicado a Redes Neuronales

INDICE

1. Introduccin al procesamiento digital de seales...................................................... 4


1.1 Conceptos bsicos sobre sistemas discretos...................................................... 7
1.1.1 Estabilidad de un sistema discreto.......................................................13
1.1.2 Respuesta en frecuencia de un sistema discreto..................................13
1.1.2.1 Propiedades de periodicidad de exponenciales discretas................. 13
1.1.2.2 Respuesta de un sistema discreto ante una exponencial peridica...14
1.1.3 Transformada de Fourier de una secuencia................................................... 18
1.1.4 Transformada z..............................................................................................20
1.1.4.1 Funcin de transferencia en z...........................................................22
1.1.4.2 Transformada inversa....................................................................... 23
1.1.5 Muestreo de seales...................................................................................... 25
2. Filtros digitales.............................................................................................................. 34
2.1 Clases de filtros digitales................................................................................. 35
2.2 Filtros de fase lineal o no dispersivos.............................................................. 37
2.3 Causalidad y sus implicaciones....................................................................... 38
2.4 Diseo de filtros no recursivos (FIR)............................................................... 44
2.4.1 Filtros FIR simtricos y antisimtricos................................................45
2.4.2 Diseo de filtros FIR de fase lineal usando ventanas..........................46
2.4.3 El mtodo de diseo de filtros mediante la ventana de Kiser............51
2.4.4 Transformaciones sobre los filtros.......................................................49
2.5 Diseo de filtros recursivos (IIR)......................................................................54
2.5.1 Diseo de filtros IIR mediante transformadas bilineales.....................60
2.5.2 Implementacin de los filtros digitales.................................................67
2.6 Efectos de la cuantificacin en los filtros.........................................................71
2.6.1 Efectos de truncamiento y redondeo....................................................71
2.6.2 Cuantificacin de seales.....................................................................73
2.6.3 Cuantificacin de los coeficientes........................................................75
2.6.4 Cuantificacin de resultados de operaciones........................................76
3. Las redes
neuronales. ..................................................................................................
77
3.1 Historia de las redes
neuronales. ......................................................................73
3.2 Generalidades....................................................................................................79
3.2.1 Definiciones de una red neuronal. ........................................................75
3.2.2 Ventajas que ofrecen las redes
neuronales. ..........................................81
3.2.2.1 Aprendizaje
adaptativo. .....................................................................82
3.2.2.2 Autoorganizacin..............................................................................82
3.2.2.3 Tolerancia a
fallos. ...........................................................................83
3.2.2.4 Operacin en tiempo
real. .................................................................83
2

Procesamiento Digital de Seales aplicado a Redes Neuronales

3.2.2.5 Fcil insercin dentro de la tecnologa


existente. .............................83
3.3 Redes neuronales y computadoras
digitales......................................................84
3.3.1 Conceptos Bsicos................................................................................85
3.3.2 Elementos bsicos que componen una red
neuronal.........................85
3.3.3 Funcin de entrada (input function). ....................................................86
3.3.4 Funcin de activacin (activation function). .......................................87
3.3.5 Funcin de salida (output function). .....................................................89
4 Aprendizaje, Validacin y Codificacin..................................................................... 90
4.1 Niveles o capas de una red
neuronal. ...............................................................91
4.2 Tipos de neuronas
artificiales. .........................................................................91
4.3 Tcnicas de decisin. .......................................................................................92
4.4 Mecanismos de
aprendizaje..............................................................................93
4.4.1 Aprendizaje
supervisado.......................................................................95
4.4.1.1 Aprendizaje por correccin de
error. ................................................95
4.4.1.2 Aprendizaje por
refuerzo...................................................................96
4.4.1.3 Aprendizaje
estocstico. ...................................................................96
4.4.2 Aprendizaje no
supervisado..................................................................97
4.4.2.1 Aprendizaje
hebbiano. ......................................................................97
4.4.2.2 Aprendizaje competitivo y
comparativo. .........................................97
4.5 Eleccin del conjunto inicial de
pesos. ............................................................98
4.5.1 Detencin del proceso de
aprendizaje. ................................................98
4.5.2 Codificacin de los datos de entrada....................................................98
4.5.2.1 Codificacin de los atributos
numricos. ..........................................99
4.5.2.2 Codificacin de los atributos simblicos. .......................................100
4.5.2.3 Resumen de los procedimientos de
codificacin.............................101
4.6 Validacin de la red
neuronal. .......................................................................101
4.7 Cuestiones a resolver al trabajar con una red
neuronal..................................101
3

Procesamiento Digital de Seales aplicado a Redes Neuronales

4.8 Principales Topologas....................................................................................102


4.8.1 Topologa de las redes neuronales. .....................................................102
4.8.2 Redes monocapa. ................................................................................102
4.8.3 Redes multicapa.......................................................... ........................102
4.8.4 Conexin entre neuronas......................................................................103
4.9 Redes de propagacin hacia atrs
(backpropagation)...................................103
4.9.1 Ejemplo......104
4.9.2 Estructura de la Red Hopfield. ..........................................................105
4.9.3 Simulated Annealing aplicada a una Red
Hopfield...........................106
4.9.4 Asociaciones entre la informacin de entrada y salida. ..........
..107
4.9.4.1 Redes heteroasociativas. .......................................................
.108
4.9.4.2 Redes autoasociativas. ..........................................................
.108
5 Aplicaciones........................................................ ........................................................... 102
5.1 Aplicaciones de las redes
neuronales. ...........................................................111
5.1.1 Asociacin y
clasificacin. ................................................................112
5.1.2 Regeneracin de
patrones. .................................................................113
5.1.3 Regeneracin y generalizacin.
.........................................................113
5.1.4 Optimizacin. ....................................................................................113
5.2 Casos concretos de
aplicacin. .....................................................................113
5.2.1 Planificacin del staff (cuerpo) de
empleados. .................................114
5.2.2 Planificacin de la demanda de
materiales. ......................................115
5.2.3 Puntuacin para la solicitud de un
crdito. .......................................117
6 Software Comerciales................................................................................................... 120
6.1 Aplicaciones del NeurOn-Line........122
Conclusiones...................................................................................................................... 132
Bibliografa........................................................................................................................ 133

Procesamiento Digital de Seales aplicado a Redes Neuronales

Introduccin
El siglo XX se ha caracterizado por un notable desarrollo en la tecnologa del manejo de
informacin, esto es, recoleccin procesamiento y distribucin de informacin. Se han
instalado grandes redes telefnicas, se inventaron la radio y la televisin, se pusieron en
rbita satlites de comunicacin y el crecimiento sin precedentes de la industria de
comunicacin y procesamiento de seales por diferentes medios.
Conforme el tiempo y la tecnologa avanzan, observamos una mejor relacin entre estas
reas, tan es as, que en la actualidad no es posible hablar por separado de una o de otra.
Hoy en da grandes Organizaciones, con cientos de oficinas distribuidas en todo el mundo
tienen la necesidad de examinar de manera cotidiana el estado actual de las tecnologas de
procesamiento de datos con tan solo oprimir una tecla. Pero esto no termina aqu, cada vez
se requieren de sistemas cada vez ms sofisticados en el procesamiento de las seales
digitales, as como su interpretacin y manipulacin, todo esto con el fin de hacer la vida un
tanto mas sencilla y la fcil resolucin de problemas de manera inmediata.
Si bien es cierto que la industria de las computadoras es creciente, pero si la comparamos
con otras industrias como la automotriz o con la del transporte areo, esta ha mostrado ha
demostrado un crecimiento verdaderamente grandioso. En poco tiempo la industria ha
avanzado de tal manera que para la realizacin de tareas como el procesamiento de seales
digitales ha implementado desde los mas rsticos instrumentos mecnicos hasta las grandes
redes de transmisin, interpretacin y manipulacin de las seales. Para esto el Hombre ha
creado entre otras, redes que cuyo objetivo no es otro que realizar las funciones mas
avanzadas de la inteligencia humana como son la de realizar la interpretacin de los sucesos
cotidianos de la vida que para tomar una resolucin para resolver un problema es necesario
tomar una decisin inmediata partiendo del hecho que dicha decisin deba de ser lo mas
exacta y acertada posible.
Las computadoras y las redes informticas han producido un gran impacto en nuestra
sociedad un impacto de enormes consecuencias, estas herramientas revolucionarias han
multiplicado la productividad y eficiencia del trabajo, tanto como para las empresas y
usuarios independientes. Ahora las redes neuronales son la propuesta de una solucin a los
problemas de gran complejidad, los cuales requieren de una gran implementacin ya sea de
soluciones a gran escala o dificultad.
El propsito de esta tesis es el mostrar un estudio sobre la aplicacin y procesamiento de las
seales digitales en las redes neuronales. Esta tesis esta estructurada en seis captulos. En el
primer captulo se presentan los conceptos bsicos sobre los sistemas discretos como
Estabilidad, Respuesta en frecuencia as como la aplicacin de las propiedades de la
funcin de transferencia en Z y transformada Z, la aplicacin de la transformada de Fourier
en las seales digitales. As tambin el muestreo de seales. En el captulo dos se analizarn
los tipos, diseo e implementacin de filtros digitales En el capitulo 3 se introducir al
mundo de las redes neuronales su historia as como la definicin generalidades y conceptos
bsicos de las mismas. En el captulo cuatro se darn a conocer las capacidades de las redes
neuronales y sus topologas. En el captulo cinco se dar a conocer la aplicacin del
5

Procesamiento Digital de Seales aplicado a Redes Neuronales

procesamiento de seales digitales usando las redes neuronales as como las aplicaciones
generales de las mismas. En el capitulo seis se hablara del software empleado por las redes
neuronales.

Procesamiento Digital de Seales aplicado a Redes Neuronales

CAPITULO I
ANTECEDENTES

Procesamiento Digital de Seales aplicado a Redes Neuronales

1. Introduccin al Procesamiento digital de Seales.


El Procesamiento de Seales posee una larga y rica historia. Es una tecnologa que se
entronca con un inmenso conjunto de disciplinas entre las que se encuentran las
telecomunicaciones, el control, la exploracin del espacio, la medicina y la arqueologa, por
nombrar solo unas pocas. Hoy en da, esta afirmacin es incluso ms cierta con la televisin
digital, los sistema de informacin y el entretenimiento multimedia. Es ms, a medida que
los sistemas de comunicacin se van convirtiendo cada vez ms en sistemas sin hilos,
mviles y multifuncin, la importancia de un procesamiento de seales sofisticado en
dichos equipos se hace cada vez ms relevante.
El Procesamiento de seales trata de la representacin, transformacin y manipulacin
de seales y de la importancia que contienen. Cuando se refiere al procesado digital de
seales, se refiere a la representacin mediante secuencias de nmeros de precisin finita y
el procesado se realiza utilizando un computador digital.
A menudo es deseable que estos sistemas funcionen en tiempo real, lo que significa
que el sistema en tiempo discreto se implementa de forma que las muestras de salida se
calculan a la misma velocidad a la que se muestrea la seal en tiempo continuo. Son
muchas las aplicaciones que requieren esta especificacin. El tratamiento en tiempo
discreto y en tiempo real de seales en tiempo continuo es prctica comn en sistema de
control, comunicaciones, radar, sonar, codificacin y realce de voz y vdeo, ingeniera
biomdica y un largo etctera.
Otro tipo de problemas del tratamiento de seales al que se enfrenta es la
interpretacin de seales. Por ejemplo, en un sistema de reconocimiento de voz el objetivo
es comprender la seal de entrada. Tpicamente, un sistema como ste aplicar un
procesado digital previo (filtrado, estimacin de parmetros, etc.) seguido por un sistema de
reconocimiento de patrones que produzca una representacin simblica.
Los problemas de tratamiento de seales no estn confinados, por supuesto, a seales
unidimensionales. Aunque hay algunas diferencias fundamentales entre las teoras del
tratamiento de seales unidimensionales y multidimensionales, una buena parte del
material que se presenta aqu tiene su contrapartida en sistemas multidimensionales. Entre
ellas destaca las aplicadas al procesamiento de imgenes digitales.
El tratamiento de seales en tiempo discreto ha avanzado con pasos desiguales
durante un largo periodo de tiempo. Hasta principios de los aos cincuenta el tratamiento
de seales se realizaban con circuitos electrnicos o incluso con dispositivos mecnicos.
Aunque los computadores digitales ya estaban disponibles en entornos de negocios y en
laboratorios cientficos, stos eran caros y de capacidad relativamente limitada. Uno de los
primeros usos de los computadores digitales en el tratamiento de seales fue en la
prospeccin petrolfera. Se grababan los datos ssmicos en cintas magnticas para su
procesamiento posterior. Este tipo de tratamiento de seales no se poda realizar
generalmente en tiempo real. Aunque el procesamiento de seales mediante computadores
digitales ofreca tremendas ventajas de flexibilidad, sin embargo, el procesado no se poda
realizar en tiempo real. Las aportaciones de Cooley y Tukey (1965) de un algoritmo
8

Procesamiento Digital de Seales aplicado a Redes Neuronales

eficiente para el clculo de las transformadas de Fourier aceler el uso del computador
digital. Muchas aplicaciones desarrolladas requeran del anlisis espectral de la seal y con
las nuevas transformadas rpidas se redujo en varios rdenes de magnitud el tiempo de
cmputo. Adems, se dieron cuenta de que el nuevo algoritmo se podra implementar en
hardware digital especfico, por lo que muchos algoritmos de tratamiento digital de seales
que previamente eran impracticables comenzaron a verse como posibles.
Otro desarrollo importante en la historia del Procesamiento de Seales ocurri en el
terreno de la Microelectrnica. Aunque los primeros microprocesadores eran demasiado
lentos para implementar en tiempo real la mayora de los sistemas en tiempo discreto, a
mediados de los ochenta la tecnologa de los circuitos integrados haba avanzado hasta el
nivel de permitir la realizacin de microcomputadores en coma fijo y coma flotante con
arquitecturas especialmente diseadas para realizar algoritmos de procesamiento de seales
en tiempo discreto. A estos procesadores se les conoce por el acrnimo de DSP (Digital
Signal Processor). Con esta tecnologa lleg, por primera vez, la posibilidad de una amplia
aplicacin de las tcnicas de tratamiento de seales en tiempo discreto. Aun ms, hoy en da
los diseos de los microprocesadores genricos son ampliados en registros e instrucciones
para poder destinarlos a tareas de procesamiento de seales, sea el caso ms llamativo el
conjunto de instrucciones MMX insertdas en la familia INTEL a partir del mtico
PENTIUM.
De las diferentes materias que involucra el tratamiento digital de seales, en este tema
slo se va a versar sobre los filtros digitales lineales e invariantes en el tiempo, abreviados
por la sigla LTI (Linear Time Invariant). La eleccin por estos filtros viene dada por su gran
difusin actual, por ser un captulo inicitico al procesado digital de seales y por
corresponder con la evolucin natural del temario de Electrnica Industrial. No obstante, el
Procesamiento Digital es por si misma una propia asignatura, lo que indica el carcter
bsico de este captulo. Para profundizar ms sobre los filtros digitales y conocer en
amplitud esta disciplina,se puede empezar por elegir alguno de los libros recomendados en
el apartado de bibliografa.
Los filtros digitales LTI son, por ejemplo, usuales en el procesamiento del audio. Los
equipos de msica vienen dotados con filtros que le permite al oyente modificar las
cantidades relativas de energa de baja frecuencia (graves) y la energa de alta frecuencia
(agudos). Estos filtros varan sus respuestas en frecuencias mediante la manipulacin de los
controles de tono.
Otra clase comn de filtros LTI son aquellos en los que la salida del filtro es una
aproximacin de la derivada de su entrada. Los filtros diferenciadores son tiles para
acentuar las transiciones rpidas de una seal, y una aplicacin en la que se emplea a
menudo es en la intensificacin de los bordes. La figura 1.1 ilustra el efecto de un filtro
diferenciador en una imagen. La figura muestra dos imgenes, la original y el resultado del
procesamiento con un filtro que tiene una respuesta en frecuencia lineal. Como la derivada
en los bordes de la imagen es mayor que en las regiones donde la intensidad vara con
lentitud en el espacio, el efecto de los filtros diferenciadores es resaltar los bordes.

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 1. Procesamiento de un filtro diferencial sobre una seal bidimensional


Los filtros selectivos en frecuencia que permiten el paso de seales sin distorsin en
una o en un conjunto de bandas de frecuencia, y atenan o eliminan totalmente las seales
en el resto de las bandas son otra clase importante de filtros LTI. Una importante aplicacin
de los filtros selectivos estn en los sistemas de comunicaciones. Son la base para los
sistemas de modulacin en amplitud (AM), en la cual la informacin de cada canal se pone
en una frecuencia separada y luego en el receptor se extrae los canales mediante filtros
selectivos en frecuencia.
Es comn emplear filtros de tiempo discreto en el anlisis de secuencias de datos
econmicos tales como el ndice del mercado de valores. A menudo las variaciones de largo
plazo (las cuales corresponden a bajas frecuencias) tienen un significado diferente al de
variaciones de corto plazo (las cuales corresponden a altas frecuencias), y es til analizar
estos componentes por separado. La separacin de estos componentes casi siempre se lleva
a cabo mediante filtros selectivos en frecuencia. El filtrado de secuencias de datos
econmicos tambin se usa para suavizar los datos y eliminar las fluctuaciones aleatorias
(que son por lo general de alta frecuencia) sobrepuestas a los datos significativos.
Se acaban de citar algunas de las muchas aplicaciones del filtrado digital LTI que en
este captulo sern tratados. En detalle, el tema del filtrado abarca muchos problemas, tales
como los que involucran su diseo y su implementacin. El principal objetivo de este
captulo es introducir el concepto bsico del filtrado de tiempo discreto. Los conceptos
primarios provienen directamente de las nociones bsicas de los sistemas discretos y de las
propiedades de las transformadas de Fourier. Entonces, adems de la introduccin de una
importante rea de aplicacin, la discusin servir, tambin, para una mejor comprensin
de las propiedades y de la importancia de los sistemas discretos y de la transformada de
Fourier. El captulo se inicia con un repaso a la naturaleza de los sistemas discretos,
analizando detenidamente las transformadas de Fourier de las secuencias y el proceso de
muestreo de las seales continuas. En el apartado 1.2 las diferencias entre filtros analgicos
y digitales sern tratadas y posteriormente se proceder a la clasificacin de los filtros de
tiempo discreto. Antes de entrar en el diseo se analizar las implicaciones de la causalidad.
Las secciones 1.3 y 1.4 presentarn las tcnicas de diseo de los filtros no recursivos y
recursivos respectivamente. Mientras que 1.5 y 1.6 tratarn sobre las problemticas de la
10

Procesamiento Digital de Seales aplicado a Redes Neuronales

implementacin de estos filtros y de los efectos producidos de la cuantificacin de la seal.


Por ltimo, sealar que para una mejor comprensin de la unidad temtica se han
elaborado algunos ficheros en MATLAB. stos sern presentados a lo largo del captulo, el
alumno puede adquirirlos en el servidor WEB de departamento.
1.1 Conceptos bsicos sobre sistemas discretos
Posiblemente lo primero en preguntarse sera qu es un filtro digital ?, pues bien,
segn se estudi en el anterior captulo sobre Tratamiento Analgico de la Seal, los filtros
tratan de extraer alguna caracterstica de la seal de entrada; en trminos frecuenciales, se
hablaba del paso de una determinada banda del espectro de la seal de entrada. Por lo tanto,
los filtros digitales son sistemas discretos que tratan de extraer alguna caracterstica
frecuencial de una seal muestreada.
Pero ante esta definicin, aparecen los vocablos tpicos del Procesamiento Digital,
tales como seal muestreada o sistema discreto. Por lo que se va a proceder a describir los
conceptos bsicos sobre los sistemas discretos. Las seales en tiempo discreto surgen si el
sistema involucra la operacin de muestreo de seales en tiempo continuo. La seal
muestreada es
donde T es el periodo de muestreo. Dicha secuencia de valores.
que aparecen de la operacin de muestreo normalmente se escribe como . Si el sistema
incluye un proceso iterativo realizado por una computadora digital, la seal involucrada es
una secuencia de nmeros
La secuencia de nmeros normalmente se escribe
como {xk} en donde k, entero asociado al elemento, es el ndice del mismo. Este ndice
podr ser positivo o negativo.

( 1.1 )
El ndice 0 es el origen de la secuencia. Aunque {xk} es una secuencia de nmeros,
sta se puede considerar como una seal muestreada de x(t) cuando el periodo de muestreo
T es de 1 segundo.

11

Procesamiento Digital de Seales aplicado a Redes Neuronales

Ejemplo 1.1
Obtener la secuencia discreta de un armnico de 100 Hz, de amplitud 0.5 V que ha
sido muestreado con una frecuencia de 1kHz, sabiendo que el desfase en la adquisicin es
de 30 y el tiempo total de muestreo ha sido de 20 ms. No considere los efectos de
cuantificacin de la seal.
Una sinusoide de tiempo continuo viene dada por la frmula matemtica siguiente:

( 1.2 )
Si se obtiene una seal de tiempo discreto tomando regularmente muestras {xk} a la
frecuencia de muestreo
, se obtendr:

(1.3 )
Para los valores indicados del ejercicio, la secuencia muestreada tendr como
resultado:

A continuacin se presenta la resolucin mediante MATLAB.

12

Procesamiento Digital de Seales aplicado a Redes Neuronales

Habiendo definido el concepto de secuencia, al que se ha asociado con el resultado del


muestreo, el trmino de sistema discreto puede ser entendido. Un sistema discreto es un
algoritmo que permite transformar una secuencia en otra.
(1.4 )
Como ejemplo de sistema discreto se podra considerar cualquier programa de
computador que transforme una tabla de valores en otra, por ejemplo, la obtencin de
cuadrados, la suma de los k primeros nmeros, la media de una serie de muestras, etc. Los
sistemas discretos pueden clasificarse en estticos o dinmicos. Un sistema discreto es
esttico cuando el elemento de la secuencia de salida de un cierto ndice depende
nicamente del elemento de la secuencia de entrada del mismo ndice. Por ejemplo, el
sistema que genera una secuencia cuyos elementos son los cuadrados de los
correspondientes elementos de una secuencia de entrada. En caso contrario, el sistema se
denomina dinmico, esto es, la secuencia de salida de un cierto ndice depende de las
secuencias de entrada y de salida de rdenes distintos al suyo. En la figura 1.2 el sistema
discreto es dinmico, ya que ante una entrada en escaln unitario la secuencia de salida no
slo depende del ndice de la secuencia de entrada sino tambin de los estados anteriores.

Figura 1. 2 Sistema discreto dinmico


Un sistema discreto es causal si el valor de un elemento de la secuencia de salida
depende nicamente de la secuencia de entrada y de salida de menor o igual ndice.

(1.5 )
Los sistemas discretos que no verifiquen esta propiedad se denominan no causales. Si
la funcin que relaciona cada elemento de la secuencia de salida es lineal, el sistema se
denomina asimismo lineal. Centrados en los sistemas dinmicos causales, un sistema ser
lineal, si la funcin expresada en (1. 5) es lineal, es decir, de la forma:

13

Procesamiento Digital de Seales aplicado a Redes Neuronales

( 1.6 )
Cuando ai y bi son constantes se dice que el sistema lineal es invariante en el tiempo.
A stos se les conoce por el acrnimo de LTI (Linear Time Invariant). Un sistema lineal
invariante verifica el principio de linealidad, es decir, que, en idnticas condiciones
iniciales, a entradas suma de entradas o producto por una constante, le corresponden
salidas sumas o productos de la misma constante. La figura 1.2 ilustra este principio.

Figura 1. 3 Linealidad de los sistemas discretos dinmicos lineales e


Invariantes.
En el presente tema slo van a ser considerados los filtros digitales que sean sistemas
discretos dinmicos lineales e invariantes por lo que normalmente se omitirn los adjetivos
para su definicin. Las ecuaciones usadas para definir estos sistemas se denominan
"ecuaciones en diferencias" y juegan un papel similar al de las ecuaciones diferenciales
lineales en los sistemas continuos.
Se denomina secuencia de ponderacin a la que se obtiene en la salida del sistema
cuando se aplica a la entrada una secuencia tipo impulso.

( 1.7 )
Si el sistema es causal es igual a cero para k < 0.
Para obtener la secuencia de salida sobre un sistema lineal ante una secuencia de
entrada dada habr de aplicar el operador convolucin discreta; este operador se define
como:
14

Procesamiento Digital de Seales aplicado a Redes Neuronales

( 1.8 )
donde {gk} representa la secuencia de ponderacin. En ellas cada elemento de la
secuencia de salida es calculada por la expresin:
Ejemplo 1.2
Dada la ecuacin en diferencia:

( 1.10 )
Obtener la secuencia de ponderacin y determinar la salida ante una entrada en
escaln.
Para obtener la secuencia de ponderacin habr de aplicarle una entrada impulsional,
de forma que la entrada ser del tipo .
La evolucin de la salida puede ser
realizada a travs de una tabla, en las que se van obtenido los resultados temporales al
aplicar la ecuacin en diferencias:

Luego la secuencia de ponderacin del sistema LTI es:

15

Procesamiento Digital de Seales aplicado a Redes Neuronales

Para calcular la respuesta en {escaln} se aplicar el operador convolucin, (1. 9),donde la


seal de entrada ser

.La secuencia de salida corresponder a:

16

Procesamiento Digital de Seales aplicado a Redes Neuronales

1.1.1 Estabilidad de un sistema discreto


Se dice que un sistema discreto es estable si, ante cualquier secuencia de entrada
acotada la secuencia de salida es tambin acotada.
Para sistemas lineales, la condicin de suficiencia de estabilidad debe cumplir que la
secuencia de ponderacin sea absolutamente sumable:

( 1.11 )
1.1.2 Respuesta en frecuencia de un sistema discreto
Al excitar un sistema continuo LTI con seales sinusoidales, este experimento
permite desarrollar el anlisis en el dominio de la frecuencia para dichos sistemas. De
manera paralela, en los sistemas discretos se va a ver como se puede obtener una
representacin frecuencial de los mismos que sirvan para caracterizarlos.
Antes de entrar en la obtencin de la respuesta en frecuencias se requiere analizar las
propiedades de las seales exponenciales discretas. Tras su estudio se estar en condiciones
de comprender mejor los mecanismos inherentes a la respuesta en frecuencia de los
sistemas discretos.
1.1.2.1

Propiedades de periodicidad de exponenciales discretas

As como existen muchas similitudes entre las seales continuas y las discretas,
tambin hay importantes diferencias. Una de stas concierne a la seal exponencial discreta
. En seales continuas,

, mientras ms grande sea la magnitud de , mayor ser la

velocidad de oscilacin de la seal, en cambio, las seales discretas


cada 2 :

son peridicas

( 1.12 )
Se observa que la exponencial de frecuencia
es la misma que aquella con
.
Por tanto, al considerar las exponenciales complejas, se tomar en cuenta un intervalo de
frecuencia 2w. Aunque de acuerdo con la anterior expresin, cualquier rango de longitud 2
sera adecuado, en la mayora de las ocasiones se suele usar el intervalo
17

Procesamiento Digital de Seales aplicado a Redes Neuronales

Debido a la periodicidad que implica la ecuacin (1.12) , la seal no tiene un


incremento continuo en la velocidad de oscilacin. Por el contrario, conforme se
incrementa a partir de 0, se obtiene que la seal oscila ms rpido hasta que se alcanza
. Conforme aumente la frecuencia a partir de este punto disminuir la velocidad de
oscilacin hasta llegar a 2 /T, la cual produce la misma secuencia constante que
1.1.2.2 Respuesta de un sistema discreto ante una exponencial peridica
Para facilitar el estudio se considerar que el periodo de muestreo es 1, T = 1. Slo se
considerar el carcter de la secuencia, independizndolo de T. Sea un sistema de secuencia
de ponderacin {gk} y considrese que su entrada es excitada por una secuencia
exponencial peridica:

( 1.13 )
Cuyos elementos son funcin de un parmetro de . La secuencia de salida segn la
aplicacin de la convolucin discreta, (1.9) ser:

( 1.14 )
El ndice de la secuencia es k, con lo que el sumatorio es un factor independiente de
este ndice, por tanto:

( 1.15 )
Si se define la funcin

( 1.16 )
18

Procesamiento Digital de Seales aplicado a Redes Neuronales

La expresin queda:

( 1.17 )
Esta expresin permite ver como, cuando el sistema es excitado ante la secuencia de
una exponencial discreta de frecuencia angular , (1. 13), los elementos de la secuencia de
salida son calculados multiplicando el valor de la entrada por el operador G(
Este operador G( , se denomina respuesta en frecuencia del sistema discreto
considerado. Es una funcin del parmetro real y peridica respecto a l, como puede
apreciarse observando 1.16 . Su periodo es 2. La respuesta en frecuencia es as mismo
una funcin compleja, la cual requiere cualquier representacin grfica de la misma en dos
curvas, por ejemplo, haciendo uso del diagrama de Bode.
Ejemplo 1.3
Determinar la respuesta frecuencia de un filtro binomial cuya secuencia de ponderacin
es {1/4, 1/2, 1/4}.
Al aplicar (1.16) sobre la secuencia de ponderacin dada:

dando valores de 0 hasta se conseguir la respuesta. Aunque G( , es una funcin


continua, con el propsito de representarla en el diagrama de Bode se hacen, por ejemplo,
64 intervalos entre 0 y , confeccionndose la tabla siguiente:

19

Procesamiento Digital de Seales aplicado a Redes Neuronales

Imponiendo las condiciones adecuadas a la funcin de peridica G(W), continuidad a


trazos con derivadas de variacin acotada en los intervalos de continuidad, entonces la
expresin (1. 16) es el desarrollo en series de Fourier de G(W), siendo los elementos de la
secuencia de ponderacin, {gk}, los coeficientes de dicho desarrollo. Este hecho permite
utilizar la expresin del clculo de los coeficientes del desarrollo para obtener el valor de la
secuencia de ponderacin a partir de la respuesta frecuencial. Se tiene as que:

( 1.18 )
Esta expresin (1.18) permite realizar la operacin inversa a la efectuada en (1.16).
Antes, de la secuencia de ponderacin, {gk}, se obtena la respuesta en frecuencia G(W),
mientras que ahora, con (1.18), de esta funcin G(W) se obtiene la secuencia de
ponderacin.
De igual forma que se vio en el diseo de filtros analgicos, se puede establecer una
estrategia de definicin del filtro digital mediante la respuesta frecuencial deseada. De
manera que se puede plantear la determinacin de su secuencia de ponderacin a partir del
conocimiento de su respuesta frecuencial y mediante el uso de (1. 18) obtener los
coeficientes del filtro.
20

Procesamiento Digital de Seales aplicado a Redes Neuronales

Ejemplo 1.4
En la figura 1.4 se representa la respuesta en frecuencia de un filtro paso bajo
normalizado, cuya frecuencia de corte es c con valor de 2. Determinar la secuencia de
ponderacin del filtro.

Figura 1. 4 Respuesta frecuencia de un filtro paso bajo discreto.


Usando la expresin (1.18) y extendindola entre c c quedar con:

Cuyos valores

sern:

Ntese que el filtro es no causal.

21

Procesamiento Digital de Seales aplicado a Redes Neuronales

1.1.3 Transformada de Fourier de una secuencia


La forma de asociar la secuencia de ponderacin {gk} a la funcin G(W), puede ser
extendida a cualquier secuencia que cumpla determinadas propiedades. As se construye lo
que se denomina la transformada discreta de Fourier de una secuencia, a sta se la conoce
por las siglas DFT (Discrete Fourier Transform). De este modo, dada una secuencia, {xk},
se define su transformada de Fourier como la funcin:

( 1.19 )
sta es igualmente peridica, de ciclo 2, y en las condiciones antes indicadas es un
desarrollo en serie de Fourier, lo que permite definir la transformada inversa:

( 1.20 )
La transformada de Fourier de una secuencia es una funcin compleja, siendo
usualmente representada grficamente por sus curvas de mdulo y de argumento. Al igual
que ya se vio en los sistemas continuos, la utilidad ms importante que se va a hacer de la
transformacin de Fourier es la que se deriva de la relacin existente entre las
transformadas de Fourier de las secuencias de entrada y de salida de un sistema LTI y su
respuesta en frecuencia, de manera que:
( 1.21 )
22

Procesamiento Digital de Seales aplicado a Redes Neuronales

Esta relacin permite tratar a los sistemas discretos de una manera similar con lo que se
proceda con los continuos; dando un procedimiento para determinar la secuencia de salida
a partir de la respuesta en frecuencia, ver figura 1.5. Conocida la respuesta en frecuencia
del sistema y la transformada discreta de la secuencia de entrada, se determinar la
transformada de la secuencia de salida segn (1. 21), y posteriormente se aplicar la
transformada inversa, obteniendo la secuencia de la salida.

Figura 1. 5 Relacin fundamental de los sistemas discretos


Ejemplo 1.5
Dado la respuesta en frecuencia de un filtro binomial de orden 2 (ver ejemplo 1.3):

y siendo {xk }= {1,1,0,0,0,...} la excitacin al sistema, calcular la secuencia de salida.


En primer lugar se proceder a calcular la DFT de la secuencia de entrada:

23

Procesamiento Digital de Seales aplicado a Redes Neuronales

Aplicando la relacin fundamental visto en (1. 21) se tendr que:

Por tanto, la secuencia de salida valdr:

1.1.4 Transformada z
La variable compleja z es una transformacin no lineal de la variable de Fourier, con
el propsito de que la funcin de transferencia del sistema discreto obtenida de esta
transformacin sea racional. Dada una secuencia real {xk} se define su transformada en z
como una funcin compleja:

( 1.22 )
En estas expresiones se pueden observar las ventajas de, por una parte, no ser
funciones peridicas, y por otra, de ser racionales. Adems, es fcil ver que la definicin de
transformada de Fourier a z, se consigue haciendo:
( 1.23 )

24

Procesamiento Digital de Seales aplicado a Redes Neuronales

As, por ejemplo, la transformada en z de una secuencia impulso ser:

( 1.24 )
La transformada de la secuencia en escaln resultar:

( 1.25 )
Otro ejemplo tpico, generalizacin del anterior, es la secuencia exponencial:

( 1.26 )
que, por ser una serie geomtrica, ser convergente para
su suma valdr:

, es decir |z|>|a|, y

( 1.27 )
Por ltimo, la transformada del desplazamiento ser:

( 1.28 )

25

Procesamiento Digital de Seales aplicado a Redes Neuronales

1.1.4.1

Funcin de transferencia en z

Dado un sistema discreto definido por su secuencia de ponderacin {gk}, cabe


considerar, si existe, su transformacin z, G(z). Teniendo en cuenta la relacin de la
convolucin entre entrada, ponderacin y salida y la relacin entre la convolucin de dos
secuencias y sus transformadas, un sistema como el de la figura 1.5, verifica que:

( 1.29 )
El operador G(z), transformada z de la secuencia de ponderacin del sistema se
denomina funcin de transferencia en z del sistema considerado.

Figura 1. 6 Condicin de relacin de transformadas.


Esta funcin de transferencia del sistema puede ser calculada a partir de la ecuacin en
diferencias que lo determina. Partiendo de la ecuacin que define el comportamiento de un
sistema dinmico lineal:

( 1.30 )
Y calculando ahora la transformada z de las dos partes de la igualdad y teniendo en
cuenta las propiedades de linealidad y desplazamiento, se obtiene:

( 1.31 )

26

Procesamiento Digital de Seales aplicado a Redes Neuronales

Entonces la relacin entrada/salida del sistema ser:

( 1.32 )
Y por tanto la funcin de transferencia del sistema ser:

( 1.33 )
1.1.4.2

Transformada inversa

Se plantea el problema inverso, obtener la secuencia {xk} a partir de su transformada


en z, X(z). Para el caso de tener X(z) en forma de funcin racional, se puede calcular de
forma sencilla a partir del teorema de los residuos, estableciendo que:

( 1.34 )
siendo C una curva cerrada que envuelve el origen.
En el caso de secuencias con trminos nicamente de ndice positivo, o nicamente
negativo, se puede utilizar el clculo de los coeficientes mediante el mtodo de la divisin
larga. Una posibilidad ms de clculo de la transformada inversa es por descomposicin en
fracciones simples. Si X(z) es racional, con todos sus polos simples y el grado del
numerador inferior al del denominador, entonces:

( 1.35 )

27

Procesamiento Digital de Seales aplicado a Redes Neuronales

y la transformada inversa ser la suma de las transformaciones inversas, que, en el caso


de secuencias de ndice positivo, ser transformada en una suma de secuencias
exponenciales y por tanto en este caso:

( 1.36 )
Ejemplo 1.6
Un sistema discreto est definido por la siguiente ecuacin en diferencias:

Calcular la FDT en transformadas en z y calcular la respuesta del sistema ante una


entrada en escaln. Utilcese el mtodo de fracciones simples. Al aplicar las transformadas
en z sobre la ecuacin en diferencias quedar:

Para calcular la secuencia de salida se aplicar (1. 29):

Es fcil de obtener los dos polos de G(z), uno en z = 1/3 y otro en z = 1/4. La
descomposicin en fracciones simples de Y(z) resultar a :

28

Procesamiento Digital de Seales aplicado a Redes Neuronales

La antitransformada ser inmediata (ver (1. 35) y (1. 36) ):

y los valores de la secuencia sern:

1.1.5 Muestreo de seales


La idea de muestras referidas a un sistema basado en un computador digital, se
concreta en la toma de valores de una seal continua en sucesivos instantes de tiempo. El
muestreo de seales consiste en la construccin de secuencias a partir de seales continuas.
Un problema que salta a la vista es la prdida de informacin.En este punto se analizar
fundamentalmente este problema, dndose las condiciones en las que el proceso de
muestreo/reconstruccin, (CAD/CDA), no signifique perdida de informacin.
El caso ms interesante de muestreo es el peridico, que se caracteriza por que los
instantes de toma de las muestras estn regularmente espaciados en el tiempo y a ste se le
llama periodo de muestreo, T, y a su inversa, frecuencia de muestreo, fs. El elemento que
realiza este proceso se denomina "muestreador", siendo la forma usual de representarlo en
los diagrama de bloques la indicada en la figura 1.7. En este bloque la salida est
relacionada con la entrada por la expresin:

29

Procesamiento Digital de Seales aplicado a Redes Neuronales

( 1.37 )

Figura 1.7

Smbolo

del muestreador

Intuitivamente se puede apreciar que el periodo de muestreo va a jugar un papel


fundamental en este proceso. La eleccin de la frecuencia de muestro es un problema
fundamental en el sistema de datos muestrados. Conviene muestrear los datos con la menor
frecuencia posible, pero que sea lo suficientemente grande como para poder evitar la
prdida de informacin y que sea posible reconstruir la funcin continua a travs de las
muestras. Justamente, el teorema del muestreo es el que puede ayudar a determinar la
frecuencia ptima del convertidor analgico/digital.
Para poder establecer las conclusiones del teorema del muestreo, se va a recurrir al
estudio frecuencial. Si una seal continua, x(t), con transformada de Fourier continua,
Xc(w), entonces las relaciones seal/transformada sern del tipo:

( 1.38 )
La relacin existente entre la seal continua y la secuencia procedente del muestreo
estar dada por (1. 37), por lo tanto, el ligazn entre la transformada de Fourier continua y
la secuencia ser del tipo:

( 1.39 )
Si la secuencia {xk} tiene asimismo transformada discreta de Fourier Xd(w), entonces
estar relacionada con su transformada por medio de:

( 1.40 )
30

Procesamiento Digital de Seales aplicado a Redes Neuronales

El problema es estudiar si existe alguna relacin entre estas dos transformadas, la de la


seal continua Xc(w) y la de la secuencia Xd(w). Se puede demostrar que la relacin
existente es:

( 1.41 )
Por tanto, si la seal continua tiene una transformada de Fourier, cuya curva de
mdulos, por ejemplo, se representa en la figura 1.8.

Figura 1. 8 Transformada de Fourier de una seal continua determinada


Entonces la curva de mdulos de la transformada de la secuencia obtenida por
muestreo, ser peridica 2 T tal como queda reflejado en la figura 1.9

Figura 1. 9 Transformada discreta de Fourier de la seal continua con un muestreador


de periodo T
31

Procesamiento Digital de Seales aplicado a Redes Neuronales

Llegando as a las condiciones que se deben de cumplir en el proceso de muestreo para


que se pueda realizar sin prdida de informacin. Suponiendo que la seal continua x(t) con
transformada de Fourier Xc(w) sea nula a partir de una determinada frecuencia 0.

( 1.42 )
Las seales que cumplen esta condicin se denominan de banda limitada. Si una seal
de este tipo se muestrea con un periodo que verifique:

( 1.43 )
Es decir:

( 1.44 )
La transformada de Fourier ser, siguiendo el ejemplo, de la forma indicada en la
figura 1.9. A/T se la l ama frecuencia angular de Nyquist.

Si por el contrario, el periodo de muestreo es superior a este valor, T > / 0 , la


transformada de la secuencia del ejemplo ser de la forma indicada en la figura 1.10, donde
se puede apreciar que Xc(w) y Xd(w) no coinciden, y por lo tanto el conocimiento de la
transformada de la secuencia no permite obtener la transformada de la seal continua. A
este fenmeno se llama solapamiento en frecuencias o aliasing.

32

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 10 Efecto de solapamiento en frecuencia o aliasing

Recurdese cmo en el captulo anterior se mencionaba el diseo de filtros antialiasing


en la propagacin de la seal continua al convertidor A/D, con el objeto de tener seales de
banda limitada y que cumplan con (1. 42) y (1. 43).
Por acabar con este resumen, hay que citar que adems del problema del muestreo,
habra de estudiar el efecto tanto de la cuantificacin como el de reconstruccin. El primero
analiza cmo afecta el problema del convertidor A/D en la transformacin de una seal
analgica de infinitos valores a otra de valores finitos; mientras el segundo estudia los
problemas de la reconstruccin debido a los convertidores D/A. stos sern analizados en
el ltimo punto del captulo.

Ejemplo 1.7
Una seal continua est constituido por la siguiente expresin:

Determinar la serie de Fourier de la seal. Esta seal posteriormente es muestreada a


10 kHz y a 6 kHz durante 2 ms con desfase nulo, obtener las DFT de las secuencias
obtenidas.
Al ser dos armnicos puros la serie de Fourier continua estar constituida por dos
componentes, una a 2 kHz y la otra a 4 kHz, con amplitudes de 1 y 1.5 respectivamente. En
la figura adjunta se representa la seal continua durante 2 ms y el mdulo de su serie de
Fourier.
33

Procesamiento Digital de Seales aplicado a Redes Neuronales

Las muestras obtenidas dependern de la frecuencia de muestro y sus valores estarn


relacionados con las siguientes expresiones:

Los valores de las secuencias


corresponden a una frecuencia de 10kHz y xk2 de
6kHz. Ambas son representadas en la figura de abajo.

Resalta a la vista la prdida de informacin en el segundo muestreo, compare estas


grficas con la forma de la seal continua. Aplicando a estas secuencias la transformada de
Fourier, el resultado es el esperado. En el primer caso no hay solapamiento en frecuencias,
mientras en el segundo el espectro de la secuencia ha perdido la informacin de la seal
continua.

34

Procesamiento Digital de Seales aplicado a Redes Neuronales

Para ejercitarse y experimentar con el teorema del muestreo se propone variar la


frecuencia de muestreo de ficheros WAV. Estos registros se caracterizan por ser un formato
digital de sonidos. El proyecto que se propone es abrir un fichero de audio y tomar slo una
muestra de cada n valores ledos. Posteriormente, el fichero ser reproducido. Este
experimento no slo mostrar a travs de su audicin la prdida de calidad sino tambin el
espectro de la seal con el formato original y el submuestreado.
Proyecto 1.1
Hacer una aplicacin que permita abrir ficheros tipo WAV y que elija una nica
muestra de cada n. Reproducir ambos sonidos, la del fichero original y la del fichero
creado. Igualmente mostrar la evolucin temporal de las secuencias y sus espectros.
Este proyecto se ha resuelto con MATLAB v5.3 y con el toolbox de Signal Processing.
Se ha creado una funcin que tiene como argumentos el camino del fichero WAV y el valor
35

Procesamiento Digital de Seales aplicado a Redes Neuronales

de n. La funcin devuelve el path al fichero de salida creado, el cul se ha generado del


submuestro del fichero fuente.

En conclusin en este captulo hemos visto las aplicaciones de las diferentes formas de
tratamiento, su manipulacin e interpretacin de las seales adems de sus propiedades, su
respuesta en forma discreta as como su aprovechamiento en los sistemas de audio.
En el siguiente captulo se detallarn las formas de filtrado de las seales adems de los
tipos y aplicaciones de los filtros digitales, su respuesta y diseo de los mismos.

36

Procesamiento Digital de Seales aplicado a Redes Neuronales

CAPITULO II
FILTROS DIGITALES

37

Procesamiento Digital de Seales aplicado a Redes Neuronales

Introduccin Filtros digitales


Los filtros digitales son una clase de sistemas discretos LTI utilizados para extraer
caractersticas desde el dominio de la frecuencia sobre seales muestreadas. El diseo de
los filtros requiere de las siguientes etapas: (1) especificaciones de las propiedades deseadas
del sistema, (2) aproximaciones de las especificaciones mediante un sistema causal en
tiempo discreto y (3) la realizacin del sistema. El primero es altamente dependiente de la
aplicacin y el tercero de la tecnologa utilizada para la implementacin.
En trminos prcticos, el filtro deseado se realiza utilizando cmputo digital y se emplea
para una seal que proviene de tiempo continuo seguido por una conversin analgicodigital.
Cuando se utiliza un filtro digital para realizar el tratamiento de seales en tiempo
continuo, empleando una configuracin como la indicada en la Figura 1. 11, tanto las
especificaciones del filtro en tiempo discreto como las que se indica en tiempo continuo se
suelen dar en el dominio de la frecuencia. Como se demostr en la seccin anterior, si se
usa un sistema LTI y si la entrada es de banda limitada y la frecuencia de muestreo es lo
suficientemente alta para evitar el solapamiento, el sistema completo se comporta como un
sistema LTI continuo en el tiempo cuya respuesta en frecuencia es:
( 2.45 )

Figura 2.1. Arquitectura del filtro digital


En estos casos es inmediato convertir las especificaciones del filtro efectivo de tiempo
continuo, Gc(w), en especificaciones del filtro en tiempo discreto, Gd(w). La arquitectura
presentada parece evidente que es ms compleja y costosa que el uso de clulas Sallen-Key
para implementar filtros analgicos. Sin embargo, los filtros digitales exhiben abrumadoras
ventajas respecto a los sistemas de tiempo continuo, una enumeracin de los beneficios
puede enmarcarse dentro de la comparacin entre estos dos tipos de filtros:

38

Procesamiento Digital de Seales aplicado a Redes Neuronales

Respuesta dinmica: El ancho de banda del filtro digital est limitado por la
frecuencia de muestreo, mientras que en los filtros analgicos con componentes
activos suelen estar restringidos por los amplificadores operacionales.

Intervalo dinmico: En los filtros analgicos aparecen derivas que limitan por
abajo el rango y se saturan con la alimentacin. En cambio en los filtros
digitales es fijado por el nmero de bits que representa la secuencia, y el lmite
inferior por el ruido de cuantificacin y por los errores de redondeo.

Conmutabilidad: Si los parmetros de un filtro se conservan en registros, los


contenidos de dichos registros pueden ser modificados a voluntad. De esta
forma, estos filtros se pueden transformar, pudindose multiplexar en el tiempo
para procesar varias seales de entradas a la vez.

Adaptabilidad: Un filtro digital puede ser implementado en soporte fsico


(hardware) o mediante un programa de ordenador (software).

Ausencia de problemas de componentes: Los parmetros de los filtros se


representan por medio de nmeros binarios y no derivan con el tiempo. Al no
haber componentes, no hay problemas de tolerancia o deriva de componentes, y
ningn otro problema asociado con un comportamiento no ideal de resistencias,
condensadores, bobinas o amplificadores. Tampoco existen problemas de
impedancia de entrada ni salida, ni efectos de adaptacin de impedancias entre
etapas.

Complejidad: la potencia de clculo de los computadores actuales y de los


algoritmos desarrollados, permiten implementar prestaciones casi imposibles de
disear con filtros analgicos.

2.1 Clases de filtros digitales


Una distincin fundamental en los sistemas discretos dinmicos lineales e invariantes,
y en particular en los filtros digitales, es la duracin de la respuesta ante el impulso. Se
habla de sistemas de respuesta de pulso finito o no recursivo (FIR, Finite Impulse
Response) y de sistemas de respuesta infinita o recursivo (IIR, Infinite Impulse Response).
Partiendo de la ecuacin en diferencias que modela el comportamiento dinmico de estos
sistemas:

( 2.46 )
39

Procesamiento Digital de Seales aplicado a Redes Neuronales

en el caso de tener todos los coeficientes


lo que quedar la ecuacin reducida a:

iguales a cero se tendr un filtro FIR, con

( 2.47 )
siendo m el orden del filtro y tendr una funcin de transferencia en z del tipo:

( 2.48 )
Obsrvese que en estos tipos de filtros cada valor de la secuencia de salida slo
depender de un nmero finito de valores de la secuencia de entrada. Adems tambin se
desprende la carencia de polos en la funcin de transferencia. Por contra, las expresiones de
los filtros recursivos corresponden a:

( 2.49 )
Y su funcin de transferencia en z a:

( 2.50 )
En estos casos, la secuencia de salida depende tanto de la entrada como de la salida.
De estas ecuaciones se deducen las siguientes propiedades. Primera, la secuencia de
ponderacin es infinita para los filtros IIR, aun teniendo un nmero finito de coeficientes.
Mientras la respuesta al impulso de un filtro no recursivo es siempre finita e igual al orden
del filtro. En segundo lugar, los filtros FIR prcticos son siempre estables, esto es, la
secuencia de salida tiene todos sus valores acotados. No es el caso de los filtros recursivos,
su estabilidad depende de la funcin de transferencia, por lo que habr de utilizar alguno de
los procedimientos algebraicos, como el de Jury, para analizar su estabilidad. Tercera,
cualquier filtro recursivo puede ser reemplazado por otro no recursivo con infinitos
coeficientes, sus valores vendrn dados por la secuencia de ponderacin del IIR. La
conclusin inversa no se cumple.

40

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 2. 1. a) Respuesta ante el impulso de un FIR


b) Respuesta ante el impulso de un I IIR

2.2 Filtros de fase lineal o no dispersivos


Existen muchas aplicaciones del procesamiento de seales en las cuales las relaciones
de fase son importantes y no deben ser perturbadas por el filtrado. Por ello se deben
disear filtros de fase lineal. stos tienen como caracterstica la introduccin de un desfase
en la respuesta en frecuencia de la secuencia de salida que sea proporcional a la frecuencia.
A estos filtros se les llaman de fase lineal o no dispersivos.
Para justificar la importancia de los filtros de fase lineal, se propone realizar el
siguiente experimento. Se toma una imagen digital, por ejemplo el prtico de entrada de la
Escuela, recurdese que sta es una secuencia bidimensional, y se calcula su transformada
de Fourier discreta 2D. Del resultado se hace separar el mdulo y el argumento de la
transformacin, para proceder por separado a la aplicacin de la transformada inversa.

41

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 13 a) Imagen de la EUITIM 256x256 pxeles


b) Transformada inversa del argumento de la transformada
c) Transformada inversa del mdulo de la transformada

Resultan obvias las conclusiones del experimento, el argumento lleva casi toda la
informacin de la secuencia. Por lo tanto, si se desea transmitir slo algunas de las
propiedades de la secuencia sin distorsionarla habr de disear filtros que no perturben la
fase de la seal muestreada. Justificando de esta manera el nfasis puesto en los filtros de
desfase nulo o lineal.
2.3 Causalidad y sus implicaciones
Los filtros digitales suelen ser caracterizados en trminos de rangos de frecuencia,
tanto de la banda pasante como de la supresora. Los cuatro tipos bsicos de filtros
supresores son ilustrados en la figura 1.14. Al ser stos sistemas discretos, sus respuestas
frecuenciales son peridicas con la frecuencia de Nyquist, N, por lo que slo se
considerar el intervalo [-N, N].

42

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 14 Especificaciones de los filtros digitales a) Paso bajo b) Paso alto c) Pasa banda
d) Rechazo de banda
En las figuras slo se muestran la respuestas en frecuencias del mdulo sin que
aparezca el argumento. Sin embargo, como se acaba de comentarse (ver prrafo 2.2), es
deseable que en la banda pasante no se introduzcan desfases o que sean de fase lineal. Con
tal propsito se parte de la realizacin de un filtro con variacin lineal del argumento
respecto a la frecuencia, esto es, se tendr que el desfase introducido es del tipo = - T,
donde es una constante. El caso particular de desfase nulo ser igual a cero. Luego si
anteuna seal de entrada peridica con las condiciones de Fourier, sta se separa en forma
de sumas de sinusoides del tipo sen( kT), , cada una de ellas producir una respuesta del
tipo:

( 2.51 )
Por lo tanto, cada armnico de la seal de entrada estar desfasada - veces, de
forma que se obtendr en la salida una versin no distorsionada de la seal de entrada en el
rango de frecuencias dependientes de la banda pasante. A razn de lo expuesto, el diseo de
un filtro paso bajo deber de cumplir con las condiciones mostradas en la figura 1.15. El
mdulo ser constante en la banda pasante y nulo en la supresora, mientras el desfase
tendr que ser lineal con la frecuencia. Un posible modelo matemtico que caracterice este
tipo de respuesta correspondera a:
( 2.52 )
43

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 15 Respuesta en frecuencia de un filtro paso bajo.


de manera que si se aplica la transformada inversa de Fourier, la secuencia de
ponderacin del filtro quedar como:

( 2.53 )
Desprendindose que el filtro paso bajo es no causal y por lo tanto no realizable
fsicamente.
Ejemplo 1.8
Obtener la secuencia de ponderacin de un filtro paso bajo de desfase nulo y que la
banda pasante sea un octavo de la frecuencia de muestreo.
Los datos del ejercicio supone que sea nulo y que la frecuencia de corte sea un
ncuarto de la frecuencia de Nyquist c n/4 Al aplicar (1. 53) se obtendr la secuencia
de ponderacin de este filtro digital:
44

Procesamiento Digital de Seales aplicado a Redes Neuronales

( 2.54 )
cuyos valores sern:

Figura 1. 16 Respuesta impulsional con desfase nulo


La respuesta al impulso de la secuencia est representada en la figura 1.16. Dos
aspectos destacan. Primero, el filtro no es causal, ya que para k<0 los valores de {gk} no
son nulos, por lo que no pueden ser implementados en tiempo real.
En segundo lugar, la respuesta al impulso no es finita, esto significa que la respuesta del
filtro tardara infinito tiempo en calcularlo, incluso asumiendo que pudiera tener infinitos
coeficientes. De estos aspectos, se concluye que la realizacin de un filtro ideal es
imposible de realizar fsicamente; habiendo de aceptar criterios de compromiso para el
diseo.
Ejemplo
Si se trunca la respuesta al impulso se tendr un filtro digital realizable fsicamente, pero
ste slo ser una aproximacin al comportamiento ideal.

45

Procesamiento Digital de Seales aplicado a Redes Neuronales

Ejemplo 1.9
Disear un filtro paso bajo FIR con una frecuencia de muestreo de 1.6 kHz, frecuencia
de corte de 200 Hz y con igual a 5, sabiendo que el orden del filtro es 10.
De aplicar (1. 53) con las condiciones dadas en el ejercicio da los siguientes
coeficientes:
y segn (1. 56) su respuesta en frecuencia ser:

( 2.55 )
Cuya respuesta en frecuencia y al impulso se encuentran representado en la figura 1.17.

Figura 1. 17 a) Respuesta en frecuencia b) Respuesta impulsional

46

Procesamiento Digital de Seales aplicado a Redes Neuronales

Del ejemplo se muestra cmo el truncamiento del orden del filtro hace dejar de comportarse
como filtro ideal, apareciendo tanto rizado en la banda pasante como en la supresora. A este
efecto se le denomina fenmeno de Gibbs. Tambin se desprende de la figura el carcter
lineal del desfase.
Aunque esta discusin se limita a la realizacin de un filtro paso bajo, las conclusiones
se mantienen en general para todos las filtros selectivos. En resumen, ninguno de los filtros
mostrados previamente en la Figura 1.14 son causales y, por tanto, son fsicamente
irrealizable.
Una pregunta que aflora naturalmente en este punto es la siguiente: Cules son las
condiciones suficientes y necesarias que debe satisfacer la respuesta frecuencial para que el
filtro sea causal ?. La respuesta a esta pregunta viene dada por el teorema de Paley-Wiener.
Del teorema se extraen varias conclusiones:

Los filtros causales tienen un mdulo,


que puede ser cero en algunas
frecuencias, pero no puede ser cero sobre cualquier banda finita de
frecuencias.

La amplitud de la banda pasante no puede ser constante en un rango finito


de frecuencias y la transicin de la banda de paso a la de rechazo no puede
ser infinitamente abrupta ( esto es una consecuencia del fenmeno de Gibss,
causado por el truncamiento de gk para lograr causalidad ).

La parte real e imaginaria de G(W) no son independientes y estn


relacionadas por la transformada de Hilbert discreta. En consecuencia, la
magnitud y la fase de G(W) no se pueden elegir arbitrariamente.

Aunque las caractersticas de respuesta en frecuencia que poseen los filtros ideales son
deseables, no son absolutamente necesarias en la mayora de las aplicaciones prcticas. Si
se relajan estas condiciones es posible realizar filtros causales que se aproximan a los
47

Procesamiento Digital de Seales aplicado a Redes Neuronales

ideales con tanta precisin como se desee. En particular, no es necesario insistir en que la
ganancia en la banda pasante sea constante. Se puede tolerar un pequeo rizado e
igualmente se puede tolerar un valor pequeo distinto de cero en la banda de rechazo. La
transicin de la banda de paso a la supresora no ser nula y existir una banda de transicin.
En cualquier problema de diseo de filtros selectivos se podr especificar: (1) el rizado de
la banda pasante, 1, (2) el rizado tolerable de la banda de rechazo, 2 (3) la frecuencia de
la banda de paso, B, y (4), la frecuencia de la banda supresora, S. . Basndose en estas
especificaciones se seleccionarn los coeficientes ak y bk de la ecuaci n en diferencias del
sistema LTI, de la manera que mejor se aproxime a la respuesta en frecuencia deseada. El
grado con el que G(W) se aproxime a las especificaciones depende del criterio usado en la
determinacin de los coeficientes as como del orden del polinomio de la FDT del sistema.

2.4 Diseo de filtros no recursivos (FIR)


Los filtros no recursivos tienen ventajas muy interesantes que les hacen ser
ampliamente utilizados en mltiples aplicaciones. La caracterstica ms destacable es su
facilidad de diseo para conseguir una respuesta en frecuencias de fase lineal. Los FIR son
por su propia constitucin estables, no habiendo problemas en su diseo o en su fase de
implementacin. Aunque el diseo de los FIR requiera de una gran cantidad de operaciones
de sumas y multiplicaciones, tanto su estructura de programacin como su realizacin en
soporte fsico resulta fcil y escalable.
En la prctica, los filtros FIR se emplean en problemas de filtrado donde hay un
requisito de fase lineal dentro de la banda de paso del filtro. Si no existe este requisito se
pueden emplear tanto filtros FIR como IIR. Sin embargo, como regla general, un filtro IIR
tiene menos rizado y el corte es ms abrupto que un FIR con el mismo grado de polinomio.
Por esta razn, si se puede tolerar alguna distorsin de fase o sta no es importante, se
prefiere un IIR, principalmente porque su implementacin involucra menos parmetros,
requiere menos memoria y tiene menor complejidad computacional.
Bsicamente hay dos mtodos para el diseo de filtros no recursivos. El primero trata
de definir la respuesta en frecuencia del filtro para luego determinar los coeficientes del
filtro mediante la transformada inversa de Fourier; mientras que la segunda estrategia
utiliza mtodos de optimizacin capaz de ir modificando los coeficientes del filtro para
aproximarlo a la respuesta en frecuencia deseada. Slo se va a tratar el primer mtodo.

48

Procesamiento Digital de Seales aplicado a Redes Neuronales

2.4.1 Filtros FIR simtricos y antisimtricos


Un filtro FIR tiene fase lineal si su respuesta impulsional satisface la condicin de
simetra o antisimetra de sus coeficientes. Para su demostracin se partir de la respuesta
en frecuencia de un filtro no recursivo que tenga un orden m. Adems, para facilitar su
comprensin se va a suponer que el filtro sea de orden par, definindose que m sea igual a
2N, por tanto, la respuesta en frecuencia de los filtros de orden par quedar como:

( 2.56 )
Si se imponen las condiciones de simetra o antisimetra:

( 2.57 )
El signo + indicar simetra en los coeficientes y el para la antisimetra. Suponiendo
primero que existe simetra y agrupando alrededor de los coeficientes
respuesta en frecuencia del filtro quedar como:

la

( 2.58 )
Observndose que el contenido de entre las llaves es real y que el desfase
introducido por el filtro es -NT, siendo por tanto el argumento lineal con la frecuencia. De
igual manera se actuar con los coeficientes antisimtricos, sin embargo, hay que destacar
que si el filtro es de orden par el punto central de la antisemetra ser nulo. Es fcil
demostrar que la respuesta en frecuencia del un filtro FIR de orden par con una respuesta
impulsional antisimtrica se puede expresar como:

( 2.59 )

49

Procesamiento Digital de Seales aplicado a Redes Neuronales

La caracterstica de fase del filtro ser


. Igualmente las expresiones
de las respuestas en frecuencias para filtros de orden impar con simetra o antisimetra son
sencillas de obtener, proponiendo al lector que lleve a las siguientes relaciones

( 2.60 )
Estas formulas de respuesta en frecuencia generales se pueden usar para disear
filtros FIR de fase lineal con respuestas impulsionales simtricas y antisimtricas. Ntese
que para un filtro simtrico, el nmero de coeficientes del filtro que especifican la respuesta
es m/2 cuando m es par o ((m+1)/2)-1) si m es impar. Por otro lado, si la respuesta
impulsional es antisimtrica y el orden es par, el punto central de la antisimetra ser nulo y
habr m/2 coeficientes que lo definan, en caso de ser orden impar, cada coeficiente tiene un
rmino emparejado de signo opuesto y estar definido por ((m+1)/2)- 1).
La eleccin de una respuesta impulsional simtrica o antisimtrica depende de la
aplicacin. Por ejemplo, si el filtro tiene antisimetra, G(W) tanto para bajas frecuencias
como para frecuencias alrededor de la frecuencia de Nyquist tiene valores prximos a cero,
por lo que no es posible utilizarlos ni para filtros paso bajos ni paso alto. Por otro lado, la
condicin de simetra produce un filtro FIR de fase lineal con una respuesta distinta de cero
para bajas frecuencias. En resumen, el problema de diseo de filtros FIR es simplemente el
del determinar m+1 coeficientes, a partir de las especificaciones en las frecuencias
deseadas.
2.4.2 Diseo de filtros FIR de fase lineal usando ventanas

Hasta este momento se ha observado que la causalidad del filtro requiere del
truncamiento de la respuesta impulsional, y la caracterstica ms destacable de los filtros
FIR (fase lineal), hizo introducir la condicin de simetra o antisimetra en los coeficientes
50

Procesamiento Digital de Seales aplicado a Redes Neuronales

del FIR. Sin embargo, aunque el orden del filtro sea elevado y se impongan condiciones de
simetra, los rizados tanto en la banda pasante como en la supresora se mantienen. As, por
ejemplo, en la figura 1.18 se muestra un filtro paso bajo de orden 51 con una frecuencia de
corte normalizada de 0.4, evidenciando que aun siendo elevado el orden del filtro el efecto
Gibbs se mantiene. Este fenmeno no desaparece con la longitud del filtro.
La causalidad del filtro obligo a definir un orden de filtro finito, de forma que una manera
genrica de expresarla sera que la secuencia de ponderacin del filtro ideal se multiplicase
por una "ventana" de longitud finita, es decir,

( 2.61 )
siendo gk definida como (2. 53) y wk una funcin ventana, donde el truncamiento ms
simple estara definido por:

( 2.62 )
tal que m marca el nmero de la secuencia de truncamiento y el orden del filtro.
Adems, a esta ventana y a otras que se vern ms adelante se las impone la condicin de
simetra para hacer cumplir la caracterstica de fase lineal.
Es instructivo considerar el efecto de la funcin ventana en la respuesta en frecuencia
deseada. Recurdese que la multiplicacin de la funcin ventana con {gk} es equivalente a
la convolucin de G(W) con W (, donde W( es la transformada de Fourier de la
funcin ventana. As, la convolucin de G(W) con W( produce la respuesta en
frecuencia del filtro FIR (truncado). Esto es,

( 2.63 )

51

Procesamiento Digital de Seales aplicado a Redes Neuronales

La transformada de Fourier de una ventana rectangular es:

( 2.64 )
La respuesta en magnitud de la funcin ventana se ilustra en la figura 1.19 para m=7.
Ntese que W( para la ventana rectangular tiene fase lineal, evidente por el carcter de
simetra de sus coeficientes.

Figura 1. 19. Modulo de la transformada de Fourier de una ventana rectangular


A medida que el orden del filtro crece, el ancho del lbulo principal decrece. Esta
caracterstica se relaciona con la regin de transicin entre la banda pasante y la supresora,
esto es, cuando se aumente el orden del filtro, el corte entre estas bandas ser ms abrupto.
Para el caso de ventanas rectangulares los lbulos laterales son altos y de hecho, a medida
que m crece las amplitudes del pico del lbulo principal y de los lbulos secundarios crecen
de forma que el rea encerrada en cada lbulo permanece constante mientras que su
anchura decrece con m. Como el rea del lbulo permanece constante al crecer m, las
oscilaciones ocurren ms rpidamente, pero no disminuye su amplitud al aumentar m.
Por lo tanto, la respuesta en frecuencia del filtro FIR truncado, G(w), ser la
convolucin de la respuesta deseada, G(w), y de la transformada de Fourier de la ventana
rectangular, tal cual fue recogido en (1. 63). Suponiendo el diseo de un filtro paso bajo con
una frecuencia de corte Wc , la figura 1.20 muestra G(w) y W( , como se usara en la
ecuacin referenciada.

52

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 20. a) Convolucin entre la respuesta ideal y la ventana rectangular.


b) Resultado de la convolucin.
El resultado no hace ms que confirmar las conclusiones del teorema de Paley- Wiener
(ver figura 1.20b). Se puede constatar la existencia de rizado tanto en la banda pasante
como en la supresora y, adems, no es posible el corte abrupto entre ambas banda. Sin
embargo, la aplicacin de ciertas funciones ventanas permiten suavizar estos
inconvenientes no deseado. Para evitarlo existen varios tipos de funciones ventanas, as por
ejemplo se tiene:

( 2.65 )
Donde para = 0.5 es llamada la ventana de von Hann y cuando = 0.54 es la
denominada ventana de Hamming. La ventana de Blackman est definida por:

( 2.66 )
Para ilustrar las caractersticas de la respuesta en frecuencia de las ventanas de von
Hann, Hamming y Blackman se muestran en la figura 2.21 un ejemplo. Se trata de
comparar las respuestas frecuenciales de un filtro FIR truncado por una ventana rectangular
y los resultados de aplicar estas funciones ventanas. El orden del filtro es 21 y la frecuencia
de corte es un cuarto de la frecuencia de Nyquist.

53

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 21

54

Procesamiento Digital de Seales aplicado a Redes Neuronales

Todas estas funciones ventana tienen lbulos laterales significativamente ms bajos


comparados con la ventana rectangular. Sin embargo, para el mismo valor del orden del
filtro, el ancho del lbulo principal es tambin ms amplio para estas ventanas comparado
con la ventana rectangular. Consecuentemente, estas funciones ventana proporcionan
mayor suavizado a travs de la operacin de convolucin en el dominio de la frecuencia, y
como resultado la regin de transicin en la respuesta del filtro FIR es ms amplia. Para
reducir el ancho de esta regin de transicin se tendr que elevar el valor de m, lo cual
resulta un filtro ms caro. La tabla 2.1 resumen estas importantes caractersticas del
dominio de la frecuencia de las distintas funciones ventana.

Tabla 2. 1 Caractersticas frecuenciales ms importantes de algunas funciones ventana

2.4.3

El mtodo de diseo de filtros mediante la ventana de Kaiser.

El compromiso entre la anchura del lbulo principal y el rea de los lbulos laterales
se puede cuantificar buscando la funcin de ventana que est concentrada de forma mxima
alrededor de = 0 en el dominio de la frecuencia. Este asunto se ha considerado en
profundidad durante largo tiempo. Entre 1966 a 1974, Kaiser descubri que se puede
formar una venta cuasi-ptima utilizando la funcin de Bessel modificada de primera
especie. La ventana de Kaiser se define como:

( 2.67 )

55

Procesamiento Digital de Seales aplicado a Redes Neuronales

donde
serie:

es la funcin de Bessel de primera especie, definida por la

( 2.68 )
A diferencia de las otras ventanas, la ventana de Kaiser tiene dos parmetros: el orden
del filtro, m, y el parmetro de forma . Variando m y se puede ajustar la amplitud de los
lbulos laterales y el ancho del lbulo principal. Se demuestras que si se aumenta el orden
del filtro y se mantiene constante, la banda de transicin disminuye mantenindose la
amplitud de los lbulos laterales. De hecho, Kaiser obtuvo, mediante amplias
experimentaciones numricas, una pareja de frmulas que permiten al diseador de filtros
predecir los valores del orden del filtro y del factor de formas necesarias para cumplir unas
determinadas especificaciones en frecuencia. Adems, tambin demostr que, sobre un
intervalo suficientemente amplio de condiciones, el nivel de rizado , (ver figura 1.20),
est determinado por la seleccin de . Supuesto fijo el nivel de rizado, la frecuencia de la
banda del filtro paso bajo se define como la mxima frecuencia para la que
La frecuencia de la banda supresora, S, se define como la mnima frecuencia para la que
. Debido al carcter simtrico de los coeficientes resulta que 12De otro
lado, la anchura normalizada de la regin de transicin es :

( 2.69 )
para la aproximacin del filtro paso bajo. Definiendo

( 2.70 )
Kaiser determin empricamente que el valor de necesario para cumplir un valor
especfico de Amin est dado por:

( 2.71 )
56

Procesamiento Digital de Seales aplicado a Redes Neuronales

Para el caso de que sea cero, la ventana es igual a la rectangular. Adems, Kaiser
descubri que para cumplir unos valores especficos de Amin,n y m debe satisfacer:

( 2.72 )
la expresin permite predecir el valor de m con una precisin de 2 para un amplio
margen de valores de Amin,en . Por tanto, con estas frmulas, el mtodo de diseo
basado en la ventana de Kaiser casi no requiere iteraciones de prueba y error.
Con el uso de las frmulas de diseo de la ventana de Kaiser, es inmediato disear un
filtro FIR paso bajo que cumpla unas determinadas especificaciones. El procedimiento de
diseo sigue los siguientes pasos:

Se establece la respuesta de frecuencia deseada para un filtro paso bajo. Esto


significa seleccionar los valores deseados de B, S y el rizado tolerable.

Hay que determinar la frecuencia de corte del filtro paso bajo ideal. Debido
a la simetra de la aproximacin en la discontinuidad de G(w), sera:

( 2.73 )
Si se elige una ventana de Kaiser se podrn calcular los parmetros del
orden del filtro y del factor de forma , utilizando los valores de
y
las expresiones (2. 71) y (2. 72). En caso contrario, esto es, si se utiliza
ventanas de von Hann, Hamming, Blackman o rectangular habr de ir iterando
con el orden del filtro, pues no se puede determinar con ninguna expresin
emprica la longitud del filtro. Como semilla para el orden del filtro se podra
utilizar la ecuacin de Kaiser para el orden del filtro (2. 73).

Una vez definida el orden del filtro se determinar la secuencia de ponderacin


del filtro ideal por medio de:

( 2.74 )
57

Procesamiento Digital de Seales aplicado a Redes Neuronales

La respuesta al impulso del filtro se calcula multiplicando la secuencia del


filtro ideal por la secuencia de la funcin ventana,

( 2.75 )
Por ultimo, si el filtro selectivo no es paso bajo se realiza la transformacin al
tipo de filtro deseado, haciendo uso de las indicaciones del cuadro 2.1

2.4.4

Transformaciones sobre los filtros

Aunque el mtodo expuesto se ha centrado en los filtros paso bajo, tambin es posible
disear los otros tipos de filtros selectivos, esto es, paso alto, pasa banda y rechazo de
banda. Para ello se podra utilizar el mismo procedimiento que se vio anteriormente, pero
en vez de aplicar la banda pasante a las bajas frecuencias se puede realizar para cualquier
otra forma de banda pasante. Sin embargo, y de igual manera que ya se vio en el anterior
captulo sobre filtros analgicos, aqu tambin existen transformaciones de paso bajo a
cualquiera de los otros tipos.
As por ejemplo, si gk(PB) son los coeficientes de la respuesta al impulso de un filtro
paso bajo con una frecuencia de corte ( C)PB y una frecuencia de Nyquist ,N, , entonces:

( 2.76 )
Siendo stos los coeficientes de la respuesta al impulso del filtro paso alto con una
frecuencia de corte de:

( 2.77 )
La demostracin de la validez de esta transformacin es bastante sencilla y es como
sigue:

58

Procesamiento Digital de Seales aplicado a Redes Neuronales

( 2.78 )

Haciendo el cambio de variables en la primera integral de

y en la segunda

de

( 2.79 )

Por tanto, el diseo del filtro paso alto con frecuencia corte
pasa por un diseo
inicial de filtro paso bajo con frecuencia de corte
pasa y multiplicando el
resultado por

Figura 1. 22 Cambio de variables de


Las relaciones entre paso bajo con pasa banda y rechazo de banda quedan recogidas
en el cuadro resumen 2.1.

59

Procesamiento Digital de Seales aplicado a Redes Neuronales

Cuadro 2. 1 Transformaciones de paso bajo a otro tipo de filtro


Ejemplo 2.10
Disear un filtro paso bajo con ventana de Kaiser si la frecuencia de banda es de 6kHz
y 9kHz la frecuencia supresora, sabiendo que se admite un rizado en la banda pasante de
0.1 y en la supresora es de 0.01. La frecuencia de Nyquist es de 15kHz.
Como el mtodo de diseo de la ventana implica que los rizados deben ser idnticos se
elige el ms restrictivo, esto es, se toma 2 = 0.01. Hay que determinar la frecuencia de
corte del filtro paso bajo ideal, que debido a la simetra de la aproximacin en la
discontinuidad de la respuesta en frecuencia del ideal, sera:

( 2.80 )
Para determinar los parmetros de la ventana de Kaiser habr de calcular

( 2.81 )

60

Procesamiento Digital de Seales aplicado a Redes Neuronales

Al sustituir estos dos valores en las ecuaciones del orden del filtro y del factor de forma
resulta,

( 2.82 )
Los coeficientes de la ventana de Kaiser estarn determinados y la secuencia de
ponderacin del filtro paso bajo ideal respondern a la ecuacin:

61

Procesamiento Digital de Seales aplicado a Redes Neuronales

Ejemplo 2.11
Construir un filtro paso banda con ventana de von Hann de orden 8 cuyas frecuencias
de bandan sea de 10 kHz y 20 kHz, sabiendo que la frecuencia de muestreo es de 100 kHz.
Atendiendo al cuadro habr de determinar cual es la frecuencia de corte del filtro paso
bajo ideal. Por la simetra de la transformacin la frecuencia central ser de 15 kHz y la
frecuencia del filtro paso bajo ideal de 5 kHz. La ventana de von Hann para m igual a 8
ser,

La secuencia de ponderacin del filtro paso bajo ideal para una frecuencia de corte de
5kHz estar dada por:

cuyos valores sern:

Al multiplicarlos por la ventana resultarn:

Ya se dispone del filtro paso bajo, por tanto, se proceder a convertirlo en pasa banda
segn la transformacin que se vio en el cuadro:

resultando la secuencia de ponderacin deseada:

62

Procesamiento Digital de Seales aplicado a Redes Neuronales

2.5.1 Diseo de filtros recursivos (IIR)


El mtodo tradicional de diseo de filtros IIR en tiempo discreto se basa en la
transformacin de un filtro analgico en un filtro digital que cumpla las especificaciones
preestablecidas. Esta solucin es razonable por varios motivos:

El arte del diseo de filtros IIR analgicos est muy avanzado, y como se
pueden obtener resultados tiles, es ventajoso utilizar los procedimientos de
diseo que ya se han desarrollado para los filtros en tiempo continuo.

Muchos mtodos tiles de diseo de filtros IIR en tiempo continuo dan


como resultado frmulas de diseo simples en forma cerrada. Por tanto, los
mtodos de filtros IIR digitales que se basan en esas frmulas estndar de
diseo de filtros IIR continuos son fciles de realizar.

El hecho de que los diseos de filtros en tiempo continuo se puedan trasladar a diseos
de filtros digitales no quiere decir que tengan la misma respuesta frecuencial. Generalmente
sucede que el filtro analgico empleado para la aproximacin tiene una respuesta en
frecuencia diferente de la respuesta en frecuencia efectiva del filtro digital. Esta
circunstancia indica que al disear un filtro digital se parte de un conjunto de
especificaciones en tiempo discreto; mientras las caractersticas del filtro en tiempo
63

Procesamiento Digital de Seales aplicado a Redes Neuronales

continuo se obtienen de la transformacin. Al realizar esta conversin se desea que la


respuesta en frecuencia del filtro digital preserve las propiedades esenciales del filtro
analgico. Esto implica concretamente que se espera que el eje imaginario del plano s se
transforme en la circunferencia unidad del plano z. Una segunda condicin es que un filtro
estable analgico se debe de transformar en un filtro estable de tiempo discreto. Esto
significa que si el filtro continuo tiene los polos en el semiplano negativos de s, el filtro
digital tiene que tener los polos dentro del circulo unidad del plano z. Estas restricciones
son bsicas para las tcnicas de diseo de los filtros digitales IIR.
2.5.1 Diseo de filtros IIR mediante transformadas bilineales
Los filtros recursivos pueden ser diseados por varios mtodos, siendo el ms comn
el basado en las transformaciones bilineales. Este procedimiento requiere del conocimiento
de la funcin de transferencia en el tiempo continuo del filtro a disear. Los coeficientes del
filtro en el dominio s son transformados a uno equivalente en el dominio z. Los coeficientes
de la discretizacin formarn el filtro IIR.
El origen de este proceder viene dado por la cantidad de experiencia acumulada en el
diseo de filtros analgicos. Por tanto, todos los polinomios, tablas, mtodos analticos y
grficos para definir el filtro analgico, empleados en el anterior captulo, sern usados en
el diseo de los filtros recursivos.
Si bien hay varios mtodos de discretizacin, la mayora de ellos tienen problemas de
solapamientos en frecuencias, por realizar una relacin entre el plano s a z de varias
regiones del dominio s a una sola z. Sin embargo, la transformacin bilineal consigue una
transformacin unvoca entre el dominio s a z. Esta transformacin se define como:

( 2.83 )
Y su relacin inversa es del tipo:

( 2.84 )
y sustituyendo s=j a en la anterior expresin quedar:

( 2.85 )

64

Procesamiento Digital de Seales aplicado a Redes Neuronales

Si 0 , entonces, de la (2. 85) se deduce que


para cualquier valor de a.
Del mismo modo, si
para todo valor de a. Es decir, si los polos del filtro
analgico estn en el semiplano izquierdo de s, su imagen en el plano z est en el interior
de la circunferencia unidad. Por tanto, los filtros en tiempo continuo causales y estables se
transforman en filtros en tiempo discreto causales y estables. Seguidamente, para demostrar
que el eje ja se transforma en la circunferencia unidad se procede a sustituir
en
la ecuacin (2. 85), con lo que se obtiene:

con lo que se puede ver que el mdulo de z es unitario para cualquier valor de
hecho, para obtener la relacin de sus respuestas en frecuencias se sustituye s por
por

. De
yz

con lo que queda despus de operar que:

( 2.86 )
Las figuras 1.23 resumen las propiedades de la transformacin bilineal.
Observando la ecuacin (2. 86) y la figura 1.23 hay que notar cmo el intervalo de la
frecuencia digital
se transforma en el intervalo de frecuencia analgica
Las transformaciones bilineales evitan el problema de solapamiento entre s y
z, pero el precio que se paga es la compresin no lineal del eje de las frecuencias. Por
consiguiente, el diseo de filtros en tiempo discreto mediante transformacin bilineal slo
ser til cuando est compresin se tolera. As, el uso de la transformacin bilineal est
limitado al diseo de aproximaciones a filtros con respuesta en amplitud constante a
intervalos, como los filtros paso bajo, paso alto o pasa banda. Por otra parte, la distorsin
del eje de la frecuencia tambin se manifiesta en una compresin de la respuesta de fase del
filtro, esto es, si el filtro analgico es de fase lineal la transformacin bilineal no conserva
esta propiedad. Esta afirmacin es ms cierto sobre todo si la banda pasante se encuentra
cerca de la frecuencia de Nyquist.

65

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 23. a)Transformacin bilineal del plano s a z,


b)Transformacin de la frecuencia digital a frecuencia analgica
El mtodo de diseo de los filtros recursivos mediante transformadas bilineales
comienza por especificar las caractersticas del filtro en el dominio de las frecuencias
digitales
. Estas especificaciones se pasarn al dominio de las frecuencias
analgicas mediante la expresin (2. 86) y que permitirn obtener las frecuencias del filtro
analgico:

( 2.87 )
A este proceso se le conoce el
mediante las soluciones ya tratadas en
transferencia del filtro analgico. Slo
consiguiendo G(z) del filtro digital. Para
procedimiento a seguir:

1.

prewarping del filtro analgico. Seguidamente,


el anterior captulo se obtendr la funcin de
restar convertir de s a z empleando (2. 84),
facilitar su desarrollo se expone un resumen del

Definir las caractersticas del filtro digital

2. Realizar la operacin de prewarping de acuerdo con (1. 87) obteniendo las


frecuencias analgicas
3.

Disear el filtro analgico con las frecuencias definidas en el punto 2.

4.

Reemplazar s en el filtro analgico por la expresin dada en (1. 84).


66

Procesamiento Digital de Seales aplicado a Redes Neuronales

67

Procesamiento Digital de Seales aplicado a Redes Neuronales

Para facilitar las transformaciones de s a z, se exponen en el cuadro 1.2 las relaciones


existentes de filtros comunes de primer y segundo orden mediante la transformada bilineal.
Ejemplo 2.12
Disear un filtro digital paso bajo de Butterworth con una frecuencia de muestreo de
10 kHz, con un a frecuencia de corte de 1 kHz y, al menos, una atenuacin de 10 dB a la
frecuencia de 2 kHz.
En primer lugar se realizara la operacin de prewarping a las frecuencias de 1kHz
y 2kHz, quedando a:

( 2.88 )
Aplicando la expresin matemtica del orden de un filtro de Butterworth, visto en el
anterior capitulo, queda n = 1.368 por lo que se debe de tomar el valor entero superior, esto
es, orden del filtro 2. La funcin de transferencia en el dominio s ser:

( 2.89 )
Utilizando las expresiones del cuadro de transformaciones de G(s) a G(z) para filtros
paso bajo de segundo orden quedar:

( 2.90 )
La respuesta en frecuencia de G(z) es indicada en la figura 1.19

68

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 24 Respuesta en frecuencia de G(z)


Es de destacar la aproximacin de fase lineal en la zona de banda pasante.

Ejemplo 2.13
Disear un filtro paso alto digital de Chebychev con un nivel de atenuacin de 40dB,
selectividad del filtro de 0.25, ganancia de tensin unitaria y frecuencia de corte de 1kHz.
Las frecuencias analgicas tras el warping resultarn ser:

69

Procesamiento Digital de Seales aplicado a Redes Neuronales

Aplicando las expresiones del anterior captulo para determinar el orden del filtro sale
que:

Tomando el polinomio de grado 3 de Chebychev para un rizado en la banda pasante de


1dB y pasndolo a filtro paso alto se obtendr su FDT normalizado:

Trasladando a la frecuencia de la banda del filtro quedar:

Aplicando la transformacin bilineal al sistema LTI de primer y segundo orden:

70

Procesamiento Digital de Seales aplicado a Redes Neuronales

2.5.2

Implementacin de los filtros digitales

Una vez calculada la FDT del filtro es posible su construccin. La ecuacin en


diferencias exige que estn disponibles los valores retrasados de la salida, de la entradas y
de las secuencias intermedias. El retardo de los valores de la secuencia implica la necesidad
de almacenar los valores pasados de la misma. Adems, hay que proporcionar medios para
multiplicar por los coeficientes los valores retrasados de la secuencia, as como para sumar
los productos resultantes.
Hay dos formas de implementar los filtros digitales: mediante un programa de
ordenador o bien por diseo en soporte fsico. Para la ejecucin en software se elaborar un
algoritmo que necesitar almacenar los valores anteriores de la salida y de la entrada y
realizar los productos y las sumas correspondientes. En el caso de utilizar lenguajes de alto
nivel, se suele usar aritmtica de punto flotante, con el objeto de evitar los efectos
asociados de la cuantificacin con la aritmtica de punto fijo, ya que pueden conducir a la
inestabilidad y a cambios significativos en la funcin de transferencia, tal como se ver ms
adelante (ver prrafo 2.6).
Si se usa Electrnica Digital, los elementos bsicos necesarios para la realizacin de un
filtro digital son sumadores, multiplicadores y memoria para almacenar los valores
retrasados de la secuencia. La interconexin de estos elementos bsicos se representan de
71

Procesamiento Digital de Seales aplicado a Redes Neuronales

forma conveniente utilizando diagramas de bloques con los smbolos bsicos que se
muestran en la figura 1.25.

Figura 1. 25. Smbolos del diagrama de bloques: a) suma de dos secuencias, b)


multiplicacin de una secuencia por una constante, c) Retardo unidad
En la notacin general de diagramas de los bloques, un sumador puede tener cualquier
nmero de entradas. Sin embargo, en casi todas las realizaciones prcticas, los sumadores
tienen dos entradas. En los diagramas que aqu se exponen esto se indica de forma
explcita. En las realizaciones digitales la operacin de retardo se puede hacer utilizando un
registro de almacenamiento por cada unidad de retardo que se necesite. Si la realizacin
utiliza circuitos integrados, los retardos podran hacerse empleando un registro de
desplazamiento temporizado con la frecuencia de muestreo de la seal de entrada. En una
realizacin software, los retardos en cascada se realizarn con registros de memoria
consecutiva.
La realizacin sistemtica en cualquiera de estos dos medios, SW o HW, se ve
considerablemente facilitada representando el filtro en diagrama de bloques. Partiendo de
las ecuaciones en diferencias del filtro:

( 2.91 )
esta expresin se puede representar por el diagrama de la figura 1.26. Al utilizar slo
sumadores con dos entradas, las sumas se realizan en un orden especfico. Es decir, la
figura 1.26 indica que deben calcularse los productos
, sumarlos
posteriormente y la suma resultante aadrsela
, y as sucesivamente. Tras
calcular yk, las variables de retardo se deben actualizar introduciendo yk-(n+-1) en el
registro que tiene yk-n, y as sucesivamente.

72

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 1. 26 Representacin genrica de los filtros a partir de la ecuacin en diferencias


Los diagramas de bloques se pueden reestructurar o modificar de diversas maneras sin
cambiar la funcin de transferencia global. Cada reestructuracin representa un algoritmo
computacional diferente para realizar el mismo sistema. Una forma ms adecuada de
implementacin se basa en la estructura en serie obtenida por la factorizacin en sistemas
de segundo orden de la funcin de transferencia del filtro:

( 2.92 )
La figura 1.27 muestra un diagrama de bloques de un filtro IIR implementado con
cascadas de segundo orden. Esta realizacin tiene cuatro sumas, cuatro multiplicaciones y
dos retardos por cada seccin de segundo orden. Esta forma de implementacin resulta la
ms efectiva para un rango variado de procesadores de propsito general as como de
procesadores especficos DSP.

Figura 1. 27 Filtro IIR en cascada


73

Procesamiento Digital de Seales aplicado a Redes Neuronales

Una realizacin en cascada se denomina comnmente implementacin en forma


cannica. La realizacin del diagrama de bloques en forma no cannica que muestra la
figura 1.26 se denomina implementacin en forma directa.
Ejemplo 1.14
Sea un filtro cuya ecuacin en diferencias es,

obtener el diagrama a bloques de la forma cannica y en forma directa.


Como se requiere de una factorizacin de sistemas de segundo orden de la funcin de
transferencia del filtro, se aplica la transformada en z a la ecuacin en diferencias,
resultando:

Las figuras adjuntas muestran la forma directa y cannica respectivamente.

Figura 1. 28. Estructuras de implementacin, a) Forma directa, b) Forma cannica

74

Procesamiento Digital de Seales aplicado a Redes Neuronales

2.6 Efectos de la cuantificacin en los filtros


Hasta el momento, en el estudio de los filtros digitales, se ha supuesto que tanto las
variables como los coeficientes de los filtros pueden tomar cualquier valor; ahora bien, la
realizacin de estos sistemas se efecta con dispositivos digitales de clculo, es decir con
computadores, en los que tanto el almacenamiento como la medida de las seales se realiza
con nmeros finitos de dgitos. La operacin de transformacin de los valores de variables
y constantes, con un nmero infinito de cifras, a un nmero concreto de bits se denomina
cuantificacin. Este proceso, imprescindible en el tratamiento de informacin con
computador, produce errores que en este ltimo punto se van a analizar y acotar.
En la implantacin de los filtros digitales aparecen tres procesos de cuantificacin:
1.

Cuantificacin de la seal de entrada

2.

Cuantificacin de los coeficientes de los filtros

3.

Errores en el redondeo de las operaciones

2.6.1 Efectos de truncamiento y redondeo


En el anlisis de error de cuantificacin, hay que tener en cuenta la forma de
representacin de los valores en el computador, segn se haga en coma fija o en coma
flotante, y, asimismo, tambin tendr influencia la forma de realizar el paso de un nmero
cualquiera, equivalente a infinitos dgitos, a un nmero finito de dgitos, segn sea por
truncamiento o por redondeo.
En general la representacin de los nmeros en computadores se realiza en base 2, es
decir en representacin binaria, por dos mtodos distintos: en coma fija, donde se utiliza un
nmero determinado de dgitos para la parte entera y otra para la parte decimal, por
ejemplo 4 y 6:

( 2.93 )
o en coma flotante, donde la representacin es de la forma:
( 2.94 )
75

Procesamiento Digital de Seales aplicado a Redes Neuronales

donde M, mantisa, es un nmero que verifica:

( 2.95 )
y c, exponente, es un nmero entero, positivo o negativo; ambos, M y c, se representan
por un nmero fijo de bits.
La forma de representacin de los nmeros negativos tiene su importancia segn se
haga por signo y magnitud, por complemento a dos o por complemento a uno.
Tanto en coma fija como flotante se va a considerar que la parte fraccionaria o mantisa
tiene b bits, entonces los nmeros se representan en saltos de
, es decir la mnima
diferencia entre dos representaciones distintas es de
Dado un nmero de infinitos dgitos, se entiende por truncamiento del mismo la
operacin de tomar los b primeros bits ms significativos, despreciando el resto, mientras
que su redondeo es tomar la representacin del valor ms prximo al mismo.
En la figura 1.29 a) se representan los valores de la seal cuantificada Q(x) en funcin
de los posibles valores de x para el caso de representacin por redondeo y coma fija. Como
se puede observar en la misma, el error en dicha cuantificacin es:
( 2.96 )

Figura 1. 29 Tcnicas de redondeo a) Cuantificacin b) Error

76

Procesamiento Digital de Seales aplicado a Redes Neuronales

En valor absoluto, el error ser, como mximo, de medio salto, es decir:

( 2.97 )
El caso de truncamiento y coma fija, utilizando el complemento a 2 para los negativos,
viene representado en la figura 1.23, donde el error est acotado entre los valores:
( 2.98 )

Figura 1. 30 Tcnicas de truncamiento a) Cuantificacin b) Error


2.6.2 Cuantificacin de seales
En la conversin analgica/digital de una seal para su tratamiento con
computadoradems del proceso de muestreo hay que tener en cuenta el de cuantificacin,
efecto ste debido a la limitacin del nmero de cifras de los registros en los que se
almacenan sus valores.
Para el estudio del efecto que esta cuantificacin de los elementos de la secuencia de
entrada produce sobre los de la secuencia de salida de un filtro digital, se va a suponer, en
primer lugar, como la forma ms usual de trabajo de los convertidores A/D, la coma fija
con b+1 bits, b la parte fraccionaria y 1 de signo, utilizando tcnicas de redondeo. Se
considera igualmente la seal normalizada a 1, es decir:

( 2.99 )
77

Procesamiento Digital de Seales aplicado a Redes Neuronales

Una representacin equivalente al proceso de cuantificacin es la derivada de


considerar, segn se indica en la figura 1.30b), su efecto como una secuencia de valores
aleatorios aadidos a la original.

( 2.100 )
Donde {ek} es una secuencia denominada frecuentemente ruido cuyos elementos
verifican:

( 2.101 )
El proceso de redondeo se caracteriza por una distribucin estadstica, tal que la
secuencia {ek} se define como una variable aleatoria con una funcin de densidad
uniforme,
entre
, que se representa en la figura 1.31.

Figura 1. 31 Funcin de densidad del error por redondeo


Los parmetros estadsticos de la media y la varianza de la misma son:

( 2.102 )
El valor que da una idea de la magnitud del error es su varianza. sta se suele referir a
la amplitud de los valores de la secuencia a cuantificar xk. Con el fin de comparar
parmetros equivalentes se define sobre la secuencia {xk} su varianza:

( 2.103 )
78

Procesamiento Digital de Seales aplicado a Redes Neuronales

con N igual al nmero de elementos cuantificados en el proceso en curso de estudio.


La medida de error de cuantificacin, representada por SNR (Signal to Noise Ratio), se
define como el cociente entre ambas desviaciones tpicas:

( 2.104 )
Como se ve en la expresin el ndice SNR aumenta con cada incremento en el nmero
de bits que se use para la representacin de la seal.
2.6.3 Cuantificacin de los coeficientes
Igual que ocurre con los valores de las muestras de la seal, en el proceso de
realizacin de un filtro, los parmetros que lo definen sufren una cuantificacin que puede
afectar, en algunas ocasiones considerablemente, a las prestaciones del sistema.
Para abordar este problema es necesario centrarse en la ecuacin caracterstica del
filtro y estudiar como varan sus races ante las variaciones en sus coeficientes. Por
ejemplo, si un sistema tiene una ecuacin en diferencias estimadas:
( 2.105 )
donde a es el coeficiente que sufre un error de cuantificacin, a, sta tendr por
ecuacin caracterstica:
( 2.106 )
en la que es claro que, si se quiere situar un polo en z = 0.995, ser necesario almacenar
el valor de a con tres cifras decimales ya que la variacin mxima de este parmetro, a,
admisible para garantizar la estabilidad es 0.005.
En general este problema se podr resolver con un anlisis de sensibilidad de las races
de la ecuacin caracterstica a los parmetros de la misma.
Las consecuencias prcticas de la cuantificacin de los coeficientes son:

Los filtros con poco ancho de banda son muy sensibles a la cuantificacin. Este
efecto se deriva por tener polos muy cerca de z = 1.

El sobremuestreo (oversampling) incrementa la sensibilidad a la cuantificacin.

L estructura fsica del filtro influye mucho.


79

Procesamiento Digital de Seales aplicado a Redes Neuronales

2.6.4 Cuantificacin de resultados de operaciones


A efectos de cuantificacin, la operacin de mayor inters es la multiplicacin ya que el
resultado de sta ocupa el doble de nmeros de cifras que de los factores, por lo que para
almacenarlo o realizar otras operaciones habr que reducir el nmero de sus cifras.
Este error de cuantificacin aparece en cada iteracin de la ecuacin en diferencias con
lo que su efecto se puede estudiar como una secuencia de nmeros aleatorios
independientes sumados a la secuencia de salida de los bloques en los que se realizan
multiplicaciones. Por ello, la importancia de este error depender fuertemente de la
estructura elegida para la implementacin del filtro.
Utilizando el esquema tpico de la construccin de un filtro, segn se indic en la
figura 1.27, y siguiendo las propiedades estadsticas enunciadas sobre el error de
cuantificacin, los ruidos son aditivos, pudindose reemplazar por unos cuyos elementos
representativos valgan:

( 2.107 )
Si cada uno de los ruidos considerados tiene iguales propiedades estadsticas, dadas en
(2. 102), las del total, suma de los referidos, sern:

( 2.108 )
indicando que a medida de que se aumente el orden del filtro mayor ser el incremento
del error cometido por redondeo en las multiplicaciones.

Pues con esto se ha concluido el capitulo 2 en el cual observamos y obtuvimos la


descripcin detallada de los tipos de filtros digitales as como su diseo en forma
matemtica. A continuacin en el captulo tres se darn a conocer los aspectos
concernientes a las redes neuronales para que posteriormente se introduzca el tema de las
seales digitales aplicadas a las redes neuronales.
80

Procesamiento Digital de Seales aplicado a Redes Neuronales

CAPITULO III
LAS REDES NEURONALES

81

Procesamiento Digital de Seales aplicado a Redes Neuronales

3. Introduccin a las redes neuronales.


El hombre se ha caracterizado siempre por su bsqueda constante de
nuevas vas para mejorar sus condiciones de vida. Estos esfuerzos le
han servido para reducir el trabajo en aquellas operaciones en las que la
fuerza juega un papel primordial. Los Progresos obtenidos han permitido
dirigir estos esfuerzos a otros campos, como por Ejemplo, a la
construccin de mquinas calculadoras que ayuden a resolver de forma
automtica y rpida determinadas operaciones que resultan tediosas
cuando se realizan a mano. Uno de los primeros en acometer esta
empresa fue Charles Babbage, quien trat infructuosamente de construir
una mquina capaz de resolver problemas matemticos Posteriormente
otros tantos intentaron construir mquinas similares, pero no fue hasta
la Segunda Guerra Mundial, cuando ya se dispona de instrumentos
electrnicos, que se empezaron a recoger los primeros frutos. En 1946
se construy la primera computadora electrnica, ENIAC. Desde
entonces los desarrollos en este campo han tenido un auge
espectacular. Estas mquinas permiten implementar fcilmente
algoritmos para resolver multitud de problemas que antes resultaban
engorrosos de resolver. Sin embargo, se observa una limitacin
importante: qu ocurre cuando el problema que se quiere resolver no
admite un tratamiento algortmico, como es el caso, por ejemplo, de la
clasificacin de objetos por rasgos comunes? Este ejemplo demuestra
que la construccin de nuevas mquinas ms verstiles requiere un
enfoque del problema desde otro punto de vista. Los desarrollos actuales
de los cientficos se dirigen al estudio de las capacidades humanas como
una fuente de nuevas ideas para el diseo de las nuevas mquinas. As,
la inteligencia artificial es un intento por descubrir y describir aspectos
de la inteligencia humana que pueden ser simulados mediante
mquinas. Esta disciplina se ha desarrollado fuertemente en los ltimos
aos teniendo aplicacin en algunos campos como visin artificial,
demostracin de teoremas, procesamiento de informacin expresada
mediante lenguajes humanos... etc. Las redes neuronales son ms que
otra forma de emular ciertas caractersticas propias de los humanos,
como la capacidad de memorizar y de asociar hechos. Si se examinan
con atencin aquellos problemas que no pueden expresarse a travs de
un algoritmo, se observar que todos ellos tienen una caracterstica en
comn: la experiencia. El hombre es capaz de resolver estas situaciones
acudiendo a la experiencia acumulada. As, parece claro que una forma
de aproximarse al problema consista en la construccin de sistemas que
sean capaces de reproducir esta caracterstica humana. En definitiva, las
redes neuronales no son ms que un modelo artificial y simplificado del
cerebro humano, que es el ejemplo ms perfecto del que disponemos
para un sistema que es capaz de adquirir conocimiento a travs de la
experiencia. Una red neuronal es un nuevo sistema para el tratamiento
82

Procesamiento Digital de Seales aplicado a Redes Neuronales

de la informacin, cuya unidad bsica de procesamiento est inspirada


en la clula fundamental del sistema nervioso humano: la neurona.
Todos los procesos del cuerpo humano se relacionan en alguna u otra
forma con la (in)actividad de estas neuronas. Las mismas son un
componente relativamente simple del ser humano, pero cuando millares
de ellas se conectan en forma conjunta se hacen muy poderosas. Lo que
bsicamente ocurre en una neurona biolgica es lo siguiente: la neurona
es estimulada o excitada a travs de sus entradas (inputs) y cuando se
alcanza un cierto umbral, la neurona se dispara o activa, pasando una
seal hacia el axon. Posteriores investigaciones condujeron al
descubrimiento de que estos procesos son el resultado de eventos
electroqumicos. Como ya se sabe, el pensamiento tiene lugar en el
cerebro, que consta de billones de neuronas interconectadas. As, el
secreto de la inteligencia -sin importar como se defina- se sita dentro
de estas neuronas interconectadas y de su interaccin. Tambin, es bien
conocido que los humanos son capaces de aprender. Aprendizaje
significa que aquellos problemas que inicialmente no pueden resolverse,
pueden ser resueltos despus de obtener ms informacin acerca del
problema. Por lo tanto, las Redes Neuronales...
_ Consisten de unidades de procesamiento que intercambian datos e
informacin.
_ Se utilizan para reconocer patrones, incluyendo imgenes, manuscritos
y secuencias de
tiempo (por ejemplo: tendencias
financieras)._ Tienen capacidad de aprender y mejorar su
funcionamiento.
Una primera clasificacin de los modelos de redes neuronales podra ser,
atendiendo a su similitud con la realidad biolgica:
1) El modelo de tipo biolgico. Este comprende las redes que tratan de
simular los
sistemas neuronales biolgicos, as como las
funciones auditivas o algunas funciones bsicas de la visin.
2) El modelo dirigido a aplicacin. Este modelo no tiene por qu guardar
similitud con los sistemas biolgicos. Su arquitectura est fuertemente
ligada a las necesidades de las aplicaciones para la que es diseada.
3.1 Historia de las redes neuronales.
1936 - Alan Turing. Fue el primero en estudiar el cerebro como una forma
de ver el mundo de la computacin. Sin embargo, los primeros tericos
que concibieron los fundamentos de la computacin neuronal fueron
Warren McCulloch, un neurofisilogo, y Walter Pitts, un matemtico,
quienes, en 1943, lanzaron una teora acerca de la forma de trabajar de
las neuronas (Un Clculo Lgico de la Inminente Idea de la Actividad
una red neuronal simple mediante circuitos elctricos.
83

Procesamiento Digital de Seales aplicado a Redes Neuronales

1949 - Donald Hebb. Fue el primero en explicar los procesos del


aprendizaje (que es el elemento bsico de la inteligencia humana) desde
un punto de vista psicolgico, desarrollando una regla de como el
aprendizaje ocurra. Aun hoy, este es el fundamento de la mayora de las
funciones de aprendizaje que pueden hallarse en una red neuronal. Su
idea fue que el aprendizaje ocurra cuando ciertos cambios en una
neurona eran activados. Tambin intent encontrar semejanzas entre el
aprendizaje y la actividad nerviosa. Los trabajos de Hebb formaron las
bases de la Teora de las Redes Neuronales. 1950 - Karl Lashley. En sus
series de ensayos, encontr que la informacin no era almacenada en
forma centralizada en el cerebro sino que era distribuida encima de l.
1956 - Congreso de Dartmouth. Este Congreso frecuentemente se
menciona para indicar el nacimiento de la inteligencia artificial. 1957 Frank Rosenblatt. Comenz el desarrollo del Perceptron. Esta es la red
neuronal ms antigua; utilizndose hoy en da para aplicacin como
identificador de patrones. Este modelo era capaz de generalizar, es
decir, despus de haber aprendido
una serie de patrones poda reconocer otros similares, aunque no se le
hubiesen presentado en el entrenamiento. Sin embargo, tena una serie
de limitaciones, por ejemplo, su incapacidad para resolver el problema
de la funcin OR-exclusiva y, en general, era incapaz de clasificar clases
no separables linealmente. 1959 - Frank Rosenblatt: Principios de
Neurodinmica. En este libro confirm que, bajo ciertas condiciones, el
aprendizaje del Perceptron converga hacia un estado finito (Teorema de
Convergencia del Perceptron).
1960 - Bernard Widroff/Marcian Hoff. Desarrollaron el modelo Adaline
(ADAptative LINear Elements). Esta fue la primera red neuronal aplicada
a un problema real (filtros adaptativos para eliminar ecos en las lneas
telefnicas) que se ha utilizado comercialmente durante varias dcadas.
1961 - Karl Steinbeck: Die Lernmatrix. Red neuronal para simples
realizaciones
tcnicas (memoria asociativa).
1969 - Marvin Minsky/Seymour Papert. En este ao casi se produjo la
muerte abrupta de las Redes Neuronales; ya que Minsky y Papert
probaron (matemticamente) que el Perceptrons no era capaz de
resolver problemas relativamente fciles, tales como el aprendizaje de
una funcin no-lineal. Esto demostr que el Perceptron era muy dbil,
dado que las funciones no-lineales son extensamente empleadas en
computacin y en los problemas del mundo real.
1974 - Paul Werbos. Desarroll la idea bsica del algoritmo de
aprendizaje de
84

Procesamiento Digital de Seales aplicado a Redes Neuronales

propagacin hacia atrs (backpropagation); cuyo significado qued


definitivamente
aclarado en 1985.
1977 - Stephen Grossberg: Teora de Resonancia Adaptada (TRA). La
Teora de Resonancia Adaptada es una arquitectura de red que se
diferencia de todas las dems previamente inventadas. La misma
simula otras habilidades del cerebro: memoria a largo y corto plazo.
1985 - John Hopfield. Provoc el renacimiento de las redes neuronales
con su libro: Computacin neuronal de decisiones en problemas de
optimizacin.
1986 - David Rumelhart/G. Hinton. Redescubrieron el algoritmo de
aprendizaje
de propagacin hacia atrs (backpropagation).
A partir de 1986, el panorama fue alentador con respecto a las
investigaciones y el desarrollo de las redes neuronales. En la actualidad,
son numerosos los trabajos que se realizan y publican cada ao, las
aplicaciones nuevas que surgen (sobretodo en el rea de control) y las
empresas que lanzan al mercado productos nuevos, tanto hardware
como software (sobre todo para simulacin).

3.2

Generalidades.

3.2.1Definiciones de una red neuronal.


Existen numerosas formas de definir a las redes neuronales; desde las
definiciones cortas y genricas hasta las que intentan explicar ms
detalladamente qu son las redes neuronales.
Por ejemplo:
1) Una nueva forma de computacin, inspirada en modelos
biolgicos.
2) Un modelo matemtico compuesto por un gran nmero de
elementos
85

Procesamiento Digital de Seales aplicado a Redes Neuronales

procesales organizados en niveles.


3).un sistema de computacin compuesto por un gran nmero de
elementos simples, elementos de procesos muy interconectados,
los cuales procesan informacin por medio de su estado dinmico
como respuesta a entradas externas. 4) Redes neuronales
artificiales son redes interconectadas masivamente en paralelo de
elementos simples (usualmente adaptativos) y c on organizacin
jerrquica, las cuales intentan interactuar con los objetos del
mundo real del mismo modo que lo hace el sistema nervioso
biolgico.
3.2.2 Ventajas que ofrecen las red neuronal.
Debido a su constitucin y a sus fundamentos, las redes neuronales
artificiales presentan un gran nmero de caractersticas semejantes a
las del cerebro. Por ejemplo, son capaces de aprender de la experiencia,
de generalizar de casos anteriores a nuevos casos, de abstraer
caractersticas esenciales a partir de entradas que representan
informacin irrelevante, etc. Esto hace que ofrezcan numerosas ventajas
y que este tipo de tecnologa se est aplicando en mltiples reas. Entre
las ventajas se incluyen:

Aprendizaje Adaptativo. Capacidad de aprender a realizar tareas


basadas en un entrenamiento o en una experiencia inicial.
Auto-organizacin. Una red neuronal puede crear su propia
organizacin o representacin de la informacin que recibe
mediante una etapa de aprendizaje. _ Tolerancia a fallos.
La destruccin parcial de una red conduce a unadegradacin de
su estructura; sin embargo, algunas capacidades de la red se
pueden retener, incluso sufriendo un gran dao.
Operacin en tiempo real. Los cmputos neuronales pueden ser
realizados en paralelo; para esto se disean y fabrican mquinas
con hardware especial para obtener esta capacidad.
Fcil insercin dentro de la tecnologa existente. Se pueden
obtener chips especializados para redes neuronales que mejoran
su capacidad en ciertas tareas. Ello facilitar la integracin
modular en los sistemas existentes.

3.2.2.1 Aprendizaje adaptativo.

86

Procesamiento Digital de Seales aplicado a Redes Neuronales

La capacidad de aprendizaje adaptativo es una de las caractersticas


ms atractivas de redes neuronales. Esto es, aprenden a llevar a cabo
ciertas tareas mediante un entrenamiento con ejemplos ilustrativos.
Como las redes neuronales pueden aprender a diferenciar patrones
mediante ejemplos y entrenamientos, no es necesario elaborar modelos
a priori ni necesidad de especificar funciones de distribucin de
probabilidad.
Las redes neuronales son sistemas dinmicos autoadaptativos. Son
adaptables debido a la capacidad de autoajuste de los elementos
procesales (neuronas) que componen el sistema. Son dinmicos, pues
son capaces de estar constantemente cambiando para adaptarse a las
nuevas condiciones.
En el proceso de aprendizaje, los enlaces ponderados de las neuronas se
ajustan de manera que se obtengan ciertos resultados especficos. Una
red neuronal no necesita un algoritmo para resolver un problema, ya que
ella puede generar su propia distribucin de pesos en los enlaces
mediante el aprendizaje. Tambin existen redes que continan
aprendiendo a lo largo de su vida, despus de completado su perodo de
entrenamiento.
La funcin del diseador es nicamente la obtencin de la arquitectura
apropiada. No es problema del diseador el cmo la red aprender a
discriminar. Sin embargo, s es necesario que desarrolle un buen
algoritmo de aprendizaje que le proporcione a la red la capacidad de
discriminar, mediante un entrenamiento con patrones.
3.2.2.2 Auto-organizacin.
Las redes neuronales emplean su capacidad de aprendizaje adaptativo
para autoorganizar la informacin que reciben durante el aprendizaje y/o
la operacin. Mientras que el aprendizaje es la modificacin de cada
elemento procesal, la autoorganizacin consiste en la modificacin de la
red neuronal completa para llevar a cabo un objetivo especfico. Cuando
las redes neuronales se usan para reconocer ciertas clases de patrones,
ellas autoorganizan la informacin usada. Por ejemplo, la red llamada
backpropagation, crear su propia representacin caracterstica,
mediante la cual puede reconocer ciertos patrones.
Esta autoorganizacin provoca la generalizacin: facultad de las redes
neuronales de responder apropiadamente cuando se les presentan datos
o situaciones a las que no haba sido expuesta anteriormente. El sistema
puede generalizar la entrada para obtener una respuesta. Esta
caracterstica es muy importante cuando se tiene que solucionar
problemas en los cuales la informacin de entrada no es muy clara;
87

Procesamiento Digital de Seales aplicado a Redes Neuronales

adems permite que el sistema d una solucin, incluso cuando la


informacin de entrada est especificada de forma incompleta.

3.2.2.3 Tolerancia a fallos.


Las redes neuronales fueron los primeros mtodos computacionales con
la capacidad inherente de tolerancia a fallos. Comparados con los
sistemas computacionales tradicionales, los cuales pierden su
funcionalidad cuando sufren un pequeo error de memoria, en las redes
neuronales, si se produce un fallo en un nmero no muy grande de
neuronas y aunque el comportamiento del sistema se ve influenciado,
no sufre una cada repentina.
Hay dos aspectos distintos respecto a la tolerancia a fallos:
a) Las redes pueden aprender a reconocer patrones con ruido,
distorsionados o incompletos. Esta es una tolerancia a fallos respecto a
los datos.
b) Las redes pueden seguir realizando su funcin (con cierta
degradacin) aunque se destruya parte de la red.
La razn por la que las redes neuronales son tolerantes a los fallos es
que tienen su informacin distribuida en las conexiones entre neuronas,
existiendo cierto grado de redundancia en este tipo de almacenamiento.
La mayora de los ordenadores , y se generar un patrn de salida que
represente la informacin almacenada.
3.2.2.4 Operacin en tiempo real.
Una de las mayores prioridades, casi en la totalidad de las reas de
aplicacin, es la necesidad de realizar procesos con datos de forma muy
rpida. Las redes neuronales se adaptan bien a esto debido a su
implementacin paralela. Para que la mayora de las redes puedan
operar en un entorno de tiempo real, la necesidad de cambio en los
pesos de las conexiones o entrenamiento es mnimo.
3.2.2.5 Fcil insercin dentro de la tecnologa existente.
Una red individual puede ser entrenada para desarrollar una nica y bien
definida tarea (tareas complejas, que hagan mltiples selecciones de
patrones, requerirn sistemas de redes interconectadas). Con las
herramientas computacionales existentes (no del tipo PC), una red
puede ser rpidamente entrenada, comprobada, verificada y trasladada
88

Procesamiento Digital de Seales aplicado a Redes Neuronales

a una implementacin hardware de bajo coste. Por lo tanto, no se


presentan dificultades para la insercin de redes neuronales en
aplicaciones especficas, por ejemplo de control, dentro de los sistemas
existentes. De esta manera, las redes neuronales se pueden utilizar para
mejorar sistemas en forma incremental y cada paso puede ser evaluado
antes de acometer un desarrollo ms amplio.

3.3 Redes neuronales y computadoras digitales.


Para entender el potencial de la computacin neuronal, sera necesario
hacer una breve distincin entre sistemas de computacin neuronales y
digitales: los sistemas neurolgicos no aplican principios de circuitos
lgicos o digitales. Un sistema de computacin digital debe ser sncrono
o asncrono. Si fuera asncrono, la duracin de los impulsos neuronales
debera ser variable para mantener uno de los valores binarios por
periodos de tiempo indefinido, lo cual no es el caso. Si el principio fuera
sncrono, se necesitara un reloj global o maestro con el cual los pulsos
estn sincronizados. ste tampoco es el caso. Las neuronas no pueden
ser circuitos de umbral lgico, porque hay miles de entradas variables
en la mayora de las neuronas y el umbral es variable con el tiempo,
siendo afectado por la estimulacin, atenuacin, etc. La precisin y
estabilidad de tales circuitos no es suficiente para definir ninguna
funcin booleana. Los procesos colectivos que son importantes en
computacin neuronal no pueden implementarse por computacin
digital. Por todo ello, el cerebro debe ser un computador analgico. Ni las
neuronas ni las sinapsis son elementos de memoria biestable. Todos los
hechos fisiolgicos hablan a favor de las acciones de las neuronas como
integradores analgicos, y la eficiencia de la sinapsis cambia de forma
gradual, lo cual no es caracterstico de sistemas biestables. Los circuitos
del cerebro no implementan computacin recursiva y por lo tanto no son
algortmicos. Debido a los problemas de estabilidad, los circuitos
neuronales no son suficientemente estables para definiciones recursivas
de funciones como en computacin digital. Un algoritmo, por definicin,
define una funcin recursiva.

89

Procesamiento Digital de Seales aplicado a Redes Neuronales

3.4.

Conceptos Bsicos.

3.4.1 Elementos bsicos que componen una red neuronal.


A continuacin se puede ver, en la Figura 4.1, un esquema de una red
neuronal:

Figura 3.1: ejemplo de una red neuronal totalmente conectada.

La misma est constituida por neuronas interconectadas y arregladas en


tres capas (esto ltimo puede variar). Los datos ingresan por medio de la
capa de entrada, pasan a travs de la capa oculta y salen por la
capa de salida. Cabe mencionar que la capa oculta puede estar
constituida por varias capas.
90

Procesamiento Digital de Seales aplicado a Redes Neuronales

Antes de comenzar el estudio sobre las redes neuronales, se debe


aprender algo sobre las neuronas y de cmo ellas son utilizadas por una
red neuronal. En la Figura 4.2 se compara una neurona biolgica con una
neurona artificial. En la misma se pueden observar las similitudes entre
ambas (tienen entradas, utilizan pesos y generan salidas).

Figura 3.2: comparacin entre una neurona biolgica (izquierda) y una artificial
(derecha).

Mientras una neurona es muy pequea en s misma, cuando se


combinan cientos, miles o millones de ellas pueden resolver problemas
muy complejos. Por ejemplo el cerebro humano se compone de billones
de tales neuronas.
3.4.2 Funcin de entrada (input function).
La neurona trata a muchos valores de entrada como si fueran uno solo;
esto recibe el nombre de entrada global. Por lo tanto, ahora nos
enfrentamos al problema de cmo se pueden combinar estas simples
entradas (ini1, ini2, ...) dentro de la entrada global, gini. Esto se logra a
travs de la funcin de entrada, la cual se calcula a partir del vector
entrada. La funcin de entrada puede describirse como sigue:
inputi = (ini1 wi1)* (ini2 wi2)*... (inin win)
donde: * representa al operador apropiado (por ejemplo: mximo,
sumatoria, productoria, etc.), n al nmero de entradas a la neurona Ni y
wi al peso.
Los valores de entrada se multiplican por los pesos anteriormente
ingresados a la neurona. Por consiguiente, los pesos que generalmente
no estn restringidos cambian la medida de influencia que tienen los
valores de entrada. Es decir, que permiten que un gran valor de entrada
tenga solamente una pequea influencia, si estos son lo suficientemente
pequeos.

91

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 3.3: ejemplo de una neurona con 2 entradas y 1 salida.

La nomenclatura utilizada en la Figura 3.3 es la siguiente: ini1 = entrada nmero 1 a la


neurona Ni; wi1 = peso correspondiente a ini1; ini2 = entrada nmero 2 a la neurona Ni; wi2 =
peso correspondiente a ini2; y outi = salida de la neurona Ni. El conjunto de todas las n
entradas ini = (ini1, ini2, ..., inin) es comnmente llamado vector entrada.Algunas de las
funciones de entrada ms comnmente utilizadas y conocidas
son:
1) Sumatoria de las entradas pesadas: es la suma de todos los valores de
entrada a la neurona, multiplicados por sus correspondientes pesos

2) Productoria de las entradas pesadas: es el producto de todos los valores de


entrada a la neurona, multiplicados por sus correspondientes pesos.

3) Mximo de las entradas pesadas: solamente toma en consideracin el valor de


entrada ms fuerte, previamente multiplicado por su peso correspondiente.
Para explicar porque se utilizan estas funciones de activacin se
suele emplear la analoga a la aceleracin de un automvil. Cuando un
auto inicia su movimiento necesita una potencia elevada para comenzar
a acelerar. Pero al ir tomando velocidad, este demanda un menor
incremento de dicha potencia para mantener la aceleracin. Al llegar a
altas velocidades, nuevamente un amplio incremento en la potencia es
necesario para obtener una pequea ganancia de velocidad. En
resumen, en ambos extremos del rango de aceleracin de un automvil
92

Procesamiento Digital de Seales aplicado a Redes Neuronales

se demanda una mayor potencia para la aceleracin que en la mitad de


dicho rango.
3.4.3 Funcin de activacin (activation function).
Una neurona biolgica puede estar activa (excitada) o inactiva (no excitada); es decir, que
tiene un estado de activacin. Las neuronas artificiales tambin tienen diferentes estados
de activacin; algunas de ellas solamente dos, al igual que las biolgicas, pero otras pueden
tomar cualquier valor dentro de un conjunto determinado. La funcin activacin calcula el
estado de actividad de una neurona; transformando la entrada global (menos el umbral, i)
en un valor (estado) de activacin, cuyo rango normalmente va de (0 a 1) o de (1 a 1).
Esto es as, porque una neurona puede estar totalmente inactiva (0 o 1) o activa (1). La
funcin activacin, es una funcin de la entrada global (gini) menos el umbral (i). Las
funciones de activacin ms comnmente utilizadas se detallan a continuacin:
1) Funcin lineal:

a(gini - i), cuando el argumento de (gini - i)


Figura 4.4: funcin de activacin lineal.
est comprendido dentro del rango (-1/a, 1/a).
Por encima o por debajo de esta zona se fija la salida en 1 o 1, respectivamente.
Cuando a = 1 (siendo que la misma afecta la pendiente de la grfica), la salida es igual a
la entrada.

2) Funcin sigmoidea:

93

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 3.5: funcin de activacin sigmoidea

Los valores de salida que proporciona esta funcin estn comprendidos dentro de un rango
que va de 0 a 1. Al modificar el valor de g se ve afectada la pendiente de la funcin de
activacin.
3) Funcin tangente hiperblica:

Figura 3.6: funcin de activacin


tangente hiperblica.

Los valores de salida que proporciona esta funcin estn comprendidos dentro de un rango
que va de 0 a 1. Al modificar el valor de g se ve afectada la pendiente de la funcin
desactivacin.

Para explicar porque se utilizan estas funciones de activacin se suele emplear la analoga a
la aceleracin de un automvil. Cuando un auto inicia su movimiento necesita una potencia
elevada para comenzar a acelerar. Pero al ir tomando velocidad, este demanda un menor
incremento de dicha potencia para mantener la aceleracin. Al llegar a altas velocidades,
nuevamente un amplio incremento en la potencia es necesario para obtener una pequea
ganancia de velocidad. En resumen, en ambos extremos del rango de aceleracin de un
automvil se demanda una mayor potencia para la aceleracin que en la mitad de dicho
rango.

3.4.4 Funcin de salida (output function).


El ltimo componente que una neurona necesita es la funcin de salida.
El valor resultante de esta funcin es la salida de la neurona i (outi); por
94

Procesamiento Digital de Seales aplicado a Redes Neuronales

ende, la funcin de salida determina que valor se transfiere a las


neuronas vinculadas. Si la funcin de activacin est por debajo de un
umbral determinado, ninguna salida se pasa a la neurona subsiguiente.
Normalmente, no cualquier valor es permitido como una entrada para
una neurona, por lo tanto, los valores de salida estn comprendidos en
el rango [0, 1] o [-1, 1]. Tambin pueden ser binarios {0, 1} o {-1, 1}.
Dos de las funciones de salida ms comunes son:

Ninguna: este es el tipo de funcin ms sencillo, tal que la salida


es la misma
que la entrada. Es tambin llamada funcin identidad.

Una vez implementado el conocimiento de las redes neuronales y


continuamos con los conceptos bsicos de una red neuronal en los
cuales quedaron claros y fielmente explicados. Ahora en nuestro capitulo
cuatro veremos la forma de aplicacin de las funciones ms elementales
de las redes neuronales como son las aplicaciones de aprendizaje
validacin y codificacin..

95

Procesamiento Digital de Seales aplicado a Redes Neuronales

CAPITULO IV
APRENDIZAJE, VALIDACION Y
CODIFICACION

4. Aprendizaje, Validacin y Codificacin.


4.1 Niveles o capas de una red neuronal.
La distribucin de neuronas dentro de la red se realiza formando niveles
o capas, con un nmero determinado de dichas neuronas en cada una
de ellas. A partir de su situacin dentro de la red, se pueden distinguir
tres tipos de capas:

96

Procesamiento Digital de Seales aplicado a Redes Neuronales

- De entrada: es la capa que recibe directamente la informacin


proveniente de las fuentes externas de la red.
- Ocultas: son internas a la red y no tienen contacto directo con el
entorno exterior. El nmero de niveles ocultos puede estar entre cero y
un nmero elevado. Las neuronas de las capas ocultas pueden estar
interconectadas de distintas maneras, lo que determina, junto con su
nmero, las distintas topologas de redes neuronales.
- De salidas: transfieren informacin de la red hacia el exterior.
En la Figura 3.1 se puede ver el ejemplo de la estructura de una posible
red multicapa, en la que cada nodo o neurona nicamente est
conectada con neuronas de un nivel superior. Notar que hay ms
conexiones que neuronas en s; en este sentido, se dice que una red es
totalmente conectada si todas las salidas desde un nivel llegan a todos y
cada uno de los nodos del nivel siguiente.
4.2 Tipos de neuronas artificiales.
Las neuronas artificiales se pueden clasificar de acuerdo a los valores
que pueden tomar. Por ahora es suficiente distinguir entre dos tipos
principales:
a- Neuronas binarias.
b- Neuronas reales.
Las neuronas binarias solamente pueden tomar valores dentro del
intervalo {0, 1} o {-1, 1}, mientras que las neuronas reales pueden
hacerlo dentro del rango [0, 1] o [-1, 1]. Los peso normalmente no estn
restringidos a un cierto intervalo, aunque para aplicaciones especficas
puede ser esto necesario.

4.3 Tcnicas de decisin.


97

Procesamiento Digital de Seales aplicado a Redes Neuronales

En general, el proceso de decisin puede ser caracterizado como se


muestra en el diagrama de la Figura 4.1:

Lo mismo ocurre cuando se utiliza una red neuronal como un sistema de


sostn de decisiones. La salida de la red neuronal es directa o
indirectamente la solucin al problema o la decisin a tomar. Por
ejemplo: si uno desea determinar si un cliente, el cual est preguntando
por la solicitud de un crdito, es un buen candidato (lo que significa que
es confiable, o sea, que puede devolver el crdito solicitado), se podran
tomar en consideracin variables o atributos tales como antecedentes
de crditos, pasivo, garantas y ganancias. Las variables o atributos
pertenecientes a un cliente especfico son las entradas al proceso de
decisin. El resultado de tal proceso podra ser una decisin similar a la
siguiente: cliente bueno o cliente malo.
Los atributos expuestos en la Tabla 5.1 sern tomados en cuenta
para el caso del puntaje para un crdito:

Tabla 4.1

A menudo las reglas que muestran la lgica (o falta de lgica) sobre las
que se basan las decisiones no son tan obvias. Por lo tanto, una persona
que no conoce mucho acerca del sujeto que solicita el prstamo, no
puede tomar una decisin correcta. Nota que aqu los valores son ms
bien simblicos que numricos. Las redes neuronales reales necesitan
98

Procesamiento Digital de Seales aplicado a Redes Neuronales

entradas numricas, pero por el momento se utilizarn entradas


simblicas para facilitar el entendimiento.
En la Tabla 4.2 se presenta un conjunto de datos de anteriores
situaciones de decisin, cada una de ellas caracterizada por diferentes
valores de las variables de entrada, con su respectiva decisin (0 es un
cliente bueno, 1 uno promedio y 2 uno malo).

Tabla 4.2

Dentro de esta base de datos yace el procedimiento de decisin, o en


otras palabras, la regla de decisin que conforma las bases para el
problema de decisin: puntaje para un crdito.
La pregunta a contestar ahora es: puede encontrarse una estructura o
regla de decisin en este conjunto de datos? La respuesta es si, las
redes neuronales pueden hallar una regla de decisin a travs de un
conjunto de datos como el presentado en la Tabla 4.2.
4.4 Mecanismos de aprendizaje.
Se ha visto que los datos de entrada se procesan a travs de la red
neuronal con el propsito de lograr una salida. Tambin se dijo que las
redes neuronales extraen generalizaciones desde un conjunto
determinado de ejemplos anteriores de tales problemas de decisin. Una
red neuronal debe aprender a calcular la salida correcta para cada
constelacin (arreglo o vector) de entrada en el conjunto de ejemplos.
Este proceso de aprendizaje se denomina: proceso de entrenamiento o
acondicionamiento. El conjunto de datos (o conjunto de ejemplos) sobre
el cual este proceso se basa es, por ende, llamado: conjunto de datos de
entrenamiento.

99

Procesamiento Digital de Seales aplicado a Redes Neuronales

Si la topologa de la red y las diferentes funciones de cada neurona


(entrada, activacin y salida) no pueden cambiar durante el aprendizaje,
mientras que los pesos sobre cada una de las conexiones si pueden
hacerlo; el aprendizaje de una red neuronal significa: adaptacin de los
pesos.
En otras palabras el aprendizaje es el proceso por el cual una red
neuronal modifica sus pesos en respuesta a una informacin de entrada.
Los cambios que se producen durante el mismo se reducen a la
destruccin, modificacin y creacin de conexiones entre las neuronas.
En los sistemas biolgicos existe una continua destruccin y creacin de
conexiones entre las neuronas. En los modelos de redes neuronales
artificiales, la creacin de una nueva conexin implica que el peso de la
misma pasa a tener un valor distinto de cero. De la misma manera, una
conexin se destruye cuando su peso pasa a ser cero.
Durante el proceso de aprendizaje, los pesos de las conexiones de la red
sufren modificaciones, por lo tanto, se puede afirmar que este proceso
ha terminado (la red ha aprendido) cuando los valores de los pesos
permanecen estables (dwij/dt = 0). Un aspecto importante respecto al
aprendizaje de las redes neuronales es el conocer cmo se modifican los
valores de los pesos, es decir, cules son los criterios que se siguen para
cambiar el valor asignado a las conexiones cuando se pretende que la
red aprenda una nueva informacin. Hay dos mtodos de aprendizaje
importantes que pueden distinguirse:
a- Aprendizaje supervisado.
b- Aprendizaje no supervisado.
Otro criterio que se puede utilizar para diferenciar las reglas de
aprendizaje se basa en considerar si la red puede aprender durante su
funcionamiento habitual o si el aprendizaje supone la desconexin de la
red, es decir, su inhabilitacin hasta que el proceso termine. En el primer
caso, se tratara de un aprendizaje on line, mientras que el segundo es
lo que se conoce como off line. Cuando el aprendizaje es off line, se
distingue entre una fase de aprendizaje o entrenamiento y una fase de
operacin o funcionamiento, existiendo un conjunto de datos de
entrenamiento y un conjunto de datos de test o prueba, que sern
utilizados en la correspondiente fase. Adems, los pesos de las
conexiones permanecen fijos despus que termina la etapa de
entrenamiento de la red. Debido precisamente a su carcter esttico,
estos sistemas no presentan problemas de estabilidad en su
funcionamiento.
Una generalizacin de la frmula o regla para decir los cambios en los
pesos es
la siguiente:
100

Procesamiento Digital de Seales aplicado a Redes Neuronales

Peso Nuevo = Peso Viejo + Cambio de Peso


Matemticamente esto es:
wij(t+1) = wij(t) + wij(t)
donde t hace referencia a la etapa de aprendizaje, wij(t+1) al peso nuevo
y wij(t) al peso
viejo.

4.4.1 Aprendizaje supervisado.


El aprendizaje supervisado se caracteriza porque el proceso de
aprendizaje se realiza mediante un entrenamiento controlado por un
agente externo (supervisor, maestro) que determina la respuesta que
debera generar la red a partir de una entrada determinada. El
supervisor controla la salida de la red y en caso de que sta no coincida
con la deseada, se proceder a modificar los pesos de las conexiones,
con el fin de conseguir que la salida obtenida se aproxime a la deseada.
En este tipo de aprendizaje se suelen considerar, a su vez, tres formas
de llevarlo
a cabo, que dan lugar a los siguientes aprendizajes supervisados:
1) Aprendizaje por correccin de error.
2) Aprendizaje por refuerzo.
3) Aprendizaje estocstico.
4.4.1.1 Aprendizaje por correccin de error.
Consiste en ajustar los pesos de las conexiones de la red en funcin de
la diferencia entre los valores deseados y los obtenidos a la salida de la
red, es decir, en funcin del error cometido en la salida.
Un ejemplo de este tipo de algoritmos lo constituye la regla de
aprendizaje del Perceptron, utilizada en el entrenamiento de la red del
mismo nombre que desarroll Rosenblatt en 1958 [Rosenblatt 58]. Esta
es una regla muy simple, para cada neurona en la capa de salida se le
calcula la desviacin a la salida objetivo como el error, . El cual luego
se utiliza para cambiar los pesos sobre la conexin de la neurona
101

Procesamiento Digital de Seales aplicado a Redes Neuronales

precedente. El cambio de los pesos por medio de la regla de aprendizaje


del Perceptron se realiza segn la siguiente regla:

donde: aqi es la salida deseada/objetivo de la neurona de salida Ni,i =


(aqi outi) la desviacin objetivo de la neurona Ni y el aprendizaje.
La salida de la neurona Nj (outj) se utiliza, porque este valor
influye en la entrada global y, por ende, en la activacin y luego en la
salida de la neurona Ni. Esto es semejante a un efecto en cadena. Ver
Figura 4.2

Figura 4.2: influencia de la salida de la


neurona Nj en la entrada de la neurona Ni.

Otro algoritmo muy conocido y que pertenece a esta clasificacin es la


regla de aprendizaje Delta o regla del mnimo error cuadrado (LMS Error:
Least Mean Squared Error), que tambin utiliza la desviacin a la salida
objetivo, pero toma en consideracina todas las neuronas predecesoras
que tiene la neurona de salida. Esto permite cuantificar el error global
cometido en cualquier momento durante el proceso de entrenamiento
de la red, lo cual es importante, ya que cuanto ms informacin se tenga
sobre el error cometido, ms rpido se puede aprender. Luego el error
calculado ( ) es igualmente repartido entre las conexiones de las
neuronas predecesoras. Por ltimo se debe mencionar la regla de
aprendizaje de propagacin hacia atrs o de backpropagation, tambin
conocido como regla LMS multicapa, la cual es una generalizacin de la
regla de aprendizaje Delta. Esta es la primer regla de aprendizaje que
permiti realizar cambios sobre los pesos en las conexiones de la capa
oculta.
4.4.1.2 Aprendizaje por refuerzo.
Se trata de un aprendizaje supervisado, ms lento que el anterior, que
se basa en la idea de no disponer de un ejemplo completo del
comportamiento deseado, es decir, de no indicar durante el
entrenamiento exactamente la salida que se desea que proporcione la
red ante una determinada entrada.

102

Procesamiento Digital de Seales aplicado a Redes Neuronales

En el aprendizaje por refuerzo la funcin del supervisor se reduce a


indicar mediante una seal de refuerzo si la salida obtenida en la red se
ajusta a la deseada,
(xito = +1 o fracaso = -1), y en funcin de ello se ajustan los pesos
basndose en un mecanismo de probabilidades. Se podra decir que en
este tipo de aprendizaje la funcin del supervisor se asemeja ms a la
de un crtico (que opina sobre la respuesta de la red) que a la de un
maestro (que indica a la red la respuesta concreta que debe generar),
como ocurra en el caso de supervisin por correccin del error.
4.4.1.3 Aprendizaje estocstico.
Consiste bsicamente en realizar cambios aleatorios en los valores de
los pesos de las conexiones de la red y evaluar su efecto a partir del
objetivo deseado y de distribuciones de probabilidad.
En el aprendizaje estocstico se suele hacer una analoga en trminos
termodinmicos, asociando a la red neuronal con un slido fsico que
tiene cierto estado energtico. En el caso de la red, la energa de la
misma representara el grado de estabilidad de la red, de tal forma que
el estado de mnima energa correspondera a una situacin en la que
los pesos de las conexiones consiguen que su funcionamiento sea el que
ms se ajusta al objetivo deseado.
Segn lo anterior, el aprendizaje consistira en realizar un cambio
aleatorio de los valores de los pesos y determinar la energa de la red
(habitualmente la funcin energa es una funcin de Liapunov). Si la
energa es menor despus del cambio, es decir, si el comportamiento de
la red se acerca al deseado, se acepta el cambio; si, por el contrario, la
energa no es menor, se aceptara el cambio en funcin de una
determinada y preestablecida distribucin de probabilidades.
4.4.2 Aprendizaje no supervisado.
Las redes con aprendizaje no supervisado (tambin conocido como
autosupervisado) no requieren influencia externa para ajustar los pesos
de las conexiones entre sus neuronas. La red no recibe ninguna
informacin por parte del entorno que le indique si la salida generada en
respuesta a una determinada entrada es o no correcta. Estas redes
deben encontrar las caractersticas, regularidades, correlaciones o
categoras que se puedan establecer entre los datos que se presenten
en su entrada.
Existen varias posibilidades en cuanto a la interpretacin de la salida de
estas redes, que dependen de su estructura y del algoritmo de
103

Procesamiento Digital de Seales aplicado a Redes Neuronales

aprendizaje empleado. En algunos casos, la salida representa el grado


de familiaridad o similitud entre la informacin que se le est
presentando en la entrada y las informaciones que se le han mostrado
hasta entonces (en el pasado). En otro caso, podra realizar una
clusterizacin (clustering) o establecimiento de categoras, indicando la
red a la salida a qu categora pertenece la informacin presentada a la
entrada, siendo la propia red quien debe encontrar las categoras
apropiadas a partir de las correlaciones entre las informaciones
presentadas.

En cuanto a los algoritmos de aprendizaje no supervisado, en general se


suelen
considerar dos tipos, que dan lugar a los siguientes aprendizajes:
1) Aprendizaje hebbiano.
2) Aprendizaje competitivo y comparativo.
4.4.2.1 Aprendizaje hebbiano.
Esta regla de aprendizaje es la base de muchas otras, la cual pretende
medir la familiaridad o extraer caractersticas de los datos de entrada. El
fundamento es una suposicin bastante simple: si dos neuronas Ni y Nj
toman el mismo estado simultneamente (ambas activas o ambas
inactivas), el peso de la conexin entre ambas se incrementa.
Las entradas y salidas permitidas a la neurona son: {-1, 1} o {0, 1}
(neuronas binarias). Esto puede explicarse porque la regla de
aprendizaje de Hebb se origin a partir de la neurona biolgica clsica,
que solamente puede tener dos estados: activa o inactiva.
4.4.2.2 Aprendizaje competitivo y comparativo.
Se orienta a la clusterizacin o clasificacin de los datos de entrada.
Como caracterstica principal del aprendizaje competitivo se puede decir
que, si un patrn nuevo se determina que pertenece a una clase
reconocida previamente, entonces la inclusin de este nuevo patrn a
esta clase matizar la representacin de la misma. Si el patrn de
entrada se determin que no pertenece a ninguna de las clases
reconocidas anteriormente, entonces la estructura y los pesos de la red
neuronal sern ajustados para reconocer la nueva clase.
4.5 Eleccin del conjunto inicial de pesos.
104

Procesamiento Digital de Seales aplicado a Redes Neuronales

Antes de comenzar el proceso de entrenamiento se debe determinar un


estado inicial, lo que significa: escoger un conjunto inicial de pesos para
las diversas conexiones entre las neuronas de la red neuronal. Esto
puede realizarse por varios criterios; por ejemplo uno de ellos es otorgar
un peso aleatorio a cada conexin, encontrndose los mismos dentro de
un cierto intervalo. Generalmente un intervalo del tipo [-n, n], donde n
es un nmero natural positivo.
Cabe mencionar que durante el transcurso del entrenamiento los pesos
no se encuentran restringidos a dicho intervalo.
4.5.1 Detencin del proceso de aprendizaje.
Para determinar cundo se detendr el proceso de aprendizaje, es
necesario establecer una condicin de detencin. Normalmente el
entrenamiento se detiene cuando el clculo del error cuadrado sobre
todos los ejemplos de entrenamiento ha alcanzado un mnimo o cuando
para cada uno de los ejemplos dados, el error observado est por debajo
de un determinado umbral. Ya que para controlar este proceso, la mayor
parte de las herramientas de las redes neuronales muestran estos
errores utilizando grficos especiales; los cuales no son utilizados para el
aprendizaje, si no que solamente para dar un indicio del proceso en s
mismo.
Otra condicin de detencin del aprendizaje puede ser cuando un cierto
nmero
de ciclos y/o pasos de entrenamiento hayan sido completamente
corridos.
Luego de alcanzarse la condicin de detencin, los pesos no se volvern
a cambiar. Entonces podemos decir que la transformacin de los datos
de entrada a los de salida est resuelta. Esto se puede interpretar como
una funcin f oculta en el conjunto de la red neuronal. Esta funcin es
exactamente la instruccin de cmo la salida ser calculada a partir de
una constelacin (vector) de entrada.
El orden en que los ejemplos de entrenamiento se presentan a la red
neuronal es otro tema importante. En general se ha observado que en la
mayora de los casos es beneficioso
realizarlo en forma aleatoria.
4.5.2 Codificacin de los datos de entrada.
Si se observa nuevamente el ejemplo del problema: puntaje para un
crdito (apartado 5.4), se ve que no hay ningn valor numrico en la
base de datos. Por lo tanto la pregunta es cmo puede entonces una
105

Procesamiento Digital de Seales aplicado a Redes Neuronales

red neuronal calcular una salida? La respuesta es sencilla; los datos


tienen que ser codificados, o sea, deben hallarse valores apropiados
para representar las caractersticas simblicas (alto, bajo, adecuado,
etc.).

Se distinguen dos tipo de variables a ser codificadas:


1) Variables o atributos numricos (frecuentemente llamadas
continuas).
2) Variables o atributos simblicos (frecuentemente llamados
discretos).
Un atributo numrico es aquel que puede tomar cualquier valor dentro
de un cierto intervalo [a, b]; donde a puede ser -(menos infinito) y b,
(infinito). Por ejemplo el peso puede medirse en libras; entonces
cualquier valor entre [0, ) est permitido. Ahora si los pesos son dados
por un cierto nmero de trminos, semejantes a: alto o bajo; entonces el
atributo se denomina simblico. Por lo tanto, dividiendo el intervalo [a,
b] de una variable numrica dentro de subintervalos, podemos
confeccionar un atributo continuo pseudodiscreto.
A continuacin, en los apartados 5.7.1 y 5.7.2, sern descriptos en
detalle dos procesos de codificacin; asumiendo que todas las entradas
se transforman dentro del intervalo [0, 1] o {0, 1} (la extensin a [-1, 1]
o {-1, 1} es fcil).
4.5.2.1 Codificacin de los atributos numricos.
Los datos son codificados dentro de un intervalo, [0.0 + buffer de baja,
1.0 buffer de alta],
por medio de una funcin lineal. Los buffer (amortiguadores) son
necesarios, especialmente cuando se trabaja con series de tiempo,
porque a menudo puede observarse que una variable numrica cae por
debajo del valor mnimo presenciado hasta el momento, o por encima
del mximo. Por medio de esta manera de codificacin se conduce a un
conjunto de valores por encima de 0.0 y por debajo de 1.0, cuando se
utiliza un salto de 0.0 a 1.0

106

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 4.3: transformacin de la edad al intervalo [0.1, 0.9]

Por ejemplo, para la Figura 5.3, se debe encontrar la ecuacin que describa la
funcin de transformacin; a la cual llamaremos t y se escribe como sigue:
t: datos originales (x) datos codificados (xnuevos);

donde: a = pendiente y, b = ordenada al origen. De esta manera, para el ejemplo de la


Figura 5.3 se tiene que a

0.19 0.1
y b = 0.1 a * 19.
31 19

De forma genrica:

mn
4.5.2.2 Codificacin de los atributos simblicos.
Cada atributo simblico que se codifica, se adjunta a una neurona en la capa de
entrada. Si hay n valores simblicos, n neuronas sern necesarias, cada una de ellas con
un conjunto de entradas permitido: {0, 1} (o {-1, 1}). Por este motivo, se utilizan
neuronas binarias.
107

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 4.4: transformacin de la edad en tres atributos simblicos.

Observando la Figura 4.4; la edad slo puede tomar un valor en el ejemplo dado. En
consecuencia, si se tiene el valor de entrada viejo, solamente la neurona esttica para viejo
recibe una entrada de 1 (en el ejemplo: N1), mientras que todas las dems tendrn una
entrada igual a 0.
Por supuesto, tambin es posible codificar atributos simblicos utilizando slo
una neurona real (recordar que los valores permitidos para este tipo de neuronas estn
comprendidos en el rango [0, 1] o [1, 1]). Para el ejemplo de la edad, viejo puede
codificarse como 0.333, edad media como 0.666 y joven como 1; siendo el intervalo
permitido de [0, 1]. Tal procedimiento solamente tiene sentido si hay un orden en los
valores que las variables de entrada (o atributos) pueden tomar.
La mayor desventaja de una codificacin binaria es que puede conducir a una
gran capa de entrada.
4.5.2.3 Resumen de los procedimientos de codificacin

4.6 Validacin de la red neuronal.


Despus del proceso de entrenamiento los pesos de las conexiones en la
red neuronal quedan fijos. Como paso siguiente se debe comprobar si la
red neuronal puede resolver nuevos problemas, del tipo general, para
los que ha sido entrenada. Por lo tanto, con el propsito de validar la red
neuronal se requiere de otro conjunto de datos, denominado conjunto de
validacin o testeo. Cada ejemplo del conjunto de evaluacin contiene
108

Procesamiento Digital de Seales aplicado a Redes Neuronales

los valores de las variables de entrada, con su correspondiente solucin


tomada; pero ahora esta solucin no se le es otorgada a la red neuronal.
Luego se compara la solucin calculada para cada ejemplo de validacin
con la solucin conocida. El nuevo ejemplo utilizado para la validacin se
identifica como Eu y su correspondiente salida correcta como Au (u indica
incgnita, en ingls). Ahora el problema es que hay que decidir cuando
la salida de la red neuronal ha de considerarse como correcta.

4.7 Cuestiones a resolver al trabajar con una red neuronal.


Muchos problemas aparecen cuando se trabaja con redes neuronales.
Primeramente se debe analizar el dominio del problema y decidir a que
clase pertenece. Luego debe decidirse si una red neuronal es adecuada
para resolver dicho problema. Esto es lo que se llama: etapa preliminar.
Concluida esta etapa, las siguientes preguntas han de responderse: aOrigen de los datos.

_ Qu datos son de importancia para la situacin del problema


definido?
_ Qu variables son relevantes?
_ De dnde pueden obtenerse los datos?
b- Preparacin y codificacin de los datos.
_ Cmo preparar y codificar los datos?
c- Topologa de la red (dependiendo parcialmente del tem b-).
_ Qu tipo de red debe escogerse?
_ Cuntas capas ocultas y con cuntas neuronas son necesarias?
_ Cuntas neuronas en la capa de salida (segn la codificacin
escogida)?
_ Qu tipos de neuronas deben escogerse?
_ Qu regla de aprendizaje escoger?
d- Decisiones concernientes al proceso de aprendizaje.
_ Cuntos ciclos de aprendizaje?
_ Qu inicializacin para los pesos?

4.8 Principales Topologas.


109

Procesamiento Digital de Seales aplicado a Redes Neuronales

4.8.1 Topologa de las redes neuronales.


La topologa o arquitectura de una red neuronal consiste en la
organizacin y disposicin de las neuronas en la misma, formando capas
o agrupaciones de neuronas ms o menos alejadas de la entrada y
salida de dicha red. En este sentido, los parmetros fundamentales de la
red son: el nmero de capas, el nmero de neuronas por capa, el grado
de conectividad y el tipo de conexiones entre neuronas.
4.8.2 Redes monocapa.
En las redes monocapa, se establecen conexiones entre las neuronas
que pertenecen a la nica capa que constituye la red. Las redes
monocapas se utilizan generalmente en tareas relacionadas con lo que
se conoce como autoasociacin (regenerar informacin de entrada que
se presenta a la red de forma incompleta o distorsionada).

4.8.3 Redes multicapa.


Las redes multicapas son aquellas que disponen de un conjunto de
neuronas agrupadas en varios (2, 3, etc.) niveles o capas. En estos
casos, una forma para distinguir la capa a la que pertenece una
neurona, consistira en fijarse en el origen de las seales que recibe a la
entrada y el destino de la seal de salida. Normalmente, todas las
neuronas de una capa reciben seales de entrada desde otra capa
anterior (la cual est ms cerca a la entrada de la red), y envan seales
de salida a una capa posterior (que est ms cerca a la salida de la red).
A estas conexiones se las denomina
conexiones hacia adelante o feedforward. Sin embargo, en un gran
nmero de estas redes tambin existe la posibilidad de conectar la
salida de las neuronas de capas posteriores a la entrada de capas
anteriores; a estas conexiones se las denomina conexiones hacia atrs o
feedback.
Estas dos posibilidades permiten distinguir entre dos tipos de redes con
mltiples capas: las redes con conexiones hacia adelante o redes
feedforward, y las redes que disponen de conexiones tanto hacia
adelante como hacia atrs o redes feedforward/feedback.
4.8.4 Conexin entre neuronas.

110

Procesamiento Digital de Seales aplicado a Redes Neuronales

La conectividad entre los nodos de una red neuronal est relacionada


con la forma en que las salidas de las neuronas estn canalizadas para
convertirse en entradas de otras neuronas. La seal de salida de un
nodo puede ser una entrada de otro elemento de proceso, o incluso ser
una entrada de s mismo (conexin autorrecurrente). Cuando ninguna
salida de las neuronas es entrada de neuronas del mismo nivel o de
niveles precedentes, la red se describe como de conexin hacia delante
(ver Figura 4.1). Cuando las salidas pueden ser conectadas como
entradas de neuronas de niveles previos o del mismo nivel, incluyndose
ellas mismas, la red es de conexin hacia atrs. Las redes de
propagacin hacia atrs que tienen lazos cerrados son llamadas:
sistemas recurrentes.
4.9 Redes de propagacin hacia atrs (backpropagation).
El nombre de backpropagation resulta de la forma en que el error es
propagado hacia atrs a travs de la red neuronal, en otras palabras el
error se propaga hacia atrs desde la capa de salida. Esto permite que
los pesos sobre las conexiones de las neuronas ubicadas en las capas
ocultas cambien durante el entrenamiento.
El cambio de los pesos en las conexiones de las neuronas adems de
influir sobre la entrada global, influye en la activacin y por consiguiente
en la salida de una neurona. Por lo tanto, es de gran utilidad considerar
las variaciones de la funcin activacin al modificarse el alor de los
pesos. Esto se llama sensibilidad de la funcin activacin, de acuerdo al
ambio en los pesos.

4.9.1 Ejemplo.
Una temperatura de 20C provoca que el tiempo de operacin de una
mquina sea de 90 segundos y un incremento de dicha temperatura
hasta los 30C causa un tiempo de operacin de 100 segundos. Cmo
influy el incremento de la temperatura en el tiempo de trabajo de la
mquina? Por supuesto, hizo ms lenta la operacin. Pero, por cunto?

111

Procesamiento Digital de Seales aplicado a Redes Neuronales

tiempo de trabajo conforme a los cambios suscitados en la temperatura. En


consecuencia, para nuestro ejemplo tenemos que:

Esto significa que se produce un incremento de tiempo de


aproximadamente 1 segundo, cuando la temperatura se eleva 1C.
Ahora si se supone que en lugar del tiempo se tiene la activacin de una
neurona y en lugar de la temperatura, la entrada global. Dado que la
mayora de las funciones de activacin son no lineales (por ejemplo la
funcin sigmoidea o la tangente hiperblica), se tiene que calcular la
derivada de la funcin con respecto al peso; por consiguiente, la entrada
global cambia. Esta derivada se utiliza para cambiar los pesos durante el
proceso de aprendizaje.
Para cada una de las neuronas en la capa de salida, la desviacin
objetivo (la cual es: la salida objetivo menos la salida real) es
multiplicada por la derivada de la funcin activacin. Utilizando la
derivada se logra una sintonizacin fina de los pesos cuando la salida
real esta cerca de la salida deseada. Al mirar la Figura 6.1, la misma
muestra una constelacin donde la salida real para una neurona es 0.95
y la deseada es de 1.0.

Figura 6.1: desviacin a la salida objetivo.

Dado que la derivada de la funcin activacin es relativamente baja en


esta regin (cuando la funcin activacin est prxima a 1), el producto
derivada por desviacin objetivo, igual al error, no se torna muy
grande. Esto es lo que se llama sintona fina de los pesos. De esta
manera, la diferencia en el cmputo del error para las neuronas de
salida al utilizar el algoritmo de backpropagation, en lugar de las reglas
simples de aprendizaje del Perceptron, es justamente el factor derivada
de la funcin activacin.
4.9.2Estructura de la Red Hopfield.
112

Procesamiento Digital de Seales aplicado a Redes Neuronales

La Red Hopfield es recurrente y completamente interconectada.


Funciona como una memoria asociativa no lineal, que puede almacenar
internamente patrones presentados de forma incompleta o con ruido. De
esta forma puede ser usada como una herramienta de optimizacin;
tambin se han utilizado en aplicaciones de segmentacin y
restauracin de imgenes y optimizacin combinatoria.
La Red Hopfield consta de un nmero de neuronas simtrica e
ntegramente conectadas, como ya se mencion anteriormente. Esto
significa que si existe una conexin desde la neurona Ni a la neurona Nj,
tambin existe la conexin desde Nj a Ni; ambas exhibendo el mismo
peso (wij = wji). Vale aclarar que la conexin de una neurona on s
misma no est permitida.
El conjunto permitido de valores de entrada y salida es {0, 1} (o
en alguna oportunidad {-1, 1}); o sea, es un conjunto binario. De esta
manera todas las neuronas en una Red Hopfield son binarias, tomando
solamente uno de los dos estados posibles:
activo (1) o inactivo (-1 o 0).
Las Redes Hopfield se emplean para reconocer patrones. Despus
que el aprendizaje haya llegado a su fin, la red neuronal debe ser capaz
de dar una salida correcta para cada patrn de entrada dado, aun
cuando este sea ruidoso.
La clave del aprendizaje Hopfield es que si un patrn que tiene que
ser aprendido se conoce, los pesos sobre cada conexin de la red
neuronal pueden ser calculados. En esta circunstancia, solamente el
estado de las neuronas cambia durante el proceso de aprendizaje. Este
clculo garantiza que cada patrn aprendido corresponda a un mnimo
de la funcin energa.
Es importante entender que para este tipo de redes la definicin de
aprendizaje es diferente al dado anteriormente, donde aprendizaje
significaba simplemente la adaptacin de los pesos. En una Red Hopfield
los pesos se pueden calcular y se mantienen fijos durante el aprendizaje
de los patrones. Solamente cambia el estado de las neuronas. Para
calcular el peso de una conexin cualquiera, wij (y por simetra para la
conexin wji), en una Red Hopfield se utiliza la siguiente ecuacin:

113

Procesamiento Digital de Seales aplicado a Redes Neuronales

siendo Q el nmero de patrones y eqi la entrada a la neurona Ni.


Generalmente es aconsejable trabajar con esta ecuacin cuando los
patrones que se han de aprender no son muy semejantes unos a otros,
y si el nmero de ceros y unos son similares para todos los patrones.
Con respecto al nmero de ceros y unos, el umbral de cada neurona
puede utilizarse para regular esto, distinguindose as dos casos
posibles:
a- Si hay ms 0s que 1s el umbral tiene que disminuirse, porque que
las neuronas tienen una probabilidad ms alta para hacerse
inactivas que para hacerse activas. b- Si hay mas 1s que 0s el
umbral tiene que incrementarse, porque las neuronas tienen una
probabilidad ms alta para hacerse activas que para hacerse
inactivas.
4.9.3 Simulated Annealing aplicada a una Red Hopfield.
En muchos problemas, la tarea no es justamente encontrar cualquier
mnimo local, sino la de encontrar el ptimo global. Lo que significa que
para una entrada determinada se debe encontrar una salida que resulte
en un mnimo de la funcin energa. Utilizando una Red Hopfield, se
encuentra que un mnimo yace cerca del vector de entrada dado,
porque la energa decrece paso a paso. El cual puede ser un mnimo
local. En una Red Hopfield todos los mnimos locales son un estado
estable.
Un problema similar se origina en termodinmica durante el proceso de
cristalizacin. Durante un enfriamiento lento, el cristal crece con una
estructura casi perfecta, ya que cada tomo tiene bastante tiempo para
saltar a otra posicin dentro de la cuadrcula, de tal forma que la energa
total del cristal decrezca. Para realizar dicho salto se necesita energa, es
decir, que si el cristal tiene la energa suficiente (si su temperatura es
aun bastante alta), todos los tomos disponen de una chance para
cambiar su posicin. Pero para permitir que esto ocurra la energa de un
tomo tiene que incrementarse por un corto tiempo, de lo contrario el
tomo descansara en su vieja posicin.
Tener una chance se puede interpretar como hay una probabilidad.
Esta probabilidad depende de la activacin que un tomo muestra a una
determinada temperatura y tiempo del sistema.
Utilizando esta tcnica donde el cristal comienza a una temperatura
elevada y que luego decrece paso a paso, se les da a los tomos una
posibilidad de cambiar sus
estados independientemente de la
activacin, por medio de un incremento en la energa de los mismos de
114

Procesamiento Digital de Seales aplicado a Redes Neuronales

un paso a otro. Cuando la temperatura se reduce, la cuadrcula vibra


menos, y el sistema (la cuadrcula) alcanza un estado estable;
hacindose gradualmente ms dificultoso para un tomo encontrar la
energa para saltar a otra posicin.
Esta es la idea de Simulated Annealing, que luego se aplica a la Red
Hopfield cuando se intenta encontrar un ptimo global.

A grandes rasgos se describe que una Simulated Annealing trabaja de esta


manera:
a- Escoger cualquier neurona.
b- Calcular d = gini - i.

d- Generar un nmero aleatorio r, con 1 r 0


e- Si (Pi r)
el conjunto outi a 1
de otra manera
el conjunto outi a 0
f - Disminuye T. Volver al paso a-.
El algoritmo se detiene cuando se alcanza algn criterio de detencin;
por ejemplo si la emperatura llega a su lmite inferior o si el nmero de
ciclos alcanza su lmite superior. La premisa fundamental de este
mtodo es que el problema de optimizacin puede formularse como una
funcin energtica. Por lo tanto hallar el ptimo global implica encontrar
el mnimo de dicha funcin energtica. La misma tiene un aspecto
genrico de esta forma:

Se han logrado exitosas aplicaciones de Simulated Annealing,


principalmente concernientes a los problemas de optimizacin
115

Procesamiento Digital de Seales aplicado a Redes Neuronales

combinatoria, semejantes al problema del viajante. El cual no puede


resolverse fcilmente por mtodos estadsticos o analticos. Por ejemplo,
imagine que un viajante tiene que visitar 19 ciudades. Qu ruta
suministra el camino ms corto entre todas las ciudades, o sea, en qu
orden debern visitarse todas las ciudades?
Por ltimo una diferenciacin muy importante es que en una Simulated
Annealing la energa puede disminuir en un paso y crecer en el otro,
pero en una Red Hopfield la energa solamente puede disminuir paso a
paso.
4.9.4 Asociaciones entre la informacin de entrada y salida.
Ya se sabe que las redes neuronales son sistemas que almacenan cierta
informacin aprendida. Esta informacin se registra de forma distribuida
en los pesos asociados a las conexiones entre neuronas. Por tanto,
puede imaginarse una red como cierto tipo de memoria que almacena
datos de forma estable, datos que se grabarn en dicha memoria como
consecuencia del aprendizaje de la red y que podrn ser ledos a la
salida como respuesta a cierta informacin de entrada, comportndose
entonces la red como lo que habitualmente se conoce por memoria
asociativa: cuando se aplica un estmulo (dato de entrada) la red
responde con una salida asociada a dicha informacin de entrada.
Existen dos formas primarias de realizar esta asociacin entre
entradas/salidas que se corresponden con la naturaleza de la
informacin almacenada en la red. Una primera sera la denominada
heteroasociacin, que se refiere al caso en el que la red aprende parejas
de datos [(A1,B1), (A2, B2),... (AN,BN)], de tal forma que cuando se
presente cierta informacin de entrada Ai, deber responder generando
la correspondiente salida asociada Bi. La segunda se conoce como
autoasociacin, donde la red aprende ciertas informaciones A1, A2, ...,
AN; de tal forma que cuando se le presenta una informacin de entrada
realizar una autocorrelacin, respondiendo con uno de los datos
almacenados, el ms parecido al de entrada.
Estos dos mecanismos de asociacin dan lugar a dos tipos de redes
neuronales: las redes heteroasociativas y las autoasociativas. Una red
heteroasociativa podra considerarse como aquella que computa cierta
funcin, que en la mayora de los casos no podra expresarse
analticamente, entre un conjunto de entradas y un conjunto de salidas,
correspondiendo a cada posible entrada una determinada salida. Por
otra parte, una red autoasociativa es una red cuya principal misin es
reconstruir una determinada informacin de entrada que se presente
incompleta o distorsionada (le asocia el dato almacenado ms parecido).
En realidad estos dos tipos de modelos de redes no son diferentes en
principio, porque una red heteroasiciativa puede siempre ser reducida a
116

Procesamiento Digital de Seales aplicado a Redes Neuronales

una asociativa mediante la concatenacin de una informacin de


entrada y su salida (respuesta) asociada, para obtener la informacin de
entrada de la red autoasociativa equivalente. Tambin puede
conseguirse que una red autoasociativa se comporte como
heteroasociativa, simplemente presentando, como entrada parcial de la
autoasociativa, la informacin de entrada para la heteroasociativa y
haciendo que la red complete la informacin para producir lo que sera la
salida de la red heteroasociativa equivalente.
4.9.4.1 Redes heteroasociativas.
Las redes heteroasociativas, al asociar informaciones de entrada con
diferentes informaciones de salida, precisan al menos de dos capas, una
para captar y retener la informacin de entrada y otra para mantener la
salida con la informacin asociada. Si esto no fuese as, se perdera la
informacin inicial al obtenerse el dato asociado {3}, lo cual no debe
ocurrir, ya que en el proceso de obtencin de la salida se puede
necesitar acceder varias veces a esta informacin que, por tanto, deber
permanecer en la capa de entrada. En cuanto a su conectividad, pueden
ser del tipo con conexin hacia adelante (o feedforward) o con conexin
hacia atrs (feddforward/feedback), o bien con conexiones laterales.
4.9.4.2 Redes autoasociativas.
Una red autoasociativa asocia una informacin de entrada con el
ejemplar ms parecido de los almacenados conocidos por la red. Estos
tipos de redes pueden implementarse con una sola capa de neuronas.
Esta capa comenzar reteniendo la informacin inicial a la entrada, y
terminar representando la informacin autoasociada. Si se quiere
mantener la informacin de entrada y salida, se deberan aadir capas
adicionales, sin embargo, la funcionalidad de la red puede conseguirse
en una sola capa.

En cuanto a su conectividad, existen de conexiones laterales y, en algunos casos,


conexiones auto-recurrentes.

Con lo anterior concluimos lo que son los procesos y las principales topologas de las redes
neuronales as como la conectividad de cada uno de los elementos de que componen las
redes neuronales.
A continuacin en el siguiente captulo se darn a conocer las aplicaciones y funciones
primordiales de las redes neuronales as como la optimizacin y planificacin de procesos.
117

Procesamiento Digital de Seales aplicado a Redes Neuronales

118

Procesamiento Digital de Seales aplicado a Redes Neuronales

CAPITULO V
APLICACIONES

5. Aplicaciones.
Las redes neuronales pueden utilizarse en un gran nmero y
variedad de aplicaciones, tanto comerciales como militares.
Se pueden desarrollar redes neuronales en un periodo de tiempo
razonable, con la capacidad de realizar tareas concretas mejor que otras
tecnologas. Cuando se implementan mediante hardware (redes
neuronales en chips VLSI), presentan una alta tolerancia a fallos del
sistema y proporcionan un alto grado de paralelismo en el
procesamiento de datos. Esto posibilita la insercin de redes neuronales
de bajo costo en sistemas existentes y recientemente desarrollados.
5.1 Aplicaciones de las redes neuronales.
119

Procesamiento Digital de Seales aplicado a Redes Neuronales

Hay muchos tipos diferentes de redes neuronales; cada uno de los


cuales tiene una aplicacin particular ms apropiada.

Algunas aplicaciones comerciales son:


Biologa:
- Aprender ms acerca del cerebro y otros sistemas.
- Obtencin de modelos de la retina.
Empresa:
- Evaluacin de probabilidad de formaciones geolgicas y
petrolferas.
- Identificacin de candidatos para posiciones especficas.
- Explotacin de bases de datos.
- Optimizacin de plazas y horarios en lneas de vuelo.
- Optimizacin
del
flujo
del
trnsito
controlando
convenientemente la
- temporizacin de los semforos.
- Reconocimiento de caracteres escritos.
- Modelado de sistemas para automatizacin y control.
Medio ambiente:
- Analizar tendencias y patrones.
- Previsin del tiempo.
Finanzas:
- Previsin de la evolucin de los precios.
- Valoracin del riesgo de los crditos.
- Identificacin de falsificaciones.
- Interpretacin de firmas

Manufacturacin:
-

Robots automatizados y sistemas de control (visin artificial


y sensores
de presin, temperatura, gas, etc.).
Control de produccin en lneas de procesos.
Inspeccin de la calidad.

Medicina:
-

Analizadores del habla para ayudar en la audicin de sordos


profundos.
Diagnstico y tratamiento a partir de sntomas y/o de datos
analticos
120

Procesamiento Digital de Seales aplicado a Redes Neuronales

(electrocardiograma, encefalogramas, anlisis sanguneo,


etc.).
Monitorizacin en cirugas.
Prediccin de reacciones adversas en los medicamentos.
Entendimiento de la causa de los ataques cardacos.

Militares:
-

Clasificacin de las seales de radar.


Creacin de armas inteligentes.
Optimizacin del uso de recursos escasos.
Reconocimiento y seguimiento en el tiro al blanco.

La mayora de estas aplicaciones consisten en realizar un


reconocimiento de patrones, como ser: buscar un patrn en una serie de
ejemplos, clasificar patrones, completar una seal a partir de valores
parciales o reconstruir el patrn correcto partiendo de uno distorsionado.
Sin embargo, est creciendo el uso de redes neuronales en distintos
tipos de sistemas de control.
Desde el punto de vista de los casos de aplicacin, la ventaja de las
redes neuronales reside en el procesado paralelo, adaptativo y no lineal.
El dominio de aplicacin de las redes neuronales tambin se lo puede
clasificar de la siguiente forma: asociacin y clasificacin, regeneracin
de patrones, regresin y generalizacin, y optimizacin.
5.1.1 Asociacin y clasificacin.
En esta aplicacin, los patrones de entrada estticos o seales
temporales deben ser clasificadas o reconocidas. Idealmente, un
clasificador debera ser entrenado para que cuando se le presente una
versin distorsionada ligeramente del patrn, pueda ser reconocida
correctamente sin problemas. De la misma forma, la red debera
presentar cierta inmunidad contra el ruido, esto es, debera ser capaz de
recuperar una seal "limpia" de ambientes o canales ruidosos. Esto es
fundamental en las
aplicaciones
hologrficas, asociativas
o
regenerativas.

Asociacin: de especial inters son las dos clases de asociacin:

121

Procesamiento Digital de Seales aplicado a Redes Neuronales

autoasociacin y heteroasociacin. Como ya se mencion en el apartado


6.8, el problema de la autoasociacin es recuperar un patrn
enteramente, dada una informacin parcial del patrn deseado. La
heteroasociacin es recuperar un conjunto de patrones B, dado un
patrn de ese conjunto. Los pesos en las redes asociativas son a menudo
predeterminados basados en la regla de Hebb. Normalmente, la
autocorrelacin del conjunto de patrones almacenado determina los
pesos en las redes autoasociativas. Por otro lado, la correlacin cruzada
de muchas parejas de patrones se usa para eterminar los pesos de la
red de heteroasociacin.
_ Clasificacin no Supervisada: para esta aplicacin, los pesos
sinpticos de la
red son entrenados por la regla de aprendizaje no supervisado, esto es,
la red adapta los
pesos y verifica el resultado basndose nicamente en los patrones de
entrada.

_ Clasificacin Supervisada: esta clasificacin adopta algunas


formas del criterio de
interpolacin o aproximacin. En muchas aplicaciones de clasificacin,
por ejemplo, reconocimiento de voz, los datos de entrenamiento
consisten de pares de patrones de entrada y salida. En este caso, es
conveniente adoptar las redes Supervisadas, como las bien conocidas y
estudiadas redes de retropropagacin. Este tipo de redes son apropiadas
para las aplicaciones que tienen una gran cantidad de clases con lmites
de separacin complejos.

5.1.2 Regeneracin de patrones.


En muchos problemas de clasificacin, una cuestin a solucionar es la
recuperacin de informacin, esto es, recuperar el patrn original dada
solamente una informacin parcial. Hay dos clases de problemas:
temporales y estticos. El uso apropiado de la informacin contextual es
la llave para tener xito en el reconocimiento.
5.1.3 Regeneracin y generalizacin.
El objetivo de la generalizacin es dar una respuesta correcta a la salida
para un estmulo de entrada que no ha sido entrenado con anterioridad.
El sistema debe inducir la caracterstica saliente del estmulo a la
entrada y detectar la regularidad. Tal habilidad para el descubrimiento
de esa regularidad es crtica en muchas aplicaciones. Esto hace que el
sistema funcione eficazmente en todo el espacio, incluso cuando ha sido
entrenado por un conjunto limitado de ejemplos.
122

Procesamiento Digital de Seales aplicado a Redes Neuronales

5.1.4 Optimizacin.
Las Redes Neuronales son herramientas interesantes para la
optimizacin de aplicaciones, que normalmente implican la bsqueda
del mnimo absoluto de una funcin de energa. Para algunas
aplicaciones, la funcin de energa es fcilmente deducible; pero en
otras, sin embargo, se obtiene de ciertos criterios de coste y limitaciones
especiales.
5.2 Casos concretos de aplicacin.
A continuacin se detallan los siguientes casos concretos de aplicacin
de redes
neuronales:
_ Planificacin del staff de empleados.
_ Planificacin de la demanda de materiales.
_ Puntuacin para la solicitud de un crdito.

5.2.1 Planificacin del staff (cuerpo) de empleados.


Hoy ms que nunca, las empresas estn sujetas a la presin de los
elevados costos. Esto puede verse en diferentes sectores corporativos,
tales como la planificacin del staff de empleados. Desde el punto de
vista de las empresas, un empleado que falla al ejecutar la mayor parte
de las tareas asignadas, evidencia una baja productividad. Por el otro
lado, esta situacin es frustrante para el empleado. Ambos efectos
causan costos, los cuales podran evitarse realizando antes una prueba
de aptitud. Estos problemas no solamente son originados por los
empleados nuevos, sino tambin por aquellos que son reubicados dentro
de la misma empresa.
En este proyecto de investigacin se examin hasta donde la prediccin
de aptitudes puede llevarse a cabo por una red neuronal, cuya topologa
suministre una tarea satisfactoria y as lograr una prediccin ms
exitosa.
Base de datos y codificacin:
La base de datos inicial contena informacin resultante de una
investigacin que realizaron por medio de un cuestionario. Las
respuestas obtenidas a travs del mismo las utilizaron para acumular
informacin acerca de las cualidades especficas y habilidades tcnicas
de cada individuo del personal indagado. Para cada pregunta, les fue
123

Procesamiento Digital de Seales aplicado a Redes Neuronales

posible categorizar la respuesta en un intervalo que va de 1 a 5;


constituyendo as la entrada que presentaron a la red neuronal. Al
entrevistado, posteriormente, lo examinaron en el orden de obtener una
cifra representativa de sus aptitudes.
De esta manera el conjunto de datos de entrenamiento qued formado
de la siguiente forma:
-

Respuesta obtenidas a travs del cuestionario = datos de


entrada.
Cifra representativa de la aptitud de la persona encuestada
= salida deseada.
El primer problema que se les present fue cmo codificar
los datos obtenidos, decidiendo transformarlos dentro del
intervalo [0.1, 1.0].

Cmo codificar la salida objetivo fue la prxima pregunta que


consideraron. Normalmente la compaa slo quiere conocer si una
persona ejecutar bien o mal la tarea determinada, o si su desempeo
ser
muy
bueno,
bueno,
promedio,
malo
o
muy
malo.
Consecuentemente, (a) asignaron la salida dada dentro de varias clases
y (b) transformaron las cifras representativas dentro del intervalo [0, 1],
utilizando en parte una funcin lineal.
Algoritmo de aprendizaje:
Ensayaron diferentes algoritmos de aprendizaje, de los cuales dos fueron
escogidos
como
los
ms
apropiados:
Propagacin
Rpida
(Quickpropagation) y Propagacin Elstica (Resilient Propagation). _
Quickpropagation: es una modificacin del algoritmo estndar de
backpropagation. A diferencia de este, la adaptacin de los pesos no es
solamente influenciada por la sensibilidad actual, sino tambin por la
inclusin del error previo calculado.
_ Resilient Propagation: es otra modificacin del algoritmo
estndar de backpropagation. En oposicin a este, la adaptacin de los
pesos es influenciada por el signo de la sensibilidad actual y antecesora,
y no por su cantidad.
Topologa de la red:
Evaluaron diferentes topologas de redes, las cuales no sern detalladas.
La pregunta fue: (a) cuntas capas ocultas son necesarias?, (b)
cuntas neuronas en cada una de ellas? La primera prueba que hicieron
mostr que para este propsito la red deba contener 2 capas ocultas,
con la primera formada por tantas neuronas como la capa de entrada y
124

Procesamiento Digital de Seales aplicado a Redes Neuronales

la segunda por un nmero menor que la primera (exactamente la mitad


como mucho).
Resultados obtenidos a partir de los ensayos:
El primer resultado que consiguieron al intentar predecir la cifra
representativa correcta fue relativamente mala. Asumieron que esto fue
causado por el hecho de que el nmero de neuronas de entrada en
proporcin al nmero de ejemplos dados en el conjunto de datos de
entrenamiento fue elevado. La pequea base de datos, conforme con la
gran capa de entrada, fue suficiente para realizar una tosca prediccin,
pero no para dar la correcta cifra representativa.
Lo mencionado en el prrafo anterior hizo que enfocaran toda la
atencin en reducir el nmero de neuronas de entradas en forma
apropiada. Tambin examinaron la red con la cual se logr el mejor
resultado, en funcin de conseguir indicadores de las entradas que
demostraran ser importantes y cales no. Entonces, reduciendo el
nmero de neuronas de entrada y formando nuevas redes, consiguieron
un resultado bastante bueno para la prediccin de las clases y an para
la prediccin de la cifra representativa correcta. En otra serie de test,
examinaron los resultados que podran favorecer a un mejoramiento por
agrupacin de las neuronas de entrada para las preguntas
interdependientes. Cada grupo, que representaba una habilidad
especial, fue conectado exactamente a una neurona en la primer capa
oculta. La razn para esto fue que haciendo ciertas conexiones se
reduce beneficiosamente el espacio de bsqueda, si y solo si, las
conexiones representan la estructura correcta, pero puede reducir el
espacio de bsqueda inapropiadamente por prohibicin de otras
conexiones.
5.2.2 Planificacin de la demanda de materiales.
La tarea de planificar la demanda de materiales es justamente predecir
en forma segura la necesidad de los mismos, o ms exactamente, de los
factores de consumo. Esto involucra tener una correcta informacin de
los volmenes aproximados de produccin, as como de los factores de
tiempo.
Principalmente para resolver esta tarea pueden distinguirse los
siguientes
procedimientos:
o Programacin orientada (program-oriented).
o Consumo orientado (consumption-oriented).
En el mtodo de programacin orientada la prediccin de la cantidad
demandada se basa sobre los resultados del planeamiento de
125

Procesamiento Digital de Seales aplicado a Redes Neuronales

produccin. Mientras que el mtodo de consumo orientado toma en


cuenta el consumo observado en perodos anteriores y sobre la base de
dicha informacin intenta predecir las futuras demandas. Como primera
aproximacin utilizaron una red neuronal por prediccin del consumo
orientado; centralizando la investigacin en la determinacin de las
habilidades de las redes para producir salidas correctas cuando analizan
un dato real. El proyecto lo realizaron conjuntamente con la compaa
que lo solicit, la cual se dedica a la fabricacin de bicicletas y por ende,
necesita de tubos para la construccin de las mismas; cuyo consumo
deban predecir.
Base de datos y codificacin:
En la Figura 7.1 se muestran las series de tiempo que utilizaron para la
planificacin de la demanda de materiales.

Figura 5.1: series de tiempo empleadas en la


planificacin de la demanda de materiales.

Cada serie de tiempo incluye datos desde 1992 a 1994 (semanalmente).


Las series, pedido y stock, fueron codificados dentro del intervalo [0.0,
0.9], para lo cual utilizaron una funcin de transformacin lineal.
Mientras que al consumo lo codificaron en dos pasos, porque esta serie
de tiempo vara, en partes, de manera muy brusca. Para el primer paso
emplearon la frmula:

siendo mx el promedio de las series de tiempo y std(x) la desviacin


estndar de las series de tiempo. Y para el segundo aplicaron una
transformacin lineal a la nueva serie de tiempos z.
126

Procesamiento Digital de Seales aplicado a Redes Neuronales

Topologa de la red:
Sobre el ensayo de diferentes redes neuronales observaron que, sin
importar la prediccin que se haga (mensualmente, semanalmente),
ms de dos capas ocultas desfavoreca el resultado obtenido.
Primero experimentaron solamente con la serie de tiempo del consumo,
y con una red neuronal constituida por nueve neuronas de entrada y una
neurona ms para la estacin; empleando 80 patrones para el
entrenamientos y 53 para la validacin. La exactitud que lograron luego
de varias corridas de la red neuronal, empleando diferentes topologas,
se muestran en la Tabla 7.1 (error permitido: 20%, ciclos de aprendizaje:
10000, algoritmos de aprendizaje: Quickpropagation o Resilient
Propagation).

Tabla 5.1

Como se puede observar, dando solo el consumo como una entrada no


es suficiente para predecir la demanda. Luego, utilizaron todas las series
de tiempo descriptas en la Figura 7.1 como entradas a la red neuronal y
adems, asignaron tres neuronas de entrada para cada serie de tiempo,
lo que result en una capa de entrada de nueve neuronas; logrando para
las
diferentes topologas una exactitud como la que exhibe en la Tabla 5.1:

Tabla 5.2

Los resultados citados no parecen ser suficientemente buenos para la


aplicacin de una red neuronal real en el campo del planeamiento de la
demanda de materiales; no obstante, est claro que las tcnicas de las
redes neuronales son prometedoras para la tarea. Actualmente se estn
ensayando otros escenarios diferentes para mejorar las predicciones as
obtenidas.
5.2.3 Puntuacin para la solicitud de un crdito.
127

Procesamiento Digital de Seales aplicado a Redes Neuronales

La puntuacin para un crdito representa una tarea de gran riesgo para


las instituciones crediticias. Estas instituciones tienen un fuerte inters
en evitar tales situaciones, rechazando los candidatos que parecen ser
un riesgo malo. Ya que un candidato rechazado, que de hecho era un
buen riesgo crediticio, no impone costos reales; mientras que, un
candidato que es incapaz de restituir el pago del crdito extendido
puede causar prdidas sustanciales (recordar el caso Schneider en
Alemania).
---Diferentes mtodos son aplicados en este campo. Muy a menudo la
decisin tomada, aprobacin o rechazo, se basa sobre los siguientes
factores: carcter, capacidad y capital (crditos triple C); siendo esta
solamente humana y naturalmente subjetiva. Otro mtodo es la
utilizacin de un sistema de puntuacin numrico.
El mismo utiliza rasgos comunes que resultan ser importantes para la
evaluacin de los candidatos para un crdito. La importancia especfica
de cada simple caracterstica est expresada por pesos. Cada candidato
al crdito se pondera con una cierta cifra indicativa (suma integral de los
rasgos) y si se sita por encima de un umbral determinado se considera
como una persona digna de crdito.
Debido
a
que
ambos
mtodos
tienen
aspectos
negativos
-subjetivamente por un lado y una simple dependencia lineal entre
caracterstica por el otro-, los esfuerzos apuntan a la aplicacin de
tcnicas de inteligencia artificial, tales como Sistemas Expertos (XPS) y
Redes Neuronales, en el campo de la puntuacin para la solicitud de un
crdito. Por lo tanto la tarea a ser consumada por medio de una red
neuronal es tratar de predecir una correcta clasificacin de los clientes.
Escenario de los datos:
Para recaudar informacin acerca de los candidatos aprobados y
desaprobados recurrieron a diferentes instituciones crediticias, pero
solamente unas pocas de ellas cooperaron; ya que la mayora alegaba
que los datos sobre los aspirantes a los crditos era un asunto interno y
por consiguiente, reciben un trato confidencial. Puesto que la
informacin de la que disponan era insuficiente, utilizaron un conjunto
de datos pblicos; el notorio conjunto de datos australiano (J. R.
Quinlan), caracterizado como sigue en la Tabla 7.3:

128

Procesamiento Digital de Seales aplicado a Redes Neuronales

Tabla 5.3

Codificacin:
Codificaron los atributos continuos simplemente por una transformacin
lineal dentro del intervalo [0.1, 0.9], utilizando para esto solamente una
neurona (real). Los atributos binarios tambin fueron codificados por
medio de una neurona (binaria). Pensaron en la utilizacin de dos
neuronas binarias, pero los ensayos no mostraron ninguna diferencia
entre ambos tipos de codificacin. En consecuencia utilizaron solamente
una neurona para los atributos binarios.
A los atributos ordenados los trataron como sigue; ya que dependiendo
de los diferentes valores que los mismos podan tomar, el nmero de
neuronas utilizadas en la capa de entrada variaba. Codificaron cada
posible valor en una neurona; por ejemplo si haba tres valores posibles,
se necesitaba de tres neuronas. El procedimiento de codificacin fue
como el mostrado en la Tabla 5.4:

Tabla 5.4

La capa de salida estaba formada por una simple neurona binaria que
daba una clasificacin bueno/malo.
Utilizando el procedimiento de codificacin de la Tabla 5.4, al menos 32
neuronas les fueron necesarias en la capa de entrada. Por supuesto
otras formas de codificacin de los atributos pueden ser posibles.
Resultados:
Para el entrenamiento y validacin, dividieron el conjunto de datos de la
Tabla 5.3 en dos subconjuntos. El nmero de ejemplos en cada
subconjunto, se puede ver en la Tabla 5.5, en donde intentaron
mantener una distribucin similar de candidatos buenos y malos.

Tabla 5.5

129

Procesamiento Digital de Seales aplicado a Redes Neuronales

El mejor resultado que obtuvieron, es el presentado en la Tabla 5.6


(Standard Backpropagation, tasa de aprendizaje: 0.2):

Tabla 5.6

Cuando emplearon dos capas ocultas el resultado no mejor, a pesar de


tomar ms tiempo de CPU. Tambin modificaron el grado de aprendizaje,
fijndolo en 0.5 y 0.7 e iniciando diferentes series de tiempo, pero los
resultados tampoco mejoraron.

6. Software Comerciales.
6.1 Aplicaciones del NeurOn-Line Studio a procesos de refinera
y petroqumica.
Los procesos industriales han instalado extensamente, durante el
transcurso de los ltimos aos, bases de datos histricas en tiempo real
con gran capacidad de almacenaje. Los especialistas en Tecnologas de
Informacin (Information Technologies, IT) hacen referencia a la
metodologa general para obtener informacin valiosa desde una gran
base de datos como data mining (minera de datos). Una de tales
metodologas son las Redes Neuronales (Neuronal Networks, NNs). El
artculo describe la aplicacin de un paquete de programas de NNs
comercial (NeurOn-Line Studio, Gensym Corporation, Cambridge,
Massachusetts, USA) a varios problemas de refineras y petroqumicas.
Se muestra como el moderno software es capaz de manejar
apropiadamente la seleccin de la estructura de la NNs y la apropiada
metodologa de entrenamiento (es decir, minimizando la funcin objetivo
adecuada, generalmente el problema del menor cuadrado). Se dan
ejemplos sobre la utilizacin de NNs como analizadores virtuales,
optimizadores y para la reduccin de modelos.
Introduccin:
130

Procesamiento Digital de Seales aplicado a Redes Neuronales

Los procesos industriales han instalado extensamente, durante los


ltimos tiempos, bases de datos histricas en tiempo real con gran
capacidad de almacenaje. En las refineras e industrias petroqumicas
tales bases de datos estn recopilando datos del proceso en tiempo real
desde los Sistemas de Control Distribuidos (Distributed Control Systems,
DCS), a una tpica frecuencia de muestreo de 1 minuto. Generalmente,
las bases de datos estn disponibles en lnea por muchos aos e
incluyen tambin los resultados de los anlisis rutinarios de laboratorio.
En una refinera tpica, es normal recolectar miles de variables (tags),
incluyendo variables de proceso y set-point, salidas de vlvula y modo
(por ejemplo: automtico, manual, local, remoto, etc.) de los
controladores. Estos historiadores en tiempo real estn produciendo
bases de datos muy grandes donde, aunque no siempre fcil de
encontrar, puede extraerse una muy rica informacin relacionada al
proceso. Debido a tcnicas especiales de compresin, tales bases de
datos tienen una tremenda capacidad de almacenamiento. Como un
ejemplo, si 40,000 tags del DCS son muestreados cada minuto (un
modesto nmero de una refinera de petrleo de tamao medio), 57.6
millones de puntos de dats se recogen cada da, totalizando alrededor
de 21 billones de puntos de datos anualmente.
No es inusual disponer on-line de varios aos coleccionados, accesibles
fcilmente utilizando herramientas de una PC estndar, tal como una
hoja de clculo Excel.
El data mining (tambin conocido como
Knowledge Discovery in Databases

KDD) ha sido definido como la extraccin no trivial de


informacin
implcita,
desconocida
previamente,
y
potencialmente til desde los datos [Frawley et al., 1999].
Haciendo uso de mquinas de aprendizaje, estadstica y
tcnicas de visualizacin paradescubrir y presentar
informacin en una forma en la cual es fcilmente
comprensible por el ser humano.

La metfora de la mina es realmente potente: hay vetas de material rico


(esto es, datos tiles desde el punto de vista de la economa, seguridad
y operacin del proceso), oculto en una inmensa cantidad de datos
crudos almacenados, muchos de los cuales se pueden considerar como
escoria. El esfuerzo para extraer el material precioso de la escoria se
basa en varias tcnicas matemticas y de IT que ayudan en la tarea.
Una de tales metodologas son las Redes Neuronales (NNs), las cuales se
describen resumidamente ms abajo, pero pueden rpidamente ser
definidas como un artefacto matemtico que necesita ser alimentado
(esto es, recibir entradas) con datos histricos para ser entrenado en
orden a predecir una o ms variables (esto es, generar salidas).
131

Procesamiento Digital de Seales aplicado a Redes Neuronales

Pero las NNs, para explotar correctamente las vetas del material rico que
se hallan en las grandes bases de datos, no necesita solamente ser
alimentada con el dato apropiado de entrada y salida, sino tambin
cumplimentar los siguientes 2 requisitos importantes: _ La NN debe
tener una estructura capaz de representar adecuadamente el problema.
_ La NN debe ser entrenada con un algoritmo robusto y confiable,
apto para converger a una solucin aceptable.
No sorprendentemente, muchos de los artculos disponibles en este
campo no abundan en las aplicaciones industriales de las NNs, pero si
sobre los detalles matemticos y caractersticas especiales de cada tipo
de topologa de NN (esto es: tipo de red, funcin de transferencia,
nmero de capas) y/o algoritmo de entrenamiento (esto es: tcnicas de
minimizacin, temas de convergencia, detalles de programacin, etc.).
Muchas veces puede gastarse mucho esfuerzo luchando con la mejor
topologa de NN y perderse muchas horas de CPU intentando obtener un
ajuste y convergencia razonable. No fue hasta hace poco que los
paquetes comerciales fueron capaces de prestar atencin a los dos
requisitos mencionados anteriormente. Este artculo presenta la
experiencia recogida con la aplicacin de uno de tales paquetes
comerciales: NeurOn-Line Studio [Gensym, 1999], una herramienta
poderosa para entrenar e implementar on-line las soluciones basadas en
NNs
Redes Neuronales: descripcin de la terminologa usual y del
software.
Muy buenas descripciones tericas y prcticas de la tecnologa de las
NNs pueden encontrarse en varias publicaciones, pero la coleccin de
artculos editados por Leonides (1998) puede mencionarse como una
buena fuente de informacin sobre la teora y prctica de las mismas.
Esta seccin solamente pretende dar una breve introduccin a las
capacidades del software NeurOn-Line Studio. El NeurOn-Line Studio
puede utilizarse off-line u on-line, siendo una herramienta para el
anlisis de procesos. Tpicamente la fuente de datos es un historiador de
datos u otro archivo de datos. Empleando poderosas herramientas de
visualizacin, es posible analizar un amplio conjunto de datos
desordenados de hasta 100,000 registros y ms de 100 variables.
El NeurOn-Line Studio provee una gua paso a paso a travs del proceso
de
preprocesamiento
de
datos,
configuracin
del
modelo,
entrenamiento, validacin y puesta en lnea. Para maximizar la
productividad, muchas tcnicas de decisin, tales como seleccin de las
132

Procesamiento Digital de Seales aplicado a Redes Neuronales

entradas relevantes, tiempos de retraso y arquitectura de la red, estn


automatizadas o convenientemente asistidas.
Una vez que un modelo se ha construido, es posible utilizar el NeurOnLine Studio para descubrir formas ms ventajosas para correr el proceso
a travs de la simulacin y de la optimizacin. Sobre la base de una
funcin objetivo, que expresa rentabilidad en trminos de variables de
proceso predichas y medidas, el NeurOn-Line Studio aplica el modelo de
red neuronal para determinar las condiciones de operacin ptima,
dentro de las restricciones del caso.
Es posible implementar los modelos predictivos y las capacidades de
optimizacin de NeurOn-Line Studio como controles ActiveX en el
entorno deWindows NT, 2000 y 98. Los mismos pueden correrse en
contenedores adecuados, que incluyen Visual Basic y aplicaciones C++,
aplicaciones MS Office, y otros que siguen la norma COM, tales como los
provistos por la mayora de los proveedores de DCSs e historiadores de
datos.
Los modelos del NeurOn-Line Studio pueden tambin fcilmente
integrarse dentro del ambiente de las aplicaciones del sistema experto
G2. Esta integracin resulta estratgica, sobre todo por la coleccin de
rutinas de conectividad del G2, orientacin a objetos y su habilidad para
representar reglas expertas en lenguaje natural estructurado.
Empleando los modelos del NeurOn-Line Studio en esta forma aumentan
la capacidad del G2 para el manejo inteligente de operaciones de
proceso.
Aplicacin de Redes Neuronales a la industria de procesos.
Como se ha mencionado, las Redes Neuronales permiten al ingeniero
crear modelos para procesos utilizando datos histricos del mismo
proceso. Los modelos pronostican cmo el proceso responder a los
cambios de entradas y diferentes condiciones de trabajo. Las
condiciones de operacin ptima, sujeta a restricciones, pueden tambin
determinarse con las NNs correctamente formuladas. Los modelos
identificados empleando NNs pueden utilizarse en estudios de proceso
off-line o ser instalados on-line para suministrar una deteccin precoz de
los problemas de proceso y determinar los set-point que continuamente
optimicen el proceso para maximizar las ganancias.
Las NNs traen a la vida los datos histricos, revelando los factores ms
importantes que afectan la calidad y el rendimiento de los productos.
Este conocimiento puede a menudo detectar mejoras sin ninguna
inversin de capital. Las reas generales de utilizacin potencial de las
NNs son las siguientes:
133

Procesamiento Digital de Seales aplicado a Redes Neuronales

Control de Calidad, Sensores Inferenciales y Reduccin de Modelos.


En la economa globalizada de hoy en da, el gerenciamiento de la
calidad en tiempo real es
una aplicacin de vital importancia, pero los ensayos de calidad
raramente estn disponibles sin retardos y usualmente son onerosos.
Los modelos basados en redes
neuronales proporcionan medidas
virtuales en tiempo real, permitiendo acciones de control rpidas para
mantener la calidad en el objetivo deseado. Los modelos pueden ser
obtenidos no slo a partir de los datos de planta y laboratorio sino de
datos generados con corridas de modelos de simulacin rigurosos
(desarrollados, por ejemplo, en HYSYS). Este ltimo procedimiento se
conoce como reduccin de modelos.
Optimizacin de Procesos. El valor de la optimizacin basada en modelos
est bien probado pero, en general, los modelos analticos de un proceso
pueden ser muy difciles de obtener. Al emplear redes neuronales en
conjunto con su capacidad de optimizacin en lnea y en tiempo real,
puede ser posible obtener el mayor potencial econmico de un proceso.
Mantenimiento Predictivo y Seguridad. Los modelos basados en redes
neuronales pueden ser empleados para monitorear la performance de
mquinas y equipos. Con ellos se pueden detectar tempranamente
corrimientos o errores en los modelos operativos o sensores,
permitiendo a los ingenieros corregir los problemas antes que devengan
en incidentes mayores. Se puede mejorar, en consecuencia, la
disponibilidad de plantas y equipos. El monitoreo continuo del contenido
de emisiones (CEM, Continuous Emissions Monitoring) de NOx, CO2, SO2
en los gases de escape de hornos y calderas es una aplicacin tpica en
esta rea.
Validacin de Sensores. La deriva progresiva y/o falla abrupta de
seales de sensores son la fuente principal de paradas de planta
planeadas y produccin de productos fuera de especificacin. Con
modelos basados en redes neuronales es posible seguir los valores
los sensores y generar alarmas cuando las medidas provenientes de
sensores fsicos no estn de acuerdo con los valores inferidos para
mismos. El valor inferido puede ser empleado tambin como lnea
base en los casos en que el instrumento es recalibrado o reparado.

las
no
los
de
los
los
de

Prediccin y Estimacin. El futuro puede ser predicho dentro de la


precisin que dan los modelos basados en comportamientos. Las redes
neuronales pueden aprender los modelos ptimos, adaptados
continuamente con el empleo de los ltimos datos medidos. Los
ingenieros pueden emplear estas predicciones para estimar la demanda
de mercados de corto plazo, predecir estados futuros del proceso o an
134

Procesamiento Digital de Seales aplicado a Redes Neuronales

condiciones meteorolgicas que afecten a las emisiones e impacten


sobre la vecindad de la planta. De algunas de las muchas aplicaciones
experimentadas actualmente con el software: NeurOn-Line Studio, los
ejemplos presentados en este artculo estn resumidos en la Tabla 1:

Prediccin del punto final de las naftas FCCU.


Con el objetivo de ejecutar una prueba del concepto para la aplicacin
del NeurOn-Line Studio como un sensor virtual, los datos fueron
colectados desde el historiador de datos de la planta PI (OSI Soft) de la
Refinera de La Plata de Repsol- YPF (Ensenada, Pcia. de Buenos Aires,
Argentina). El objetivo fue inferir el 90% del Punto de Destilacin de la
nafta de la Unidad de Cracking Cataltico Fluidizado (Fluidized Catalytic
Cracking Unit FCCU). Este caso fue descripto en detalle por Ruiz (1999)
pero una breve descripcin se da a continuacin.
Los datos fueron colectados utilizando la interfase Excel DataLink del
historiador PI, colectando inicialmente 63 variables operativas, durante
el perodo de junio-octubre de 1998. El volumen total de informacin
recogida fue de 80 Mbytes aproximadamente. Despus del filtrado de los
datos, inspeccin para identificar los perodos de operacin inestables o
135

Procesamiento Digital de Seales aplicado a Redes Neuronales

mal funcionamiento de los sensores, un perodo de 8 das fue


seleccionado como el conjunto de entrenamiento. Un conjunto de
validacin independiente tambin fue extrado, para utilizarse sobre la
validacin del modelo finalmente entrenado.
El conjunto de datos de entrenamiento fue inspeccionado a fondo para
detectar los perodos malos. La Figura 1 refleja el perodo cuando el
caudal de alimentacin a la FCCU se cambi de 170 a 180 m 3/h. El
NeurOn-Line Studio permite, directamente desde el grfico, embanderar
los datos para ser previamente preprocesados al entrenamiento de la
NN.

Figura 1: cambio en el flujo de alimentacin a la FCCU (marcados en rojo) de 170 a 180 m3/h.

136

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 2: grfico X-Y mostrando la relacin entre el caudal del reflujo de la


columna principal y la variable a ser inferida (Punto del 90% de la nafta).

Figura 2: grfico X-Y mostrando la relacin entre el caudal del reflujo de la


columna principal y la variable a ser inferida (Punto del 90% de la nafta).
Figura 3: prediccin del punto final para la nafta de la FCCU (lnea
amarilla) vs. el actual (lnea verde) durante el perodo de validacin.

En la Figura 2 un grfico X-Y muestra la relacin del caudal de reflujo con


el punto final de la nafta. En el mismo, el perodo inestable
correspondiente al caudal de alimentacin de la planta se marc
tambin en rojo. Los otros puntos de operacin marcados en amarillo
son una porcin tambin eliminada del peroo de entrenamiento porque
una vlvula de alivio de presin se abri causando una perturbacin en
la columna principal.
Se entrenaron dos modelos, el primero de ellos utilizando como entradas
variables de proceso con diferentes retrasos. Algunas de ellas se
emplearon con el valor instantneo y otras retrasadas en un rango de 30
minutos a 1 hora. El segundo modelo se entren empleando solamente
18 variables (modelo reducido), todas ellas retrasadas 1 hora. Ambos
modelos exhibieron buenas predicciones del punto de destilacin 90%
de la nafta. Se prefiri el modelo reducido porque la menor cantidad de
variables involucradas lo hacen ms robusto con respecto la falla de los
137

Procesamiento Digital de Seales aplicado a Redes Neuronales

sensores. La Figura 3muestra el valor predicho y el actual, obtenido a


partir del modelo reducido, para el perodo de validacin.
Prediccin de la calidad y reduccin del modelo en una columna Splitter
de
propano/propileno.
Un modelo riguroso, basado en los principios fundamentales, de una
columna de destilacin empleada para separar una mezcla de propano y
propileno se desarroll tilizando el simulador HYSYS. El diagrama de
flujo del proceso se exhibe en la Figura 4. Con la utilidad del caso de
estudio de HYSYS (Case Study), se gener una grilla de alrededor de 900
puntos (esto es, 900 corridas), como se muestra en la Figura 5. Las
variables de operacin que se toman en consideracin para el
entrenamiento de la NN se presentan en la Figura 6. Para predecir el
propileno producto y la composicin de fondo del propano, se emplearon
una mezcla de las variables manipuladas (por ejemplo, el caudal de
reflujo a la columna y el calor en el reboiler), las variables externas
(como el caudal de alimentacin y la composicin) y las variables de
estado (como la temperatura de la alimentacin).

Figura 4: diagrama de flujo del proceso obtenido a travs del simulador HYSYS de la columna
de separacin C3/C3=.

138

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 5: facilidad del caso de estudio HYSYS empleado para generar la grilla de entrenamiento.

Como la grilla de datos generada para entrenar el modelo est libre de ruidos, la NN
entrenada muestra una muy buena concordancia. En la Figura 7 puede mostrarse cuan
buena es la prediccin de la composicin de producto de tope (propileno), ya sea en el
grfico de lnea o en el X-Y, donde la composicin predicha y al actual se comparan casi
exactamente.

Figura 6: lista de las variables de HYSYS utilizadas para entrenar la NN.

139

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 7: valores del modelo de HYSYS vs valores predichos por el NeurOn-Line


Studio para la composicin de tope del propileno (ambos grficos, de lnea y X-Y).

Adicionalmente al modelo reducido de la NN, se cre un modelo de optimizacin. En este


aso, el objetivo es obtener una cierta especificacin de las composiciones de tope y fondo,
manipulando el operario las variables, tomndose en consideracin las perturbaciones
externas y satisfaciendo todas las restricciones, incluyendo las variables de estado. En la
Figura 8, se presenta la estructura del modelo de optimizacin. Las variables manipuladas,
en este caso, son el caudal del reflujo de la columna tower y el caudal de producto, como se
muestra en la Figura 9.

140

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 8: red de optimizacin para el separador C3.

Figura 9: clasificacin de las variables del modelo de optimizacin del separador C3.

Estimacin on-line del punto de weathering del LPG. Para controlar las especificaciones
del producto propano, el operador hace determinaciones on-site del weathering point de
ambos productos: propano y butano de la columna depropanizadora de la FCCU II, de la
141

Procesamiento Digital de Seales aplicado a Redes Neuronales

Refinera de Lujn de Cuyo de Repsol-YPF. Estos anlisis manuales se ejecutan en el


campo, con intervalos de aproximadamente 8 horas y reportados en una hoja de clculo
Excel. La planta tiene instalado tambin un cromatgrafo on-line sobre ambos productos de
tope y fondo.
Se desarroll una NN para predecir el weathering point del propano, basada en las
condiciones de operacin de la columna y cromatgrafos on-line. Los datos de operacin se
recogieron desde el historiador de datos PI (perodo mayo-junio 1999) y combinados con
los datos de anlisis generados por el operador de planta. El weathering point es una
funcin directa (pero no sencilla) de la composicin de las corrientes de productos. El
primer modelo fundamental fall al predecir el weathering point correcto porque el anlisis
de rutina es una evolucin ni isotrmica ni adiabtica, pero s politrpica. La metodologa
de la red neuronal es capaz de considerar el error metodolgico del laboratorio. Una vez s,
se prepararon dos series de datos, una para el entrenamiento y otra para la validacin de la
NN entrenada. En la Figura 10 se exhibe el weathering point del 95% propano de para
ambas series de datos.

La NN entrenada fue capaz de predecir muy bien la determinacin del weathering point de
la planta. En la Figura 11 puede exhibirse la prediccin continua a travs de un perodo de
una semana. En el mismo grfico estn superpuestas las determinaciones hechas en el lugar.

142

Procesamiento Digital de Seales aplicado a Redes Neuronales

Figura 11: prediccin del weathering point del propano (rosa) vs el valor actual (rojo).

Conclusiones:
La tecnologa de la NN ha demostrado ser una forma muy poderosa de
obtener correlaciones buenas y confiables para ejecutar la aplicacin de
analizadores virtuales y para instalar en lnea herramientas de
optimizacin de proceso. El software, NeurOn-Line Studio, para
desarrollar y poner en lnea tal tecnologa y cubrir las necesidades del
personal de ingeniera, de tal manera que ningn profesionalismo se
necesite poseer obre las NNs, pero s sobre el proceso y las relaciones
causa-efecto. reconocimientos: queremos agradecer a las siguientes
personas quienes suministraron los datos y participaron en el desarrollo
de algunos de los ejemplos presentados:.
Conclusiones
El Procesamiento de seales trata de la representacin, transformacin y manipulacin
de seales y de la importancia que contienen. Cuando se refiere al procesado digital de
seales, se refiere a la representacin mediante secuencias de nmeros de precisin finita y
el procesado se realiza utilizando un computador digital.
Las computadoras y las redes informticas han producido un gran
impacto en nuestra sociedad un impacto de enormes consecuencias,
estas herramientas revolucionarias han multiplicado la productividad y
eficiencia del trabajo, tanto como para las empresas y usuarios
independientes. Ahora las redes neuronales son la propuesta de una
solucin a los problemas de gran complejidad, los cuales requieren de
una gran implementacin ya sea de soluciones a gran escala o
dificultad.
143

Procesamiento Digital de Seales aplicado a Redes Neuronales

A menudo es deseable que estos sistemas funcionen en tiempo real, lo que significa que el
sistema en tiempo discreto se implementa de forma que las muestras de salida se calculan a
la misma velocidad a la que se muestrea la seal en tiempo continuo. Son muchas las
aplicaciones que requieren esta especificacin.
El propsito de esta tesis es el mostrar un estudio sobre la aplicacin y procesamiento de las
seales digitales en las redes neuronales. Por lo tanto se logro mostrar la aplicacin y el
procesamiento como herramienta de seales digitales en las redes Neuronales.

Bibliografa
[Aracil91] Aracil, R., Jimnez, A., Sistemas discretos de Control, Servicio de
Publicaciones de la ETS de Ingenieros industriales de Madrid, 1991.
[Barahon97] Barahona, E.. , Qu es un Pentium MMX?, PC WORLD n 132, pp135-139,
1997.
144

Procesamiento Digital de Seales aplicado a Redes Neuronales

[Banks90] Banks, S., Signal Processing, Image Processing and Pattern Recognition,
Prentice Hall, 1990.
[Burrus98] Burrus, C. S., McClellan, J. H., Oppenheim, A.V., Parks, T. W., Schafer,
R.W., Schuessler, H., W., Ejercicios de tratamiento de la seal utilizando
MATLAB v.4, Prentice Hall, 1998.
[Embree91] Embree, P.M., Bruce, K., C language algorithms for signal processing,
Prentice Hall, 1991.
[Ifeachor96] Ifeachor, E.C., Digital Signal Processing. Principles, Algorithms and
Applications, Prentice-Hall, 1996.
[Krauss95] Krauss, T.P., Shure, L., Little, J.N., Signal Processing Toolbox (User's
Guide), The Math Works, Inc., 1995.
[Miguel88] De Miguel, P., Fundamentos de computadores, Paranifo, 1988.
[Oppenhe94]Oppenheim, A. V., Willsky, A. S., Seales y Sistemas, Prentice Hall
Iberoamericana, 1994.
[Oppenhe98]Oppenheim, A. V., Willsky, A. S., Nawab, S. H., Seales y Sistemas, Prentice
Hall Iberoamericana, segunda ediccin, 1998.
[Oppenhe00]Oppenheim, A. V., Schafer, R. W., Buck, J. R., Tratamiento de seales en
tiempo discreto, Prentice Hall, 2000.

145

También podría gustarte