Está en la página 1de 7

Aplicacin de las Redes Neuronales para la Identificacin de un Sistema no lineal.

Un Caso Prctico
Jess Acosta* Josep Fernandez* Lenin Becerra**
*

Departament dEnginyeria de Sistemes, Automtica i Informtica Industrial. Universitat Politcnica de Catalunya. Barcelona, Espaa. {jacosta,ruzafa}@esaii.upc.es
**

Depto. de Ingeniera Electrnica Universidad Nacional Experimental Politcnica Antonio Jos de Sucre (UNEXPO). Barquisimeto, Venezuela. leninbm@bqto.unexpo.edu.ve

Resumen
En el presente trabajo se obtuvieron y analizaron modelos de un sistema de reaccin continuo (hidrlisis del anhdrido actico) utilizando las redes neuronales (RN) con el fin de determinar si los mismos realmente presentan un comportamiento dinmico que sea representantivo del proceso real. Se compararon tres mtodos: el modelo matemtico (MM) y dos modelos neuronales desarrollados bajo arquitecturas tipo feedforward: Redes perceptrnicas multicapas (RPM) y redes de base radial. La formulacin del MM se bas en el balance de materia para el anhdrido actico, el balance de energa en el reactor y en la expresin de velocidad de reaccin. En el patrn de entrenamiento de las RN se incluyeron tiempos de retardo. Para las RPM se us como mtodo de aprendizaje el Algoritmo Levenberg Marquardt. Todos los modelos obtenidos describieron adecuadamente el comportamiento dinmico real del proceso. Sin embargo, los modelos neuronales dieron mejor aproximacin que el MM, y entre ellos, el de base radial lo describi ms acertadamente, por lo cual presenta una mayor calidad en la identificacin. Estos resultados permitieron comprobar que las RN realmente poseen la habilidad para representar cualquier sistema no lineal, donde la mayora de los mtodos de identificacin clsicos no conducen a resultados aceptables. Palabras Claves: Inteligencia artificial, simulacin, algoritmo Levenberg Marquardt, redes neuronales.

matemtica puede obtenerse en forma estrictamente terica, lo que se denomina Modelado; as como tambin en forma emprica, mediante experimentos sobre el sistema real, basndose en datos de entrada y salida del proceso, llamado Identificacin. La principal ventaja del modelado de procesos, es que permite predecir el comportamiento dinmico y esttico de los sistemas antes de construirlos y tambin se puede analizar el desempeo de uno existente, con la intencin de estudiar su comportamiento. Adems, sin exponer el proceso a daos, se puede determinar que puede ocurrirle, simulando el modelo con una condicin, entrada inusual o perturbacin. Para obtener los modelos existen diferentes tcnicas de identificacin de sistemas. Algunas de ellas requieren medicin completa del estado, pero su aplicabilidad se ve limitada ya que esto no siempre es posible, debido a la gran cantidad de no linealidades y perturbaciones presentes en los procesos. Una gran cantidad de los mtodos clsicos no conducen a resultados aceptables, por lo tanto, puede ser algunas veces difcil de encontrar modelos matemticos representativos. Para obviar este problema es necesario hacer uso de observadores ([1]; [2]; [3]; [4]), lo que conlleva a un incremento en la dinmica del sistema. Esto ha llevado a explorar otras tcnicas con los cuales se puedan eliminar estos inconvenientes. Las redes neuronales artificiales o simplemente redes neuronales, constituyen una de las reas de la inteligencia artificial que ha despertado mayor inters en los ltimos aos y constituyen una herramienta sumamente general para abordar una amplia clase de problemas de identificacin de sistemas dinmicos, como se conoce a travs de trabajos realizados por [5]. En particular, este enfoque resulta muy ventajoso cuando se trata de la identificacin de sistemas no lineales (como es el caso de todos los procesos

INTRODUCCIN

La aplicacin de tcnicas de control a sistemas dinmicos requieren de una representacin que caracterice el proceso fsico, o sea, un modelo matemtico del mismo. Esta representacin

industriales), donde la mayora de los mtodos clsicos no conducen a resultados aceptables. En cambio, las redes neuronales son capaces de resolver problemas cuya solucin por otros mtodos convencionales resulta extremadamente difcil y/o insatisfactoria. El presente estudio tiene como objetivo la evaluacin de las prestaciones de las redes neuronales para la modelizacin de un sistema no lineal. En l se analiza un caso prctico: un sistema de reaccin continuo y se obtienen modelos utilizando las redes neuronales artificiales para determinar si los mismos realmente presentan un comportamiento dinmico que sea representativo del proceso real, asimismo se comparan los resultados de diferentes alternativas de modelizacin.

DESCRIPCION DEL SISTEMA DE REACCIN CONTINUO

Figura 1: Montaje para el Sistema de Reaccin Continuo

Para la presente investigacin se tom como referencia el sistema de reaccin estudiado por [6], el cual es la Hidrlisis del Anhdrido Actico (ecuacin (1)), debido a que su naturaleza cumple con todos los requisitos establecidos: es una reaccin simple y elemental, en presencia de un exceso de agua, su cintica se ajusta a una expresin de primer orden; asimismo, es una reaccin qumica exotrmica. Sus reactivos (anhdrido actico y agua), as como su producto (cido actico), son lquidos a presin atmosfrica y temperatura ambiente, condiciones a las cuales la reaccin puede llevarse a cabo completamente. Adems, dicho estudio devela una gran cantidad de datos experimentales, los cuales fueron datos excelentes para el desarrollo de sta.

FORMULACIN MATEMTICO

DEL

MODELO

(CH 3 CO ) 2 O + H 2 O 2CH 3 COOH

(1)

Se tomaron en cuenta las siguientes consideraciones: a) Las densidades de los reactivos y la del producto permanecen constantes, b) Las capacidades calorficas del medio reaccionante no vara con los cambios de temperatura y composicin, adicionalmente Cv y Cp son aproximadamente iguales, c) El calor de reaccin es constante en el intervalo de temperaturas de operacin, d) Las entalpas de los reactivos se consideran constantes, pues la temperatura de alimentacin no cambia, e) La temperatura ambiente permanece constante, y f) El flujo volumtrico del producto permanece constante. a) Balance molar en estado dinmico para el reactivo limitante A. dC A (t ) (2) A q A (t ) VrA (t ) q S C A (t ) = V PM A dt donde: A: densidad del anhdrido actico, g/ml. PMA: peso molecular del anhdrido actico, g/mol. qA(t): flujo volumtrico del anhdrido actico alimentado, ml/seg. V: volumen del reactor, ml. rA(t): velocidad de reaccin, mol/ml*seg qS: flujo volumtrico del producto, ml/seg. CA(t): concentracin del anhdrido actico, g/ml b) Velocidad de reaccin: rA(t) = K o e
E / RT ( t )

Esta reaccin qumica fue llevada a cabo en dos sistemas diferentes, uno continuo y otro discontinuo. La instalacin en este caso del sistema de reaccin continuo (Vase Figura 1), se realiz con los siguientes elementos: a) Reactor continuo, recipiente cilndrico con una capacidad de 250 ml (beaker). Oper por rebose, los reactivos se alimentaron empleando un par de buretas de 50 ml, la mezcla reaccionante se mantuvo homognea con la utilizacin de un agitador magntico y el producto abandon el reactor por medio de un canal colocado en la parte superior del mismo (a nivel de la superficie del lquido), b) Termocupla, elemento sensor de temperatura del medio reaccionante, su salida se conect a un amplificador, con el fin de realizar las mediciones con mayor precisin, y c) Colector, recipiente rectangular empleado para la recoleccin del producto de la reaccin.

C A (t )

(3)

c)

Balance de energa en el reactor.


H A . A .q A (t ) + HW .W .qW (t ) V .rA (t ).Hr
dT (t ) U . A(T (t ) TS ) qS ..CP (T (t ) Tref ) = V ..CV dt

(4)

19,74 (8) Q A(s) 270,031 s + 1 33,62 (10.352,9) C (s) + QW(s) A 270,031 s + 1 270,031 s + 1

T(s) =

donde: HA: entalpa del anhdrido actico alimentado, Cal/gr. w: densidad del agua, g/ml. Hw: entalpa del agua alimentada, Cal/gr. qw(t): flujo volumtrico del agua, ml/seg. Hr: calor de reaccin, Cal/mol consumido de A. U: coeficiente global de transferencia de calor, Cal/cm2*K*seg A: rea de transferencia de calor, cm2 : densidad del medio reaccionante, g/cm3 CP: capacidad calorfica del medio reaccionante a presin constante, Cal/g*K. Cv: capacidad calorfica del medio reaccionante a volumen constante, Cal/g*K. TS: temperatura ambiente, K. Tref: temperatura de referencia para el clculo de las entalpas, K. T(t): temperatura del medio reaccionante, K. Luego de realizar un proceso de linealizacin y aplicando Transformada de Laplace se obtiene la siguiente expresin: CA(s) = T(s) =
K2 K1 T(s) Q A(s) 1 s + 1 1 s + 1

TOPOLOGA NEURONAL

DE

LA

RED

Se entiende por topologa la configuracin fsica de la red, es decir, la manera en que estn interconectados los elementos de procesamiento. Pueden agruparse en dos: a) Redes con topologa feedforward y b) Redes con topologa with feedback. En las primeras, las comunicaciones van en una sola direccin, de las neuronas de entrada hacia las neuronas de salida, un ejemplo de este tipo de topologa son las redes tipo perceptrn y las redes de base radial. Y en las segundas, algunas neuronas tienen sus salidas conectadas a las neuronas de las capas previas, un ejemplo de estas se ve en las redes recurrentes y las redes Hopfield. En esta investigacin los modelos neuronales se desarrollaron bajo topologa tipo feedforward: Redes perceptrnicas multicapas (RNPM) y redes de base radial (RNBR), por ser las ms populares y apropiadas para una gran variedad de problemas en ingeniera, con entrenamiento supervisado usndose como mtodo de aprendizaje el Algoritmo Levenberg Marquardt para el primer caso, una mejora al de retropropagacin del error (Backpropagation) por las ventajas que ste presenta y porque se prob con otros algoritmos sealados por [7], tales como: Fletcher-Reeves (traincgf), Polak-Ribire (traincgp), Powell-Beale (traincgb), BFGS (trainbfg) y un paso secante (trainoss); pero stos no convergieron tan rpidamente.

(5)

K4 K3 QW(s) Q A(s) + 2 s +1 2 s +1 K5 CA(s) 2 s +1

(6)

donde: T(s): Temperatura del medio reaccionante en el dominio de Laplace CA(s): Concentracin del anhdrido actico en el dominio de Laplace. QA(s): Flujo volumtrico de anhdrido en el dominio de Laplace. QW(s): Flujo volumtrico del agua en el dominio de Laplace. K1,K2,K3,K4,K5: Ganancias 1,2: Constantes de tiempo Personalizando el sistema usando los parmetros operacionales y sus propiedades fsicas parra determinar las constantes de tiempo y las ganancias, se obtiene el modelo matemtico: CA(s) = 0,00508 QA(s) 8,00E 6 T(s) 115 s + 1 115 s + 1 (7)

EXPERIMENTO, RESULTADOS Y DISCUSION

El software utilizado estuvo conformado por los toolboxes Simulink y Redes Neuronales de Matlab 5.2, el cual permite realizar simulaciones e implementar una gran variedad de redes neuronales facilitando el proceso de investigacin. En cuanto al hardware, se us un computador PENTIUM 200 MMX. En un principio, se obtuvieron los datos de entrenamiento, stos deban de cubrir todo el conjunto de entradas esperado, es decir, todo el rango de frecuencia y amplitud de las seales de entrada al sistema. Debido a las caractersticas del sistema de reaccin estudiado (sistema SISO, Single Input Single Output), para poder ampliar el conjunto de valores que conforman el patrn de entrenamiento

u (k)

PROCESO
(Sistema Real)
Z
-1

y (k)

Z-

Z-

Z-1

e (k)

Z-

ZZ1

RED NEURONAL

Z-1

Figura 2: Identificacin del proceso en estudio usando Redes Neuronales.

cuando se realizara la simulacin, se incluyeron tiempos de retardo de tal manera de obtener suficientes datos histricos del proceso en estudio debido a que slo se posean inicialmente treinta y tres pares de datos muestreados, es decir, una entrada con su respectiva salida. Es por ello que el patrn de entrenamiento estaba formado por nueve seales: por la seal de entrada y sus respectivos cuatro retardos, y por cuatro retardos de la seal de salida. Mientras ms retardos se agregan se obtiene una mejor aproximacin pero conlleva a un mayor tiempo de entrenamiento, menos retardos implica disminuir la calidad de identificacin con un entrenamiento rpido. Cada seal contiene una muestra de teinta y tres datos, lo que hace un total de 297 datos muestreados para el patrn de entrenamiento. Esquemticamente se observa en la Figura 2. Los parmetros de aprendizaje para la RNPM usados fueron los siguientes: a) Tasa de aprendizaje (ta)=0,005, b) Ciclos de entrenamiento (epochs)=1000, c) Mnimo gradiente =1e-20. En relacin a la RNBR fue el Spread (Difusin de la funcin de base radial) establecido por defecto en 1. Para ambas redes el error medio cuadrtico (mse) final fue de 0,001. Acerca del dimensionamiento de la topologa de este tipo de redes, se indica que no existe una teora que defina a ciencia cierta el nmero de capas de la red y el nmero de neuronas en cada capa; esto se hace usando pruebas por ensayo y error. En el caso de las RNPM, se utilizaron tres capas para definir el dimensionamiento de la red: una de entrada, una oculta y otra de salida; y se obtuvo la mejor

combinacin de neuronas por capa para el algoritmo de entrenamiento seleccionado, la cual arroj ser una red con nueve neuronas en la capa de entrada, diez neuronas en la capa oculta y una neurona en la capa de salida. En cambio en las RNBR, se utilizaron dos capas para definir el dimensionamiento de la red: una entrada y otra de salida; el software utilizado disea redes de ste tipo de dos capas y adiciona neuronas en la capa entrada de la red hasta encontrar la especificacin del mse alcanzar el mximo nmero de neuronas, es as como se obtuvo la mejor combinacin de neuronas por capa, la cual arroj ser una red con dieciocho neuronas en la capa entrada y una neurona en la capa de salida. En la Tabla 2, se presentan los resultados obtenidos en el proceso de entrenamiento. Las funciones de activacin utilizadas son diferenciables no lineales (tales como tangente sigmoidal tansig para RNPM y base radial radbas para RNBR) y lineal (purelin). Despus de realizar diferentes pruebas result conveniente tanto para la capa de entrada como para la oculta de la RNPM usar tansig y para la capa de salida purelin. En cambio para la RNBR, la capa entrada us radbas y la capa de salida purelin, en este tipo de red neuronal Matlab fija el tipo de funcin de activacin. Al usar la funcin tansig radbas los datos son escalados (normalizados) para reducir la velocidad de entrenamiento; en cambio en la salida se usa la funcin purelin y los datos de salida no se transforman. En la tabla 1 se muestran las funciones matemticas generales que se aplican a una RNBR, en donde: ni = N de neurona (1:N), Pr = Vector de entrada (1:n), w = pesos RNBR , = pesos nodo lineal, b = bias, y( k ) =salida predicha por la red.

Confluencia

ni =

(w ir p r )2 b
r

Funcin de Activacin (Transferencia)

ai = radbas(ni) = exp (-ni2) yk =

Funcin de Salida de Nodo Lineal

ai i
i

Tabla 1: Funciones matemticas generales que se aplican en una RNBR.


Modelo mse obtenido 0,000995496 0,000011559 Tiempo (seg) 79,70 2,86 Combinacin ptima de neuronas por capas 09 10 01 18 01

RNPM RNBR

Tabla 2: Resultados del entrenamiento de las redes neuronales. MODELO DESVIACION Matemtico < 1,5% Neuronal Perceptrnico Multicapa (NPM) < 0,40% Neuronal de Base Radial (NBR) < 0,05% Tabla 3: Desviacin en % entre los modelos con respecto al proceso real

La asignacin de los pesos de las neuronas y sesgos fue asignado automticamente en ambos casos por el software Matlab. De los resultados de la Tabla 2 se puede indicar lo siguiente: Y La RNPM obtenida para este problema present mayor nmero de capas que la RNBR. La primera estuvo conformada por tres capas, en cambio la otra estuvo constituida por dos capas. Y Para la RNPM, un mayor nmero de neuronas en la capa escondida (oculta) aport mejores resultados en este estudio, lo cual en cierta medida no da cabida a la regla prctica sealada por [8], de que: el nmero de neuronas de la capa oculta se puede seleccionar aproximadamente igual a la mitad de las neuronas de la capa de entrada. Esto puede ser debido a las funciones de activacin utlizadas, es decir, tanto para la capa de entrada como para la oculta se us tansig y para la capa de salida purelin . Y Tal como lo seal [9], cuando se inicia el entrenamiento de una RNPM y sta no converge, se debe comenzar a aumentar el nmero de neuronas por capas, hasta que se llegue a la combinacin ptima con el sistema. Esta situacin se dio en el experimento. Y Tal como lo afirma [7], la RNBR necesit mucho menos tiempo que la RNPM para su diseo. Esto es debido en cierto modo a que la

RNBR estuvo constituida por un menor nmero de capas: una con dieciocho neuronas (capa de entrada) y otra con una neurona (capa de salida). La RNBR presenta un menor error medio cuadrtico que la RNPM, por lo cual debe presentar una mayor calidad de identificacin.

En la Tabla 3 se muestra el porcentaje de desviacin entre los modelos obtenidos con respecto al proceso real. En l se observa que los modelos neuronales presentan menores variaciones que el modelo matemtico, esto no significa, que la obtencin de un modelo matemtico no es instrumento vlido para obtener una aproximacin a un sistema, sino que en este caso, las redes neuronales se ajustan mejor al comportamiento dinmico del sistema en estudio. Dicha desviacin en porcentaje (%) para cada tipo de modelo e instante de tiempo fue calculada mediante las siguientes expresiones matemticas: Desviacin (%) = ((Tmodi Texpi)/Texpi) * 100 (7) Desviacin (%) = ((Trnpmi Texpi)/Texpi) * 100 (8) Desviacin (%) = ((Trnbri Texpi)/Texpi) * 100 (9) donde: Tmodi: Temperatura del modelo matemtico en el instante de tiempo i. Trnpmi: Temperatura de la red neuronal perceptrnica multicapa ( de la red neuronal de base radial) en el instante de tiempo i.

35 34 33 Temperatura (C) 32 31 30 29 28 27
60 12 0 18 0 24 0 30 0 36 0 42 0 48 0 54 0 60 0 66 0 72 0 78 0 84 0 90 0 96 0 0

T iem p o (seg)
Experim ental Modelo N euronal RP M Modelo Matem tico Modelo N euronal RB R

Figura 3: Comparacin del proceso real con los modelos obtenidos

Trnbri :Temperatura de la red neuronal base radial en el instante de tiempo i. Texpi : Temperatura experimental en el instante de tiempo i. Todos los modelos obtenidos describieron adecuadamente el comportamiento dinmico real del proceso. Sin embargo, los modelos neuronales dieron una mejor aproximacin que el modelo matemtico, y entre ellos, el de la RNBR lo describi ms acertadamente (% de desviacin inferior a 0,05), por lo cual presenta una mayor calidad en la identificacin (Figura 3).

CONCLUSIONES Y TRABAJOS FUTUROS

De los resultados del presente estudio se desprenden las siguientes conclusiones: Y La Hidrlisis del anhdrido actico, permiti realizar de manera sencilla, el seguimiento del comportamiento del sistema de reaccin, ya que es una reaccin exotrmica, homognea en fase

lquida, que puede llevarse a cabo completamente en condiciones de temperatura ambiente y presin atmosfrica. Su cintica se ajusta a una expresin de primer orden. La aplicacin de simulacin para el sistema continuo describi el comportamiento dinmico del mismo, a travs de los cambios de concentracin del anhdrido actico y la temperatura del medio reaccionante. Fue diseada en el Toolbox Simulink del software Matlab a partir del modelo matemtico. Las redes neuronales seleccionadas con topologa feedforward (Red Perceptrnica Multicapa y Red de Base Radial), as como los algoritmos de entrenamiento implementados para cada caso, permitieron realizar exitosamente sta investigacin. El uso de tiempos de retardos, permiti ampliar el conjunto de valores que conformaron el patrn de entrenamiento cuando se realiz la simulacin de las redes neuronales. En otras palabras, tuvo como objeto obtener suficientes datos histricos del proceso en estudio, debido a que slo se poseen inicialmente treinta y tres pares de datos

Y Y

muestreados. El patrn de entrenamiento se conform por nueve seales, lo que di lugar a 297 datos muestreados. El mtodo Levenberg Marquardt convergi ms rpidamente que otros algoritmos, tales como: Fletcher-Reeves (traincgf), Polak-Ribire (traincgp), Powell-Beale (traincgb), BFGS (trainbfg) y un paso secante (trainoss); y por eso, adems de las ventajas que ste presenta, se seleccion como algoritmo para entrenar la RNPM. El mtodo Levenberg Marquardt no present ninguna ventaja evidente sobre el de base radial, esto se debe a su mayor complejidad. Tanto el modelo matemtico formulado para el sistema de reaccin continuo como los modelos neuronales, describieron adecuadamente su comportamiento dinmico real. Sin embargo, los modelos neuronales dieron una mejor aproximacin que el modelo matemtico. Entre los modelos neuronales el de base radial describi ms acertadamente el comportamiento dinmico real, por lo cual presenta una mayor calidad en la identificacin.

Referencias [1] Anstrom, K. J. And Wittenmark, B., (1995) Adaptive Control, Addison Wesley. [2] Franklin, G. et al. (1994) Digital Control of Dynamic Systems, Addison Wesley. [3] Ioannou, P. And Sun, J., (1996) Robust Adaptive Control, Prentice Hall. [4] Mosca, E. (1995) Optimal Predictive and Adaptive Control, Prentice Hall. [5] Narendra, Kumpati et al. (1990) Identification and Control of Dynamical Systems using Neural Networks, IEEE Transactions on Neuronal Networks, Vol. 1, N 1, pp. 4-27. [6] Surez, J. Y Lucena, M (1998) Estudio de la Estabilidad de un Sistema de Reaccin mediante simulacin dinmica. Universidad Nacional Experimental Politcnica Antonio Jos de Sucre (UNEXPO), Departamento de Ingeniera Qumica. Barquisimeto, Venezuela. [7] Demuth, H. and Beale, M. (1997) Neural Network Toolbox for Use with MALTLAB : Users Guide Version 3.0, U.S.A., The MathWorks, Inc. [8] Aguado, A. y Otros (1998) Identificacin de sistemas dinmicos no lineales mediante redes neuronales, Instituto de Ciberntica, Matemtica y Fsica de la Habana-Universidad Autnoma de Quertaro de Mxico, III Congreso de la Asociacin Colombiana de Automtica, Colombia. [9] Angulo, F. y Delgado, A. (1998) Identificacin de sistemas dinmicos no lineales con redes neuronales recurrentes, Universidad Nacional de Colombia, III Congreso de la Asociacin Colombiana de Automtica, Colombia.

En resumen, se puede sealar que los modelos neuronales realmente presentan un comportamiento dinmico representativo del proceso real. Esta ventaja es aplicable tanto a modelos lineales como a no lineales, ya que es una habilidad de stas representar cualquier funcin lineal o no entre una data de entrada y una de salida.

Como trabajo futuro se piensa realizar: La aplicacin de las redes neuronales con topologa with feedback (entre ellas redes recurrentes y redes de Hopfield), para la identificacin del mismo proceso en estudio, con el objeto de observar si aportan mejores resultados que las redes con topologa feedforward (Redes perceptrnicas multicapas y redes de base radial).

También podría gustarte