IEEE - Trabajo - Optimización

Aplicación de modelos de regresión lineal y red neuronal
artificial para la estimación del consumo energético de un

proceso de molienda de caña en un ingenio azucarero
A. Vallejo 1, D. Ortiz 2, L. M. Garcia 3
Universidad Autónoma de Occidente
Maestría en Sistemas Energéticos
Cali, Colombia
allan.vallejo@uao.edu.co 1, daniel.ortiz@uao.edu.co 2, lina_maria.garcia@uao.edu.co 3
Resumen—En este artículo se presenta el desarrollo de una respecto a los niveles de producción del proceso es una relación
metodología basada en herramientas de inteligencia artificial para la de suma importancia a tener en cuenta en un plan de gestión
estimación del desempeño energético de un proceso de molienda de energética (Castrillon, Gonzalez, & Quispe, 2013).
caña de azúcar en un ingenio del Valle del Cauca en Colombia. Esto
partiendo del ordenamiento y análisis de los datos obtenidos del Uno de los métodos más usados en la actualidad para el análisis
proceso, los cuales inicialmente serán utilizados para realizar un del comportamiento de este tipo de procesos es la aplicación del
modelo de regresión lineal autorregresivo exógeno y posteriormente modelo de regresión lineal por mínimos cuadrados. Este
uno de red neuronal artificial, a través del software Matlab. Ambos posibilita, una vez establecida una función lineal, efectuar
modelos serán evaluados con datos de prueba, tendrán la misma predicciones sobre el valor de la variable dependiente que en este
estructura y se comparará su desempeño con el objetivo de caso es el consumo energético, conociendo el valor de la variable
determinar con cual de ellos se presenta la mejor estimación del independiente que corresponde a la producción (Mena &
comportamiento de las variables estudiadas. Montecinos, 2006). La proporción de la variación de la respuesta
de la variable dependiente explicada por el modelo, es medida
Palabras claves—Inteligencia artificial, regresión lineal, red por el coeficiente de determinación R2, el cual se espera que sea
neuronal artificial, desempeño energético. cercano a 1, lo cual quiere decir que el modelo tiene buen ajuste
Abstract—This paper presents the development of a methodology y es capaz de explicar el comportamiento de dicha variable
based on artificial intelligence tools for estimating the energy (López, Rojano, Ojeda, & Salazar, 2007).
performance of a sugarcane milling process in a company in Valle del
Cauca in Colombia. This starts from the ordering and analysis of the
Una variante de la estructura de regresión lineal es el modelo de
data obtained from the process, which will be used to make a auto regresión con variables exógenas, de ahora en adelante
autoregressive exogenous linear regression model and later an ARX, en donde se tiene un número de pasos de tiempo de la
artificial neural network model, through Matlab software. Both entrada en el pasado y un retardo de la entrada con respecto a la
models will be evaluated with test data, they will have the same salida, el cual será aplicado al conjunto de datos obtenidos para
structure and their performance will be compared in order to este trabajo (López, Rojano, Ojeda, & Salazar, 2007).
determine with which of them the best estimate of the behavior of the Otro método que últimamente está siendo muy utilizado para el
variables studied is presented.
análisis de este tipo de procesos es el de las redes neuronales
Keywords—Artificial intelligence, linear regression, artificial neural artificiales, de ahora en adelante RNA. Esta es una técnica de
network, energy performance. estimación y clasificación perteneciente a la inteligencia
artificial, que tiene como principio el proceso de aprendizaje que
intenta simular la conducta cognitiva del cerebro humano. Una
I. INTRODUCCIÓN RNA normalmente está constituida por capas de información,
Tener un buen desempeño energético es considerado un donde generalmente se puede distinguir una capa de entrada o
mecanismo para asegurar el abastecimiento energético, pues se variables independientes, una o varias capas intermedias u
sustenta en la adopción de nuevas tecnologías y sobre todo de ocultas que realizan la determinación de las relaciones entre las
buenos hábitos de consumo, con el fin de optimizar el uso de variables de entrada y salida, y una capa de salida que recibe el
los recursos energéticos disponibles logrando con ellos los más resultante de las variables independientes (Mena & Montecinos,
altos niveles productivos (UPME, 2016). 2006).
En cuanto a los ingenios azucareros, en Colombia se La finalidad de este trabajo es establecer una metodología para
encuentran ubicados sobre el valle geográfico del río Cauca, para la estimación del consumo energético según el nivel de
siendo trece en total los que se benefician de las condiciones producción de un proceso de molienda de caña de azúcar,
climáticas de esta zona que favorecen la siembra y cosecha utilizando técnicas de regresión lineal y de RNA, cuyos
de caña durante todo el año y permiten la producción no desempeños serán comparados posteriormente.
solamente de azúcar sino también de alcohol, abono e
incluso energía (Asocaña, 2014). Una de las partes más
críticas de los procesos productivos realizados en los II. METODOLOGÍA
ingenios corresponde a la molienda de la caña, pues su Este trabajo inicia con la explicación de la base de datos usada,
desarrollo depende en gran parte de motores eléctricos, los seguida por la aplicación del modelo de regresión lineal con la
cuales están catalogados como los usuarios de mayor definición de su estructura, parámetros y validación, para luego
consumo de energía eléctrica en plantas industriales , por lo obtener y también validar un modelo RNA con esta misma
que la predicción o estimación del consumo de energía con
estructura, finalizando con la comparación del desempeño de
ambos modelos. Parametro Valor
Valor de distribución normal para confianza
A. Descripción de los datos del 99% (z) 2,575
Coeficiente de varianza (cv) 0,13008
La caña de azúcar después de ser cosechada y trasladada
hasta la planta de producción, se descarga en bandas Nivel deseado de precisión ( e ) 0,021
transportadoras que la llevan hasta una desfibradora que Muestra mínima de datos 254,409
parte sus tallos en trozos muy pequeños para después iniciar
su paso por el molino que está compuesto por seis juegos de Tabla 2. Parámetros de la muestra mínima de datos
motores eléctricos de cuatro masas cada uno, la finalidad de
esta etapa es extraer el jugo de la caña de azúcar que Cabe destacar que inicialmente el número total de registroscon
contiene la sacarosa, aplicando agua caliente y alternando el los que se contaba era de 294, sin embargo, se decidió considerar
mismo jugo extraído entre los primeros cinco pasos o solo 282 de ellos, excluyendo los que presentaban un incremento
motores para facilitar el proceso. Finalmente, del sexto paso muy significativo en el valor del consumo energético con una
o motor sale la caña de azúcar ya en forma de bagazo con producción casi nula o un incremento significativo de la
baja humedad para su posterior tratamiento y uso para producción con consumo energético muy bajo, lo cual no es
combustible en las calderas, mientras que el jugo extraído congruente y de lo que se puede inferir un posible error en la
en esta etapa de molienda sigue su proceso hasta ser recopilación de los datos para todo el año en el registro de las
convertido en azúcar. toneladas de caña ingresadas al proceso. Con estos 282 datos se
La base de datos incluye la información diaria de producción asegura el cumplimiento de la muestra mínima con una
de toneladas de caña pesadas al ingreso del molino y el confiabilidad del 99%.
consumo de energía eléctrica medido para los equipos
asociados al proceso, durante todos los días productivos del B. Estructura del modelo ARX
año 2019. En la Tabla 1 se presenta una pequeña muestra de
A partir del método de regresión lineal con mínimos cuadrados, se usa un
los datos obtenidos.
modelo ARX, para lo que se espera generar la gráfica que explica el
comportamiento del consumo energético en el proceso de molienda de
caña de azúcar. Para el entrenamiento del modelo se utilizó un 70% de los
datos disponibles y para su validación el 30% restante.
Cabe destacar que para este caso es un modelo dinámico lineal de

autoregresión con variable exógena ya que solo se tiene una variable
externa que corresponde a la producción, que ha sido medida en instantes
de tiempo. La estructura del modelo está representada mediante la
Ecuación 2 (Mena & Montecinos, 2006).
𝑌=𝜙𝛳
Ecuación 2
Donde Y es la variable dependiente, 𝜙 es la información recopilada de mi

sistema (dataset) y 𝛳 son los parámetros que encontrar para el desarrollo
del modelo matemático del modelo.
Se tiene entonces un número de infinitas de rectas posibles de las que se

Tabla 1. Base de datos
requiere seleccionar la correcta. Los valores de los datos de 𝜙 ya se
Habiendo definido anteriormente que la toma de datos se encuentran en el conjunto de datos inicial con el que se pretende calcular
realizó diariamente durante un año, se calcula entonces la el modelo, lo que variará serán los parámetros, para lo que será ideal
muestra mínima que resulta confiable para el análisis, la cual calcular aquellos con el que el modelo muestra un mayor rendimiento.
está definida por la Ecuación 1. Entonces, la forma matricial estará definida como en la Ecuación 3 (Mena
& Montecinos, 2006).
Ecuación 1
Donde no es la muestra mínima de datos, e corresponde al

nivel deseado de precisión, z es el valor de distribución
normal estándar y cv es el coeficiente de varianza. Estos Ecuación 3
parámetros se presentan en la Tabla 2 con respecto a los
datos correspondientes al año 2019 ya obtenidos con
anterioridad.
Según lo anterior, es posible expresar la Ecuación 4 como la forma III. RESULTADOS Y ANÁLISIS
lineal.
𝑌𝐾 = 𝜃1 𝑦(𝑘−1) + 𝜃2 𝑢(𝑘−1) A. Validación del modelo ARX
Ecuación 4 Obteniendo el modelo matemático del sistema, expresado por medio de la

ecuación 6, se realiza una validación con una serie de datos de entrada para
Las matrices de 𝜙 y Y son usadas para calcular 𝛳 , como se puede observar gráficamente el comportamiento de las salidas, esto se logra
observar en la Ecuación 5. mediante el desarrollo en Matlab del código que se presenta como Anexo
1 en este documento. En el Gráfico 1 se evidencia el comportamiento del
modelo real en color rojo y el estimado en color azul con círculos vacíos,
𝜃 = [𝛷𝑇 𝛷]−1 𝛷 𝑇 𝑌
donde la estimación sigue el comportamiento de los datos reales, por lo
que se puede inferir que el modelo predice el comportamiento real de
Ecuación 5 manera similar.
C. Parámetros del modelo
Ya habiendo definido la estructura a utilizar identificando cada una

de las matrices y los datos, se requiere poder definir un modelo
matemático que nos permita predecir nuestra salida de una manera
óptima. Para esto se hace uso de la Ecuación 5 y mediante la
multiplicación de matrices se obtienen los parámetros 𝜃1 y 𝜃2 , valores
indispensables para el cálculo de nuestro modelo matemático.
𝜃1 = 0.3405
𝜃2 = 8.9713
Se procede a reemplazar estos valores en la ecuación 4 para el

desarrollo del modelo matemático del sistema, tal como se presenta
en la Ecuación 6.
𝑌𝐾 = (0.3405)𝑦(𝑘−1) + (8.9713)𝑢(𝑘−1)
Gráfico 1. Comparación de modelo real vs el estimado ARX

Ecuación 6
De igual forma se evalúa el valor del coeficiente R como resultante de las
D. Estructura modelo RNA tendencias de la regresión lineal de los datos evaluados. En el Gráfico 2 se
observa cómo es la resultante del comportamiento lineal de los datos
La red neuronal artificial es un modelo computacional que emula el evaluados por el modelo. Este coeficiente nos muestra que el modelo pasa
sistema neuronal biológico en el procesamiento de información; los por la mayoría de puntos suministrados para poder llegar a modelar y
modelos que se originan son adecuados para describir pronósticos estimar el sistema.
para tiempos prolongados, además de relaciones no lineales
(Quiñones, y otros, 2020). Este modelo es utilizado para poder evaluar Cabe resaltar que el valor obtenido es muy cercano a 1, como se había
la producción con respecto al consumo energético eléctrico del mencionado anteriormente, esto es un indicador de un buen ajuste del
proceso. modelo.
Considerando la estructura del modelo lineal, la misma base de datos

y contexto, se procede con el desarrollo de un modelo no lineal del
tipo RNA, lo cual permitirá comparar el desempeño de ambos
modelos.
Para lograr un respectivo entrenamiento, se ha divido la base de datos

en valores de prueba y entrenamiento para posteriormente tener un
desempeño de pronóstico con el que comparar frente al modelo lineal
anteriormente desarrollado.
Después de un desarrollo de entrenamiento, utilizando el programa

Matlab, se generan dos capas con 1000 iteraciones, para poder obtener
desempeños de las salidas estimadas de entrenamiento y las salidas
según una cantidad de datos de prueba.
Gráfico 2. Coeficiente R del comportamiento lineal de los valores reales

con la estimación del modelo ARX
B. Validación del modelo RNA Finalmente, para validar el modelo generado por la RNA, se usan los datos
de prueba y se evalúa el desempeño de las salidas estimadas. En el Graficó
El comportamiento grafico de este modelo y el resultado de su 5, es posible observar que el coeficiente R es levemente mayor que para
coeficiente R se logra mediante el código desarrollado en Matlab que el modelo lineal y sigue siendo cercano a 1.
se presenta como Anexo 2 en este documento. En el Gráfico 3 la línea
azul representa el comportamiento del sistema real y la roja es la
estimación del modelo generado con los datos de entrenamiento;
pudiéndose observar que el modelo sigue una trayectoria muy similar
a la real.
Gráfico 3. Comparación de comportamiento real vs estimado para

datos de entrenamiento de RNA Gráfico 5. Coeficiente R del comportamiento lineal de los datos de
prueba con las salidas estimadas del modelo RNA
En el Grafico 4 se evidencia el desempeño de los datos de
entrenamiento por medio del coeficiente R, el cual es muy cercano a En el Gráfico 6, se compara el comportamiento de los datos o entradas de
1 y mayor al valor obtenido para el modelo lineal. prueba y las salidas estimadas, donde se evidencia como la línea roja que
corresponde al modelo estimado, sigue un comportamiento muy similar
en cada variación de los datos suministrados como prueba.
Gráfico 6. Comparación del comportamiento de las salidas estimadas del

modelo RNA con respecto a datos de prueba
Gráfico 4. Coeficiente R del comportamiento lineal de los datos de

entrenamiento con la estimación del modelo RNA
IV. CONCLUSIONES V. REFERENCIAS
A partir de este trabajo se logra el desarrollo de dos

modelos, uno lineal y el otro no lineal, para los cuales se Asocaña. (2014). El sector azucarero en la actualidad. Obtenido
logró determinar el desempeño y ajuste con respecto a los de https://www.asocana.org/publico/info.aspx?Cid=215
datos del consumo energético del proceso de molienda de
caña de azúcar en un ingenio de la región. Castrillon, R., Gonzalez, A., & Quispe, E. (2013). Mejoramiento
de la eficiencia energética en la industria del cemento por proceso
Se identificó que los datos recopilados tienen un húmedo a través de la implementación del sistema de gestión
comportamiento lineal y se lograron modelar por medio de integral de la energía. Scielo, 115-123.
ARX, ya que fueron recopilados en instantes de tiempo y
además dependen de una entrada externa. López, I., Rojano, A., Ojeda, W., & Salazar, R. (2007). Modelos
ARX para predecir la temperatura del aire en un invernadero.
Por la cantidad de datos y la variación entre estos, se ha Scielo, 181-192.
logrado obtener un coeficiente R de 0.75 para el modelo
ARX, el cual representa un desempeño aceptable. Se debe Mena, C., & Montecinos, R. (2006). Comparación de redes
tener en cuenta que para lograr un mejor resultado se neuronales y regresión lineal para estimar productividad de sitio en
requiere de mayor cantidad de datos y que se puedan plantaciones forestales, utilizando geomática. Scielo, 35-43.
presentar menor ruido entre mediciones. A pesar de esto,
al evaluar el modelo ARX de manera gráfica, se evidencia Quiñones, L., Ochoa, L., Kemper, N., Gamarra, O., Bazán, J., &
como la estimación de salidas, sigue un comportamiento Delgado, J. (2020). Artificial neural network to estimate an index
similar al de los datos reales medidos. of water quality. Enfoque - UTE, 109-120.
En el desarrollo del modelo no lineal, para validar el UPME. (2016). Plan de acción indicativo de eficiencia energética
mismo proceso o sistema, se ha evidenciado que los 2017-2022. Colombia: Ministerio de Minas y Energía.
coeficientes de desempeño presentan una leve mejoría con
respecto al modelo lineal. Estos desempeños han dado
como resultado un coeficiente R de 0.8 para los datos de
entrenamiento y de 0.763 para los datos de prueba; siendo
este último el comparable con el modelo lineal y
evidenciando que es levemente mayor. Esto debido a que
el modelo RNA logra analizar la variación de los datos
medidos logrando ajustarse un poco mejor a la base de
datos que no logra ser tan constante en cada medición.
En cuanto a la validación gráfica para el modelo RNA, se

observa que el modelo estimado sigue de manera ajustada
las tendencias de los valores suministrados como prueba al
modelo.
VI. ANEXOS
A. Código en Matlab modelo ARX B. Código en Matlab modelo RNA

%%
close all %%
U=Entrada; close all
% U=U/norm(U) X = EntradaA';
Y=Salida;
% Y=Y/norm(Y)
D = SalidaA';
Phi1=[Y(1:end-1),U(1:end-1)];
YReal1=Y(2:end);
plot3(Y(1:end-1),U(1:end-1),Y(2:end),'or') XTest = EntradaA(170:1:282)';
xlabel('Salida(k-1)');ylabel('Entrada (k- XTrain = EntradaA(1:1:169)';
1)');zlabel('Salida Real(k)') DTest = SalidaA(170:282)';
hold on DTrain = SalidaA(1:169)';
%% Red =
newff(X,D,[10,10],{'tansig','tansig','pure
lin'},'trainlm');
%Estimación de parámetros
Red.trainparam.epochs=1000;
Red.divideFcn='';
Theta1=inv(Phi1'*Phi1)*Phi1'*YReal1 [Red,tr]=train(Red,X,D);
%% %[Red,tr]=train(Red,XTrain,DTrain);
YestTrain1= Phi1*Theta1;
figure
%%
plot(YReal1(:,1),'-b');
YestTrain = sim(Red,XTrain);
hold on
figure
plot(YestTrain1(:,1),'-r');
plot(DTrain(1,:),'-b');
hold off
hold on
figure (1)
plot(YestTrain(1,:),'-r');
plotregression(YReal1(:,1),YestTrain1(:,1)
hold off
)
%%
RangoU=0:1000:9000; figure
RangoY=0:1000:112000; plotregression(DTrain(1,:),YestTrain(1,:))
[U3d,Y3d]=meshgrid(RangoU,RangoY);
Yest3d=Theta1(1)*Y3d+Theta1(2)*U3d; %%
surf(Y3d,U3d,Yest3d); Yest = sim(Red,XTest);
view(125,25) figure
hold off plot(DTest(1,:),'-b');
%% hold on
%Validación del modelo plot(Yest(1,:),'-r');
figure hold off
N=length(Y)
figure
for k=2:N plotregression(DTest(1,:),Yest(1,:))
Yest1(k)=Theta1(1)*Y(k- hold off
1)+Theta1(2)*U(k-1); %%
end;
plot(Y(2:N),'r');hold on;
plot(Yest1(2:N),'-ob');hold off
%
figure (5)
plotregression(Y,Yest1)
%

IEEE - Trabajo - Optimización

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

IEEE - Trabajo - Optimización

Cargado por

Copyright:

Formatos disponibles

Aplicación de modelos de regresión lineal y red neuronal

artificial para la estimación del consumo energético de un

Cabe destacar que para este caso es un modelo dinámico lineal de

Donde Y es la variable dependiente, 𝜙 es la información recopilada de mi

Se tiene entonces un número de infinitas de rectas posibles de las que se

Donde no es la muestra mínima de datos, e corresponde al

𝑌𝐾 = 𝜃1 𝑦(𝑘−1) + 𝜃2 𝑢(𝑘−1) A. Validación del modelo ARX

Ecuación 4 Obteniendo el modelo matemático del sistema, expresado por medio de la

C. Parámetros del modelo

Ya habiendo definido la estructura a utilizar identificando cada una

Se procede a reemplazar estos valores en la ecuación 4 para el

Gráfico 1. Comparación de modelo real vs el estimado ARX

Considerando la estructura del modelo lineal, la misma base de datos

Para lograr un respectivo entrenamiento, se ha divido la base de datos

Después de un desarrollo de entrenamiento, utilizando el programa

Gráfico 2. Coeficiente R del comportamiento lineal de los valores reales

Gráfico 3. Comparación de comportamiento real vs estimado para

Gráfico 6. Comparación del comportamiento de las salidas estimadas del

Gráfico 4. Coeficiente R del comportamiento lineal de los datos de

A partir de este trabajo se logra el desarrollo de dos

En cuanto a la validación gráfica para el modelo RNA, se

A. Código en Matlab modelo ARX B. Código en Matlab modelo RNA

También podría gustarte